“新华网军事新闻采集”的版本间的差异

来自JsRobot
跳转至: 导航搜索
(创建页面,内容为“==简介== 采集新闻类帖子 ==功能== 采集军事新闻类帖子,保存为CSV文件。 ==演示== ==数据== 数据样例[[]]”)
 
功能
第3行: 第3行:
 
==功能==
 
==功能==
 
     采集军事新闻类帖子,保存为CSV文件。
 
     采集军事新闻类帖子,保存为CSV文件。
 +
    对采集的文章做去重处理,已经采集过的不再采集。
 +
    采集过程只保留文字,忽略图片内容。
 +
 
==演示==
 
==演示==
 
==数据==
 
==数据==
 
     数据样例[[]]
 
     数据样例[[]]

2016年8月6日 (六) 11:53的版本

简介

    采集新闻类帖子

功能

    采集军事新闻类帖子,保存为CSV文件。
    对采集的文章做去重处理,已经采集过的不再采集。
    采集过程只保留文字,忽略图片内容。

演示

数据

   数据样例[[]]