“新华网军事新闻采集”的版本间的差异
来自JsRobot
(创建页面,内容为“==简介== 采集新闻类帖子 ==功能== 采集军事新闻类帖子,保存为CSV文件。 ==演示== ==数据== 数据样例[[]]”) |
(→功能) |
||
第3行: | 第3行: | ||
==功能== | ==功能== | ||
采集军事新闻类帖子,保存为CSV文件。 | 采集军事新闻类帖子,保存为CSV文件。 | ||
+ | 对采集的文章做去重处理,已经采集过的不再采集。 | ||
+ | 采集过程只保留文字,忽略图片内容。 | ||
+ | |||
==演示== | ==演示== | ||
==数据== | ==数据== | ||
数据样例[[]] | 数据样例[[]] |
2016年8月6日 (六) 11:53的版本
简介
采集新闻类帖子
功能
采集军事新闻类帖子,保存为CSV文件。 对采集的文章做去重处理,已经采集过的不再采集。 采集过程只保留文字,忽略图片内容。
演示
数据
数据样例[[]]