“新华网军事新闻采集”的版本间的差异
来自JsRobot
(创建页面,内容为“==简介== 采集新闻类帖子 ==功能== 采集军事新闻类帖子,保存为CSV文件。 ==演示== ==数据== 数据样例[[]]”) |
(→功能) |
||
| 第3行: | 第3行: | ||
==功能== | ==功能== | ||
采集军事新闻类帖子,保存为CSV文件。 | 采集军事新闻类帖子,保存为CSV文件。 | ||
| + | 对采集的文章做去重处理,已经采集过的不再采集。 | ||
| + | 采集过程只保留文字,忽略图片内容。 | ||
| + | |||
==演示== | ==演示== | ||
==数据== | ==数据== | ||
数据样例[[]] | 数据样例[[]] | ||
2016年8月6日 (六) 10:53的版本
简介
采集新闻类帖子
功能
采集军事新闻类帖子,保存为CSV文件。
对采集的文章做去重处理,已经采集过的不再采集。
采集过程只保留文字,忽略图片内容。
演示
数据
数据样例[[]]