“新华网军事新闻采集”的版本间的差异
来自JsRobot
(→功能) |
(→数据) |
||
(未显示同一用户的1个中间版本) | |||
第7行: | 第7行: | ||
==演示== | ==演示== | ||
+ | [[image:XinHuaWangJunShiXinWenCaiJi_Use.gif]] | ||
+ | |||
==数据== | ==数据== | ||
− | 数据样例[[]] | + | 数据样例[[Media:XinHuaWangJunShiXinWenCaiJi_Data.rar|XinHuaWangJunShiXinWenCaiJi_Data.rar]] |
2016年8月6日 (六) 12:03的最新版本
简介
采集新闻类帖子
功能
采集军事新闻类帖子,保存为CSV文件。 对采集的文章做去重处理,已经采集过的不再采集。 采集过程只保留文字,忽略图片内容。
演示
数据
数据样例XinHuaWangJunShiXinWenCaiJi_Data.rar