“新华网军事新闻采集”的版本间的差异
来自JsRobot
(→演示) |
(→数据) |
||
第10行: | 第10行: | ||
==数据== | ==数据== | ||
− | 数据样例[[]] | + | 数据样例[[Media:XinHuaWangJunShiXinWenCaiJi_Data.rar|XinHuaWangJunShiXinWenCaiJi_Data.rar]] |
2016年8月6日 (六) 12:03的最新版本
简介
采集新闻类帖子
功能
采集军事新闻类帖子,保存为CSV文件。 对采集的文章做去重处理,已经采集过的不再采集。 采集过程只保留文字,忽略图片内容。
演示
数据
数据样例XinHuaWangJunShiXinWenCaiJi_Data.rar