新华网军事新闻采集

来自JsRobot
Storm讨论 | 贡献2016年8月6日 (六) 11:53的版本 功能

跳转至: 导航搜索

简介

    采集新闻类帖子

功能

    采集军事新闻类帖子,保存为CSV文件。
    对采集的文章做去重处理,已经采集过的不再采集。
    采集过程只保留文字,忽略图片内容。

演示

数据

   数据样例[[]]