7C教育资源网试卷采集
来自JsRobot
简介
7C教育资源网试卷采集是很有价值的,为了批量采集试卷,我们写了一个提取数据的工具。
功能
采集目标 http://xk.7cxk.net/shiti/yuwen/nj1/ 采集要求 1、按分类采集 2、输出格式为CSV,采集字段为:网址,试题名称,创 作 者,试题添加,更新时间,试题大小,下载次数,试题等级,授权方式,运行平台,网络地址,本地地址 3、下载文件命名为:2017春长春版语文一年级下册第9单元.rar 4、数据文件和下载文件放在一个文件夹中,文件夹名为分类名:一年级语文试题试题 输出数据
使用说明
1、打开软件,点击修改设置,任务列表,把分类网址复制进入,可以复制多行。 2、点击修改设置,参数列表 :采集页数=5(采集页面个数,0为全部采集,5为采集1到5页) 下载文件=0(是否下载文件,1下载,0不下载) 测试模式=0(测试使用,默认为0)
演示
数据
数据样例:yinianjiyuwenshiti.rar
备注
采集有1个必要条件: 打开软件,点击修改设置,任务列表,需要输入分类网址才能采集。