“阿里众包招聘信息采集”的版本间的差异
来自JsRobot
(→数据) |
(→备注) |
||
第28行: | 第28行: | ||
==备注== | ==备注== | ||
采集有三个要注意的地方: | 采集有三个要注意的地方: | ||
− | + | 1、将录取状态=0,点击不录取后,采集速度不能太快,每隔5S点击一次,否则会触发阿里防采集规则,导致采集未采集完就停止任务。 | |
− | + | 2、一次只能采集一个任务网址。 | |
− | + | 3、IE和软件自带浏览器看不到任务列表;QQ和谷歌浏览器可以查看任务列表,复制任务网址到任务列表里采集。 |
2016年12月30日 (五) 17:28的最新版本
简介
阿里众包招聘信息采集
功能
操作目标 登录网址 https://newjob.taobao.com/task/workList.htm?spm=a21ex.7906944.0.0.eghJCe 打开页面 https://newjob.taobao.com/parttime/parttime-detail.html?spm=a21ex.8104751.0.0.NalfnE&workId=11135615
1. 点击查看详情,进入之后,点击手机图标,会出现手机号码。 2. 采集字段:用户id,旺旺号,用户名,年龄,电话,是否结束 3. 采集完毕后勾选“不录取“,原因选择“其他”。 4. “待录取”选项卡下清空,自动移动到”已结束”里。 5. 点击采集后,会弹出自带浏览器,登录后再采集。
参数设置
是否结束=1(待录取为1,已结束为3) 录取状态=0(0点击不录取,1不操作) 开始页数=1(开始页码) 结束页数=0(结束页码,0为全部采集)
演示
数据
数据文件:Alizhongbaozhaopin.rar
备注
采集有三个要注意的地方: 1、将录取状态=0,点击不录取后,采集速度不能太快,每隔5S点击一次,否则会触发阿里防采集规则,导致采集未采集完就停止任务。 2、一次只能采集一个任务网址。 3、IE和软件自带浏览器看不到任务列表;QQ和谷歌浏览器可以查看任务列表,复制任务网址到任务列表里采集。