阿里众包招聘信息采集

Storm讨论 | 贡献2016年12月30日 (五) 17:25的版本 演示

Storm讨论 | 贡献2016年12月30日 (五) 17:25的版本 演示

简介

    阿里众包招聘信息采集

功能

   操作目标
   登录网址
   https://newjob.taobao.com/task/workList.htm?spm=a21ex.7906944.0.0.eghJCe
   打开页面
   https://newjob.taobao.com/parttime/parttime-detail.html?spm=a21ex.8104751.0.0.NalfnE&workId=11135615
   1.	点击查看详情,进入之后,点击手机图标,会出现手机号码。
   2.	采集字段:用户id,旺旺号,用户名,年龄,电话,是否结束
   3.	采集完毕后勾选“不录取“,原因选择“其他”。
   4.	“待录取”选项卡下清空,自动移动到”已结束”里。
   5.   点击采集后,会弹出自带浏览器,登录后再采集。

参数设置

  是否结束=1(待录取为1,已结束为3)
  录取状态=0(0点击不录取,1不操作)
  开始页数=1(开始页码)
  结束页数=0(结束页码,0为全部采集)   

演示

   Alizhongbaozhaopin.gif

数据

   城市清单:zhonghuayingcai_chengshiqingdan.rar

备注

   采集有三个要注意的地方:
   1、采集速度不能太快,否则会触发阿里防采集规则。
   2、只能采集一个任务。
   3、QQ和谷歌浏览器可以查看任务列表,复制任务网址到任务列表里采集。IE和软件自带浏览器看不到任务列表,可以打开任务网址。