站酷设计师采集工具

来自JsRobot
Storm讨论 | 贡献2017年4月15日 (六) 20:12的版本

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索

简介

   这个项目采集了酷站上的设计师信息。

功能

   输出是设计师信息
   字段如下
   [网址]:http://www.zcool.com.cn/u/1310119
   [昵称]:jingchutang
   [城市]:北京市
   [职业]:平面设计师
   [姓名]:保密(男)
   [家乡]:江苏
   [院校]:
   [酷龄]:5岁
   [生日]:1984-10-02
   [现居]:北京
   [QQ]:3383623970
   [微信]:TT13912166272
   [装备]:未填写
   [标签]:未填写
   [简介]:
   采集活跃设计师栏目,
   依据职业和城市遍历组合采集设计师数据
   根据编号采集设计师数据

演示

   KuZhanSheJiShiCaiJiGongJu UI.png

使用

默认处理

   这种模式是通过编号的方式遍历设计师的方式采集数据。
   KuZhanSheJiShiCaiJiGongJu Setting.png
   启动采集后,软件会弹出一个小的浏览器。
   请您在浏览器里输入你的用户和密码,然后登录。
   在登录成功后,点击继续执行按钮,就可以正常采集了。
  
   注意设计师编号范围不要设置太大。
   这个是为了避免账号锁定特别做的设计。

采集作品最多活跃设计师生成任务清单

   这种模式为了采集作品最多的活跃设计师的任务清单。
   KuZhanSheJiShiCaiJiGongJu Setting2.png
   这种模式不需要登录帐号。
   这个模式采集的数据为为了后面的批量采集做准备的。
   在测试的时候采集页数设置为2,正常使用的时候请把采集页数设置为100。
   采集结果的任务清单文件默认在“c:\output\时间目录”内。
   采集完成后,请剪切到“c:\output”目录内。

使用任务清单批量采集设计师详细信息

   这种模式在任务清单的基础上采集设计师的信息。
   KuZhanSheJiShiCaiJiGongJu Setting3.png
   启动采集后,软件会弹出一个小的浏览器。
   请您在浏览器里输入你的用户和密码,然后登录。
   在登录成功后,点击继续执行按钮,就可以正常采集了。
   注意行号编号范围不要设置太大。
   这个是为了避免账号锁定特别做的设计。

备注

   由于需要账号登录,采集的时候必须有方便客户规避封号的一些处理。
   处理思路,大致就是两个:
   如果按编号采集,那么就一小组一小组的采集设计师的信息。
   如果按分类采集,那么就先在不登录的情况下,采集到设计师的网址。然后再登录情况下一小组一小组的采集设计师的信息。