简介
这个项目采集了酷站上的设计师信息。
功能
输出是设计师信息 字段如下 [网址]:http://www.zcool.com.cn/u/1310119 [昵称]:jingchutang [城市]:北京市 [职业]:平面设计师 [姓名]:保密(男) [家乡]:江苏 [院校]: [酷龄]:5岁 [生日]:1984-10-02 [现居]:北京 [QQ]:3383623970 [微信]:TT13912166272 [装备]:未填写 [标签]:未填写 [简介]:
采集活跃设计师栏目, 依据职业和城市遍历组合采集设计师数据 根据编号采集设计师数据
演示
使用
默认处理
这种模式是通过编号的方式遍历设计师的方式采集数据。![]()
启动采集后,软件会弹出一个小的浏览器。 请您在浏览器里输入你的用户和密码,然后登录。 在登录成功后,点击继续执行按钮,就可以正常采集了。 注意设计师编号范围不要设置太大。 这个是为了避免账号锁定特别做的设计。
采集作品最多活跃设计师生成任务清单
这种模式为了采集作品最多的活跃设计师的任务清单。![]()
这种模式不需要登录帐号。
这个模式采集的数据为为了后面的批量采集做准备的。 在测试的时候采集页数设置为2,正常使用的时候请把采集页数设置为100。
采集结果的任务清单文件默认在“c:\output\时间目录”内。 采集完成后,请剪切到“c:\output”目录内。
使用任务清单批量采集设计师详细信息
这种模式在任务清单的基础上采集设计师的信息。![]()
启动采集后,软件会弹出一个小的浏览器。 请您在浏览器里输入你的用户和密码,然后登录。 在登录成功后,点击继续执行按钮,就可以正常采集了。
注意行号编号范围不要设置太大。 这个是为了避免账号锁定特别做的设计。
备注
由于需要账号登录,采集的时候必须有方便客户规避封号的一些处理。 处理思路,大致就是两个: 如果按编号采集,那么就一小组一小组的采集设计师的信息。 如果按分类采集,那么就先在不登录的情况下,采集到设计师的网址。然后再登录情况下一小组一小组的采集设计师的信息。