3,360
个编辑
更改
无编辑摘要
==数据==
样例数据[[Media:alibaba_chengxintong_qiyeminglu.rar|alibaba_chengxintong_qiyeminglu.rar]]
==注意==
采集诚信通的数据的时候,如果数据量比较大,会遇到饭采集的问题。
具体表现特征就是采集一段时间之后,就出现验证码。
处理方法是把数据分段采集。
具体操作如下:
a.先刷新IE里的诚信通页面,然后查看页面是否有验证码。
b.如果有验证码就输入验证码后,刷新页面,再次检查时有验证码。如果没有验证码了,就执行c
c.启动采集器,然后指定一个采集页数的范围比如(1到10页或者11到20页),然后开始采集。
d.在这次采集完后,再刷新一下IE的诚信通页面,查看是否有验证码出来。如果有验证码,再人工输入一下验证码。