3,360
个编辑
更改
→使用
采用关键词过滤技术,过滤“发布在个人房源里,但是实际上是中介”的房源信息。
==使用==
[[image:20160128_58ershoufang_qiangdan_setting.gif]]
采集集页:采集信息列表页的多少页。我们在分析问题的时候发现,58的信息是越新的在越前面显示。太老的信息对于客户是无意义的。也就每次都采集前几页就可以了。
代理清单:这个可以不用。
刷新时间:刷新页面的时间。间隔多长时间去检查一次页面的更新情况。取值越小,检查的越频繁。这个值根据客户自己试验设定。
弹出通知:发现新的个人房源信息就弹出IE窗口提示客户的开关。为1,表示弹IE,为0,就表示不弹IE。
中介过滤=c:\output\中介过滤.txt
===使用步骤===
第一次使用
弹出通知设置为0,
点击开始采集,采集几分钟,然后停止采集。
这样可以把老的数据采集一遍,让采集器记忆下那些信息是无效的,以后就不采集了。
以后使用
弹出通知设置为1,
点击开始采集
采集过程中发现有新的个人房源信息,在主界面上显示,同时就弹出IE提示。
==其他==