更改

58租房经纪人信息采集V2

添加380字节, 2017年8月4日 (五) 11:12
使用方法
==简介==
58租房经纪人信息采集V2的数据是出租经济人的电话,可以做营销。
为了方便的采集出租经济人数据信息,我们写了一个提取数据的工具。为了方便的采集到58租房经济人的数据信息,我们写了一个提取数据的工具。
==功能==
采集目标
http://statsnb.oecd58.orgcom/Indexchuzu/ 可以把nb宁波更换为别的城市,比如:http://sz.aspx?DatasetCode=PATS_IPC58.com/chuzu/ 支持http://*.58.com/chuzu/网址采集
采集要求
采集107个国家的数据生成一个CSV表格,生成一个电话的txt文件 采集每个国家8(A-H)个行业的数据 数据要求精确到4位小数 数据过滤条件为 Reference Date:Priority date Patents Office & Triadic Patents Families:Triadic Patents Families Reference country:Applicant(s)'s country(ies) of residence采集字段:网址,时间,标题,联系人,电话,户型,租金,位置,小区,面积,楼层,总楼层,付款,配置,朝向,装修,类型
输出数据
==使用方法==
1、更换目标站点
点击 修改设置,任务列表,修改 http://nb.58.com/chuzu/为http://sz.58.com/chuzu/
2、采集全部页数
点击修改设置,参数列表,采集页数=2,把2改为70,即全部采集。因为58网站一次最多展示70页,所以设置70就是全部采集。
 
==演示==
[[image:oced_use58chuzuxinxi.gif]] 
==数据==
数据样例:[[Media:oced_data58chuzuxinxi.rar|oced_data58chuzuxinxi.rar]] 
==备注==
采集有两个必要条件:
需要把城市列表和参数信息文件拷贝到C:\OUTPUT目录中需要把采集目标网址复制到任务列表里 需要在IE里访问要采集的网站,并把过滤条件都设置好。需要秒换ip服务器上运行软件,58网址有反采集措施,采集速度和采集数量有限制,超过就会锁定ip。
3,360
个编辑