“58租房经纪人信息采集V2”的版本间的差异
来自JsRobot
(→功能) |
(→备注) |
||
第24行: | 第24行: | ||
==备注== | ==备注== | ||
采集有两个必要条件: | 采集有两个必要条件: | ||
− | + | 需要把采集目标网址复制到任务列表里 | |
− | + | 需要秒换ip服务器上运行软件,58网址有反采集措施,采集速度喝采集数量有限制,超过就会锁定ip。 |
2017年8月4日 (五) 07:03的版本
简介
58租房经纪人信息采集V2的数据是出租经济人的电话,可以做营销。 为了方便的采集出租经济人数据信息,我们写了一个提取数据的工具。
功能
采集目标 http://nb.58.com/chuzu/ 可以把nb宁波更换为别的城市,比如:http://sz.58.com/chuzu/ 支持http://*.58.com/chuzu/网址采集 采集要求 生成一个CSV表格,生成一个电话的txt文件 采集字段:网址,时间,标题,联系人,电话,户型,租金,位置,小区,面积,楼层,总楼层,付款,配置,朝向,装修,类型 输出数据
使用方法
1、更换目标站点 点击 修改设置,任务列表,修改 http://nb.58.com/chuzu/为http://sz.58.com/chuzu/ 2、采集全部页数 点击修改设置,参数列表,采集页数=2,把2改为70,就是全部采集。因为58网站一次最多展示70页,所以设置70就好。
演示
数据
数据样例:oced_data.rar
备注
采集有两个必要条件: 需要把采集目标网址复制到任务列表里 需要秒换ip服务器上运行软件,58网址有反采集措施,采集速度喝采集数量有限制,超过就会锁定ip。