“58租房经纪人信息采集V2”的版本间的差异
来自JsRobot
(→功能) |
(→功能) |
||
第12行: | 第12行: | ||
采集字段:网址,时间,标题,联系人,电话,户型,租金,位置,小区,面积,楼层,总楼层,付款,配置,朝向,装修,类型 | 采集字段:网址,时间,标题,联系人,电话,户型,租金,位置,小区,面积,楼层,总楼层,付款,配置,朝向,装修,类型 | ||
输出数据 | 输出数据 | ||
+ | ==使用方法== | ||
+ | 1、更换目标站点 | ||
+ | 点击 修改设置,任务列表,修改 http://nb.58.com/chuzu/为http://sz.58.com/chuzu/ | ||
+ | 2、采集全部页数 | ||
+ | 点击修改设置,参数列表,采集页数=2,把2改为70,就是全部采集。因为58网站一次最多展示70页,所以设置70就好。 | ||
==演示== | ==演示== |
2017年8月4日 (五) 05:41的版本
简介
58租房经纪人信息采集V2的数据是出租经济人的电话,可以做营销。 为了方便的采集出租经济人数据信息,我们写了一个提取数据的工具。
功能
采集目标 http://nb.58.com/chuzu/ 可以把nb宁波更换为别的城市,比如:http://sz.58.com/chuzu/ 支持http://*.58.com/chuzu/网址采集 采集要求 生成一个CSV表格,生成一个电话的txt文件 采集字段:网址,时间,标题,联系人,电话,户型,租金,位置,小区,面积,楼层,总楼层,付款,配置,朝向,装修,类型 输出数据
使用方法
1、更换目标站点 点击 修改设置,任务列表,修改 http://nb.58.com/chuzu/为http://sz.58.com/chuzu/ 2、采集全部页数 点击修改设置,参数列表,采集页数=2,把2改为70,就是全部采集。因为58网站一次最多展示70页,所以设置70就好。
演示
数据
数据样例:oced_data.rar
备注
采集有两个必要条件: 需要把城市列表和参数信息文件拷贝到C:\OUTPUT目录中 需要在IE里访问要采集的网站,并把过滤条件都设置好。