百度地图公司信息采集工具

来自JsRobot
Storm讨论 | 贡献2017年5月24日 (三) 10:46的版本 数据

跳转至: 导航搜索

简介

   这个工具可以采集百度地图上搜索出来的公司信息。

背景

   现在大家大量使用手机定位来到陌生的地方。
   百度地图就是一个很常见寻找信息的入口。
   就寻找公司信息而言,其他的企业黄页都没有地图来的直接。
   新公司可以不关注其他企业黄页的信息,但是很少不关注自己的企业的地理位置的。

功能

   采集“按照关键词和地域在百度地图上搜索的公司信息”
   输出公司名字省份城市地址电话经纬度。
   支持半自动的手动在地图上定位的关键词搜索抓取。
   支持全自动的全国城市的关键词搜索抓取。
   支持全自动的城市子区域的关键词搜索抓取。

演示

    全自动模式-城市所有区域采集
    BaiDuDiTu City Use.gif
    全自动模式-全国所有城市采集
    BaiDuDiTu Country Use.gif
    半自动模式-指定地理位置采集
    BaiDuDiTu Manual Use.gif

数据样例展示

    Baiduditushujuyangli.jpg

使用

半自动模式-指定地理位置采集

   请检查你的IE的版本,
   如果你的IE的版本低于11,
   请把IE的版本升级到IE11,
   我们发现IE的低版本采集地图信息有问题。
   在您点击开始抓取后,
   软件会启动IeBrowser,
   请你在IeBrowser的百度地图页面中,设定要采集的城市和关键词,然后点击搜索按钮,等待公司信息出来。
   然后请您点击继续执行的按钮
   然后软件会关闭IeBrowser,
   然后软件就会自动抓取公司的信息了。
   切换城市
   百度地图上的城市是可以切换的。
   切换关键词
   百度地图的搜索的关键词是可以手工输入的。
   输入后记得要点击一下那个搜索按钮。
   采集县城的某个关键词的数据
   如果你采集的是某个县城的关键词的公司数据,
   输入的关键词可以是“地名 关键词”
   采集异常的情况
   如果遇到采集失败的情况,
   在你在IeBrowser里点击查询后,
   先向后翻一页,
   然后翻页到第一页,
   然后点击继续执行就可以了。

全自动模式-全国所有城市采集

    默认设置采集北京的酒店
    任务列表中是"采集城市:北京,酒店"
    你可以修改为你想采集的城市和关键词,比如"采集城市:重庆,酒吧"
    任务列表中支持多个城市的任务一起录入,一行一个任务。
    采集指定的城市的的时候,为了采集最多的数据,软件自动枚举了城市的区域。

全自动模式-城市所有区域采集

    默认设置采集北京的酒店
    任务列表中是"采集全国:酒店"
    你可以修改为你想采集的关键词,比如"采集全国:酒吧"
    任务列表中支持多个任务一起录入,一行一个任务。
    采集全国的数据的时候,软件内部自动枚举了比较重要的城市。
    采集特定城市的的时候,软件内部自动枚举了城市的区域。