美团商户产品采集

来自JsRobot
Storm讨论 | 贡献2016年9月19日 (一) 13:46的版本 使用

跳转至: 导航搜索

简介

   这个项目采集了美团上的美食板块的商家信息和产品信息。

背景

   外卖企业需要这个数据。

演示

   MeiTuanShangJiaChanPing Use.gif

使用

   请在使用采集前,
   先租用一个动态换IP的VPS,
   建立一个拨号方式"宽带连接"。
   MeiTuanShangJiaChanPing adsl.png
   采集指定店铺的店铺信息和产品信息
   当任务列表中设定的是店铺的网址的时候,
   采集的结果就是指定店铺的店铺信息和产品信息
   例如“http://www.meituan.com/shop/100737790”
   这个一般用于测试,采集时间很短。
   这个采集一般不需要换IP。
   采集指城市区域的店铺信息和产品信息
   当任务列表中设定的是区域的网址的时候,
   采集的结果就是指定区域的店铺信息和产品信息
   例如“http://sz.meituan.com/category/meishi/futianqu/rating”
   这个采集就需要换IP。
   采集指城市的店铺信息和产品信息
   当任务列表中设定的是城市的网址的时候,
   采集的结果就是指定城市的店铺信息和产品信息
   例如“枚举区域:http://sz.meituan.com/category/meishi/all/rating”    
   这个采集就需要换IP。
   这个采集的时间非常长,会等待很长的时间才会看到数据。
   采集的时候请耐心等待,最好是晚上开始采集,白天看结果。

数据

   数据样例[[Meia:MeiTuanShangHuChanPing_Dat.rar]

说明

   美团有锁定IP机制的反采集措施。
   采集一定数目的数据后,美团会弹出验证码,要求用户输入验证码后再运行采集。
   我们推荐采用的是动态IP VPS的方式绕过这个锁定IP的反采集措施。
   软件有一个“任务分组”参数,当软件执行了这么多任务后,就执行一次换IP操作。
   当然你也可以其他换IP的方式换IP.
   如VPN自动换IP, ADSL拨号自动换IP,路由器拨号换IP的方式)。
   如果是企业环境下使用推荐使用动态换IP的VPS的方式换IP。
   这个是所有换IP里的方法效果最好的。
   我们都试过其他几种换IP的方式,可以用,但是会有一些这样那样的问题。