“中国门博网信息采集”的版本间的差异

来自JsRobot
跳转至: 导航搜索
数据
数据
第15行: 第15行:
 
     [[image:oced_use.gif]]
 
     [[image:oced_use.gif]]
 
==数据==
 
==数据==
     数据样例:[[Media:门博网企业库信息.rar|门博网企业库信息.rar]]
+
     数据样例:[[Media:门博网信息采集.rar|门博网信息采集.rar]]
  
 
==备注==
 
==备注==

2016年9月20日 (二) 14:04的版本

简介

   中国门博网信息采集。
   客户要求采集相关信息,为此我们编写了一款软件自动化采集。

功能

   采集目标
   http://mbw.rc6688.com/trade/
   采集要求
   批量采集列表页里的字段:联系人,电话 ,名字
   分3个栏目:
   百城万店
   展会
   其他渠道
   每个栏目进行分页处理,然后采集每个列表页里的内容。

演示

   Oced use.gif

数据

   数据样例:门博网信息采集.rar

备注

   该网站一共是21311条数据,但是每个账号最多只能采集20000条数据。
   最好一个栏目一个栏目地地采集。保证2个栏目的采集是全的。
   因为涉及到登录,不能异地同时登录采集,需要一方退出后采集。
   采集有两个开关:(方便从第几页到第几页采集,防止采集过快导致无法采集)
   开始页数=1
   结束页数=0