LEUZE网站信息采集

来自JsRobot
Storm讨论 | 贡献2018年10月18日 (四) 09:09的版本 演示

跳转至: 导航搜索

简介

   leuze网站的数据是很有价值的,但是这个网站分类很多,有305个网址。
   为了方便的查看数据,我们写了一个提取数据的工具。

功能

   采集目标
   http://www.leuze.com.cn/cn/china/
   采集要求
   采集6个分类的数据
   采集6大分类下305个网址的数据
   采集字段:网址,产品型号,产品订货号,品牌,分类,商品图片,商品文档,8100`检测类型(电感/电容),8040`工作电压 `VDC,8096`检测距离(电感/电容)`mm,8048`开关频率`Hz,8059`响应时间`ms,8051`输出电路,8053`输出功能,8052`输出电路(2),8054`输出功能(2),8049`连接方式,8056`外形`mm,8036`长度(圆柱形)`mm,8041`工作温度`℃,8099`防护等级,8055`外壳材料
   输出数据

演示

   LEUZE.jpg

数据

   数据样例:oced_data.rar

备注

   采集有两个必要条件:
   1、先采集6大分类下,所有网址清单,生成任务清单.txt
   2、选择采集所有分类信息,就是采集所有的产品信息。