3,360
个编辑
更改
创建页面,内容为“==简介== leuze网站的数据是很有价值的,但是这个网站分类很多,有305个网址。 为了方便的查看数据,我们写了一个提...”
==简介==
leuze网站的数据是很有价值的,但是这个网站分类很多,有305个网址。
为了方便的查看数据,我们写了一个提取数据的工具。
==功能==
采集目标
http://www.leuze.com.cn/cn/china/
采集要求
采集6个分类的数据
采集6大分类下305个网址的数据
采集字段:网址,产品型号,产品订货号,品牌,分类,商品图片,商品文档,8100`检测类型(电感/电容),8040`工作电压 `VDC,8096`检测距离(电感/电容)`mm,8048`开关频率`Hz,8059`响应时间`ms,8051`输出电路,8053`输出功能,8052`输出电路(2),8054`输出功能(2),8049`连接方式,8056`外形`mm,8036`长度(圆柱形)`mm,8041`工作温度`℃,8099`防护等级,8055`外壳材料
输出数据
==演示==
[[image:oced_use.gif]]
==数据==
数据样例:[[Media:oced_data.rar|oced_data.rar]]
==备注==
采集有两个必要条件:
1、先采集6大分类下,所有网址清单,生成任务清单.txt
2、选择采集所有分类信息,就是采集所有的产品信息。
leuze网站的数据是很有价值的,但是这个网站分类很多,有305个网址。
为了方便的查看数据,我们写了一个提取数据的工具。
==功能==
采集目标
http://www.leuze.com.cn/cn/china/
采集要求
采集6个分类的数据
采集6大分类下305个网址的数据
采集字段:网址,产品型号,产品订货号,品牌,分类,商品图片,商品文档,8100`检测类型(电感/电容),8040`工作电压 `VDC,8096`检测距离(电感/电容)`mm,8048`开关频率`Hz,8059`响应时间`ms,8051`输出电路,8053`输出功能,8052`输出电路(2),8054`输出功能(2),8049`连接方式,8056`外形`mm,8036`长度(圆柱形)`mm,8041`工作温度`℃,8099`防护等级,8055`外壳材料
输出数据
==演示==
[[image:oced_use.gif]]
==数据==
数据样例:[[Media:oced_data.rar|oced_data.rar]]
==备注==
采集有两个必要条件:
1、先采集6大分类下,所有网址清单,生成任务清单.txt
2、选择采集所有分类信息,就是采集所有的产品信息。