这个项目采集了顺风快递的价格。
==功能==
采集了顺风快递的价格采集了顺风快递的快递资费 原始内容网页截图如图 [[image:ShunFengKuaiDiJiaCaiJi_Src0.jpg]] [[image:ShunFengKuaiDiJiaCaiJi_Src1.jpg]]
数据输出字段如下:
[出发城市]:世界
[产品1]:顺丰国际特惠
[到达1]:4-6
[首重1]:27100韩元27100 [续重1]:2200韩元2200
[产品2]:顺丰国际特惠
[到达2]:4-6
[首重2]:20900韩元20900 [续重2]:6200韩元6200
[产品3]:顺丰次日
[到达3]:2-3
[首重3]:23800韩元23800 [续重3]:12000韩元12000 首重:运送一公斤的价格。 续重:在首重基础上,每增加一公斤,增加多少钱。
==演示==
[[image:ChuangKouNeiRongDingShiBuZhuoQi_UiShunFengKuaiDiJiaGeCaiJi_Ui.png]]
==使用==
启动软件软件有三种工作模式 把软件上面的十字图标拖动到你要抓取的窗口上面放开,[[image:ShunFengKuaiDiJiaGeCaiJi_Mode.png]] 第一步:先使用“生成地址清单”模式,生成“地址清单.txt”。 [[image:ShunFengKuaiDiJiaGeCaiJi_Setting0.png]] 执行完成后, 点击“查看输出”按钮, 找到“地址清单.txt”文件, 然后拷贝到c:\output目录内 第二步:使用“生成任务清单”模式,生成“任务清单.txt”。 [[image:ShunFengKuaiDiJiaGeCaiJi_Setting1.png]] 执行完成后, 点击“查看输出”按钮, 找到“任务清单_xxxxxxxx.txt”文件, 然后拷贝到c:\output目录内 第三步:使用“执行任务清单”模式,采集具体的快递资费信息。 寄件时间的格式是yyyy-mm-dd hh:mm,注意中间的空格和补零. 如果寄件时间为空值,那么就把现在采集的时间作为寄件时间。 任务清单里的文件路径是前面生成的“任务清单_xxxxxxxx.txt”文件路径 [[image:ShunFengKuaiDiJiaGeCaiJi_Setting2.png]] ==备注== 采集过程中,我们发现地址清单有三千多条。 快递数目=地址条数*(地址条数-1) 要采集的数据就是千万级的数据。 然后选择合适的文字处理类型和刷新处理类型,为了避免采集工具显示假死,就把任务做了拆分,20000个快递信息作为一个子任务文件。 然后就可以了。所以,整个任务的执行流程就是,先获得地址清单,然后在获得任务清单,然后再执行任务清单。