更改

顺风快递价格采集

添加955字节, 2017年5月8日 (一) 12:00
使用
[[image:ShunFengKuaiDiJiaGeCaiJi_Ui.png]]
==使用==
软件有两种工作模式软件有三种工作模式
[[image:ShunFengKuaiDiJiaGeCaiJi_Mode.png]]
第一次使用的时候,先使用“生成任务清单”模式,生成“地址清单第一步:先使用“生成地址清单”模式,生成“地址清单.txt”。 这个文件默认生成在“c:\output\时间目录”里。 你需要手动把此文件拷贝到“C:\OUTPUT”目录中。
[[image:ShunFengKuaiDiJiaGeCaiJi_Setting0.png]]
执行完成后,
点击“查看输出”按钮,
找到“地址清单.txt”文件,
然后拷贝到c:\output目录内
以后运行的时候,直接使用“执行任务清单”模式,采集具体的快递资费信息。第二步:使用“生成任务清单”模式,生成“任务清单.txt”。
[[image:ShunFengKuaiDiJiaGeCaiJi_Setting1.png]]
执行完成后,
点击“查看输出”按钮,
找到“任务清单_xxxxxxxx.txt”文件,
然后拷贝到c:\output目录内
 
第三步:使用“执行任务清单”模式,采集具体的快递资费信息。
寄件时间的格式是yyyy-mm-dd hh:mm,注意中间的空格和补零.
如果寄件时间为空值,那么就把现在采集的时间作为寄件时间。
任务清单里的文件路径是前面生成的“任务清单_xxxxxxxx.txt”文件路径
[[image:ShunFengKuaiDiJiaGeCaiJi_Setting2.png]]
 
==备注==
采集过程中,我们发现地址清单有三千多条。
快递数目=地址条数*(地址条数-1)
要采集的数据就是千万级的数据。
为了避免采集工具显示假死,就把任务做了拆分,20000个快递信息作为一个子任务文件。
所以,整个任务的执行流程就是,先获得地址清单,然后在获得任务清单,然后再执行任务清单。
3,360
个编辑