==简介==
oced网站的数据是很有价值的,但是这个网站访问非常慢。斗米兼职网信息采集http://vip.doumi.com/ 为了方便的查看数据,我们写了一个提取数据的工具。客户要求采集相关应聘人员的电话等基本信息
==功能==
采集目标
http://statsvip.oecddoumi.orgcom/managecenter/Index.aspx?DatasetCode=PATS_IPC
采集要求
采集107个国家的数据点击报名管理 采集每个国家8(A-H)个行业的数据采集字段 :姓名,电话,地址,性别,岁数 数据要求精确到4位小数采集完一条信息,点击录用,报名管理里就移除了 数据过滤条件为如果设置报名管理报名单为0,自动跳采集下一条 Reference Date:Priority date Patents Office & Triadic Patents Families:Triadic Patents Families Reference country:Applicant(s)'s country(ies) of residence 输出数据
==演示==
[[image:oced_usedoumixinxicaiji.gif]]
==数据==
数据样例:[[Media:oced_dataDoumixinxicaiji.rar|oced_dataDoumixinxicaiji.rar]]
==备注==
采集有两个必要条件:采集有两个开关: 需要把城市列表和参数信息文件拷贝到C:\OUTPUT目录中采集页数=0(全部采集) 需要在IE里访问要采集的网站,并把过滤条件都设置好。录用开关=1(=1采集完毕后就点击录用,=0不点击录用)