“斗米兼职信息采集”的版本间的差异

(创建页面,内容为“==简介== oced网站的数据是很有价值的,但是这个网站访问非常慢。 为了方便的查看数据,我们写了一个提取数据的工具...”)
 
演示
 
(未显示同一用户的4个中间版本)
第1行: 第1行:
 
==简介==
 
==简介==
     oced网站的数据是很有价值的,但是这个网站访问非常慢。
+
     斗米兼职网信息采集http://vip.doumi.com/
     为了方便的查看数据,我们写了一个提取数据的工具。
+
     客户要求采集相关应聘人员的电话等基本信息
 +
 
 
==功能==
 
==功能==
 
     采集目标
 
     采集目标
     http://stats.oecd.org/Index.aspx?DatasetCode=PATS_IPC
+
     http://vip.doumi.com/managecenter/
 
     采集要求
 
     采集要求
     采集107个国家的数据
+
     点击报名管理
     采集每个国家8(A-H)个行业的数据
+
     采集字段 :姓名,电话,地址,性别,岁数
     数据要求精确到4位小数
+
     采集完一条信息,点击录用,报名管理里就移除了
     数据过滤条件为
+
     如果设置报名管理报名单为0,自动跳采集下一条 
    Reference Date:Priority date
+
 
    Patents Office & Triadic Patents Families:Triadic Patents Families
+
    Reference country:Applicant(s)'s country(ies) of residence
+
    输出数据
+
 
==演示==
 
==演示==
     [[image:oced_use.gif]]
+
     [[image:doumixinxicaiji.gif]]
 +
 
 
==数据==
 
==数据==
     数据样例:[[Media:oced_data.rar|oced_data.rar]]
+
     数据样例:[[Media:Doumixinxicaiji.rar|Doumixinxicaiji.rar]]
 +
 
 
==备注==
 
==备注==
     采集有两个必要条件:
+
     采集有两个开关:
     需要把城市列表和参数信息文件拷贝到C:\OUTPUT目录中
+
     采集页数=0(全部采集)
     需要在IE里访问要采集的网站,并把过滤条件都设置好。
+
     录用开关=1(=1采集完毕后就点击录用,=0不点击录用)

2016年9月19日 (一) 14:37的最新版本

简介

   斗米兼职网信息采集http://vip.doumi.com/
   客户要求采集相关应聘人员的电话等基本信息

功能

   采集目标
   http://vip.doumi.com/managecenter/
   采集要求
   点击报名管理
   采集字段 :姓名,电话,地址,性别,岁数
   采集完一条信息,点击录用,报名管理里就移除了
   如果设置报名管理报名单为0,自动跳采集下一条 

演示

   Doumixinxicaiji.gif

数据

   数据样例:Doumixinxicaiji.rar

备注

   采集有两个开关:
   采集页数=0(全部采集)
   录用开关=1(=1采集完毕后就点击录用,=0不点击录用)