更改

金象网药品信息采集

添加244字节, 2016年1月17日 (日) 02:59
输出
这个工具解决采集药品信息收集的问题。
==展示==
[[image:20160112_qq114_ui20160117_jingxiangwang_ui.gif]]<br>[[image:20160112_qq114_data20160117_jingxiangwang_data.gif]]<br> 
==背景==
药品采购的时候,需要知道药品的价格。
上面有两万多个药品产品。
==需求==
采集QQ、名称、区域、行业、主页、邮箱、电话、地址、描述 以http采集内容://88881560.114.qq.com/网址为例[[image:20160112_qq114_xuqiu_1.gif]]<br>[[image:20160112_qq114_xuqiu_2.gif]]<br>网址,分类1,分类2,分类3,分类4,分类5,分类6,分类7,分类8,分类9,分类10,编号,编码,商品名称,通用名称,规格,生产企业,批准文号,有效期至,说明书
==功能==
===输入===
输入网址为http://www.114.qqjxdyf.com/ 
===输出===
输出为CSV文件, 字段如下输出有三个。 药品信息.csv。字段列表:网址,商品分类分类1,分类2,分类3,分类4,分类5,分类6,分类7,分类8,分类9,分类10,编号,编码,商品名称,通用名称,规格,生产企业,批准文号,有效期至,说明书 数据样例图片信息.csv。字段列表:编号,外链,内链 imgs目录。这个目录保存药品相关的图片。 
===处理===
打开QQ114的网址,打开网址http://www.jxdyf.com, 依次翻页枚举药品分类, 解析出每个翻页的中的QQ信息网址处理药品子类翻页 依次处理每个QQ信息也的具体内容解析出每个翻页的中的药品信息网址 依次处理每个药品信息也的具体内容
保存输出数据
 
==其他==
3,360
个编辑