“金象网药品信息采集”的版本间的差异
来自JsRobot
(→需求) |
(→输入) |
||
第14行: | 第14行: | ||
==功能== | ==功能== | ||
===输入=== | ===输入=== | ||
− | 输入网址为http://www. | + | 输入网址为http://www.jxdyf.com |
+ | |||
===输出=== | ===输出=== | ||
输出为CSV文件, | 输出为CSV文件, |
2016年1月17日 (日) 04:54的版本
摘要
这个工具解决采集药品信息收集的问题。
展示
背景
药品采购的时候,需要知道药品的价格。 金象网是第二大的药品展示网站。 上面有两万多个药品产品。
需求
采集内容网址,分类1,分类2,分类3,分类4,分类5,分类6,分类7,分类8,分类9,分类10,编号,编码,商品名称,通用名称,规格,生产企业,批准文号,有效期至,说明书
功能
输入
输入网址为http://www.jxdyf.com
输出
输出为CSV文件, 字段如下 网址,商品分类,编号,编码,商品名称,通用名称,规格,生产企业,批准文号,有效期至,说明书 数据样例
处理
打开QQ114的网址, 依次翻页 解析出每个翻页的中的QQ信息网址 依次处理每个QQ信息也的具体内容 保存输出数据