“寻医问药网采集工具”的版本间的差异
来自JsRobot
(→数据) |
|||
第11行: | 第11行: | ||
[批准文号]:国药准字417303H02 | [批准文号]:国药准字417303H02 | ||
[通用名称]:甲地高辛片 | [通用名称]:甲地高辛片 | ||
+ | |||
+ | 数据样例展示如下: | ||
+ | |||
+ | [[image:Xywywsjyl.jpg]] | ||
txt文件,以文本格式保存“药品名字”和“通用名称”和“药品名字+通用名称”的搜索词汇清单。 | txt文件,以文本格式保存“药品名字”和“通用名称”和“药品名字+通用名称”的搜索词汇清单。 |
2017年5月25日 (四) 14:23的版本
简介
这个工具采集了寻医药品网的药品信息。
功能
这工具负责从寻医问药网上提取药品信息。 数据保存为两种文件,csv文件和txt文件
csv文件,以excel表的格式保存药品信息,方便用户以后核对数据 字段列表如下: [网址]:http://yao.xywy.com/goods/10.htm [药品名称]:贝可力 [批准文号]:国药准字417303H02 [通用名称]:甲地高辛片
数据样例展示如下:
txt文件,以文本格式保存“药品名字”和“通用名称”和“药品名字+通用名称”的搜索词汇清单。 搜索词汇清单文件是后面的百度搜索项目的输入文件。
演示
设置
采集的时候需要指定开始编号和结束编号。 这两个值需要客户自己调整一下。 保留着两个值的目的是为了避免客户采集到已经采集过的药品信息。