查看“寻医问药网采集工具”的源代码
←
寻医问药网采集工具
跳转至:
导航
、
搜索
因为以下原因,你没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
==简介== 寻医问药网依靠自身多年来对医生、医院资源的沉淀积累,成功搭建了由健康资讯、医药搜索查询以及独具自主特色的“ 有问必答”社区共同构成的医患交流平台。并凭借每天IP过百万,PV过千万的超级人气,迅速成为广大患者、医疗单位、医药厂商关注的焦点。 • 2010年网站日浏览量突破5000万;日均独立IP突破500万。搜索引擎收录数量增长了390%,超过392,700,00条;搜索引擎反向链接数量增长了133%,超过572,000条。 • 2011年获得由马云、虞锋、史玉柱、沈国军等中国成功企业家、行业领袖发起设立的投资基金“云峰基金”战略投资。此次融资主要用于寻医问药网的深化发展,打造第三方健康服务导购平台闻康商城,并在服务创新上加大力度,以为广大网民提供更实用、更便捷、更完善的健康服务。 1. 采集字段:网址 药品名称 批准文号 通用名称 2. 采集这个信息可以方便一些药品公司完善药品信息 3. 可以填充药品网站药品内容,很多网站药品信息的批准文号无法采集或者是图片处理,这个软件采集所有信息全部都是文字。 ==功能== 这工具负责从寻医问药网上提取药品信息。 数据保存为两种文件,csv文件和txt文件 csv文件,以excel表的格式保存药品信息,方便用户以后核对数据 字段列表如下: [网址]:http://yao.xywy.com/goods/10.htm [药品名称]:贝可力 [批准文号]:国药准字417303H02 [通用名称]:甲地高辛片 数据样例展示如下: [[image:Xywywsjyl.jpg]] txt文件,以文本格式保存“药品名字”和“通用名称”和“药品名字+通用名称”的搜索词汇清单。 搜索词汇清单文件是后面的百度搜索项目的输入文件。 ==演示== [[image:XunYiWenYaoCaiJiGongJu_Ui.png]] ==设置== [[image:XunYiWenYaoCaiJiGongJu_Setting.png]] 采集的时候需要指定开始编号和结束编号。 这两个值需要客户自己调整一下。 保留着两个值的目的是为了避免客户采集到已经采集过的药品信息。 ==数据== [[image:XunYiWenYaoCaiJiGongJu_Csv.png]] [[image:XunYiWenYaoCaiJiGongJu_Txt.png]] ==备注==
返回至
寻医问药网采集工具
。
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
页面信息