查看“金象网药品信息采集”的源代码
←
金象网药品信息采集
跳转至:
导航
、
搜索
因为以下原因,你没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
==摘要== 这个工具解决采集药品信息收集的问题。 ==展示== [[image:20160117_jingxiangwang_ui.gif]]<br> [[image:20160117_jingxiangwang_data.gif]]<br> ==背景== 药品采购的时候,需要知道药品的价格。 金象网是第二大的药品展示网站。 上面有两万多个药品产品。 ==需求== 采集内容:网址,分类1,分类2,分类3,分类4,分类5,分类6,分类7,分类8,分类9,分类10,编号,编码,商品名称,通用名称,规格,生产企业,批准文号,有效期至,说明书 ==功能== ===输入=== 输入网址为http://www.jxdyf.com ===输出=== 输出有三个: 药品信息.csv。字段列表:网址,分类1,分类2,分类3,分类4,分类5,分类6,分类7,分类8,分类9,分类10,编号,编码,商品名称,通用名称,规格,生产企业,批准文号,有效期至,说明书 图片信息.csv。字段列表:编号,外链,内链 imgs目录。这个目录保存药品相关的图片。 ===处理=== 打开网址http://www.jxdyf.com, 枚举药品分类, 处理药品子类翻页 解析出每个翻页的中的药品信息网址 依次处理每个药品信息也的具体内容 保存输出数据 ==其他==
返回至
金象网药品信息采集
。
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
页面信息