查看“58企业名录采集”的源代码
←
58企业名录采集
跳转至:
导航
、
搜索
因为以下原因,你没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
==摘要== 这个工具解决58装潢企业名录采集的问题。 ==展示== [[image:20160118_58qiyeminglu_ui.gif]]<br> [[image:20160118_58qiyeminglu_dir.gif]]<br> [[image:20160118_58qiyeminglu_data.gif]]<br> ==背景== 58企业名录网,是权威的企业黄页、企业信息、公司招聘信息导航网站。<br> 你可以找到全国数百万个最新、真实免费的企业名录,企业黄页,包括公司招聘,地址,电话等企业信息大全。<br> 在58上发布信息的企业一般都会在58的企业名录上找到。<br> 这对于找一些中小型公司的联系方式是非常有效的.<br> ==需求== 采集58上某个特定行业的企业名录的信息。 要求每天获取新的企业信息,过滤到的企业信息。 第一次要可以获得整个的企业信息。 ==功能== ===输入=== 某个城市的某个行业的企业名录网址 比如北京装潢企业的网址是http://qy.58.com/bj_271/ 输入接受 http://qy.58.com/{城市}_{行业编号}/ 的格式的网址。 ===输出=== 网址,公司名字,城市名字,公司资质,公司性质,公司行业,公司规模,联系人,联系电话,邮箱,企业网址,公司地址 ===处理=== ==备注== 58有一些反采集的处理。 电话号码和邮箱都是图片。 而且每天都会换图片生产的算法。 字母和数字之间也可能是粘连的。 采集的时候一并把电话号码和邮箱的图片都采集下来了。 客户可以使用第三方OCR软件识别电话和邮箱的图片。 也可以由人工处理电话和邮箱的图片。 对于每天都采集,抓取新增企业信息的客户来说,人工处理足够的。
返回至
58企业名录采集
。
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
页面信息