查看“你们软件支持所有网站吗”的源代码
←
你们软件支持所有网站吗
跳转至:
导航
、
搜索
因为以下原因,你没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
这个是刚入行的数据营销人员常问的一个问题。 客户常常会希望一个软件解决所有问题。 这种期望是非常好的,但是实际上的网站的采集问题是非常复杂的。 其实这种想法与“我有一把凿子和一个锤子,理论上可以凿一个维纳斯”是一致的。 解决一个问题,本身包含三部分,一个是工具,一个是解决问题的技能,一个是解决问题的处理成本。 当然,如果也有人真的想成为数据采集的高手,的确可以自己学习。 但是对大多数人来说,想吃鸡蛋是不用买一只鸡养在家里下蛋的。 工具一般都是很廉价的,解决问题的技能学习成本却很高。 对于简单的网页来说,可能只需要懂得什么叫HTML。以前很古老的网页大都是直接用HTML写的。 对于稍微复杂点的网页来说,可能就需要懂得AJAX。现在新的网页大部分都是用来AJAX技术来获取一些易变的信息。 对于更复杂的网页就可能要知道什么叫做COOKIE,怎么处理COOKIE。如果需要登录才能看到的信息就是需要处理COOKIE的。 对于超复杂的网页来说,你可能就需要知道什么叫做反采集技术。什么叫做换IP,什么叫做多用户登录等等。 许多采集器宣传的时候是说支持所拥有的网页。这个理论上是没有任何问题。但是实际上是把网站的差异性的处理是推给客户的。 我们的一些客户就是买了通用的采集器,但是没有时间去学习采集的知识才找我们的。
返回至
你们软件支持所有网站吗
。
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
页面信息