3,360
个编辑
更改
无编辑摘要
这个是刚入行的数据营销人员常问的一个问题。
客户常常会希望一个软件解决所有问题。
这种期望是非常好的,但是实际上的网站的采集问题是非常复杂的。
其实这种想法与“我有一把凿子和一个锤子,理论上可以凿一个维纳斯”是一致的。
解决一个问题,本身包含三部分,一个是工具,一个是解决问题的技能,一个是解决问题的处理成本。
当然,如果也有人真的想成为数据采集的高手,的确可以自己学习。
但是对大多数人来说,想吃鸡蛋是不用买一只鸡养在家里下蛋的。
工具一般都是很廉价的,解决问题的技能学习成本却很高。
对于简单的网页来说,可能只需要懂得什么叫HTML。以前很古老的网页大都是直接用HTML写的。
对于超复杂的网页来说,你可能就需要知道什么叫做反采集技术。什么叫做换IP,什么叫做多用户登录等等。
许多采集器宣传的时候是说支持所拥有的网页。这个理论上是没有任何问题。但是实际上是把网站的差异性的处理是推给客户的。
我们的一些客户就是买了通用的采集器,但是没有时间去学习采集的知识才找我们的。