“你们软件支持所有网站吗”的版本间的差异

来自JsRobot
跳转至: 导航搜索
(创建页面,内容为“ 客户常常会希望一个软件解决所有问题。 这种期望是非常好的,但是实际上的网站的采集问题是非常复杂的。 其...”)
 
 
(未显示同一用户的1个中间版本)
第1行: 第1行:
 +
    这个是刚入行的数据营销人员常问的一个问题。
 +
 
     客户常常会希望一个软件解决所有问题。
 
     客户常常会希望一个软件解决所有问题。
 
     这种期望是非常好的,但是实际上的网站的采集问题是非常复杂的。
 
     这种期望是非常好的,但是实际上的网站的采集问题是非常复杂的。
 
     其实这种想法与“我有一把凿子和一个锤子,理论上可以凿一个维纳斯”是一致的。
 
     其实这种想法与“我有一把凿子和一个锤子,理论上可以凿一个维纳斯”是一致的。
 +
 
     解决一个问题,本身包含三部分,一个是工具,一个是解决问题的技能,一个是解决问题的处理成本。
 
     解决一个问题,本身包含三部分,一个是工具,一个是解决问题的技能,一个是解决问题的处理成本。
 
     当然,如果也有人真的想成为数据采集的高手,的确可以自己学习。
 
     当然,如果也有人真的想成为数据采集的高手,的确可以自己学习。
 
     但是对大多数人来说,想吃鸡蛋是不用买一只鸡养在家里下蛋的。
 
     但是对大多数人来说,想吃鸡蛋是不用买一只鸡养在家里下蛋的。
 +
 +
    工具一般都是很廉价的,解决问题的技能学习成本却很高。
 +
    对于简单的网页来说,可能只需要懂得什么叫HTML。以前很古老的网页大都是直接用HTML写的。
 +
    对于稍微复杂点的网页来说,可能就需要懂得AJAX。现在新的网页大部分都是用来AJAX技术来获取一些易变的信息。
 +
    对于更复杂的网页就可能要知道什么叫做COOKIE,怎么处理COOKIE。如果需要登录才能看到的信息就是需要处理COOKIE的。
 +
    对于超复杂的网页来说,你可能就需要知道什么叫做反采集技术。什么叫做换IP,什么叫做多用户登录等等。
 +
    许多采集器宣传的时候是说支持所拥有的网页。这个理论上是没有任何问题。但是实际上是把网站的差异性的处理是推给客户的。
 +
 +
    我们的一些客户就是买了通用的采集器,但是没有时间去学习采集的知识才找我们的。

2017年4月26日 (三) 10:21的最新版本

    这个是刚入行的数据营销人员常问的一个问题。
    客户常常会希望一个软件解决所有问题。
    这种期望是非常好的,但是实际上的网站的采集问题是非常复杂的。
    其实这种想法与“我有一把凿子和一个锤子,理论上可以凿一个维纳斯”是一致的。
    解决一个问题,本身包含三部分,一个是工具,一个是解决问题的技能,一个是解决问题的处理成本。
    当然,如果也有人真的想成为数据采集的高手,的确可以自己学习。
    但是对大多数人来说,想吃鸡蛋是不用买一只鸡养在家里下蛋的。
    工具一般都是很廉价的,解决问题的技能学习成本却很高。
    对于简单的网页来说,可能只需要懂得什么叫HTML。以前很古老的网页大都是直接用HTML写的。
    对于稍微复杂点的网页来说,可能就需要懂得AJAX。现在新的网页大部分都是用来AJAX技术来获取一些易变的信息。
    对于更复杂的网页就可能要知道什么叫做COOKIE,怎么处理COOKIE。如果需要登录才能看到的信息就是需要处理COOKIE的。
    对于超复杂的网页来说,你可能就需要知道什么叫做反采集技术。什么叫做换IP,什么叫做多用户登录等等。
    许多采集器宣传的时候是说支持所拥有的网页。这个理论上是没有任何问题。但是实际上是把网站的差异性的处理是推给客户的。
    我们的一些客户就是买了通用的采集器,但是没有时间去学习采集的知识才找我们的。