58二手房个人房源抢单器

来自JsRobot
跳转至: 导航搜索

摘要

     这个工具58二手房个人房源抢单的问题。

展示

     58ershoufangqiangdanqi ui.png

背景

     58同城是中国第一中文分类信息网站,涵盖房产、车辆、招工、兼职、黄页等海量的生活分类信息,满足您不同的查询需求。同时也是您最好的免费发布信息网站。
     许多小公司都在关注58同城上面的新发布信息。
     “抓得快,抓的准”就是决定业务员抢单成功与否的一个关键。
     抓得快,要求第一时间发现房源信息。
     抓的准要求过滤中介信息,过滤历史信息,只保留新增个人房源信息,确保业务员打电话打的少,但是有价值。

需求

     1.采集特定城市的二手房信息
     2.要求提供新客户通知功能
     3.采用IE弹出窗口的模式提醒用户
     4.要求过滤中介人员
     5.软件要设置密码避免别人随意使用
     6.要求过滤老的单子

分析

    中介识别的规则:
    如果房源来源是中介则必然是中介,必须忽略。
    如果房源来源是个人,则可能是中介也可能是个人。
    如果房源的信息页面里出现了特殊的关键词(比如 经纪人 链家 我爱我家 中原 21世纪 美联 中大恒基 中天置地 麦田 鑫尊 爱屋吉屋)则认为是中介。
    如果发现一个人的电话在多个信息中出现,就可以认为是中介。
    如果同一个电话在不同房源上出现超过2次以上即可视为中介电话。
    同一房源如果出现过多个不同的电话,也可视为中介房源。
    开发过程中发现:
    在“来源是个人房源”和“重复信息不采集”和“出现特殊关键词过滤”三种技术过滤后,剩余的房源已经很少了。
    来源是中介房源信息占房源信息的99%。电话不是图片,但是直接通过来源就可以过滤,不需要通过电话,
    来源是个人房源信息占房源嘻嘻的1%。电话是图片,58每天换一次电话号码识别算法,导致电话号码的100%很难做到,使用电话号码过滤的技术无法实现。
    来源是个人房源的信息是是可以通过关键词过滤的。

功能

输入

      58某个城市的二手房的网址。
      http://bj.58.com/ershoufang/

输出

      发现有新的个人房源采用弹出IE窗口的方式提示。

处理

      通过采集“来源是个人房源”的数据,过滤中介数据。
      采用历史记录技术过滤历史数据,避免数据二次采集。
      采集最前面几页,避免数据的二次采集。
      采用关键词过滤技术,过滤“发布在个人房源里,但是实际上是中介”的房源信息。

使用

软件设置

      58ershoufang qiangdanqi setting.png
      采集集页:采集信息列表页的多少页。我们在分析问题的时候发现,58的信息是越新的在越前面显示。太老的信息对于客户是无意义的。也就每次都采集前几页就可以了。
      代理清单:这个可以不用。
      刷新时间:刷新页面的时间。间隔多长时间去检查一次页面的更新情况。取值越小,检查的越频繁。这个值根据客户自己试验设定。
      弹出通知:发现新的个人房源信息就弹出IE窗口提示客户的开关。为1,表示弹IE,为0,就表示不弹IE。
      中介过滤=c:\output\中介过滤.txt

使用步骤

      软件安装
      参考软件安装指南
      软件使用
      参考软件使用指南
      特别说明
      第一次使用:弹出通知设置为0,点击开始采集,采集几分钟,然后停止采集。这样可以把老的数据采集一遍,让采集器记忆下那些信息是无效的,以后就不采集了。
      以后使用:弹出通知设置为1,点击开始采集。采集过程中发现有新的个人房源信息,在主界面上显示,同时就弹出IE提示。
      直接拨号
      需要您在手机上先安装营销助手APP,并启动该软件,点击开始。
      具体的步骤请参考怎么安装营销助手APP
      然后将设置里的三个参数修改一下
      拨打电话设置为1
      电话地址设置为营销助手上显示的手机地址。
      电话口令设置为营销助手上显示的访问口令。
      然后就可以正常使用了。

其他