微信群的微信群二维码采集

Storm讨论 | 贡献2016年1月6日 (三) 03:07的版本

Storm讨论 | 贡献2016年1月6日 (三) 03:07的版本

摘要

   这个工具解决发现新的微信群的问题。

背景

   微信营销的一个很重要工作就是增加曝光量。加入微信群,就是这其中一个很重要的工作。
   一个微信群,往往在建立初期管理是不完善的,很容易加入。但是到了后期,加入就是很麻烦的事情了。
   客户希望加入最近新建的微信群,为后续的微信营销做准备。

需求

  把微信群的二维码图片保存下来
  每天只采集新增的微信群的二维码图片
  按照时间和行业分类新的微信群
  按照时间和地域分类新的微信群

功能

输入

  http://www.weixinqun.com/group

输出

  以网址http://www.weixinqun.com/group?id=897549对应的数据保存为例子
  数据保存如下:
  时间目录\
      城市\
          杭州市\
              宝妈 辣妈 代理 购物 推广 交流.png
      行业\
          微商\
              宝妈 辣妈 代理 购物 推广 交流.png
      微信群信息清单.csv
  微信群信息清单.csv的字段如下
  编号,名称,行业,城市
  897549,宝妈 辣妈 代理 购物 推广 交流,微商,杭州市

处理

  主要处理逻辑
  1.软件打开网址http://www.weixinqun.com/group
  2.依次翻页
  3.解析各个翻页中的特定微信群的信息网址
  4.依次打开特定微信群的网址(例如http://www.weixinqun.com/group?id=897549)
  5.解析网页内容,把二维码图片保存下来。
  次要处理逻辑
  1.在处理特定微信群的网址之前,先判断一下微信群是否在上次已经采集过。
  2.如果没有采集过,则采集,并把网址加入历史清单
  4.如果以及擦剂过,则跳过处理。

结论

其他