“按作者公众号采集微信公众号文章”的版本间的差异

2016年1月10日 (日) 05:20的版本

摘要

 这个工具是解决客户收集某个特定微信公众号文章的问题。

背景

 微信营销是一个大的趋势。
 微信营销中的一个核心问题就是微信文章的编写。
 古语说，读书破万卷,下笔如有神。
 写好微信公众文章的第一件事情，就是学习高手的公众号文章怎么写。

需求

 把某个微信公众号的所有文章都保存下来。
 要求保存为HTML格式，方便用户编辑。
 要求保存为TXT格式，方便用户检索。

功能

输入

 某个公众号的网址。
 例如http://weixin.sogou.com/gzh?openid=oIWsFt747RYx3-dEPsVs7v0KKY0o&ext=h3NILeBbx87b0bsxUG4QV7cjR8Alm7QdOzbDVLiWKs_s7AsdmvGByqKS0axEvj5I
 你可以在搜狗搜索上搜索该公众号的名字，就可以找到这个公众号的网址。

输出

 以网址http://www.weixinqun.com/group?id=897549对应的数据保存为例子
 数据保存如下：
 时间目录\
      城市\
          杭州市\
              宝妈 辣妈 代理 购物 推广 交流.png
      行业\
          微商\
              宝妈 辣妈 代理 购物 推广 交流.png
      微信群信息清单.csv
  微信群信息清单.csv的字段如下
  编号,名称,行业,城市
  897549,宝妈 辣妈 代理 购物 推广 交流,微商,杭州市

处理

  主要处理逻辑
  1.软件打开网址http://www.weixinqun.com/group
  2.依次翻页
  3.解析各个翻页中的特定微信群的信息网址
  4.依次打开特定微信群的网址（例如http://www.weixinqun.com/group?id=897549）
  5.解析网页内容，把二维码图片保存下来。
  次要处理逻辑
  1.在处理特定微信群的网址之前，先判断一下微信群是否在上次已经采集过。
  2.如果没有采集过，则采集，并把网址加入历史清单
  4.如果以及擦剂过，则跳过处理。

“按作者公众号采集微信公众号文章”的版本间的差异

2016年1月10日 (日) 05:20的版本

目录

摘要

背景

需求

功能

输入

输出

处理

展示

其他

导航菜单

个人工具

命名空间

变种

视图

更多

搜索

导航

工具