“按作者公众号采集微信公众号文章”的版本间的差异

来自JsRobot
跳转至: 导航搜索
(创建页面,内容为“==摘要== 这个工具是解决客户收集某个特定微信公众号文章的问题。 ==背景== 微信营销是一个大的趋势。 微信营销中的一...”)
(没有差异)

2016年1月10日 (日) 06:20的版本

摘要

 这个工具是解决客户收集某个特定微信公众号文章的问题。

背景

 微信营销是一个大的趋势。
 微信营销中的一个核心问题就是微信文章的编写。
 古语说,读书破万卷,下笔如有神。
 写好微信公众文章的第一件事情,就是学习高手的公众号文章怎么写。

需求

 把某个微信公众号的所有文章都保存下来。
 要求保存为HTML格式,方便用户编辑。
 要求保存为TXT格式,方便用户检索。

功能

输入

 某个公众号的网址。
 例如http://weixin.sogou.com/gzh?openid=oIWsFt747RYx3-dEPsVs7v0KKY0o&ext=h3NILeBbx87b0bsxUG4QV7cjR8Alm7QdOzbDVLiWKs_s7AsdmvGByqKS0axEvj5I
 你可以在搜狗搜索上搜索该公众号的名字,就可以找到这个公众号的网址。

输出

 以网址http://www.weixinqun.com/group?id=897549对应的数据保存为例子
 数据保存如下:
 时间目录\
      城市\
          杭州市\
              宝妈 辣妈 代理 购物 推广 交流.png
      行业\
          微商\
              宝妈 辣妈 代理 购物 推广 交流.png
      微信群信息清单.csv
  微信群信息清单.csv的字段如下
  编号,名称,行业,城市
  897549,宝妈 辣妈 代理 购物 推广 交流,微商,杭州市

处理

  主要处理逻辑
  1.软件打开网址http://www.weixinqun.com/group
  2.依次翻页
  3.解析各个翻页中的特定微信群的信息网址
  4.依次打开特定微信群的网址(例如http://www.weixinqun.com/group?id=897549)
  5.解析网页内容,把二维码图片保存下来。
  次要处理逻辑
  1.在处理特定微信群的网址之前,先判断一下微信群是否在上次已经采集过。
  2.如果没有采集过,则采集,并把网址加入历史清单
  4.如果以及擦剂过,则跳过处理。

展示

其他