“按作者公众号采集微信公众号文章”的版本间的差异
来自JsRobot
(创建页面,内容为“==摘要== 这个工具是解决客户收集某个特定微信公众号文章的问题。 ==背景== 微信营销是一个大的趋势。 微信营销中的一...”) |
(没有差异)
|
2016年1月10日 (日) 06:20的版本
摘要
这个工具是解决客户收集某个特定微信公众号文章的问题。
背景
微信营销是一个大的趋势。 微信营销中的一个核心问题就是微信文章的编写。 古语说,读书破万卷,下笔如有神。 写好微信公众文章的第一件事情,就是学习高手的公众号文章怎么写。
需求
把某个微信公众号的所有文章都保存下来。 要求保存为HTML格式,方便用户编辑。 要求保存为TXT格式,方便用户检索。
功能
输入
某个公众号的网址。 例如http://weixin.sogou.com/gzh?openid=oIWsFt747RYx3-dEPsVs7v0KKY0o&ext=h3NILeBbx87b0bsxUG4QV7cjR8Alm7QdOzbDVLiWKs_s7AsdmvGByqKS0axEvj5I 你可以在搜狗搜索上搜索该公众号的名字,就可以找到这个公众号的网址。
输出
以网址http://www.weixinqun.com/group?id=897549对应的数据保存为例子 数据保存如下: 时间目录\ 城市\ 杭州市\ 宝妈 辣妈 代理 购物 推广 交流.png 行业\ 微商\ 宝妈 辣妈 代理 购物 推广 交流.png 微信群信息清单.csv 微信群信息清单.csv的字段如下 编号,名称,行业,城市 897549,宝妈 辣妈 代理 购物 推广 交流,微商,杭州市
处理
主要处理逻辑 1.软件打开网址http://www.weixinqun.com/group 2.依次翻页 3.解析各个翻页中的特定微信群的信息网址 4.依次打开特定微信群的网址(例如http://www.weixinqun.com/group?id=897549) 5.解析网页内容,把二维码图片保存下来。 次要处理逻辑 1.在处理特定微信群的网址之前,先判断一下微信群是否在上次已经采集过。 2.如果没有采集过,则采集,并把网址加入历史清单 4.如果以及擦剂过,则跳过处理。