这个工具解决新浪博客的文章采集问题
这个工具将新浪博客的文章保存为一个通用的格式。 这种格式支持图文混排的内容。 这种格式的存储,可以很方便的被其他的上传模块使用。 比如上传内容到其他的CMS系统,甚至是上传到论坛。
功能: 指定博客的网址采集博客的内容。
设置: 任务列表中的网址,注意可以单行,也支持多行网址。 采集页数默认为1,表示采集一页。 采集页数为0,表示采集所有的页面。
功能: 从一个文本文件中读取博客的网址,依次采集每个博客的内容。
设置:
数据存储如下图: