查看“新浪博客文章采集工具”的源代码
←
新浪博客文章采集工具
跳转至:
导航
、
搜索
因为以下原因,你没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
==摘要== 这个工具解决新浪博客的文章采集问题 ==简介== 这个工具将新浪博客的文章保存为一个通用的格式。 这种格式支持图文混排的内容。 这种格式的存储,可以很方便的被其他的上传模块使用。 比如上传内容到其他的CMS系统,甚至是上传到论坛。 ==演示== [[image:XinLangBokeWenZhangCaiJiGongJu_Ui.png]] ==功能== ===默认处理=== 功能: 指定博客的网址采集博客的内容。 设置: [[image:XinLangBokeWenZhangCaiJiGongJu_Setting.png]] 任务列表中的网址,注意可以单行,也支持多行网址。 采集页数默认为1,表示采集一页。 采集页数为0,表示采集所有的页面。 ===批量采集=== 功能: 从一个文本文件中读取博客的网址,依次采集每个博客的内容。 设置: [[image:XinLangBokeWenZhangCaiJiGongJu_Setting2.png]] 请不要修改任务列表里的内容。 参数列表中的网址清单的文件网址可以换成客户自己的网址清单。 采集页数默认为1,表示采集一页。 采集页数为0,表示采集所有的页面。 ==输出== 数据存储如下图: [[image:XinLangBokeWenZhangCaiJiGongJu_Dir1.png]] [[image:XinLangBokeWenZhangCaiJiGongJu_Dir2.png]] 文章索引如下图: [[image:XinLangBokeWenZhangCaiJiGongJu_Csv.png]] 文章正文如下图:
返回至
新浪博客文章采集工具
。
导航菜单
个人工具
3.137.223.8
该IP地址的讨论
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
页面信息