查看“百度贴吧采集工具”的源代码
←
百度贴吧采集工具
跳转至:
导航
、
搜索
因为以下原因,你没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
==摘要== 这个工具是用户根据需要提取百度贴吧的话题的工具, 主要提取发帖内容和回复内容 发帖内存保存:帖子ID,作者,内容,发帖时间 回复你让保存:帖子ID,回复人,内容,回复时间 ==使用== [[image:BaiDuTieBaCaiJi_Use.gif]] ==背景== 百度搜索还是很多人用的最多的网站之一, 需要在网站上面分析一些热点话题, 采集这些话题用于数据分析或者毕业论文的依据。 通过百度搜索找到自己要找的话题进行采集, 然后对于这些话题进行数据分析。 ==需求== 应用者根据自己需要找到需要分析的热点话题进行采集, 对收集到的数据进行数据分析。 ==功能== ===输入=== ===输出=== [[image:201603163.png]]<br> ===处理=== 模拟人工查询的方法输入关键词 获取查询结果 解析返回结果中的标题 作者 内容 最后回复时间 回复数目 话题编号 根据网址的域名进行网址过滤 根据网址的域名进行网址去重 保存新发现的结果 解析结果内容 ==使用== ==备注==
返回至
百度贴吧采集工具
。
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
页面信息