==摘要==
这个工具是用户根据需要提取百度贴吧的话题的内容。 ==使用== [[image:BaiDuTieBaCaiJi_Use.gif]]这个工具是用户根据需要提取百度贴吧的帖子内容。
==背景==
==功能==
应用者根据自己需要找到需要分析的热点话题进行采集,功能一. 采集指定贴吧的所有发帖内容 对收集到的数据进行数据分析。 主要提取发帖内容和回复内容 发帖内存保存:帖子ID,作者,内容,发帖时间 回复你让保存:帖子ID,回复人,内容,回复时间[[image:BaiDuTieBa_TieBaTieZi.png]]
==功能=====输入======输出=== 功能二.采集指定帖子的内容和回复内容 [[image:201603163BaiDuTieBa_TieZiHeHuiFu.png]]<br> 数据保存为下面几种格式 CSV格式,方便EXCEL打开,方便后续的数据处理 HTM格式,方便WORD打开,方便后去的文档处理。 TXT格式,方便直接查看。
===处理=== 模拟人工查询的方法输入关键词功能三.采集指定人的所有发帖及回复 获取查询结果 解析返回结果中的标题 作者 内容 最后回复时间 回复数目 话题编号 根据网址的域名进行网址过滤 根据网址的域名进行网址去重 保存新发现的结果 解析结果内容 [[image:BaiDuTieBa_MouRenTieZiHeHuiFu.png]]
==使用演示== [[image:BaiDuTieBaCaiJi_Use.gif]] ==输出== 数据样例[[media:BaiDuTieBaCaiJi_Dat.rar]] [[image:BaiDuTieBaCaiJi_TieZi.png]] [[image:BaiDuTieBaCaiJi_HuiFu.png]] [[image:BaiDuTieBaCaiJi_Word.png]]
==备注==
应用者根据自己需要找到需要分析的热点话题进行采集,
对收集到的数据进行数据分析。