“百度贴吧采集工具”的版本间的差异
来自JsRobot
(→输出) |
|||
(未显示同一用户的2个中间版本) | |||
第10行: | 第10行: | ||
==功能== | ==功能== | ||
− | + | 功能一. 采集指定贴吧的所有发帖内容 | |
− | + | [[image:BaiDuTieBa_TieBaTieZi.png]] | |
− | + | ||
+ | 功能二.采集指定帖子的内容和回复内容 | ||
+ | [[image:BaiDuTieBa_TieZiHeHuiFu.png]] | ||
数据保存为下面几种格式 | 数据保存为下面几种格式 | ||
CSV格式,方便EXCEL打开,方便后续的数据处理 | CSV格式,方便EXCEL打开,方便后续的数据处理 | ||
第18行: | 第20行: | ||
TXT格式,方便直接查看。 | TXT格式,方便直接查看。 | ||
− | == | + | 功能三.采集指定人的所有发帖及回复 |
+ | [[image:BaiDuTieBa_MouRenTieZiHeHuiFu.png]] | ||
+ | |||
+ | ==演示== | ||
[[image:BaiDuTieBaCaiJi_Use.gif]] | [[image:BaiDuTieBaCaiJi_Use.gif]] | ||
2016年10月13日 (四) 17:15的最新版本
摘要
这个工具是用户根据需要提取百度贴吧的帖子内容。
背景
百度搜索还是很多人用的最多的网站之一, 需要在网站上面分析一些热点话题, 采集这些话题用于数据分析或者毕业论文的依据。 通过百度搜索找到自己要找的话题进行采集, 然后对于这些话题进行数据分析。
功能
功能一. 采集指定贴吧的所有发帖内容![]()
功能二.采集指定帖子的内容和回复内容数据保存为下面几种格式 CSV格式,方便EXCEL打开,方便后续的数据处理 HTM格式,方便WORD打开,方便后去的文档处理。 TXT格式,方便直接查看。
功能三.采集指定人的所有发帖及回复![]()
演示
输出
数据样例media:BaiDuTieBaCaiJi_Dat.rar
备注
应用者根据自己需要找到需要分析的热点话题进行采集, 对收集到的数据进行数据分析。