“百度贴吧采集工具”的版本间的差异
来自JsRobot
(未显示同一用户的22个中间版本) | |||
第1行: | 第1行: | ||
==摘要== | ==摘要== | ||
− | + | 这个工具是用户根据需要提取百度贴吧的帖子内容。 | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
==背景== | ==背景== | ||
− | + | 百度搜索还是很多人用的最多的网站之一, | |
− | + | 需要在网站上面分析一些热点话题, | |
− | + | 采集这些话题用于数据分析或者毕业论文的依据。 | |
− | + | 通过百度搜索找到自己要找的话题进行采集, | |
− | + | 然后对于这些话题进行数据分析。 | |
− | + | ||
− | + | ||
==功能== | ==功能== | ||
− | + | 功能一. 采集指定贴吧的所有发帖内容 | |
− | + | [[image:BaiDuTieBa_TieBaTieZi.png]] | |
− | + | ||
− | + | 功能二.采集指定帖子的内容和回复内容 | |
− | + | [[image:BaiDuTieBa_TieZiHeHuiFu.png]] | |
− | + | 数据保存为下面几种格式 | |
− | + | CSV格式,方便EXCEL打开,方便后续的数据处理 | |
− | + | HTM格式,方便WORD打开,方便后去的文档处理。 | |
− | + | TXT格式,方便直接查看。 | |
− | + | ||
− | + | 功能三.采集指定人的所有发帖及回复 | |
− | == | + | [[image:BaiDuTieBa_MouRenTieZiHeHuiFu.png]] |
− | [[image: | + | |
+ | ==演示== | ||
+ | [[image:BaiDuTieBaCaiJi_Use.gif]] | ||
+ | |||
+ | ==输出== | ||
+ | 数据样例[[media:BaiDuTieBaCaiJi_Dat.rar]] | ||
+ | |||
+ | [[image:BaiDuTieBaCaiJi_TieZi.png]] | ||
+ | |||
+ | [[image:BaiDuTieBaCaiJi_HuiFu.png]] | ||
+ | |||
+ | [[image:BaiDuTieBaCaiJi_Word.png]] | ||
==备注== | ==备注== | ||
− | + | 应用者根据自己需要找到需要分析的热点话题进行采集, | |
− | + | 对收集到的数据进行数据分析。 | |
− | + |
2016年10月13日 (四) 17:15的最新版本
摘要
这个工具是用户根据需要提取百度贴吧的帖子内容。
背景
百度搜索还是很多人用的最多的网站之一, 需要在网站上面分析一些热点话题, 采集这些话题用于数据分析或者毕业论文的依据。 通过百度搜索找到自己要找的话题进行采集, 然后对于这些话题进行数据分析。
功能
功能一. 采集指定贴吧的所有发帖内容![]()
功能二.采集指定帖子的内容和回复内容数据保存为下面几种格式 CSV格式,方便EXCEL打开,方便后续的数据处理 HTM格式,方便WORD打开,方便后去的文档处理。 TXT格式,方便直接查看。
功能三.采集指定人的所有发帖及回复![]()
演示
输出
数据样例media:BaiDuTieBaCaiJi_Dat.rar
备注
应用者根据自己需要找到需要分析的热点话题进行采集, 对收集到的数据进行数据分析。