“百度贴吧采集工具”的版本间的差异

来自JsRobot
跳转至: 导航搜索
展示
 
(未显示同一用户的11个中间版本)
第1行: 第1行:
 
==摘要==
 
==摘要==
       这个工具是用户根据需要提取百度贴吧的话题的工具,主要提取标题,作者,内容,最后回复时间和回复数目的,用于数据分析。
+
       这个工具是用户根据需要提取百度贴吧的帖子内容。
 
+
==使用==
+
    [[image:BaiDuTieBaCaiJi_Use.gif]]
+
  
 
==背景==
 
==背景==
第11行: 第8行:
 
     通过百度搜索找到自己要找的话题进行采集,
 
     通过百度搜索找到自己要找的话题进行采集,
 
     然后对于这些话题进行数据分析。
 
     然后对于这些话题进行数据分析。
 
==需求==
 
      应用者根据自己需要找到需要分析的热点话题进行采集,
 
      对收集到的数据进行数据分析。
 
  
 
==功能==
 
==功能==
===输入===
+
      功能一. 采集指定贴吧的所有发帖内容
===输出===
+
      [[image:BaiDuTieBa_TieBaTieZi.png]]
[[image:201603163.png]]<br>
+
  
===处理===
+
       功能二.采集指定帖子的内容和回复内容
      模拟人工查询的方法输入关键词
+
       [[image:BaiDuTieBa_TieZiHeHuiFu.png]]
       获取查询结果
+
       数据保存为下面几种格式
       解析返回结果中的标题 作者 内容 最后回复时间 回复数目 话题编号
+
       CSV格式,方便EXCEL打开,方便后续的数据处理
       根据网址的域名进行网址过滤
+
       HTM格式,方便WORD打开,方便后去的文档处理。
       根据网址的域名进行网址去重
+
       TXT格式,方便直接查看。
       保存新发现的结果
+
       解析结果内容
+
  
==使用==
+
      功能三.采集指定人的所有发帖及回复
 +
    [[image:BaiDuTieBa_MouRenTieZiHeHuiFu.png]]
 +
 
 +
==演示==
 +
    [[image:BaiDuTieBaCaiJi_Use.gif]]
 +
 
 +
==输出==
 +
      数据样例[[media:BaiDuTieBaCaiJi_Dat.rar]]
 +
 
 +
      [[image:BaiDuTieBaCaiJi_TieZi.png]]
 +
 
 +
      [[image:BaiDuTieBaCaiJi_HuiFu.png]]
 +
 
 +
      [[image:BaiDuTieBaCaiJi_Word.png]]
  
 
==备注==
 
==备注==
 +
      应用者根据自己需要找到需要分析的热点话题进行采集,
 +
      对收集到的数据进行数据分析。

2016年10月13日 (四) 17:15的最新版本

摘要

     这个工具是用户根据需要提取百度贴吧的帖子内容。

背景

    百度搜索还是很多人用的最多的网站之一,
    需要在网站上面分析一些热点话题,
    采集这些话题用于数据分析或者毕业论文的依据。
    通过百度搜索找到自己要找的话题进行采集,
    然后对于这些话题进行数据分析。

功能

     功能一. 采集指定贴吧的所有发帖内容
     BaiDuTieBa TieBaTieZi.png
     功能二.采集指定帖子的内容和回复内容
     BaiDuTieBa TieZiHeHuiFu.png
     数据保存为下面几种格式
     CSV格式,方便EXCEL打开,方便后续的数据处理
     HTM格式,方便WORD打开,方便后去的文档处理。
     TXT格式,方便直接查看。
     功能三.采集指定人的所有发帖及回复
    BaiDuTieBa MouRenTieZiHeHuiFu.png

演示

   BaiDuTieBaCaiJi Use.gif

输出

     数据样例media:BaiDuTieBaCaiJi_Dat.rar
     BaiDuTieBaCaiJi TieZi.png
     BaiDuTieBaCaiJi HuiFu.png
     BaiDuTieBaCaiJi Word.png

备注

     应用者根据自己需要找到需要分析的热点话题进行采集,
     对收集到的数据进行数据分析。