“百度贴吧采集工具”的版本间的差异

来自JsRobot
跳转至: 导航搜索
输出
 
(未显示同一用户的2个中间版本)
第10行: 第10行:
  
 
==功能==
 
==功能==
       主要提取发帖内容和回复内容
+
       功能一. 采集指定贴吧的所有发帖内容
       发帖内存保存:帖子ID,作者,内容,发帖时间
+
       [[image:BaiDuTieBa_TieBaTieZi.png]]
       回复你让保存:帖子ID,回复人,内容,回复时间
+
 
 +
      功能二.采集指定帖子的内容和回复内容
 +
       [[image:BaiDuTieBa_TieZiHeHuiFu.png]]
 
       数据保存为下面几种格式
 
       数据保存为下面几种格式
 
       CSV格式,方便EXCEL打开,方便后续的数据处理
 
       CSV格式,方便EXCEL打开,方便后续的数据处理
第18行: 第20行:
 
       TXT格式,方便直接查看。
 
       TXT格式,方便直接查看。
  
==使用==
+
      功能三.采集指定人的所有发帖及回复
 +
    [[image:BaiDuTieBa_MouRenTieZiHeHuiFu.png]]
 +
 
 +
==演示==
 
     [[image:BaiDuTieBaCaiJi_Use.gif]]
 
     [[image:BaiDuTieBaCaiJi_Use.gif]]
  

2016年10月13日 (四) 17:15的最新版本

摘要

     这个工具是用户根据需要提取百度贴吧的帖子内容。

背景

    百度搜索还是很多人用的最多的网站之一,
    需要在网站上面分析一些热点话题,
    采集这些话题用于数据分析或者毕业论文的依据。
    通过百度搜索找到自己要找的话题进行采集,
    然后对于这些话题进行数据分析。

功能

     功能一. 采集指定贴吧的所有发帖内容
     BaiDuTieBa TieBaTieZi.png
     功能二.采集指定帖子的内容和回复内容
     BaiDuTieBa TieZiHeHuiFu.png
     数据保存为下面几种格式
     CSV格式,方便EXCEL打开,方便后续的数据处理
     HTM格式,方便WORD打开,方便后去的文档处理。
     TXT格式,方便直接查看。
     功能三.采集指定人的所有发帖及回复
    BaiDuTieBa MouRenTieZiHeHuiFu.png

演示

   BaiDuTieBaCaiJi Use.gif

输出

     数据样例media:BaiDuTieBaCaiJi_Dat.rar
     BaiDuTieBaCaiJi TieZi.png
     BaiDuTieBaCaiJi HuiFu.png
     BaiDuTieBaCaiJi Word.png

备注

     应用者根据自己需要找到需要分析的热点话题进行采集,
     对收集到的数据进行数据分析。