今日头条作者信息采集工具
来自JsRobot
简介
这个项目采集了今日头条中的作者信息。
功能
1.支持按栏目采集栏目的文章和作者 2.支持按作者采集发布的文章的信息 3.支持对每个作者做数据统计
演示
安装
请参考软件安装指南 请阅读软件使用指南
使用
软件有三种工作模式, 一种是按频道采集文章信息的方式, 一种是按作者采集文章信息的模式, 一种是数据统计的模式。
大致的使用流程是这样: 先用频道的网址作为输入,使用“按频道采集文章信息”的模式,采集出该频道的作者信息, 然后把作者的网址作为输入,使用“按作者采集文章信息”的模式,采集出作者的文章信息和作者自身的信息。 然后作者的文章信息和作者自身的信息作为输入,使用“据统计”的模式,计算出每个作者的阅读数评论数之类的信息。
按频道采集文章信息输入是频道的网址 输出是作者列表,字段如下 [编号]:63708610683 [作者]:提莫莫大魔王 [网址]:https://www.toutiao.com/c/user/63708610683/
按作者采集文章信息输入是作者的网址 输出是作者信息表和文章信息表 作者信息表的字段如下 [作者编号]:52269429967 [作者]:搞笑小短剧 [关注]:1 [粉丝]:1941 [网址]:https://www.toutiao.com/c/user/52269429967/ 文章信息表的字段如下: [作者]:搞笑小短剧 [作者编号]:52269429967 [编号]:6430314335817695490 [标题]:最近很火的情侣聊天套路,可以说非常虐狗了! [时间]:2017-06-14 16:21:05 [栏目]:搞笑 [阅读]:58502 [评论]:9 [网址]:https://www.toutiao.com/item/6431406286650212865/
数据统计输入是作者信息表和文章信息表所在的目录 输出是统计信息表 统计信息表的字段如下 [作者]:关爱电竞技八卦协会 [关注]:5 [粉丝]:1669 [阅读]:3624582 [评论]:10072
注意
任务列表支持多行 每行可以放一个网址
“数据统计”的输入目录是“按作者采集文章信息”的输出数据的目录 在“按作者采集文章信息”执行完后,点击“查看数据”按钮,就可以看到这个目录。