亚马逊优秀评论者信息采集

来自JsRobot
Storm讨论 | 贡献2016年1月12日 (二) 05:26的版本

跳转至: 导航搜索

摘要

     这个工具解决亚马逊的优秀评论者的联系方式的采集问题。

背景

     在微博上的大V是大家比较熟悉的。亚马逊上也有一批大V。这些就是优秀评论人员。
     这些评论人员的评论的权重都是比较高的,一个好的评论可以给亚马逊商家带来很高的流量,反之,要是成立的。
     就像是饭店需要美食家一样。一个好的店铺也需要好的评论人员。
     为了收集这些“电商美食家”的信息,我们特别编写了这个工具。

需求

     1.要求下列国家的的亚马逊优秀评论者信息采集
     美国    https://www.amazon.com/review/top-reviewers
     英国    http://www.amazon.co.uk/reviews/top-reviewers
     加拿大  http://www.amazon.ca/review/top-reviewers
     巴西    http://www.amazon.com.br/review/top-reviewers
     墨西哥  http://www.amazon.com.mx/review/top-reviewers
     德国    http://www.amazon.de/review/top-reviewers
     法国    http://www.amazon.fr/review/top-reviewers
     西班牙  http://www.amazon.es/review/top-reviewers
     意大利  http://www.amazon.it/review/top-reviewers
     荷兰    http://www.amazon.nl/review/top-reviewers
     日本    https://www.amazon.co.jp/review/top-reviewers
     印度    https://www.amazon.in/review/top-reviewers
     澳洲    https://www.amazon.com.au/review/top-reviewers
     中国    https://www.amazon.cn/review/top-reviewers
     2.输出的数据的字段为
     网址 等级 名字 邮箱 关于 兴趣
     3.输出的内容需要翻译为中文。

功能

输入

     输入是一个网址清单,可以放入一个或者多个评论者列表的网址。

输出

     一个CSV的数据表格,字段如下
     网址,等级,名字,邮箱,关于,兴趣

处理

     软件内部打开一个优秀评论人员列表的网页(比如,https://www.amazon.com/review/top-reviewers)
     枚举各个翻页
     枚举每个翻页中评论人员网址
     依次处理评论人员的网址
     解析数据保存到CSV文件

展示

其他