亚马逊美国站BestSellers100珠宝信息采集工具

来自JsRobot
跳转至: 导航搜索

价值

   亚马逊公司(Amazon,简称亚马逊;NASDAQ:AMZN),是美国最大的一家网络电子商务公司,位于华盛顿州的西雅图。是网络上最早开始经营电子商务的公司之一,亚马逊成立于1995年,一开始只经营网络的书籍销售业务,现在则扩及了范围相当广的其他产品,已成为全球商品品种最多的网上零售商和全球第二大互联网企业,在公司名下,也包括了AlexaInternet、a9、lab126、和互联网电影数据库(Internet Movie Database,IMDB)等子公司。
   亚马逊及其它销售商为客户提供数百万种独特的全新、翻新及二手商品,如图书、影视、音乐和游戏、数码下载、电子和电脑、家居园艺用品、玩具、婴幼儿用品、食品、服饰、鞋类和珠宝、健康和个人护理用品、体育及户外用品、玩具、汽车及工业产品等。
   2004年8月亚马逊全资收购卓越网,使亚马逊全球领先的网上零售专长与卓越网深厚的中国市场经验相结合,进一步提升客户体验,并促进中国电子商务的成长。2016年10月,亚马逊排2016年全球100大最有价值品牌第8名。2017年2月,Brand Finance发布2017年度全球500强品牌榜单,亚马逊排名第三。
   在2000年后中国很多企业相继入驻Amazon,做起了国际生意,近几年生意越来越难做,仅仅靠等待能够做好生意的时代已经离我们很遥远了,大多数商家都选择了主动出击的方式,下面这个软件就是采集了买家的信息,方便商家主动邮件推广自己产品。
   1.软件采集字段有:
   产品信息:类别信息,店铺名称,品牌分类,产品编号,产品标题,五星等级,产品简介,产品详细,产品描述,产品价格,畅销榜,用户评论,产品图片,产品网址,Five,Four,Three,Twe,One
   评论信息:Asin,评分,评论标题,评论人,日期,标记,评论内容
   2.快速高效获取销售榜前前100个产品信息和评论:对应商家来说可以找到精准客户无疑是最大的帮助了,这个软件不但帮助我们找到热销产品,而且还有客户评论,让我们可以了解客户需求,节省商家时间和精力,是精准营销的好助手。
   3.销售榜高销售率商品获取:这个软件可以采集哪些评分较高的商品信息,按好评率高的商品的设计,也会增加我们的商品好评几率。这个就是直接获取销售好评和商品之间的关系。
   4.获取高质量评论:我们的顶级评论者已经帮助数百万同行的客户在亚马逊网站上做出有意义的购买决定,并提供持续有用的高质量评论。顶尖的评选者排名现在展示了我们最好的贡献者,而名人堂则荣获前几年排名最高的人物。花点时间探索这些客户撰写的评论。他们会激励你

背景

   在各行各业都有热销商品,亚马逊网站上也有销售排名前100的商品。

获取这些亚马逊销售排名前100的商品信息,有助于了解哪些产品是热销的,可以制定产品发展的方向。

   获取这些评论人员的评论的权重都是比较高的,一个好的评论可以给亚马逊商家带来很高的流量,反之,要是成立的。
   为了收集这些评论员的信息,我们特别编写了这个工具。

需求

   1.要求下列国家的的亚马逊销售榜前100商品信息采集
   美国    
   https://www.amazon.com/Best-Sellers-Mens-Jewelry/zgbs/fashion/3887881/
   https://www.amazon.com/Best-Sellers-Girls-Jewelry/zgbs/fashion/3880961/
   https://www.amazon.com/Best-Sellers-Novelty-Jewelry/zgbs/fashion/2516784011/
   https://www.amazon.com/Best-Sellers-Womens-Jewelry/zgbs/fashion/7192394011/
   https://www.amazon.com/Best-Sellers-Boys-Jewelry/zgbs/fashion/3880611/
   https://www.amazon.com/Best-Sellers-Girls-Earrings/zgbs/fashion/3881621/
   https://www.amazon.com/Best-Sellers-Mens-Bracelets/zgbs/fashion/3888081/
   2.输出的数据的字段为
   产品信息:类别信息,首图链接,产品网址,店铺名称,品牌分类,产品价格,ASIN,产品标题,分类1,值1,分类2,值2,分类3,值3,分类4,值4,Package Dimensions,Shipping Weight,上架日期,Metal stamp,Metal,Material,Gem Type,Stone shape,Minimum color,Stone Creation Method,Cut,产品简介,产品详细,产品描述,畅销榜,五星等级,用户评论,Five,Four,Three,Twe,One
   评论信息:Asin,评分,评论标题,评论人,日期,标记,评论内容

功能

输入

   输入是一个网址清单,可以放入一个或者多个销售榜前100列表的网址。

输出

   一个CSV的数据表格,字段如下
   产品信息:类别信息,店铺名称,品牌分类,产品编号,产品标题,五星等级,产品简介,产品详细,产品描述,产品价格,畅销榜,用户评论,产品图片,产品网址,Five,Four,Three,Twe,One

评论信息:Asin,评分,评论标题,评论人,日期,标记,评论内容

处理

   软件内部打开一个热销商品榜的列表(比如,https://www.amazon.com/Best-Sellers-Girls-Jewelry/zgbs/fashion/3880961/)
   枚举各个翻页
   枚举每个翻页中评论人员网址
   依次处理评论人员的网址
   解析数据保存到CSV文件

展示

  Amazon-US bestsellers100.png

安装

  请参考软件安装指南

使用

  请先阅读软件使用指南,
  然后
  #运行JsRobot
  #点击JsRobot的设置按钮,弹出设置对话框
  #点击JsRobot的设置对话框的恢复默认按钮
  #修改网址列表中的网址为你要抓取的国家的那个网址。
  #点击JsRobot的开始按钮
  #采集所有分类商品排名  采集所有畅销榜珠宝的前100个产品信息
  #采集指定分类商品排名  点击修改设置,把分类网址复制到输入网址中,点击OK,就可以采集了。
  #采集分类信息          采集所有的珠宝相关的分类网址,一共121个,生成一个CSV文件,一个文本文件,方便复制粘贴。
  #采集评论问答          点击修改设置,参数列表里,提取评论=1  提取问答=1,1表示提取评论,0表示不提取评论。复制产品网址到输入网址,然后采集。
  #批量提取商品评论问答  点击修改设置,输入网址里有一个文本文件路径,C:\output\商品网址.txt,没有就新建一个文本文件,重命名为 : 商品网址.txt,把要采集的产品网址复制到txt文件中,就可以采集了。
  #点击JsRobot的开始按钮
  #然后就可以自动运行了

备注

  #亚马逊修改了安全规则,采集过快会锁定IP段,锁定后就无法采集了。要重新拨号再采集。
  #采集的过程是是先遍历列表页面,然后采集具体的信息页面,100个商品,每个商品评论要翻几百页还是比较耗费时间的,所以你要等待一段时间才会看到数据。
  #如果你是测试想很快的看到数据,验证软件是否正常工作,可以只采集少量页数。