摘要
这个工具根据EBAY的分类网址采集了EBAY的商品信息。
演示
功能
输入:
包含/m.html的网址
包含/i.html的网址
输出:
数据文件字段如下:
[ListedInCategory]:Computers/Tablets & Networking>Home Networking & Connectivity>Boosters, Extenders & Antennas
[Picture]:img\291594849837.jpg
[Title]:3 12dBi RP-SMA Antenna + 3 8in U.FL Cable Mod Kit for Buffalo WZR-1750DHP
[ItemCondition]:New
[QTY]:More than 10 available
[QtySold]:1
[SellerID]:superpowersupplycom
[Price]:US $26.69
[ItemLocation]:Greenwood, Indiana, United States
[Shipping]:US $10.99
[EachAdditionalItem]:US $4.99
[Service]:USPS First Class Mail International / First Class Package International Service
[UPC]:Does not apply
[Brand]:Super Power Supply
[MPN]:Does not apply
[ItemListingLink]:http://www.ebay.com/itm/291594849837
设置
任务列表中的网址,要求必须包含/i.html或者/m.html
结束页数指定为0的时候,从指定的开始也没采集到最后一页。
说明
EBAY的商品列表中的商品有重复的问题。
我们在采集过程中只采集前两页,采集出100个商品,去重后只有97个。
实际采集的商品是比商品列表页上看到的数量少的。