-
爬虫不用登陆,不用各种防封,所以还是比较简单的。
-
难点在于获取商品信息时,是利用ajax加载的。
-
这里我用到了phantomjs
-
商品信息我放在了***j:\淘宝\***下,这个需要你自己建
-
启动爬虫后输入店铺的url就可以了,例如:
- https://****.1688.com
-
启动之后就可以完美运行了,速度较慢。相对于人工来说还是很快的
liuxinxx / alibaba Goto Github PK
View Code? Open in Web Editor NEW阿里巴巴店铺商品爬虫