scrapy_get_cosmetics/README.md at master · liwg1995/scrapy_get_cosmetics · GitHub

爬取http://hzp.onlylady.com/brand.html上的各个品牌的商品

使用python3.6
需要安装pip install scrapy
图片我爬取下来总共25535张
写入txt文件的信息有：
- 商品名
- 商品类型
- 商品所属的品牌
- 商品价格
- 商品图片对应的图片名

各个参数直接用@分割开，每个商品之间用####分隔开，便于对文件的处理

爬取http://cosmetic.lady.163.com/search/product/上的各个品牌的商品

同上，只是图片有所减少，因为排除了一些默认图片的商品

中间件`middlewares`有代理ip、有随机useragent