Skip to content

Latest commit

 

History

History
16 lines (14 loc) · 725 Bytes

README.md

File metadata and controls

16 lines (14 loc) · 725 Bytes

爬取http://hzp.onlylady.com/brand.html上的各个品牌的商品

  • 使用python3.6
  • 需要安装pip install scrapy
  • 图片我爬取下来总共25535
  • 写入txt文件的信息有:
    • 商品名
    • 商品类型
    • 商品所属的品牌
    • 商品价格
    • 商品图片对应的图片名

各个参数直接用@分割开,每个商品之间用####分隔开,便于对文件的处理

爬取http://cosmetic.lady.163.com/search/product/上的各个品牌的商品

  • 同上,只是图片有所减少,因为排除了一些默认图片的商品

中间件middlewares有代理ip、有随机useragent