Skip to content

scrapy获取一个百度权重为7的化妆品站点,下载站点商品图片,一些信息写入文件

Notifications You must be signed in to change notification settings

liwg1995/scrapy_get_cosmetics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

爬取http://hzp.onlylady.com/brand.html上的各个品牌的商品

  • 使用python3.6
  • 需要安装pip install scrapy
  • 图片我爬取下来总共25535
  • 写入txt文件的信息有:
    • 商品名
    • 商品类型
    • 商品所属的品牌
    • 商品价格
    • 商品图片对应的图片名

各个参数直接用@分割开,每个商品之间用####分隔开,便于对文件的处理

爬取http://cosmetic.lady.163.com/search/product/上的各个品牌的商品

  • 同上,只是图片有所减少,因为排除了一些默认图片的商品

中间件middlewares有代理ip、有随机useragent

About

scrapy获取一个百度权重为7的化妆品站点,下载站点商品图片,一些信息写入文件

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages