GitHub

输入一个网址，异步爬取网站。
all_web_crawler 是支持mongodb 和内存去重
all_web_es 是支持elasticsearch

对于小网站来说，不用在乎抓取逻辑，速度也是很快，加大开发效率

对于网站数量很多的，这个约到后期越慢

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.idea		.idea
base_curl		base_curl
example		example
util		util
.gitignore		.gitignore
__init__.py		__init__.py
readme.md		readme.md

Provide feedback