Un ejemplo de como usar el Django para guardar datos obtenidos mediante un Spider de Scrapy en una base de datos y exponerlos via REST
- Python 2.7
- pip
- virtualenv
- Un broker compatible con celery, este proyecto asume redis
- Una motor de base de datos compatible con django
# instalar fabric en ambiente global
pip install fabric
# clonar repositorio
git clone git://github.com/gcba/Scrapy-Django.git
cd rScrapy-Django
# correr setup
fab DEV setup
Reemplazar el último comando por la siguiente secuencia
fab DEV setup_virtualenv
# activar virtualenv
source bin/activate
# instalar lxml con dependencias estáticas
STATIC_DEPS=true pip install lxml
# continuar instalación
fab DEV update
Cualquier customización de settings necesaria hacerla sobre settings_local.py. Copiar archivo demo:
cp settings_local_demo.py settings_local.py
y modificarlo a gusto
redis-server
python manage.py celeryd
scrapy runspider scrap.py
python manage.py runserver