GitHub - thejacket/RESTDockerized: Dockerized REST API

4 endpointy API: żądanie tekstu z zadanego URL, żądanie zdjęć, pobranie zasobów i sprawdzenie statusu zadania
Zarządzanie workerami przez Celery - dowolna skalowalność
Broker redis
Scraping stron z wykorzystaniem Selenium + headless Chrome-Webdriver oraz requests

Instalacja krok po kroku

W terminalu powinny wyświetlić się komunikaty brokera, Celery, monitora Celery-flower i flaskowej aplikacji.

curl -X 'POST' <docker-machine ip>:5000/textFromWebsite/<websiteUrl>

curl -X 'POST' <docker-machine ip>:5000/imagesFromWebsite/<websiteUrl>

curl -J -L <docker-machine ip>:5000/downloadResources/<websiteURL> -o <websiteURL>.zip

curl <docker-machine ip>:5000/status/<taskId>

Dwa pierwsze endpointy służą do scrapowania tekstu i obrazów z zadanego URL do lokalnego katalogu w którym uruchomiona jest aplikacja Oba zwracają przy przyjęciu żądania id zadania, co pozwala na śledzenie jego statusu
/downloadResources/ spakuje i wyśle zasoby w ZIP, jeśli są one na serwerze
/status/ pozwala śledzić status wykonywanego zadania

!! Nie działa pobieranie zasobów !!
Dodać testy
Wyabstrahować metodę pobierania zasobów z URL, by można było zmienić sposób scrapowania i rozszerzyć jego funkcjonalność (np. zmienić silnik na inny niż Selenium czy dodać rotujące proxy/user-Agenta)
Dodać możliwość konfiguracji limitera

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
flask-app		flask-app
flask-celery		flask-celery
.gitignore		.gitignore
1.jpg		1.jpg
README.md		README.md
diagram1.jpg		diagram1.jpg
docker-compose.yml		docker-compose.yml