Sistema que baixa os pdfs do site www.coronavirus.sc.gov.br, e le os dados para extrair informações. Gera o dados-consolidados.csv
Usando o pipenv
$ pipenv install
instalará as dependências necessárias contidas noPipfile
Usando o pip
$ pip install -r requirements.txt
Obs: É necessário ter o pdftotext
no sistema
A maneira mais fácil é invocar o $ pipenv shell
e após isso executar o arquivo run.sh
- Incorporar as informações das imagens e usar
tesseract
para OCR.