Skip to content

Latest commit

 

History

History
47 lines (31 loc) · 2.06 KB

README.md

File metadata and controls

47 lines (31 loc) · 2.06 KB

N|Solid

Scrapy + Power BI = Magic: The Gathering!

Foi realizado a scraping da página de venda de cartas MTG Gold Fish com intuito de testar algumas técnicas de coleta, limpeza e apresentação de dados.

  • Link para o Dashboard: Microsoft Power BI.

  • Link para o LinkedIn: seu like pode me ajudar! :)

  • Para tal projetos, foram utilizadas as seguintes ferramentas:

  • Python

    • Scrapy
    • Pandas
  • Microsoft Power BI

  • random.randint(0, 99) copos de café

Dentro deste Dashboard interativo a imaginação é o limite, podemos avaliar cartas tanto em características monetárias quanto em características de poder, dentro de cada arranjo temos diversos filtros, divirta-se!

Você pode utilizar esse código como base e automatizar tal coleta e conecta-la a um banco de dados, o qual pode alimentar o Dashboard em tempo real! Criando inúmeras novas possibilidades de análise de dados.

Utilizando!

  • Utilize o comando abaixo para coletar os links:
scrapy runspider links_NomeDoModulo.py -O links_NomeDoModulo.csv
  • Utilize o comando abaixo para coletar as cards :
scrapy runspider cards_NomeDoModulo.py -O cards_NomeDoModulo.csv
  • Caso esteja com problema com perca de dados durante a coleta (dados : None), entre no modulo default_settings.py, que está na pasta settings do Scrapy, e modifique a velocidade entre as coletas.
DOWNLOAD_DELAY = 0.90 # tente usar entre 0.25 a 1
  • Unindo os dados coletados e removendo as linhas brancas, em uma única tabela:
python join_cards.py

*Não esqueça que os arquivos .csv devem estar na mesma pasta que os módulos, caso contrario mude o caminho do arquivo dentro do modulo.