Boas-vindas a mais um curso de visualização de dados da Alura!
Esse Github foi produzido com muito carinho para você montar o seu portfólio com as atividades do curso e elaborar suas próprias hipóteses, testar as técnicas exploradas dentro do curso e também adicionar outras durante a leitura das documentações de bibliotecas de visualização de dados com a linguagem Python: Matplotlib, Seaborn e Plotly.
O objetivo deste curso é auxiliar você a utilizar a linguagem Python na análise de dados por meio da agregação de recursos visuais, recorrendo a gráficos como ferramentas de exploração e apresentação dos dados ao seu público. É importante que você tenha um conhecimento básico das bibliotecas de visualização de Python, bem como das bibliotecas de manipulação de dados como Pandas e Numpy.
Neste curso, vamos construir um portfólio com as análises de duas bases de dados diferentes, explorando cada uma e respondendo aos questionamentos levantados em torno de seus dados. Todas as bases estão no formato CSV e podem ser acessadas por meio do Github.
Bases de dados:
- Tabela com os PIBs (Produto Interno Bruto) dos estados brasileiros no período de 2002 - 2020
- Tabela com a pontuação do IDEB (Índice de Desenvolvimento da Educação Básica) das escolas à nivel nacional
Como sugestão para escolha da paleta de cores para o seu projeto existem sites como o Coolor ou imagecolorpicker. As cores utilizadas nesse projeto são:
Azul | |||||
---|---|---|---|---|---|
AZUL1 | AZUL2 | AZUL3 | AZUL4 | AZUL5 | AZUL6 |
#174A7E | #4A81BF | #6495ED | #2596be | #94AFC5 | #CDDBF3 |
Cinza | |||||
---|---|---|---|---|---|
CINZA1 | CINZA2 | CINZA3 | CINZA4 | CINZA5 | BRANCO |
#231F20 | #414040 | #555655 | #A6A6A5 | #BFBEBE | #FFFFFF |
Vermelho | Verde | ||||
---|---|---|---|---|---|
VERMELHO1 | VERMELHO2 | LARANJA1 | VERDE1 | VERDE2 | VERDE3 |
#C3514E | #E6BAB7 | #F79747 | #0C8040 | #9ABB59 | #9ECCB3 |
Na imagem abaixo, apresentamos um diagrama com diversos tipos de visualização de dados (criado por Andrew Abela) em que é possível perceber 4 subgrupos, dentre eles:
- Comparação
- Distribuição
- Relacionamento
- Composição
Para este curso focamos nos subgrupos da Composição e Relacionamento, levando em conta as observações que gostaríamos de apresentar em nosso portfólio.
Neste projeto, vamos explorar diversos gráficos de composição dentre eles:
- Gráficos de Setores (Pizza e Rosca)
- Gráficos de Cascata
- Gráficos de Colunas Agrupadas
- Gráficos de Barras e Colunas Empilhadas
- Gráficos de Áreas
- Gráficos de Inclinação
- Treemap (Gráfico de Árvore)
Neste projeto, vamos explorar diversos gráficos de relacionamento dentre eles:
- Gráficos de Dispersão com linha de tendência
- Gráficos de Dispersão com cores
- Gráficos de Bolhas
Para verificar um resumo com os principais gráficos gerados ao longo curso clique nesse link
Esse curso teve como objetivo apresentar os diferentes tipos de visualização de dados e como escolher qual é o mais adequado para representar as análises de acordo com as perguntas e demandas requisitadas para o problema. Durante o curso, você aprendeu a criar gráficos de composição e relacionamento dos dados partindo do uso das bibliotecas mais utilizadas em Python, personalizar os gráficos e adicionar outros recursos visuais como anotações, destaques, legenda de dados e outras técnicas de visualização.
Ao final do curso, você será capaz de gerar visualizações personalizadas e voltadas ao tipo de público que você deseja.
Sinta-se à vontade para fazer o fork desse projeto e construir o seu portfólio 😊