Neste repositório se encontram as atividades desenvolvidas durante o Master do Insper. O objetivo é concentrar em um só lugar os exercícios, tutoriais e estudos ao longo do curso.
Durante o curso, serão estudadas as competências em análises estatísticas, programação, uso ético de dados, processos de automação e narrativas digitais. Para saber mais, acesse o site do Insper.
O repositório está organizado por disciplina e cada aula ou projeto têm uma pasta especícifica onde podem ser encontrados os códigos e os dados.
Em andamento
- Introdução à lógica de programação;
- Leitura e escrita de arquivos em formatos distintos;
- Organização e qualidade do código;
- Aplicações em Python.
Em breve
- Conhecer os fundamentos teóricos do processo analítico de conjuntos de dados;
- Compreender os fundamentos da análise exploratória de conjuntos de dados;
- Desenvolver transformações e análises em conjuntos de dados reais;
- Utilizar ferramentas analíticas interativas para exploração de consjuntos de dados.
Em andamento
- Extrair automaticamente textos de websites e mídias sociais;
- Efetuar análise e classificação automática de textos;
- Interpretar as redes e identificar: clusters informacionais, comunidades de usuários e influenciadores;
- Explorar corpus de imagens, efetuar o tratamento de imagens digitais e capturar padrões e informações relevantes.
Em andamento
- Entender o que é um modelo e o framework de modelagem;
- Identificar oportunidades dentro do jornalismo para resolução de problemas a partir de técnicas de machine learning;
- Avaliar resultado de modelos;
- Aplicar técnicas de modelagem para objetivos específicos dentro do jornalismo;
- Comunicar incertezas inerentes ao resultado de modelos.
Em andamento
- Formular boas perguntas de pesquisa empírica;
- Identificar diferentes métodos empíricos, suas hipóteses e pontos fracos;
- Analisar criticamente hipóteses, suposições e resultados de pesquisa;
- Manusear dados para corroborar hipóteses;
- Estruturar um desenho de pesquisa que leva em conta pergunta, variáveis independentes, variáveis dependentes, método empírico e análises de robustez;
- Coletar dados e aplicar métodos causair usando pacotes estatísticos;
- Elaborar produto jornalístico que inclua conceitos estatísticos avançados.
Em breve
- Construção em módulos do pensamento analítico para elaboração de um modelo computacional de busca e ranqueamento de dados;
- Para os algoritmos e estrutura de dados (árvore binária e grafos), ter explícito a noção da diferença de custo entre diferentes algoritmos que resolvem o mesmo problema aplicando-os em testes de performance;
- Estudo de sumarização textual e engenharia de conhecimento para determinar palavras-chave em contexto textual;
- Desenvolvimento do pipeline para busca de dados estruturados e não estruturados;
- Dsenvolvimento do ranqueamento dos dados, com organização de temas.