Gesiel Rios Lopes
Tutorial: Introdução à análise exploratória de dados com Python – Parte 1
O avanço da tecnologia, observados nos últimos anos, aliado com a popularização da Internet e com o aumento na quantidade e complexidade dos serviços oferecidos na Web contribuíram de forma significativa à geração massiva de dados. A manipulação e análise de forma inteligente desse volume de dados produzidos, têm se tornado um dos grandes desafios computacionais da atualidade.
Para este fim, a análise exploratória de dados (AED) é bem adequada, uma vez que é bem conhecida em estatística e ciências. A abordagem operacional da análise de dados visava melhorar a compreensão e a acessibilidade dos resultados. Sem esquecer a solidez dos modelos estatísticos e a formulação de hipóteses, que está intrinsecamente ligada ao conceito de “análise” em seu significado científico, o foco é transferido para a “exploração”. A AED se relaciona com o processo de revelar informações ocultas e desconhecidas dos dados de tal forma que o analista obtém uma representação imediata, direta e fácil de entender. Gráficos visuais são um elemento obrigatório desta abordagem, devido à capacidade intrínseca do cérebro humano de obter uma interpretação mais direta e confiável de similaridades, diferenças, tendências, clusters e correlações através de uma imagem, ao invés de uma série de números.
Neste tutorial, será apresentado conceitos sobre como utilizar a linguagem de programação python para explorar um conjunto de dados, o que é essencial para obter uma boa compreensão e possíveis problemas de um conjunto de dados, além de auxiliar na geração de hipóteses que podem ser extraídas a partir da análise de um conjunto de dados.
Tópicos abordados:
-
- Introdução à análise exploratória de dados;
- Por que usar python para análise exploratória de dados;
- Fundamentos de python para análise exploratória de dados;
- Medidas de tendência central
- Medidas de dispersão ou variabilidade
- Visualização gráfica de dados
- Correlação e diagrama de dispersão
- Considerações finais
21 de agosto – 11h30 às 12h30 – Sala 4