Article image
Carlos Lima
Carlos Lima25/04/2024 10:46
Compartilhe

Análise exploratória de dados em uma linha de código

  • #Python

A análise exploratória é um passo fundamental e certamente um dos primeiros em termos de analisar os dados, outra coisa que se sabe muito bem e que é um mantra da programação é "don't repeat yourself", de modo que performar as mesmas etapas em diferentes conjuntos de dados pode ser cansativo, e existe uma forma de realizar mais rapidamente, com o fasteda!

Fasteda

Como sugere o autor no repositório do fasteda, o módulo capaz de fornecer as primeiras impressões sobre o seu conjunto de dados.

Em sua estrutura ele é composto por numpy, pandas, matplotlib, seaborn, missingno, colorama e scipy.stats, sendo capaz de performar as seguintes tarefas:

  • Head of dataframe (first 3 rows)
  • Tail of dataframe (last 3 rows)
  • Missing values count
  • MSNO Matrix
  • Shape
  • Info()
  • Describe()
  • Correlation
  • Pairplot
  • Histplot(s) & Boxplot(s) subplot
  • Countplot(s)

Fiz uma demostração de como instalar e usar o fasteda no Deepnote, vou compartilhar o link a quem tiver interesse:

image

Referências

Deepnote

fasteda doc.

Compartilhe
Comentários (2)
Carlos Lima
Carlos Lima - 25/04/2024 10:55

Opa Luís, eu costumo ter que repetir muitas fazes quando participo de competições, por isso é útil, grato o feedback:



ps: Eu estava com outra aba aberta lendo o seu artigo (HAHAHA), até espantei quando vi o comentário.

Luís Simas
Luís Simas - 25/04/2024 10:51

Muito legal esse artigo, Carlos.

Você fez parecer simples a parada. :)