Análise exploratória de dados em uma linha de código
- #Python
A análise exploratória é um passo fundamental e certamente um dos primeiros em termos de analisar os dados, outra coisa que se sabe muito bem e que é um mantra da programação é "don't repeat yourself", de modo que performar as mesmas etapas em diferentes conjuntos de dados pode ser cansativo, e existe uma forma de realizar mais rapidamente, com o fasteda!
Fasteda
Como sugere o autor no repositório do fasteda, o módulo capaz de fornecer as primeiras impressões sobre o seu conjunto de dados.
Em sua estrutura ele é composto por numpy, pandas, matplotlib, seaborn, missingno, colorama e scipy.stats, sendo capaz de performar as seguintes tarefas:
- Head of dataframe (first 3 rows)
- Tail of dataframe (last 3 rows)
- Missing values count
- MSNO Matrix
- Shape
- Info()
- Describe()
- Correlation
- Pairplot
- Histplot(s) & Boxplot(s) subplot
- Countplot(s)
Fiz uma demostração de como instalar e usar o fasteda no Deepnote, vou compartilhar o link a quem tiver interesse:





Ainda não dá pra mim não, mas daqui há alguns meses já vou conseguir.
O Kaagle eu conheço tem um tempo, mas esse Driven Data não conhecia. Obrigado pelas dicas.
Sim, no Kaggle principalmente, as vezes no Driven Data :)
Você participa de competições? Pow, maneiro de demai, de qual você participar? Kaagle?
Estou querendo participar também só consigo aprender assim com esses hackathons... kk
Mas primeiro estou fortalecendo a minha base Python primeiro senão derrapo na primeira curva e saio da prova.
Transferência de pensamento... kkkk
Opa Luís, eu costumo ter que repetir muitas fazes quando participo de competições, por isso é útil, grato o feedback:
ps: Eu estava com outra aba aberta lendo o seu artigo (HAHAHA), até espantei quando vi o comentário.
Muito legal esse artigo, Carlos.
Você fez parecer simples a parada. :)