Etapas da Mineração de Dados
- #Power BI
- #Python
- #Machine Learning
Estabelecendo objetivos da mineração de dados
Essa etapa inclui identificar as principais questões que precisam ser respondidas, considerar os custos, benefício e determinar o nível esperado de precisão e utilidade dos resultados.
Selecionando Dados
Essa etapa tem como intuito selecionar os dados corretos para análise, que podem estar prontamente disponíveis ou exigir a coleta de novos dados. Essa etapa também depende, em grande parte, da qualidade dos dados que estão sendo utilizados. O tipo de dado, seu tamanho e a frequência da coleta possuem influência direta no resultado da mineração de dados.
Dados de pré-processamento
Essa etapa envolve a limpeza e formatação dos dados para torná-los adequados para análise. Os dados brutos, muitas vezes, podem ser confusos, podendo estarem incorretos ou possuírem informações irrelevantes, portanto o objetivo principal dessa etapa deve ser identificar os atributos irrelevantes dos dados e elimina-los, além disso deve-se determinar o impacto dos dados que faltam no resultado final da mineração.
Transformando Dados
Essa etapa inclui a redução do número de atributos e a transformação de variáveis em diferentes tipos. As variáveis podem precisar serem transformadas para ajudar a explicar o fenômeno e para capturar as suas não linearidades nos comportamentos subjacentes.
Armazenamento de Dados
Essa etapa armazena os dados em um formato que facilite a análise. Os dados devem ser armazenados em um formato que dê privilégios irrestritos e imediatos de leitura e gravação ao cientista de dados. A segurança e a privacidade dos dados devem ser uma preocupação primordial para o armazenamento de dados.
Dados de Mineração
Essa etapa envolve a análise de dados por meio de métodos estatísticos, aprendizado de máquina e algoritmos de mineração de dados. Nesta etapa também ocorre o processo de visualização de dados utilizando recursos gráficos avançados do software para mineração dos dados.
Avaliação dos resultados da mineração
Por fim, é necessário avaliar os resultados da mineração de dados e incorporar feedback para melhorar os resultados em iterações futuras. A avaliação formal pode incluir o teste das capacidades preditivas dos modelos em dados observados para ver a eficácia dos algoritmos.
Esse é um resumo que eu fiz desse artigo, espero que essas informações possam ser úteis :)