Article image
Cinthia Barreto
Cinthia Barreto22/02/2023 00:16
Compartilhe

Etapas da Mineração de Dados

  • #Power BI
  • #Python
  • #Machine Learning

Estabelecendo objetivos da mineração de dados

Essa etapa inclui identificar as principais questões que precisam ser respondidas, considerar os custos, benefício e determinar o nível esperado de precisão e utilidade dos resultados.



Selecionando Dados

Essa etapa tem como intuito selecionar os dados corretos para análise, que podem estar prontamente disponíveis ou exigir a coleta de novos dados. Essa etapa também depende, em grande parte, da qualidade dos dados que estão sendo utilizados. O tipo de dado, seu tamanho e a frequência da coleta possuem influência direta no resultado da mineração de dados.

Dados de pré-processamento

Essa etapa envolve a limpeza e formatação dos dados para torná-los adequados para análise. Os dados brutos, muitas vezes, podem ser confusos, podendo estarem incorretos ou possuírem informações irrelevantes, portanto o objetivo principal dessa etapa deve ser identificar os atributos irrelevantes dos dados e elimina-los, além disso deve-se determinar o impacto dos dados que faltam no resultado final da mineração.

Transformando Dados

Essa etapa inclui a redução do número de atributos e a transformação de variáveis em diferentes tipos. As variáveis podem precisar serem transformadas para ajudar a explicar o fenômeno e para capturar as suas não linearidades nos comportamentos subjacentes.



Armazenamento de Dados

Essa etapa armazena os dados em um formato que facilite a análise. Os dados devem ser armazenados em um formato que dê privilégios irrestritos e imediatos de leitura e gravação ao cientista de dados. A segurança e a privacidade dos dados devem ser uma preocupação primordial para o armazenamento de dados.



Dados de Mineração

Essa etapa envolve a análise de dados por meio de métodos estatísticos, aprendizado de máquina e algoritmos de mineração de dados. Nesta etapa também ocorre o processo de visualização de dados utilizando recursos gráficos avançados do software para mineração dos dados.



Avaliação dos resultados da mineração

Por fim, é necessário avaliar os resultados da mineração de dados e incorporar feedback para melhorar os resultados em iterações futuras. A avaliação formal pode incluir o teste das capacidades preditivas dos modelos em dados observados para ver a eficácia dos algoritmos.

Esse é um resumo que eu fiz desse artigo, espero que essas informações possam ser úteis :)

Compartilhe
Comentários (0)