Visão Computacional com PyTorch: Reconhecimento de Dígitos Manuscritos
Visão Computacional:
Visão computacional, de forma simples e objetiva, é um campo da inteligência artificial no qual as máquinas são capazes de extrair informações relevantes de imagens.
PyTorch:
PyTorch é um framework baseado em Python e Torch que permite a construção ágil e prática de redes neurais.
MNIST:
MNIST é o dataset utilizado neste contexto. Consiste em um conjunto de imagens de dígitos escritos à mão, cada uma com um rótulo correspondente. O dataset contém 70.000 imagens, das quais 10.000 são dedicadas ao conjunto de teste.
Objetivo do artigo:
O objetivo deste artigo é fornecer um código produzido por mim que serve como uma introdução à visão computacional usando o PyTorch. O código está bem comentado e divide claramente as etapas necessárias para obter os dados, que incluem:
- Importar bibliotecas necessárias.
- Baixar dados de treino e teste usando PyTorch.
- Carregar dados de treino e teste.
- Visualizar um exemplo do conjunto de treinamento.
- Definir dispositivo e criar rede neural.
- Definir modelo e função de perda.
- Treinar os dados.
- Salvar o modelo.
- Carregar o modelo.
- Fazer previsões.
Para aqueles interessados, o código está disponível no Kaggle e será posteriormente enviado ao meu repositório pessoal no GitHub. Espero que seja útil para vocês.