Visão Computacional com PyTorch: Reconhecimento de Dígitos Manuscritos

Visão Computacional:

Visão computacional, de forma simples e objetiva, é um campo da inteligência artificial no qual as máquinas são capazes de extrair informações relevantes de imagens.

PyTorch:

PyTorch é um framework baseado em Python e Torch que permite a construção ágil e prática de redes neurais.

MNIST:

MNIST é o dataset utilizado neste contexto. Consiste em um conjunto de imagens de dígitos escritos à mão, cada uma com um rótulo correspondente. O dataset contém 70.000 imagens, das quais 10.000 são dedicadas ao conjunto de teste.

Objetivo do artigo:

O objetivo deste artigo é fornecer um código produzido por mim que serve como uma introdução à visão computacional usando o PyTorch. O código está bem comentado e divide claramente as etapas necessárias para obter os dados, que incluem:

Importar bibliotecas necessárias.
Baixar dados de treino e teste usando PyTorch.
Carregar dados de treino e teste.
Visualizar um exemplo do conjunto de treinamento.
Definir dispositivo e criar rede neural.
Definir modelo e função de perda.
Treinar os dados.
Salvar o modelo.
Carregar o modelo.
Fazer previsões.

Para aqueles interessados, o código está disponível no Kaggle e será posteriormente enviado ao meu repositório pessoal no GitHub. Espero que seja útil para vocês.