Como extrair texto de qualquer image usando Deep Learning

Ainda neste artigo

Resultado final
Repositório
O que é OCR?
Etapas e Ferramentas

Resultado final

No final do código, podemos visualizar o texto acompanhado da imagem correspondente. Optei por utilizar uma imagem mais limpa, mas é possível usar outras (inclusive fiz isso). O desafio está na formatação do texto na saída.

Repositório

O repositório pode ser acessado e forkado (conforme o interesse) neste link.

O que é OCR?

OCR é a abreviação para Reconhecimento Óptico de Caracteres, sendo um método de Deep Learning que permite a conversão de texto de uma imagem para um formato legível por máquinas.

O EasyOCR é uma das ferramentas que facilitam esse processo, e o mecanismo utilizado para criação do código.

Repositório do EasyOCR - https://github.com/JaidedAI/EasyOCR

Etapas e Ferramentas

Python
OpenCV (biblioteca poderosa e popular para visão computacional)
EasyOCR (documentação mencionada neste artigo)

O processo de utilização da biblioteca é simples e consiste em quatro etapas:

Definir o idioma.
Carregar a imagem.
Formatar a saída do texto.
Solicitar a 'leitura'.