Como extrair texto de qualquer image usando Deep Learning
Ainda neste artigo
- Resultado final
- Repositório
- O que é OCR?
- Etapas e Ferramentas
Resultado final
No final do código, podemos visualizar o texto acompanhado da imagem correspondente. Optei por utilizar uma imagem mais limpa, mas é possível usar outras (inclusive fiz isso). O desafio está na formatação do texto na saída.
Repositório
O repositório pode ser acessado e forkado (conforme o interesse) neste link.
O que é OCR?
OCR é a abreviação para Reconhecimento Óptico de Caracteres, sendo um método de Deep Learning que permite a conversão de texto de uma imagem para um formato legível por máquinas.
O EasyOCR é uma das ferramentas que facilitam esse processo, e o mecanismo utilizado para criação do código.
- Repositório do EasyOCR - https://github.com/JaidedAI/EasyOCR
Etapas e Ferramentas
- Python
- OpenCV (biblioteca poderosa e popular para visão computacional)
- EasyOCR (documentação mencionada neste artigo)
O processo de utilização da biblioteca é simples e consiste em quatro etapas:
- Definir o idioma.
- Carregar a imagem.
- Formatar a saída do texto.
- Solicitar a 'leitura'.