Article image
Carlos Lima
Carlos Lima09/05/2024 17:11
Compartilhe

Como extrair texto de qualquer image usando Deep Learning

    Ainda neste artigo

    • Resultado final
    • Repositório
    • O que é OCR?
    • Etapas e Ferramentas

    Resultado final

    image

    No final do código, podemos visualizar o texto acompanhado da imagem correspondente. Optei por utilizar uma imagem mais limpa, mas é possível usar outras (inclusive fiz isso). O desafio está na formatação do texto na saída.

    Repositório

    image

    O repositório pode ser acessado e forkado (conforme o interesse) neste link.

    O que é OCR?

    OCR é a abreviação para Reconhecimento Óptico de Caracteres, sendo um método de Deep Learning que permite a conversão de texto de uma imagem para um formato legível por máquinas.

    O EasyOCR é uma das ferramentas que facilitam esse processo, e o mecanismo utilizado para criação do código.

    Etapas e Ferramentas

    • Python
    • OpenCV (biblioteca poderosa e popular para visão computacional)
    • EasyOCR (documentação mencionada neste artigo)

    O processo de utilização da biblioteca é simples e consiste em quatro etapas:

    1. Definir o idioma.
    2. Carregar a imagem.
    3. Formatar a saída do texto.
    4. Solicitar a 'leitura'.
    Compartilhe
    Comentários (0)