image

Bootcamps ilimitados + curso de inglés para sempre

80
%OFF
Article image
Carlos Lima
Carlos Lima09/05/2024 17:11
Compartir
CI&T - Do Prompt ao AgenteRecomendado para tiCI&T - Do Prompt ao Agente

Como extrair texto de qualquer image usando Deep Learning

    Ainda neste artigo

    • Resultado final
    • Repositório
    • O que é OCR?
    • Etapas e Ferramentas

    Resultado final

    image

    No final do código, podemos visualizar o texto acompanhado da imagem correspondente. Optei por utilizar uma imagem mais limpa, mas é possível usar outras (inclusive fiz isso). O desafio está na formatação do texto na saída.

    Repositório

    image

    O repositório pode ser acessado e forkado (conforme o interesse) neste link.

    O que é OCR?

    OCR é a abreviação para Reconhecimento Óptico de Caracteres, sendo um método de Deep Learning que permite a conversão de texto de uma imagem para um formato legível por máquinas.

    O EasyOCR é uma das ferramentas que facilitam esse processo, e o mecanismo utilizado para criação do código.

    Etapas e Ferramentas

    • Python
    • OpenCV (biblioteca poderosa e popular para visão computacional)
    • EasyOCR (documentação mencionada neste artigo)

    O processo de utilização da biblioteca é simples e consiste em quatro etapas:

    1. Definir o idioma.
    2. Carregar a imagem.
    3. Formatar a saída do texto.
    4. Solicitar a 'leitura'.
    Compartir
    Recomendado para ti
    Globant  - Java & Spring Boot AI Developer
    Accenture - Python para Análise e Automação de Dados
    Lupo - Primeiros Passos com Inteligência Artificial
    Comentarios (0)
    Recomendado para tiCI&T - Do Prompt ao Agente