Onlineocr – Para obter texto a partir de PDFs e imagens

Postado em

ocr

Ao receber um arquivo PDF ou uma imagem na qual o texto não pode ser editado ou copiado (para editá-lo em outro programa) certamente, precisará de um sistema que seja capaz de reconhecer o que está escrito no documento e gerar um texto plano para que se possa usá-lo livremente.

É aí que aparecem os famosos OCR, sistemas de reconhecimento de texto em imagens, que alguns serviços de armazenamento de arquivos já incluem como uma funcionalidade adicional (como Google Drive, por exemplo). Isso permite que ao guardar um documento nesses serviços, possamos obter seu conteúdo e inclusive buscar caracteres dentro deles, o que é necessário para quem guarda recibos escaneados, por exemplo, ou faturas de todo tipo em gif ou jpg.

Porém, se o que quer é um site que, sem precisar de registro, identifique e ofereça o texto que há dentro, então, precisa dar uma olhada em onlineocr.net.

Os limites das opções gratuitas deste tipo de software podem ser “só reconhecer a primeira página de um pdf” ou “reconhecer 13 páginas de forma gratuita, logo precisa pagar por cada uma delas“. Neste caso se trata de um limite de “número de páginas por hora“, o que transforma a onlineocr em uma excelente solução para quem tem muito o que reconhecer e não tem pressa para executar o trabalho sem necessidade de pagar nada.

Embora não conte com um design muito atraente nem funcionalidades surpreendentes, funciona perfeitamente em vários idiomas diferentes.

Imagem de texto em shutterstock.com