17 de maio de 2011

Google Docs com OCR (Reconhecimento Óptico de Caracteres)


Mais uma solução na minha busca de um software para converter arquivos PDF em DOC, li este post no blog googlediscovery.

O Google está testando uma nova API para o Google Docs que irá adicionar uma funcionalidade de reconhecimento óptico de caracteres [OCR] na plataforma online de edição de textos e planilhas.
De acordo com a firma de Mountain View, os usuários poderão enviar uma imagem em alta resolução (JPG, GIF ou PNG – menos de 10MB) e o Google Docs será capaz de extrair o texto e converter em um novo documento. No entanto, o Google alerta que a versão para demonstração do recurso leva até 40 segundos para realizar o processo, e em alguns momentos, retorna com muitos erros.
O Google tradicionalmente utiliza um software open-source da OCRopus, mas não está claro até o momento se a função futura do Google Docs irá utilizar a mesma tecnologia.


Claro que tudo isso acontece dentro da api do google docs, mas dai para trazer para o word fica bem mais fácil.

Nenhum comentário: