Eu já falei um pouco sobre reconhecimento ótico de caracteres quando comentei sobre o PhotoTranslator.
Um usuário do N900 resolveu brincar com isso também, inspirado pelo PhotoTranslator. Como ele não é muito paciente (afinal, tem que esperar os desenvolvedores do programa o disponibilizarem), resolveu por sua conta brincar com o assunto.
O que o rapaz (que também é o autor do Witter, o único cliente para o twitter disponível atualmente para o N900) fez foi bem simples: ele baixou o Tesseract, que é o pacote de reconhecimento utilizado pelo pessoal do PhotoTranslator e o compilou, sem problema nenhum.
Aí ele precisou de algo para converter as fotos tiradas pelo N900, que são gravadas em JPEG, para TIFF, que é o formato utilizado pelo Tesseract. Ele usou o ImageMagick. Novamente, apenas o downlaod e a compilação.
E fez alguns testes de reconhecimento….na minha concepção, a coisa até que foi bem! As imagens que ele reconheceu e o resultado podem ser vistos no site dele.
Não há nenhum programa, nem compilação de nada, pois a intenção é apenas mostrar que é possível. Isso pode abrir algumas possibilidades, como aquele programa para Symbian que digitaliza cartões de visita, e insere os dados na agenda do aparelho.
fonte: Daniel Would’s Weblog