Como obter um bom resultado com o Tesseract-ocr + OpenCV?

1. Como obter um bom resultado com o Tesseract-ocr + OpenCV?

Bigshow2015
(usa Ubuntu)

Enviado em 07/06/2020 - 03:39h

Galera, estou tentando extrair textos (em sua grande maioria, números) de imagens utilizando o Tesseract em conjunto do OpenCV. Tenho tentado a um tempo criar um programa que faça isso, mas tenho falhado... O problema é que, por mais que eu procure tutoriais e códigos em livros para testar, nunca obtenho o resultado esperado. Eu sempre sigo tudo como deve ser, utilizando os filtros e contornos com o auxílio das funções do OpenCV, mas quando chega na hora do reconhecimento, o resultado sempre são letras sem sentido, símbolos que não existem ma imagem e um monte de espaçamento sem motivo aparente.

Alguém poderia me ajudar nesse problema?

Basicamente o que eu preciso é entender como obter os textos esperados lendo uma simples imagem. Se alguém souber como usar as funcionalidades do tesseract com precisão e puder me ajudar, ficaria muito grado.

Lembrando que eu programo em C++, utilizo o Ubuntu e já fiz inúmeros testes diferentes e nenhum deles com um resultado decente.

1 0

Quote

2. Re: Como obter um bom resultado com o Tesseract-ocr + OpenCV?

Nick-us
(usa Slackware)

Enviado em 09/06/2020 - 01:00h

Bigshow2015 escreveu:

Galera, estou tentando extrair textos (em sua grande maioria, números) de imagens utilizando o Tesseract em conjunto do OpenCV. Tenho tentado a um tempo criar um programa que faça isso, mas tenho falhado... O problema é que, por mais que eu procure tutoriais e códigos em livros para testar, nunca obtenho o resultado esperado. Eu sempre sigo tudo como deve ser, utilizando os filtros e contornos com o auxílio das funções do OpenCV, mas quando chega na hora do reconhecimento, o resultado sempre são letras sem sentido, símbolos que não existem ma imagem e um monte de espaçamento sem motivo aparente.

Alguém poderia me ajudar nesse problema?

Basicamente o que eu preciso é entender como obter os textos esperados lendo uma simples imagem. Se alguém souber como usar as funcionalidades do tesseract com precisão e puder me ajudar, ficaria muito grado.

Lembrando que eu programo em C++, utilizo o Ubuntu e já fiz inúmeros testes diferentes e nenhum deles com um resultado decente.

Eu nunca usei nenhuma das 2 ferramentas, mas me pareceu interessante e útil!
Acho que o que ajudaria se você postar o código que vc criou em C++ que faça essa extração, mesmo que falhando, pq é mais fácil ter algo para testar do que criar do zero para tentar responder sua pergunta!

Até mesmo para entender o que vc está exatamente extraindo da imagem! Seja para comparar, para reconhecer, ou mesmo para arquivar!

A pouco tempo eu vi em FLTK links que falavam sobre software livre de reconhecimento facial, reconhecimento de placas de carro, reconhecimento de pessoas e objetos... Não anotei naquele momento, mas o Link, mostrava inclusive Screenshots dos programas.

1 0

Quote

3. Re: Como obter um bom resultado com o Tesseract-ocr + OpenCV?

Bigshow2015
(usa Ubuntu)

Enviado em 10/06/2020 - 04:13h

Nick-us escreveu:

Então amigo, eu conseguir extrair excelentes resultados com os meus testes!

Eu já fiz alguns projetos sobre reconhecimento facial, reconhecimento de pessoas e objetos... Mas quando se trata de extração de textos de uma imagem, eu ainda sou um pouco "novato"... Eu não posso passar o meu código completo, porque é um projeto particular e importante, mas se você precisar de ajuda, posso contribuir com o pouco que eu sei. Eu pretendo aprimorar ainda mais meu conhecimento na área de visão computacional, então é sempre bom aprender e compartilhar.

Ah, e se quiser que eu te mostre um exemplo de código para extrair textos de imagens utilizando o OpenCV + Tesseract-OCR, é só falar. Como eu já disse, consegui resultados excelentes, mas acredito que ainda possa melhorar bastante e estou lutando para tal.

Desde já agradeço pela preocupação, abraços!

1 0

Quote