Como obter um bom resultado com o Tesseract-ocr + OpenCV?

1. Como obter um bom resultado com o Tesseract-ocr + OpenCV?

Vitor
Bigshow2015

(usa Ubuntu)

Enviado em 07/06/2020 - 03:39h

Galera, estou tentando extrair textos (em sua grande maioria, números) de imagens utilizando o Tesseract em conjunto do OpenCV. Tenho tentado a um tempo criar um programa que faça isso, mas tenho falhado... O problema é que, por mais que eu procure tutoriais e códigos em livros para testar, nunca obtenho o resultado esperado. Eu sempre sigo tudo como deve ser, utilizando os filtros e contornos com o auxílio das funções do OpenCV, mas quando chega na hora do reconhecimento, o resultado sempre são letras sem sentido, símbolos que não existem ma imagem e um monte de espaçamento sem motivo aparente.

Alguém poderia me ajudar nesse problema?

Basicamente o que eu preciso é entender como obter os textos esperados lendo uma simples imagem. Se alguém souber como usar as funcionalidades do tesseract com precisão e puder me ajudar, ficaria muito grado.

Lembrando que eu programo em C++, utilizo o Ubuntu e já fiz inúmeros testes diferentes e nenhum deles com um resultado decente.


  


2. Re: Como obter um bom resultado com o Tesseract-ocr + OpenCV?

Nick Us
Nick-us

(usa Slackware)

Enviado em 09/06/2020 - 01:00h

Bigshow2015 escreveu:

Galera, estou tentando extrair textos (em sua grande maioria, números) de imagens utilizando o Tesseract em conjunto do OpenCV. Tenho tentado a um tempo criar um programa que faça isso, mas tenho falhado... O problema é que, por mais que eu procure tutoriais e códigos em livros para testar, nunca obtenho o resultado esperado. Eu sempre sigo tudo como deve ser, utilizando os filtros e contornos com o auxílio das funções do OpenCV, mas quando chega na hora do reconhecimento, o resultado sempre são letras sem sentido, símbolos que não existem ma imagem e um monte de espaçamento sem motivo aparente.

Alguém poderia me ajudar nesse problema?

Basicamente o que eu preciso é entender como obter os textos esperados lendo uma simples imagem. Se alguém souber como usar as funcionalidades do tesseract com precisão e puder me ajudar, ficaria muito grado.

Lembrando que eu programo em C++, utilizo o Ubuntu e já fiz inúmeros testes diferentes e nenhum deles com um resultado decente.

Eu nunca usei nenhuma das 2 ferramentas, mas me pareceu interessante e útil!
Acho que o que ajudaria se você postar o código que vc criou em C++ que faça essa extração, mesmo que falhando, pq é mais fácil ter algo para testar do que criar do zero para tentar responder sua pergunta!

Até mesmo para entender o que vc está exatamente extraindo da imagem! Seja para comparar, para reconhecer, ou mesmo para arquivar!

A pouco tempo eu vi em FLTK links que falavam sobre software livre de reconhecimento facial, reconhecimento de placas de carro, reconhecimento de pessoas e objetos... Não anotei naquele momento, mas o Link, mostrava inclusive Screenshots dos programas.



3. Re: Como obter um bom resultado com o Tesseract-ocr + OpenCV?

Vitor
Bigshow2015

(usa Ubuntu)

Enviado em 10/06/2020 - 04:13h

Nick-us escreveu:

Bigshow2015 escreveu:

Galera, estou tentando extrair textos (em sua grande maioria, números) de imagens utilizando o Tesseract em conjunto do OpenCV. Tenho tentado a um tempo criar um programa que faça isso, mas tenho falhado... O problema é que, por mais que eu procure tutoriais e códigos em livros para testar, nunca obtenho o resultado esperado. Eu sempre sigo tudo como deve ser, utilizando os filtros e contornos com o auxílio das funções do OpenCV, mas quando chega na hora do reconhecimento, o resultado sempre são letras sem sentido, símbolos que não existem ma imagem e um monte de espaçamento sem motivo aparente.

Alguém poderia me ajudar nesse problema?

Basicamente o que eu preciso é entender como obter os textos esperados lendo uma simples imagem. Se alguém souber como usar as funcionalidades do tesseract com precisão e puder me ajudar, ficaria muito grado.

Lembrando que eu programo em C++, utilizo o Ubuntu e já fiz inúmeros testes diferentes e nenhum deles com um resultado decente.

Eu nunca usei nenhuma das 2 ferramentas, mas me pareceu interessante e útil!
Acho que o que ajudaria se você postar o código que vc criou em C++ que faça essa extração, mesmo que falhando, pq é mais fácil ter algo para testar do que criar do zero para tentar responder sua pergunta!

Até mesmo para entender o que vc está exatamente extraindo da imagem! Seja para comparar, para reconhecer, ou mesmo para arquivar!

A pouco tempo eu vi em FLTK links que falavam sobre software livre de reconhecimento facial, reconhecimento de placas de carro, reconhecimento de pessoas e objetos... Não anotei naquele momento, mas o Link, mostrava inclusive Screenshots dos programas.


Então amigo, eu conseguir extrair excelentes resultados com os meus testes!

Eu já fiz alguns projetos sobre reconhecimento facial, reconhecimento de pessoas e objetos... Mas quando se trata de extração de textos de uma imagem, eu ainda sou um pouco "novato"... Eu não posso passar o meu código completo, porque é um projeto particular e importante, mas se você precisar de ajuda, posso contribuir com o pouco que eu sei. Eu pretendo aprimorar ainda mais meu conhecimento na área de visão computacional, então é sempre bom aprender e compartilhar.

Ah, e se quiser que eu te mostre um exemplo de código para extrair textos de imagens utilizando o OpenCV + Tesseract-OCR, é só falar. Como eu já disse, consegui resultados excelentes, mas acredito que ainda possa melhorar bastante e estou lutando para tal.

Desde já agradeço pela preocupação, abraços!






Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner
Linux banner
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts