Tem como editar documento escaneado? [RESOLVIDO]

37. Re: Tem como editar documento escaneado? [RESOLVIDO]

Jeferson
Deis

(usa Ubuntu)

Enviado em 28/10/2012 - 20:00h

rei_astro escreveu:

Que programa você usa para utilizar o scanner?


Digitalizador Simples; o que vem instalado com o ubuntu.


  


38. Re: Tem como editar documento escaneado? [RESOLVIDO]

Luis R. C. Silva
luisrcs

(usa Linux Mint)

Enviado em 28/10/2012 - 20:25h

Ótimo, então escanei as imagens e siga o poste #26.


39. Re: Tem como editar documento escaneado? [RESOLVIDO]

Jeferson
Deis

(usa Ubuntu)

Enviado em 28/10/2012 - 20:32h

rei_astro escreveu:

Instale o Gimp, o tesseract e o tesseract-ocr-por.

1 - escanei a imagem em 600dpi em modo cores;
2 - abra a imagem no Gimp;
3 - vá no menu imagem -> modo, selecione Tons de cinza;
4 - vá no menu cores -> Brilho e Contraste, em brilho coloque -60 e em contrate, coloque 127;
5 - vá no menu filtros -> Desfocar -> Desfocagem gaussiana, e clique em ok;
6 - vá no menu filtros -> Realçar -> Aguçar, em Acuidade coloque no máximo e clique em ok;
7 - exporte a imagem com as modificações para um arquivo com extensão .jpg;
8 - abra um terminal e digite
$ tesseract imagem.jpg texto -l por 
onde imagem.jpg é o nome da imagem escaneada e texto é a saída, que terá extensão .txt.

Sou professor e esses são os passos base para uma boa conversão de imagem para texto.


No Gimp, se não tiver nada aberto as opções para fazer mudanças ficam inativas.

Ex: Menu Imagem, o ton de cinza esta transparente e não é possivel seleciona-lo.

Não tem que primeiro importar o scaneado para habilitar essas mudanças de imagem, cores e filtros?


40. Re: Tem como editar documento escaneado? [RESOLVIDO]

Luis R. C. Silva
luisrcs

(usa Linux Mint)

Enviado em 28/10/2012 - 20:36h

Deis escreveu:

rei_astro escreveu:

Instale o Gimp, o tesseract e o tesseract-ocr-por.

1 - escanei a imagem em 600dpi em modo cores;
2 - abra a imagem no Gimp;
3 - vá no menu imagem -> modo, selecione Tons de cinza;
4 - vá no menu cores -> Brilho e Contraste, em brilho coloque -60 e em contrate, coloque 127;
5 - vá no menu filtros -> Desfocar -> Desfocagem gaussiana, e clique em ok;
6 - vá no menu filtros -> Realçar -> Aguçar, em Acuidade coloque no máximo e clique em ok;
7 - exporte a imagem com as modificações para um arquivo com extensão .jpg;
8 - abra um terminal e digite
$ tesseract imagem.jpg texto -l por 
onde imagem.jpg é o nome da imagem escaneada e texto é a saída, que terá extensão .txt.

Sou professor e esses são os passos base para uma boa conversão de imagem para texto.


No Gimp, se não tiver nada aberto as opções para fazer mudanças ficam inativas.

Ex: Menu Imagem, o ton de cinza esta transparente e não é possivel seleciona-lo.

Não tem que primeiro importar o scaneado para habilitar essas mudanças de imagem, cores e filtros?


É por isso que no #2 pede para abrir a imagem escaneada no Gimp.



41. Re: Tem como editar documento escaneado? [RESOLVIDO]

Jeferson
Deis

(usa Ubuntu)

Enviado em 28/10/2012 - 20:48h

rei_astro, muito obrigado por sua pasciência.

Deu certo: Case closed.


42. Re: Tem como editar documento escaneado? [RESOLVIDO]

Luis R. C. Silva
luisrcs

(usa Linux Mint)

Enviado em 28/10/2012 - 20:52h

Beleza, precisando...



43. Re: Tem como editar documento escaneado? [RESOLVIDO]

Jeferson
Deis

(usa Ubuntu)

Enviado em 28/10/2012 - 21:06h

rei_astro escreveu:

Beleza, precisando...


Com arquivo que não foi scaneado mas esta em pdf, é a mesma coisa né?


44. Re: Tem como editar documento escaneado? [RESOLVIDO]

Luis R. C. Silva
luisrcs

(usa Linux Mint)

Enviado em 28/10/2012 - 21:14h

Se o .pdf só tiver texto pode usar o pdf2doc, que também é uma ferramenta usada em terminal.


45. Re: Tem como editar documento escaneado? [RESOLVIDO]

Jeferson
Deis

(usa Ubuntu)

Enviado em 28/10/2012 - 21:19h

rei_astro escreveu:

Se o .pdf só tiver texto pode usar o pdf2doc, que também é uma ferramenta usada em terminal.


Vamos dizer que seja só texto.

De um exemplo de como faz.

E porque sendo .pdf não pode usar o tesseract? Tem que ser o pdf2doc.

E também; caso não seja só texto,como que seria o processo para tornar editável?


46. Re: Tem como editar documento escaneado? [RESOLVIDO]

Jeferson
Deis

(usa Ubuntu)

Enviado em 28/10/2012 - 21:24h

Não achei esse pdf2doc no Gerenciador de Pacotes Synaptic.

Ele não é em modo gráfico?


47. Re: Tem como editar documento escaneado? [RESOLVIDO]

Jeferson
Deis

(usa Ubuntu)

Enviado em 28/10/2012 - 21:30h

sudo apt-get install pdf2doc
Lendo listas de pacotes... Pronto
Construindo árvore de dependências
Lendo informação de estado... Pronto
E: Impossível encontrar o pacote pdf2doc



48. Re: Tem como editar documento escaneado? [RESOLVIDO]

Luis R. C. Silva
luisrcs

(usa Linux Mint)

Enviado em 28/10/2012 - 21:30h

Deis escreveu:

rei_astro escreveu:

Se o .pdf só tiver texto pode usar o pdf2doc, que também é uma ferramenta usada em terminal.


Vamos dizer que seja só texto.

De um exemplo de como faz.

E porque sendo .pdf não pode usar o tesseract? Tem que ser o pdf2doc.

E também; caso não seja só texto,como que seria o processo para tornar editável?


Acho que me enganei. No Linux tem que ser o pdf2html, depois copia e cola como texto.

http://www.vivaolinux.com.br/dica/Convertendo-arquivo-PDF-em-HTML-e-DOC-ODT






Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts