Linux slogan
Visite também: BR-Linux.org · Dicas-L · NoticiasLinux · SoftwareLivre.org · UnderLinux · BestLinux
» Screenshot
Linux: black gnome
Por goajunior



» Login
Login:
Senha:

Se você ainda não possui uma conta, clique aqui.

Esqueci minha senha

» Wallpaper
Linux: Linux abstrato
Por zendrael

Dica

Convertendo arquivos .doc para .txt via linha de comando
Linux user
Publicado por Fábio Berbert de Paula em 07/05/2004

Login: fabio, 4937681 pontos Homepage: https://twitter.com/fabiodovol
[ Hits: 7591 ]

Convertendo arquivos .doc para .txt via linha de comando

Essa semana pintou uma dúvida na sessão de Perguntas & Respostas do site sobre como converter um .doc para .html através de linha de comando. Bom, a solução é simples, para isso precisaremos de dois pacotes instalados em sua distribuição:
  • catdoc: converte .doc para texto;
  • txt2html: converte texto para HTML.

No Debian você os instala a partir do comando:

# apt-get install catdoc txt2html

Ou se preferir:
http://www.gnu.org/directory/All_Packages_in_Directory/catdoc.html
http://distro.ibiblio.org/.../sources/txt2html/2.21/

Agora basta digitar o seguinte comando:

$ catdoc arquivo.doc | txt2html

Legal né? Se quiser salvar a saída:

$ catdoc arquivo.doc | txt2html > arquivo.txt

[]'s


Outras dicas deste autor

Leitura recomendada
   Dica Linux recomendada Visualizando tempo de conexão com o ac
   Dica Linux recomendada LSOF: Quem está ouvindo aí no seu Linux?
   Dica Linux recomendada Comandos de rede Linux (básico)
   Dica Linux recomendada Utilizando alias para agilizar comandos no Linux
   Dica Linux recomendada Permissão para desligar o sistema

Comentários
[1] Comentário enviado por fernandus em 07/05/2004 - 09:57h:

eu não posso simplesmente fazer :
#mv texto.doc texto.txt ?

a dúvida que eu tenho é como mudar a extensão de centenas de arquivos como eu faria em MS-DOS... rename ou ren...

[2] Comentário enviado por fabio em 07/05/2004 - 10:11h:

Não, renomear é uma coisa, converter formatos é outra. Pra renomear seus .doc pra .txt você pode digitar esse simples comando:

for X in *.doc; do TMP=`echo $X | sed 's/doc$/txt/'`; mv $X $TMP; done

[]'s

[3] Comentário enviado por ctrlc em 09/05/2004 - 13:15h:

nem tao simples assim (:

boa dica!

[4] Comentário enviado por thudojorge em 07/03/2008 - 13:58h:

e para ler ficheiros pdf na linha de comandos? qual e a aplicacao?


Contribuir com comentário
  
Para executar esta ação você precisa estar logado no site, caso contrário, tudo o que for digitado será perdido.
Responsável pelo site: Fábio Berbert de Paula - Copyleft 2002-2009 Viva o Linux.com.br

Viva o Linux

A maior comunidade Linux da América Latina! Artigos, dicas, tutoriais, fórum, scripts e muito mais. Ideal para quem busca auto-ajuda em Linux.