Convertendo uma webpage para PDF pelo terminal

Publicado por edps em 15/11/2011

[ Hits: 8.613 ]

Blog: https://edpsblog.wordpress.com/

 


Convertendo uma webpage para PDF pelo terminal



Salvar os artigos que gosto no formato PDF é uma mania que eu tenho, e felizmente no VOL isso é muito fácil.

Em outros sites, utilizo às vezes a impressora virtual do 'CUPS-PDF' ou a extensão 'Web2PDF' que tenho instalada no meu navegador Opera.

Como dito, aqui no VivaoLinux isso é muito fácil pois o próprio site nos disponibiliza o link 'Versão para impressora', através do qual o conteúdo dos artigos e dicas é reproduzido livre de propagandas e de conteúdo de terceiros. Após isso basta imprimir normalmente ou salvar em PDF ou PS.

Vejam um exemplo de uma dica minha sobre a instalação do kernel 3.4 no Debian, pronto para ser salvo como PDF ou para ser impresso:
Linux: Convertendo uma webpage para PDF pelo terminal

Noutro exemplo, vejamos uma dica do meu amigo André L (pinduvoz) da forma como é exibida no site e já convertida através da extensão 'Web2PDF':
Linux: Convertendo uma webpage para PDF pelo terminal

Linux: Convertendo uma webpage para PDF pelo terminal

Obs.: Vejam que no caso acima, toda a página é impressa no PDF, propagandas, links externos e etc.

E com isso, chegamos à conclusão que no caso do VOL, o melhor a fazer é utilizar o link disponibilizado pelo site e imprimir diretamente ou exportar para PDF ou PS, visto que, como na primeira imagem, o conteúdo nos é disponibilizado livre de qualquer propaganda ou link externo.

E na Web?

Agora vem a parte que me levou a confecção desta dica, ou seja, converter uma página web diretamente para PDF pelo terminal!

Para tal, utilizaremos o pacote 'wkhtmltopdf' disponível em muitas distribuições.

Em Debian|Ubuntu e derivados:

sudo apt-get install wkhtmltopdf
Linux: Convertendo uma webpage para PDF pelo terminal

Arch Linux:

sudo pacman -S wkhtmltopdf

Gentoo:

sudo emerge -av wkhtmltopdf

Slackware:
Através do GIT:
Outros:
Como exemplo, usarei para a conversão a 1ª parte do artigo sobre kernel atualizado no Debian:

wkhtmltopdf -s A4 http://gnu2all.blogspot.com/2011/11/kernel-atualizado-no-debian-squeeze-1.html kernel-atualizado-no-debian-squeeze-1.pdf
Linux: Convertendo uma webpage para PDF pelo terminal

Eis a página já convertida:
Linux: Convertendo uma webpage para PDF pelo terminal

Enquanto testava as funcionalidades do programa resolvi, para fins de comparação, efetuar a conversão de uma página pelo 'wkhtmltopdf' e também pelo 'CUPS- PDF'. O resultado foi assombroso!

As páginas escolhidas foram as 'complicadas' USES do Gentoo:

wkhtmltopdf -s A4 http://http://gentoo-portage.com/USE Gentoo-USES.pdf

O documento salvo pelo 'CUPS-PDF' (Gentoo-Portage_-_USE_Flags_-_Opera.pdf) ocupa 2MB de espaço em disco, enquanto que o 'Gentoo-USES.pdf' criado pelo 'wkhtmltopdf', ocupa apenas 209KB.
Linux: Convertendo uma webpage para PDF pelo terminal

Descobri também um novo endereço mais simplificado, porém muito útil e em nossa língua nativa.

Para maiores informações sobre o uso e opções do programa:

man wkhtmltopdf

Referências

How to convert any internet Webpage to PDF from command line on GNU/Linux: Converter páginas HTML para PDF no Linux com wkhtmltopdf:

Dica previamente publicada em meu blog: gnu2all.blogspot.com - Convertendo uma webpage para PDF pelo terminal

Outras dicas deste autor

screenFetch - The Bash Screenshot Information Tool

Debian Mirror Redirector

LocalePurge, removendo locales não utilizados no Arch Linux e em distros Debian-like

Xfce 4.8 no Debian Squeeze

O obmenu-generator e a criação de um pequeno Debian package

Leitura recomendada

Lançada edição n. 6 da Revista Espírito Livre

Web of Life: um jogo de estratégia online GPL

MPlayer - Reproduzindo diretórios (e seus subdiretórios) de música

Abrir o "Monitor do Sistema" com "Ctrl + Alt + Del"

Instalar Debian 4 em modo gráfico

  

Comentários

Nenhum comentário foi encontrado.



Contribuir com comentário




Patrocínio

Site hospedado pelo provedor HostGator.
Linux banner
Linux banner
Linux banner

Destaques

Artigos

Dicas

Viva o Android

Tópicos

Top 10 do mês

Scripts