O Wget não está exibindo o formato original da página quando fico offline? [RESOLVIDO]

1. O Wget não está exibindo o formato original da página quando fico offline? [RESOLVIDO]

Homem Sem Nome
homemsemnome

(usa Debian)

Enviado em 21/12/2016 - 01:38h

O lance é o seguinte: já aconteceu de eu perder conteúdo que tinha salvo no histórico do navegador pelo fato do link em questão ter "quebrado", ou seja, o conteúdo ter saído do ar. E como eu costumo marcar muita coisa para estudar depois, eu gostaria de salvar a página no meu HD e poder visualizá-la depois de maneira offline. Foi então que eu fui atrás do Wget para poder baixar a página, mas o problema é que enquanto eu estou conectado à internet, ele exibe a página bonitinho; mas caso eu esteja realmente offline, a página sai em um formato todo zuado.

Vejam primeiramente os dois comandos que eu testei para baixar a página, sendo que a diferença entre eles está no fato de que um tem a opção -p ativa (ela é a responsável por baixar todos os arquivos necessários para que o site possa ser exibido localmente), e já o outro não. E enquanto que o download com a opção -p cria uma diretório inteiro com várias subpastas dentro contendo as informações do site, o outro simplesmente baixa somente a página no formato HTML mesmo.

$ wget -cp --user-agent="Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) Gecko/2008092416 Firefox/3.0.3" --convert-links http://www.devmedia.com.br/introducao-ao-shell-script-no-linux/25778 


$ wget -c --user-agent="Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) Gecko/2008092416 Firefox/3.0.3" --convert-links http://www.devmedia.com.br/introducao-ao-shell-script-no-linux/25778 


Eu cheguei a cogitar o fato de que o problema poderia ser o user-agent, mas eu testei o download sem ele e o efeito foi o mesmo. =(

Vejam como o download fica quando é aberto enquanto eu estou online (sem a opção -p):
https://imgur.com/a/PrDO4

Agora vejam o mesmo arquivo sendo aberto enquanto eu estou offline (sem a opção -p):
https://imgur.com/a/OILXO

Com a opção -p:
https://imgur.com/a/yta0r




  


2. MELHOR RESPOSTA

Mauriciodez
Mauriciodez

(usa Debian)

Enviado em 02/01/2017 - 21:10h

homemsemnome escreveu:

Calma aí irmão, eu só estou querendo fazer o paranauê com as próprias ferramentas GNU. Não curto ficar dependendo de extensões. E também tem o fato de que eu já tenho tantas extensões aqui no meu navegador que daqui a pouco essa b*** para de funcionar. hauhauahuahauhauahau

Enfim, em último caso eu irei apelar para essa extensão aí. Está tranquilo. Só imagino que deve haver uma forma de se fazer isso no Wget de maneira prática.


eu entendo certinho q vc tá querendo desenrolar a parada do seu jeito ... mas vc tem q entender q o CSS pode ser feito de 'n' maneiras ( vai do gosto de quem fez ), e como uma HP é composta de trocentos elementos, para o bagulho ficar organizado de uma maneira q "sintetize" o CSS original tem q ser criado uma estrutura "comum" para q se adeque em qualquer HP ... no caso, a maneira mais funcional é a criação desse zilhão de pastas !!

___________________________________________________________________________________________
" Nem sempre é amigo aquele que te tira do buraco !!! ( Saddam Hussein )"

3. Re: O Wget não está exibindo o formato original da página quando fico offline? [RESOLVIDO]

Mauriciodez
Mauriciodez

(usa Debian)

Enviado em 21/12/2016 - 02:08h

homemsemnome escreveu:
Foi então que eu fui atrás do Wget para poder baixar a página, mas o problema é que enquanto eu estou conectado à internet, ele exibe a página bonitinho; mas caso eu esteja realmente offline, a página sai em um formato todo zuado.


velho seguinte .. vc olhou se a página não faz referencia a um CSS externo ??? se vc baixar a página sem o CSS quando vc estiver desconectado ela não vai formatar mesmo não !!!
___________________________________________________________________________________________
" Nem sempre é amigo aquele que te tira do buraco !!! ( Saddam Hussein )"


4. Re: O Wget não está exibindo o formato original da página quando fico offline? [RESOLVIDO]

Homem Sem Nome
homemsemnome

(usa Debian)

Enviado em 21/12/2016 - 02:22h

Mauriciodez escreveu:


Eu não entendo nada de redes mano. O que é um CSS? Como eu faço para procurá-lo e baixá-lo direitinho?

Obrigado.


5. Re: O Wget não está exibindo o formato original da página quando fico offline? [RESOLVIDO]

Perfil removido
removido

(usa Nenhuma)

Enviado em 21/12/2016 - 05:03h

Quando eu meto um drop num site eu uso

wget -c -t 0 -r -x -k -p -np ...  


----------------------------------------------------------------------------------------------------------------
Nem direita, nem esquerda. Quando se trata de corrupção o Brasil é ambidestro.
(anônimo)

Encryption works. Properly implemented strong crypto systems are one of the few things that you can rely on. Unfortunately, endpoint security is so terrifically weak that NSA can frequently find ways around it. — Edward Snowden



6. Re: O Wget não está exibindo o formato original da página quando fico offline?

Marcos Souza
IUseLinux

(usa Slackware)

Enviado em 21/12/2016 - 09:27h

homemsemnome escreveu:

Mauriciodez escreveu:


Eu não entendo nada de redes mano. O que é um CSS? Como eu faço para procurá-lo e baixá-lo direitinho?

Obrigado.


CSS é uma linguagem de programaçao que normalmente vem aclopada ao html, serve para dar estilo ao site, normalmente nao se coloca o codigo CSS junto com o HTML, mas sim se anexa os dois arquivos juntos, por isso que quando for baixar um site ele pode vim sem estilo, pois estara baixando apenas o HTML.

"Talk is cheap, show me the code"



7. Re: O Wget não está exibindo o formato original da página quando fico offline? [RESOLVIDO]

Marcos Souza
IUseLinux

(usa Slackware)

Enviado em 21/12/2016 - 09:34h

homemsemnome escreveu:

Mauriciodez escreveu:


Eu não entendo nada de redes mano. O que é um CSS? Como eu faço para procurá-lo e baixá-lo direitinho?

Obrigado.


Tipo o site do devmedia olhe só:
<link href='http://fonts.googleapis.com/css?family=Roboto:300' rel='stylesheet' type='text/css'>
<link href='http://fonts.googleapis.com/css?family=Montserrat:700' rel='stylesheet' type='text/css'>
<link href="http://fonts.googleapis.com/css?family=Lato:100,300,400,700,900,100italic,300italic,400italic,700italic,900italic" rel="stylesheet" type="text/css">

<link href="http://www.devmedia.com.br/articles/css/viewcomp.css?id=1.2" rel="stylesheet" type="text/css">
<link href="http://www.devmedia.com.br/articles/css/menu-pagina-post.css" rel="stylesheet" type="text/css">

<link href="http://www.devmedia.com.br/articlesdev/css/artigodev_style.css" rel="stylesheet" type="text/css">
<link rel="stylesheet" href="//maxcdn.bootstrapcdn.com/font-awesome/4.4.0/css/font-awesome.min.css">


O Codigo CSS nao veio junto com o site, mas sim o html está anexado com o css por isso está assim, ainda mais que este CSS nao está em arquivo interno e sim está na rede, por isso a pagina só fica com estilo online.

"Talk is cheap, show me the code"



8. Re: O Wget não está exibindo o formato original da página quando fico offline? [RESOLVIDO]

Perfil removido
removido

(usa Nenhuma)

Enviado em 21/12/2016 - 11:12h

Eu uso uma extensão do Firefox (deve ter para o Chrome/Chromium também) que salva a página em formato "mht". Assim posso ver offline a qualquer hora e fica normal... experimenta aí.


9. Re: O Wget não está exibindo o formato original da página quando fico offline? [RESOLVIDO]

Homem Sem Nome
homemsemnome

(usa Debian)

Enviado em 21/12/2016 - 17:59h

IUseLinux escreveu:


Muito obrigado pela explicação colega. Mas você poderia me dizer como eu faço para baixar o código CSS junto com o HTML através do Wget?

Valeu.

PauloHAC escreveu:


Você poderia me dizer qual é o nome dessa extensão?

Obrigado.


10. Re: O Wget não está exibindo o formato original da página quando fico offline? [RESOLVIDO]

Zenas Alves
zenas

(usa Slackware)

Enviado em 21/12/2016 - 18:11h

homemsemnome escreveu:

O lance é o seguinte: já aconteceu de eu perder conteúdo que tinha salvo no histórico do navegador pelo fato do link em questão ter "quebrado", ou seja, o conteúdo ter saído do ar. E como eu costumo marcar muita coisa para estudar depois, eu gostaria de salvar a página no meu HD e poder visualizá-la depois de maneira offline. Foi então que eu fui atrás do Wget para poder baixar a página, mas o problema é que enquanto eu estou conectado à internet, ele exibe a página bonitinho; mas caso eu esteja realmente offline, a página sai em um formato todo zuado.

Vejam primeiramente os dois comandos que eu testei para baixar a página, sendo que a diferença entre eles está no fato de que um tem a opção -p ativa (ela é a responsável por baixar todos os arquivos necessários para que o site possa ser exibido localmente), e já o outro não. E enquanto que o download com a opção -p cria uma diretório inteiro com várias subpastas dentro contendo as informações do site, o outro simplesmente baixa somente a página no formato HTML mesmo.

$ wget -cp --user-agent="Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) Gecko/2008092416 Firefox/3.0.3" --convert-links http://www.devmedia.com.br/introducao-ao-shell-script-no-linux/25778 


$ wget -c --user-agent="Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) Gecko/2008092416 Firefox/3.0.3" --convert-links http://www.devmedia.com.br/introducao-ao-shell-script-no-linux/25778 


Eu cheguei a cogitar o fato de que o problema poderia ser o user-agent, mas eu testei o download sem ele e o efeito foi o mesmo. =(

Vejam como o download fica quando é aberto enquanto eu estou online (sem a opção -p):
https://imgur.com/a/PrDO4

Agora vejam o mesmo arquivo sendo aberto enquanto eu estou offline (sem a opção -p):
https://imgur.com/a/OILXO

Com a opção -p:
https://imgur.com/a/yta0r



Este artigo pode te ajudar:
https://www.vivaolinux.com.br/dica/Wget-Baixando-sites-inteiros



11. Re: O Wget não está exibindo o formato original da página quando fico offline? [RESOLVIDO]

Homem Sem Nome
homemsemnome

(usa Debian)

Enviado em 21/12/2016 - 18:22h

zenas escreveu:


Obrigado pela dica colega, mas eu já conhecia esse artigo aí. Me baseei nele e no artigo do Elias Praciano para montar o meu comando.

https://elias.praciano.com/2013/12/o-comando-wget-em-10-exemplos/

O lance é que eu não quero baixar o site inteiro, mas sim determinada página que abra normalmente enquanto eu estou offline. E como o formato sai distorcido mesmo quando eu utilizo a opção -p, eu não sei o que fazer. Vamos aguardar e ver se alguém aqui sabe como baixar o tal do CSS junto. =)


12. Re: O Wget não está exibindo o formato original da página quando fico offline? [RESOLVIDO]

Zenas Alves
zenas

(usa Slackware)

Enviado em 21/12/2016 - 18:34h

homemsemnome escreveu:

zenas escreveu:


Obrigado pela dica colega, mas eu já conhecia esse artigo aí. Me baseei nele e no artigo do Elias Praciano para montar o meu comando.

https://elias.praciano.com/2013/12/o-comando-wget-em-10-exemplos/

O lance é que eu não quero baixar o site inteiro, mas sim determinada página que abra normalmente enquanto eu estou offline. E como o formato sai distorcido mesmo quando eu utilizo a opção -p, eu não sei o que fazer. Vamos aguardar e ver se alguém aqui sabe como baixar o tal do CSS junto. =)


Mas então é simples, se você quer baixar uma página específica basta apontá-la no comando Wget. Por exemplo, se você quer baixar uma página do site example.com e não todo o conteúdo basta jogar no terminal:
$ wget -r example.com/about 

E ele fará download apenas do hotsite about. Porém tem alguns problemas com isso, você talvez não tenha toda as funcionalidades de conexão que o site online permite, como anúncios, iframes, etc... E também não poderá acessar conteúdos alocados no banco de dados do site. Mas fora isso, toda a documentação e os arquivos estão com você. Espero ter ajudado.




01 02