Descobrindo o PageRank de um site via linha de comando

Publicado por Fábio Berbert de Paula em 20/09/2011

[ Hits: 6.636 ]

Blog: https://www.instagram.com/alexabolada/

 


Descobrindo o PageRank de um site via linha de comando



Nesta rápida dica criaremos um simples Perl script para recuperar o PageRank de um site através de linha de comando.

Para quem não sabe o que é PageRank, eis um trecho de sua definição na Wikipédia:

O sistema PageRank é usado pelo motor de busca Google para ajudar a determinar a relevância ou importância de uma página. Foi desenvolvida pelos fundadores do Google, Larry Page e Sergey Brin enquanto cursavam a Universidade de Stanford em 1998.

O Google mantém uma lista de bilhões de páginas em ordem de importância, isto é, cada página tem sua importância na Internet como um todo; esse Banco de Páginas mantém desde a página mais importante do mundo até a menos importante. Essa importância se dá pelo número de votos que uma página recebe. Um voto é um link em qualquer lugar da Internet para aquela página. Votos de páginas mais importantes valem mais do que votos de páginas menos importantes.


Fonte: http://pt.wikipedia.org/wiki/PageRank

Para executar nosso script será necessário a instalação do módulo Perl WWW:Google::PageRank. Vamos instalá-lo via CPAN:

sudo perl -MCPAN -e shell

Na shell interativa comande:

cpan[1]> install WWW::Google::PageRank
cpan[1]> exit

De volta ao terminal, vamos verificar se a instalação do módulo foi executada com sucesso:

perl -MWWW::Google::PageRank -e 'print "ok\n"'

A saída deve ser um simples "ok".

Agora vamos ao script em si. Abra um editor de texto de sua preferência e crie um arquivo com o seguinte conteúdo:

#!/usr/bin/perl use WWW::Google::PageRank; my $pr = WWW::Google::PageRank->new; foreach my $site (@ARGV) { if ( $site !~ /^http/i ) { $site = "http://$site"; } print "$site tem pagerank " . scalar($pr->get($site)) . "\n"; }

Salve com um nome qualquer, aqui adotei pagerank.pl.

Dê permissão de execução:

chmod a+x pagerank.pl

E finalmente execute-o, passando a lista dos sites desejados como parâmetro:

./pagerank.pl www.vivaolinux.com.br
http://www.vivaolinux.com.br tem pagerank 6


Outro exemplo:

pagerank.pl www.vivaolinux.com.br br-linux.org www.doode.com.br under-linux.org dicas-l.com.br softwarelivre.org www.noticiaslinux.com.br
http://www.vivaolinux.com.br tem pagerank 6
http://br-linux.org tem pagerank 6
http://www.doode.com.br tem pagerank 5
http://under-linux.org tem pagerank 6
http://dicas-l.com.br tem pagerank 7
http://softwarelivre.org tem pagerank 7
http://www.noticiaslinux.com.br tem pagerank 6


É isso.

Um abraço.

Outras dicas deste autor

OBS - Captura de Tela Tremulante (OBS Flickering) [Resolvido]

Escolhendo quais colunas exibir no comando top

VirtualBox no Debian 10 Buster? Virtual Machine Manager

Calendário para acompanhamento de ciclo menstrual

Converter imagens para fundo transparente via linha de comando

Leitura recomendada

Gerando estatísticas de acesso ao web server com awstats em arquivos html estáticos

Perl e jQuery

Dicas e macetes sobre o Firefox

Munin - estatísticas para servidores

Shell, algumas dicas para iniciantes

  

Comentários
[1] Comentário enviado por meiradarocha em 20/09/2011 - 17:33h

Bem interressante!

Vale a pena dar uma olhada nesta página: http://www.webmasterworld.com/forum80/631.htm

[2] Comentário enviado por julio_hoffimann em 20/09/2011 - 18:27h

Legal Fábio!

Como sempre Perl se mostrando uma ótima linguagem para utilitários web. :-)

Abraço!

P.S.: Os comentários enviados por autores nos artigos estão funcionando. ;-)

[3] Comentário enviado por removido em 21/09/2011 - 11:41h

Bem legal !

[4] Comentário enviado por ysquyty em 19/12/2011 - 16:51h

Legal gostei demais. Vou colocar em meu site.


Vinicius

www.dedcomponentes.com.br">www.dedcomponentes.com.br
www.dedcomponentes.com



Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts