Linux slogan
Visite também: Segurança Linux · BR-Linux.org · Dicas-L · Doode · NoticiasLinux · SoftwareLivre.org · UnderLinux



» Screenshot
Linux: super slack mac
Por removido
» Login
Login:
Senha:

Se você ainda não possui uma conta, clique aqui.

Esqueci minha senha



Artigo

Python: automatizando a extração de informações na web com expressões regulares
Linux user
rafael.alencar
16/09/2009
Presenciamos uma grande necessidade e valorização de soluções para recuperação, filtragem e organização de informações da Internet. O presente artigo pretende ilustrar, de forma didática, como automatizar a obtenção de informações dinâmicas em páginas web utilizando a linguagem Python e seu amplo suporte a expressões regulares.
Por: Rafael José de Alencar Almeida | Blog: http://www.rafael-labs.com
[ Hits: 18129 ]
Conceito: 10.0   3 voto(s)3 voto(s)3 voto(s)3 voto(s)3 voto(s) + quero dar nota ao artigo

Introdução

No atual estágio de expansão e dinamismo da Internet, a posse de informações concisas e de qualidade é um requisito essencial para que um site, aplicação ou empresa se destaque em seu meio. Portanto, há uma grande necessidade e valorização de soluções para recuperação, filtragem e organização das informações que se encontram na web.

O presente artigo pretende ilustrar, de forma didática, como automatizar a obtenção de informações dinâmicas em páginas web utilizando a linguagem Python e seu amplo suporte a expressões regulares.

Serão explicados, passo a passo, exemplos envolvendo exibição da previsão do tempo, obtenção de postagens no Twitter, download de imagens e acesso aos resultados de buscas no Google.

Compreendendo os exemplos demonstrados, o leitor poderá facilmente desenvolver aplicativos capazes de obter diversas informações dinâmicas como: cotações, notícias, postagens etc. Recomenda-se que o leitor já possua conhecimentos básicos da sintaxe da linguagem Python e de expressões regulares.

É importante lembrar que para tarefas mais complexas de Parser (X)HTML em Python existem diversos módulos prontos, como o Beautiful Soup.

Próxima página >>




Páginas do artigo

Outros artigos deste autor

Leitura recomendada

Comentários
[1] Comentário enviado por valdineisantos em 16/09/2009 - 16:21h:

Muito bom seu texto. Como você comentou o BeautifulSoap é bastante util eu sempre procuro pelos elementos da página com ele e não com expressões regulares embora o resultado final seja exatamente o mesmo.

Parabens.

[2] Comentário enviado por wryel em 16/09/2009 - 17:35h:

eu fiz essas coisas com o curl do linux uns tempos atras, cheguei a achar a lib pycurl na net mas não tava conseguindo importar pra dentro dos projetos ;|

maior mão na roda seu tutorial =0

[3] Comentário enviado por jlojunior em 17/09/2009 - 10:17h:

Excelente artigo, parabéns!

Poxa, legal ver mais alguém de Barbacena por aqui!
Como eu, é entusiasta de Linux e Python!
Mande um abraço pro prof. Herlon lá na EAFB!

Abraço!

[4] Comentário enviado por jmurray em 26/08/2010 - 09:34h:

Era somente isso que faltava para mim migrar para o Linux por definitivo. O que me prende no Windows era a automatização de tarefas para a internet !


Contribuir com comentário


  
Para executar esta ação você precisa estar logado no site, caso contrário, tudo o que for digitado será perdido.
Responsável pelo site: Fábio Berbert de Paula - Conteúdo distribuído sob licença GNU FDL
Site hospedado por:

Viva o Linux

A maior comunidade Linux da América Latina! Artigos, dicas, tutoriais, fórum, scripts e muito mais. Ideal para quem busca auto-ajuda em Linux.