Linux slogan
Visite também: Segurança Linux · BR-Linux.org · Dicas-L · Doode · NoticiasLinux · SoftwareLivre.org · UnderLinux



» Screenshot
Linux: Ubuntu 7.04 + E17
Por micmend
» Login
Login:
Senha:

Se você ainda não possui uma conta, clique aqui.

Esqueci minha senha



Scripts

Linux user

Publicado por Murilo R. Esplugues em 24/02/2005 (última atualização em 15/07/2011)   [ 5151 hits ]

Login: mre, 145507 pontos

Homepage: http://www.helpday.blogspot.com/   


Descrição

Pequeno script que extrai endereços de email de um arquivo contendo texto diverso. Quidk and Dirty!

[ Download: exmail.py ]   [ Enviar nova versão ]

Versões atualizadas deste script (NOVO)
Linux user

Publicado por djasdijai em 08/05/2011

Changelog: Corrigi alguns bugs que deu no ubuntu 11.04
e ao exibir mensgens de erro pula uma linha

(versão 2)

 

[ Esconder código-fonte ]

#!/usr/bin/env python

# Autor: Murilo R. Esplugues
# Data:  23/02/2005
# Nome do arquivo: exmail.py
# Descricao do programa: Extrai email de arquivos de texto
# (qq palavra com @)
# Python Vrs: Python 2.4.* - e vrs anteriores
# Contato: murilo_esplugues@yahoo.com.br
# Categorias: Script - Python - ModoTexto

# Uso: exmail.py arquivo_com_emails.txt > emails.txt
# -*- coding: iso8859-1 -*-

import sys
import string as s


NoFile = "Nome de arquivo nao especificado"        
NoRead = "Nao foi possível ler"

if len(sys.argv) < 2:
    sys.stderr.write(NoFile)
else:
   file = sys.argv[1]
   try:
       input = open(file, 'r')
   except IOError:
       sys.stderr.write(NoRead, "'%s'\n" % file)
       sys.exit()
      
   lines = input.readlines()
   lines.sort()
   for line in lines:
       if "@" in line:
           for data in s.split(line):
               if "@" in data:
                   print  s.lower(data)

Scripts recomendados
   Script Linux recomendado Agenda de cadastros com tratamento de erros
   Script Linux recomendado Leitor de arquivo
   Script Linux recomendado tar7z
   Script Linux recomendado ccl - cut and change lines
   Script Linux recomendado Converte imagens em JPG

Comentários
[1] Comentário enviado por Feko em 15/07/2011 - 09:37h:

Muito bacana, simples e funcional =)
Talvez seja uma boa idéia usar expressões regulares (Com a bênção do Aurélio) para fazer estas procuras. Não que seja a melhor solução, mas uma alternativa =)


#!/usr/bin/env python
import re,sys
remail=re.compile('([_.0-9a-z-]+@[0-9a-z-]+.[a-z]{2,6})')
txt=open(sys.argv[1]).read()
print remail.findall(txt)


Abraços!

[2] Comentário enviado por extratorfox em 15/02/2012 - 10:56h:

Viva ai pessoal
Tambem trabalho com desenvolvimento mas em delphi e desenvolvemos aqui na empresa uma ferramenta para extração de email direto da web usando keyword diretamente no google
com possobilidade de coneçoes com proxy´s e tb ligação ao mysql ! sei que o assunto nao e windows mas queriamos ue visitassem nossa pagina e dessem o vosso feedback !
www.extratordeemail.com
Valeu ai a todos
Abraço
Romnho

[3] Comentário enviado por macgbr em 12/05/2012 - 15:19h:

Excelente, parabéns pela iniciativa.

Super simples. Para quem inicialmente teve uma mensagem de rro como:
ph@macgyver /temp $ ./exmail.py lista.txt > ./emails.txt
File "./exmail.py", line 20
SyntaxError: Non-ASCII character '\xc3' in file ./exmail.py on line 20, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

Apenas remova o acento ou recorra a outros caminhos referente a codificação ISO, UTF, etc.

Que seja útil para usuários mais leigos.

Abs



Contribuir com comentário


  
Para executar esta ação você precisa estar logado no site, caso contrário, tudo o que for digitado será perdido.
Responsável pelo site: Fábio Berbert de Paula - Conteúdo distribuído sob licença GNU FDL
Site hospedado por:

Viva o Linux

A maior comunidade Linux da América Latina! Artigos, dicas, tutoriais, fórum, scripts e muito mais. Ideal para quem busca auto-ajuda em Linux.