Exmaill - Extrator de Emails

Publicado por Murilo R. Esplugues 24/02/2005 (última atualização em 15/07/2011)

[ Hits: 14.799 ]

Homepage: http://www.helpday.blogspot.com/

Download exmail.py

Download 1304887710.exmail.py (versão 2)




Pequeno script que extrai endereços de email de um arquivo contendo texto diverso. Quidk and Dirty!

  



Versões atualizadas deste script

Versão 2 - Enviado por djasdijai em 08/05/2011

Changelog: Corrigi alguns bugs que deu no ubuntu 11.04
e ao exibir mensgens de erro pula uma linha

Download 1304887710.exmail.py


Esconder código-fonte

#!/usr/bin/env python

# Autor: Murilo R. Esplugues
# Data:  23/02/2005
# Nome do arquivo: exmail.py
# Descricao do programa: Extrai email de arquivos de texto
# (qq palavra com @)
# Python Vrs: Python 2.4.* - e vrs anteriores
# Contato: [email protected]
# Categorias: Script - Python - ModoTexto

# Uso: exmail.py arquivo_com_emails.txt > emails.txt
# -*- coding: iso8859-1 -*-

import sys
import string as s


NoFile = "Nome de arquivo nao especificado"        
NoRead = "Nao foi possível ler"

if len(sys.argv) < 2:
    sys.stderr.write(NoFile)
else:
   file = sys.argv[1]
   try:
       input = open(file, 'r')
   except IOError:
       sys.stderr.write(NoRead, "'%s'\n" % file)
       sys.exit()
       
   lines = input.readlines()
   lines.sort()
   for line in lines:
       if "@" in line:
           for data in s.split(line):
               if "@" in data:
                   print  s.lower(data)

Scripts recomendados

Inversor de Links

Agenda Python

Conversor MKV para AVI

Juntando tabelas em aquivo texto

Leitura de arquivo com input


  

Comentários
[1] Comentário enviado por Feko em 15/07/2011 - 09:37h

Muito bacana, simples e funcional =)
Talvez seja uma boa idéia usar expressões regulares (Com a bênção do Aurélio) para fazer estas procuras. Não que seja a melhor solução, mas uma alternativa =)


#!/usr/bin/env python
import re,sys
remail=re.compile('([_.0-9a-z-][email protected][0-9a-z-]+.[a-z]{2,6})')
txt=open(sys.argv[1]).read()
print remail.findall(txt)


Abraços!

[2] Comentário enviado por extratorfox em 15/02/2012 - 10:56h

Viva ai pessoal
Tambem trabalho com desenvolvimento mas em delphi e desenvolvemos aqui na empresa uma ferramenta para extração de email direto da web usando keyword diretamente no google
com possobilidade de coneçoes com proxy´s e tb ligação ao mysql ! sei que o assunto nao e windows mas queriamos ue visitassem nossa pagina e dessem o vosso feedback !
www.extratordeemail.com
Valeu ai a todos
Abraço
Romnho

[3] Comentário enviado por m4cgbr em 12/05/2012 - 15:19h

Excelente, parabéns pela iniciativa.

Super simples. Para quem inicialmente teve uma mensagem de rro como:
[email protected] /temp $ ./exmail.py lista.txt > ./emails.txt
File "./exmail.py", line 20
SyntaxError: Non-ASCII character '\xc3' in file ./exmail.py on line 20, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

Apenas remova o acento ou recorra a outros caminhos referente a codificação ISO, UTF, etc.

Que seja útil para usuários mais leigos.

Abs


Contribuir com comentário