Rastrear emails na internet
Publicado por Roberto Fettuccia (última atualização em 29/01/2013)
[ Hits: 7.352 ]
Caros colegas do mundo livre, posto aqui com muito orgulho um script que faz uma varredura de contatos de emails na internet, este opera graças ao navegador em modo texto chamado w3m, o script faz na verdade um filtro de milhares de strings de texto, retornando somente o desejado.
Este script automatiza uma busca pelos principais sites, como o Google, Bing e Yahoo.
Antes de utilizar, devemos criar dois arquivos de texto na mesma raiz de execução do script, vamos lá!
Arquivo: cidades.lst
Obs.: Em campos com espaço utilizar "+".
INICIO --------------------------------------
porto+alegre-rs,centro
porto+alegre-rs,partenon
florianópolis-sc,itacurubi
canoas-rs,centro
canoas-rs,igara
canoas-rs,niterói
rio+de+janeiro-rj,centro
rio+de+janeiro-rj,lapa
FIM --------------------------------------
Arquivo: verbo.lst
Deve conter os ramos de negócio ou objeto alvo da busca. Vamos usar como exemplo o ramo automotivo:
INICIO -------------------------------------------------
acessorios
carros usados
carros novos
veículos novos
vaículos usados
veículos semi-novos
venda carros
venda veículos
revenda carros
revenda veículos
serviço autorizados
autorizada oficina
mecânica autorizada
peças originais
venda-direta carro
serviços carro
FIM --------------------------------------
#!/bin/bash # informações # Garimpaemail 1.0 - 16-01-13 # escript desenvolvido por roberto fettuccia. # testado RHEL6, centos6.3, ubuntu 11.04, debian 5.4 # mail : rpaulafettuccia@gmail.com #-------------------------------------------------------------- # INSTALAR dependência : w3m #--------------------------------------------------------------- # modo de uso: # garimpaemail.sh [assunto] >> [arquivo] # garimpaemail.sh contato >> emails.txt PIDX="$(echo $$)" assunto="$1" cidadesFLL="./cidades.lst" verbos="./verbo.lst" touch /var/tmp/$PIDX garimpar() { w3m -no-cookie "www.google.com.br/search?hp&q=$str&oq=$str" | expand | grep @ | grep '[^@^.^]' | sed "s/ /\n/g" | grep "@" >> /var/tmp/$PIDX w3m -no-cookie "http://br.bing.com/search?q=$str" | expand | grep @ | grep '[^@^.^]' | sed "s/ /\n/g" | grep "@" >> /var/tmp/$PIDX w3m -no-cookie "http://cade.search.yahoo.com/search?p=$str" | expand | grep @ | grep '[^@^.^]' | sed "s/ /\n/g" | grep "@" >> /var/tmp/$PIDX sed -i 's/@yahoo./@yahoo.com.br /g' /var/tmp/"$PIDX" sed -i 's/@gmail./@gmail.com /g' /var/tmp/"$PIDX" sed -i 's/@hotmail./@hotmail.com /g' /var/tmp/"$PIDX" sed -i 's/@terra./@terra.com.br /g' /var/tmp/"$PIDX" sed -i 's/br./br/g' /var/tmp/"$PIDX" sed -i 's/ com//g ' /var/tmp/"$PIDX" cat /var/tmp/$PIDX | sort -u rm -f /var/tmp/$PIDX } for line in $(cat "$cidadesFLL" ); do for line in $(cat "$verbos"); do verb="$line" cidade="$(echo $line | awk -F, '{print $1}' | sed 's/+/ /g')" bairro="$(echo $line | awk -F, '{print $2}' | sed 's/+/ /g')" str="$cidade $bairro $verb" garimpar done done # dependências w3m, sed. # USO : # ./garimpaemail.sh PIDX="$(echo $$)" cidadesFLL="./cidades.lst" verbos="./verbo.lst" touch /var/tmp/$PIDX garimpar() { w3m -no-cookie "www.google.com.br/search?hp&q=$str&oq=$str" | expand | grep @ | grep '[^@^.^]' | sed "s/ /\n/g" | grep "@" >> /var/tmp/$PIDX w3m -no-cookie "http://br.bing.com/search?q=$str" | expand | grep @ | grep '[^@^.^]' | sed "s/ /\n/g" | grep "@" >> /var/tmp/$PIDX w3m -no-cookie "http://cade.search.yahoo.com/search?p=$str" | expand | grep @ | grep '[^@^.^]' | sed "s/ /\n/g" | grep "@" >> /var/tmp/$PIDX sed -i 's/@yahoo./@yahoo.com.br /g' /var/tmp/"$PIDX" sed -i 's/@gmail./@gmail.com /g' /var/tmp/"$PIDX" sed -i 's/@hotmail./@hotmail.com /g' /var/tmp/"$PIDX" sed -i 's/@terra./@terra.com.br /g' /var/tmp/"$PIDX" sed -i 's/br./br/g' /var/tmp/"$PIDX" sed -i 's/ com//g ' /var/tmp/"$PIDX" cat /var/tmp/$PIDX | sort -u rm -f /var/tmp/$PIDX } for line in $(cat "$cidadesFLL" ); do for line in $(cat "$verbos"); do verb="$line" cidade="$(echo $line | awk -F, '{print $1}' | sed 's/+/ /g')" bairro="$(echo $line | awk -F, '{print $2}' | sed 's/+/ /g')" str="$cidade $bairro $verb" garimpar done done
Instalador de Código Fonte - Linha de Comando
Sincronização entre Servidores de Impressão
EPD (Editor de Pacotes Debian)
Nenhum comentário foi encontrado.
Compilando um Kernel customizado a partir do código-fonte do Kernel do Debian 12
Gentoo binário ao lado da sua distro atual
Documentação para a função de carregamento saudável da bateria do notebook Acer Aspire 5 no Linux
Instalando Google Chrome no Linux Mint 22
O Que Fazer Após Instalar Linux Mint 22
Instalando o Dolphin e deixando-o "pretinho" acompanhando o tema escuro do Gnome-Shell
Meu computador está travando (12)
Meu computador não aceita o Linux de nenhuma maneira (7)
Máximo que meu PC suporta de gigas no HD ou ssd. (5)
Error no such device : 3C8E-127A. error: disco 'hd1,gpt... não e... (3)