Removendo linhas duplicadas não-consecutivas

Publicado por Sandro Marcell em 20/10/2009

[ Hits: 16.693 ]

Blog: http://sanmarcell.wordpress.com

1 0

Denuncie Favoritos Indicar Impressora

Removendo linhas duplicadas não-consecutivas

Geralmente utilizo o comando sort para remover linhas duplicadas de um arquivo:

sort -o output -u input

O problema era que em alguns casos as linhas não poderiam ser ordenadas, mas o sort (obviamente!) as ordenava. Então acabei resolvendo o meu problema assim:

perl -ne '$i{"$_"}++ || print' < input > output

O mesmo pode ser obtido via awk:

awk '!i[$0]++' < input > output

Ou:

awk '!($0 in i) {i[$0] ; print}' < input > output

Sendo "input" o arquivo de entrada e "output" o de saída.

Falou! ;)

Outras dicas deste autor

Copiar e colar no XTerm

Man pages coloridas

PHP + jQuery - Monitorando link de internet em tempo real

Habilitando correção ortográfica no Vim

Substituir espaços em branco por underlines em nome de arquivos

Leitura recomendada

Como tirar os "Ícones invisíveis" do lançador do Ubuntu

Como baixar o código HTML de um site por linha de comando no Linux

Convert[endo] fotos

Instalando FreeRADIUS no Debian/Ubuntu - Versão atual

Habilitando/Desabilitando daemons no Debian

Comentários

[1] Comentário enviado por ferrarezux em 29/10/2012 - 12:37h

Valeu cara! Me ajudou demais aqui.

Patrocínio

Site hospedado pelo provedor RedeHost.

Destaques

Criei um app de escrita acadêmica para brasileiros! (4)

Links importantes de usuários do vol (4)

Artigos

Como rodar o Folding@home no Linux

Criando um painel de controle (Dashboard) para seu servidor com o Homepage

O Abismo entre o Código e o Chão: Saltos Tecnológicos e a Exclusão Estrutural no Brasil

Instalar e Configurar a santíssima trindade (PAP) no Void Linux

O Editor de Texto Nano: Simplicidade no Terminal

Dicas

NixOS + NVIDIA antiga: como sobreviver ao driver 595 (GTX 750 Ti / Maxwell)

Conhecendo o tmux: Multiplexador de Terminal

Acessando página do Syncthing fora da máquina local

[Resolvido] Meu monitor suporta 100fps. Por que o máximo é 60fps nos jogos?

Jogando "Magic" gratuitamente no Linux

Tópicos

VMWare Player não conecta na rede nem consigo intercambiar arquivos (0)

SystemD e mais polêmicas. (3)

Como instalo o Clipper/Harbour no Linux Ubuntu (4)

A falsa sensação de que entende a tal da palavra! (4)

Top 10 do mês

Xerxes
1° lugar - 141.238 pts
Fábio Berbert de Paula
2° lugar - 66.422 pts
Buckminster
3° lugar - 45.696 pts
Alberto Federman Neto.
4° lugar - 36.223 pts
Alessandro de Oliveira Faria (A.K.A. CABELO)
5° lugar - 23.455 pts
Sidnei Serra
6° lugar - 23.437 pts
edps
7° lugar - 23.211 pts
Daniel Lara Souza
8° lugar - 21.156 pts
Mauricio Ferrari (LinuxProativo)
9° lugar - 20.447 pts
Andre (pinduvoz)
10° lugar - 17.067 pts

Scripts

[Shell Script] imageDownloader

[Shell Script] Flatpak manager

[Shell Script] Renomador em lote feito em Zenity

[C/C++] Jogo do Labirinto no Terminal

[Shell Script] Status do teclado em qualquer ambiente gráfico com system tray no Linux