Removendo linhas duplicadas não-consecutivas

Publicado por Sandro Marcell em 20/10/2009

[ Hits: 16.319 ]

Blog: http://sanmarcell.wordpress.com

1 0

Denuncie Favoritos Indicar Impressora

Removendo linhas duplicadas não-consecutivas

Geralmente utilizo o comando sort para remover linhas duplicadas de um arquivo:

sort -o output -u input

O problema era que em alguns casos as linhas não poderiam ser ordenadas, mas o sort (obviamente!) as ordenava. Então acabei resolvendo o meu problema assim:

perl -ne '$i{"$_"}++ || print' < input > output

O mesmo pode ser obtido via awk:

awk '!i[$0]++' < input > output

Ou:

awk '!($0 in i) {i[$0] ; print}' < input > output

Sendo "input" o arquivo de entrada e "output" o de saída.

Falou! ;)

Outras dicas deste autor

Ordenando strings em shell script

Tocando CDs de áudio via cdda2wav

Otimizando o Firefox para conexões banda larga

Squid - Limitando números de conexões simultâneas

Utilizando abreviações no Vim

Leitura recomendada

Convertendo arquivos de áudio no Debian

Economizando digitação com o comando cp

rename - Comando para renomear todos os arquivos para letra minúscula

Exercício Prático LPIC 10

Uso básico dos comandos zip e unzip

Comentários

[1] Comentário enviado por ferrarezux em 29/10/2012 - 12:37h

Valeu cara! Me ajudou demais aqui.

Patrocínio

Site hospedado pelo provedor RedeHost.

Destaques

Agora temos uma assistente virtual no fórum!!! (250)

Artigos

Atualizando o Passado: Linux no Lenovo G460 em 2025

aaPanel - Um Painel de Hospedagem Gratuito e Poderoso

O macete do Warsaw no Linux Mint e cia

Aprenda a Gerenciar Permissões de Arquivos no Linux

Fundo pontilhado CSS

Dicas

Git config não aplica configurações

O que você quer para sua vida ao usar o Linux?

Visualizar arquivos em formato markdown (ex.: README.md) pelo terminal

Dando - teoricamente - um gás no Gnome-Shell do Arch Linux

Como instalar o Google Cloud CLI no Ubuntu/Debian

Tópicos

Como bloquear e desbloquear papel de parede no Ubuntu 24.04 (3)

Criar um servidor de arquivos local com o ubuntu server e o samba? (1)

Invasão de Arch Based (10)

Falhas em startar o mongodb [RESOLVIDO] (3)

samba4 versao 4.22.3 usuario nao consegue trocar a senha (2)

Top 10 do mês

Xerxes
1° lugar - 77.717 pts
Fábio Berbert de Paula
2° lugar - 54.552 pts
Daniel Lara Souza
3° lugar - 18.241 pts
Mauricio Ferrari
4° lugar - 17.482 pts
Alberto Federman Neto.
5° lugar - 15.104 pts
edps
6° lugar - 14.404 pts
Buckminster
7° lugar - 13.953 pts
Alessandro de Oliveira Faria (A.K.A. CABELO)
8° lugar - 13.189 pts
Diego Mendes Rodrigues
9° lugar - 13.023 pts
Andre (pinduvoz)
10° lugar - 12.548 pts

Scripts

[Shell Script] Criar Script para apagar determinados arquivos

[Shell Script] inSANE - Script para usar Scanner

[Shell Script] Instalador do emulador de joystick Xbox para joystick generico para PC, PS2, PS3 (Debian e Derivados

[Shell Script] Instalador de Hotspot Linux Debian (SysV)

[Shell Script] Script para verificar o Status da bateria