Pular para o conteúdo

Remover linhas com valores duplicados na coluna "X" [RESOLVIDO]

Responder tópico
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.
  • Denunciar
  • Indicar

1. Remover linhas com valores duplicados na coluna "X" [RESOLVIDO]

Enviado em 22/05/2020 - 12:01h

Pessoas ... a situação é a seguinte, preciso comparar colunas de um .CSV .. preciso de colunas que tenham somente valores unicos em determinada coluna ... a principio quals linhas irão ser excluidas pouco importa contanto que, fique 1 com dados .

EX:
1234;maumau;9875
8547;maumau;poliuh
polk;poutz;maumau
00000;maumau;poutz


Nesse caso eu compararia a 2ª coluna e o resultado desejado seria a excusão de 2 linhas que tem o valor repetido "maumau" ... não importa quais linhas serão excluídas

Responder tópico

O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

2. Re: Remover linhas com valores duplicados na coluna "X" [RESOLVIDO]

Melhor resposta

Enviado em 22/05/2020 - 17:42h

Testa assim:
sort -t';' -k2,2 -u arquivo.csv 


3. Re: Remover linhas com valores duplicados na coluna "X" [RESOLVIDO]

Enviado em 22/05/2020 - 18:06h


Ryuk escreveu:

Testa assim:
sort -t';' -k2,2 -u arquivo.csv 



dúvida ... -k2,2 significa começar da segunda coluna e terminar na segunda coluna ??


------------------------------------------------------| Linux User #621728 |------------------------------------------------------

" Nem sempre é amigo aquele que te tira do buraco !!! ( Saddam Hussein )"

------------------------------------------------------| Linux User #621728 |------------------------------------------------------


4. Re: Remover linhas com valores duplicados na coluna

Enviado em 22/05/2020 - 20:43h

É, basicamente é isso mesmo. Se for usado apenas "-k2" o sort começa a ordenar do segundo campo até o último campo. Aí, o unique (-u) não funciona pois os campos seguintes seriam diferentes. Delimitando apenas ao segundo campo "-k2,2" a opção "-u" pode ser usada pra excluir as linhas com o segundo campo repetido, pois estaria restringindo apenas a uma coluna.

Responder tópico

O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Responder tópico

Entre na sua conta para responder.

Fazer login para responder