Enviado em 25/09/2020 - 19:03h
Eu tenho arquivos com 7 colunas. Preciso excluir as linhas em que os valores na primeira, segunda e terceira coluna são iguais. Ou seja, a data (coluna 1), a hora (coluna 2) e o índice (coluna 3) não podem ser repetidos juntos e devo manter apenas a linha em que o valor da sétima coluna é o maior.
Aqui está um exemplo dos dados:
E eu preciso de um resultado como este:
Em outras palavras, as condições são: se você tiver mais de uma linha com a mesma data (por exemplo, 2040101) na coluna 1, a mesma hora (por exemplo, 2100) na coluna 2 e o mesmo índice (por exemplo, 1762 ) na terceira coluna, mantenha apenas a linha em que o valor da última coluna é maior. No caso do exemplo que dei, basta manter:
Obrigada pela ajuda!
Aqui está um exemplo dos dados:
20140101 2100 1762 -5.983 -37.483 26.8 11000
20140101 2100 1762 -5.983 -37.483 36.8 15000
20140109 2040 1762 -5.983 -37.483 25.0 3000
20140109 2040 1762 -5.983 -37.483 28.0 7000
20140130 2250 1762 -5.983 -37.483 22.0 3000
20140109 2040 1763 -5.992 -37.483 25.0 4000
20140109 2040 1763 -5.992 -37.483 23.2 6000
20140114 1940 1763 -5.992 -37.483 34.0 6000
E eu preciso de um resultado como este:
20140101 2100 1762 -5.983 -37.483 36.8 15000
20140109 2040 1762 -5.983 -37.483 28.0 7000
20140130 2250 1762 -5.983 -37.483 22.0 3000
20140109 2040 1763 -5.992 -37.483 23.2 6000
20140114 1940 1763 -5.992 -37.483 34.0 6000
Em outras palavras, as condições são: se você tiver mais de uma linha com a mesma data (por exemplo, 2040101) na coluna 1, a mesma hora (por exemplo, 2100) na coluna 2 e o mesmo índice (por exemplo, 1762 ) na terceira coluna, mantenha apenas a linha em que o valor da última coluna é maior. No caso do exemplo que dei, basta manter:
20140101 2100 1762 -5.983 -37.483 36.8 15000
20140109 2040 1762 -5.983 -37.483 28.0 7000
20140130 2250 1762 -5.983 -37.483 22.0 3000
20140109 2040 1763 -5.992 -37.483 23.2 6000
20140114 1940 1763 -5.992 -37.483 34.0 6000
Obrigada pela ajuda!