Pular para o conteúdo

Remover tags HTML com SED

Dica publicada em Shell Script / Expressões Regulares
Fábio Berbert de Paula fabio
Hits: 4.805 Categoria: Shell Script Subcategoria: Expressões Regulares
  • Indicar
  • Impressora
  • Denunciar

Remover tags HTML com SED

Remover tags HTML usando o sed é, como diriam os mais sofisticados, "piece of cake!". Uma tag HTML tem o seguinte formato:



ou



note que independente da tag ser de abertura ou fechamento, ela sempre começa com < e termina com >. Então vamos à nossa expressão regular:

echo 'Link aqui
' | sed 's/<[^>]*>//g'

Link aqui

Onde:
  • /<[^>]*>/ = começa com <, tudo o que não é > e termina com >
  • //g = substitua todas as ocorrências do padrão acima por nada

Simples assim!

Conectando Linux com celulares através de Bluetooth

Vim com Tema de Cores do Visual Studio Code

Tema Escuro no Chrome Developer Tools (Dark Mode)

Novo portal Linux: Open SCRIPT

Como renomear arquivos de letras maiúsculas para minúsculas

Exibindo o nome completo dos pacotes instalados no Debian e derivados

Redirecionamento no Shell

Limitando o alcance do SED por números de linha

Ubuntu - Iniciar Conky no Login

Leitor de arquivos ePub

#1 Comentário enviado por maurixnovatrento em 14/06/2020 - 21:09h

Essas instruções com sed estão cada vez melhores.

___________________________________
Conhecimento não se Leva para o Túmulo.

Contribuir com comentário

Entre na sua conta para comentar.