Remover tags HTML com SED

Publicado por Fábio Berbert de Paula em 14/06/2020

[ Hits: 3.611 ]

Blog: https://mestrefabio.com

 


Remover tags HTML com SED



Remover tags HTML usando o sed é, como diriam os mais sofisticados, "piece of cake!". Uma tag HTML tem o seguinte formato:

<abrir tag></fechar tag>

ou

<tag com argumentos />

note que independente da tag ser de abertura ou fechamento, ela sempre começa com < e termina com >. Então vamos à nossa expressão regular:

echo '<a href="#">Link aqui</a><br/>' | sed 's/<[^>]*>//g'
Link aqui

Onde:
  • /<[^>]*>/ = começa com <, tudo o que não é > e termina com >
  • //g = substitua todas as ocorrências do padrão acima por nada

Simples assim!

Outras dicas deste autor

Contar e ordenar a quantidade de ocorrências de cada linha em um arquivo

Como instalar o Docker no Debian 9 Stretch

Desativando popups "O sistema detectou um problema no aplicativo" no Ubuntu

Como descobrir se sua instalação GNU/Linux é 32 ou 64 bits

Traceroute - como escolher qual gateway ou interface de rede será usado

Leitura recomendada

Múltiplas expressões no SED

Listar comandos mais utilizados (via histórico de shell)

Eliminando linhas de comentário ou linhas em branco no Linux

sed - Eliminando linhas em branco

Equação de 2° Grau Shell Script - Zenity

  

Comentários
[1] Comentário enviado por maurixnovatrento em 14/06/2020 - 21:09h


Essas instruções com sed estão cada vez melhores.

___________________________________
Conhecimento não se Leva para o Túmulo.



Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts