Remover tags HTML com SED

Publicado por Fábio Berbert de Paula em 14/06/2020

[ Hits: 4.657 ]

Blog: https://fabio.automatizando.dev

 


Remover tags HTML com SED



Remover tags HTML usando o sed é, como diriam os mais sofisticados, "piece of cake!". Uma tag HTML tem o seguinte formato:

<abrir tag></fechar tag>

ou

<tag com argumentos />

note que independente da tag ser de abertura ou fechamento, ela sempre começa com < e termina com >. Então vamos à nossa expressão regular:

echo '<a href="#">Link aqui</a><br/>' | sed 's/<[^>]*>//g'
Link aqui

Onde:
  • /<[^>]*>/ = começa com <, tudo o que não é > e termina com >
  • //g = substitua todas as ocorrências do padrão acima por nada

Simples assim!

Outras dicas deste autor

Como evitar que o CSS do teu site fique armazenado em cache

Vim - implemente um "substituir tudo" no modo BOSS

Problemas em diretório com milhares de arquivos [Resolvido]

APT - Como descobrir a que repositório pertence um pacote

Instalação e Configuração do Oracle Express Edition e SQL Developer no Ubuntu

Leitura recomendada

Exibindo o nome completo dos pacotes instalados no Debian e derivados

Obtendo a cotação do Bitcoin com SED

Ubuntu - Iniciar Conky no Login

Eliminando linhas de comentário ou linhas em branco no Linux

Como renomear arquivos de letras maiúsculas para minúsculas

  

Comentários
[1] Comentário enviado por maurixnovatrento em 14/06/2020 - 21:09h


Essas instruções com sed estão cada vez melhores.

___________________________________
Conhecimento não se Leva para o Túmulo.



Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts