Expressões regulares no PHP

Este artigo irá abordar conceitos sobre a utilização de expressões regulares com a linguagem PHP. Tópicos abordados: padrão POSIX, busca de padrões e curingas (wildcards).


[ Hits: 46.120 ]

Por: Marcelo Santos Araujo em 10/09/2004


Conceitos sobre expressões regulares



Expressões Regulares com PHP


Uma expressão regular é uma maneira de descrever um padrão em um trecho de texto ou frase.

Por exemplo, a string "teste" apresenta um padrão textual "teste". Também pode ser associado às letras ou sílabas: "e","te","st","es", etc.

Existem dois padrões disponíveis em PHP:
  • Padrão POSIX (iremos abordar este);
  • Padrão PCRE (Perl-compatible regular expression).

Classes de caracteres no POSIX:



Exemplos de outras utilizações para buscar padrões textuais:

[[:alnum:]] Caracteres alfanuméricos.
[[:alpha:]] Caracteres alfabéticos.
[[:digit:]] Número Decimal (0-9).
[[:lower:]] Caracteres minúsculos.
[[:upper:]] Caracteres maiúsculos.
[[:xdigit:]] Número Hexadecimal .
[[:cntrl:]] Caracteres de Controle.
[[:print:]] Caracteres imprimíveis.
[[:space:]] Caracteres com espaços em branco.


Símbolo *


O símbolo * significa que o padrão a ser encontrado pode se repetir de 0 vezes ate N vezes.

Exemplo:

(php)*teste

Resultado:
'teste', 'php teste', 'php php teste', 'php php php teste', etc

Símbolo +


É utilizado quando se busca um padrão que se repete pelo menos uma vez.

Exemplo:

[[:alnum:]]+

Resultado:
Pelo menos um caractere alfanumérico.

    Próxima página

Páginas do artigo
   1. Conceitos sobre expressões regulares
   2. Sub-expressões regulares e derivados
   3. Exemplos com PHP
Outros artigos deste autor

Replicação em banco de dados MySQL

Leitura recomendada

Iniciando no mundo das expressões regulares (parte 2)

Verificação da sintaxe do e-mail 1.0

Iniciando no mundo das expressões regulares (parte 1)

Upload de imagens com criação de thumbnails em PHP

Compactador de URL utilizando manipulação de diretórios do Linux com PHP

  
Comentários
[1] Comentário enviado por arrb em 10/09/2004 - 08:43h

Bom artigo, no caso da ER para tags creio q o correto seria:
"<[A-Za-z]+[A-Za-z0-9]*>" .

esta ER peraria <a> <h1> <dd> etc...

Blz

[2] Comentário enviado por gatecrasher em 10/09/2004 - 10:59h

isso ai mesmo,

desculpa a falha

[3] Comentário enviado por claudiolima em 01/06/2006 - 12:39h

Bom artigo para incentivar cada vez mais a programação! Blz.

[4] Comentário enviado por Gutto em 21/10/2007 - 16:00h

Só um detalhe, que para iniciantes pode dar problemas. Nos exemplos acima, o correto é fechar o parêntese do if( e do eregi(. Nos exemplo só está fechando um dos dois.

<?php

function verifica_alfabeto($var)
{
if(eregi("[a-zA-Z]",$var))
{
echo "Somente contem caracteres do alfabeto";
}
}

// Validação de email:
if(!eregi('[a-zA-Z0-9_\-\.]+@[a-zA-Z0-9\-]+\.[a-zA-Z0-9\-\.]+$',$var_email)) {
echo "Email inválido!";
}


if(eregi("[0-9]",$nome))
{
// se campo nome conter números
echo "Campo: nome invalido";
}

// Para verificar a incidência de tags HTML
// Existem outras maneiras de filtrar
if(eregi("[<a-zA-Z>]",$var))
{
echo "Apresentam tags html";
} ?>


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts

[a-zA-Z] caracteres do alfabeto (maiúsculo e minúsculo).
[aeiou] apenas vogais.
[^a-z] tudo menos os caracteres do alfabeto (minúsculo).
[^aeiou] - apenas consoantes O caractere ^ representa fora do intervalo das vogais. Não está contido entre aeiou..