Web Mining

Este artigo, feito por mim e colegas do curso de Mestrado em Ciência da Computação, não tem a finalidade de prover ninguém com informações avançadas sobre Web Mining e sim, mostrar algumas vantagens, escopo e resultados que podem ser obtidos, além de claro, motivar sua pesquisa sobre o assunto.

[ Hits: 29.765 ]

Por: Quintino Izidio dos Santos Neto em 08/09/2006 | Blog: http://www.cnpgc.embrapa.br/~quintino/index.htm


Introdução



Mineração na Web mostra padrões de comportamento no uso da Web, para isso, são aplicadas técnicas de Data Mining no conteúdo Web. A análise pode ser feita sobre páginas visitadas, tempo gasto em cada uma, quais as mais freqüentadas, associações entre páginas e padrões transversos (páginas não ligadas diretamente por Hyperlinks, e sim por meio de outras páginas).

Estão sendo discutidas estratégias para analisar seqüências de páginas para definir comportamento de usuários. Identificar certos tipos de usuários, comparar padrões de compradores e não compradores, identificar diferenças entre usuários visitantes rápidos, usuários investigadores e usuários compradores. O conhecimento obtido com essa investigação pode servir para projetar páginas com o objetivo de maximizar a eficiência de contato com o cliente.

Web Mining é freqüentemente associado com "Recuperação de Informação", mas na verdade trata-se de um processo mais amplo, interdisciplinar, envolvendo técnicas de Recuperação de Informação, estatística, inteligência artificial e mineração de dados.

Em geral, as tarefas principais de Web Mining são as seguintes:
  • Busca de documentos: consiste em se encontrar sites Web contendo documentos especificados por palavras-chave. É o processo de se extrair dados a partir de fontes de textos disponíveis na Internet, tais como conteúdos de textos de documentos HTML obtidos removendo-se as tags HTML, textos extraídos de grupos de discussão, newsletters, etc. Esta tarefa envolve a utilização de técnicas de Recuperação de Informação.
  • Seleção e pré-processamento da informação: consiste em selecionar e pré-processar automaticamente informações obtidas na Internet. O pré-processamento envolve qualquer tipo de transformação da informação obtida na busca, como, por exemplo, corte de textos, transformação da representação da informação em outros formalismos.
  • Generalização: consiste em descobrir automaticamente padrões gerais em sites Web ou entre vários sites Web. Esta tarefa envolve a utilização de técnicas de inteligência artificial e de mineração de dados.
  • Análise: validação e interpretação dos padrões minerados.

Página anterior     Próxima página

Páginas do artigo
   1. Web mining
   2. Introdução
   3. As categorias de Web Mining
   4. Conclusão
Outros artigos deste autor
Nenhum artigo encontrado.
Leitura recomendada

Conhecendo o xHarbour

Tutorial Kettle

Utilizando arquivos Access (.mdb) no seu Linux

O eeePC e o OS/2 Warp

JOINS - Uma introdução a JOINS em bancos de dados de forma didática

  
Comentários
[1] Comentário enviado por thelinux em 08/09/2006 - 19:57h

Nota 10 por estarem compartilhando informacoes.

[2] Comentário enviado por thelinux em 08/09/2006 - 19:58h

E facil da nota baixa e nao se identifica. Nota 10 para o trabalho de voces.

[3] Comentário enviado por removido em 09/09/2006 - 23:41h

Poxa thelinux, um pouco mais de calma. O kra expressou o que ele achou. A vantagem do software livre é justamente a liberdade de expressão. Tenho certeza que o autor não está preocupado com a nota aqui. O importante é compartilhar, se gostarem ou não, não importa.

Nada é tão bom ao ponto de todos gostarem e nem tão ruim ao ponto de ninguém gostar.

Quanto ao artigo, está ótimo. Mesmo não sendo voltado ao linux, foi muito interessante. Este é o primeiro artigo do autor. que já começou muito bem então espero que continue ativamente na comunidade.

[]'s

[4] Comentário enviado por thelinux em 11/09/2006 - 08:18h

Esta é minha opinião. A liberdade realmente é importante e realmente fico chateado quando pessoas dão nota sem se identificar nem justificar. Geralmente estas pessoas não contribuem em nada para o Linux.

fdettoni - sou um cara muito tranquilo.

Mas é isso.

[5] Comentário enviado por fmpfmp em 11/09/2006 - 10:14h

.

[6] Comentário enviado por carlocesar em 12/09/2006 - 09:34h

Parabéns pela iniciativa de compartilhar este tipo de assunto, que por sinal está muito bem explicado!

carlocesar

[7] Comentário enviado por jalexandre em 12/09/2006 - 11:16h

Massa esse artigo. Muito interessante esse tal de Web Mining :)
Parabéns.

[8] Comentário enviado por haduken em 21/05/2009 - 23:51h

excelente artigo sobre web mining, aborda de maneira muito prática o assunto! parabéns!


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts