Otimizando seu web server com Apache2 + Lighttpd

Solução que fez com que o desempenho (velocidade de resposta) do servidor web do Viva o Linux aumentasse em até 8 vezes. O Apache2 possui módulos indispensáveis para servir páginas dinâmicas, enquanto o Lighttpd é imbatível quando se trata de páginas estáticas. Então, por quê não combinar os dois?

[ Hits: 98.129 ]

Por: Fábio Berbert de Paula em 03/09/2009 | Blog: https://youtube.com/c/cotidianohackeado


Controle de cache no cliente: tags expires e etag



Explorar o cache do cliente é uma das chaves para a otimização em sites de grande volume de acesso. Voltando ao exemplo da home do VOL, a mesma possui 27 elementos, sendo 1 dinâmico e 26 estáticos.

Sem nenhuma otimização de configuração, toda vez que um cliente (browser) visitar o site, todos os 27 elementos serão baixados e cada download originará uma conexão direta com o servidor web, o que consome recursos de software e também largura de banda, visto que o download sempre precisa ser realizado novamente, mesmo você sendo visitante reincidente.

Como é sabido, todo browser possui um espaço reservado para cache de páginas de internet e esse cache é diretamente controlado pelas tags de controle de cache informadas pelo site visitado. Sendo assim, por quê não aproveitar o recurso de cache local dos clientes para diminuir a quantidade de acessos ao seu servidor?

Expires

Para explorar tal recurso devemos configurar 2 itens no servidor web. O primeiro é a tag "Expires", que informa ao browser que determinado arquivo é válido por algum período de tempo. A configuração padrão na maioria dos servidores web é de 1 dia, o que considero insuficiente. Com 1 dia de validez, um visitante assíduo de seu site baixará os arquivos estáticos do mesmo 30 vezes por mês. Se você considerar que sua logotipo não muda menos que 1 vez por ano, fazê-lo baixar o mesmo arquivo todos os dias é um baita desperdício.

A configuração que considero ideal para cache de arquivos estáticos é de 1 ano. Mas aí você me pergunta:

"- Se o browser do usuário vai ficar 1 ano usando minha logotipo cacheada em seu disco local, se eu atualizar minha logo, como a mesma atualizará no cache do cliente?"

A solução é simples. Se você atualizar sua logotipo, que no caso se chama logotipo01.png, renomeie o arquivo para logotipo02.png. O primeiro arquivo está em cache, mas o segundo não. Esta solução requer este tipo de sincronia com o webmaster, porém o custo x benefício é grande. Muita banda e recurso economizado para pouco trabalho renomeando arquivos que quase nunca mudam.

Para você entender melhor o conceito da tag Expires, vamos a um exemplo prático, onde baixaremos um arquivo usando o protocolo HTTP na unha:

$ telnet www.vivaolinux.com.br 80
Trying 76.74.248.57...
Connected to vivaolinux.com.br.
Escape character is '^]'.
GET /publico/cache.txt HTTP/1.0
Host: www.vivaolinux.com.br
<Digite enter para gerar uma linha em branco aqui>

HTTP/1.1 200 OK
Date: Thu, 03 Sep 2009 10:01:07 GMT
Server: Apache
Last-Modified: Thu, 03 Sep 2009 09:49:01 GMT
Accept-Ranges: bytes
Content-Length: 43
Expires: Fri, 03 Sep 2010 10:03:24 GMT
Vary: Accept-Encoding
Connection: close
Content-Type: text/plain; charset=ISO-8859-1

Olá, agora este arquivo está no seu cache!
Connection closed by foreign host.

Simulamos, via telnet, a conexão que um browser faz quando é digitada a URL http://www.vivaolinux.com.br/publico/cache.txt. Neste caso os campos Date, Server, Last-Modified, Accept-Ranges, Content-Length, Expires, Vary, Connection e Content-Type correspondem à informações trocadas entre o browser e o servidor, não sendo visíveis na tela do usuário.

No exemplo acima a tag "Expires" informa ao browser que o arquivo cache.txt é válido, por 1 ano, no caso até 3 de setembro de 2010. Sendo assim o browser guarda este arquivo em cache por 1 ano.

Etag

Etag foi uma tag criada para ser a sucessora do Expires. Em breves palavras, ela cria uma assinatura para cada arquivo oferecido pelo servidor ao cliente e esta serve para controle de cache, sobrepondo as informações oferecidas pelo Expires. O Etag não define uma data futura para o vencimento do cache do arquivo, ao invés disso ele faz o servidor web, de tempos em tempos, gerar uma nova assinatura para o arquivo para comparar com a assinatura armazenada pelo browser do cliente.

Resumindo, Etag não colou, mas vem habilitado na configuração padrão da maioria dos servidores web disponíveis. Cabe ao administrador do sistema DESABILITAR o uso de Etag no servidor.

No decorrer do artigo veremos como configurar o Expires e o Etag tanto no Lighttpd quanto no Apache.

Página anterior     Próxima página

Páginas do artigo
   1. Considerações iniciais
   2. Apache2 vs Lighttpd
   3. Controle de cache no cliente: tags expires e etag
   4. Instalando e configurando o Lighttpd
   5. Integrando Apache2 com Lighttpd
   6. Testando a configuração
   7. Resultados e conclusão
Outros artigos deste autor

Transferindo arquivos com o rsync

Criando um contador de downloads com PHP e MySQL

Criando gráficos com a classe JPGraph (parte 2)

VLC, o reprodutor multimídia

Alexa e o ranking dos principais sites Linux da comunidade brasileira

Leitura recomendada

Impressora Lexmark USB no Slackware 10.2

As melhores ferramentas de colaboração para Linux

Instalando o Debian Etch sem o Gnome

Recuperando e/ou adaptando o GRUB do Sabayon Linux

Reduzindo problemas de atualizações no Debian, Ubuntu e derivados

  
Comentários
[1] Comentário enviado por elgio em 03/09/2009 - 12:00h

Muito bom Fábio.

O legal desta tua solução é a comprovação de que as vezes não basta esta ou aquela solução. Em alguns casos se usa AMBAS. O melhor das duas. Muito bom.

[2] Comentário enviado por marcelomortificy em 03/09/2009 - 12:11h

Muito bom!!!!


Parabéns Fábio.

[3] Comentário enviado por marcelomendes em 03/09/2009 - 12:15h

Muito bom Fábio, parabéns!

[4] Comentário enviado por TheHawk em 03/09/2009 - 13:13h

Geralmente não comento muito aqui no VOL..... mas essa aqui eu fiz questão de deixar o comentario.... tá de parabens.... muito boa solução, otimizou bem o negocio.... trabalho com provedor wireless e aqui estou usando o ThunderCache, quando estava usando o apache para servidor os arquivos para o thunder estava tendo uma lentidão terrivel.... depois de mudar o servidor web parea o lighttpd foi dá agua para o vinho, extremamente rapido e leve.... o light é otimo...... mais uma vez parabens pela solução, até mais.

[5] Comentário enviado por cesar em 03/09/2009 - 13:45h

Boa!

[]'s

[6] Comentário enviado por cleberjsantos em 03/09/2009 - 13:59h

Opa Fábio,

Boa.... ;) E então, eu estava testando o Light também, mas me deparei com alguns problemas, talvez por ainda não o conhecer diretamente claro! Mas a idéia era basicamente abandonar o Apache e partir para a combinação Lighttpd + Varnish, hoje uso Apache + Varnish, no qual já dá um adianto tremendo, então imagina o Light + Varnish ;)

Bem, vou documentar minha experiência, e com base nela fazer um How-to aqui também, neste caso estou falando de usar Zope/Plone com Light + Varnish, se depois desejar podemos trocar figurinhas quanto a otimizações ;)

Cleber J Santos
www.cleberjsantos.com.br

[7] Comentário enviado por foguinho.peruca em 03/09/2009 - 18:09h

Olá!

Boa solução! Vou tentar implementar uma semalhante, porém eu o uso a combinação do tomcat (para o java) + apache (redirecionamento na rede). acho que vou dividir a carga do tomcat com o lighttpd e ver no que da... ^^''

Jeff

[8] Comentário enviado por removido em 03/09/2009 - 21:03h

Parabéns chefito.... Será que seu trabalho vai ganhar uma camiseta redbul ?????
rs...rs...rs...rs...

[9] Comentário enviado por isaque_alves em 03/09/2009 - 23:09h

Cara, essa solução é perfeita...
vo testar assim que chegar em casa no meu servidor de testes e demonstações...
valeu por compartilhar o conhecimento!!
E é isso!!

Viva o Software Livre!!!
Viva o Linux!!

[10] Comentário enviado por maran em 04/09/2009 - 12:30h

Show!

[11] Comentário enviado por junior em 04/09/2009 - 15:55h

Já dizia o poeta: Fodástico!

[12] Comentário enviado por pinduvoz em 04/09/2009 - 21:30h

O site realmente ganhou agilidade.

Parabéns!

[13] Comentário enviado por pedro-filho em 06/09/2009 - 02:56h

tem como configurar o expires no squid ?????

obrigado....

[14] Comentário enviado por reideer em 07/09/2009 - 21:40h

Boa noite.
Eu já testei esta solução a algum tempo, porém precisava de virtualhosts e mais algumas coisas, no final das contas se tornou inviável.

Gostaria de Saber se o Vol utiliza algum sistema de Cache, e qual?

[15] Comentário enviado por franciscosouza em 09/09/2009 - 08:16h

Sensacional, parabéns pelo artigo! ;D

[16] Comentário enviado por removido em 09/09/2009 - 20:31h

Boa noite.

Fábio, você poderia corrigir o exemplo de integração do Apache com Lighttpd na 'Versão para impressora'. O exemplo de configuração para integrar os dois Web Server é exibido da seguinte forma:

<img src="http://img.vivaolinux.com.br/imagens/logotipo01.png">
Para:
<img src="http://img.vivaolinux.com.br/imagens/logotipo01.png">

Deveria ser:

<img src="/imagens/logotipo01.png">
Para:
<img src="http://img.vivaolinux.com.br/imagens/logotipo01.png">



[17] Comentário enviado por guilhermecunha em 10/09/2009 - 08:43h

Muito legal, concerteza me lembrarei deste artigo quando administrar um site com muitos acessos...

Abraço!

Guilherme Cunha
http://www.guilhermecunha.com.br

[18] Comentário enviado por removido em 20/11/2009 - 15:59h

Fabio,

Estou com a seguinte situação e gostaria de uma opinião sua.

o hardware é o seguinte.

DELL 1950

2 processadores quadcore e 8gb de RAM
2 discos SAS em RAID 1

o sistema que esta hospedado nele é TOMCAT e POSTGRES 8.3. O Load average dele é de uma média de 3.5 a 4, tenho uma média de 250 conexões simultãneas e acho que esta ficando cada vez mais lento.

Tentei uma solução de proxy reverso com o apache mais a aplicação fica com problemas no jsession, ai vem a minha pergunta se eu colocasse o lighttpd na frente junto com o apache para separar o conteudo statico melhoraria????

abraços

Filipe Mendonça

[19] Comentário enviado por removido em 20/11/2009 - 20:25h

Ótimo artigo Fábio.
Intressante essa implementação para o site.

[]'s

[20] Comentário enviado por fabio em 21/11/2009 - 22:26h

Olá Filipe,

No caso você não precisaria do Apache, apenas o Lighttpd com Tomcat.

Alguma processo está pesando demais aí, essa máquina não pode ter 3/4 de load com apenas 250 acessos simultâneos.

PS: O Tomcat por natureza é lento e consome muito hardware, pelo menos era assim quando o utilizei a 4 ou 5 anos atrás, não sei como é agora.

Um abraço.

[21] Comentário enviado por Holmes em 16/12/2009 - 22:08h

muito interessante, vlw, Placebo..............gostei das informações...........

[22] Comentário enviado por ferreirajr630 em 26/01/2010 - 09:14h

Paraben otimo mas otimo mesmo esse artigo esparo que venha mas artigos na mesma categoria de melhoria de navegação

[23] Comentário enviado por dolivervl em 09/03/2010 - 20:05h

Muito bom mesmo, Parabéns !!!

[24] Comentário enviado por elderjmp em 30/08/2010 - 00:12h

Fábio,

Parabéns pelo artigo, muito bom.

Pq usar o mod_proxy do Apache para direcionar as requisições de conteúdo estático ao invés de requisitar diretamente ao Lighttpd, passando o caminho na porta 81, no arquivo index.php (<img src="http://img.vivaolinux.com.br:81/imagens/logotipo01.png">)?

E usando o Debian aqui, ocorreu o erro "client denied by server configuration: proxy:http://...". O mod_proxy só funcionou depois de habilitar no arquivo /etc/apache2/mods-available/proxy.conf a diretiva "Allow from all" (Default é "Deny for all"). Algum problema em permitir para todos?

Abraço

[25] Comentário enviado por fabio em 30/08/2010 - 00:34h

Olá Elder,

Passar o caminho diretamente no código-fonte ao invés de usar o mod_proxy é viável quando seu site é composto por apenas alguns arquivos, mas no caso do VOL, ele possui milhares de links, então é mais fácil alterar somente o apache.conf a centenas de arquivos.

O allow from all é tranquilo de usar, mas sugiro que dê um options -indexes para evitar que possam acessar a lista de arquivos dos diretórios.

[]'s

[26] Comentário enviado por julianjedi em 16/09/2010 - 13:02h

Nossa .. muito bom mesmo fabio, quando li no excerpt do artigo pensei ateh q vc ia fazer um monte de remendo ... mas ficou muito simples de entender e os resultados foram sensacionais ... com certeza é uma grande contribuição para a comunidade...

Já dizia o poeta: Fodástico![1]

[27] Comentário enviado por dolivervl em 08/10/2010 - 23:57h

Fábio uma coisa que quero saber de vc é o seguinte, compactação com o apache, já usou ? qual sua opnião sobre isso? Uso no proxy onde trabalho e reduziou e muito o consumo de banda e não aumento consideravelmente o uso de CPU do servidor proxy.

[28] Comentário enviado por removido em 09/11/2010 - 08:35h

Sabia que o IIS da o mesmo problema e que é ainda pior que no apache?

[29] Comentário enviado por qxada07 em 24/03/2011 - 09:13h

Um artigo muito bom... Parabéns.....

Sempre achei o Apache muuuuito ferrado porém estes 2 integrados não tem para ninguém....

[30] Comentário enviado por SmasherBomb em 10/04/2011 - 13:43h

Parabéns...artigo muito bom !!

[31] Comentário enviado por fabgcruz em 15/04/2011 - 09:15h

Muito bacana o artigo .... maravilha !

[32] Comentário enviado por ederrb em 06/05/2011 - 11:17h

Fábio(e quem mais puder ajudar), tenho exatamente essa máquina: Intel Xeon E3110 Woldfale (2 cores x 3.0 GHz), 8GB Ram e 1,5TB de disco. Nessa maquina rodo um servidor de armazenamento de áudio(tal como o 4shared) sendo que com algumas implementações a mais e alguns diferenciais(vide www.suamusica.com.br ). Na hora do pico chega a ter mais de 200 downloads simultaneos. Estes downloads são feitos através de readfile() no php(principalmente para que os visitantes não tenham conhecimento sobre o caminho dos arquivos p/ download). Isso deixa a máquina arrastando-se, já cheguei a registrar load de 95 e a solução que vi foi reiniciar o httpd acarretando na perda de todas as conexões, caso eu não restarte o httpd a maquina trava geral. Ouvi dizer que o lighthttpd tem uma extensão X-LIGHTTPD-send-file que dispensaria o uso de readfile(), assim o php nao faria o trabalho de "soltar o download na tela" e pelo que vejo nos processos é justamente ele quem está consumindo todo o hardware da maquina. Pela sua experiência, seria viável instalar o lighthttpd com essa configuração passada por você + essa extensão? Tentei usar a extensão na minha configuração atual com apache mas nao obtive êxito. Desculpe-me pelo texto demasiado longo, vi aqui uma oportunidade de resolver este problema que vem persistindo há quase um mes. Agradeço desde já ! Abraços.

[33] Comentário enviado por samuelspsd em 16/01/2012 - 17:24h

Eu teria algumas dúvidas em relação a este artigo, ainda está aberto para discussão? Obrigado.


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner
Linux banner
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts