Instalando e configurando um sistema RAID 1 no Debian Lenny

Recentemente houve a necessidade de montar em meu setor de trabalho um sistema com redundância contra falhas. Pesquisando sobre o assunto, resolvemos que a alternativa para solucionar nosso problema poderia ser um RAID 1. Depois de feito, testado e documentado, resolvi compartilhar com a comunidade a minha experiência

[ Hits: 119.608 ]

Por: hermes nunes pereira junior em 24/09/2010


Configurando o novo Grub



O menu.lst foi (re)criado em /boot/grub, mas ele ainda está sem indicar que o sistema é um RAID, o parâmetro root ainda está apontando para o sda1, lugar onde originalmente está o /boot.

É necessário alterar este parâmetro para que se um dos HDs falhar, na hora do próximo boot ele assuma que o outro HD é o principal.

Para editar:

# vim /boot/grub/menu.lst

Na linha:

kernel          /boot/vmlinuz-2.6.26-2-686 root=/dev/sda1 ro quiet

Troque para:

kernel          /boot/vmlinuz-2.6.26-2-686 root=/dev/md0 ro

Obs.: A versão do kernel poderá ser diferente na versão do Linux instalado.

O /dev/md0 é a primeira posição do array criado pelo mdadm, usando o /dev/sda1 e /dev/sdb1.

Depois destas configurações, o sistema está pronto para suportar uma eventual falha de um dos HDs.

Verificando e testando o sistema na ocorrência de falhas

O sistema está atualizado e funcionando, mas precisamos fazer uma simulação real de um HD queimado. Podemos retirar um dos HDs e reiniciar o sistema ou usar o mdadm para simular o erro.

Utilizando o mdadm:

# mdadm --manage --set-fault /dev/md1 /dev/sdb5

Este comando fará com que o segundo disco (/dev/sdb5), primeira partição, que está no array md0 pare de funcionar.

Os parâmetros:
  • --manage - chama o módulo de gerência
  • /dev/md0 - primeiro dispositivo RAID
  • /dev/sdb5 - partição lógica no segundo HD

Este comando "danificou" o array /dev/md1. Para verificar o erro digite:

# mdadm --detail /dev/md1

No final da listagem aparecerá:

NumberMajorMinorRaidDeviceState
0850Active sync /dev/sda5
1001Removed
2821-Fault spare /dev/sdb5


O sistema está com um "crash". Segundo o comando, o /dev/sdb5 foi removido do RAID.

O /proc/mdstat dará a mesma informação:

md1: active raid1 sdb5[2] (F) sdb5[0]

O (F) é a indicação de fault.

Corrigindo o problema

Vimos que o /dev/md1 /dev/sdb5 está danificado. Poderia ser um erro por causa de um erro físico no HD, ou mesmo um HD queimado.

Se for um HD com problemas físicos, a primeira coisa a ser feita é colocar outro HD no lugar.

Depois é necessário remover do RAID as partições que estão no array para depois adicioná-las novamente.

Para remover:

# mdadm /dev/md1 -r /dev/sdb5

Supondo que o HD pifou de vez e tenha que colocar outro, a melhor alternativa é colocar um HD igual ao primeiro, mas não é a única chance do RAID funcionar, o fundamental é que as partições tenham o mesmo tamanho.

Para colocar o novo HD fazendo o RAID, basta seguir os passos a partir do item COPIANDO A TABELA DE PARTICIONAMENTO e seguir até o final.

Considerações finais

Esta solução é uma boa alternativa para dar uma segurança ao sistema em caso de falhas. Mas é bom lembrar que o RAID não é backup. Um backup sempre é importante, mesmo em sistemas RAID.

Página anterior    

Páginas do artigo
   1. Introdução
   2. Tipos de RAID
   3. Montando o sistema RAID
   4. Copiando a tabela de particionamento
   5. Criando o primeiro dispositivo md0
   6. Criando o sistema de arquivos das partições RAID
   7. Criando o sistema de arquivos das partições RAID - cont
   8. Adicionando o primeiro HD ao RAID 1
   9. Configurando o novo Grub
Outros artigos deste autor

Instalando o CMS Joomla

O fantástico mundo dos instrumentos MIDI (parte 1)

Uma breve introdução ao Audacity

Usando o NIS/NFS como ferramentas de centralização de controle de rede

Criando um mirror do Conectiva para uma rede interna

Leitura recomendada

Configuração do Shaperd no Debian Lenny

Asterisk realtime e Trunk

Instalando e desmistificando o Debian

Configurando um servidor de email com Postfix, MySQL, SASL, MailScanner e MailWatch no CentOS 4.2

Configuração de rede no AIX IBM

  
Comentários
[1] Comentário enviado por pherde em 24/09/2010 - 14:46h

Po...... muito bom o artigo, muito bem detalhado....

[2] Comentário enviado por removido em 26/09/2010 - 17:36h

Hermes Nunes Pereira Júnior:

you broke the balloon's mouth with your article. It's very well written. Congratulations!
10!

[3] Comentário enviado por obernan em 27/11/2010 - 17:09h

Muito obrigado pela contribuicao, esse seu tutorial e muito importante, ja copiei e gravai na minha pasta de tutos importates !!!!
Mas uma vez muito obrigado pela contribuicao.
Abraço

[4] Comentário enviado por tihbaptista em 28/11/2010 - 23:36h

Sempre quando eu tento executar esse comando mdadm /dev/md2 -a /dev/sda6 diz que o device esta ocuado. É o device responsavel pelo swap, tem alguma ideia do que pode ser?

[5] Comentário enviado por aj.vini em 12/01/2011 - 15:15h

@tihbaptista

Seu swap está ativado? Se sim, desative-o com o swapoff /dev/sda6 antes de executar o comando.

[6] Comentário enviado por moliveira777 em 13/08/2011 - 22:44h

Boa noite,

Parabéns pelo artigo, mas fiquei com uma dúvida, os comandos abaixo são no HD master(sda) ou slave(sdb) ?

# cd /mnt
# mkdir raiz
# mount -t ext3 /dev/md0 raiz
# cd raiz
# mkdir initrd mnt proc sys
# cp -a /boot /bin /cdrom /dev /etc /initrd.img /lib /media ./
# cp -a /opt /root /sbin /selinux /srv /tmp /usr /var /vmlinuz ./


[7] Comentário enviado por alexandre.unix em 21/10/2011 - 12:35h

bom dia, esse tutorial não está funcionando, quando configuro conforme abaixo
As alterações ocorreram nas linhas:

root (hd1,0)
kernel /vmlinuz-2.6.24-1-686 root=/dev/md0 ro

Esta alteração vai fazer com que o sistema dê o boot pelo /dev/md0, a partição raiz, mas no segundo HD, o hd1,0.

o linux não carrega mais ai reinstalei novamente e pulei essa parte e continuo, só que quando chegar para atribuir os discos sda1 e os outros ele não deixa fala que está ocupado, teria como alguém me ajudar ?

[8] Comentário enviado por alexandre.unix em 21/10/2011 - 15:05h

Seguam esse tutorial que funciona.
Raid1 instalando o sistema do zero...
Testei todos os passos ,funciona perfeitamente.
Testei também o desastre com os 2 discos, uma de casa vez, dei o restore e funcionou perfeitamente.


http://translate.google.com.br/translate?hl=pt-BR&sl=en&u=http://mikeoverip.wordpress.com/2009/12/07...


Abraços...

[9] Comentário enviado por minduim em 29/01/2012 - 21:11h

Por favor alguem poderia me ajudar? Não consigo com que o Ubuntu 11.10 de boot com RAD1 no segundo HD.
Aproposito parabéns pelo artigo.

http://www.vivaolinux.com.br/topico/GRUB/Ubuntu-1110-Raid1-via-software-nao-funciona


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor HostGator.
Linux banner
Linux banner
Linux banner

Artigos

Dicas

Viva o Android

Tópicos

Top 10 do mês

Scripts