Auteur :
• 25 septembre 2010
closeCet article a été publié il y a 6 ans 2 mois 16 jours, il est donc possible qu’il ne soit plus à jour. Les informations proposées sont donc peut-être expirées.

Un disque

Plus tôt cette semaine, je publiais un billet concernant l’installation d’un RAID logiciel (RAID 1) dans une Ubuntu 10.04.1 server. Sans vouloir revenir sur la définition d’un RAID 1, rappelons simplement que cette solution permet une redondance des données en disques en miroir et peut tolérer la panne d’un disque.

En fin de billet, je précisais qu’une prochaine étape serait les procédures à suivre dans le cas de la panne d’un disque, ce billet d’aujourd’hui en discutera donc.

Tout d’abord, précisons que la configuration proposée dans le billet précédant comporte une lacune majeure (voir la discussion à la fin du billet) compliquant grandement la récupération des données. En effet, puisque la partition boot (nécessaire au démarrage) n’est présente que sur le premier disque, la perte du second disque est facilement récupérable, le système pouvant quand même démarrer. Alors que la panne du premier disque empercherait le système de démarrer.

J’ai donc réinstallé mon serveur en partitionnant (2 partitions par disque) mes deux disques de manière identique (une autre possibilité est d’avoir une seule partition par disque, un seul raid sur lequel nous pouvons appliquer un LVM, mais je n’ai pas retenu cette solution pour ce billet).

Pour ensuite créer deux périphériques multidisques.
Identiques aux partitions physiques, RAID no 0 (/dev/md0) et RAID no 1 (/dev/md1)

Pour ensuite créer sur ces deux partitions, le swap et la partition racine en ext4.

Et poursuivre l’installation normalement.

Lorsque l’installation est terminée et que vous êtes authentifié dans le système, il est possible de vérifier l’état du RAID en tapant pour le premier périphérique:

sudo mdadm --detail /dev/md0

et pour le second périphérique:

sudo mdadm --detail /dev/md1

La panne

Pour simuler la panne d’un disque, je l’ai carrément déconnecté un disque du système. Au démarrage, le système détecte l’anomalie et nous demande si l’on veut démarrer en mode dégradé (toute nouvelle défaillance entrainant la perte de données).

On peut s’en assurer une fois dans le système en tapant :

sudo mdadm --detail /dev/md1

Supposons que nous avions mis au démarrage un nouveau disque de remplacement. Avant son installation, nous devons nous assurer que notre celui-ci est partitionné de façon identique. On suppose que sda est le disque fonctionnant normalement et sdb le nouveau disque. On enregistre les informations de partitions.

sudo sfdisk -d /dev/sda > sda.bak

Et on les applique au disque sdb.

sudo sfdisk /dev/sdb < sda.bak

Reste à ajouter ce nouveau disque à notre RAID

sudo mdadm --manage /dev/md0 --add /dev/sdb1
sudo mdadm --manage /dev/md1 --add /dev/sdb2

On peut vérifier la reconstruction en tapant :

sudo mdadm --detail /dev/md0
sudo mdadm --detail /dev/md1

Pour le monitorage, je n’ai pas vraiment exploré mdadm, mais j’ai remarqué que dans Webmin il i y a un module qui permet de recevoir un courriel en cas de défaillance

Be Sociable, Share!
Vous pouvez suivre toutes les réponses à à ce billet via le flux RSS 2.0. Les commentaires et la notification par ping sont désactivés.

14 réponses

  1. #technos ProfNoel : RAID logiciel dans une Ubuntu 10.04.1 server (2). http://ow.ly/19a4kX

  2. 2
    Indyana 
    Firefox 3.6.10 Ubuntu 10.04

    Bonjour,
    J’ai également récupéré quelques vieux disques 10/20Go, et j’en ai profité pour faire un petit NAS, grâce à Freenas, celui ci gère très bien le RAID. Il m’a parut plus simple que Ubuntu et pour le coup, beaucoup plus complet.

    http://freenas.org/doku.php

  3. 3
    Pierre 
    Firefox 3.6.10.NETCLR3.5.30729ZarafaCheck Windows XP

    Super, merci pour ce second article, qui me semble combler les lacunes du premier article.

    L’exercice que tu as fait va mettre très utile et je vais le mettre en application tout prochainement.

    Continue à nous livrer de tels billets, ils sont très bien.
    Pierre

  4. //Cybercarnet du ProfNoël » Archives du Blog » RAID logiciel dans une Ubuntu 10.04.1 server (2). http://t.co/3yF24Lw

  5. 5
    LePirlouit 
    Chrome 6.0.472.63 Windows XP

    article très complet.

    il manque juste le monitoring du recovery avec la commande

    cat /proc/mdstat

    on peut y voir l’vencée de la reconstruction, ainsi que la vitesse et le temps restant.

  6. Salut,

    Moi j’avais installé mon serveur avec un RAID1 il y a maintenant 2 ans et il tourne toujours sans problème. En lisant ton article je me suis dit que je pourrais, par curiosité, aller jeter un coup d’oeil et voici ce que je peux lire :
    —-
    13:36 spl@marshall ~% sudo mdadm –detail /dev/md0
    /dev/md0:
    Version : 00.90.03
    Creation Time : Wed Aug 6 17:43:18 2008
    Raid Level : raid1
    Array Size : 14651200 (13.97 GiB 15.00 GB)
    Used Dev Size : 14651200 (13.97 GiB 15.00 GB)
    Raid Devices : 2
    Total Devices : 1
    Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Mon Sep 27 13:37:02 2010
    State : active, degraded
    Active Devices : 1
    Working Devices : 1
    Failed Devices : 0
    Spare Devices : 0

    UUID : 366b30bb:525392dc:3ae1e9e5:6db1d9f7
    Events : 0.2028081

    Number Major Minor RaidDevice State
    0 0 0 0 removed
    1 8 19 1 active sync /dev/sdb3

    13:37 spl@marshall ~% sudo mdadm –detail /dev/md1
    /dev/md1:
    Version : 00.90.03
    Creation Time : Wed Aug 6 17:43:51 2008
    Raid Level : raid1
    Array Size : 960148736 (915.67 GiB 983.19 GB)
    Used Dev Size : 960148736 (915.67 GiB 983.19 GB)
    Raid Devices : 2
    Total Devices : 1
    Preferred Minor : 1
    Persistence : Superblock is persistent

    Update Time : Mon Sep 27 13:17:58 2010
    State : clean, degraded
    Active Devices : 1
    Working Devices : 1
    Failed Devices : 0
    Spare Devices : 0

    UUID : 9cad24ee:3c568f11:7b22aac7:96afa701
    Events : 0.88682

    Number Major Minor RaidDevice State
    0 8 4 0 active sync /dev/sda4
    1 0 0 1 removed

    —-
    Est-ce que quelqu’un peut m’aider à interpréter le « active, degraded » du premier et « clean, degraded » du second?

  7. 7
    FiFi 
    Firefox 3.5.8 Linux

    c’est indiqué en bas (bien que cat /proc/mdstat soit plus clair à ce niveau)

    pour /dev/md0
    0 0 0 0 removed
    1 8 19 1 active sync /dev/sdb3

    pour /dev/md1
    0 8 4 0 active sync /dev/sda4
    1 0 0 1 removed

    donc en gros, le raid ne tourne déjà plus que sur une patte, en pas la même des deux côtés. Il faudrait regarder les logs pour la raison de cette situation (mais si aucun monitoring n’a jamais été fait, c’est déjà mal parti). Je conseille vivement un backup avant de tenter un rebuild et regarder si le problème persiste. Si c’est le cas, et que aussi bien sda que sdb provoquent des erreurs, alors il est temps de changer de disques.

    Pour info:
    – règle 1: le raid, n’est pas du backup
    – règle 2: il faut monitorer ses array, sinon ça ne sert à rien sinon au mieux à retarder l’échéance fatale

    PS à l’auteur, mettre la swap en raid0 c’est pas génial pour la dispo générale du système, le moindre process swapé va se crasher au « retour de swap » en cas de panne d’un des disques de l’array

  8. 8
    FiFi 
    Firefox 3.5.8 Linux

    j’avais oublié, pour le monitoring, normalement mdadm fait ça très bien
    pour Debian il y a d’ailleurs en plus un cronjob qui reconstruit tous les array le premier dimanche de chaque mois. Pas très écolo ni économe, mais ça permet en partie de provoquer les problèmes sur un membre de l’array avant qu’il ne vraiment soit trop tard.

    pour la notif par email via mdadm, s’assurer que mdadm tourne en mode monitor et régler une adresse mail après MAILADDR dans le fichier de config /etc/mdadm/mdadm.conf (man mdadm.conf pour les curieux), et pas oublier de configurer son MTA favori

  9. 9
    Éric Noël 
    Firefox 3.6.10 Ubuntu 10.04

    @FiFi Que suggères-tu pour le partitionnement du swap ?

  10. 10
    FiFi 
    Firefox 3.5.8 Linux

    pour le swap du raid1 sera très bien aussi, bonne disponibilité avec un gain en lecture, généralement le plus intéressant pour ramener un process de la swap dans la ram

  11. 11
    Éric Noël 
    Firefox 3.6.10 Ubuntu 10.04

    @FiFi Ok je comprends ton intervention, les deux RAID son bel et bien en RAID 1. C’est la page de partition (le seconde saisie d’écran) qui utilise la dénomination RAID no 0 (/dev/md0) et RAID no 1 (/dev/md1)…

  12. 12
    Alfred 
    Firefox 3.6.10GTB7.1.NETCLR3.5.30729 Windows XP

    Vraiment sympa post sur l’installation d’un logiciel de RAID (RAID 1) dans un serveur Ubuntu 10.04.1 qui fournit des informations parctical aussi. lors de la recherche pour ça je suis allée sur un site qui offre divers outils de récupération de données.

  13. 13
    Mark 
    Firefox 3.6.10GTB7.1.NETCLR3.5.30729 Windows XP

    Bonjour,

    post merveilleux. J’étais à la recherche pour la récupération de données, mais aussi de ses ressources d’information. certaines sources de récupération de données sont

    http://www.rsedata.fr/

     
     
     

  14. 14
    FiFi 
    Firefox 3.5.8 Linux

    @Éric Noël: effectivement, désolé, j’ai louché au moment de lire l’information
    beer_count++ pour moi