Ce contenu est traduit automatiquement. Veuillez consulter la Clause de non-responsabilité relative à la traduction automatique.
Overschakelen naar Engels

What is split-brain and how do I recover?
Qu'est-ce que le split-brain et comment puis-je récupérer ?


Date de la dernière modification : 2025-05-28

Produits Applicables

  • QuTS hero h5.3.0 or later
  • High Availability Manager 1.0 or later

Définition et Cause

Dans un Cluster à haute disponibilité (HA), split-brain se produit lorsque les deux nœuds perdent la communication entre eux mais restent opérationnels indépendamment, et les deux nœuds ont assumé le rôle de nœud actif. Cela peut entraîner une incohérence des données ou une corruption des Stockage partagés, car chaque nœud peut tenter de prendre le contrôle des ressources partagées simultanément.

Les causes courantes de split-brain incluent :

  • Déconnexion réseau entre les nœuds dans le Cluster
  • Défaillance de la connexion de heartbeat
  • Chemins réseau instables ou incohérents

Solution

  1. Réparez la connexion réseau entre les nœuds.
    Vérifiez d'abord et rétablissez la connexion réseau entre les deux nœuds (par exemple, la connexion de heartbeat, les commutateurs, les paramètres réseau).
    Ce n'est qu'après le rétablissement de la connexion que le système peut procéder à la vérification de l'état du Cluster.
  2. Laissez le système détecter automatiquement l'état de split-brain.
    1. Une fois que les nœuds rétablissent la communication, le système échange des informations d'état entre les deux nœuds. 
    2. Si les deux nœuds ont assumé le rôle de nœud actif, le système l'identifie comme une condition de split-brain.
    3. Pour éviter la corruption des données, le système arrête la plupart des services (tels que SMB, iSCSI) et affiche un message d'erreur indiquant qu'un split-brain s'est produit.
  3. Récupérer du split-brain via High Availability Manager.
    1. Ouvrez High Availability Manager.
    2. Cliquez sur Récupérer du Split-Brain pour lancer l'assistant de récupération.
      Dans l'assistant, vous pouvez choisir l'une des options de récupération suivantes :
      • Option 1 : Conserver les données sur un seul nœud
        Sélectionnez le nœud à conserver, et l'autre nœud sera effacé et réinitialisé en tant que nœud passif. Le système resynchronisera ensuite le Cluster HA.
        Cette option est appropriée lorsque vous savez clairement quel nœud a les données correctes et que vous souhaitez restaurer rapidement le Cluster.
      • Option 2 : Conserver les données sur les deux nœuds
        Si les deux nœuds contiennent des données importantes, le système permet à un nœud de reprendre les services en premier, tandis que l'autre nœud est retiré du Cluster.
        Après avoir vérifié et concilié les données, vous pouvez réintégrer manuellement le nœud retiré au Cluster.
  4. Optionnel : Minimisez les futurs split-brain en activant un serveur de quorum.
    Si les nœuds se déconnectent l'un de l'autre mais restent connectés au réseau, un serveur de quorum peut toujours surveiller les nœuds individuels et relayer leurs statuts entre eux. Cela aide à réduire le risque de split-brain.
    Vous pouvez configurer un serveur de quorum en allant à High Availability Manager > Paramètres > Politique Basculement > Serveur de Quorum.

Lectures Complémentaires

Est-ce que cet article a été utile ?

Merci pour votre commentaire.

Veuillez nous indiquer comment améliorer cet article :

Si vous souhaitez fournir un commentaire supplémentaire, veuillez l’inclure ci-dessous.

Choisissez une spécification

      En voir davantage Moins

      Ce site est disponible dans d'autres pays/régions :

      open menu
      back to top