Vad är split-brain och hur återhämtar jag mig?
Tillämpliga produkter
- QuTS hero h5.3.0 or later
- High Availability Manager 1.0 or later
Definition och orsak
I en hög tillgänglighet (HA) Kluster,split-braininträffar när båda noderna förlorar kommunikation med varandra men förblir operativa oberoende, ochbåda noderna har antagit rollen som aktiv nod.Detta kan orsaka datainkonsekvens eller korrupt delad Lagring, eftersom varje nod kan försöka ta kontroll över delade resurser samtidigt.
Vanliga orsaker till split-brain inkluderar:
- Nätverksavbrott mellan noderna i Kluster
- Fel på hjärtslagsanslutningen
- Ostabila eller inkonsekventa nätverksvägar
Lösning
- Åtgärda nätverksanslutningen mellan noderna.
Kontrollera först och återställ nätverksanslutningen mellan de två noderna (till exempel hjärtslagsanslutningen, switchar, nätverksinställningar).
Endast efter att anslutningen har återställts kan systemet fortsätta att verifiera Kluster status. - Låt systemet automatiskt upptäcka split-brain status.
- När noderna återupprättar kommunikation, utbyter systemet statusinformation mellan de två noderna.
- Om båda noderna har antagit rollen som aktiv nod, identifierar systemet det som ett split-brain tillstånd.
- För att förhindra datakorruption, stoppar systemet de flesta tjänster (såsom SMB, iSCSI) och visar ett felmeddelande som indikerar att split-brain har inträffat.
- Återställ från split-brain via High Availability Manager.
- Öppna High Availability Manager.
- Klicka Återställ från Split-Brain för att starta återställningsguiden.
I guiden kan du välja ett av följande återställningsalternativ:- Alternativ 1: Bevara data på endast en nod
Välj noden att behålla, och den andra noden kommer att raderas och återställas som passiv nod. Systemet kommer sedan att synkronisera HA Kluster.
Detta alternativ är lämpligt när du tydligt vet vilken nod som har korrekt data och vill återställa Kluster snabbt. - Alternativ 2: Bevara data på båda noderna
Om båda noderna innehåller viktig data, tillåter systemet en nod att återuppta tjänster först, medan den andra noden tas bort från Kluster.
Efter att ha verifierat och försonat data, kan du manuellt återansluta den borttagna noden till Kluster.
- Alternativ 1: Bevara data på endast en nod
- Valfritt: Minimera framtida split-brain genom att aktivera en quorum-server.
Om noderna kopplas bort från varandra men förblir anslutna till nätverket, kan en quorum-server fortfarande övervaka de individuella noderna och förmedla deras status med varandra. Detta hjälper till att minska risken för split-brain.
Du kan konfigurera en quorum-server genom att gå till High Availability Manager > Inställningar > Redundans Policy > Quorum Server.