Hvad er split-brain, og hvordan gendanner jeg det?
Anvendelige Produkter
- QuTS hero h5.3.0 or later
- High Availability Manager 1.0 or later
Definition og Årsag
I en høj-tilgængelighed (HA) Klynge, split-brain opstår, når begge noder mister kommunikation med hinanden, men forbliver operationelle uafhængigt, og begge noder har antaget rollen som aktiv node. Dette kan forårsage datainkonsistens eller korrupte delte Lager, fordi hver node kan forsøge at tage kontrol over delte ressourcer samtidig.
Almindelige årsager til split-brain inkluderer:
- Netværksafbrydelse mellem noderne i Klynge
- Fejl i heartbeat-forbindelsen
- Ustabile eller inkonsistente netværksstier
Løsning
- Fix netværksforbindelsen mellem noderne.
Kontroller og gendan først netværksforbindelsen mellem de to noder (for eksempel heartbeat-forbindelsen, switches, netværksindstillinger).
Kun efter forbindelsen er gendannet kan systemet fortsætte med at verificere Klynge status. - Lad systemet automatisk detektere split-brain status.
- Når noderne genopretter kommunikation, udveksler systemet statusinformation mellem de to noder.
- Hvis begge noder har antaget rollen som aktiv node, identificerer systemet det som en split-brain tilstand.
- For at forhindre datakorruption stopper systemet de fleste tjenester (såsom SMB, iSCSI) og viser en fejlmeddelelse, der angiver, at split-brain er opstået.
- Gendan fra split-brain via High Availability Manager.
- Åbn High Availability Manager.
- Klik Gendan fra Split-Brain for at starte gendannelsesguiden.
I guiden kan du vælge en af følgende gendannelsesmuligheder:- Mulighed 1: Bevar data på kun én node
Vælg den node, der skal bevares, og den anden node vil blive slettet og nulstillet som den passive node. Systemet vil derefter resynkronisere HA Klynge.
Denne mulighed er passende, når du klart ved, hvilken node der har de korrekte data og ønsker at gendanne Klynge hurtigt. - Mulighed 2: Bevar data på begge noder
Hvis begge noder indeholder vigtige data, tillader systemet, at én node genoptager tjenester først, mens den anden node fjernes fra Klynge.
Efter verifikation og afstemning af data kan du manuelt genindtræde den fjernede node til Klynge.
- Mulighed 1: Bevar data på kun én node
- Valgfrit: Minimer fremtidig split-brain ved at aktivere en quorum-server.
Hvis noderne afbrydes fra hinanden, men forbliver forbundet til netværket, kan en quorum-server stadig overvåge de enkelte noder og videresende deres status til hinanden. Dette hjælper med at reducere chancen for split-brain.
Du kan konfigurere en quorum-server ved at gå til High Availability Manager > Indstillinger > Failover Politik > Quorum Server.