Mi az a split-brain, és hogyan tudom helyreállítani?
Alkalmazható termékek
- QuTS hero h5.3.0 or later
- High Availability Manager 1.0 or later
Meghatározás és ok
Egy magas rendelkezésre állású (HA) Klaszter esetén, split-brain akkor fordul elő, amikor mindkét csomópont elveszíti a kommunikációt egymással, de függetlenül működőképes marad, és mindkét csomópont átvette az aktív csomópont szerepét. Ez adatinkonzisztenciát vagy sérült megosztott Tárhely-t okozhat, mert mindkét csomópont megpróbálhatja egyszerre irányítani a megosztott erőforrásokat.
A split-brain gyakori okai közé tartozik:
- Hálózati kapcsolat megszakadása a Klaszter csomópontjai között
- A heartbeat kapcsolat meghibásodása
- Instabil vagy következetlen hálózati útvonalak
Megoldás
- Javítsa a hálózati kapcsolatot a csomópontok között.
Először ellenőrizze és állítsa helyre a hálózati kapcsolatot a két csomópont között (például a heartbeat kapcsolat, kapcsolók, hálózati beállítások).
Csak a kapcsolat helyreállítása után lehet a rendszernek ellenőriznie a Klaszter állapotát. - Hagyja, hogy a rendszer automatikusan észlelje a split-brain állapotot.
- Amint a csomópontok újra létrehozzák a kommunikációt, a rendszer állapotinformációkat cserél a két csomópont között.
- Ha mindkét csomópont átvette az aktív csomópont szerepét, a rendszer split-brain állapotként azonosítja.
- Az adatsérülés megelőzése érdekében a rendszer leállítja a legtöbb szolgáltatást (például SMB, iSCSI), és hibaüzenetet jelenít meg, amely jelzi, hogy split-brain történt.
- Split-brain helyreállítása High Availability Manager segítségével.
- Nyissa meg a High Availability Manager-t.
- Kattintson a Split-Brain helyreállítása elemre a helyreállítási varázsló elindításához.
A varázslóban választhat az alábbi helyreállítási lehetőségek közül:- 1. lehetőség: Adatok megőrzése csak az egyik csomóponton
Válassza ki a megőrizni kívánt csomópontot, a másik csomópont törlődik és passzív csomópontként állítódik vissza. A rendszer ezután újraszinkronizálja a HA Klaszter-t.
Ez a lehetőség akkor megfelelő, ha egyértelműen tudja, melyik csomópont rendelkezik a helyes adatokkal, és gyorsan szeretné helyreállítani a Klaszter-t. - 2. lehetőség: Adatok megőrzése mindkét csomóponton
Ha mindkét csomópont fontos adatokat tartalmaz, a rendszer lehetővé teszi, hogy az egyik csomópont először folytassa a szolgáltatásokat, míg a másik csomópont eltávolításra kerül a Klaszter-ból.
Az adatok ellenőrzése és egyeztetése után manuálisan újra csatlakoztathatja az eltávolított csomópontot a Klaszter-hoz.
- 1. lehetőség: Adatok megőrzése csak az egyik csomóponton
- Opcionális: Minimalizálja a jövőbeni split-brain előfordulását egy kvórum szerver engedélyezésével.
Ha a csomópontok megszakadnak egymással, de továbbra is csatlakoznak a hálózathoz, egy kvórum szerver továbbra is figyelheti az egyes csomópontokat, és továbbíthatja azok állapotát egymásnak. Ez segít csökkenteni a split-brain esélyét.
Kvórum szervert konfigurálhat a következő helyen: High Availability Manager > Beállítások > Feladatátvétel Politika > Kvórum Szerver.