What is split-brain and how do I recover?
Split-brain คืออะไรและฉันจะกู้คืนได้อย่างไร?


Last modified date: 2025-05-28

ผลิตภัณฑ์ที่ใช้ได้

  • QuTS hero h5.3.0 or later
  • High Availability Manager 1.0 or later

คำจำกัดความและสาเหตุ

ใน คลัสเตอร์ ที่มีความพร้อมใช้งานสูง (HA), split-brain เกิดขึ้นเมื่อโหนดทั้งสองสูญเสียการสื่อสารกันแต่ยังคงทำงานได้อย่างอิสระ และ โหนดทั้งสองได้สันนิษฐานบทบาทโหนดที่ใช้งานอยู่. สิ่งนี้อาจทำให้เกิดความไม่สอดคล้องกันของข้อมูลหรือ ที่เก็บข้อมูล ที่เสียหาย เพราะแต่ละโหนดอาจพยายามควบคุมทรัพยากรที่ใช้ร่วมกันพร้อมกัน.

สาเหตุทั่วไปของ split-brain ได้แก่:

  • การตัดการเชื่อมต่อเครือข่ายระหว่างโหนดใน คลัสเตอร์
  • การล้มเหลวของการเชื่อมต่อ heartbeat
  • เส้นทางเครือข่ายที่ไม่เสถียรหรือไม่สอดคล้องกัน

วิธีแก้ไข

  1. แก้ไขการเชื่อมต่อเครือข่ายระหว่างโหนด.
    ตรวจสอบและคืนค่าการเชื่อมต่อเครือข่ายระหว่างโหนดทั้งสองก่อน (เช่น การเชื่อมต่อ heartbeat, สวิตช์, การตั้งค่าเครือข่าย).
    เฉพาะเมื่อการเชื่อมต่อได้รับการคืนค่าแล้วเท่านั้นที่ระบบสามารถดำเนินการตรวจสอบสถานะ คลัสเตอร์ ได้.
  2. ให้ระบบตรวจจับสถานะ split-brain โดยอัตโนมัติ.
    1. เมื่อโหนดกลับมาสื่อสารกันอีกครั้ง ระบบจะแลกเปลี่ยนข้อมูลสถานะระหว่างโหนดทั้งสอง.
    2. หากโหนดทั้งสองได้สันนิษฐานบทบาทโหนดที่ใช้งานอยู่ ระบบจะระบุว่าเป็นสถานะ split-brain.
    3. เพื่อป้องกันการเสียหายของข้อมูล ระบบจะหยุดบริการส่วนใหญ่ (เช่น SMB, iSCSI) และแสดงข้อความข้อผิดพลาดที่ระบุว่าเกิด split-brain.
  3. กู้คืนจาก split-brain ผ่าน High Availability Manager.
    1. เปิด High Availability Manager.
    2. คลิก กู้คืนจาก Split-Brain เพื่อเปิดตัวช่วยกู้คืน.
      ในตัวช่วยกู้คืน คุณสามารถเลือกหนึ่งในตัวเลือกการกู้คืนต่อไปนี้:
      • ตัวเลือก 1: เก็บข้อมูลไว้ในโหนดเดียวเท่านั้น
        เลือกโหนดที่จะเก็บไว้ และโหนดอื่นจะถูกลบและรีเซ็ตเป็นโหนดที่ไม่ใช้งาน ระบบจะซิงโครไนซ์ คลัสเตอร์ ใหม่.
        ตัวเลือกนี้เหมาะเมื่อคุณทราบแน่ชัดว่าโหนดใดมีข้อมูลที่ถูกต้องและต้องการคืนค่า คลัสเตอร์ อย่างรวดเร็ว.
      • ตัวเลือก 2: เก็บข้อมูลไว้ในทั้งสองโหนด
        หากโหนดทั้งสองมีข้อมูลสำคัญ ระบบจะอนุญาตให้โหนดหนึ่งกลับมาทำงานก่อน ในขณะที่โหนดอื่นถูกลบออกจาก คลัสเตอร์.
        หลังจากตรวจสอบและปรับข้อมูลให้สอดคล้องกัน คุณสามารถเข้าร่วมโหนดที่ถูกลบกลับไปยัง คลัสเตอร์ ได้ด้วยตนเอง.
  4. ตัวเลือก: ลด split-brain ในอนาคตโดยเปิดใช้งานเซิร์ฟเวอร์ quorum.
    หากโหนดตัดการเชื่อมต่อกันแต่ยังคงเชื่อมต่อกับเครือข่าย เซิร์ฟเวอร์ quorum ยังสามารถตรวจสอบโหนดแต่ละตัวและส่งสถานะของพวกเขาให้กันและกันได้ สิ่งนี้ช่วยลดโอกาสของ split-brain.
    คุณสามารถกำหนดค่าเซิร์ฟเวอร์ quorum โดยไปที่ High Availability Manager > การตั้งค่า > นโยบาย การย้ายโหนดเมื่อเกิดข้อผิดพลาด > เซิร์ฟเวอร์ Quroum.

อ่านเพิ่มเติม

Was this article helpful?

Thank you for your feedback.

Please tell us how this article can be improved:

If you want to provide additional feedback, please include it below.

เลือกสเปค

      ดูเพิ่มเติม น้อยลง

      This site in other countries/regions:

      open menu
      back to top