Jak bezpečně vyměnit varovné SSD disky v RAID Úložiště poolu?
Platné produkty
- QNAP NAS running QTS or QuTS hero
- Models with hot-swappable drive bays
- RAID groups using SSDs (RAID 1, RAID 5, RAID 6, RAID 10, etc.)
Popis problému
Jeden nebo více SSD ve vašem RAID Úložiště poolu vykazuje stav "Varování", což naznačuje, že životnost SSD byla vyčerpána (0 % zbývajícího života) nebo byly zjištěny chyby S.M.A.R.T. Chcete vědět:
- Můžete bezpečně odstranit a nahradit disk ve stavu Varování pomocí hot-swap?
- Jaký je správný postup?
- Jaká jsou rizika, když více SSD současně vykazuje stav Varování?
Krátká odpověď
Ano — disk ve stavu Varování lze bezpečně vyměnit za provozu, stejně jako disk Selhání. Můžete vytáhnout SSD ve stavu Varování z pozice, zatímco NAS je zapnutý, vložit nový náhradní SSD a RAID automaticky začne obnovovat. Musíte však vyměňovat disky jeden po druhém a počkat na dokončení obnovy před výměnou dalšího.
Postup řešení
Než začnete
- Ověřte, že máte aktuální zálohu všech dat na skupině RAID. To je kritické, zejména když je více disků ve stavu Varování.
- Zkontrolujte stav RAID: Ujistěte se, že žádný jiný disk ve skupině RAID není aktuálně ve stavu Selhání nebo Obnova.
- Přejděte na Úložiště a snímky → Úložiště/Snímek → vyberte Pool Úložiště → zobrazte stav skupiny RAID.
- Identifikujte fyzické umístění disku ve stavu Varování:
- Přejděte na Úložiště a snímky → Disky/VJBOD → najděte SSD ve stavu Varování → klikněte na Najít (LED disku bude blikat, aby vám pomohla identifikovat správnou pozici).
- Připravte náhradní SSD:
- Nový SSD musí být stejný nebo větší než disk, který je nahrazován.
- Ujistěte se, že SSD je kompatibilní s modelem vašeho NAS.
Krok za krokem: Výměna hot-swap
Krok 1: Odstraňte varovný SSD
- S NAS zapnutým a běžícím fyzicky vytáhněte varovný SSD z jeho diskové pozice.
- NAS vydá zvukové upozornění a stav skupiny RAID se změní na Degradovaný.
- To je očekávané — RAID 5 může tolerovat jeden chybějící disk, RAID 6 může tolerovat dva.
Důležité: NEvypínejte NAS před vytažením disku. Výměna hot-swap musí být provedena, zatímco systém běží.
Krok 2: Vložte náhradní SSD
- Vložte nový SSD do stejné diskové pozice.
- NAS automaticky detekuje nový disk.
- Skupina RAID začne automaticky obnovovat.
Krok 3: Sledujte obnovu
- Přejděte na Úložiště a snímky → Úložiště/Snímek → vyberte Úložiště Pool.
- Skupina RAID zobrazí stav Obnovování s procentem pokroku.
- Počkejte, až se obnova plně dokončí (100%) před pokračováním v nahrazování dalšího disku.
Varování: Doba obnovy závisí na velikosti disku a zatížení systému. Nevypínejte ani nerestartujte NAS během obnovy.
Krok 4: Opakujte pro další disky (pokud je potřeba)
Pokud máte více varovných SSD k nahrazení:
- Počkejte, dokud aktuální obnova nedosáhne 100% a stav RAID se nevrátí na Připraven/Normální.
- Teprve poté pokračujte v nahrazování dalšího varovného SSD.
- Opakujte kroky 1–3 pro každý disk, jeden po druhém.
Po výměně
- Ověřte, že stav skupiny RAID je Připraven a všechny disky ukazují Dobré.
- Přejděte na Úložiště a snímky → Disky/VJBOD a potvrďte, že všechny nové SSD jsou rozpoznány a zdravé.
- Po dokončení všech výměn proveďte RAID scrubbing (kontrola konzistence dat):
- Přejděte na Úložiště a snímky → vyberte skupinu RAID → Spravovat → RAID Scrubbing.
Kritická rizika, když je více SSD ve stavu Varování
| Riziko | Popis |
|---|---|
| Selhání RAID během obnovy | Když se skupina RAID obnovuje (degradovaný stav), má žádnou toleranci selhání (pro RAID 5) nebo sníženou toleranci (pro RAID 6). Pokud během obnovy selže další disk ve stavu Varování, celá skupina RAID bude ztracena. |
| Nepravidelnost konce životnosti SSD | SSD s 0% životností mohou selhat náhle a bez dalšího varování. Čím více disků ve stavu Varování ve skupině, tím vyšší je riziko druhého selhání během obnovy. |
| Stres z obnovy | Proces obnovy intenzivně čte všechna data ze zbývajících disků, což může urychlit selhání dalších SSD na konci životnosti. |
Zmírnění rizik
- Vždy mějte ověřenou zálohu před zahájením — to je nejdůležitější opatření.
- Vyměňujte disky během období nízkého zatížení, abyste snížili I/O stres na zbývající disky ve stavu Varování během obnovy.
- Vyměňujte disky podle pořadí nejhoršího zdraví — začněte s SSD, které ukazuje nejkritičtější hodnoty S.M.A.R.T.
- Zvažte upgrade úrovně RAID — pokud často čelíte selhání více disků, RAID 6 (toleruje 2 selhání disků) poskytuje lepší ochranu než RAID 5 (toleruje pouze 1).