為什麼企業需要 QuTS MEGA Scale-out 解決方案
共同挑戰是:資料規模長期成長、服務不能中斷、並且需要可預期的資料保護與可維運性。
法規導向的長期資料保存
交易紀錄、通話錄音與稽核資料需長期保存且不可遺失;透過高可用與資料保護機制,在不中斷服務下持續擴充容量。
長期累積的巨量研究資料
基因、影像與研究數據持續成長;以高效率保護機制搭配自動修復,長期穩定支撐分析與研究工作。
大量且長期留存的影像資料
製程影像與監控錄影快速累積;Scale-out 可依產線成長擴充,並透過自動重平衡避免效能與管理瓶頸。
多元功能,滿足多樣化儲存需求
QuTS MEGA 以一致的 Scale-out 架構,整合檔案與物件服務、主流協定支援,以及可預期的擴展路徑,讓企業能隨資料成長穩定擴充。
一套平台,涵蓋服務、協定與擴展能力
以企業級可用性為前提,提供清楚的能力邊界與落地規格,方便客戶在規劃 POC / 正式導入時快速對齊需求。
儲存類型
同一套平台,彈性滿足不同資料型態
-
檔案儲存(File Storage) 適用於共享資料夾、部門協作、影像/檔案歸檔等場景。
-
物件儲存(Object Storage) 適用於長期保存、應用整合與 S3 API 介接需求。
協定
對齊企業既有應用與存取方式
-
SMBWindows / AD 環境常用的檔案共享協定。
-
NFSLinux / 研發環境常見的檔案服務協定。
-
S3 API物件儲存標準介面,利於應用整合與資料湖架構。
可擴展架構
從導入起步到 PB 規模,路徑清晰
-
3–96 節點 Scale-out 從 3 至 96 個節點彈性擴展,提供 PB 級高可用儲存。
-
擴充不中斷、維運一致 節點可依需求逐步加入,透過自動重平衡簡化擴充與維運。
※ 實際可用性與效能表現將依叢集規模、服務配置與資料保護策略(EC/Replication 等)而定。
核心能力
基於 Linux 與 Ceph 分散式架構,以高可用性為核心,透過資料冗餘、容錯機制、彈性維運與可擴展性,打造企業級儲存平台。
高可用性(High Availability)
即使節點故障,服務仍持續運作
資料冗餘
-
副本複製 透過多份資料副本確保資料可用性,適合需要快速存取與高可靠性的場景。
-
糾刪碼 採用 Ceph Erasure Coding,提供高效率資料保護與容錯能力。
容錯能力
-
服務分散 服務分散運行於多節點,當節點故障時自動進行服務復原與遷移,維持對外服務可用。
-
自我修復 自動利用副本或同位元重建遺失資料,維持資料完整性並降低人工介入。
持續營運能力
-
動態重平衡 節點加入或移除時自動重新分佈資料,維持冗餘一致並避免熱點,確保系統平衡運作。
-
不中斷升級 在不中斷服務、不影響營運的情況下完成系統升級與維護作業。
-
資料儲存永續性 基於 Ceph 分散式架構,容量與效能可隨節點擴展,支援企業長期資料成長。
企業級安全與合規功能
-
Active Directory 整合 整合企業 AD 環境,提供統一身份認證、使用者帳號管理與角色權限設定,簡化權限管理流程。
-
操作稽核追蹤 記錄所有系統操作與資料存取行為,提供完整稽核軌跡,滿足合規查核與安全分析需求。
-
Write Once Read Many(S3 WORM) 不可變物件鎖定機制,防止資料被篡改或刪除,滿足金融、醫療等產業的法規遵循要求。
Erasure Coding(EC)保護力圖解
以 EC 4+2 為例:「4 份資料切片」+「2 份同位元切片」,分散於 6 個節點,可容忍最多 2 個節點同時故障。
QuTS MEGA 支援多種 EC 配置(如 8+2、8+3 等),可依需求選擇不同的容量效率與保護等級。
視覺化理解:4 份資料 + 2 份保護
把檔案拆成 6 片分散到 6 個節點:其中 4 片是資料(D1–D4)、2 片是保護(P1–P2)。即使壞掉 2 個節點,仍能用剩下的片段重建回原始資料。
註:此為 EC 4+2 示例,實際可選用 8+2、8+3、16+4 等不同配置,以符合不同的容量與保護需求。
情境 1:2 個節點故障 ✔︎ 資料安全
即使 Node 2 和 Node 5 故障,系統仍可從剩餘的 D1、D3、D4、P2 重建完整資料,資料不會遺失。
情境 2:3 個節點故障 ✕ 資料遺失
當 3 個或更多節點同時故障時,剩餘片段不足以重建資料,可能導致資料遺失。這超出了 EC 4+2 的容錯範圍。
※ 此為「保護力」概念示例(Failure Domain = Node)。QuTS MEGA 支援多種 EC 配置(如 4+2、8+2、8+3、16+4 等),可依叢集規模、工作負載與保護需求選擇最適合的配置。實際讀寫可用性仍會依叢集設定(例如 min_size、服務層 HA/負載設計)而定。
服務分散
服務分散運行於多節點,當節點故障時自動進行服務復原與遷移,確保叢集服務持續可用。
自動服務復原機制
降低單點故障風險,提升整體系統可用性
✔︎ 正常狀態:服務分散於多個節點
⚠ Node 2 故障 → 自動服務遷移
當 Node 2 故障時,原本運行的 S3 和 MGR 服務自動遷移至 Node 3 和 Node 4,
確保服務不中斷,使用者無感知。
故障自動偵測
即時監控節點健康狀態,快速識別故障節點並啟動復原流程。
服務自動遷移
將故障節點上的服務自動遷移至正常節點,確保服務不中斷。
負載均衡分散
服務智慧分散於多個節點,避免單一節點負載過高,提升整體效能。
零人工介入
全自動化處理故障復原,降低維運負擔與人為錯誤風險。
適用於 24×7 營運場景、高併發存取需求,以及需要高可用性保證的關鍵業務應用。大幅降低服務中斷對業務的影響,提升使用者體驗。
自我修復
自動偵測並重建遺失或損壞的資料,維持資料完整性與保護狀態,無需人工介入。
智慧資料修復機制
透過副本或 Parity 自動重建資料,確保長期資料完整性
✔︎ 正常狀態:資料以 3 副本分散儲存
⚠ 偵測到 Node B 硬碟故障,資料遺失
✔︎ Self-Healing:自動從 Node A 或 Node C 重建資料至新硬碟
當偵測到 Node B 資料遺失時,系統自動從 Node A 或 Node C 複製完整資料,
無需人工介入即可恢復 3 副本保護狀態,確保資料長期可靠性。
持續健康檢查
定期掃描資料完整性,主動偵測損壞或遺失的資料區塊。
自動資料重建
透過 Replication 或 Erasure Coding 自動重建資料,確保資料完整性。
保護狀態恢復
重建完成後自動恢復原有的保護等級,避免長時間處於降級狀態。
修復進度追蹤
提供即時修復進度與狀態資訊,讓管理者掌握叢集健康狀況。
降低維運壓力與人力成本,減少因人工操作造成的錯誤風險。適用於長期資料保存、法規遵循與關鍵資料保護場景,確保資料長期可靠性。
動態重平衡
當節點加入或移除時,自動重新分佈資料,維持資料冗餘一致性並避免儲存熱點。
智慧資料再分配機制
確保叢集資源均衡使用,維持最佳效能與容量利用率
⚠ 新增節點前:3 個節點容量使用不均
⚠ 容量使用不均,Node 3 接近滿載,可能成為效能瓶頸
重平衡進行中:自動遷移資料至新節點
✔︎ 重平衡完成:4 個節點容量均衡,效能最佳化
✔︎ 容量均衡分佈(62-66%),避免熱點,維持最佳效能
新增 Node 4 後,系統自動將部分資料從 Node 1-3 遷移至新節點,
使 4 個節點的容量使用率保持均衡(約 62-66%),避免單一節點過載。
新增節點自動整合
新節點加入時,系統自動將部分資料遷移至新節點,平衡儲存使用率。
移除節點資料保護
節點移除前自動將資料遷移至其他節點,確保資料不遺失且維持保護等級。
避免效能熱點
自動偵測負載不均並重分佈資料,避免效能熱點;支援 Data disk auto metadata migration,運行期間動態優化資料與 Metadata 分佈。
I/O 效能優先
提供 Client I/O First / Recovery I/O First 調度模式,在重平衡或資料修復期間,保障關鍵服務效能。
支援企業彈性擴充需求,可依業務成長逐步增加節點而不影響服務。維持長期效能穩定性,避免因容量不均導致的效能衰退,降低擴充與維運複雜度。
監控與告警
以深度硬體監控、彈性告警規則與多元整合機制,強化事件反應效率與維運協作能力。
深度硬體監控與定位
完整硬體狀態資訊
監控風扇、溫度與電源狀態,並透過專屬介面協助部署與維運。
硬體 LED 與硬碟定位
快速識別故障磁碟並縮短更換時間。
S.M.A.R.T. 健康監控
掌握磁碟健康狀態,提前預警潛在風險。
告警通報與監控整合
Prometheus + Alertmanager
支援 Email、SNMP Trap、Microsoft Teams 即時通報。
SNMP 與第三方監控平台
可與既有平台整合(例如 PRTG Network Monitor)。
QNAP 服務戰情室
集中呈現叢集健康、告警與事件,支援原廠遠端監控與通報。
叢集規模與節點型號
最少 3 節點即可建立叢集,最多可擴充至 96 節點。提供四款節點,涵蓋入門、大容量、高密度與高效能等不同工作負載。
QSN-3000
Scale-out 入門節點
6 核心 / 12 執行緒
6 × 2.5" SATA
2 × 2.5GbE BASE-T
QSN-3050
大容量節點
8 核心 / 16 執行緒
6 × 2.5" SATA
2 × 2.5GbE BASE-T
QSN-7530
高效能密集型節點
12 核心 / 24 執行緒
2 × 2.5GbE BASE-T