I/O bekleme süresinin her milisaniyesi pahalı GPU hesaplama gücünü boşa harcar.
NFS over RDMA ile TS-h1290FX, depolama performansının hesaplama hızlarıyla uyumlu olmasını sağlar.
AI eğitimi maliyetleri GPU süresiyle belirlenir, ancak depolama I/O darboğazları nedeniyle bilgi işlem süresinin %40'ından fazlası boşa harcanır.
Her veri okumasında, CPU'nun TCP paket parçalanmasını, sağlama toplamı hesaplamalarını ve çekirdek bağlamı geçişlerini işlemesi gerekir. Bu ek yük, AI hesaplama değerine sıfır katkı sağlar ancak sessizce CPU kaynaklarının %99'una kadarını tüketir.
CPU Kullanımı ≥ %99Geleneksel bir NFS yolunda, aynı veri GPU'ya ulaşmadan önce çekirdek tamponu ile kullanıcı alanı arasında 4-6 kez kopyalanmalıdır. Her kopya gecikme ekler ve eklenen her mikrosaniyelik gecikme bilgi işlem gücünü azaltır.
Gecikme 100–500 μs8×H100 kümesi örneğinde, bulut maliyetleri saatte 24 doları aşıyor. I/O darboğazları nedeniyle GPU kullanımı %60'a düştüğünde, saatte neredeyse 10 dolar tamamen boşa harcanıyor.
GPU Boşta > %40Tek bir GPU ile zar zor yönetilebilirken, aynı depolamadan eşzamanlı olarak okuma yapan 4, 8 veya 16 GPU'ya genişletildiğinde, geleneksel TCP NFS çekişme gecikmesi katlanarak kötüleşir.
Çok Düğümlü Eşzamanlılık Kırılma NoktasıRDMA üzerinden NFS, geleneksel protokollerde küçük bir değişiklik değildir; depolamadan GPU belleğine kadar tüm veri yolunu temelden yeniden inşa eder.
| Özellik Öğesi | QNAP TS-h1290FX | Rakip A (SATA NAS) | Rakip B (Kurumsal AFA) |
|---|---|---|---|
| CPU | AMD EPYC™ 7302P 16Ç / 3,3 GHz En Güçlü | Intel Xeon D-1541 8Ç / 2,7 GHz | Üst düzey Intel serisi |
| Depolama Arayüzü | NVMe PCIe Gen 4 ×4 U.2 En hızlı | SATA 6 Gb/s | NVMe / SAS / FC |
| NVMe Yuvaları | 12 × 2,5" U.2 PCIe Gen 4 | Yerel destek yok (adaptör gerekli)Desteklenmeyen | 48 × 2,5" NVMe |
| NFS üzerinden RDMA | ✓ Tamamen optimize edilmiş yerel destek Yerel | ✗ Desteklenmeyen Desteklenmeyen | △ Kısmen destekleniyor |
| Dahili Ağ | 2× 25GbE SFP28 + 2× 2,5GbE | 2× 10GbE + 4× 1GbE | Birden fazla 25/100GbE (yapılandırmaya bağlı) |
| PCIe Genişletme | 4× PCIe Gen 4 Gen 4 | 2× PCIe Gen 3 | Yüksek yoğunluklu çok yuvalı |
| Maksimum Bellek | 1 TB DDR4 ECC 3200 MHz | 64 GB DDR4 2666 MHz | 1.280 GB |
| ZFS Dosya Sistemi | ✓ QuTS hero yerel entegrasyonu | ✗ | Tedarikçiye bağlı |
| S3 Nesne Depolaması | ✓ QuObjects (Nesne Kilidi içerir) | ✗ | Tedarikçiye bağlı |
| Çoklu Kiracı İzolasyonu | ✓ NFS paylaşımları + ZFS snapshot izolasyonu | Sınırlı destek | Destekleniyor |
Birden fazla GPU düğümü, yüzlerce GB eğitim setini paralel olarak okur. Geleneksel NFS'te, I/O bekleme süresi hesaplama süresini aşar. RDMA, veri iletiminin GPU talebine yetişmesini sağlar.
Patoloji slaytları ve 3D DICOM görüntüleri genellikle gigabaytlarca yer kaplar. AI destekli tanı okuma sırasında takılırsa, klinik faydalar ciddi şekilde azalır. Düşük gecikmeli depolama, tanı AI'nın en yüksek verimlilikte çalışmasını sağlar.
Üretim hatları saniyede büyük miktarda süreç verisi üretir. AI modelleri, anahtar verimlilik değişkenlerini bulmak için geçmiş verileri gerçek zamanlı analiz etmelidir. I/O gecikmesi analiz gecikmesine dönüşür ve nihayetinde verim kaybına yol açar.
TS-h1290FX × NFS over RDMA — Şirket İçi AI Eğitimi için Depolama Altyapısı