Wyeliminuj wąskie gardła pamięci masowej dla AI
dzięki NFS over RDMA

Każde opóźnienie I/O (liczone w milisekundach) marnuje moc obliczeniową kosztownych procesorów GPU. Połączenie modelu TS-h1290FX i technologii NFS over RDMA gwarantuje, że wydajność pamięci masowej dotrzymuje kroku szybkości obliczeń.

Poznaj NFS over RDMA

Twoje GPU może marnować czas, czekając na dane

Podczas gdy koszt trenowania AI zależy od czasu pracy GPU, wąskie gardła I/O pamięci masowej mogą marnować ponad 40% Twojego czasu obliczeniowego.

1. Ukryty koszt stosu TCP

Za każdym razem, gdy dane są odczytywane, procesor CPU jest obciążony przetwarzaniem pakietów TCP i przełączaniem kontekstu. Choć nie wnosi to nic do obliczeń AI, potajemnie zużywa nawet 99% zasobów CPU.

2. 4–6 rund zbędnego kopiowania pamięci

W tradycyjnym protokole NFS dane są kopiowane między jądrem a przestrzenią użytkownika od 4 do 6 razy, zanim trafią do GPU. Każda mikrosekunda dodatkowego opóźnienia skutkuje utratą mocy obliczeniowej.

3. Realne straty wynikające z bezczynności GPU

Przykładowo, w klastrze 8×H100 koszty chmury przekraczają 24 USD za godzinę. Jeśli wykorzystanie GPU spadnie do 60% podczas oczekiwania na dane, około 10 USD na godzinę zostaje całkowicie zmarnowane.

Dlaczego NFS over RDMA zmienia wszystko

Wykorzystując technologie Kernel Bypass oraz Zero-Copy, eliminujemy zbędne kopiowanie pamięci i obciążenie procesora CPU, które są nieodłączną cechą tradycyjnego NFS. Całe przetwarzanie protokołu jest przenoszone na sprzęt, co drastycznie skraca czas oczekiwania procesorów GPU na dane.

100-krotna redukcja opóźnień

Reakcja w czasie rzeczywistym na potrzeby trenowania AI.

Redukcja obciążenia CPU o 85%

Odciąż serwery, aby mogły zająć się faktycznymi obliczeniami.

Przepustowość bliska prędkości łącza

Osiągaj prędkości sieciowe do 100 Gb/s.

<5% czasu oczekiwania GPU

Pozwól swoim drogim procesorom GPU pracować z pełną wydajnością.

Przestań godzić się na wąskie gardła starszej generacji

Funkcja	QNAP TS-h1290FX	Standardowy NAS SATA
Wydajność	NFS over RDMA (Natywnie)	Nieobsługiwane (tradycyjne TCP)
Opóźnienia	Ultra-niskie (Mikrosekundy)	Wysokie (milisekundy)
Zużycie CPU	Zminimalizowane dzięki RDMA	Duże obciążenie (Overhead)
Interfejs dysków	U.2 NVMe PCIe Gen 4	SATA 6 Gb/s