Wyeliminuj wąskie gardła pamięci masowej dla AI
dzięki NFS over RDMA
Każde opóźnienie I/O (liczone w milisekundach) marnuje moc obliczeniową kosztownych procesorów GPU. Połączenie modelu TS-h1290FX i technologii NFS over RDMA gwarantuje, że wydajność pamięci masowej dotrzymuje kroku szybkości obliczeń.
|
Twoje GPU może marnować czas, czekając na dane
Podczas gdy koszt trenowania AI zależy od czasu pracy GPU, wąskie gardła I/O pamięci masowej mogą marnować ponad 40% Twojego czasu obliczeniowego.
1. Ukryty koszt stosu TCP
Za każdym razem, gdy dane są odczytywane, procesor CPU jest obciążony przetwarzaniem pakietów TCP i przełączaniem kontekstu. Choć nie wnosi to nic do obliczeń AI, potajemnie zużywa nawet 99% zasobów CPU.
2. 4–6 rund zbędnego kopiowania pamięci
W tradycyjnym protokole NFS dane są kopiowane między jądrem a przestrzenią użytkownika od 4 do 6 razy, zanim trafią do GPU. Każda mikrosekunda dodatkowego opóźnienia skutkuje utratą mocy obliczeniowej.
3. Realne straty wynikające z bezczynności GPU
Przykładowo, w klastrze 8×H100 koszty chmury przekraczają 24 USD za godzinę. Jeśli wykorzystanie GPU spadnie do 60% podczas oczekiwania na dane, około 10 USD na godzinę zostaje całkowicie zmarnowane.
|
Dlaczego NFS over RDMA zmienia wszystko
Wykorzystując technologie Kernel Bypass oraz Zero-Copy, eliminujemy zbędne kopiowanie pamięci i obciążenie procesora CPU, które są nieodłączną cechą tradycyjnego NFS. Całe przetwarzanie protokołu jest przenoszone na sprzęt, co drastycznie skraca czas oczekiwania procesorów GPU na dane.
100-krotna redukcja opóźnień
Reakcja w czasie rzeczywistym na potrzeby trenowania AI.
|
Redukcja obciążenia CPU o 85%
Odciąż serwery, aby mogły zająć się faktycznymi obliczeniami.
|
Przepustowość bliska prędkości łącza
Osiągaj prędkości sieciowe do 100 Gb/s.
|
<5% czasu oczekiwania GPU
Pozwól swoim drogim procesorom GPU pracować z pełną wydajnością.
|
|
|
Przestań godzić się na wąskie gardła starszej generacji
| Funkcja |
QNAP TS-h1290FX |
Standardowy NAS SATA |
| Wydajność |
NFS over RDMA (Natywnie) |
Nieobsługiwane (tradycyjne TCP) |
| Opóźnienia |
Ultra-niskie (Mikrosekundy) |
Wysokie (milisekundy) |
| Zużycie CPU |
Zminimalizowane dzięki RDMA |
Duże obciążenie (Overhead) |
| Interfejs dysków |
U.2 NVMe PCIe Gen 4 |
SATA 6 Gb/s |
|
Gotowy, aby przyspieszyć rozwój AI w swojej firmie?
Przejdź na macierz All-Flash TS-h1290FX i uwolnij pełny potencjał swoich węzłów obliczeniowych.
|
|