TrendForum.Net

TrendForum.Net (https://www.trendforum.net/)
-   Bilgisayar ve Donanım (https://www.trendforum.net/bilgisayar-ve-donanim/)
-   -   NVIDIA’dan AMD’ye Yanıt: H100, MI300X’ten 2 Kat daha Hızlı (https://www.trendforum.net/bilgisayar-ve-donanim/35573-nvidia-dan-amd-ye-yanit-h100-mi300x-ten-2-kat-daha-hizli.html)

KoJiRo 16 Aralık 2023 19:41

NVIDIA’dan AMD’ye Yanıt: H100, MI300X’ten 2 Kat daha Hızlı
 
[Only registered and activated users can see links. Click Here To Register...]

AMD, Instinct MI300X lansmanında yapay zeka (AI) ve yüksek performanslı bilgi işlem (HPC) konusunda yeni grafik yongalarının NVIDIA H100‘den önemli ölçüde daha hızlı olduğunu iddia etmişti. Rakibi ise tabiri caizse AMD’yi yalanlayarak durumun tam tersi olduğunu gösterdi.

Yeşil takıma göre, uygun şekilde optimize edildiğinde H100 tabanlı sistemler Instinct MI300X destekli sunuculardan daha hızlı. NVIDIA, AMD’nin performansı Instinct MI300X tabanlı sunucusuyla karşılaştırmak için kullandığı DGX H100 makinesi için optimize edilmiş yazılım kullanmadığını iddia ediyor. Bu bağlamda, yüksek yapay zeka performansının sağlam bir paralel hesaplama yapısına, çok yönlü bir araç paketine, son derece rafine algoritmalara (optimizasyonlar) ve gelişmiş donanıma bağlı olduğu belirtiliyor. Başka bir deyişle, bahsedilen puzzle’ın parçalarından biri eksik olduğunda performans düzeyi düşük, hatta vasatın altında olabiliyor.

[Only registered and activated users can see links. Click Here To Register...]

NVIDIA’ya göre TensorRT-LLM, H100 ve benzeri GPU’lar için çok önemli bir performans sağlayıcı olan Hopper mimarisi için özel olarak tasarlanmış gelişmiş çekirdek optimizasyonlarına sahip. Bu ince ayar, Llama 2 70B gibi modellerin çıkarımların hassasiyetinden ödün vermeden H100 GPU’larda hızlandırılmış FP8 işlemlerini çalıştırmasına olanak tanıyor.

GPU üreticisi bunu kanıtlamak için Llama 2 70B modelini çalıştıran sekiz H100 GPU ile donatılmış tek bir DGX H100 sunucusunun performans ölçümlerini sundu. Bir DGX H100 makinesi, bir toplu iş boyutuna ayarlandığında tek bir çıkarım görevini yalnızca 1.7 saniyede tamamlayabiliyor. AMD’nin sekiz yollu MI300X sisteminde ise bu süre 2.5 saniye (AMD tarafından yayınlanan rakamlara göre).

Technopat


Forum saati; Türkiye'ye göre ayarlanmış olup, şu an saat: 23:51.

Powered by vBulletin® Version 3.8.7   Copyright ©2000 - 2024, vBulletin Solutions, Inc.