Gündemdekiler

AMD, CDNA Mimarili Instinct MI100 GPU Hızlandırıcısını Duyurdu

RDNA 2 grafik mimarisine dayanan RX 6000 serisi ekran kartları kullanılmaya başladı. Artık RX 6700 ve RX 6500 serisi üzere daha hesaplı kartlar beklerken AMD’den yüksek performanslı bilgi süreç alanında yeni bir atak geldi. Kırmızı ekip, “bilimsel iş yükleri için dünyanın en süratli HPC GPU hızlandırıcısı” olarak tanımladığı AMD Instinct MI100 Accelerator’ı tanıttı.

AMD, Instinct MI100’ün “hesaplama ve orta irtibat performansında dev bir sıçrama” sağlamak için sıfırdan inşa edilen yeni CDNA mimarisini kullandığını belirtti. Geçmiş HPC hızlandırıcılar ile kıyaslandığında ise yaklaşık 3,5 kat (FP32) performans artışı ve yapay zeka süreç hacmi için yaklaşık 7 kat (FP16) performans artışı sunuluyor.

MI100 GPU’nun arkasındaki temel teknolojiler ortasında şunlar yer alıyor:

  • Makine tahsili için üstün performansa sahip orijinal bir Matrix Core Teknolojisi.
  • 64 GB/sn CPU – GPU bant genişliği ve 276 GB/sn’ye kadar eşler ortası (P2P) bant genişliği performansı için AMD Infinity Fabric Link Teknolojisi.
  • 11,5 TFLOPS’a kadar FP64 performansı (veya 23,1 TFLOPS en yüksek FP32 performansı) için PCIe Gen 4.0 ilişkisi.
  • Ultra süratli HBM2 bellek teknolojisi.

Yeni Instinct MI100 hızlandırıcı kartlar Oak Ridge Leadership Computing Facility tarafından bir mühlet test edildi. Tesis yöneticisi Bronson Messer, MI100’ün test platformlarında “diğer GPU’lara kıyasla 2-3 kata kadar performans artışı” sağladığını söyledi. Son olarak güç verimliliği tarafında iyileştirmeler yapıldığı da belirtiliyor.

AMD Radeon Instinct Hızlandırıcı Özellikleri

Accelerator Name AMD Radeon Instinct MI6 AMD Radeon Instinct MI8 AMD Radeon Instinct MI25 AMD Radeon Instinct MI50 AMD Radeon Instinct MI60 AMD Radeon Instinct MI100
Mimari Polaris 10 Fiji XT Vega 10 Vega 20 Vega 20 Arcturus
Üretim 14nm FinFET 28nm 14nm FinFET 7nm FinFET 7nm FinFET 7nm FinFET
Çekirdek 2304 4096 4096 3840 4096 7680
Frekans Suratı 1237 MHz 1000 MHz 1500 MHz 1725 MHz 1800 MHz ~1500 MHz
FP16 Hesaplama 5.7 TFLOPs 8.2 TFLOPs 24.6 TFLOPs 26.5 TFLOPs 29.5 TFLOPs 185 TFLOPs
FP32 Hesaplama 5.7 TFLOPs 8.2 TFLOPs 12.3 TFLOPs 13.3 TFLOPs 14.7 TFLOPs 23.1 TFLOPs
FP64 Hesaplama 384 GFLOPs 512 GFLOPs 768 GFLOPs 6.6 TFLOPs 7.4 TFLOPs 11.5 TFLOPs
VRAM 16 GB GDDR5 4 GB HBM1 16 GB HBM2 16 GB HBM2 32 GB HBM2 32 GB HBM2
Bellek Frekansı 1750 MHz 500 MHz 945 MHz 1000 MHz 1000 MHz 1200 MHz
Data Yolu 256-bit 4096-bit 2048-bit 4096-bit 4096-bit 4096-bit
Bant Genişliği 224 GB/s 512 GB/s 484 GB/s 1 TB/s 1 TB/s 1.23 TB/s
Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma
TDP 150W 175W 300W 300W 300W 300W
Başa dön tuşu