AMD, CDNA Mimarili Instinct MI100 GPU Hızlandırıcısını Duyurdu

RDNA 2 grafik mimarisine dayanan RX 6000 serisi ekran kartları kullanılmaya başladı. Artık RX 6700 ve RX 6500 serisi üzere daha hesaplı kartlar beklerken AMD’den yüksek performanslı bilgi süreç alanında yeni bir atak geldi. Kırmızı ekip, “bilimsel iş yükleri için dünyanın en süratli HPC GPU hızlandırıcısı” olarak tanımladığı AMD Instinct MI100 Accelerator’ı tanıttı.

AMD, Instinct MI100’ün “hesaplama ve orta irtibat performansında dev bir sıçrama” sağlamak için sıfırdan inşa edilen yeni CDNA mimarisini kullandığını belirtti. Geçmiş HPC hızlandırıcılar ile kıyaslandığında ise yaklaşık 3,5 kat (FP32) performans artışı ve yapay zeka süreç hacmi için yaklaşık 7 kat (FP16) performans artışı sunuluyor.
MI100 GPU’nun arkasındaki temel teknolojiler ortasında şunlar yer alıyor:
- Makine tahsili için üstün performansa sahip orijinal bir Matrix Core Teknolojisi.
- 64 GB/sn CPU – GPU bant genişliği ve 276 GB/sn’ye kadar eşler ortası (P2P) bant genişliği performansı için AMD Infinity Fabric Link Teknolojisi.
- 11,5 TFLOPS’a kadar FP64 performansı (veya 23,1 TFLOPS en yüksek FP32 performansı) için PCIe Gen 4.0 ilişkisi.
- Ultra süratli HBM2 bellek teknolojisi.

Yeni Instinct MI100 hızlandırıcı kartlar Oak Ridge Leadership Computing Facility tarafından bir mühlet test edildi. Tesis yöneticisi Bronson Messer, MI100’ün test platformlarında “diğer GPU’lara kıyasla 2-3 kata kadar performans artışı” sağladığını söyledi. Son olarak güç verimliliği tarafında iyileştirmeler yapıldığı da belirtiliyor.
AMD Radeon Instinct Hızlandırıcı Özellikleri
| Accelerator Name | AMD Radeon Instinct MI6 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI100 |
|---|---|---|---|---|---|---|
| Mimari | Polaris 10 | Fiji XT | Vega 10 | Vega 20 | Vega 20 | Arcturus |
| Üretim | 14nm FinFET | 28nm | 14nm FinFET | 7nm FinFET | 7nm FinFET | 7nm FinFET |
| Çekirdek | 2304 | 4096 | 4096 | 3840 | 4096 | 7680 |
| Frekans Suratı | 1237 MHz | 1000 MHz | 1500 MHz | 1725 MHz | 1800 MHz | ~1500 MHz |
| FP16 Hesaplama | 5.7 TFLOPs | 8.2 TFLOPs | 24.6 TFLOPs | 26.5 TFLOPs | 29.5 TFLOPs | 185 TFLOPs |
| FP32 Hesaplama | 5.7 TFLOPs | 8.2 TFLOPs | 12.3 TFLOPs | 13.3 TFLOPs | 14.7 TFLOPs | 23.1 TFLOPs |
| FP64 Hesaplama | 384 GFLOPs | 512 GFLOPs | 768 GFLOPs | 6.6 TFLOPs | 7.4 TFLOPs | 11.5 TFLOPs |
| VRAM | 16 GB GDDR5 | 4 GB HBM1 | 16 GB HBM2 | 16 GB HBM2 | 32 GB HBM2 | 32 GB HBM2 |
| Bellek Frekansı | 1750 MHz | 500 MHz | 945 MHz | 1000 MHz | 1000 MHz | 1200 MHz |
| Data Yolu | 256-bit | 4096-bit | 2048-bit | 4096-bit | 4096-bit | 4096-bit |
| Bant Genişliği | 224 GB/s | 512 GB/s | 484 GB/s | 1 TB/s | 1 TB/s | 1.23 TB/s |
| Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma |
| TDP | 150W | 175W | 300W | 300W | 300W | 300W |