MMX, SSE ve AVX Nedir?

Bilgisayarlarımızda yer alan işlemciler aslında isminden da anlaşılabileceği üzere birtakım komut setleri aracılığıyla bizim yaptığımız süreçlerin elektriksel olarak karşılığını düzenleyen ve her şeyin çalışmasını sağlayan en temel donanım. Bu sırada, çeşitli gayeler için çeşitli komut setlerinden yararlanıyoruz. MMX, SSE ve AVX ise işlemcilerimizde kullandığımız komut setlerinden birkaçı.
Yeni jenerasyon işlemcilerin de yaygınlaşması, bilgisayarların bilimsel süreçlerde yahut çeşitli iş yüklerinin çözülmesinde sıkça kullanılmasıyla bir arada, süreci hızlandırmak ismine ortaya çıkan MMX, SSE ve AVX’e bu yazıda ayrıntılıca göz atacağız.
Eski Vakitlerde İşlemciler ve Komut Setleri
Yıllar yıllar öncesine, 1980’lere kadar dönelim. Bir yandan işlemci pazarının önderi ve en büyüğü olan Intel, bir yandan da AMD’nin sıkı bir rekabet anlayışıyla piyasayı kavurduğu vakitler. Tıpkı günümüzde olduğu üzere. 8-bit yonga kullanan Commondore 64 üzere bilgisayarların tersine masaüstü tarafında “PC” ismini verdiğimiz bilgisayarlar çok daha gelişmiş, 16-bit mimarisinden 32-bit yongalara süratli bir geçiş süreci başlamıştı.
Mimarileri “bit” ile söz ederken kullandığımız 16-bit, 32-bit, 64-bit üzere terimlerdeki sayılar aslında işlenebilecek bilgilerin büyüklüğü ve mimarinin gelişmişliğine dair bizlere fikir veriyor. Bu bedellerin büyüklüklerini 2’nin üssü cinsinden hesaplayabilirsiniz.
İşlemcilerin İşlediği Data Tipleri
İşlemciler, yapıları gereği skaler yahut tamsayı (integer) data tiplerini kullanıyordu. Bunun ne olduğunu anlayabilmeniz için tekrardan sizi geçmişe götürüp matematiğin temel bahislerinden birisine merhaba diyeceğiz. Buradaki manasıyla skaler; sadece büyüklüğü ile belirlenebilen, rastgele matematiksel sürecin tek bilginin kıymetleri kullanılarak gerçekleşmesine deniliyor. Kısaca SISD (single instruction, single veri / tek talimat, tek veri) manasına geliyor.
Yani o periyodun işlemcilerinin kullandığı komut biçimine bakacak olursak, iki bilgi pahasının birbirine eklenmesi süreci, çalışma mantığından ötürü sırf bu iki sayı için gerçekleşiyor. Bahsettiğimiz birebir sayıyı, 16 adet sayının yer aldığı kümeye eklemek için 16 adet komut vermeniz gerekiyor. O devir için işlemcilerin genel itibariyle hudutları bu kadardı.
Ayrıyeten devrin Intel 80386SX ve misal işlemcileri integer (tamsayıları söz eder, örneğin 3 yahut -5 gibi) tipindeki dataları işleyebiliyorken, float (ondalık sayıları tabir ederken kullanılır, örneğin 5.80 yahut 6.50 gibi) bilgi tipindeki sayıları işlemek için maalesef 80387SX üzere diğer bir işlemciye ve işlemciye ne yapması gerektiğini söyleyen özel bir instruction sete (komut seti) muhtaçlık vardı.
Bilgisayar ihtilalinin yeni yeni başladığı ve gerçekleştiği yıllardan bahsettiğimiz için, bu söylediklerimiz tahminen birçok şahsa şaşırtan gelse de, her teknolojik aygıtta olduğu üzere işlemciler de günümüzdeki üzere çok gelişmiş değildi. X86 işlemciler de ayrıyeten float (ondalık/kayan noktalı) sayıları işleyebilmek için x87 ismi verilen farklı bir alt mimariye sahip yardımcı işlemcilere muhtaçlık duyuyordu. Günümüzde ise float bilgi tiplerini işlemek için farklı başka çipler kullanmak yerine, ikisinin de tek yongada yer aldığı işlemcileri kullanıyoruz.
Intel 80486, Yardımcı İşlemcileri Ortadan Kaldırıyor
Takvimler Nisan 1989’u gösterdiğinde Intel’in piyasaya I486 işlemci ailesinin birinci üyesi olan 80486’yı sürmesiyle birlikte float data tiplerinin işlenmesi için yardımcı işlemcilere gerek kalmamıştı. Bu işlemcilerin içerisinde float dataların işlenebilmesi için gereken FPU (Floating Point Unit / Entegre Kayan Nokta Birimi) isminde bir ünite bulunuyor. İşlemcide büyük bir alan kaplamasına karşın performans manasında önemli manada avantaj sunuluyor.
Her şeye karşın tekrar de tüm yapı skalerdi ve 80486’dan sonra 1993’de piyasaya sürülen masaüstü işlemcisi olan birinci Intel Pentium’da da bu böyleydi. Ta ki, 3 yıl sonrasına yani 1996 yılının Ekim ayına kadar.

Intel 80486’nın mikroskobik imajı. Beyaz dikdörtgen içerisinde yer alan kısım FPU ünitesi.
MMX nedir?
Matematiksel olarak sayılar birtakım farklı hallerde bir ortada toplanabilir. Bu belli gruplamaya vektör denilir. Daha da anlaşılır bir biçimde tabir edecek olursak, yatay (horizontal) ve dikey (vertical) çalışan bedelleri liste biçiminde düşünebilirsiniz. İşte MMX teknolojisiyle birlikte işlemci dünyasında vektör matematiğinin yapılabilmesinin önü açıldı.
Bu teknoloji başlangıçta yalnızca integer bilgi tiplerine uygun olduğu için epey sonluydu. Aslında bunu yapmak için temelde FPU (Floating Point Unit) ünitesi kullanılıyor. Bu nedenle vektörel matematiği kullanmak için birtakım MMX komutları ateşlendiğinde rastgele bir float (ondalık/kayan noktalı sayılar) hesaplaması yapılamayacağını programcıların bilmesi gerekiyordu.
Pentium’da yer alan FPU ünitesi 64-bit yazmaçlara sahip. MMX süreçleri için her biri iki adet 32-bit, 4 adet 16-bit yahut 8 adet 8-bit tamsayı ile bir arada kullanılabiliyor. Asıl vektör olan ise temelde bu sayı kümeleri. Üzerlerinde işlenecek olan her komut aslında kümede yer alan tüm bedeller üstünde yürütülüyor.
Masaüstü işlemcilerde kullanılan tip bilgi sistemine ise SIMD (single instruction, multiple data) ismi veriliyor. SIMD, evvelden beri masaüstü işlemcilerin geleceğe yönelik attığı en büyük adımlardan birisi olarak görülmekte. Pekala bu formda bir sistem kullanmanın avantajları nedir diye soracak olursanız, hesaplama gerektiren her şeyde kıymetli seviyede olmakla birlikte 3B grafiklerin ve multimedyaların işlenmesinde verimliliğin artmasını sağlanıyor. Mesela MMX, vertex processing yahut chroma keying ile alpha compositing’in işlenme suratında kıymetli ölçüde tesirli bir komut seti. Maalesef floating point (kayan noktalı sayı) MMX kullanılırken tam manasıyla işlenemediğinden, MMX pek kullanılmıyor ve verimli olmuyordu.
AMD, 3DNow ile Rekabeti Artırıyor
AMD tarafından bu sorunu çözmek ve rekabeti kızıştırmak ismine 1998 yılında 3DNow teknolojisi geliştirildi. Birinci defa bu teknolojiyi kullanan AMD K6-2 işlemcilerde alışılageldik Intel işlemcilerden farklı olarak temel x86 komut setine SIMD komutları eklenerek vektörlerin çok daha verimli işlenmesi sağlandı.
MMX komut setinin gelişmiş versiyonu olarak düşünebileceğimiz AMD 3DNow, MMX SIMD kayıtçılarını (registers) single-orecision (32-bit) floating-point bilgileri aritmetik süreçleri (toplama, çıkarma, çarpma) destekleyecek formda artırdı. Klasik yavaş x87 FPU yerine AMD 3DNow takviyeli yazılımlar duruma bağlı olarak 4 kata kadar daha süratliydi. Bu AMD K6’nın, rakibi olan Intel Pentium II işlemcisine göre daha uygun performans göstermesini sağlıyor.
Yeniden de bu teknoloji yazılım dünyası tarafından pek istek görmedi ve yaygınlaşmadı.
Ağustos 2010 yılında da gelecekteki AMD işlemcilerde (PREFETCH ve PREFECHW komutları dışında / bu komutlar L1 önbelleğine en az 32 bayt bilgiyi evvelce yükler.) 3DNow’un kaldırılacağı duyuruldu. Birebir komutlar Intel Bay Trail mimarisini kullanan işlemcilerde de (ilgili mimariye sahip Atom, Celeron, Pentium) bulunuyor.

AMD K6-2 işlemcisinin mikroskobik manzarası.
SSE’nin Doğuşu
Bilirsiniz, teknoloji dünyasında rekabet olmadan ilerleme ve gelişme görmek maalesef pek mümkün olmuyor. Firmalar, birden fazla vakit karşılarında dişli bir rakip görmediği için, maliyet bakımından da zora girmek istemediklerinden, tıpkı teknolojileri kullanıcılara kullandırmaya devam eden bir stratejiyi benimsedi. Intel, AMD’nin de atılımıyla, masaüstü işlemci pazarının düzgünce kızışmasıyla bir arada 1999 yılında yeni bir çıkış daha yaptı.
Intel Pentium III’ün piyasaya sürüldüğü 1999 yılında, o devirde büyük tesir bırakacak olan “shiny vector” sürece özelliği SSE (Streaming SIMD Extensions) ismi verilen komut seti teknolojisi, bilgisayar dünyasına sunuldu. Bu sefer Intel çok zekice bir atılım yapmış, FPU’dan başka olmak üzere ekstradan 8 adet 128-bit register ve birtakım komut setlerini işlemcilerine eklemişti. Başka registerların kullanılması FPU ünitesinin artık bu emelle çok kullanılmasına gerek kalmadığı manasına gelse de, Pentium III maalesef FP (floating point) talimatlarla birlikte hala SSE komutları almıyordu. Ayrıyeten yeni özellik yalnızca 4 adet 32-bitlik float bilgileri destekledi.
Her şeye karşın floating point SIMD komutlarının (instructions) sunulması ses ve imaj sürece, görüntü kodlama / kod çözme, evrak sıkıştırma ve çıkarma üzere birçok alanda büyük oranda performans artışı sağladı.
SSE2, SSE3 ve SSE4
Intel uzun vadede SSE teknolojisinden ziyadesiyle yararlanmayı planladığı için çok fazla ehemmiyet veriyordu. 2001 yılında Pentium 4 işlemcisi ile birlikte SSE’nin yeni kuşağı olan SSE2 komut seti ortaya çıktı. SSE2’de farklı bilgi çeşitlerinin işlenmesine yönelik takviye çok daha düzgün pozisyondaydı. Dört adet 32-bit yahut iki adet 64-bit float, tıpkı vakitte on altı adet 8-bit, 8 adet 16-bit, dört adet 32-bit yahut iki adet 64-bit olmak üzere integer tipinde bilgiler destekleniyordu. MMX registerlar hala işlemcide yer alsa da, bütün SSE ve MMX süreçleri ayrıyeten sunulan 128-bit SSE registerları ile değiştirilebiliyor.
SSE3 ise 2003 yılında Pentium 4 işlemcisinin Presscott ismi verilen yenilenmiş üretimi ile piyasaya sunuldu. SSE3 ile bir arada 13 adet daha yeni instruction içeriyordu ve birebir register üzerinde bulunan pahalar ortasında birtakım matematiksel süreçleri yapabilme yetisi kazanmıştı.
3 yıl sonra, Ocak 2006’da Intel tarafından Core kuşağı işlemciler piyasaya sunuldu. Bu işlemciler yalnızca Pentium’ların yerini almakla kalmamış, SIMD teknolojisinin (SSSE3 -Supplemental SSE) sonuncu sürümü olan SSE4 ile birlikte merhaba demişti. AMD tarafında da 2007 yılında Barselona mimarisi de kendisine mahsus SSE4’e sahipti.
Bu SSE sürümüne yönelik küçük bir güncelleme daha 2008 yılında Nehalem mimarili Core işlemciler ile birlikte yayınlandı ve Intel tarafından SSE4.2 olarak isimlendirildi. (Orijinal sürüm aslında bundan ötürü SSE4.1 olarak da biliniyor.) SSE4.2’de registerlarda rastgele bir değişiklik meydana gelmedi ama daha fazla instruction eklenerek mantıksal ve matematiksel süreçlerin önü ziyadesiyle geleceğe dönük açıldı.
2008 yılının sonlarında artık masaüstü işlemci pazarında hem Intel hem de AMD, MMX’i SSE4.2 komut setiyle işleyen işlemciler piyasaya sunuyor. Tıpkı vakitte başta oyunlar olmak üzere birçok yazılım da bu özelliklere gereksinim duymaya başladı.

AMD SSE4a dayanaklı bir işlemcinin mikroskobik imgesi. Görsel Kaynağı: Fritzchens Fritz
Yenilik Vakti: AVX Doğuyor
Intel, 2008 yılında şu ana kadar geliştirdiği SIMD yapısında büyük oranda bir değişiklik yapmak üzere sıkı bir biçimde çalıştığını duyurdu. 2011 yılında Sandy Bridge işlemciler AVX komut setiyle birlikte bilgisayar dünyasına sunuldu.
Her şey ikiye katlanmıştı. İki kat daha fazla vektör registeri ve iki kat daha büyük bir yapı. Artık 16 adet 256-bit register yalnızca 8 adet 32-bit yahut 4 adet 64-bit float sayıyı alabiliyordu. Bilgi formatlarının kullanımı bakımından SSE’ye kıyasla daha kısıtlayıcı olsa da, bu komut seti hala işlemcilerde yer alıyordu.
Bahsi geçen vakte kadar derleyicilerden tutun, birçok kompleks yazılım vektör matematiği için yazılımsal manada uygun bir dayanağa sahip olmuştu. 3.8 GHz suratında çalışan i7 2600K üzere bir işlemci, AVX komutlarıyla 230 GFLOPS (bir saniyede milyarlarca floating point işlemi) kadar süreç yeteneğine sahip. İşlemcinin kalıp boyutu da göz önüne alındığında, hiç de makûs bir kıymet olmadığını söyleyebiliriz.
Pekala ya AVX nitekim 3.8 GHz süratte çalışsaydı ne olurdu? AVX kullanılırken, ne kadar kullanılıyorsa fizikî yongaya da o kadar çok iş düşüyor. Bu nedenle ısınma çok fazla olacağından, Intel aldığı kararla ısınmayı azaltmak ve güç tüketimini makul düzeye çekmek için AVX kullanılırken saat suratını yüzde 20 kadar düşürdü. Maalesef çağdaş bir işlemcide gelişmiş SIMD süreçleri yapmak için buna razı olmalısınız.
AVX ile birlikte sunulan bir öbür gelişmiş yenilik ise birebir anda 3 adet bedelle çalışabilmeyi sağlamasıydı. SSE’nin bütün versiyonlarında yapılan süreçler, iki bedel ortasında karşılığın akabinde registerlardan birisinin değiştirilmesiyle yapılıyordu. AVX ise SIMD süreçlerini yaparken, özgün bedelleri bozmadan sonucu başka bir register içinde tutuyor.
AVX2’nin Çıkışı ve FMA
2013 yılında Intel tarafından Haswell mimarisiyle piyasaya sürülen 4. Jenerasyon Core işlemcilerde AVX2 ile bir arada FMA (Fused Multiply-Accumulate) ismi verilen bir ünite daha eklendi. Olağanda bu özelliğin AVX ile bir alakası olmamasına ve daha sonraki iki sürecin gerçekleşmesini sağlayan talimatı verip uygulama yeteneği skalerde çalışmasına karşın, vektör ve matris matematiğinin kullanıldığı yerlerde de değerli ölçüde yararlı oluyordu.
Intel tarafından piyasaya sunulan işlemcilerde kullanılan FMA uzantıları alışılagelinenin dışında bir halde AMD’nin FMA eklentisinden farklıydı. Hatta o kadar farklı ki, neredeyse birbirleriyle tamamıyla uyumsuzlar. Bunun asıl sebebi olarak Intel tarafından sunulan FMA’nın 3 farklı kıymetle çalışması gösterilebilir. Örneğin iki adet kaynak paha ve bir adet yanıt yahut üç adet kaynak pahanın yerine geçen bir adet yanıt halinde.
AMD’nin sunduğu FMA’da ise dört adet işlenen paha mevcut. Bu nedenle Intel’in FMA yapısından farklı olarak 3 adet sayı kullanarak ilgili matematiğin yapılması mümkün. Tıpkı vakitte karşılığın da bu bedellerden biriyle değiştirilmesi gerekmiyor. FMA4 aslen matematiksel manada bir evvelki FMA3’den çok daha âlâ bir yapı olmasına karşın, programlama manasında ve işlemciye ilgili yapıların dahil edilmesi manasında biraz daha zorlayıcıdır.

AMD ve Intel işlemcilerin kesiştiği komut seti uzantıları. – Görsel Kaynağı: Testbit
AVX-512
Intel, şimdi AVX2 komut setinin yeni piyasada uzunluk göstermeye başladığı vakitlerde, AVX2’nin yerini alması düşünülen AVX-512 için hazırlanmaya başlamıştı. Asıl maksat “her şeyin daha birçoklarını, çok fazlasını” sağlayabilmekti. Yalnızca yazmaç (register) sayısı iki kat daha artırılmayacak, boyut manasında da iki katı daha büyüyecek ve birçok yeni komutun eklenmesinin dışında eskiye dönük dayanak sağlanacaktı.
AVX-512’nin birinci sefer kendini gösterdiği işlemci Intel’in üstün bilgisayarlar için geliştirdiği ikinci kuşak çok çekirdekli işlemci olan Xeon Phi 7200 idi. Bu kusursuz işlemcinin 72 fizikî çekirdeğe ve 288 iş parçacığına sahip olduğunu söylemeden geçmeyelim.

AVX-512’de evvelki revizyonlardan daha farklı olan şey, yeni gelen vektör komut setinin 19 adet alt kümeye ayrılması. Bunlar uyumluluk hedefiyle oluşturulmuş olanlar, AVX-512F ve çok özel olan komutlardı. Bu ekstra komut setleri aslında integer FMA, reciprocal (karşılıklı) matematik ve evrişimli hudut ağları oluşturma algoritmalarıyla süreç yaparken büyük ölçüde kullanılıyor.
AVX-512 birinci çıktığında Intel’in iş bilgisayarları, sunucular ve üstün bilgisayarları hedefleyen en değerli kozlarından birisiydi lakin artık son çıkan 10. Jenerasyon Ice Lake ve 11. Kuşak Tiger Lake mimarisi Core işlemciler de bu komut setini son kullanıcıya sunuyor. Yanlış anlamadınız, bu artık 512-bit vektör ünitesine sahip hafif bir laptop alıp kullanabileceğiniz manasında geliyor.
AVX-512’nin Taşınabilir Aygıtlara Uygunluğu ve Dezavantajları
AVX-512 düzgün bir teknoloji olduğu kadar maalesef kimi eksi taraflarıyla de biliniyor.
Taşınabilir Aygıtlara Uygun Olmaması ve Saat Suratında Düşüş
Bir merkezi işlemcide yer alan registerların tümü, aşağıdaki görselde yer alan çift çekirdekli Skylake işlemcide görebileceğiniz üzere genel itibariyle “register file” ismi verilen bir kalıp içerisinde küme halindedir.

Görsel Kaynağı: TechSpot
Görselde sarı kutu içerisine alınan kısım vektör registerini gösterir. Kırmızı kutucuk içerisindeki kısım ise integer registerin muhtemel yeridir. Vektör registerin büyüklüğü kesinlikle dikkatinizi çekmiş olmalı. Görseldeki bahsi geçen Skylake işlemci AVX2 için olan 256-bit yazmaçları (register) kullanıyor. Bu nedenle birebir kalıpta bir işlemci için AVX-512 yazmaçları bunun dört katı kadar daha (bitlerin ikiye katlanması için 2 kat, register count’un da ikiye katlanması için 2 kat) büyük olacaktır.
Sizce boyutun epey değerli olduğu dizüstü ve taşınabilir aygıt bölümü için üretilen küçük işlemcilerde vektörler için kullanılan yazmaçların bu kadar yer kaplaması âlâ bir şey mi? İşlemcilerin alanı kelam konusu olduğunda, her milimetre kare hayli kıymetli.
Ayrıyeten yazının başlarında da değindiğimiz üzere, vektör matematikler yapılırken AVX üzere özelliklerin kullanılmasının ziyadesiyle ısınmaya neden olmasından ötürü maalesef işlemcinin saat suratları otomatik olarak düşürülüyor. Bu nedenle taşınabilir platformlar üzere taşınabilirliğin ve düşük güçle çalışmanın değerli olduğu aygıtlarda AVX-512 kullanımı çok daha fazla güce gereksinim duyduğu için, AVX-512 olmayan işlemcileri kullanmadan evvelkine göre daha berbat olacak. Çünkü işlemciler AVX-512 kullanılarak bir süreç yerine getirilmeye çalışıldığında daha fazla güce muhtaçlık duyacaklar ve daha düşük saat suratlarıyla çalışacaklar.
Her İşlemcideki AVX-512 Komut Seti Farklı
AVX-512’nin neden olduğu sorunlar maalesef ki yalnızca taşınabilir işlemcilere tesiriyle sonlu değil. Vektör matematiğine hakikaten gereksinim duyan ve sıkça kullanılacak yazılımların geliştiricileri, verimliliğin değerli olduğu sunucular ve iş istasyonları için maalesef birden çok sürüm geliştirmek zorunda kalacaklar. Bunun asıl nedeni ise bütün AVX-512 takviyeli işlemcilerin hepsinin tıpkı komutları sunmaması.
Örneğin IFMA seti (Integer Fused Multiply-Accumulate) yalnızca Tiger Lake, Ice Lake ve Cannon Lake işlemcilerde mevcut. Copper ve Cascade Lake işlemciler her ne kadar sunucu ve iş istasyonları için üretilmiş olsalar da bu dayanağı sunmuyor.
AMD tarafının ise CPU’lar için AVX-512 ile ilgilenmediğini, takviye sunmayı planlamadıklarını söyleyebiliriz. Çünkü ekran kartı üreticisi olmanın verdiği tecrübe ve görüş farklılığından olsa gerek, AMD bu usul büyük vektör matematiğinin hesaplanması için GPU’ların kullanılmasının daha uygun olduğunu düşünüyor. AMD ve NVIDIA bu biçim kullanımlar için halihazırda aslında çok daha performanslı özel ekran kartları üretiyor.
Sonuç ve Geleceğe Dair Görüşler
Yıllar öncesinden günümüze kadar CPU’ların vektör matematiği yapabilme yeteneği bilgisayar dünyasının geleceğine yönelik en büyük adımlardan birisi olarak görülüyordu. Artık işlemcilerimizin birçoğu her alanda iş görebilecek kadar yetenekli. Skaler, vektör yahut matris matematikleri yapılabiliyor, integer ve float data tipleri rahatça ek komut setleri yardımıyla işleniyor.
Tekrar de bu denklemde yıllar uzunluğu hesap edilmeyen bir şey vardı. Artık CPU’ların SIMD konusunda rakibi, paralel süreç yeteneğiyle öne çıkan GPU’lardı. 3 boyutlu grafik dünyasının neredeyse tamamı SIMD, vektör matematiği, float pahalarla ilgili olduğundan, grafik hızlandırıcı ve işlemciler de tıpkı biçimde ziyadesiyle gelişti. Artık günümüzde 500 dolardan daha düşük bir fiyata saniyede 800 milyar SIMD talimatını rahatça gerçekleştirebilecek GPU edinmek mümkün. Ve bu halihazırdaki en uygun masaüstü işlemciden bile daha süratli süreç kapasitesi manasına geliyor. Her şeye karşın GPU’ların da her matematiksel süreç için değil, muhakkak spesifik muhtaçlıkları karşılamak için geliştirildiğini unutmayın.

499 dolar bandında piyasaya çıkan referans RTX 3070.
GPU’ların SIMD yeteneğine kıyasla merkezi işlemcilerin (CPU) içerisinde yer alan komut setini kullanışlı ekstra bir tahlil olarak düşünebilirsiniz. Lakin, grafik işlemcilerin süratle gelişmesiyle bir arada, CPU’ların çok büyük vektör matematiği yapmak üzere ünitelerden oluşması artık gerekmiyor. AMD’nin AVX2’den sonra halefi olacak yeni bir sürüm geliştirmemesi de aslında bundan. Bu nedenle ilerleyen periyotlarda makul niş alanlar için özel taşınabilir SoC işlemciler de görülebileceği düşünülüyor. Bütün bunlar bir yana, Intel tarafının ise kendi geliştirmiş olduğu AVX-512 ünitesini işlemcileriyle bilgisayar dünyasına sunmaya pek istekli olduğunu görüyoruz.
Pekala gelecekte sizce AVX-1024 ünitesini görecek miyiz? Açıkçası buna yakın vakitte pek ihtimal vermiyoruz çünkü Intel büyük ihtimalle bunun yerine halihazırdaki yapıyı ek güncellemeler ve komut setleriyle güncelleyip, üzerinde çalıştığı GPU sınırına daha fazla tartı verecektir.
Her şeye karşın finalde SSE ve AVX komut setleri yazılım kesiminin vazgeçilmezi olmuş, birçok yazılımın asgarî ihtiyaçları ortasında yer almıştır. Örneğin Adobe Photoshop en az SSE4.2, makine tahsili API’si TensorFlow AVX, Microsoft Teams ise art plan efektleri için AVX2 kullanır. Bu bizlere gösteriyor ki GPU’lar her ne kadar bu işi daha düzgün yapıyor olsalar da, CPU’lar için de vektör matematiği hala değerli. Hayli süratli ilerleyen teknoloji dünyasında daha nelerle karşılaşacağız, vakit içerisinde bekleyip görelim.
Sizlerin de eklemek istediği şeyler varsa yorum yazabilir, sorularınız için Technopat Toplumsal‘de husus açabilirsiniz. Sağlıcakla kalın.
Kaynak: Technopat