RDNA 5 architektūroje siekiama stipriai padidinti šeiderių spartą žaidimuose

AMD tobulina savo RDNA 5 architektūrą, kurios projektavimas, tikėtina, jau pasiekė baigiamąjį etapą. Remiantis informacija, pateikta LLVM kompiliatoriui, sužinojome, kad būsimoje AMD RDNA 5 / UDNA architektūroje numatyti architektūriniai pakeitimai, kurie padidins skaičiavimo pajėgumų išnaudojimą, o tai leis pasiekti žymiai didesnį žaidimų šeiderių našumą. RDNA 5 kodinis pavadinimas yra GFX1310, ir dabar ji įgyvendina pilną „Dual-Issue VALU“ vamzdyną „Wave32“. Tai leidžia vektorių operacijas (VOP) išduoti vienu metu į GPU X ir Y aritmetinio loginio bloko (ALU) juostas. Naujasis dizainas išplečia sujungto dauginimo ir sudėties (FMA) bei kitų VOP instrukcijų, tinkamų dvigubam išdavimui (Dual-Issue), spektrą ir sušvelnina kai kuriuos registrų apribojimus, leidžiant kompiliatoriams ir šeiderio kodui atlikti intensyvesnes skaičiavimo operacijas Wave32 režimu. Tai reiškia, kad RDNA 5 FP32 skaičiavimo išteklių panaudojimas gali būti daug didesnis nei anksčiau, o tai labai naudinga FP32 intensyvioms programoms, todėl žaidėjai netrukus pajus žymų našumo padidėjimą.

AMD iš pradžių įdiegė dvigubo išdavimo VALU RDNA 3 architektūroje su „Radeon RX 7000“ serijos vaizdo plokštėmis. Tačiau vamzdynas neveikė visiškai, nes dvigubo išdavimo įgyvendinimas palaikė tik ribotą VOP instrukcijų pogrupį, neįtraukė kelių svarbių FMA variantų, reikalavo „Wave32“ režimo ir griežto registrų bankų atskyrimo, be to, kompiliatoriai dažnai jį apeidavo, o tvarkyklės jo visiškai neapdorojo. Dėl to daugelis šeiderių negalėjo išnaudoti X/Y poravimo, o išmatuotas FP32 pralaidumas dažnai smarkiai nukrisdavo žemiau aparatinės įrangos teorinio maksimumo. Tai kenkė našumui ir mažino skaičiavimo pajėgumą, ypač programose, kurios labai priklauso nuo FP32 skaičiavimo. Tai ypač pasakytina apie šiuolaikinius žaidimus, kurie apdoroja viršūnių ir pikselių šeiderius daugiausia naudodami FP32 skaičiavimą. Su naujuoju RDNA 5 dizainu žaidimų našumas turėtų labiau atitikti teorinį skaičiavimo našumą.

Parašykite komentarą

Brukalų kiekiui sumažinti šis tinklalapis naudoja Akismet. Sužinokite, kaip apdorojami Jūsų komentarų duomenys.