AMD CPU-spekulaatio (Zen6/Zen7 ...)

Tuli vähän mietittyä, että mitä tuolla bitwise matrix multiply-accumulate-käskyllä tekee ja päädyin siihen, että se on todella nerokas käsky jolla tekee vaikka mitä:

Tuolla AMDn 16x16-versiolla voi toteuttaa esim. datan uudelleenjärjestelyn 16-bittisten simd-linjojen välillä, tai bittien uudelleenjärjestelyn saman simd-linjan sisällä, kaikille simd-linjoille erikseen.

Eli käytännössä tuo bitreverse-käsky on sisäisesti toteutettu tämän bmma-käskyn laskentayksiköllä, ja esim bittien shiftauksen ja rotatoinnin kaikille 16-bittisten ja kapeampien data-alkioiden vektorille voisi myös toteuttaa sillä, lisäksi sillä voi laskea esim xorin tai orin vektorilinjan sisällä.

Ja sillä onnistuu kätevästi esim sen tarkastaminen, että onko jotkut tietyt bitit luvun sisällä nollia.

Ja näissä pikaisesti keksimissäni käyttötavoissa ei ole vielä edes hyödynnetty tuota kolmatta inputtia mihinkään.
 
Viimeksi muokattu:

Statistiikka

Viestiketjuista
291 517
Viestejä
4 988 837
Jäsenet
80 083
Uusin jäsen
mthamala

Hinta.fi

Back
Ylös Bottom