AMD CPU-spekulaatio (Zen6/Zen7 ...)

Jos siellä on pelkkä iGPU CAD/CAM-käyttöön tarkoitetuissa koneissa niin se koneen keskusmuistin muistikaista ei todellakaan ole suurin sen koneen ongelmista.



AI-kupla on huutajien spekulointia?

Ja hienosti muokkasit lainausta että väitit minun sanoneen jotain mitä en sanonut. En väittänyt, että DDR5n korkea hinta on tilapäinen ilmiö, vaan että massiivinen hintaero DDR4n ja DDR5n välillä on tilapäinen ilmiö.



Analyytikoita on monenlaisia jotka sanovat eri asioita, ja ymmärtävät eri asioita. Nyt kun ollaan keskellä AI-hypeä, monet huutavat kilpaa hypen mukana vaikkeivät oikeasti ymmärrä asioita.

Ja analyytikot eivät suunnittele prosessoreita. Minä suunnittelen.

Tässä ei ole päätä eikä häntää. TSMC ei tee mitään DRAM-muistipiirejä.

TSMC myy kokonaisia valmistettuja piikiekkoja, ja tyypillinen CPU-piilastu on paljon pienempi kuin tyypillinen näyttis- tai neuroverkkokiihdytinpiilastu, joten niitä CPU-piilastuja mahtuu kokonaiselle piikiekolle paljon enemmän, jolloin samalla rahalla saa enemmän piilastuja. Tässä ei ole kyse mistään TSMC:n "matalammista hinnoista".

TSMC:llä ei ole siis mitään yhtä hintaa kiekolle vaan ne hinnoitelaan monen ei muuttujan perusteella ja yksi on riskianalyysi. CPU coreja voi olettaa tuotettavan todennäköisemmin vakaalla varmalla kapasiteetilla VS AI-piirit joten TSMC tarjoaa halvemmala hnnalla CPU kiekkoja. Mikä tosssa on niin outoa muka. Paitsi sinä et tajua sitä.


Joo, kun sitä tyrkytetään hirveällä innolla joka paikassa. Ensimmäisiä AI-koodaus-katastrofeja on myös päässyt jo uutisiin


Sillä että (nyky-)AI on roskaa on melko vähän tekemistä laskentatehon kanssa. Sillä on tekemistä sen kanssa, että LLM on teknisesti väärä ratkaisu useimpiin asioihin, mutta nyt LLMiä tungetaan joka paikkaan, asioihin mihin ne eivät sovi.



Tässä lauseessa ei ole päätä eikä häntää. Kuinka vaikeaa on käyttää esimerkiksi sijamuotoja?



Nimenomaan eivät tarvi DRAM-kaistaa, vaan viivettä ja välimuistikapasiteettia.



Viive yleensä paljon tärkeämpi kuin kaista. Kolmen prosentin ero on melko merkityksetön.

winrar-compression.jpg




Tämä on usein se ainoa asia mihin kotikäyttäjä sitä DRAM-kaistaa tarvii



Ei, se että taustalla on auki prosesseja jotka eivät tee juuri mitään eivät mitenkään merkittävästi nosta muistikaistan tarvetta.



Riippuu täysin siitä, että millä tavalla ja missä järjestyksessä sitä dataa käsitellään.

Kun et ymmärrä miten prosessori toimii, niin mutuilet näitä päästäsi.

Prosessorissa ei ole mitään käskyjä siihen, että tehdään suuria DMA-siirtoja, jotka tarvitsevat paljon kaistaa. Siellä on käskyjä, jotka tekevät yksittäisiä latauksia tai tallennuksia, ja yleisimmät leveydet mitä softat lataavat tai tallettavat kerrallan on 32, 64 ja 8 bittiä, joskin AVX:llä on mahdollista tehdä 256-bittisiä ja AVX-512lla 512-bittisiä muistioperaatiota kerrallaan, JOS algoritmi on vektoroitu.

Kun tehdään 32-bittinen lataus eikä sitä löyty välimuistista, sillä datalla kestää satoja kellojaksoja saapua DRAMista, eikä sillä, DRAMin kanavamäärällä ole tyypillisesti mitään vaikutusta tähän nopeuteen.

DDR4lla tehdään burst-siirto jossa 64-bittisellä kanavalla siirretään 8 peräkkäistä 64-bittistä data-alkiota kerrallaan että ladataan kokonainen 64-tavuinen välimuistilinja.
DDR5lla tehdään burst-siirto jossa 32-bittisellä alikanavalla siiretään 16 peräkkäistä 32-bittistä data-alkiota kerrallaan että ladataan kokonainen 64-tavuinen välimuistilinja. (ja näitä voidaan sitten tehdä kaksi rinnakkain, saman DIMMin molemmille eri alikanaville)

Se itse siirto muistivylän yli kestää alle nanosekunnin murto-osan, mutta sen haun viive on silti yli 100 nanosekuntia.
Pullonkaula ei yleensä ole siinä väylässä, vaan muistin viiveissä.

Toki siellä välimuistissa on sitten prefetchereitä jotka usein alkavat latailemaan jo seuraavia välimuistilinjoja kun edellisiä accessoidaan, ja näin luo lisää liikennettä sinne muistiväylälle, mutta se, kuinka hyvin nämä toimivat riippuu hyvin paljon siitä, mitä softa tekee.
Käytännössä kuitenkaan yhdeltä ytimeltä ei pystytä laukomaan niin paljoa muistiaccesseja että niillä saataisiin esim. kaksikanavaista DDR4-muistiohjainta saturoitua millään järkevillä tosimaailman koodeilla,
kaistariippuvaisia tilanteita saadaan CPUn toimesta aikaiseksi lähinnä vain kun hyvin paljon muistiaccesseja tekee yhtä aikaa moni CPU-ydin ja ne muistiaccessit ovat osoitteiltaan hyvin lineaarisia, että nuo prefetcherit toimivat hyvin.



Tästäkään lauseesta ei saa mitään selvää. Voisitko yrittää kirjoittaa selkeää suomea?



Miten määritelet "laskennan" ?

L3-välimuistin määrä on myös kasvanut moninkertaisesti että muistiaccessien tarvii harvemmin mennä DRAMiin asti.

2011 Sandy Bridgessä oli 4 ydintä, 256-bittinen AVX-datapolku, muistina 128 bittiä DDR3-1333, L3-välimuistia 8 megatavua.
2026 zen5n eniten myydyssä mallissa on 8 ydintä, 512-bittinen AVX512-datapolku, muistina tyypillisesti 128 bittiä DDR5-5600, L3-välimuistia tyypillisesti 32 megatavua.

Maksimikellotaajuudet n. 4 vs 5.5 GHz, monen säikeen kellot n. 3.5 vs 4 GHz.

Muistikaistaa siis tyypillisessä nykyprossussa n 4.2 kertaa enemmän kuin 15 vuotta sitten, ja välimuistia/säie 2 kertaa enemmän.

Laskentateho taas - montako kertaa enemmän, riippuu totaalisesti siitä, mitä laskentetehoa mitataan. Jos mitataan maksimaalisia flopseja jossain hyvin säännöllisessä äärimäisen optimoidussa monisäikeisessä numeronmurskauskoodissa(josta zen5lle on vektoroitu AVX-512-versio), niitä on toki zen5lla
luokkaa 9 kertaa enemmän (jolloin laskennan ja kaistan erojen suhde on 2.14), mutta käytännössä mitkään noista ehdottamistasi kotikäyttäjän workloadeista eivät tällaista koodia sisällä. Se "yleinen suoritusnopeus" tyypillisellä koodilla mitä useimmiten on ajossa jää aika lailla samaan luokkaan kuin tuo kaistojen suhde vaikka olisi paljon säikeitä ajossa, sitten kun onkin vähemmän säikeitä ajossa, se jää vielä pienemmäksi.

Ja tosiaan kun sillä zen5lla on 4x enemmän välimuistia, 2x enemmän välimuistia/säie, niin sitä DRAMia tarvii accessoida keskimäärin vähemmän/laskuoperaatio



Jospa nyt yrittäisit ottaa selvää, mitä tapeout tarkoittaa sen sijaan, että tulet mutujankkaamaan asioista, joista olet pihalla kuin lumiukko.

Tapeout tarkoittaa sitä, että piirin design on löyty lukkoon ja sen valmistuksen valmisteleminen alkaa.


Se kaikki piirin kehitystyö ja oleellinen testaus pitää tapahtua ennen tapeouttia.

(tai, jos testausta jatketaan tapeoutin jälkeen ja jos piiristä löytyy vakavia isompia bugeja tapeoutin jälkeen, sitten pitää (hyvin kalliilla) tehdä uusi tapeout ja viivästää tuotteen markkinoilletuloa, tosin joitain äärimmäisen pieniä bugikorjauksia joiden vaikutus on hyvin paikallinen voidaan tehdä halvemmalla ilman täyttä uutta tapeouttia, mutta viive markkinoilletuloon silti samaa luokkaa)
Jep. Ja ottaen huomioon, etttä omien avaintojen mukaan 80 % koneiden käytöstä on Jonnet pelaamassa Roblox. Niin tähän etenkin toinen kampa varmasti auttaisi, vaikka ihmeen hyvin nytää pyörivän.
Koulun kaikki opiskeluun oppilaille tarkoitetut koneet on samoja. Ta en voi tietää koko koulun tilannetta. Mutta yleensä ns ATK uokka koneet on kaikki samoja. Eiköhän toisen muistikamman saisi jos oikesti tarvitsisi ja perustelisi. On koulussa 1 5 akselinen työstökone. 2012 Opettelin käytää GibsCAmiä e4300 kellotettuna (tai joku vastaava cpu) ja 4 gt DDR2 ja HD4850 (vissiin 1 gt kortti). Mutta eiköhän ohjelmisto ole bloatettu.
Pahittelut jos olen vääristekkyt sanomisiasi ei ole ollut tarkoituksellista. Foorumin maalaus lainaa tominto bugitti (kuten moni muukin asia esim editorissa.


En jaksa kaikkia viestiä lukea, mutta tämän olet postanut ketjuun: Tämänhetkinen tilanne jossa DDR5 on sairaan kallista on äärimmäisen tilapäinen. vastasin tuon olevan vain AI kuplahuutelian spekulaatiota. Siis aika provokatiivinenvastaukseni myömnnän.
 
Viimeksi muokattu:

Statistiikka

Viestiketjuista
306 591
Viestejä
5 195 335
Jäsenet
82 890
Uusin jäsen
DanielK

Hinta.fi

Back
Ylös Bottom