AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

Eikö toi vajaa 200 CU:n lippulaivapiiri olisi melko realistinen tai välttämätön siinä skenaariossa, jossa RDNA 5:llä AMD yrittäisi taas kilpailla kovemmin kuten RDNA 2 sukupolvessa?
 
Kuulostaa yhtä uskottavalta clickbait materialilta kuin navi3x kellotaajuudet, no vähintään respinnin jälkeen kelloa luvassa, eiku viimeistään navi4x:ssa, eikun. En pidättele hengitystä 512bit amd pelipiiriä odotellessa. MLID:n track record niin huono ettei kannata kiinnittää mitään huomiota siihen. Jos paremmat huhupajat alkavat tuollaisista puhumaan niin uskottavuus voisi olla nollaa suurempi.
hmm toisaalta miksi kepler_l2 näitä repostailee X:ssä jos ei ole luotettava? Toki MLIDiin on aina hyvä suhtautua skeptisesti.

1753531537841.png


Noh kaikki on spekulaatiota, mä itse veikkaan enemmän tuota 96 CU:ta, noi 600w monsterit on vähä meh varsinkin näillä helteillä:

 
hmm toisaalta miksi kepler_l2 näitä repostailee X:ssä jos ei ole luotettava? Toki MLIDiin on aina hyvä suhtautua skeptisesti.

1753531537841.png


Noh kaikki on spekulaatiota, mä itse veikkaan enemmän tuota 96 CU:ta, noi 600w monsterit on vähä meh varsinkin näillä helteillä:

Kepler tais postata spekulaation 384bit rdna5:sta jonka kertoi olevan täyttä keksintöä omasta päästä. Onko sulla linkata missä kepler väittää amd:lta olevan tulossa 512bit väyläisen ratkaisun? Aika paljon kertoo huhujen tasosta kun wccftech, videocardz tms, huhusaitit ei nosta tätä MLID:n clickbait keksintöä sivuillensa.

----
editti: Keplerin arvailut kuvassa, ei siis väitä tiedoksi/vuodoksi vaan omaksi arvaukseksi siitä mitä rdna5:ssa voisi olla tulossa
1753532592118.png

lähde: Page 21 - Discussion - RDNA 5 / UDNA (CDNA Next) speculation
 
Viimeksi muokattu:
Kunhan vaan AMD:kin lähtis 5090 tasoisten korttien kilpaan mukaan. AMD sais laitta reilummin muistia mitä Nvidia tulis vähän pöhinää sektoriin. AMD on tehnyt saman ennenkin silloin kun se lisäsäsi prosessoriytimiä vrt Inteliin. Samaten intelin pitäisi nimen omaan yrittää pelata muistin määrällä, että saisivat jotain myytyä. Intelin tuotteiden hitaus takaisi seuraavienkin mallien myyntiperusteen eikä poistaisi niiden tarvetta.
 
Kunhan vaan AMD:kin lähtis 5090 tasoisten korttien kilpaan mukaan. AMD sais laitta reilummin muistia mitä Nvidia tulis vähän pöhinää sektoriin. AMD on tehnyt saman ennenkin silloin kun se lisäsäsi prosessoriytimiä vrt Inteliin. Samaten intelin pitäisi nimen omaan yrittää pelata muistin määrällä, että saisivat jotain myytyä. Intelin tuotteiden hitaus takaisi seuraavienkin mallien myyntiperusteen eikä poistaisi niiden tarvetta.

Mielestäni ei todellakaan tarvitsisi. Toki se saisi näkyvyyttä ja löytyisi ehkä kourallinen ihmisiä maailmasta jotka sitten ostaisivat jonkun 36Gb muistilla olevan 4500€ maksavan vesijäähyä vaativan "tämä on 10% tehokkaampi kuin 5090 ja pystyy luomaan jopa 10 framea lisää jokaisen oikean framen väliin" kortin mikä vaatisi mieluusti sen 1600W virtalähteen ja "vain" 4-6 virtaliitintä vieden sen 4 korttipaikkaa ja 56cm kotelon pituutta...

Jo nytkin nämä "hinnat alkaen" 720€ ylemmän keskiluokan kortit ovat aika paljon rahaa vievä harrastus kun miettii sitä keskiverto pelaajaa joka pohtii sen 1000€ konepaketin kokoamista mihin pitäisi saada mahtumaan vielä näyttö, näppäistö, hiiri ja kuulokkeet vs sitten PS5 konsolia.. voi konsoli vielä monella voiton jos hinnat vielä kasvavat.
 
Mielestäni ei todellakaan tarvitsisi. Toki se saisi näkyvyyttä ja löytyisi ehkä kourallinen ihmisiä maailmasta jotka sitten ostaisivat jonkun 36Gb muistilla olevan 4500€ maksavan vesijäähyä vaativan "tämä on 10% tehokkaampi kuin 5090 ja pystyy luomaan jopa 10 framea lisää jokaisen oikean framen väliin" kortin mikä vaatisi mieluusti sen 1600W virtalähteen ja "vain" 4-6 virtaliitintä vieden sen 4 korttipaikkaa ja 56cm kotelon pituutta...

Jo nytkin nämä "hinnat alkaen" 720€ ylemmän keskiluokan kortit ovat aika paljon rahaa vievä harrastus kun miettii sitä keskiverto pelaajaa joka pohtii sen 1000€ konepaketin kokoamista mihin pitäisi saada mahtumaan vielä näyttö, näppäistö, hiiri ja kuulokkeet vs sitten PS5 konsolia.. voi konsoli vielä monella voiton jos hinnat vielä kasvavat.
Kilpailu high endissä on ainoa asia joka ajaisi alas hintatasoa kaikilla näytönohjaintasoilla, koska ylemmän keskitason näytönohjainten hinnat määräytyy suhteessa high endiin ja alemman keskitason hinnat suhteessa ylempään keskitasoon, jne. Niin kauan kuin NVIDIAlla on monopoli high endissa, NVIDIA määrää hinnat ja kuluttajahan siitä kärsii. Eli toivomalla, että AMD ei kilpaile high endissä, toivot samalla että kaikki näytönohjaimet pysyvät tarpeettoman kalliina.
 
Kilpailu high endissä on ainoa asia joka ajaisi alas hintatasoa kaikilla näytönohjaintasoilla, koska ylemmän keskitason näytönohjainten hinnat määräytyy suhteessa high endiin ja alemman keskitason hinnat suhteessa ylempään keskitasoon, jne. Niin kauan kuin NVIDIAlla on monopoli high endissa, NVIDIA määrää hinnat ja kuluttajahan siitä kärsii. Eli toivomalla, että AMD ei kilpaile high endissä, toivot samalla että kaikki näytönohjaimet pysyvät tarpeettoman kalliina.

Mutta kun tuo EI ole toiminut noin tähänkään saakka.
Intel on tuonut halpoja hyviä näytönohjaimia eikä todellakaan kilpaile high end (eikä edes hig medium) tasolla. AMD on yleensä myös jos ei heti niin ajan kanssa laskenut mukavasti hintoja. Ainoastaan Nvidia tuntuu loppuun saakka pitävän ne kalliit hinnat...

Katsoo vaikka 7700XT sitä saa noin 400€ 7800XT jopa 500€, kun taas jos katsoo 4070 / 4070Super / 4080 hintoja niin ei löydy tai hinnat edelleen pilvissä..
 
Mutta kun tuo EI ole toiminut noin tähänkään saakka.
Intel on tuonut halpoja hyviä näytönohjaimia eikä todellakaan kilpaile high end (eikä edes hig medium) tasolla. AMD on yleensä myös jos ei heti niin ajan kanssa laskenut mukavasti hintoja. Ainoastaan Nvidia tuntuu loppuun saakka pitävän ne kalliit hinnat...

Katsoo vaikka 7700XT sitä saa noin 400€ 7800XT jopa 500€, kun taas jos katsoo 4070 / 4070Super / 4080 hintoja niin ei löydy tai hinnat edelleen pilvissä..
Tuo mitä sanot ei ole mitenkään ristiriidassa sen kanssa mitä sanoin. Se, että kilpailu high endissä ajaisi hintoja alas kaikilla tasoilla, ei tarkoita etteikö kilpailu low endissä olisi low endille hyvä asia, tai että ei voisi tapahtua muita yksittäisiä hintojen korjauksia.
 
Joo kyllä se näin on että AMD:n high end kortit laskevat hieman hintatasoa kaikilla tasoilla. Ainakin itselleni 7900 XTX hankinta oli no brainer ja ainoastaan 4090 ja 5090 on samanverran tai enemmän VRAMia käytössä. 4k näytön kanssa vaihtehtona oli joko 1200€ 7900 XTX hyvällä jäähyllä tai 2000€ 4090 huonolla jäähyllä, samalla kun molemmissa oli lähes sama rasterointikyky.

Joissakin peleissä oma VRAM käyttö on käynyt jo yli 20gigan puolella joten mielellään tuollainen 36 gigaa vramia kelpaa. Nykyisessä markkinatilanteessa Nvidia pääsee kyllä taas kuorimaan hillot päältä, pitää jaksaa odottaa siihen saakka että AMD julkaisee seuraavat huippukortit, pahoin pelkään että hinnat nousevat jonnekin 1200$ MSRP paikkeille myös AMD:llä. Spekulointia, spekulointia...
 
Mutta kun tuo EI ole toiminut noin tähänkään saakka.
Intel on tuonut halpoja hyviä näytönohjaimia eikä todellakaan kilpaile high end (eikä edes hig medium) tasolla. AMD on yleensä myös jos ei heti niin ajan kanssa laskenut mukavasti hintoja. Ainoastaan Nvidia tuntuu loppuun saakka pitävän ne kalliit hinnat...

Katsoo vaikka 7700XT sitä saa noin 400€ 7800XT jopa 500€, kun taas jos katsoo 4070 / 4070Super / 4080 hintoja niin ei löydy tai hinnat edelleen pilvissä..

Tämä johtuu siitä, kun niin monet pelaajat on nVidia-fanipoikia joiden mielipide on "Laitan koneeseen vain NVIDIA, PISTE!" eikä hintoja siten tarvi tiputtaa. :hmm:
 
Eikö toi vajaa 200 CU:n lippulaivapiiri olisi melko realistinen tai välttämätön siinä skenaariossa, jossa RDNA 5:llä AMD yrittäisi taas kilpailla kovemmin kuten RDNA 2 sukupolvessa?

Ei.

Tarkoittaisi piiriä, joka olisi suuruusluokkaa 3x järeämpi kuin Navi 48 (joka on n. 350 mm^2), ja kun N3 pikemminkin nostaa kuin laskee valmistuskustannuksia niin ne valmistuskustannukset olisi aivan järkyttävät, samaa luokkaa kuin >1000mm^2 N4-piirillä olisi.

Vertailun vuoksi nvidian 5090 on pintaa-alaltaan n. 750 mm^2 ja sen hintakin taitaa olla parissa tonnissa.


Ja ei kannata tosiaan vertailla RDNA4sta vanhempien AMDn "huippu"piirien CU-lukuihin suoraan CU per CU, koska

1) RDNA3 tuplasti teoreettiset flopsit/CU RDNA2een verrattuna mutta käytännön hyöty tästä jäi usein jonnekin 10% luokkaan kun toinen liukulukuyksikkö saatiin vain hyvin harvoin käyttöön
2) RDNA4 sitten paransi huomattavasti sitä kuinka usein se toinen liukulukyksikkö oikeasti saatiin käyttöön, nopeutti teksturointia selvästi sekä tuplasi teoreettisen säteenjäljitysväännön (n. 20% parempi IPC rasteroinnissa, 80% parempi IPC path tracingissä)

Ja Mooren lain tarjoamat ilmaiset lounaat on tosiaankin ohi. Uudet valmistustekniikat ei enää mahdollista laskentayksikkömäärän kasvua ilman hinnan kasvua. Lähinnä nykyään uusien valmistustekniikoiden myötä saadaan vähän pienempi virrankulutus ja pieniä kellotaajuusparannuksia (ja se, mitä pinta-alassa voitetaan katoaa siihen että se pinta-ala on kalliimpaa)

Vaikka RDNA5/UDNA ei arkkitehtuurillisesti parantaisi mitään RDNA4een verrattuna, mutta muistipullonkaula ei pahenisi, niin, verrattuna Navi 31een:

Joku 112 CU:ta olisi jo oikein pätevä määrä uudelle huippumallille:
* rasteroinnissa n. 20% parempi IPC + 16% lisää yksiköitä + 25% lisää kelloa tarkoittaisi n. 1.75x suorituskykyä,
* path tracingissä taas n. 80% parempi IPC + 16% lisää yksiköitä + 25% lisää kelloa tarkoittaisi n. 2.6x suorituskykyä

Ja RDNA5/UDNA kuitenkin sisältänee arkkitehtuurillisia parannuksia RDNA4sta, eli käytännössä voisi suorituskykyero navi 31een olla vieläkin suurempi

Mutta toki paljon riippuu muistijärjestelmästä - muistikaista on kallista.
 
Viimeksi muokattu:
Kilpailu high endissä on ainoa asia joka ajaisi alas hintatasoa kaikilla näytönohjaintasoilla, koska ylemmän keskitason näytönohjainten hinnat määräytyy suhteessa high endiin ja alemman keskitason hinnat suhteessa ylempään keskitasoon, jne. Niin kauan kuin NVIDIAlla on monopoli high endissa, NVIDIA määrää hinnat ja kuluttajahan siitä kärsii. Eli toivomalla, että AMD ei kilpaile high endissä, toivot samalla että kaikki näytönohjaimet pysyvät tarpeettoman kalliina.
Eikai peruskuluttajan rtx xx60 mallit nyt niin kalliita ole inflaatio huomioonottaen? maksoin joskus 2012/2013 vuodenvaihteessa 230e gtx 660 2gb näyttiksestä. 2018 tammikuussa maksoin sellaiset 300e gtx 1060 6gb mallista (joku voisi sanoa tämän olleen ti-malli, kun sellaista ei tullut). rtx 3060 oli sellaiset 300-350e niille ketkä kerkesivät sen ostamaan ennen hintojen nousuja ja alle 350 euron saa nyt rtx 5060 mallia. Ongelma koskee noita tehokkaampia näyttiksiä. gtx 1080ti näyttistä sai alle tonnilla. rtx 5090 on jo yli kaksi tonnia (tosin virrankulutus ja jäähdytyksen koko on kasvanut ja piirikin on isompi, gtx 1080ti=471mm vs rtx 5090=750mm).
olisihan se mukavaa jos näyttikset ei maksaisi niin paljoa, muttei tuolle oikein mitään voi, valmistuskustannuksetkin uusilla prosesseilla vain nousevat :confused2:
 
Ja ei kannata tosiaan vertailla RDNA4sta vanhempien AMDn "huippu"piirien CU-lukuihin suoraan CU per CU
Juu tuosta vinkkelistä lähinnä kattelin, eli että RDNA 3:ssa saatu tungettua 96CU 305mm2:iin, joten tuon tuplaaminen pienemmällä prosessilla ei tuntuisi mahdottomalta. Turhan yksinkertaistavaa tuijotella CU määriä toki.
 
Juu tuosta vinkkelistä lähinnä kattelin, eli että RDNA 3:ssa saatu tungettua 96CU 305mm2:iin, joten tuon tuplaaminen pienemmällä prosessilla ei tuntuisi mahdottomalta. Turhan yksinkertaistavaa tuijotella CU määriä toki.

RDNA3n CU on ihan eri asia kuin RDNA5n CU, ja siinä 305mm2ssa ei ole mukana muistiohjaimia eikä L3-välimuistia. Kokonaisuudessaan piipinta-alaa navi31ssä on n. 500 mm2

Ja käytännössä kaikki mitä pinta-alassa voitetaan N5=>N3-välillä hävitään sen pinta-alan hinnassa.
 
RDNA3n CU on ihan eri asia kuin RDNA5n CU, ja siinä 305mm2ssa ei ole mukana muistiohjaimia eikä L3-välimuistia. Kokonaisuudessaan piipinta-alaa navi31ssä on n. 500 mm2
Onko RDNA 5:n kohdalla RDNA 3:a muistuttava chiplet ratkaisu, mutta isompana, poissuljettu? Esim joku 500-600mm2 GCD + MCD:t päälle?

Lähinnä tässä yritän siis miettiä skenaariota, jossa AMD skabaa kärjen tuntumassa (voi hyvin olla että ei yritä tätä). Tuote kallis valmistaa juu, mutta Nvidian tapaan siitä sitten pyydettäisiinkin riistohintaa ja mahdollisesti samaa tuotetta myös myytäisiin datakeskus-/ammattilaissektoreilla.
 
Ihme jos ei siirry chiplettiin ainakin lippulaivamallien osalta. Massiivipiirien teko on liian kallista ja hankalaa
Johan AMD yritti chiplettiä ja julkaisuun ei edes päässyt, kun vituiksi meni..
Lisäksi ei niiden chiplettien liimailukaan yhteen mitebkään ilmaista ole ja kyseinen resurssi on edelleen hyvin kallista ja tuotantomäärät rajoitettuja.

GPU Monoliiteissä taas virheet haittaavat vain vähän sillä jos fiksusti suunniteltuja, niin leikkausmahdollisuuksia on suurimmalle osalle alasta, sillä niissä on erittäin paljon samaa paskaa siinä paketissa,, niin saantoja saadaan nostettua kovasti..
 
Eikai peruskuluttajan rtx xx60 mallit nyt niin kalliita ole inflaatio huomioonottaen? maksoin joskus 2012/2013 vuodenvaihteessa 230e gtx 660 2gb näyttiksestä. 2018 tammikuussa maksoin sellaiset 300e gtx 1060 6gb mallista (joku voisi sanoa tämän olleen ti-malli, kun sellaista ei tullut). rtx 3060 oli sellaiset 300-350e niille ketkä kerkesivät sen ostamaan ennen hintojen nousuja ja alle 350 euron saa nyt rtx 5060 mallia. Ongelma koskee noita tehokkaampia näyttiksiä. gtx 1080ti näyttistä sai alle tonnilla. rtx 5090 on jo yli kaksi tonnia (tosin virrankulutus ja jäähdytyksen koko on kasvanut ja piirikin on isompi, gtx 1080ti=471mm vs rtx 5090=750mm).
olisihan se mukavaa jos näyttikset ei maksaisi niin paljoa, muttei tuolle oikein mitään voi, valmistuskustannuksetkin uusilla prosesseilla vain nousevat :confused2:
RTX 5060 8GB on ihan OK hintainen. Voisi se olla halvempikin, ei voida ajatella että se olisi jotenkin aggressiivisesti hinnoiteltu. Mutta kilpailu high endissä vaikuttaisi todennäköisesti vähiten juurikin noihin ihan lähtötason kortteihin. Eniten RTX 5090:aan ja 5080:aan, nämä kun ovat ne hinta-suorituskykysuhteeltaan selvästi huonoimmat kortit joille AMD:llä ei ole vastinetta, ja siitä sitten portaittain alaspäin vähenevissä määrin.

Mitä RTX 5060 Ti 8GB ja RX 9060 XT 8GB näytönohjaimiin tulee... niitä ei pitäisi olla olemassa. Niiden funktiot ovat (1) myydä ylihintaisia paketti-PC:itä joissa 8GB muistin määrä harhaanjohtavasti selviää vasta speksien syövereistä, ja tätä ei pakettikoneen kohderyhmää edustava kuluttaja välttämättä ymmärrä tehdä, ja (2) saada 16GB mallit näyttämään erityisen hyviltä ja siten perustella niiden suhteellisen korkeat hinnat. 16GB malleissa on isommasta muistin määrästä johtuva hintalisä joka ei mitenkään vastaa muistin määrän todellista kustannusta - jos 8GB malleja ei olisi, 16GB mallit olisivat halvempia.
 
  • Tykkää
Reactions: IHS
Onko RDNA 5:n kohdalla RDNA 3:a muistuttava chiplet ratkaisu, mutta isompana, poissuljettu? Esim joku 500-600mm2 GCD + MCD:t päälle?

Ei. Mutta nopeampi piiri vaatii myös enemmän muistikaistaa. Enemmän/kalliimpia MCD-piirejä.

Ja joku 500-600 mm2 N3sta (+ ne MCDt päälle) tulisi järkyttävän kalliiksi ja olisi täysin normaalien kuluttajien hintaluokan ulkopuolella, aivan kuten 5090, koska tuo olisi käytännössä 5090stäkin selvästi kalliimpi valmistaa.

Lähinnä tässä yritän siis miettiä skenaariota, jossa AMD skabaa kärjen tuntumassa (voi hyvin olla että ei yritä tätä). Tuote kallis valmistaa juu, mutta Nvidian tapaan siitä sitten pyydettäisiinkin riistohintaa ja mahdollisesti samaa tuotetta myös myytäisiin datakeskus-/ammattilaissektoreilla.

Mahdollista, mutta optimoidut tuotteet molempiin on aika erilaisia. Toki puhutaan siitä, että UDNA yhdistää laskentakorttien ja pelikorttien arkkitehtuurin, mutta järkevää olisi silti tehdä erilaiset piirit molempiin, että perusarkkitehtuuri olisi sama mutta sitä olisi silti kustomoitu eri suuntiin, esim säteenjäljitysvääntöä ei laskentakorteissa tarvita(voisi joko jättää kokonaan pois, tai puolittaa yksiköiden määrän että DCUn kaksi CU:ta jakaa yhden säteenjäljitysyksikön, tai käyttää vaikka vanhempaa hitaampaa pienempää (esim RDNA3-mallista) törmäystarkastusyksikköä), eikä ROPejakaan kuin hyvin vähän, sen sijaan halutaan enemmän shader-ytimiä ja fp64-tarkkuuden laskentayksiköitä niihin shader-ytimiin. Ja se fp64-laskentatarkkuus on taas pelikortissa totaalisen turha.
 
Viimeksi muokattu:
AI-laskenta on se mihin itse kaipaan halvempaa ja parempaa rautaa. Sen verta köyhä olen, että ei ole varaa 96GB 9000 euroa maksavaan RTX PRO 6000 korttiin. Nythän Ai laskennasta on kehittymässä vähän samaan tapaan kotihässläämisen boomi mitkä cryptotkin olivat.. tai no ainakin siinä on samoja piirteitä. Jengi kasaa 8 x 4090 / 8x3090 komboja koti LLM käyttöön. Köyhänä saattaisin hyvinkin harkita 3500 euron 5090 nopeuksista AMD korttia jossa 64GB muistia (siis siitä RDNA5 sukupolvesta). 5070ti nopeuksinen kortti 96GB:lla muistia edulliseen hintaan myisi kuin häkä. Maailmalla on huutava pula sellaisista tuotteista. Porukka joutuu pohtimaan AMD 395+ Ai super duper hyper max läppäri-piireistä tehtyjä pöytäkoneita, koska siinä on 128GB muisti, josta 96GB voi käyttää integroidun näyttiksen kanssa mihin vaan.
 
AI-laskenta on se mihin itse kaipaan halvempaa ja parempaa rautaa. Sen verta köyhä olen, että ei ole varaa 96GB 9000 euroa maksavaan RTX PRO 6000 korttiin. Nythän Ai laskennasta on kehittymässä vähän samaan tapaan kotihässläämisen boomi mitkä cryptotkin olivat.. tai no ainakin siinä on samoja piirteitä. Jengi kasaa 8 x 4090 / 8x3090 komboja koti LLM käyttöön. Köyhänä saattaisin hyvinkin harkita 3500 euron 5090 nopeuksista AMD korttia jossa 64GB muistia (siis siitä RDNA5 sukupolvesta). 5070ti nopeuksinen kortti 96GB:lla muistia edulliseen hintaan myisi kuin häkä. Maailmalla on huutava pula sellaisista tuotteista. Porukka joutuu pohtimaan AMD 395+ Ai super duper hyper max läppäri-piireistä tehtyjä pöytäkoneita, koska siinä on 128GB muisti, josta 96GB voi käyttää integroidun näyttiksen kanssa mihin vaan.
Mun mielestä kyllä selkeästi parempi, että pidetään kuluttaja- ja Pro-/AI-rauta tyystin erillään. Kryptomania on koko ATK-historian mustinta aikaa miesmuistiin. Varmaan kaikista, normaalisti suurinpiirtein rehellisistä kauppiaista tuli lähes kertaheitolla rikollisia (pyyhkivät kuluttajansuojalailla perseitään) eikä ns. normaalit ihmiset yksinkertaisesti pystyneet ostamaan näytönohjaimia lainkaan, mutta kryptoroistoille niitä riitti kyllä tiskien alta kymmenittäin. Tai jos jotain romurautaa sai ostettua, niin moninkertaiseen hintaan. Tämän hulluuden seurauksia maksamme vieläkin erityisesti NVidian tuotteiden pöhöttyneissä hinnoissa.

Hemmetin hyvä, että "5070ti nopeuksista korttia 96GB muistilla" ei ole saatavilla, koska GDDR7-muistipiirien saatavuudessa voi hyvinkin olla rajoitteita. Paljon järkevämpää, että nuo muistit pistetään esim. kolmeen 5090- tai kuuteen 5080- korttiin (tai RDNA5-kortteihin) ja aivan oikein että siitä 96GB kortista täytyy maksaa se kolminkertainen hinta 5090 verrattuna. Ne ostavat, ketkä oikeasti tarvivat. Tuskin kovinkaan moni harrastaja muutamaa poikkeustapausta lukuunottamatta kaipaa mitään AI-buumia sotkemaan markkinoita taas kerran, kun edellisestäkään ei vielä olla täysin toivuttu.

Taino, jos muisti- ja GPU-piirejä ja kaikkea muuta on kaikille saatavilla kohtuuhintaan senkus kaupasta hakee, niin mikäs siinä sitten.
 
Ei. Mutta nopeampi piiri vaatii myös enemmän muistikaistaa. Enemmän/kalliimpia MCD-piirejä.

Ja joku 500-600 mm2 N3sta (+ ne MCDt päälle) tulisi järkyttävän kalliiksi ja olisi täysin normaalien kuluttajien hintaluokan ulkopuolella, aivan kuten 5090, koska tuo olisi käytännössä 5090stäkin selvästi kalliimpi valmistaa.

Ei välttämättä tarvita sen enempää MCD piirejä koska 20gbps GDDR6 -> 30gbps GDDR7 tuo jo 50% lisää kaistaa.

Tosin jos 5090 (6090) kanssa haluaa kilpailla niin miksi AMD:n 2x ~300mm2 GCD + 8x ~30mm2 MCD olisi selvästi kalliimpi valmistaa kuin Nvidian ~750mm2 monoliittipiiri? Nuo MCD piirithän voisi olla huomattavasti edullisemmalla valmistusprosessilla kuin GCD:t.

Huhujen mukaanhan RDNA4(5) lippulaivan piti olla kahdella GCD:llä.
 
Jos kaipaa vaan paljon muistia, niin Strix Halo prosu hankintaan. Olisikohan jossain minisforumin koneessa paras hinta/laatusuhde, todennäköisesti edullisempi kuin läppäri vastaavilla osilla ja taatusti halvempi kuin kolme 5090 korttia.
 
Ei välttämättä tarvita sen enempää MCD piirejä koska 20gbps GDDR6 -> 30gbps GDDR7 tuo jo 50% lisää kaistaa.

Ne GDDR7-muistiohjaimet on joka tapauksessa kalliimpia kuin GDDR6-muistiohjaimet.

Ja vain 50% lisää kaistaa piirissä jossa olisi 2.5-4x enemmän laskentatehoa olisi edelleen pahasti kaistapullonkaulainen, 384-bittinen muistiväylä ei GDDR7llakaan olisi oikein tarpeeksi noin järeälle piirille, TAI sitten siellä pitäisi olla todella iso L3-välimuisti (joka sekin nostaisi niiden piirien kokoa ja hintaa)

Tosin jos 5090 (6090) kanssa haluaa kilpailla niin miksi AMD:n 2x ~300mm2 GCD + 8x ~30mm2 MCD olisi selvästi kalliimpi valmistaa kuin Nvidian ~750mm2 monoliittipiiri?

Koska
1) se nvidian 5090 johon nyt verrataan on tehty vanhemmalla, halvemmalla valmistustekniikalla ja 600 mm^2 N3sta maksaa selvästi enemmän kuin 750mm N4sta/4N:ää.
2) lisäksi ne 200-270mm^2 vanhalla valmistustekniikalla valmistettuja MCD-piirejä ei ole ilmaisia
3) lisäksi se erikoispaketointi jolla ne eri piilastut kytketään yhteen tulee selvästi kalliimmaksi kuin monoliittipiirin paketointi

Nuo MCD piirithän voisi olla huomattavasti edullisemmalla valmistusprosessilla kuin GCD:t.

Ne eivät voi olla liian vanhalla valmistustekniikalla jos halutaan toteuttaa hyvin nopea muistiohjain, sekä saada niille suuri määrä SRAMia L3-kakuksi mahdollisimman halvalla ja lisäksi pitää virrankulutus pienenä. Käytännössä sweet spot tuollaiseen on nykyään joku N7/N6.

Se joku 200-270mm N7/N6sta maksaanee suurin piirtein sen verran kuin mitä joku 120-160 mm^2 N4sta/4N:ää.

Huhujen mukaanhan RDNA4(5) lippulaivan piti olla kahdella GCD:llä.

Kaikkia huhuja ei kannata uskoa. Tai jos tuo huhu piti paikkaansa, siihen sen perumiseen oli varmasti hyvät syyt (toimi liian huonosti tai tuli aivan liian kalliiksi)


Täysin symmetrisiin piilastuihin perustuva monen piilastun näyttis olisi vähän epäoptimaalinen, koska näyttiksellä on aina jonkin verran sellaista toiminnallisuutta, jonka pitää olla yksi tiiiviisti integroitu möykky. Jos sen duplikoi molemmille piilastuille, sitten toisella se logiikka on tyhjän panttina.

Yksi vaihtoehto olisi toki laittaa tämä logiikka IO-piilastulle, jos niitä on vain yksi.
Mutta AMD RDNA3ssa valitsi sen, että laskenta-/logiikkapiilastuja on yksi, muistiohjain-/välimuistipiilastuja monta.



Piirin pilkkominen moneen pieneen piilastuun ei myöskään ole mikään silver bullet joka ratkoo kaikki valmistustekniikan hintaongelmat, kun se suurin hintaongelma on se, että kehittyneiden valmistustekniikoiden piikiekot vaan ovat järkyttävän kalliita.

Piirin pilkkominen pienempiin piilastuihin helpottaa lähinnä sitä ongelmaa, että koko piilastu menee pilalle jonkin kriittisen valmistusvirheen takia, mutta tätä ongelmaa pienentää huomattavasti myös se, että osan shader-ytimistä tai osan välimuisteista voidaan kytkeä pois päältä (jos sattuvat olemaan särki), ja piirin voi sitten myydä piiriä sitten halvempana mallina.

ja sitten piirin pilkkominen pienemmiksi piilastuiksi myös hiukan vähentää sitä hukkapinta-alaa joka tulee siitä, että piilastut ovat suorakulmioita mutta piiikiekko pyöreä, verrattuna 300mm^2 piilastuihin 600mm^2 piilastut hukkaavat n. 5% enemmän pinta-alaa reuna-alueisiin jotka jäävät piisirujen ulkopuolelle.

Valmistuksen hintaa suurempi hyöty piirin jakamisesta moneen piilastuun tulee usein siitä, että voidaan myydä useampaa erilaista tuotetta halvemmilla tuotekehityskustannuksilla,
kun osa toiminnallisuudesta on sellaisella piilastulla, joiden määrää voi säädellä tuotekonfiguraation mukaan. Esim. AMD on saanut EPYCinsä markkinoille melko samaan aikaan kuin kuluttaja-Ryzenit, kun niissä itse CCD-piilastut on aivan samoja, Intelillä taas serverimallit samasta mikroarkkitehtuurista on usein tullut jopa yli vuoden kuluttajamallien jälkeen. ja AMDllä joskus Zen1n aikaan ei vaan olisi riittänyt tuotekehitysresurssit kehittää zen-arkkitehtuurista erillisiä kuluttaja- ja serveri-piirejä, mutta kun sama piiri toimi molemmille (server-tuotteissa neljän piilastun MCD-paketoinnilla), saatiin molemmat tuotteet markkinoille käytössä olevilla resursseilla.
 
Viimeksi muokattu:
Jos kaipaa vaan paljon muistia, niin Strix Halo prosu hankintaan. Olisikohan jossain minisforumin koneessa paras hinta/laatusuhde, todennäköisesti edullisempi kuin läppäri vastaavilla osilla ja taatusti halvempi kuin kolme 5090 korttia.
Tuosta kirjoitinkin, että moni joutuu katselemaan AMD Halo SER:riä. Noin kalliiksi tuotteksi aivan liian hidas ~2000 euron hintaiseksi todella liitin köyhiä nuo. Jos esim katsot frameworkin erillisemona myytävää.

Max+ 395 - 128GB​


~2000 eur

3x Standard 4-pin fan header (Standard PWM)
1x Standard 9-pin header (Front Panel Header)
2x 20-pin USB Type-E header (Front panel USB header)
1x Standard 9-pin header (Front panel audio header)
1x Standard 4-pin header with 3 signals (ARGB header)
1x RTC Battery connector (Molex 51021-8602, RTC Battery is preinstalled)
1 x PCIe x4 slot (not exposed on default case)

HUOM!
. Joissain minisforumin emoissa on sentään 16x PCIE liitin, vaikka kyseessä on läppäpuolen piirisarjasta kyhätty ITX emo. Halot on aina integroituja.

Ehkä
seuraava iteraation tuosta Halosta tarjoaa enemmän vastinetta rahalle jos olis tyylin 3x NPU + 50% lisää muistia.
 
Tuosta kirjoitinkin, että moni joutuu katselemaan AMD Halo SER:riä. Noin kalliiksi tuotteksi aivan liian hidas ~2000 euron hintaiseksi todella liitin köyhiä nuo. Jos esim katsot frameworkin erillisemona myytävää.

Max+ 395 - 128GB​


~2000 eur

3x Standard 4-pin fan header (Standard PWM)
1x Standard 9-pin header (Front Panel Header)
2x 20-pin USB Type-E header (Front panel USB header)
1x Standard 9-pin header (Front panel audio header)
1x Standard 4-pin header with 3 signals (ARGB header)
1x RTC Battery connector (Molex 51021-8602, RTC Battery is preinstalled)
1 x PCIe x4 slot (not exposed on default case)

HUOM!
. Joissain minisforumin emoissa on sentään 16x PCIE liitin, vaikka kyseessä on läppäpuolen piirisarjasta kyhätty ITX emo. Halot on aina integroituja.

Ehkä
seuraava iteraation tuosta Halosta tarjoaa enemmän vastinetta rahalle jos olis tyylin 3x NPU + 50% lisää muistia.

Todella typerää valitusta jälleen.

Mikään muu kuluttaja-PC-rauta ei tietääkseni tarjoa tuollaista muistimäärää ja kaistaa nimenomaan neuroverkkojen ajamiseen, niin ihan turha valittaa jostain "hitaudesta" jos kyseessä on ainoa kuluttajarauta millä malli toimii ja vertailukohteena on lähinnä unelmat tai paljon kalliimmat erikoiskiihdyttimet.

Ja se, että joku tekee prossulle emolevyn jossa on vähän liittimiä ei tee prossusta huonoa.

Tuon prossun IO-piiriltä löytyy kyllä 16x pcie-väylä.
 
Todella typerää valitusta jälleen.

Mikään muu kuluttaja-PC-rauta ei tietääkseni tarjoa tuollaista muistimäärää ja kaistaa nimenomaan neuroverkkojen ajamiseen, niin ihan turha valittaa jostain "hitaudesta" jos kyseessä on ainoa kuluttajarauta millä malli toimii ja vertailukohteena on lähinnä unelmat tai paljon kalliimmat erikoiskiihdyttimet.

Ja se, että joku tekee prossulle emolevyn jossa on vähän liittimiä ei tee prossusta huonoa.

Tuon prossun IO-piiriltä löytyy kyllä 16x pcie-väylä.

Ehkä se on sinusta typerää. Kerroin vain, että en todellakaan tyydy tuohon hitaaseen ensimmäiseen iteraatioon. Pihien valmistajien kohdalla pitää aina äänestää lompakolla. Nuo firmat eivät välitä sinusta / kuluttajista ja enemmänkin aina miettivät miten voisivat antaa vähemmän kovemmalla hinnalla. Ei noita yrityksia kannata ruveta fanittamaan ellei ne maksa siitä hyvää hintaa. "shilling for money"

Sanottakoon tähän väliin, että on tuossa Halossa jonkin verran hyvääkin. Se on melko hyvän hyötysuhteen lopputuote ja siinä mielessä uniikki markkinoilla. Täysi kuorma kuluttaa noin 115W ja se on kohtuu kova lukema.
 
Ehkä se on sinusta typerää. Kerroin vain, että en todellakaan tyydy tuohon hitaaseen ensimmäiseen iteraatioon. Pihien valmistajien kohdalla pitää aina äänestää lompakolla. Nuo firmat eivät välitä sinusta / kuluttajista ja enemmänkin aina miettivät miten voisivat antaa vähemmän kovemmalla hinnalla. Ei noita yrityksia kannata ruveta fanittamaan ellei ne maksa siitä hyvää hintaa. "shilling for money"

Sanottakoon tähän väliin, että on tuossa Halossa jonkin verran hyvääkin. Se on melko hyvän hyötysuhteen lopputuote ja siinä mielessä uniikki markkinoilla. Täysi kuorma kuluttaa noin 115W ja se on kohtuu kova lukema.
Mihin ihmeen "hitaaseen ensimmäiseen iteraatioon"? Siellä on se PC-maailmassa ennennäkemättömän tehokas integroitu GPU hoitamassa niitä tekoälylaskuja.
 
Ehkä se on sinusta typerää. Kerroin vain, että en todellakaan tyydy tuohon hitaaseen ensimmäiseen iteraatioon.

Ketään ei kiinnosta, mihin sinä tyydyt. Kun piiri maksaa kymmeniä tai satoja miljoonia dollareita suunnitella, sitä ei tosiaankaan speksata yhden pihalla olevan kuluttajan melko epärealististen haaveiden mukaan vaan sen mukaan, mikä on järkevää ja fiksua ja taloudellisesti kannattavaa, ja mitä ne oikeasti suuria määriä ostavat oikeat asiakkaat haluavat.

Pihien valmistajien kohdalla pitää aina äänestää lompakolla.

Strix Halossa ei ole mitään "pihiä", ja sellaista ammattikäyttöä varten missä työpöytäkäytöllä ja pelinopeudella ei ole mitään väliä ja voidaan käyttää vielä isompaa, kalliimpaa ja enemmän virtaa kuluttavaa piiriä on myös MI300A, jossa taitaa on puolitoistakertainen määrä CPU-ytimiä ja enemmän tekoälykäyttöön optimoitu paljon järeämpi mutta melko pelikelvoton näyttis.

Ja niitä firmoja kiinnostaa aika paljon enemmän sinua rikkaampien ja asioista paljon sinua paremmin perillä olevien asiakkaiden lompakot kuin juuri sinun lompakkosi.
 
Viimeksi muokattu:
Mihin ihmeen "hitaaseen ensimmäiseen iteraatioon"? Siellä on se PC-maailmassa ennennäkemättömän tehokas integroitu GPU hoitamassa niitä tekoälylaskuja

PC maailmassa onkin ollut hirveä vaje noissa integroiduissa. Eivät ole viitsiineet tarjota niitä kun se söisi liikaa erillisnäyttisten kakkua tai ainakin niin pelkäävät. Enennäkemättömän tehokas juu mutta silti hidas.

Tuosta

AMD Ryzen™ Al Max+ 395​

tuotteesta tulee jossain kohtaa seuraava malli ja jos pyhä Liisa suo, niin isommalla maksimi muistilla.
 
Ja niitä firmoja kiinnostaa aika paljon enemmän sinua rikkaampien ja asioista paljon sinua paremmin perillä olevien asiakkaiden lompakot kuin juuri sinun lompakkosi.

Kiinostaa juu vai kiinnostaako? Voitaisiinko sanoa, että paljon kiinnostaa myös asioista huonosti perillä olevien lompakot ja onneksi Nvidian kohdalla se kuluttajan aliarvioiminen on osunut kipeästi myyntilukuihin. Huonosta 5060 8gb myynnistä kiitos lienee pitkälti rautatubekanavien neuvojen. Todella moni 5060 8GB testivideo suositteli välttämään sitä. Mutulla veikkaan, että 5060 8GB variantti ei tunnu myyvän edes puolta siitä mitä oltiin toivottu. 12GB 5070 käy sekin huonosti kaupaksi ja AMD ottaa hienosti masseja kotiin. Eli lompakolla äänestäminen kannattaa niin saattaa tulla vauhtia tehdä kilpailukykyisempiä tuotteita. 5070super lienee seurausta huonoista myyntiluvuista.
 
PC maailmassa onkin ollut hirveä vaje noissa integroiduissa. Eivät ole viitsiineet tarjota niitä kun se söisi liikaa erillisnäyttisten kakkua tai ainakin niin pelkäävät

Tällaisen salaliittohörhöilyn sijaan kannattaisi yrittää opetella ymmärtämän vähän sitä tekniikkaa, mistä höpisee.

Tässä ei ole kyse pelkästään mistään "viitsimisestä" vaan myös oleellisista teknisistä rajoitteista.

Tehokas näyttis tarvii paljon muistikaistaa, ja:

1) normaaleilla laajennettavilla DRAM-keskusmuistityypeillä (DDR4, DDR5) se tehokkaan näyttiksen tarvitsema kaista tulee hyvin kalliiksi ja lisää virrankulutusta selvästi. Se, että siinä Strix Halossa on 256-bittinen muistiväylä (siinä missä muissa kuluttaja-PC-CPU-piireissä on vain 128-bittinen muistiväylä) on yksi oleellinen syy sen korkeaan hintaan.

2) grafiikkaoptimoiduilla DRAM-muisteilla (GDDR, HBM) joilla kaistaa on enemmän se muisti pitää kolvata emolevylle tai laittaa näyttiksen kanssa samaan pakettiin mikä tekee mahdottomaksi sen muistin laajentamisen tai vaihtamisen jälkikäteen. Lisäksi voi tulla ongelmaksi, että jos esim paketointivaiheessa menee jotain pieleen, on sekä muistit että itse prossupiilastu kaikki käyttökelvottomia.
Lisäksi ne graffaoptimoidut muistit on usein viiveiltään huonompia kuin "normaalit" CPU-optimoidut DRAM-muistit tai niiden (liian pitkät) purskekoot sopivat huonosti CPU:iden välimuisteille, voi esim. olla että CPUn ladatessa dataa muistista joudutaan käytännössä lataamaan tuplasti enemmän, tuhlaten kaistaa ja virtaa, mikäli pienin puskekoko on tuplasti isompi kuin CPUn välimuistilinjan koko. Ja se välimuistilinjan koko on käytännössä modernissa x86-64ssa lukittu 64 tavuun, sen vaihtaminen olisi hyvin ongelmallista.


. Enennäkemättömän tehokas juu mutta silti hidas.

Verrattuna mihin?

Tämän valittamisen sijaan, suunnittele itse nopeampi. Palaa takaisin haukkumaan tätä hitaaksi vasta kun olet onnistunut.
 
Viimeksi muokattu:
Tällaisen salaliittohörhöilyn sijaan kannattaisi yrittää opetella ymmärtämän vähän sitä tekniikkaa, mistä höpisee.

Tässä ei ole kyse pelkästään mistään "viitsimisestä" vaan myös oleellisista teknisistä rajoitteista.

Tehokas näyttis tarvii paljon muistikaistaa, ja:

1) normaaleilla laajennettavilla DRAM-keskusmuistityypeillä (DDR4, DDR5) se tehokkaan näyttiksen tarvitsema kaista tulee hyvin kalliiksi ja lisää virrankulutusta selvästi. Se, että siinä Strix Halossa on 256-bittinen muistiväylä (siinä missä muissa kuluttaja-PC-CPU-piireissä on vain 128-bittinen muistiväylä) on yksi oleellinen syy sen korkeaan hintaan.

2) grafiikkaoptimoiduilla DRAM-muisteilla (GDDR, HBM) joilla kaistaa on enemmän se muisti pitää kolvata emolevylle tai laittaa näyttiksen kanssa samaan pakettiin mikä tekee mahdottomaksi sen muistin laajentamisen tai vaihtamisen jälkikäteen. Lisäksi voi tulla ongelmaksi, että jos esim paketointivaiheessa menee jotain pieleen, on sekä muistit että itse prossupiilastu kaikki käyttökelvottomia.
Lisäksi ne graffaoptimoidut muistit on usein viiveiltään huonompia kuin "normaalit" CPU-optimoidut DRAM-muistit tai niiden (liian pitkät) purskekoot sopivat huonosti CPU:iden välimuisteille, voi esim. olla että CPUn ladatessa dataa muistista joudutaan käytännössä lataamaan tuplasti enemmän, tuhlaten kaistaa ja virtaa, mikäli pienin puskekoko on tuplasti isompi kuin CPUn välimuistilinjan koko. Ja se välimuistilinjan koko on käytännössä modernissa x86-64ssa lukittu 64 tavuun, sen vaihtaminen olisi hyvin ongelmallista.




Verrattuna mihin?

Tämän valittamisen sijaan, suunnittele itse nopeampi. Palaa takaisin haukkumaan tätä hitaaksi vasta kun olet onnistunut.

Aika villiä huhua taas MLID tarinoi tänään tulevista AMD RDNA5 low end ja mid range korteista. Eli tuon "vuodon" mukaan myös erillisnäyttiksiin olisi tulossa LPDDR6 / LPDDR5X muistiohjaimet ja 128bit / 256bit / 384bit muistiväylät.

Eikö tuollaisen valmistaminen olisi kohtuu kallista jos on noin leveät muistiväylät, vaikka kuinka käyttäisi läppärimuistia?
Toki tuollaisessa etuna varmaan olisi se että voisi tehdä AI variantteja korteista todella suurilla muistimäärillä.

1755844638987.png
 
Tuosta

AMD Ryzen™ Al Max+ 395​

tuotteesta tulee jossain kohtaa seuraava malli ja jos pyhä Liisa suo, niin isommalla maksimi muistilla.
Ite näkisin että muistia tuossa on jo nyt runsaasti mutta kaistaa ja laskentatehoa suhteessa turhan vähän, mitä AI puuhasteluun tulee. Tasapaino siis päinvastaisella tavalla heikko kuin 4090:ssä.
 
jos kiinnostaa on tuon Ai Max+ 395:sen tehosta myös testejä. tämä Phoronixin testi on aika hyvä.

Heillä on testi myös Intelin 285K:ta vastaan ajettuna. Se mitä nuo testit näyttää hyvin on tuon AMD tuotteen hyötysuhteen monissa asioissa.

mm sivu 5 /11, jossa testattavana Blender 4.5 - keskikulutus 98.4 Watt kun taas 9950X samasta 171 Watt. Toki tuota 9950X prossaa ei ole alivoltitettu. Senkin hyötysuhden paranee aika hyvin jos osaa optimaalisesti alivoltittaa.

 
Viimeksi muokattu:
Aika villiä huhua taas MLID tarinoi tänään tulevista AMD RDNA5 low end ja mid range korteista. Eli tuon "vuodon" mukaan myös erillisnäyttiksiin olisi tulossa LPDDR6 / LPDDR5X muistiohjaimet ja 128bit / 256bit / 384bit muistiväylät.

Eikö tuollaisen valmistaminen olisi kohtuu kallista jos on noin leveät muistiväylät, vaikka kuinka käyttäisi läppärimuistia?
Toki tuollaisessa etuna varmaan olisi se että voisi tehdä AI variantteja korteista todella suurilla muistimäärillä.

1755844638987.png

Tuossa on siis sekaisin APU-piirejä ja erillisnäyttiksiä.


Tuo ensimmäinen APU-piiri 4+4+2 ytimellä ei IMHO vaikuttaisi kovin järkevältä, ja 16+4+2 vielä vähemmän. Zen6c-ytimiä kannattaisi olla enemmän kuin zen6-ytimiä, koska zen6c-ytimet ovat energiatehokkaampia ja halvempia ja silloin kun säikeitä on ajossa paljon, suurella määrällä zen6-ytimiä homma käy helposti tehorajoitteiseksi. Toisaalta AMD kuitenkin strix haloon laittoi pelkkiä normaaleita zen6-ytimiä, joten ei nämä kokoonpanot ole poissuljettuja.

Tuo 8 on myös vähän hassu CU-määrä, se on liikaa siihen että tehdään minimilistinen näyttis joka on vaan sitä varten että saadaa kone bootattua ja windowsin työpöytää pyöritettyä(kuten zen4/zen5n IOD:n integroitu näyttis), mutta vähänlaisesti siihen että sitä voisi oikeasti käyttää johonkin pelaamiseen pienelläkään resoluutiolla.

En kuitenkaan silti tuomitse tätä huhua varmuudella vääräksi.

Tuosta seuravasta(AT4) taas: 128-bittinen LPDDR5X olisi selvä kaistapullonkaula 24 CU:lle.
 
Viimeksi muokattu:
Asiaa nykysukupolvesta mutta laitan silti tänne, koska täällä on enemmän tätä enemmän arkkitehtuurikeskustelua kuitenkin kuin suoriin tuotteisiin liittyvissä ketjuissa, ja tämä liittyy moniin eri tuotteisiin

AMDn nykyisissä integroiduissa näyttiksissä arkkitehtuurina on "RDNA3.5" , AMDn nykysukupolven erillisnäyttikset on arkkitehtuuriltaan "RDNA4".

Tuosta RDNA3.5sta on ollut vähän huonosti artikkeleita, että mitä se tarkkaanottaen sisältää.

AMD on kuitenkin julkaissut sen käskykantamanuaalit, joten silmäilin pikaisesti läpi AMDn käskykantamanuaalit RDNA3lle, RDNA3.5lle ja RDNA4lle, ja löysin sieltä seuraavat asiat:

* Säteenjäljitysparannukset tuli vasta RDNA4ssa (kappale 10.9)
* 8-bittinen laskentatarkkuus(neuroverkkoja varten) tuli vasta RDNA4ssa (kappale 7.5)
* Vektorirekisterien dynaaminen allokointi tuli vasta RDNA4ssa (kappale 3.3.3)
* Muistin osoitteistukseen liittyviä parannuksia tuli pääosin vasta RDNA4ssa (10.4.1)
... mutta yhteen latauskäskyyn liittyvä integroitu datankonversio tuli jo RDNA3.5ssa (kappale 10.1)
* Skalaari-liukuluku-ALU tuli jo RDNA3.5ssa (kappale 6.8)


Eli melko linjassa sen oletuksen kanssa, että RDNA3.5 on "RDNA4 - säteenjäljitysparannukset - neuroverkkoparannukset", joskaan asia ei ole ihan 100% näin vaan RDNA3.5 ->RDNA4 -välillä tuli vähän muutakin



 
Viimeksi muokattu:
Lisa Sun mukaan MI450 valmistetaan (ainakin osittain) 2nm prosessilla. Vuoden 2026 jälkimmäisellä puoliskolla ilmeisesti ovat toimittamassa tuota.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Linkki: https://x.com/HyperTechInvest/status/1975635156796121551
 
Lisa Sun mukaan MI450 valmistetaan (ainakin osittain) 2nm prosessilla. Vuoden 2026 jälkimmäisellä puoliskolla ilmeisesti ovat toimittamassa tuota.
OpenAI diilissä sanottiin selkeästi, että mi450 ensimmäisen GW toimitukset alkavat 2026 toisella vuosipuoliskolla. Iso muutos amd:lle kun samalla tulee uusi räkki missä 72gpu:ta yhteenkytketty nopealla linkillä. Ensimmäinen oikea rackscale ratkaisu, edellinen ratkaisu ei oikein skaalannut suorituskykyisesti yli 8gpu:lle jaettuun kuormaan.

Varmaan menee kaikki kaupaksi mitä amd saa tehtyä. Tällä hetkellä kai konesaliratkaisujen myyntiä rajoittaa tarjolla olevien hbm-muistien määrä. Varmaan tän vuoksi OpenAI ostanut hbm-muistikapasiteettia,...
 
Amd ja sony kertoivat amd:n gpu-raudan tulevista ominaisuuksista.
  • Neural Arrays: A collection of compute units configured to share and process data to work together like a single AI engine.
  • Radiance Cores: New dedicated ray traversal hardware to deliver high-performance real-time ray tracing and path tracing.
  • Universal Compression: A new system that evaluates and compresses all available data within the GPU to dramatically reduce memory bandwidth usage.
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Linkki: https://youtu.be/ItXPvGrI6gY?si=aNQor_KeD5hgDP9S
 
Amd ja sony kertoivat amd:n gpu-raudan tulevista ominaisuuksista.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Linkki: https://youtu.be/ItXPvGrI6gY?si=aNQor_KeD5hgDP9S

Nämä ovat varmaan Nvidian leirissäkin korkealla olevia tavoitteita - RT ei ole varmaan koskaan liian hyvä (AMD:llähän tuo on ollut aina ongelmana ja on edelleenkin), ja GPU:n laskentatehoa käyttävien erilaisten AI-sovellusten myötä halutaan myös erinäisiä parannuksia liittyen toisaalta tarvittavan fyysisen muistin kokoon (eli otetaan kompressio käyttöön) ja toisaalta halutaan myös saada eri GPU prosessit jakamaan dataa paremmin ja kommunikoimaan keskenään tehokkaammin. AMD käsittääkseni häviää Nvidialle eri benchmarkeissa ja käytännön suorituskyvyssä eniten juuri esim. N-body simulaatiossa (joka ehkä toisaalta myös benchmarkeissa paremmin CUDA:lle optiomoitu) ja säteenseurannassa (RT= ray tracing).
 
Ihan selvähän se on, että rt/pt käyttöön tarkitettujen ominaisuuksien on kasvettava jos jollakin aikavälillä aiotaan saada puhtaasti niillä toteutettuja pelimoottoreita. Nythän videossa vielä puhuttiin lähinnä valaistuksesta mutta suunta on kyllä selvä.
 
Nämä ovat varmaan Nvidian leirissäkin korkealla olevia tavoitteita - RT ei ole varmaan koskaan liian hyvä (AMD:llähän tuo on ollut aina ongelmana ja on edelleenkin), ja GPU:n laskentatehoa käyttävien erilaisten AI-sovellusten myötä halutaan myös erinäisiä parannuksia liittyen toisaalta tarvittavan fyysisen muistin kokoon (eli otetaan kompressio käyttöön) ja toisaalta halutaan myös saada eri GPU prosessit jakamaan dataa paremmin ja kommunikoimaan keskenään tehokkaammin. AMD käsittääkseni häviää Nvidialle eri benchmarkeissa ja käytännön suorituskyvyssä eniten juuri esim. N-body simulaatiossa (joka ehkä toisaalta myös benchmarkeissa paremmin CUDA:lle optiomoitu) ja säteenseurannassa (RT= ray tracing).
Säteenseurannan osalta ratkaisu on hyvin samankaltainen kuin nvidialla. Videolla cerny selitti miten säteenseuranta menee uudella yksiköllä shadereiden rinnalla versus ennen säteenseuranta laskettiin shadereilla. Samalla gpu voi käyttää enemmän muistikaistaa kun säteenseuranta ja shaderit laskevat samaan aikaan jos ei ota kiinni muistista tai lämmöistä.

Neural array todella mielenkiintoinen konsepti. Tätä ei avattu paljoa, mutta voi olla game changer, tosin vaatinee peliltä tukea että konfiguroidaan laskentayksiköt tarpeen mukaan. Project amtethystistä pitäisi etenkin työskennellä peleihin sopivien konealgoritmien parissa, esim. fsr4/pssr mutta muutakin lienee tulossa.

Eiköhän ps6 ja xbox next ole sen tasoisia, että säteenseuranta ja ehkä myös path tracing on kaikissa siitä hyötyvissä peleissä. Toki kun on vanhoja konsoleita ja pc-laitteita niin niitäkin pitää tukea että pelejä saa myytyä. Pikkuhiljaa rasterin merkitys vähenee ja vähenee. Jo tänään aikalailla kaikki silmäkarkkipelit ovat syvällä säteenseurannassa.
 
Viimeksi muokattu:
AMD:n financial analyst day tänään suomenaikaa 20:00. Kuultaneen paljon amd:n tulevasta konesalipuolesta mikä voi antaa vihjeitä myös kuluttajapuolen teknologioihin. Jos haluaa katsoa niin joutunee rekisteröitymään linkin sivun kautta + webcast. Ehkä joku saitti "piraatti"-striimaa saman youtubeen, ehkä ei.
We are excited to host our Financial Analyst Day on Tuesday, November 11, 2025. Join Chair and Chief Executive Officer Dr. Lisa Su and members of the AMD leadership team who will present the company’s strategy and growth opportunities, innovative product and technology roadmaps, and long-term financial plan.
 
Ei tuota jaksa kyllä kattoa kun "ai per second" on niin helvetin korkee.

Niinpä. Itsekin aloin katsoa mutta aloin sitten kuitenkin tekemään koneella muuta ja jossain vaiheessa vaihtui tuon sivukorvalla kuunteleminen telkkarin katsomiseen kun oli niin pelkkää AI-hypeä.

Tuliko tuolla josssain välissä jotain oikeaa asiaakin?
 

Statistiikka

Viestiketjuista
296 071
Viestejä
5 061 826
Jäsenet
81 022
Uusin jäsen
Walton

Hinta.fi

Back
Ylös Bottom