Virallinen: AMD vs Intel keskustelu- ja väittelyketju

  • Keskustelun aloittaja Keskustelun aloittaja Sampsa
  • Aloitettu Aloitettu
No pahus, sekoitin aiempiin uutisiin ja niissäkin ne hinnat olivatkin pelkkiä huhuja.

Tuo on halpa-alustan prosessori jolloin sille on vaikea iskeä liian kovaa hintaa. Jos ei laiteta tarpeeksi kovaa hintaa, se syö kaiken kaiken markkinan LGA2011-3 alustan tonnin prosessorilta. Toisaalta liian kallis hinta karkottaa sekin ostajia kalliimmalta alustalta kun 70 euron emolevyyn saa "samantehoisen" prosessorin kuin 250 euron emolevyyn saa tonnilla. Hinnoitteli tämän miten tahansa, LGA2011-3 alusta kärsii pahasti.
Kyllä se on totta.
Ajattelin että olit löytänyt jotain uutta tieto hinnasta.. Joku huhu oli että n. puolet tuosta 1000€ i9-7900X hinnasta, mutta ei ole vissiin virallinen hinta vielä tullut inteliltä.
 
Kyllä se on totta.
Ajattelin että olit löytänyt jotain uutta tieto hinnasta.. Joku huhu oli että n. puolet tuosta 1000€ i9-7900X hinnasta, mutta ei ole vissiin virallinen hinta vielä tullut inteliltä.

Njoo kasi corenen sky lake X HEDT prossu i7 7820x on sen ~$600 mrsp:llä(nykynen hinta taitaa suomessa olla moiselle lähempänä 500€), että eiköhän se alle tuosta kuiten tule olemaan. I7 K:lla se lähtö hinta ollu saksassa 399€ jo pitkään, joten eiköhän tuolle i9 9900k:lle se hinta ole vähintään 450€-500€ jos se i7 9700k on sen 399€. Yllättyisin kyllä kovasti jos alentaisivat i7:kan lähtöhintaa, mutta ei sekään pois suoljettua ole.
 
Mikä tuossa mielestäsi on epätodellista?

Nuo prosessin transistoritiheydet on ihan julkisesti tiedossa.

No vaikka se että Intel ei tuolla 10nm prosessilla saa mitään järkevää ulos vuonna 2018 kun taas "Others" saa ulos järkevää 2018. Taitaa koko slidestä puuttua "Others" 7nm prosessit, sehän on täälläkin niin moneen kertaan sanottu että GloFo:n ja TSMC:n 7nm on jotakuinkin sama kuin Intelin 10nm.

Eli täyttä propagandaa.
 
No vaikka se että Intel ei tuolla 10nm prosessilla saa mitään järkevää ulos vuonna 2018 kun taas "Others" saa ulos järkevää 2018. Taitaa koko slidestä puuttua "Others" 7nm prosessit, sehän on täälläkin niin moneen kertaan sanottu että GloFo:n ja TSMC:n 7nm on jotakuinkin sama kuin Intelin 10nm.

Eli täyttä propagandaa.

Pitäähän tuo nyt paikkaansa, vaikka ne tuliskin hieman myöhemmin tätä vuotta, vai mitkä prosessifirmat tuottaa parhaillaan massatuotantona 7nm-kiviä?
 
Ei ole paljon mutta eipä paljon muutakaan tullut.
Shakkiohjelmissa tarvitaan tehoa mm. aseman analysointiin. Mikä olisi paras siirto asemassa, kun siirettiin näin oliko kyseessä hyvä vai huono siirto ja kumpi on asemassa johdossa jne.

Missasit sitten jälleen täysin koko pointtini. Shakki ihmistä vastaan on reaaliaikasovellus, joka toimii tarpeeksi nopeasti kaikilla markkinoilla olevilla prosessoreilla. Sen nopeuttamiseen ei ole mitään
tarvetta.


Sitä tehoa on siihen aseman analysointiin aivan riittävästi vaikka PEXT-käsky on hidas. Se tietokone voittaa silti heittämällä ihmisen

Sen lisäksi se on täysin niche-market, josta ylipäätään piittaa vain häviävän pieni ihmisjoukko.

Shakki on täten workloadina täysin EVVK. Ketään järkevää prosessoriarkkitehtia ei kiinnosta shakin suorituskyky.

Mikä fakta tukee sinun teorioitasi?

:facepalm:

Vaikka se, että olen tehnyt tutkimus- ja tuotekehitystyötä n. 20 vuotta elämässäni, ja tiedän miten asioiden (myös mikropiirien) tuotekehitys toimii.

Niinkuin oikeasti. Minä en keksi asioita päästäsi kuten sinä, tai jos keksin, sanon hyvin selvästi että kyse on spekulaatiosta, enkä ole asiasta varma.

Ja jos spekulaationi osoittautuu vääräksi, sitten totean spekuloineeni väärin, enkä ala puolustamaan virheellistä spekulaatiotani mitä naurettavimmalla vänkäämisellä.

4 kuukautta voi laittaa satunnaisten valmistusongelmien piikkiin. Pitkälti saman verran, ei puhuta mistään vuosista.

Jos se olisi 4 kuukautta toiseen suuntaan, sitten se olisi sinulle ehdottomasti merkki jostain joka tukisi pointtiasi.

Jälleen maaliotolppien siirtelyä.

Esitit valheellisen väitteen näiden prosessoreiden julkaisuaikatauluista, ja kun valheesi paljastetaan, yrität alkaa vähättelemään sitä.

Voisitko niinkuin vaan jo myöntää, että puhut paskaa kun olet pihalla kuin lumiukko?

Tiedän tuon serveripuolen ongelman. Silti siellä olisi voinut saada edes vähän markkinaosuutta (vaikka puhuttaisiin prosentin osista) panostamalla ja samalla pitää nimeä pinnalla.

:facepalm:

Jos prosessorin perusarkkitehtuuri on huono, ei siitä taiota hyvää sitä vähän viilaamalla. Pitää pistää kokonaan uusiksi. Juuri sen mitä AMD päätti tehdä, alkaa kehittämään Zeniä puhtaalta pöydältä.

Ja jälleen olet hienosti ristiriitainen itsesi kanssa. Toisaalta ihmettelet, miksi AMD haaskaisi resursseja excavatoriin, jos niitä ei voinut käyttää zenissä, ja toisaalta nyt ehdotat että siihen olisi pitänyt haaskata vielä paljon enemmän resursseja.

AMD teki juuri järkevästi tehdessää excavatorin pienellä vaivalla loppuun vain läppäreihin, ja käyttämällä kunnolla resursseja zeniin, joka sitten myös kelpaa niihin palvelimiin.


Niihin halpisläppäreihin kelpasi paremmin kissaytimillä varustetut ruput. Carrizo oli vähän liian kallis.

:facepalm:

Jälleen kerran sotket täysin ytimiä/niiden mikroarkkitehtuureita ja kokonaisia piirejä. Ja olet muutenkin jällleen pihalla kuin lumiukko asioista mitä höpötät.

Excavator-ytimellä valmistettiin piiri nimeltä Stoney Ridge. AMD KORVASI SILLÄ kissasarjaan pohjautuvat pikku-APUnsa.

Ja tosiaan Excavator-moduli oli 14.48 mm^2, neljä Puma+-ydintä oli yhteensä n. 27 mm^2.

AMD on ennenkin jättänyt käyttämättä suurempia arkkitehtuureita. Komodo ja K12 jäi kokonaan julkaisematta.

JÄLLLEEN KERRAN sotket ytimen mikroarkkitehtuureita ja piirejä keskenään.

Kodomoon suunniteltu mikroarkkitehtuuri, Piledriver, JULKAISTIIN. Se julkaistiin piirillä, jossa vaan pidettiin kaikki "Uncore"-puoli samanlaisena kuin Bulldozer-pohjaisessa zambezissa.

Ne olivat kaksi eri vaihtoehtoa. Molemmissa tapauksissa resursseja säästyy. Parempia tapoja säästää resursseja?

Jälleen kerran voi vastata vaan tällä:

:facepalm:

Dunning–Kruger effect - Wikipedia

Sitä suuremmalla syyllä miksi lisätä käskykantatuki Excavatoriin ja sen jälkeen tehdä täysin tyhjästä Zen johon lisätään käskykantatuki kyseisille käskyille?

:facepalm:

Päätös niiden lisäämisestä excavatoriin oli tehty jo ennen kuin zenin suunnittelu aloitettiin.

Kellotaajuudet näyttivät nousevan tai pysyneet samana.

Kellotaajuudet laskivat selvästi Godavari -> Carrizo. Steamroller-pohjainen Godavari toimi maksimissaan 3.9/4.1 Ghz kellotaajuudella. Ekat Carrizot taisivat toimia maksimissaan 2.1/3.4 GHz kellotaajuudella.

Myöhemmin (mm. valmistustekniikan kypsyttyä) Carrizo saatiin sitten toimimaan 3.5/3.8 GHz kellotaajuudella, ja sitten myöhemmin tuli vielä viilattu malli Bristol Ridge, jossa turbokellot oli vihdoin saatu samalle tasolle kuin godavarissa (kaksi vuotta viilatummalla valmistustekniikalla).

Niin ovat mutta ne ovat silti samat. Sitä kutsutaan resurssipulaksi.

Ensinnäkin, sitä kutsutaan myös yhteensopivuudeksi.

Yleensä olet hirveästi haukkumassa Inteliä siitä, kun Intel laittaa kannan viimeistään kahden vuoden välein uusiksi.

Nyt kun AMD jättää suuren osan ulkoisista liitännät ennalleen, että voidaan käyttää samaa kantaa, kutsutkin sitä resurssipulaksi.

:facepalm:

Ytimen ulkopuoliset osat vuoden 2018 prosessorissa samat kuin 2015 prosessorissa.

:facepalm:

Eikä ole läheskään. Joitain palikoita toki on.

Niitä yhdistävä väylä on aivan erilainen => siihen väylään kytketyt osatkin on erilaisia.

Ja Excavatorissa ei edes ole L3-kakkua.

Vaikka tuo pitäisi paikkaansa, ei tarkoita etteikö Excavatorista olisi voitu silti karsia Zenin eduksi. Tai vaihtoehtoisesti hylätä Excavator ja kehittää Zenin kanssa. Molemmat ovat mahdollisia skenaarioita.

Samassa viestissä ylempänä yrität ehdottaa että excavatoriin olisi pitänyt "panostaa" jotta siitä olisi saatu myös serverimalli ja nyt yritä ehdottaa, että siitä olisi pitänyt "säästää".
Sen lisäksi, että olet pihalla kuin lumiukko, olet täysin epäkonsistentti itsesi kanssa.

Roskainenkin tulos voi olla riittävä kun lähtökohta on tarpeeksi huono.

Ei. Roskainen => buginen. Enemmän aikaa käytetty bugien metsästämiseen ja korjaamiseen, ja valmis toimiva tuote hitaammin markkinoilla.

En edes jaksanut katsoa kissaytimiä. Sillä voi olla merkitystä koska Bulldozerin L2 cachen kellotaajuusrajoitus tuskin olisi ollut ongelma 2 GHz:n kelloilla, 4 GHz:n kelloilla se oli paha asia. Ehkä
valmistustekninen ongelma mutta kuitenkin.

Maalitolppien siirtely-yritys senkun jatkuu. Puhuttiin L1-välimuistin koon kasvattamisen vaikeudesta, L2-välimuistien nopeudella ei tämän kanssa ole mitään tekemistä. Sen sijaan että myöntäisit olleesi väärässä ja puhuneesi hatusta keksittyä paskaa, yrität kääntää keskustelua sivuun. Edelleen, paluu alkuperäiseen: AMD on ennen excavatoria tehnyt 8-tie-joukkoassosiatiivisen 32 kiB L1D-välimuistin kissaytimiinsä.

Tähän aikataulupuoleen liittyen tässä teoriaa. Jim Keller, tunnettu arkkitehtuurisuunnittelija joka suunnittelee prosessorin perusarkkitehtuurin ja kun se on valmis, lähtee uusiin hommiin jättäen toteutuksen muille.

Ei, vaan Jim keller, tunnettu CPU-projektinjohtaja, jolla on myös paljon arkkitehtuurillista osaamista.

https://www.eetimes.com/document.asp?doc_id=1330348&page_number=1

Keller teki Mike Clarkista Zenin pääarkkitehdin, ja itse vain heitteli hiukan ideoita taustalta.

Ja vaikka arkkitehtien työ painottuu projektin alkupuolelle, eivät he voi kokonaan jättää projektia taakseen sen edettyä tiettyyn vaiheeseen;

Esimerkiksi kun laskentayksiköiden toteutuksessa meinaa tulla nopeusongelmia, ja pitää päättää, miten ongelma ratkotaan: Pidetäänkö arkkitehtuuritaso ennallaan, ja käskyn toteutukseen jää paha kriittinen polku joka hidastaa kellotaajuutta selvästi(huono ratkaisu), lisätäänkö käskyn toteutukseen liukuhihnavaihe tai pari (eli lisää viivettä käskylle), jotta se saadaan toteutettua samalla kellotaajuudella (arkkitehtuuritason muutos), vai (jos mahdollista) vaihdetaanko sen toteutuksen algoritmia sellaiseen, joka vaatii paljon enemmän pinta-alaa ja kuluttaa enemmän virtaa, mutta päästään alkuperäiseen nopeustavoitteeseen. Arkkitehdin tehtävä on tehdä tämä päätös yhdessä sitä paliikkaa suunnittelevan insinöörin kanssa, vain hänellä on kokonaisnäkemys siihen.

Samoin testausvaiheessa arkkitehteja tarvitaan edelleen kertomaan, mitä asioita piirissä erityisesti pitää testata, ja miten, koska he tuntevat piirin yleisen rakenteen parhaiten, ja tietävät, millaisissa asioissa siellä todennäköisimmin on bugeja; minkä toiminnallisuuden toteuttamiseen liittyy eniten monimutkaista logiikkaa jossai bugien todennäköisyys on suurin.

Arkkitehtien pitää siis pysyä "käytettävissä" myös projektin loppuvaiheessa. He voivat käyttää jo suurimman osan työajastaan seuraavan prosessoriversion suunnitteluun, mutta välillä heidän osaamistaan tarvitaan sen vanhemman tuotteen parissa. Käytännössä silloin kun uusi versio on jatkokehitelmä vanhasta, tämä sujuu melko saumattomasti.

Mihin hommaan Jim Keller palkattiin AMD:lla?

Tuomaan AMDlle osaamista uuden prosessoriytimen kehitykseen. Tämä tarkoitti sekä johtamista ja prosesseja, että myös arkkitehtuurillisia ideoita, mutta vastoin yleistä käsitystä, Keller EI ollut suoraan Zenin pääarkkitehti.

Jos Kellerin tehtävänä oli suunnitella puhtaalta pöydältä uusi arkkitehtuuri ja Zen on puhtaalta pöydältä suunniteltu uusi arkkitehtuuri, miksi Keller oli AMD:lla vielä kauan sen jälkeen kun Zenin arkkitehtuuri valmistui?

Jälleen kerran olet täysin pihalla siitä, kuinka projektit käytännössä toimii.

Zen-projekti jatkui suoraan zen2-projektina. zen2-projekti jatkuu suoraan zen3-projektina. zen3-projekti jatkuu suoraan zen4- tai zen5-projektina (ei ole varmaa tietoa, onko zen4sta olemassa, koska itämainen kuolema-sana)

K12 piti alunperin tulla ulos samoihin aikoihin kuin Zenin, joten Kelleriä ei AMD:lla pitänyt K12. Mikä siis? Zen2 on hyvä vastaus. Jos Zen oli se kokonaan uusi arkkitehtuuri, miksi Keller ei lähtenyt silloin? Hänen työnsä oli tehty ja Keller viimeksikin lähti AMD:lta siinä vaiheessa kun saa hommansa valmiiksi.

Homma oli tässä AMDn tuotekehitysprosessien viilaaminen tehokkaiksi, sekä tiettyjen ideoiden tuominen prosessoriarkkitehtuuriin liittyen, että hyvä projektinjohtaminen. Homman kannalta sen zenin valmistuminen ei ollut mikään tärkeä juttu. Varsinaisten arkkitehtien työtä tarvittiin pienessä määrin myös muualla, ja toisaalta Keller sai omat arkkkitehtuuri-ideansa välitettyä Clarkille ja muille arkkitehdeille jo aiemmin joten niiden kannalta hän olisi voinut lähteä jopa aiemmin.

Lisäksi: miksi AMD suunnittelisi kokonaan uuden arkkitehtuurin tyhjästä kun markkinoille tarvitaan nopeasti jotain? Kaavaan sopii: Zen2 on kokonaan uusi arkkitehtuuri, Zen ei. Mikäli Zen ei ole kokonaan tyhjästä luotu arkkitehtuuri, mistä se "ei tyhjästä" tuli Zeniin?

:facepalm:

Tämä menee jälleen tälle tasolle

Dunning–Kruger effect - Wikipedia

Kaikki mahdollinen, mitä näistä arkkitehtuureista on sanottu, kertoo että zen2 on zenin jatkokehitelmää.

Kaikki mahdollinen, mitä näistä arkkitehtuureista on sanottu, kertoo että zen on täysin uusi arkkitehtuuri.

AMD on julkinen pörssiyhtiö. Se ei saa valehdella osakkeenomistajilleen, se olisi rikos.

Käytännössä kaikki mahdollinen, mitä näistä arkkitehtuureista näkee niitä järkevästi vertamalla kertoo, että zen on täysin uusi arkkitehtuuri.

Mutta sinä vaan olet saanut päähäsi että AMDn täytyy valehdella ja kaikkein asiantuntijoiden täytyy olla väärässä ja sinä, joka et tiedä piirisuunnittelusta yhtään mitään tiedät paremmin ja pystyt paljastamaan suuren salaliiton.


Niinkuin oikeasti.
 
Viimeksi muokattu:
No vaikka se että Intel ei tuolla 10nm prosessilla saa mitään järkevää ulos vuonna 2018 kun taas "Others" saa ulos järkevää 2018.

First 10nm Cannon Lake Laptop Spotted Online: Lenovo Ideapad 330 for $449

Mitä epäjärkevää tuossa on?

Sen osalta toki tuo käppyrä meni pieleen, että tuo kone ei ollut ulkona viime vuoden puolella, vaan vasta tämän vuoden puolella. Eli tuohon käppyrään nähden myöhästyi puolisen vuotta.

ja tosiaan tuossa käppyrässä ei kerrota, mikä määritelläään siksi ajanhetkeksi, jolloin prosessi voidaan käppyrään piirtää. Onko se ensimmäinen tuote kaupassa?

Ja toki tuollainen viiva joka alkaa nousta jo kohti tulevia tuotteita on harhaanjohtava.

Ja tokihan tuon prosessin suorituskyky ja saannot lienee vielä huonoja. Mutta sillä prosessilla saadaan ihan oikeita tuotteita ulos.

Taitaa koko slidestä puuttua "Others" 7nm prosessit, sehän on täälläkin niin moneen kertaan sanottu että GloFo:n ja TSMC:n 7nm on jotakuinkin sama kuin Intelin 10nm.

juu, puuttuu, mutta:

Käsittääkseni markkinoilla ei ole nähty vielä yhtään muiden "7nm" piirejä. Toki niitä on paperijulkaistu (mm. snapdragon 855), mutta ei ole vielä ostettavissa, piirit ei ole vielä valmiina vaan on tehtaassa valmistuksessa.
Noita Core i3-8121U-piirin sisältäviä läppäreitä sen sijaan saa ostettua kaupasta, melkein puolisen vuotta aiemmin.

Käytännössä tuo käppyrä tuntuu loppuvan tuossa 2018H1 loppuun. Jos 2018H2 olisi otettu mukaan, sinne olisi tullut TSMCn "7nm" prosessi mukaan. Sen transistorityheys tosiaan on hyvin samaa luokkaa kuin Intelin "10nm" prosessin, prosessin todellisissa mitoissa Intelin "10nm" on karvan verran edellä (MMP 40nm vs 36nm, sama CPP(54nm)) mutta SRAM-cellin koossa TSMCn "7nm" on silti 10% pienempi.
Tämä todellisista mitoista huolimatta tiheämpi SRAM vihjaisi siihen, että TSMCn prosessi on vähän enemmän tiheysoptimoitu, intelin uhratessa tiheyttä paremman nopeuden saavuttamiseen. (toki intelin prosessin nykyversio lienee vielä aika paljon hitaampi kuin se mitä siltä odotetaan).

GFn "7nm" prosessin aikatauluista ei tiedetä vielä varmaa, voi mennä ensi vuoden puolelle.


Mutta tuossa käppyrässä esimerkiksi nuo vertailut intelin "14nm" ja muiden "16" tai "14" tai "12nm" välillä menee täysin oikein - intelin "14nm" on niitä selvästi edellä transistoritiheydessä.

Intel on jopa hyvin rehellisesti laittanut sinne mukaan jonkun TSMCn "20nm" prosessin joka oli suorituskyvyltään onneton eikä kelvannut juuri kellekään(vain apple ja qualcomm(ylikuumeneva snapdragon 810), nvidia haukkui sen lyttyyn?), mutta oli transistoritiheydessä intelin "22nm" prosessia edellä.

Joten väite, että
jiipee sanoi:
Todellisuuden kanssahan tuolla ei ole yhtään mitään tekemistä.

On täysin puppu-väite mm. noiden "12nm", "14nm" ja "16nm" palluroiden osalta.
 
Viimeksi muokattu:
Kilpailevat foundryt muuten juttelee jo 5nm prosessista ja 3nm on myöskin jo mainittu. Että ei ne kilpailijat tumput suorina seisoskele ja katse että "WAU! Intel julkaisee kohta 7nm!"

Ne "5nm" ja "3nm" on puhtaita markkinointinimiä. Niillä ei ole mitään tekemistä minkään sen valmistusprosessin fyysisten ominaisuuksien tai suorituskyvyn kanssa. Markkinointi voi aina keksiä uusia numeroita, eikä se ole kovin vaikeaa.

Jos tehdään vaikka 10% viilaus "7nm" prosessiin ja julkaistaan se "5nm" nimellä, ja sen jälkeen tehdään toinen 10% viilaus, ja julkaistaan se "3nm" nimellä, ollaan kokonaisuutena saatu aikaan paljon vähemmän kuin se, että intel julkaisee vaikka "7nm" prosessin joka oikeasti pienentää geometriaa 30% suuntaansa.

Että melko turha vertailla noita markkinointinimiä keskenään.

Nuo "12nm" prosessit on hyvä esimerkki tästä: Intelin "14nm" on selvästi tiheämpi kuin GFn tai TSMCn "12nm" prosessi. TSMCn "12nm" prosessilla taitaa olla edelleen aivan samat mitat kuin niiden "20nm" prosessilla, solukirjastoa tosin ollaan viilattu siten, että standardisoluista tehty syntetisoitu logiikka voidaan pakata hiukan tiukempaan.
 
Viimeksi muokattu:
@Threadripper :lle annettu varoitus jatkuvasta maalitolppien siirtelystä ja vänkäämisestä

Saanko perustelut maalitolppien siirtelylle? Se että joku sanoo minun siirtelevän maalitolppia ei tarkoita niin tapahtuneen. Missään kohtaa en mitään maalitolppia ole siirtänyt. Muistuttaa kovasti aiempaa keskustelua jossa väitin luvun 8 olevan pienempi kuin luvun 40 ja sain varoituksen. Yksityisviesteillä käydyssä keskustelussa yksi käyttäjä jopa ymmärsi pointin.

Minäkö olen ainoa joka täällä vänkää? Mitä tuo sitten on jos ei vänkäämistä?

Missään ei sanota, että Kellerillä olisi ollut osaa tai arpaa Zen 2:n suunnittelussa, saattoi olla tai saattoi olla olematta, se ettet keksi "parempaakaan tekemistä" jollekin tietylle ajanjaksolle ei tarkoita että olisit oikeassa.
Heität myös täysin hatusta että sen ja sen oli pakko olla valmis silloin ja tällöin koska roadmap sitä ja tätä. Se että K12 aiottiin joskus julkaista ennen Zeniä ei tarkoita että se olisi ollut valmis ennen Zeniä.

Kerrot kuinka ei voi olla noin koska ei ole virallista tietoa muttet anna mitään mikä toisi mitään keskusteluun. Eli jos ei ole virallista tietoa, ei voida spekuloida mitään koska se ei välttämättä pidä paikkaansa :confused: Spekulointi kielletty, varsinkin sellainen jossa esitetään jotain väitteiden tueksi.
 
Missasit sitten jälleen täysin koko pointtini. Shakki ihmistä vastaan on reaaliaikasovellus, joka toimii tarpeeksi nopeasti kaikilla markkinoilla olevilla prosessoreilla. Sen nopeuttamiseen ei ole mitään tarvetta.

Sitä tehoa on siihen aseman analysointiin aivan riittävästi vaikka PEXT-käsky on hidas. Se tietokone voittaa silti heittämällä ihmisen

Ei ihme että syytät maalitolppien siirtämisestä kun et edes yritä tajuta mitä sinulle kerrotaan.

Shakkiohjelmissa tarvitaan tehoa mm. aseman analysointiin. Mikä olisi paras siirto asemassa, kun siirettiin näin oliko kyseessä hyvä vai huono siirto ja kumpi on asemassa johdossa jne.

Shakkiohjelman nopeuttamiseen ihmistä vastaan ei ole tarvetta. Shakkiohjelman nopeuttamiseen on tarvetta kun analysoidaan asemaa ja siihen liittyviä parhaita siirtoja. Shakki tietokone vs ihminen on todellakin evvk. Katso vaikka tuolta mikä tahansa turnauksen mikä tahansa peli niin ymmärrät mistä on kyse ChessBomb
 
Saanko perustelut maalitolppien siirtelylle?
Onhan tuolla noita esimerkkejä, vaikka viimeisimpänä L1-keskustelun kääntäminen yhtäkkiä L2:een
Kerrot kuinka ei voi olla noin koska ei ole virallista tietoa muttet anna mitään mikä toisi mitään keskusteluun. Eli jos ei ole virallista tietoa, ei voida spekuloida mitään koska se ei välttämättä pidä paikkaansa :confused: Spekulointi kielletty, varsinkin sellainen jossa esitetään jotain väitteiden tueksi.
Spekulointi ei ole kiellettyä, ongelma on siinä että esität asiat kuin ne olisivat faktoja, vaikka kyse on vain omista arvauksistasi
 
Arjen rasismia
Twn9QuP.png
 
Onhan tuolla noita esimerkkejä, vaikka viimeisimpänä L1-keskustelun kääntäminen yhtäkkiä L2:een

Klassinen "jäi lukematta aiempi keskustelu" tapaus kyseessä.

Olennaista oli, onko AMD:lla kokemusta siitä miten mainittu välimuisti käyttäytyy kun kelloja laitetaan 4 GHz kuten Zenissä? Kissaytimet eivät sitä kerro koska liian alhainen kellotaajuus. Excavator kertoo paljon paremmin. Bulldozer otettiin mukaan koska

Siitä, millä kellotaajudella ne kisasasrjassa toimii ei tämän kannalta ole mitään merkitystä.

Ai? Miten Bulldozerin kellottuvuudelle kun L2 välimuisti rajoitti 4 GHz:n paikkeilla? Hyvin huonosti. Joten kyllä sillä voi olla väliä.

Maalitolpat eivät siirtyneet koska vastasin siihen miksi asialla voi olla väliä. MOT.

Spekulointi ei ole kiellettyä, ongelma on siinä että esität asiat kuin ne olisivat faktoja, vaikka kyse on vain omista arvauksistasi

Minulla on sentään jotain lähteitä väitteilleni. Koska Zen2:n arkkitehtuurista ei ole kerrottu yhtään mitään, kaikki Zen2 arkkitehtuuriin liittyvä on spekulaatiota.

Odotan edelleen lähdettä tuolle väitteelle:

Excavatorin suunnittelu aloitettiin Zenin suunnittelun kanssa suunnilleen samoihin aikoihin.

Ei, vaan pari vuotta aiemmin.

Excavator nähtiin jo mm. lokakuussa 2011 julkaistuissa slideissä.
 
Shakkiohjelman nopeuttamiseen ihmistä vastaan ei ole tarvetta. Shakkiohjelman nopeuttamiseen on tarvetta kun analysoidaan asemaa ja siihen liittyviä parhaita siirtoja. Shakki tietokone vs ihminen on todellakin evvk. Katso vaikka tuolta mikä tahansa turnauksen mikä tahansa peli niin ymmärrät mistä on kyse ChessBomb

Noniin, löysit maailmasta YHDEN www-siten jonka palvelimilla tuolle nopeutukselle olisi käyttöä. Ja sillä webbisitellä on ehkä joitain kymmeniä palvelinkoneita?

Näitä vastaavia sitejä on ehkä pari muutakin maailmassa ja voidaan päästä ehkä satoihin palvelinkoneisiin joissa tälle on tarvetta?

Ja näiden takia kymmeniin tai satoihin miljoniin prosessoreihin joita myydään kaikkialle muualle maailmaan pitäisi tehdä nopea totutus käskystä jota näiden palvelujen ehkä muutamat sadat palvelimet tarvii?

:facepalm:

On AMDlle aika paljon kannattavampaa antaa vaan intelin ottaa myynnit näistä kuin alkaa näkemään R&D-vaivaa (jonka voisi käyttää tärkeämpien optimointien tekemiseen) ja ehkä tekemään ytimistään hiukan isompia ihan vaan näiden takia.

Toki se nopeampi PEXT-käsky varmaan AMDlle joskus tulee. Mutta ei sen takia, että sitä shakkiin tarvitaan, vaan sen takia että sitä joskus tulevaisuudessa tullaan käyttämään johonkin muuhunkin, hyödyllisempään tarkoitukseen. Ja kun muut, enemmän "low hanging fruit"it saadaan ensin tehtyä, sitten voidaan keskittyä harvemmin käytettyjen käskyjen kuten PEXTin optimointiin.

Ja näköjään tuota PEXT-käskyä voisi käyttää esimerkiksi morton-koodien laskemiseen. Morton-koodeja taas voi käyttää moniin melko kehittyneisiin algoritmeihin, esimerkiksi lineaarialgebrassa ja säteenjäljityksessä (tosin molemmat pyritään CPUn sijasta laskemaan GPUlla)
 
First 10nm Cannon Lake Laptop Spotted Online: Lenovo Ideapad 330 for $449

Mitä epäjärkevää tuossa on?

Sen osalta toki tuo käppyrä meni pieleen, että tuo kone ei ollut ulkona viime vuoden puolella, vaan vasta tämän vuoden puolella. Eli tuohon käppyrään nähden myöhästyi puolisen vuotta.

ja tosiaan tuossa käppyrässä ei kerrota, mikä määritelläään siksi ajanhetkeksi, jolloin prosessi voidaan käppyrään piirtää. Onko se ensimmäinen tuote kaupassa?

Ja toki tuollainen viiva joka alkaa nousta jo kohti tulevia tuotteita on harhaanjohtava.

Ja tokihan tuon prosessin suorituskyky ja saannot lienee vielä huonoja. Mutta sillä prosessilla saadaan ihan oikeita tuotteita ulos.
Teknisesti ottaen on julkaistu yksi uutta prosessia käyttävä vähäpätöinen ja karsittu tuote, joka on kaikessa huonompi kuin hieman aiemmin julkaistu vanhempaa prosessia käyttävä i3-8130U. Suoraan sanoen ihmetyttää, että miksi tuo i3-8121U edes julkaistiin. Ehkä tulevissa slaideissa näyttää kivalta, kun jo vuoden 2018 alkupuoliskolla on tullut valmistusprosessista jotain myytävää ulos. Jos ensimmäistä järkevää tuotetta pitää odottaa tämän jälkeen odottaa vuosi, niin pidän julkaisua melko nimellisenä. Saa nähdä, miten käy.
 
Teknisesti ottaen on julkaistu yksi uutta prosessia käyttävä vähäpätöinen ja karsittu tuote, joka on kaikessa huonompi kuin hieman aiemmin julkaistu vanhempaa prosessia käyttävä i3-8130U.

Ei aivan kaikessa;

Cannon lake tukee AVX-512sta, Kaby Lake ei. Ja tämä on aika merkittävä parannus.

Samoin tuossa on mm. lisää tietoturvaominaisuuksia virtualisointiin, MBE.

Lisäksi energiatehokkuudesta ei tiedetä varmuudella mitään, se voi olla huonompi tai parempi.

Suoraan sanoen ihmetyttää, että miksi tuo i3-8121U edes julkaistiin. Ehkä tulevissa slaideissa näyttää kivalta, kun jo vuoden 2018 alkupuoliskolla on tullut valmistusprosessista jotain myytävää ulos. Jos ensimmäistä järkevää tuotetta pitää odottaa tämän jälkeen odottaa vuosi, niin pidän julkaisua melko nimellisenä. Saa nähdä, miten käy.

Kun sitä valmistusprosessia kehitetään, sitä pitää joka tapauksessa testata jollain. Ja parhaat testikappaleet jossa varmasti monimutkaisimmat ongelmat paljastuu on ihan oikeat prosessorit.

Ja kun sieltä saadaan ihan toimiva prosessoreita ulos, miksi ne heitettäisiin roskiin sen sijasta, että ne myydään asiakkaille?

Intelin toimintatapa on, että uusi valmistusprosessi kehitetään yhdessä tehtaassa (ja sen kehittämisen aikana sillä tehdään koekappaleita ja sitä viilataan jne), ja siinä vaiheessa, kun prosessi toimii riittävän hyvin (siitä saadaan ulos parempia tuotteita tai halvemmalla kuin vanhasta), se prosessi kloonataan aivan samanlaisena muihin tehtaisiin. Jopa tehtaan sisäilman ilmankosteus vakioidaan eri tehtaiden välillä.

Nyt tilanne on se, että "10nm" prosessilla saadaan toimivia piirejä ulos, mutta niiden saanto on vielä niin huono, ja/tai niiden suorituskyky on niin huono, että tätä prosessia ei vielä kannata kloonata muihin tehtaisiin, kun "14nm" prosessilla saadaan tuotettua parempia piirejä ja/tai halvemmalla.

Tämä yksi "tuotekehitystehdas" kuitenkin tuottaa koko ajan piirejä ulos samalla kun valmistustekniikan parametreja viilataan.
 
Viimeksi muokattu:
Ne "5nm" ja "3nm" on puhtaita markkinointinimiä. Niillä ei ole mitään tekemistä minkään sen valmistusprosessin fyysisten ominaisuuksien tai suorituskyvyn kanssa. Markkinointi voi aina keksiä uusia numeroita, eikä se ole kovin vaikeaa.

Niin olenko minä väittänyt jossain että noi luvut olisi todellisia? Intelin 7nm tiedetään sen verran että ovat sanoneet ettei yhtä agressiivista shrinkkiä lähetä hakemaan kuin 10nm kanssa on vuosi tolkulla nyt yritetty. Jotain sentään opittu.

Pointti on se että Intelillä ollut etumatka valmistusprosessissa on nyt kurottu umpeen muiden toimesta.

Ja se on ihan sinua lainatakseni "EVVK" jos Intel on julkaissut jonkun 2-core tuhnun 10nm. Vastaavasti TSMC on samplannut Rome ja 7nm Vegaa jo jonkin aikaa jota pidän huomattavasti suurempana saavutuksena kuin noita 2-core tuhnuja.
Toi 7nm Vega esim on hiukan toista kokoluokkaa kuin joku 2-core tuhnu, eli TSMC on varsin pitkällä tuon prosessinsa kanssa ainakin omasta mielestäni kun tuon kokoluokan piiriä samplataan ja myyntiin olisi AMD:n mukaan tulossa vielä vuoden lopulla.
 
Niin olenko minä väittänyt jossain että noi luvut olisi todellisia? Intelin 7nm tiedetään sen verran että ovat sanoneet ettei yhtä agressiivista shrinkkiä lähetä hakemaan kuin 10nm kanssa on vuosi tolkulla nyt yritetty. Jotain sentään opittu.

Pointti on se että Intelillä ollut etumatka valmistusprosessissa on nyt kurottu umpeen muiden toimesta.

Ja se on ihan sinua lainatakseni "EVVK" jos Intel on julkaissut jonkun 2-core tuhnun 10nm. Vastaavasti TSMC on samplannut Rome ja 7nm Vegaa jo jonkin aikaa jota pidän huomattavasti suurempana saavutuksena kuin noita 2-core tuhnuja.
Toi 7nm Vega esim on hiukan toista kokoluokkaa kuin joku 2-core tuhnu, eli TSMC on varsin pitkällä tuon prosessinsa kanssa ainakin omasta mielestäni kun tuon kokoluokan piiriä samplataan ja myyntiin olisi AMD:n mukaan tulossa vielä vuoden lopulla.

"Samplaaminen" on aivan eri juttu kuin myynnissä olevan tuotteen valmistaminen.

Tuotetta voidaan välillä samplata vaikka pari vuotta, kunnes se saadaan oikeasti toimimaan , ja riittävillä saannoilla ja suorituskyvyllä myyntikuntoon.

Tyypillisesti ensimmäiset samplet tulee melkein vuosi ennen tuotteen julkaisua, mutta bugien tai muiden ongelmien takia voi joskus mennä selvästi kauemminkin.

Että jospa kuitenkin puhuttaisiin siitä TSMCn "7nm" prosessin ylivoimaisuudesta ja toimivuudesta intelin "10nm" prosessiin nähden vasta kun ne sillä tehdyt tuotteet on oikeasti markkinoilla.
 
Että jospa kuitenkin puhuttaisiin siitä TSMCn "7nm" prosessin ylivoimaisuudesta ja toimivuudesta intelin "10nm" prosessiin nähden vasta kun ne sillä tehdyt tuotteet on oikeasti markkinoilla.

Sopii minulle jos sinulle sopii se että mitään 2-core tuhnuja ei myöskään oteta laskuihin.
 
"Samplaaminen" on aivan eri juttu kuin myynnissä olevan tuotteen valmistaminen.

Tuotetta voidaan välillä samplata vaikka pari vuotta, kunnes se saadaan oikeasti toimimaan , ja riittävillä saannoilla ja suorituskyvyllä myyntikuntoon.

Tyypillisesti ensimmäiset samplet tulee melkein vuosi ennen tuotteen julkaisua, mutta bugien tai muiden ongelmien takia voi joskus mennä selvästi kauemminkin.

Että jospa kuitenkin puhuttaisiin siitä TSMCn "7nm" prosessin ylivoimaisuudesta ja toimivuudesta intelin "10nm" prosessiin nähden vasta kun ne sillä tehdyt tuotteet on oikeasti markkinoilla.

Tämä lienee jo nähty, mutta laitanpa silti:
TSMC Kicks Off Volume Production of 7nm Chips
Siitä ehkä kiinnostavin kappale:
“So far, we have already favored out more than 18 customer products with good yield [and] performance,” said C. C. Wei, a Co-CEO and President of TSMC, during a conference call with financial analysts. “More than 50 products tape-outs has been planned by end of this year from applications across mobile, server CPU, network processor, gaming, GPU, PGA, cryptocurrency, automotive and AI. Our 7nm is already in volume production.”
(Tuo C.C Wei:n kommentti 7nm:n palvelin-CPU:ista oli mielenkiintoinen. Liekö paljoa muita vaihtoehtoja kuin EPYC?)

Huomattavaa on, että TSMC tekee nyt noita kiviä hyvin laajalle segmentille. Myös minun mielestäni jonkun verran hiusten halkomista vetää joku Core i3-8121U perusteeksi Intelin 10nm kyvykkyydestä. Kyseesä on ihan mopotuote: dual-core, 2,2GHz, max turbo 3,1GHz, eikä iGPU:ta. Tuotteen ominaisuuksissa ei ole mitään perustetta 10nm-prosessin käytölle. Akkukestoksikin luvataan näköjään vain 5h. Tuo näyttää enemmänkin heikolta yritykseltä pelastaa edes osa kasvoista sen vuosia jatkuneen 10nm-lupailun jälkeen (se "10nm tuotteita jo myynnissä"-argumentti). Saannot on tosiaan myös vielä mitä sattuu kun muuta 10nm-tavaraa ei ole tarjolla. Veikkaisin että TSMC olisi hyvin voinut myös julkaista jonkun vastaavan höpönlöpön tuotteen aikaa sitten kun kerta yllä mainittu määrä oikeasti high-end massamarkkinatuotteita (esim. se 855) on nyt tulossa heillä tuotantoon (tai jo on).

Itse en kyllä ihan noin vahvasti liputtaisi Intelin prosessikyvykkyydestä nykytietämyksen valossa. Mutta tosiaan katsotaan sitten kun näkyy kummankin tuotteita markkinoilla. Intelin tämän hetken tarjontaa ei ole ainakaan vaikea pestä ja ajatushan tässä varmaan oli että kummalla on parempi 7/10nm prosessi ja nimenomaan kenellä se on high-end-massatuotantoon toimintakypsä aiemmin. Intel voi tuoda paremman prosessin ensi vuonna, mutta TSMC lupailee sinne jo EUVL:ää eli hedän termeillään 7FF+.

Ja niistä 3nm/5nm-markkinointitermeistä, niin ei se IBM:kään nyt ihan n00b ole. Vaikka matkaa varmasti on, niin tämä nyt vain tuli jostain muualta kuin Inteliltä:
IBM unveils world’s first 5nm chip
Ja tuossa on jo melko iso muutos verrattuna nykyiseen FinFetiin. Varmaan tuostakin kiekosta voisi ottaa muutaman piirin ja myydä ne "ensimmäisinä" 5nm-piireinä markkinoille.
 
Viimeksi muokattu:
@Threadripper :lle annettu varoitus jatkuvasta maalitolppien siirtelystä ja vänkäämisestä
Antaisitteko myös Mr @hkultala :lle varoituksen henkilökohtaisuuksiiin menemisestä? Viestit ovat tietosisällöllisesti mielenkiintoisia, mutta välillä turhan kärkkäitä. Jos ja kun asioista väitellään, niin henkilökohtaisuuksiin meneminen ei edistä väittelyä millään lailla. Mielestäni säännöt tulee olla näiltä osin samat kaikille, vaikka jonkun tietotaito jollain alueella voikin olla ensiluokkaista. Jos ei pysty asiallisesti vastaamaan liian tonttuun viestiin, niin sitten jättää vastaamatta. Trolli tarvitsee sen vastapuolen elääkseen.
 
Viimeksi muokattu:
(Tuo C.C Wei:n kommentti 7nm:n palvelin-CPU:ista oli mielenkiintoinen. Liekö paljoa muita vaihtoehtoja kuin EPYC?)

Romea on samplattu tietyille partnereille jo jonkin aikaa validointiin ja tuo artikkeli on keväältä eli eiköhän sillä Romea tarkoitettu.

Ja tosiaan TSMC ilmoitti keväällä 7nm aloitetun volume production kun taas Intel lupailee 10nm vlolume production käynnistymistä loppuvuodesta 2019. Että jokainen voi tehdä tuosta omat johtopäätöksensä kumpi on edellä.
 
Romea on samplattu tietyille partnereille jo jonkin aikaa validointiin ja tuo artikkeli on keväältä eli eiköhän sillä Romea tarkoitettu.

Ja tosiaan TSMC ilmoitti keväällä 7nm aloitetun volume production kun taas Intel lupailee 10nm vlolume production käynnistymistä loppuvuodesta 2019. Että jokainen voi tehdä tuosta omat johtopäätöksensä kumpi on edellä.
Joo, eiköhän tuo ole selvä juttu. Huvittaa vain tässäkin asiassa tuo hiusten halkominen. Muutama viesti taaksepäin vastaus TR:lle:

Niinkuin oikeasti. Minä en keksi asioita päästäsi kuten sinä, tai jos keksin, sanon hyvin selvästi että kyse on spekulaatiosta, enkä ole asiasta varma.

Ja jos spekulaationi osoittautuu vääräksi, sitten totean spekuloineeni väärin, enkä ala puolustamaan virheellistä spekulaatiotani mitä naurettavimmalla vänkäämisellä.
Vähän tuntuisi nyt pata-kattilaa-meiningiltä. Noh, popparit käteen, onhan tämä kovatasoista ja hinta-laatusuhteeltaan erinomaista viihdettä. :)
 
Sadas sivu jätkät (+se imaginäärinen mimmi joka tätä myös seuraa)! :D ;)

1O7y5fw.jpg
 
Viimeksi muokattu:
...
Zen-projekti jatkui suoraan zen2-projektina. zen2-projekti jatkuu suoraan zen3-projektina. zen3-projekti jatkuu suoraan zen4- tai zen5-projektina (ei ole varmaa tietoa, onko zen4sta olemassa, koska itämainen kuolema-sana)
...
Tuohon liityen kysymys onko kellään tietoa onko AMD:lla yksi tiimi kehittämässä Zenejä vai kaksi ts tapahtuuko kehitys sarjassa vai osittain rinnan.

GPU puolellahan AMD:llä on ollut kaksi ryhmää niin että yksi ryhmä kehittäää jokatoisen sukupolven ja täten ryhmät toimii rinkannakin vuorotahdilla.

Niin no vain hidas tuplaydinprosessori johon tarvii siitähuolimatta vielä erillisen GPU:n kun se prosessori ei sisällä toimivaa iGPU:ta ei mielestäni nykyaikana ole erityisen järkevä tuote.

Ne "5nm" ja "3nm" on puhtaita markkinointinimiä. Niillä ei ole mitään tekemistä minkään sen valmistusprosessin fyysisten ominaisuuksien tai suorituskyvyn kanssa. Markkinointi voi aina keksiä uusia numeroita, eikä se ole kovin vaikeaa.
...
Olenko ymmärtänyt oikein että nykyisellä valmistustekniikalla ja materiaaleilla ei edes teoriassa voi päässä 4,5-4nm pienempään mittakaavaan
(ja tietenkin on erittäin epätodennäköistä että käytännössä päästäisiin siihen teoreetiseen maksimiin millään edes etäisesti kaupallisesti järkevillä kustannuksilla).
 
Viimeksi muokattu:
...

Kun sitä valmistusprosessia kehitetään, sitä pitää joka tapauksessa testata jollain. Ja parhaat testikappaleet jossa varmasti monimutkaisimmat ongelmat paljastuu on ihan oikeat prosessorit.

Ja kun sieltä saadaan ihan toimiva prosessoreita ulos, miksi ne heitettäisiin roskiin sen sijasta, että ne myydään asiakkaille?

Intelin toimintatapa on, että uusi valmistusprosessi kehitetään yhdessä tehtaassa (ja sen kehittämisen aikana sillä tehdään koekappaleita ja sitä viilataan jne), ja siinä vaiheessa, kun prosessi toimii riittävän hyvin (siitä saadaan ulos parempia tuotteita tai halvemmalla kuin vanhasta), se prosessi kloonataan aivan samanlaisena muihin tehtaisiin. Jopa tehtaan sisäilman ilmankosteus vakioidaan eri tehtaiden välillä.

Nyt tilanne on se, että "10nm" prosessilla saadaan toimivia piirejä ulos, mutta niiden saanto on vielä niin huono, ja/tai niiden suorituskyky on niin huono, että tätä prosessia ei vielä kannata kloonata muihin tehtaisiin, kun "14nm" prosessilla saadaan tuotettua parempia piirejä ja/tai halvemmalla.

Tämä yksi "tuotekehitystehdas" kuitenkin tuottaa koko ajan piirejä ulos samalla kun valmistustekniikan parametreja viilataan.
Miten todennäköistä on muuten että Intel pystyisi saamaan tuon 10nm prosessinsa kuntoon "vain" sitä valmistusta hiomalla ts kuinka mahdollista on se että koko 10nm prosessi on jotenkin perustavanlaatuisesti pielessä niin että sitä ei saada toimimaan ennen kuin se ja sille suuniteltavat prosessorit suunitellaan kokonaan uusiksi.

Meinaan kun ne puheet siitä milläperusteilla Intel suunnittelee seuraavaa 7nm prosessia annoit vähän ymmärtää että tuossa 10nm suunittelussa olisi jotain jo lähtökohtaisesti pielessä.

Ts ongelma ei olisi varsinaisesti sen 10nm tehtaan valmistuslaitteissa vaan siinä mitä ja miten niillä yritetään valmistaa.

Ts onko mahdolista että Intel päätyy käytännössä hyppäämään 10nm massatuotannon yli ja siirtyisi suoraan 7nm massatuotantoon (tämä ei tarkoita etteikö 10nm:llä valmistettaisi merkittävää märää Intel tuotteita).
 
Viimeksi muokattu:
Ts onko mahdolista että Intel päätyy käytännössä hyppäämään 10nm massatuotannon yli ja siirtyisi suoraan 7nm massatuotantoon (tämä ei tarkoita etteikö 10nm:llä valmistettaisi merkittävää märää Intel tuotteita).

Itse olen omassa mielessäni vähän veikkaillut että näin tulee käymään ja 10nm valmistetaan vain jotain tuhnuja kun sitä ei saada toimimaan ilman että se tehtäisiin käytännössä kokonaan uusiksi. On sitä sen verran nyt jo lykätty ja tunetettu että alkaa näyttää siltä että ei siitä toimivaa tule koskaan.
 
Miten todennäköistä on muuten että Intel pystyisi saamaan tuon 10nm prosessinsa kuntoon "vain" sitä valmistusta hiomalla ts kuinka mahdollista on se että koko 10nm prosessi on jotenkin perustavanlaatuisesti pielessä niin että sitä ei saada toimimaan ennen kuin se ja sille suuniteltavat prosssorit suunitellaan kokonaan uusiksi.

Meinaan kun ne puheet siitä milläperusteilla Intel suunnittelee seuraavaa 7nm prosessia annoit vähän ymmärtää että tuossa 10nm suunittelussa olisi jotain jo lähtökohtaisesti pielessä.

Ts ongelma ei olisi varsinaisesti sen 10nm tehtaan valmistuslaitteissa vaan siinä mitä ja miten niillä yritetään valmistaa.

Ts onko mahdolista että Intel päätyy käytännössä hyppäämään 10nm massatuotannon yli ja siirtyisi suoraan 7nm massatuotantoon (tämä ei tarkoita etteikö 10nm:llä valmistettaisi merkittävää märää Intel tuotteita).

Mikäli ongelmat liittyy tuohon koboltin käyttöön alimpien kerrosten johdotuksissa, sitten tilanne on pikemminkin siten, että kun muut "5nm" prosesseissaan siirtyvät myös koboltin käyttöön, heillä on suurella riskillä edessään ne samat ongelmat, joiden kanssa intel nyt tappelee, kun taas intel on siinä vaiheessa ratkonut jo nämä ongelmat tapeltuaan niiden kanssa "10nm" prosessinsa kanssa.

Kupari vaatii ympärilleen suojakerroksen joka alkaa käydä niin kapeaksi, että itse johdolle ei meinaa jäädä matalimmilla (tiheämmillä) johdotuskerroksilla käytännössä juuri ollenkaan tilaa, siitä on käytännössä pakko siirtyä pois johdotuksien kaventuessa. Ja tällä hetkellä kaikilla suunta näyttäisi olevan kohti kobolttia, muilla vaan hiukan myöhemmin kuin Intelillä.

Intel "10nm" prosessissaan valitsi hyvin tiheän nollakerroksen(M0)-johdotuksen (johtoväli 36nm, muiden "7nm" prosessien M0-johtovälin ollessa 40nm), joten intelillä oli siten hiukan suurempi paine ottaa kobolti käyttöön aiemmin.

Ja jos taas koboltin käytössä on jotain perustavanlaatuisia ongelmia, ettei kyse ole vaan ongelmista sen käyttöönotossa vaan sitä ei vaan millään saada toimimaan riittävän hyvin, sitten kaikki piirivalmistajat ovat ongelmissa, kaikkien pitää löytää joku uusi korvaava aine kuparin tilalle alimpien tasojen johdoille, jos koboltista ei siihen olekaan, jotta valmistustekniikoiden kehitystä saadaan jatkettua.


Mutta sinänsä on nyt hyvä jälkiviisastella, että jos intel olisi vaikka valinnut M0-johtovälikseen vaikka jotain 42-44 nanometrin luokkaa, ja pysynyt kuparin käytössä, paljon ongelmia olisi varmaan vältetty, ja prosessi olisi voinut olla kunnollisessa massatuotannossa jo kauan sitten, transistoritiheys (ja optimaalinen suorituskyky prosessin toimiessa oikein) olisi vaan ollut jonkin verran huonompi, tuo 2.7x tiheyden parantamiseen tähtääminen (joka mahdollisesti vaati sen koboltin) oli liikaa. Toilsaalta sitten ne kobolttiongelmat olisi varmaan olleet edessä "7nm" prosessin kanssa.
 
Viimeksi muokattu:
Noniin, löysit maailmasta YHDEN www-siten jonka palvelimilla tuolle nopeutukselle olisi käyttöä. Ja sillä webbisitellä on ehkä joitain kymmeniä palvelinkoneita?

Näitä vastaavia sitejä on ehkä pari muutakin maailmassa ja voidaan päästä ehkä satoihin palvelinkoneisiin joissa tälle on tarvetta?

Ja näiden takia kymmeniin tai satoihin miljoniin prosessoreihin joita myydään kaikkialle muualle maailmaan pitäisi tehdä nopea totutus käskystä jota näiden palvelujen ehkä muutamat sadat palvelimet tarvii?

:facepalm:

On AMDlle aika paljon kannattavampaa antaa vaan intelin ottaa myynnit näistä kuin alkaa näkemään R&D-vaivaa (jonka voisi käyttää tärkeämpien optimointien tekemiseen) ja ehkä tekemään ytimistään hiukan isompia ihan vaan näiden takia.

Toki se nopeampi PEXT-käsky varmaan AMDlle joskus tulee. Mutta ei sen takia, että sitä shakkiin tarvitaan, vaan sen takia että sitä joskus tulevaisuudessa tullaan käyttämään johonkin muuhunkin, hyödyllisempään tarkoitukseen. Ja kun muut, enemmän "low hanging fruit"it saadaan ensin tehtyä, sitten voidaan keskittyä harvemmin käytettyjen käskyjen kuten PEXTin optimointiin.

Ja näköjään tuota PEXT-käskyä voisi käyttää esimerkiksi morton-koodien laskemiseen. Morton-koodeja taas voi käyttää moniin melko kehittyneisiin algoritmeihin, esimerkiksi lineaarialgebrassa ja säteenjäljityksessä (tosin molemmat pyritään CPUn sijasta laskemaan GPUlla)

"Toimii kaikilla prosessoreilla riittävän nopeasti" vaihtui "evvk koska ei ole markkinoita".

Maalitolpat :rolleyes:

Fanipojuille lisää vänkäämisen aihetta

Best (Non-Gaming) Performance CPUs

Mukava nähdä Tom's Hardwaren pystyvän tekemään jutun jossa suositellaan pelkkää AMD:ta ja Inteliä vain sivulauseissa. Olen pitkään pitänyt tuollaista artikkelia mahdottomana. Heti kun pelaaminen jätetään pois, Intel ei näytä kelpaavan missään kategoriassa. Toivotaan Zen2:n menevän ohi pelessäkin niin Inteliä ei enää tarvita :hungry:
 
"Toimii kaikilla prosessoreilla riittävän nopeasti" vaihtui "evvk koska ei ole markkinoita".

Maalitolpat :rolleyes:
Tässä tapauksessahan kyseessä on täysin sama asia:
Ryzen toimii (hitaasti) Intel toimii (nopeasti), käskyä ei käytetä juuri yhtään missään (yhdellä shakkiohjelmalla ei ole mitään merkitystä)-> Toimii kaikilla riittävän nopeasti, ELI ominaisuudella ei ole markkinoita (tällähetkellä).

Sekä Intelin, että AMD:n tulisi kehittää nyt prossun sisäisten palikoiden välistä kommunikointinopeutta ja välimuistisysteemiä. Ne ovat tällähetkellä se asia, joilla tehdään se voittajasiru. Jollain ei missään käytetyllä hömppälisäkäskyllä ei ole mitään merkitystä. Samoin muistiohjainta kannattaa kehittää, perustuen ihan siihen, miten molemmat hyötyvät selkeästi muistin kellottamisesta.
 
Tässä tapauksessahan kyseessä on täysin sama asia:
Ryzen toimii (hitaasti) Intel toimii (nopeasti), käskyä ei käytetä juuri yhtään missään (yhdellä shakkiohjelmalla ei ole mitään merkitystä)-> Toimii kaikilla riittävän nopeasti, ELI ominaisuudella ei ole markkinoita (tällähetkellä).

Sekä Intelin, että AMD:n tulisi kehittää nyt prossun sisäisten palikoiden välistä kommunikointinopeutta ja välimuistisysteemiä. Ne ovat tällähetkellä se asia, joilla tehdään se voittajasiru. Jollain ei missään käytetyllä hömppälisäkäskyllä ei ole mitään merkitystä. Samoin muistiohjainta kannattaa kehittää, perustuen ihan siihen, miten molemmat hyötyvät selkeästi muistin kellottamisesta.

Höpö höpö. Ensin nopeudella ei ole väliä "koska kaikki prosessorit ovat yhtä nopeita" ja kun käy ilmi ettei se nopeus olekaan ihan yksi ja sama, siirrytään kertomaan kuinka nopeus evvk koska pienet markkinat. Täysin eri asioita.

Välimuistien reilu parannus prosessorin sisällä on haastavaa ellei keksitä uutta tekniikkaa. Superiso ulkoinen välimuisti (2 gigaa HBM2:ta esim) auttaisi lähinnä näytönohjaimia. En usko tuolla puolella tapahtuvan paljoa lähiaikoina.

Muistiohjaimen kehitys näyttää olevan suuri ongelma vain tietyissä ohjelmissa jotka yleensä ovat ikivanhoja. Fallout 4 ehkä paras esimerkki. En usko DDR4:n kehitykseen enää paljoa panostettavan muutenkaan koska DDR5 tulee noin parin vuoden päästä ja siellä missä rahaa tehdään (serverit) on jämähdetty 2666 MHz:n. Menevätköhän ylöspäin koskaan.
 
Höpö höpö. Ensin nopeudella ei ole väliä "koska kaikki prosessorit ovat yhtä nopeita" ja kun käy ilmi ettei se nopeus olekaan ihan yksi ja sama, siirrytään kertomaan kuinka nopeus evvk koska pienet markkinat. Täysin eri asioita.

Välimuistien reilu parannus prosessorin sisällä on haastavaa ellei keksitä uutta tekniikkaa. Superiso ulkoinen välimuisti (2 gigaa HBM2:ta esim) auttaisi lähinnä näytönohjaimia. En usko tuolla puolella tapahtuvan paljoa lähiaikoina.

Muistiohjaimen kehitys näyttää olevan suuri ongelma vain tietyissä ohjelmissa jotka yleensä ovat ikivanhoja. Fallout 4 ehkä paras esimerkki. En usko DDR4:n kehitykseen enää paljoa panostettavan muutenkaan koska DDR5 tulee noin parin vuoden päästä ja siellä missä rahaa tehdään (serverit) on jämähdetty 2666 MHz:n. Menevätköhän ylöspäin koskaan.

Täysin nimenomaan ja pelkästään samoja asioita. Nyt puhutaan vain yhdestä ja vain yhdestä jonninjoutavasta käskystä, jota ei käytännössä käytetä yhtään missään ja joka molemmalla prossulla toimii, ryzenillä vain hitaammin, kun AMD sangen fiksusti ei ole panostanut ominaisuuteen, jolla ei ole nyt käyttöä, eikä (toistaiseksi) markkinoita.

Prossun sisäistä liikennettä on kehitetty lähiaikoina eri tahoilla, eivätkä läheskään kaikki tutkimusten tulokset ole edistyneet edes vielä valmiisiin ratkaisuihin. Kyllä se kehitys on sillä puolella huomattavasti helpompaa, kuin ydinten viilaaminen, kun niitä on optimoitu jatkuvasti. Tuon kommunikaatiosysteemin vaatimukset ovat kuitenkin muuttuneet ihan tässä "lähiaikoina", kun kasvavat ydinmäärät tekevät ihan uusia vaatimuksia.

Jos muistiohjain on hidas, niin se on hidas, softasta huolimatta. Kaikki ohjelmistot käyttävät muistia, kokoajan enemmän sitä törsäten (lisäksi threadien määrä kasvaa kokoajan), joten muistiohjaimen nopeutus on erittäin tärkeää. Sitten jos prossussa on vieä integroitu GPU, niin nykysysteemit ovat täysin polvillaan. Ei noissa konsoleissa ole ihan huvikseen se muistisysteemi sellainen, kun on. Muistipuolella näen myös kiinnostavana kehityshaarana haihtumattoman keskusmuistin, joka on kokoajan kehitteillä. Tämä muuttaisi kiintolevyn roolia selkeästi.

Yksi kohta jossa kaivataan sekä raudan että softapuolen tekijöiden yhteistyötä on tietysti se, miten käyttikset käsittävät prossun rakenteen ja optimoivat säikeiden käytön s.e. cachet tulevat hyödynnettyä mahdollisimman hyvin ja tietoa tarvitsee hakea hitaita reittejä myöten mahdollisimman harvoin.

X86 prossuissa kannattaisi myös harkita siirtymistä heterogenous prossuihin. Turha kaikkien ydinten on osata kaikkea. Osa ytimistä voisi olla huomattavasti karsittuja versioita, joissa olisi panostettu sensijaan raskaaseen laskentaan. Tämä tietysti vaatisi sitten paljon yhteistyötä ohjelmistojen kehittäjien puolelta ja yhteisymmärrystä AMD-Intel akselilla. Se ei toimi, jos molemmat luovat oman systeeminsä.
 
Ryzen2 3700x lyö tiskiin 6Ghz kellotaajuuden, 12-ydintä ja 24-threadia. 5.7Ghz all-core. Clock-to-clock suorituskyky on parantunut 20% vrt 2700X. Ryzen2:saa CCX:ssä on kuusi ydintä, ja inf-fabricin latenssit tiputettu puoleen. AMD on saanu muistiohjaimen viritettyä joten tullaan näkemään tuki 4600Mhz DDR4 muisteille jopa cl12 päälatensseilla.

Aaah että, Intel konkassa 2021 mennessä. AMD:n voittokulkua ei voi estää!

Kuulin nämä faktana lähteiltäni AMD:n työpajalla!
 
X86 prossuissa kannattaisi myös harkita siirtymistä heterogenous prossuihin.

Ohan meillä jo opencl ja prossuja "yksinkertaisimmilla" ytimillä jotka on erikoistuneet erittäin rinnakkaistuvaan laskentaan
 
Ohan meillä jo opencl ja prossuja "yksinkertaisimmilla" ytimillä jotka on erikoistuneet erittäin rinnakkaistuvaan laskentaan
X86 prossuja Inteliltä ja AMD:ltä, jotka ovat tuonkin asian suhteen täysin yhteensopivia? En tiennytkään moisesta.
 
Täysin nimenomaan ja pelkästään samoja asioita. Nyt puhutaan vain yhdestä ja vain yhdestä jonninjoutavasta käskystä, jota ei käytännössä käytetä yhtään missään ja joka molemmalla prossulla toimii, ryzenillä vain hitaammin, kun AMD sangen fiksusti ei ole panostanut ominaisuuteen, jolla ei ole nyt käyttöä, eikä (toistaiseksi) markkinoita.

Prosessorin nopeus ja markkinaosuus sama asia, "OK".

Prossun sisäistä liikennettä on kehitetty lähiaikoina eri tahoilla, eivätkä läheskään kaikki tutkimusten tulokset ole edistyneet edes vielä valmiisiin ratkaisuihin. Kyllä se kehitys on sillä puolella huomattavasti helpompaa, kuin ydinten viilaaminen, kun niitä on optimoitu jatkuvasti. Tuon kommunikaatiosysteemin vaatimukset ovat kuitenkin muuttuneet ihan tässä "lähiaikoina", kun kasvavat ydinmäärät tekevät ihan uusia vaatimuksia.

Jos muistiohjain on hidas, niin se on hidas, softasta huolimatta. Kaikki ohjelmistot käyttävät muistia, kokoajan enemmän sitä törsäten (lisäksi threadien määrä kasvaa kokoajan), joten muistiohjaimen nopeutus on erittäin tärkeää. Sitten jos prossussa on vieä integroitu GPU, niin nykysysteemit ovat täysin polvillaan. Ei noissa konsoleissa ole ihan huvikseen se muistisysteemi sellainen, kun on. Muistipuolella näen myös kiinnostavana kehityshaarana haihtumattoman keskusmuistin, joka on kokoajan kehitteillä. Tämä muuttaisi kiintolevyn roolia selkeästi.

Yksi kohta jossa kaivataan sekä raudan että softapuolen tekijöiden yhteistyötä on tietysti se, miten käyttikset käsittävät prossun rakenteen ja optimoivat säikeiden käytön s.e. cachet tulevat hyödynnettyä mahdollisimman hyvin ja tietoa tarvitsee hakea hitaita reittejä myöten mahdollisimman harvoin.

X86 prossuissa kannattaisi myös harkita siirtymistä heterogenous prossuihin. Turha kaikkien ydinten on osata kaikkea. Osa ytimistä voisi olla huomattavasti karsittuja versioita, joissa olisi panostettu sensijaan raskaaseen laskentaan. Tämä tietysti vaatisi sitten paljon yhteistyötä ohjelmistojen kehittäjien puolelta ja yhteisymmärrystä AMD-Intel akselilla. Se ei toimi, jos molemmat luovat oman systeeminsä.

Puhutko nyt ytimien välisestä liikenteestä vai yhden prosessoriytimen osien välisestä liikenteestä? Ensimmäisestä arvelen. Siinä onkin varmasti kehittämisen varaa. Infinity Fabric on enemmän helppo kuin nopea ratkaisu ja Intelin ring bus tukehtuu suurilla määrillä. Mesh yrittää ottaa molemmista hyvät puolet muttei sekään ole mikään täydellinen.

Muistiohjaimen nopeuden merkitys vähenee sitä mukaa kun prosessorille laitetaan enemmän kakkua. Muistilatenssien pienentämisessä tulee jossakin vaiheessa raja vastaan eikä kanavien lisääminen auta loputtomiin. Integroitu GPU muuttaa tietenkin tilannetta kuten myös muisti joka ei kadota tietoja sammutettaessa.

PC puolen vahvuus on juuri siinä ettei ohjelmistojen tarvitse tukea n+1 erilaista prosessoria tai olla optimoituja tarkalleen tietylle raudalle vaan pitkälle pääsee kun tukee yhtä x86 tai x86-64 yhteensopivaa CPU:ta. Nykyprosessoreista saisi paljon enemmän irti kunnollisella optimoinnilla, josta päästään siihen kuka viitsii optimoida kun prosessoreita on satoja erilaisia. AMD antoi ymmärtää heterogenous prosessorien suurimmaksi ongelmaksi ohjelmistopuolen ja siksipä yrittävätkin saada aikaan prosessorin joka jakaa kuormaa automaattisesti näytönohjaimelle tarvittaessa. Ts ei tarvita erillistä ohjelmistotukea. Se on kova juttu jos/kun saavat tehtyä. Hiljaista on ollut vaikka siitä puhuivat vuosia sitten.
 
Ryzen2 3700x lyö tiskiin 6Ghz kellotaajuuden, 12-ydintä ja 24-threadia. 5.7Ghz all-core. Clock-to-clock suorituskyky on parantunut 20% vrt 2700X. Ryzen2:saa CCX:ssä on kuusi ydintä, ja inf-fabricin latenssit tiputettu puoleen. AMD on saanu muistiohjaimen viritettyä joten tullaan näkemään tuki 4600Mhz DDR4 muisteille jopa cl12 päälatensseilla.

Aaah että, Intel konkassa 2021 mennessä. AMD:n voittokulkua ei voi estää!

Kuulin nämä faktana lähteiltäni AMD:n työpajalla!

Unohdit, että Ryzen4 on oikeastaan sama kivi, kun prosessi on niin hyvä, niin tekivät sekin samaan kiveen ja keskittyivät suunnittelemaan seuraavaa jumalkiveä. Ainakin engineer sampleista on saanut lyijykynällä aktivoitua toiset 12 corea. Ei vaikuttanut all-core kelloihin, koska modi tiputti käyttöjännitettä ja ollaan yhä 95W TPD:n sisällä.
 
X86 prossuja Inteliltä ja AMD:ltä, jotka ovat tuonkin asian suhteen täysin yhteensopivia? En tiennytkään moisesta.

X86 prossuja kyllä, mutta nämä mainitsemani ytimet ei pyöritä x86-käyttistä itsessään ja miksi tarvitsisikaan, kun sen tekevät ytimet on jo järestään molemmilla merkeillä.
 
Prosessorin nopeus ja markkinaosuus sama asia, "OK".



Puhutko nyt ytimien välisestä liikenteestä vai yhden prosessoriytimen osien välisestä liikenteestä? Ensimmäisestä arvelen. Siinä onkin varmasti kehittämisen varaa. Infinity Fabric on enemmän helppo kuin nopea ratkaisu ja Intelin ring bus tukehtuu suurilla määrillä. Mesh yrittää ottaa molemmista hyvät puolet muttei sekään ole mikään täydellinen.

Muistiohjaimen nopeuden merkitys vähenee sitä mukaa kun prosessorille laitetaan enemmän kakkua. Muistilatenssien pienentämisessä tulee jossakin vaiheessa raja vastaan eikä kanavien lisääminen auta loputtomiin. Integroitu GPU muuttaa tietenkin tilannetta kuten myös muisti joka ei kadota tietoja sammutettaessa.

PC puolen vahvuus on juuri siinä ettei ohjelmistojen tarvitse tukea n+1 erilaista prosessoria tai olla optimoituja tarkalleen tietylle raudalle vaan pitkälle pääsee kun tukee yhtä x86 tai x86-64 yhteensopivaa CPU:ta. Nykyprosessoreista saisi paljon enemmän irti kunnollisella optimoinnilla, josta päästään siihen kuka viitsii optimoida kun prosessoreita on satoja erilaisia. AMD antoi ymmärtää heterogenous prosessorien suurimmaksi ongelmaksi ohjelmistopuolen ja siksipä yrittävätkin saada aikaan prosessorin joka jakaa kuormaa automaattisesti näytönohjaimelle tarvittaessa. Ts ei tarvita erillistä ohjelmistotukea. Se on kova juttu jos/kun saavat tehtyä. Hiljaista on ollut vaikka siitä puhuivat vuosia sitten.

Yhden käskyn (jota ei käytetä missään (eli sille ei ole markkinoita)) nopeus on täysin eriasia, kuin prosessorin yleinen nopeus.
Mitä sekoilet tuon markkinaosuuden kanssa, sitä en ymmärrä ollenkaan. Yhden käskyn nopeudella (jota ei käytetä juuri missään) ja prossun (kokonaisuuden) markkinaosuudella ei ole juuri mitään tekemistä keskenään. Juuri kukaan ei jätä ryzenia ostamatta, koska tuo käsky on siinä hidas. Sensijaan, jos yleisen hieromisen sijasta olisi käytetty resurssit tuon käskyn saamiseksi vähintään kilpailijan tasolle ja ryzen olisikin esim 2% yleisesti hitaampi, niin huomattavasti useampi ottaisi kilpailijan tuotteen..

Luonnollisesti puhun Ydin-ydin, ydin-muistiohjain, ydin-IO palikoiden välisestä liikenteestä. Sehän molemmilla valmistajilla on hidastunut, kun ydinten määrä on kasvanut ja ne on liitetty toisiinsa nykysysteemeillä.. Noiden liittämisestä oli jokuaika sitten liikkeellä tutkimuspapereita, joissa oli katsottu uusia, suorituskykyisempiä vaihtoehtoja. En nyt jaksa käydä etsimään.

Kakun suhteellinen osuus ei juuri kasva, koska kakkua raiskaavien threadien määrä kasvaa ja cachetettavan muistin määrä kasvaa..

PC puolella on tehty käskykantalaajennuksia. Nyt pitäisi tehdä käskykantalaajennuksen sijaan vain prossulaajennus, joka tosin tulisi olla AMD:llä ja Intelillä samalla tavalla yhteensopiva, kuin normi X86 puolikin.
 
Prosessorin nopeus ja markkinaosuus sama asia, "OK".
Muistiohjaimen nopeuden merkitys vähenee sitä mukaa kun prosessorille laitetaan enemmän kakkua. Muistilatenssien pienentämisessä tulee jossakin vaiheessa raja vastaan eikä kanavien lisääminen auta loputtomiin. Integroitu GPU muuttaa tietenkin tilannetta kuten myös muisti joka ei kadota tietoja sammutettaessa.

Kakku syö vain transistoreita ihan kiitettävästi, ynnä sillä on paha tapa hidastua kasvaessaan.
How L1 and L2 CPU Caches Work, and Why They're an Essential Part of Modern Chips - ExtremeTech

"It might seem logical, then, to devote huge amounts of on-die resources to cache — but it turns out there’s a diminishing marginal return to doing so. Larger caches are both slower and more expensive. At six transistors per bit of SRAM (6T), cache is also expensive (in terms of die size, and therefore dollar cost). "
 
Prosessorin nopeus ja markkinaosuus sama asia, "OK".
Puhutko nyt ytimien välisestä liikenteestä vai yhden prosessoriytimen osien välisestä liikenteestä? Ensimmäisestä arvelen. Siinä onkin varmasti kehittämisen varaa. Infinity Fabric on enemmän helppo kuin nopea ratkaisu ja Intelin ring bus tukehtuu suurilla määrillä.

:facepalm:

Jälleen puhdasta mutupaskaa ymmärtämättä yhtään mistä puhut.

Mesh yrittää ottaa molemmista hyvät puolet muttei sekään ole mikään täydellinen.

Mesh ja ring bus ovat väylätopologioita, tieteellisiä geneerisiä termejä eikä mitään tiettyjä intelin toteutuksia kuvaavia nimiä.

Pelkkä termi "Indinity fabric" taas on AMDn markkinointinimi omalle väylälleen, joka on jollain tasolla ilmeisesti crossbar-pohjainen, mutta josta voidaan muodostaa useampitasoinen hierarkia erilaisilla topologioilla.
Se on täysin eri tason asia kuin nuo kaksi muuta käyttämääsi termiä.

Yksinkertainen crossbar nimenomaan skaalautuu hyvin huonosti suurelle määrälle portteja, koska sen monimutkaisuus menee suoraan toiseen potenssiin kytkettävien asioiden määrään nähden. Jos yritetään tehdä crossbaria, jossa on paljon portteja siitä tulee iso, virtasyöppö eikä siitä voi tehdä kovin nopeaa.

Jotta yksittäiset crossbarit infinity fabricissa AMDn piireillä pysyy pieninä, siinä on sitten monitasoinen hierarkia. Eli sen sijaan, että jokainen ydin on kytketty siihen crossbariin omalla portillaan, neljä ydintä on laitettu samaan ryppääseen CCXksi (ja CCXn sisällä on paikallinen pieni crossbar) ja näillä on yhteinen portti siihen koko piirin crossbariin. Tämä hierarkinen monitasoinen ratkaisu sitten kivasti lisää viiveitä heti kun mennään sen oman CCn L3-välimusitin ulkopuolellle, ja se myös negatoi huomattavan osan sitä crossbarin tyypillisetä etua/pointtia - että mitkä kaksi tahansa porttia voivat kommunikoida täydellä nopeudella yhtä aikaa. Kun useampi ydin on saman portin takana, niiden pitää jakaa sen portin kaista keskenään.

Muistiohjaimen nopeuden merkitys vähenee sitä mukaa kun prosessorille laitetaan enemmän kakkua.
Muistilatenssien pienentämisessä tulee jossakin vaiheessa raja vastaan eikä kanavien lisääminen auta loputtomiin.

Kanavien lisäämisen vaikutus viiveeseen on käytännössä olematon. Sillä saadaan kaistaa lisää.

Ja ajattelet asiaa väärinpäin. Muistiviive ei ole "voitettava taistelu joka voidaan korjata" vaan "hävitty pitkitystaistely", suhteessa ytimen nopeuteen muistiviive käy jatkuvasti hitaammaksi.

Vaikka muistiväylän ulkoiset kellotaajuudet ja datansiirtonopeudet kasvavat jatkuvasti, itse muistin sisäinen kellotaajuus ei ole juurikaan kasvanut, eikä muistien viiveet pienentyneet. Käytännössä joka kerta, kun uusi muistityyppi otetaan käyttöön, muistin sisäinen kellotaajuus (samalla ulkoisella kellotaajuudella) puolitetaan.

Ja niitä suurempia välimuisteja tarvitaan nimenomaan sen takia, kun se muistiviive on käynyt niin pahaksi. Jotta kärsittäisiin mahdollisimman vähän siitä pahasta muistiviiveestä.

90-luvun puolivälissä jollain 120 MHz peruspenalla muistiviive oli n. 10 kellojaksoa, nyt se on yli 100 kellojaksoa, ja nykyaikainen prosessori tekee yli tuplasti enemmän työtä kellojaksossa.

PC puolen vahvuus on juuri siinä ettei ohjelmistojen tarvitse tukea n+1 erilaista prosessoria tai olla optimoituja tarkalleen tietylle raudalle vaan pitkälle pääsee kun tukee yhtä x86 tai x86-64 yhteensopivaa CPU:ta. Nykyprosessoreista saisi paljon enemmän irti kunnollisella optimoinnilla, josta päästään siihen kuka viitsii optimoida kun prosessoreita on satoja erilaisia.


AMD antoi ymmärtää heterogenous prosessorien suurimmaksi ongelmaksi ohjelmistopuolen ja siksipä yrittävätkin saada aikaan prosessorin joka jakaa kuormaa automaattisesti näytönohjaimelle tarvittaessa. Ts ei tarvita erillistä ohjelmistotukea.

:facepalm:

Nyt olet kyllä jälleen aivan totaalisen pihalla. Näytönohjain ajaa aivan eri käskykantaa eikä AMD ole koskaan missään ilmaissut mitään intressiä tehdä x86sta ajavaa näyttistä.

Intelillä sen sijaan tällaisen suuntaista on ollut tekeillä, Larrabee ja sen seuralaiset Knights-linja, mutta niissäkin tarvii vähintään käyttiksen sekduloida säikeet eri ytimille.

Se on kova juttu jos/kun saavat tehtyä. Hiljaista on ollut vaikka siitä puhuivat vuosia sitten.

Eivät ole koskaan puhuneet mitään tuollaista. Olet ymmärtänyt täysin väärin, mitä HSAlla tarkoittetaan.

HSAssa on ollut kyse vain
1) välimuistikoherenttiudesta näyttiksen ja CPUn välillä, mahdollistaa saman muistin käytön molemmille
2) yhteisestä tavukoodista CPUlle ja GPUlle.

Käyttiksen/ajoympäristön/ajurien pitää edelleen kääntää se tavukoodi sille prosessorille, millä se ajetaan, ja skeduloida koodi pyörimään siellä missä se sitä haluaa ajaa. Täysin softan hallinnassa oleva systeemi.
 
Viimeksi muokattu:
:facepalm:

Jälleen puhdasta mutupaskaa ymmärtämättä yhtään mistä puhut.

Mesh ja ring bus ovat väylätopologioita, tieteellisiä geneerisiä termejä eikä mitään tiettyjä intelin toteutuksia kuvaavia nimiä.

Pelkkä termi "Indinity fabric" taas on AMDn markkinointinimi omalle väylälleen, joka on jollain tasolla ilmeisesti crossbar-pohjainen, mutta josta voidaan muodostaa useampitasoinen hierarkia erilaisilla topologioilla.
Se on täysin eri tason asia kuin nuo kaksi muuta käyttämääsi termiä.

Yksinkertainen crossbar nimenomaan skaalautuu hyvin huonosti suurelle määrälle portteja, koska sen monimutkaisuus menee suoraan toiseen potenssiin kytkettävien asioiden määrään nähden. Jos yritetään tehdä crossbaria, jossa on paljon portteja siitä tulee iso, virtasyöppö eikä siitä voi tehdä kovin nopeaa.

Jotta yksittäiset crossbarit infinity fabricissa AMDn piireillä pysyy pieninä, siinä on sitten monitasoinen hierarkia. Eli sen sijaan, että jokainen ydin on kytketty siihen crossbariin omalla portillaan, neljä ydintä on laitettu samaan ryppääseen CCXksi (ja CCXn sisällä on paikallinen pieni crossbar) ja näillä on yhteinen portti siihen koko piirin crossbariin. Tämä hierarkinen monitasoinen ratkaisu sitten kivasti lisää viiveitä heti kun mennään sen oman CCn L3-välimusitin ulkopuolellle, ja se myös negatoi huomattavan osan sitä crossbarin tyypillisetä etua/pointtia - että mitkä kaksi tahansa porttia voivat kommunikoida täydellä nopeudella yhtä aikaa. Kun useampi ydin on saman portin takana, niiden pitää jakaa sen portin kaista keskenään.

Niinhän ne ovat ja kun puhutaan ring busista tai meshista, kaikki ymmärtävät mitä sillä tarkoitetaan. Ring busissa on ainakin 4 väylää jotka hoitavat liikennettä ja Intel puhuu Scalable On-Die Interconnectista, ring bus kuulostaa paremmalta vaikka oikaiseekin. Olennaista on viiveiden kasvu kun ytimiä lisätään jonka takia Intel lisäsi enemmän ringejä ja lopulta halusi keksiä toisen ratkaisun.

Kuten sanoin, enemmän helppo kuin nopea. Pohjimmiltaan Infinity Fabric ja siihen liittyvät tekniikat tekevät ytimien lisäämisen prosessoriin todella helpoksi. Turpiin tulee ytimien välisessä kommunikaatiossa joka sisältää myös L3 välimuistin kun nekin ovat CCX:ssa kiinni. Ei sovi kaikkeen mutta rahaa tuolla saa tehtyä.

Kanavien lisäämisen vaikutus viiveeseen on käytännössä olematon. Sillä saadaan kaistaa lisää.

Ja ajattelet asiaa väärinpäin. Muistiviive ei ole "voitettava taistelu joka voidaan korjata" vaan "hävitty pitkitystaistely", suhteessa ytimen nopeuteen muistiviive käy jatkuvasti hitaammaksi.

Tietysti muttei se kaistojen lisäyskään ole kovin pätevä kehityskohde loputtomiin.

Siksi sanoinkin ettei se kehitys auta koska täydellinenkin muistiohjain on toivottoman hidas loppupeleissä.

Vaikka muistiväylän ulkoiset kellotaajuudet ja datansiirtonopeudet kasvavat jatkuvasti, itse muistin sisäinen kellotaajuus ei ole juurikaan kasvanut, eikä muistien viiveet pienentyneet. Käytännössä joka kerta, kun uusi muistityyppi otetaan käyttöön, muistin sisäinen kellotaajuus (samalla ulkoisella kellotaajuudella) puolitetaan.

Ja niitä suurempia välimuisteja tarvitaan nimenomaan sen takia, kun se muistiviive on käynyt niin pahaksi. Jotta kärsittäisiin mahdollisimman vähän siitä pahasta muistiviiveestä.

90-luvun puolivälissä jollain 120 MHz peruspenalla muistiviive oli n. 10 kellojaksoa, nyt se on yli 100 kellojaksoa, ja nykyaikainen prosessori tekee yli tuplasti enemmän työtä kellojaksossa.

Siltähän se muistien kehitys vaikuttaa. Lisää kelloja, enemmän latenssia. Sivutuoteena saadaan virrankulutusta alas josta hyötyvät palvelimet ja puhelimet
lähinnä. Uusi muistitekniikka olisi kova, kunhan ei ole RAMBUS tyylinen ripoff.


Eipä yllättänyt. 4 muistikanavaa on ollut melko turha Intelin 8-10 ytimisissä työpöytäprosessoreissa vs 3 kanavaa, joten 16-ytimiselle voisi odottaakin 4 kanavan riittävän.
 
Siltähän se muistien kehitys vaikuttaa. Lisää kelloja, enemmän latenssia. Sivutuoteena saadaan virrankulutusta alas josta hyötyvät palvelimet ja puhelimet
lähinnä. Uusi muistitekniikka olisi kova, kunhan ei ole RAMBUS tyylinen ripoff.

Mitähän nyt olet tarkoittaviin sanalla "muistitekniikka"? Muistiväylää vai muistisolun toteutusperiaatetta? Nämä ovat kaksi täysin eri asiaa.

Keskusmuistin solut on kymmeniä vuosia tehty aivan samalla DRAM-periaatteella. Ja "RAMBUS"illa tarkoittanet RDRAMia, sekin oli sisäisesti aivan normaalia DRAMia.

(ja Rambus(firma) on RDRAMin jälkeen kehittänyt monia muitakin muistiväyliä ja muistiohjaimia. Esimerkiksi PS3ssa oli Rambusin kehittämä XDR DRAM-muistiväylä, ja ilmeisesti Zeninkin DDR4-muistiohjaimet on Rambusin kehittämiä, AMDn Rambusilta lisensoimia.)

Sen sijaan sitä väylää, mikä siltä DRAM-muistipiiriltä lähtee ulos, on uudistettu muutaman vuoden välein.
Ja sitä valmistusprosessia, millä sitä DRAMia on tehty, on parannettu parin vuoden välein, melko lailla Mooren lain tahdissa.

Tosin nyt ollaan vihdoin kohta saamassa DIMMejä joissa on DRAMin sijasta aivan erilaisella periaatteella toimivaa xpoint-muistia.
 
Viimeksi muokattu:

Statistiikka

Viestiketjuista
295 772
Viestejä
5 048 688
Jäsenet
80 970
Uusin jäsen
Aatami Korpi

Hinta.fi

Back
Ylös Bottom