Virallinen: AMD vs Intel keskustelu- ja väittelyketju

  • Keskustelun aloittaja Keskustelun aloittaja Sampsa
  • Aloitettu Aloitettu
Ei ole, mutta uskon sen rakeenteen olevan olemassa enemmänkin kustannussyistä olemassa kuin väyläratkaisun tähden.

Miten sen nyt ottaa. Intel pisti AMD:n GPU:n samalle alustalle PCIe väylän päähän, koska kyseinen tapa on halvin ja helpoin tapa.

Konsoleissa nimenomaan puhuttiin paljon GPU:n käytöstä laskennan apuna. Homma vai kusahti hieman, kun GPU:n suorituskyky oli, mitä oli, joten ne jouduttiin etupäässä hyödyntämään grafiikan piirtoon pelkästään..
 
Esim läppäriin ulkoinen näyttis olisi kiva liittää jollakin kapeammalla väylällä (esim 4X-1x).

Merkitys pöytäkonetta päivitettäessä tasan 0.

Pöytäkonepuolella taas tarvitaan mahdollisimman nopea väylä GPU:n ja näyttiksen välille, jotta esim GPU:ta voidaan hyödyntää laskennassa ym mahdollisimman tehokkaasti.

Ongelma tässä on se, että pcien nelosversiokin on liian hidas siihen, että tämä toimisi tehokkaasti.

Ne workloadit, jotka tästä oikeasti merkittävästi hyötyy, on äärimmäisen harvassa, kun käytännössä kaikki workloadit on joko sellaisia, että
1) Se väylä ei ole oikeastaan millään tavalla pullonkaula
2) Se nelosversiokin olisi niin paha pullonkaula, että ei ole järkeä laskea näyttiksellä.
3) Rutiinin laskemiseen tehokkaasti näyttiksellä tarvittaisiin välimuistikoherenttia väylää, jota pcie(myöskään nelosversio) ei ole.

Ei se konsoleissakaan huvikseen ole se rakenne, mikä niissä tällähetkellä on.

Niissä siinä on oikeasti välimuistikoherentti liitäntä ja yhteinen muisti ilman mitään kaistapullonkaulaa siinä välissä. Pci express 4.0 ei tätä ole.

Väylä siinä välissä nyt vain hukkaa suorituskykyä, täysin turhaan.

Niin, vaikka se olisi pci expressin nelosversio. Sen kanssa ei edelleenkään kannata vekslata dataa edestakaisin CPUn ja GPUn muistien välillä.

Aina noille nopeammille väylille on tarvetta löytynyt, ei niitä PCI-E 1.0 nopeudella liikennöiviä näyttiksiä enää sattuneesta syystä tehdä.

Tehdäänpäs, Mikä tahansa nykynäyttis osaa liikennöidä pcie 1.0-nopeudella.

Ja näyttikseni on tällä hetkellä kiinni pcie 3.0 x8-väylässä. Ihan vaan koska sen siirtämisestä pcie3.0 x16-väylään en saisi käytännössä missään käytännön tilanteessa mitään lisänopeutta, enkä jaksanut siirtää vanhaa (idlaavaa tai mainaavaa) näyttistä slotista toiseen.

Ja pcie 2.0 x 16 tarjoaa saman kaistan kuin tämä pcie 3.0 x 8

Eli siis, edes pcie 3.0lle ei ole vielä kovin paljoa tarvetta löytynyt kotikoneessa yhden GPUn systeemeissä. Sen sijaan sille on löytynyt käyttöä kahden GPUn systeemeissä, kun sen avulla saadaan 16 linjaa riittämään kahdelle näyttikselle.


Toki jossain palvelimissa joissa on jotain 10 gigabitin verkkokortteja ja joissa tehdään todella järeätä levy-IOta massiivisiin SSD-levyihin sitä IO-kaistaa tarvii mahdollisimman paljon.
 
Merkitys pöytäkonetta päivitettäessä tasan 0.



Ongelma tässä on se, että pcien nelosversiokin on liian hidas siihen, että tämä toimisi tehokkaasti.

Ne workloadit, jotka tästä oikeasti merkittävästi hyötyy, on äärimmäisen harvassa, kun käytännössä kaikki workloadit on joko sellaisia, että
1) Se väylä ei ole oikeastaan millään tavalla pullonkaula
2) Se nelosversiokin olisi niin paha pullonkaula, että ei ole järkeä laskea näyttiksellä.
3) Rutiinin laskemiseen tehokkaasti näyttiksellä tarvittaisiin välimuistikoherenttia väylää, jota pcie(myöskään nelosversio) ei ole.



Niissä siinä on oikeasti välimuistikoherentti liitäntä ja yhteinen muisti ilman mitään kaistapullonkaulaa siinä välissä. Pci express 4.0 ei tätä ole.



Niin, vaikka se olisi pci expressin nelosversio. Sen kanssa ei edelleenkään kannata vekslata dataa edestakaisin CPUn ja GPUn muistien välillä.



Tehdäänpäs, Mikä tahansa nykynäyttis osaa liikennöidä pcie 1.0-nopeudella.

Ja näyttikseni on tällä hetkellä kiinni pcie 3.0 x8-väylässä. Ihan vaan koska sen siirtämisestä pcie3.0 x16-väylään en saisi käytännössä missään käytännön tilanteessa mitään lisänopeutta, enkä jaksanut siirtää vanhaa (idlaavaa tai mainaavaa) näyttistä slotista toiseen.

Ja pcie 2.0 x 16 tarjoaa saman kaistan kuin tämä pcie 3.0 x 8

Eli siis, edes pcie 3.0lle ei ole vielä kovin paljoa tarvetta löytynyt yhden GPUn systeemeissä. Sen sijaan sille on löytynyt käyttöä kahden GPUn systeemeissä, kun sen avulla saadaan 16 linjaa riittämään kahdelle näyttikselle.
No, pistä se näyttiksesi sitten 4X väylään, kun sillä nopeudella ei ole mitään merkitystä. Tai tee vielä parempi repäisy ja pistä se bridgepiirin päässä olevaan 4X väylään. Mitään eroa kun et kuitenkaan huomaa.

Väylä on esim silloin heti pullonkaula, JOS ja kun tekstuureja joudutaan siirtämään sitä myöten syystä tai toisesta. Mitä nopeampi väylä, sen lievempi töksähdys. Tietysti jos on senverran fiksu, jotta hankkii näyttiksen reilulla muistimäärällä, niin tekstuurien siirtotarve pelin aikana on lähinnä aloitusvaiheessa..

Ja hei, noillahan ei ole sinulle mitään ostopakkoa, voit pysyä PCIe 2.0 emossa ihan niinpitkään, kun haluat.
--------------
Massamuistit ja intelin nuhainen DMI väylä (nyt =4x PCIe 3 ) hyötyvät jokatapauksessa eniten tuosta PCIe4.0:sta, ihan pöytäkoneissakin.
---------------
Onkos Nvidia muuten luopunut jo SLI sillasta?
 
No, pistä se näyttiksesi sitten 4X väylään, kun sillä nopeudella ei ole mitään merkitystä. Tai tee vielä parempi repäisy ja pistä se bridgepiirin päässä olevaan 4X väylään. Mitään eroa kun et kuitenkaan huomaa.

Väylä on esim silloin heti pullonkaula, JOS ja kun tekstuureja joudutaan siirtämään sitä myöten syystä tai toisesta. Mitä nopeampi väylä, sen lievempi töksähdys. Tietysti jos on senverran fiksu, jotta hankkii näyttiksen reilulla muistimäärällä, niin tekstuurien siirtotarve pelin aikana on lähinnä aloitusvaiheessa..

Ja hei, noillahan ei ole sinulle mitään ostopakkoa, voit pysyä PCIe 2.0 emossa ihan niinpitkään, kun haluat.

Näin monta riviä melkein pelkkää olkiukkoiluilua..

Tuossa vähän benchmarkkeja pci express-väylän nopeuden vaikutuksesta pelinopeuteen:

NVIDIA GeForce GTX 1080 PCI-Express Scaling

--------------
Massamuistit ja intelin nuhainen DMI väylä (nyt =4x PCIe 3 ) hyötyvät jokatapauksessa eniten tuosta PCIe4.0:sta, ihan pöytäkoneissakin.

DMI ei ole millään tavalla nuhainen eikä sen nopeudessa huomaa missään koti- tai työpöytäkäytössä käytännössä yhtään mitään pullonkaulaa millään koti-/työpöytäkäyttäjän todellisella workloadilla.

Ja jos tietokoneen pääasiallinen käyttötarkoitus on levyimagejen siirtely kovalevyltä SSD-levyltä toiselle, kannattaa hakeutua psykiatriseen hoitoon.
 
Viimeksi muokattu:
Peleissähän taidetaan harrastaa aika paljon ennakkoon striimaamista, millä vältetään kerralla lataamista.
 
Näin monta riviä melkein pelkkää olkiukkoiluilua..

Tuossa vähän benchmarkkeja pci express-väylän nopeuden vaikutuksesta pelinopeuteen:

NVIDIA GeForce GTX 1080 PCI-Express Scaling



DMI ei ole millään tavalla nuhainen eikä sen nopeudessa huomaa missään koti- tai työpöytäkäytössä käytännössä yhtään mitään pullonkaulaa millään koti-/työpöytäkäyttäjän todellisella workloadilla.

Ja jos tietokoneen pääasiallinen käyttötarkoitus on levyimagejen siirtely kovalevyltä toiselle, kannattaa hakeutua psykiatriseen hoitoon.

Valitettavasti ohjelmat muuttuvat kokoajan raskaimmiksi ja isommiksi möhkäleiksi, jollin sinne ei todellakaan kavata mitään 4X PCIe 3.0 väylää väliin, jota myöten yritetään tuupata
- Ääni
- Verkko
- USB3.1
- Mahdollisesti joku muu nopea, vähälatessinen väylä (FW /TB)
- massamuistiasema

Lähinnä massamuistit ovat kehittyneet kokoajan, s.e. tuo väylä saadaan niillä saturoitua ihan liian helposti. En ymmärrä, miksi vastustat kehitystä, kun kuitenkin tuplasti tiedonsiirtokapasiteettiä on aina tuplasti tiedonsiirtokapasiteettiä ja sitä jopa voidaan hyödyntää...
 
Valitettavasti ohjelmat muuttuvat kokoajan raskaimmiksi ja isommiksi möhkäleiksi, jollin sinne ei todellakaan kavata mitään 4X PCIe 3.0 väylää väliin, jota myöten yritetään tuupata
- Ääni

96 KHz 24-bit 9-kanavaääni tarkoittaa 2.6 megatavua sekunnissa. Tämä on pieru saharassa pcie expressin kaistassa.


Suurin osa liikenteestä lähtee ulos internetiin jonkun maksimissaan 100-megabittisen = 13- megatavuisen yhteyden kautta. Edelleenkään ei tunnu yhtään missään siinä pci express/DMI-kaistassa.

- USB3.1
- Mahdollisesti joku muu nopea, vähälatessinen väylä (FW /TB)

Se, että sillataan lisää väyliä ei kuluta YHTÄÄN kaistaa silloin kun niiden sillattujen väylien yli ei siirretä dataa.

Eli sen sillatun väylän olemassaolo on nolla-argumentti, jos sille ei keksi mitään käyttöskenaariota.

- massamuistiasema

... jonka nopeutta todellisissä käyttötilanteissa dominoi hakuajat, ei väylän kaista.

Lähinnä massamuistit ovat kehittyneet kokoajan, s.e. tuo väylä saadaan niillä saturoitua ihan liian helposti.

Se väylä saadaan saturoituia ainoastaan kun yrittämällä yritetään ja siirrellään niitä levyimageja todella nopean SSDn partitiolta toiselle. Se ei saturoidu missään järkevässä normaalissa käyttötarkoituksessa, kaikissa normaalitilanteissa pullonkaula on aivan muualla, eli siis sen SSD-levyn hakuajassa.

Se, siirtyykö joku levyimage partitiolta toiselle viidessä vai seitsemässä sekunnissa on täysin EVVK. Sillä ei ole MITÄÄN merkitystä mihinkään.

Niinkuin oikeasti, kannattaa hakeutua hoitoon jos koneen pääasiallinen käyttötarkoitus on niiden levyimagejen siirtely.

En ymmärrä, miksi vastustat kehitystä, kun kuitenkin tuplasti tiedonsiirtokapasiteettiä on aina tuplasti tiedonsiirtokapasiteettiä ja sitä jopa voidaan hyödyntää...

Minä en vastusta kehitystä. Sinä sen sijaan puhut aivan puhdasta paskaa siitä, että emolevy on käytännössä pakko vaihtaa parin vuoden välein näiden "parempien liitäntien" takia, vaikka todellisuudessa monta vuotta vanhalla emolevyllä selviää oikein hyvin, ja hyödyt uusien emolevyjen uusista liitännistä ja siirtomoodeista jäävät todella pieniksi.


(Vasta) siinä vaiheessa siitä uudesta emolevystä on oikeasti iloa, kun se uusi emolevy mahdollistaa NVRAMeja tukevat DIMMit tai välimuistikoherentin liitännän oheislaitteille kuten näyttikselle.
 
Viimeksi muokattu:
96 KHz 24-bit 9-kanavaääni tarkoittaa 2.6 megatavua sekunnissa. Tämä on pieru saharassa pcie expressin kaistassa.



Suurin osa liikenteestä lähtee ulos internetiin jonkun maksimissaan 100-megabittisen = 13- megatavuisen yhteyden kautta. Edelleenkään ei tunnu yhtään missään siinä pci express/DMI-kaistassa.



Se, että sillataan lisää väyliä ei kuluta YHTÄÄN kaistaa, jos niitä väyliä ei käytetä johonkin.



... jonka nopeutta todellisissä käyttötilanteissa dominoi hakuajat, ei väylän kaista.



Se väylä saadaan saturoituia ainoastaan kun yrittämällä yritetään ja siirrellään niitä levyimageja todella nopean SSDn partitiolta toiselle. Se ei saturoidu missään järkevässä normaalissa käyttötarkoituksessa, kaikissa normaalitilanteissa pullonkaula on aivan muualla, eli siis sen SSD-levyn hakuajassa.

Se, siirtyykö joku levyimage partitiolta toiselle viidessä vai seitsemässä sekunnissa on täysin EVVK. Sillä ei ole MITÄÄN merkitystä mihinkään.

Niinkuin oikeasti, kannattaa hakeutua hoitoon jos koneen pääasiallinen käyttötarkoitus on niiden levyimagejen siirtely.

Hakuajat ovat kokoajan pienentyneet / pienentymässä. Tietysti jos käyttää halppisratkaisuja, niin sitten nopeus ei ole kummoinen, mutta jos siihen massamuistiin jonkun 500e-800e satsaa, niin sitten nopeus on parempi. Itse en ole tähän mennessä vielä katunut yhdenkään käytössäolevan SSD:n ostoa, Ja sen tiedän, että seuraava askel on jossain vaiheessa nopea M2 tai Octane käyttis ja ohjelmakäyttöön, eikä emo saa olla eden minkäänlainen periaatteellinen jarru siinä vaiheessa.

Eikö ennemminkin hoitoon kannattaisi hakeutua, jos se käy ahdistamaan, että laitteista tehdään paremmin toimivia?

Ps osalla kone on liitetty esim toiseen koneeseen / NASsiin verkon kautta ja sieltä voi tulla sen 5-8 Gigan nopeudella dataa. Ei läheskään kaikki käytä sitä verkkoliitintä ainoastaan internettiin liittämiseen.
 
Hakuajat ovat kokoajan pienentyneet / pienentymässä.

Flash-pohjaisella SSDllä ei merkittävästi.

Flash-pohjaisten SSDiden kehitys on lähinnä sitä, että sinne SSD-levylle laitetaan yhä suurempi määrä rinnakkaisia flash-muisti-bankkeja, mikä auttaa kaistaan, mutta ei juuri auta viiveeseen

Optane/x-point toki tuo hakuaikoihin selvän parannuksen.

Ps osalla kone on liitetty esim toiseen koneeseen / NASsiin verkon kautta ja sieltä voi tulla sen 5-8 Gigan nopeudella dataa. Ei läheskään kaikki käytä sitä verkkoliitintä ainoastaan internettiin liittämiseen.

Mitähän gigatavuluokan dataa oikein kuvittelet niiden koneiden välillä siirtäväsi jatkuvasti suurella nopeudella?

Yleinen käyttötarkoitus on esim. elokuvan katsominen toisen koneen levyltä. Tässä ei tarvi koko leffaa siirtää sekunnissa, siihen on aika kaksi tuntia.


Ja levyimagejen jatkuva siirtely kahden eri tietokoneen välillä ei ole yhtään sen fiksumpaa ja hyödyllisempää toimintaa kuin niiden siirtely saman koneen eri partiitoiden välillä. Täysin EVVK.


Kotikoneessa/yhdellä käyttäjällä ei yksinkertaisesti MISSÄÄN ole sellaisia HYÖTYdatamääriä että tällaisia tiedonsiirtonopeuksia tarvittaisiin yhtään mihinkään. Ja jos olisi, ja sitä dataa siirreltäisiin näitä nopeuksia yhtään enempää, kuluttaja-SSDistä paukkuisi kirjoitussyklit hetkessä.


Ja kaikki se "temppidataliikenne" mikä syntyy satunnaisesta swappaamisesta ja www-selaimen levylle tallettavasta välimusitista yms. ei ole bulkkidataa jonka nopeutta väylä dominoi vaan satunnaisdataa, jonka nopeutta hakuaika dominoi.
 
Viimeksi muokattu:
Flash-pohjaisella SSDllä ei merkittävästi.

Flash-pohjaisten SSDiden kehitys on lähinnä sitä, että sinne SSD-levylle laitetaan yhä suurempi määrä rinnakkaisia flash-muisti-bankkeja, mikä auttaa kaistaan, mutta ei juuri auta viiveeseen

Optane/x-point toki tuo hakuaikoihin selvän parannuksen.



Mitähän gigatavuluokan dataa oikein kuvittelet niiden koneiden välillä siirtäväsi jatkuvasti suurella nopeudella?

Yleinen käyttötarkoitus on esim. elokuvan katsominen toisen koneen levyltä. Tässä ei tarvi koko leffaa siirtää sekunnissa, siihen on aika kaksi tuntia.


Ja levyimagejen jatkuva siirtely kahden eri tietokoneen välillä ei ole yhtään sen fiksumpaa ja hyödyllisempää toimintaa kuin niiden siirtely saman koneen eri partiitoiden välillä. Täysin EVVK.


Kotikoneessa/yhdellä käyttäjällä ei yksinkertaisesti MISSÄÄN ole sellaisia HYÖTYdatamääriä että tällaisia tiedonsiirtonopeuksia tarvittaisiin yhtään mihinkään. Ja jos olisi, ja sitä dataa siirreltäisiin näitä nopeuksia yhtään enempää, kuluttaja-SSDistä paukkuisi kirjoitussyklit hetkessä.


Ja kaikki se "temppidataliikenne" mikä syntyy satunnaisesta swappaamisesta ja www-selaimen levylle tallettavasta välimusitista yms. ei ole bulkkidataa jonka nopeutta väylä dominoi vaan satunnaisdataa, jonka nopeutta hakuaika dominoi.

Onneksi noita kehitetään muitakin, kuin FLASH pohjaisia ratkaisuja.

Minulle on aivan sama, jos sinulla on aina aikaa siirrellä jotain tiedostoa kaksi tuntia. Itseä kun saatttaa toisinaan harmittaa muutaman minuutinkin siirto.
Tietokoneen nyt vain pitää olla mahdollisimman vikkelä sen odottelu, kun se latailee ja nypläilee jotain on todella rasittavaa puuhaa.
Minua ei pätkääkään kiinnosta, miten toimit koneidesi kanssa tai mitä ominaisuuksia niiltä et vaadi. Sanoisin, että en miltei 100%:lla varmuudella tule ikinä joutumaan odottelemaan niitä, joten tee miten lystäät, mutta nuo asiaan kuulumattomat hoitorölläilyt ym voisit kyllä jättää ihan suosiolla väliin.
 
Minulle on aivan sama, jos sinulla on aina aikaa siirrellä jotain tiedostoa kaksi tuntia. Itseä kun saatttaa toisinaan harmittaa muutaman minuutinkin siirto.

Onko sinulla paljonkin satojen gigatavujen kokoisia tiedostoja, joita siirtelet jatkuvasti? Pienemmillä ei nimittäin mene minuutteja DMIn yli.

Minun suurin tiedostoni on n. 30 gigan levyimage. Sitä ei ole vielä koskaan tarvinnut siirtää, mutta sekin siirtyisi DMin yli alle kymmenessä sekunnissa.

Seuraavaksi suurimmat tiedostoni ovat jotain 6 gigan videotiedostoja. DMIn kaistalla näiden siirtäminen kestäisi puolitoista sekuntia.

Että niinkuin oikeasti. Voisitko nyt ottaa ne aivot käyttöön sen sijaan että mutuilet aivan älyttömyyksiä kaistatarpeestasi?

Tietokoneen nyt vain pitää olla mahdollisimman vikkelä sen odottelu, kun se latailee ja nypläilee jotain on todella rasittavaa puuhaa.

Sitten kannattaisi sitä tietokonetta päivittää siihen suuntaan, että se odottelu vähenee, eikä nopeuttaa täysin turhia asioita, joiden nopeus ei ole missään pullonkaula.

Mars ostamaan se optane-levy! Ja mars tilaamaan nopeampi internet-yhteys!
 
Viimeksi muokattu:
Koskakohan Intel meinasi uutta arkkitehtuuria alkaa väsätä? Eikö tämä nykyinen ole vähän loppuun koluttu jo varsinkin, kun AMD yllätti housut kintuissa. Näyttää skaalautuvan muutenkin huonosti useammalle ytimelle.
 
Koskakohan Intel meinasi uutta arkkitehtuuria alkaa väsätä? Eikö tämä nykyinen ole vähän loppuun koluttu jo varsinkin, kun AMD yllätti housut kintuissa.

Kyllä sen Sapphire Rapids:in tuotekehitys on aloitettu jo pari vuotta sitten. Menee vaan toiset pari vuotta, että se saadaan valmiiksi ja markkinoille.

Sen aikaa mennään vielä lake-sarjan viilauksilla.

Ja Lake-sarjan ytimistäkin on oikeastaan kolmea eri arkkitehtuuriversiota:

* Ilman AVX-512-tukea (kuluttajamallit)
* AVX-512-tuella (nopeuden suhteen) rajoitetuilla AVX-512-laskentayksiköillä (SP-sarjan alemmat mallit, sekä ilmeisesti myös cannon lake) (*)
* "Täydellä" AVX-512-tuella täysillä 512-bittisillä laskentayksiköillä. (SP-sarjan järeämmät mallit)

Näyttää skaalautuvan muutenkin huonosti useammalle ytimelle.

Ei siinä arkkitehtuurissa ole mitään minkä takia se skaalautuisi huonosti suurelle ydinmäärälle.

Zeniä pienempi suorituskykyero yhden ja monen säikeen välillä ei johdu siitä, että intel skaalautuisi huonosti monelle ytimelle, vaan siitä, että intel pärjää paremmin yhdellä ytimellä. Ja tämä taas johtuu valmistustekniikan eroista; Matalammilla kelloilla (ei turbo-mode, kaikki ytimet käytössä, lämpö- ja virransyöttörajoitteinen tilanne) molemmat on suurinpiirtein yhtä enegiatehokkaita valmistustekniikoita, mutta suuremmalla jännitteellä (turbo-mode, vähän ytimiä käytössä, rajoittavana tekijänä ei lämpö/virransyöttö vaan kriittiset polut) intelin valmistustekniikka mahdollistaa suuremmat kellotaajuudet ja sen kautta paremman yhden säikeen suorituskyvyn.


(*) Näissä malleissa siis on käskykannan puolesta ihan sama AVX-512-tuki, mutta siellä ei ole kaikkia SIMD-laskentayksiköitä levennetty 512 bittiin, jolloin 256-bittiseen AVXään verrattuna AVX-512 ei tuplaa teoreettista laskentanopeutta. AVX-512sta saadaan kuitenkin näilläkin ytimillä pieni hyöty, koska sen avulla voidaan esimerkiksi vektoroida looppeja, joita ilman AVX-512sta ei voida vektoroida.
 
Viimeksi muokattu:
Koskakohan Intel meinasi uutta arkkitehtuuria alkaa väsätä? Eikö tämä nykyinen ole vähän loppuun koluttu jo varsinkin, kun AMD yllätti housut kintuissa. Näyttää skaalautuvan muutenkin huonosti useammalle ytimelle.
Lähinnä datan siirtely siellä prossun sisällä eri paikkojen välillä, välimuistit ja muistiohjaimet ovat ne alueet, joita kehittelemällä sikä Intel, että AMD saisivat nopeutettua parhaiten noita prossujaan, joissa on > 8 ydintä.
--------
AMD:llä on lisäksi valinnan paikka, aikooko se tehdä tiettyjä hitaita erikoiskäskyjä raudalla vai hitaalla emulaatiolla tulevissa prossuissaan. Joskus oli huhuja, että myös intel siirtyisi joissain käskystä pois raa-asta rauta totutuksesta ja ne hidastuisivat, mutta siitä on jo aikaa ja kyseessä taisi olla uutisankka..
 
Onneksi noita kehitetään muitakin, kuin FLASH pohjaisia ratkaisuja.

Minulle on aivan sama, jos sinulla on aina aikaa siirrellä jotain tiedostoa kaksi tuntia. Itseä kun saatttaa toisinaan harmittaa muutaman minuutinkin siirto.
Tietokoneen nyt vain pitää olla mahdollisimman vikkelä sen odottelu, kun se latailee ja nypläilee jotain on todella rasittavaa puuhaa.
Minua ei pätkääkään kiinnosta, miten toimit koneidesi kanssa tai mitä ominaisuuksia niiltä et vaadi. Sanoisin, että en miltei 100%:lla varmuudella tule ikinä joutumaan odottelemaan niitä, joten tee miten lystäät, mutta nuo asiaan kuulumattomat hoitorölläilyt ym voisit kyllä jättää ihan suosiolla väliin.
No näin se joillakin on mutta ei siinä mitään, silloin ostetaan se kallein ja päivitetään tiheään. Ehkä tässä kädenväännössä kannattaisi miettiä kuitenkin sitä isoa porukkaa, joille ihan oikeasti tuo vanhallakin emolevyllä ajelu ja siihen kenties uuden prossan läiskääminen on ihan validi polku. Muutenkin @hkultala on oikeassa sen suhteen että levyjen/verkon yli tehtävät suuret datasiirrot ovat malliesimerkki huonosta suunnittelusta. Aika paljon tätä hölmöilyä on tehty ihan suurissakin yritysympäristöissä ja vasta nyt on alettu heräämään että se datan siirto itse asiassa maksaa lukuisilla mittareilla mitattuna (cpu-syklit, tietoliikennesatsaukset, levytilan kertautumiset, salaukset...) ja paljon. Päälle tulee sitten vielä epäsuorat kulut/haitat eli esim. latenssiviiveet, datan koherenttius, hallinta, ylläpito. Järkevällä suunnittelulla se kerralla siirrettävän datan määrä on minimaalinen, siirto voidaan tehdä taustalla huomaamattomasti mieluusti osissa, ja siirtomatkat lyhyitä.

Kotielämässä pätee samat lainalaisuudet eli se siirtely on usein typerää ja turhaa. Jonkun pelin latausajat voi hieman lyhentyä tai joku raskas video-editointi, joka ei mahdu muistiin...nääh, ei kyllä pahemmin mieleen tule käyttökelpoisia esimerkkejä. Isoimmat perustallaajan paketit on nykyään pelejä, jotka voivat viedä sen satakin gigatavua, mutta näitä lataillaan sitten hartaudella Steamista ja asennetaan kerran. Omalta SSD:ltä kyllä latautuu kaikki uusimmatkin pelit niin vikkelästi etten ehdi edes miettiä haluaisinko sitä nopeammaksi.

Ja sitten toinen mieleen tullut aihe kun lueskelin tätä:
ARM julkaisi Cortex-A76-prosessoriytimet, Mali-G76-grafiikkaohjaimen ja Mali-V76-videoprosessorin - io-tech.fi
Siis muiden lisäksi ARM on luukuttamassa nyt 7nm-prosessin piirejä. Kait nuo GF:n ja TMSC:n prosessit alkaa sitten olla ihan oikeastikin sen verran hyvällä mallilla että useampi taho uskaltaa niitä jo markkinoida tosissaan. Intelin 10nm vastannee kilpailijoiden 7nm:ää, mutta mitä hemmettiä Intel oikein sählää kun muut tulee nyt heittämällä rinnalle tai jopa ohi.
 
Viimeksi muokattu:
Intelin 10nm vastannee kilpailijoiden 7nm:ää, mutta mitä hemmettiä Intel oikein sählää kun muut tulee nyt heittämällä rinnalle tai jopa ohi.

Jossain oli juttuu että Intel mokasi siinä että lähtivät liian agressiivista shrinkkii hakemaan. Intelin 14nm mentiin jo todella agressiivisella otteella ja jos en väärin muista niin intelin tavoite 10nm kanssa oli vieläkin kunnianhimoisempi ja se kusee nyt kintuille.
 
Mielenkiintoisia huhuja pyörii kyllä loppuvuoden 2018 ja alkuvuoden 2019 prossuista. Pitäisiköhän sittenkin harkita tuon 2700X palautusta ja sinnitellä vielä yksi vuosi SB i7:lla.. Jo nuo Zen2 huhut vaikuttavat aikas hyviltä, kun ilmeisesti 5Ghz onnistuisi silläkin ja huhutut teholisäykset kuulostavat melko merkittäviltä. Ja sitten toki vielä Intelin vastineet..
 
Mielenkiintoisia huhuja pyörii kyllä loppuvuoden 2018 ja alkuvuoden 2019 prossuista. Pitäisiköhän sittenkin harkita tuon 2700X palautusta ja sinnitellä vielä yksi vuosi SB i7:lla.. Jo nuo Zen2 huhut vaikuttavat aikas hyviltä, kun ilmeisesti 5Ghz onnistuisi silläkin ja huhutut teholisäykset kuulostavat melko merkittäviltä. Ja sitten toki vielä Intelin vastineet..

Vielä kun vehkeet olisivat julkaisuaikaan oikeasti julkaisukunnossa. Nopeat käänteet prossumarkkinoilla ovat tuoneet ainakin minun makuuni vähän liikaa lastentauteja tuotteisiin. Ainakin Asuksen biossit X370-emolevyille ovat vieläkin niin reikäisiä, ettei viitsi päivittää ellei ole pakko. Ehkä mä en vaan nauti tuntikausien säätämisestä enää.
 
Kuten toiseen ketjuun kirjoitin, mitään tuollaista ei Intel luvannut. Intel lupasi 5 GHz Turbolla ja 28 ydintä, ei 28 ydintä 5 GHz kaikki ytimet. Intel ei luvannut toimittaa sellaista prosessoria jota tilaisuudessa demottiin.

Eli taas meni hype täydestä kun amerikkalaiset eivät ymmärrä mitä sanottiin.

Niin tilaisuudessa se oli kellotettu 5GHz kaikilla ytimillä eli virran tarve on ollut varmaan aika suuri. Eiköhän se julkaisu versio ole jotain muuta kuin 5GHz kaikilla ytimillä. Parilla saattaa vakiona turbotella toki 5GHz.
 
Eipä ihme et Intelillä tuli kiire julkistaa oma mörköprossunsa HEDT-alustalleen, AMD julkasti just X399 refreshin ja 32-ytimisen Threadripper 2:n:

AMD Reveals Threadripper 2 : Up to 32 Cores, 250W, X399 Refresh

Kellotaajuuksia ei oo kait vielä lyöty lukkoon, mut TDP on melko massiivinen 250W. Vähä tuli kyllä ainaki itelle puskista tämä.

Tuli aika suurena yllätyksenä minullekin.

Intelin yhden piilastun ratkaisussa päästään keskimäärin pienempiin kommunikaatio-/muistiviiveisiin(ja esim. parempaan pelisuorituskykyyn), mutta AMDn MCM-ratkaisussa lämpökuorma tulee suuremmalle efektiiviselle pinta-alalle, hiukan helpompi jäähdyttää silloin kun suuri määrä ytimiä pyörii suurella kellolla.
 
Tuli aika suurena yllätyksenä minullekin.

Intelin yhden piilastun ratkaisussa päästään keskimäärin pienempiin kommunikaatio-/muistiviiveisiin(ja esim. parempaan pelisuorituskykyyn), mutta AMDn MCM-ratkaisussa lämpökuorma tulee suuremmalle efektiiviselle pinta-alalle, hiukan helpompi jäähdyttää silloin kun suuri määrä ytimiä pyörii suurella kellolla.
Taitaa muistiviiveet vastata aika lailla 4 erillistä CPU:ta? Vai tiedetäänkö tätä jo oikeasti?
 
Taitaa muistiviiveet vastata aika lailla 4 erillistä CPU:ta? Vai tiedetäänkö tätä jo oikeasti?

Puolet lastuista ei omaa suoraa väylää muistiin, vaan se kiertää toisen lastun kautta. Väittäisin viiveiden olevan rankempia kuin vastaavassa epycissä, jossa jokaisella lastulla on suora yhteys muistiin. Mutta epävirallinen epävirallinen...

TR_Layout_Unofficial_AT_575px.png
 
Taitaa muistiviiveet vastata aika lailla 4 erillistä CPU:ta? Vai tiedetäänkö tätä jo oikeasti?

Juu.

Ja muisti on threadripperissä NUMA eli sen optimaalinen hyödyntäminen vaatii tukea käyttöjärjestelmältä, ja käyttöjärjestelmän pitää tietää prosessorin rakenne NUMAn suhteen, että mistä allokoi muistia millekäkin säikeelle, ja sitten välttää säikeiden siirtelyä eri NUMA-nodelle.

Lisäksi muisti on ilmeisesti edelleen nelikanavainen 2*2 -konfiguraatiossa (eikä 4*1-konfiguraatiossa) jolloin joillain piilastuilla muistiin pitää aina mennä kiertäen toisten piilastujen kautta. Tosin tästä en ole täysin varma, voi olla myös 4*1.


edit: epävarmuutta ilmaisevat sanat poistettu svk:n viestissä olleen sliden näkemisen jälkeen.
 
TR2:lla kahden ytimen muistilatenssi tulee olemaan >= 124ns (GMI @ 3200MHz muistikello) sen normaalin muistilatenssin lisäksi, koska niillä ei ole omaa lokaalia muistia.
Mahdollisesti myös GMI - SDF hypystä tulee jotain vielä päälle, kun siirrytään ytimien välisestä väylästä (GMI) muistiohjaimen omaavan ytimen sisäiseen SDF väylään.

Toisinsanoen muistilatenssi tulee keskimäärin olemaan aika helvetin kauhea (n. 195ns) 3200MHz muistikellolla, eikä NUMA moodia ole saatavilla ellei noita vapaamatkustajaytimiä disabloi.

Threadripper oli jo 2P rakenteen takia järjetön markkinoituna kuluttajille suunnattuna HEDT:nä, TR2:n kanssa ollaan jo lobotomiatasolla.
 
Toisinsanoen muistilatenssi tulee keskimäärin olemaan aika helvetin kauhea (n. 195ns) 3200MHz muistikellolla, eikä NUMA moodia ole saatavilla ellei noita vapaamatkustajaytimiä disabloi.

Se on edelleen kyllä nimenomaan NUMA, mutta hiukan tyypillisestä NUMA-konfiguraatiosta poikkeava NUMA-konfiguraatio; Puoleen ytimistä ei mitkään käyttiksen NUMA-optimoinnit tehoa ja niille muistin käyttö on aina hidasta. (toiseen puoleen kyllä tehoaa; On tärkeää, että ne piilastut. joiden oma muistiohjain on käytössä, käyttää enemmän nimenomaan sitä siihen kytkettyä muistia)
 
Viimeksi muokattu:
Se on nimenomaan NUMA, mutta puoleen ytimistä ei mitkään käyttiksen NUMA-optimoinnit tehoa. (toiseen puoleen kyllä tehoaa)

TR:n NUMA (Local) moodissa jokainen ydin käyttää omaan muistiohjaimeensa kytkettyä muistia.
Ei latenssiongelmia, mutta käyttiksen / softan täytyy olla tuosta tietoinen.

UMA (Distributed) yhteensopivuus on parempi ja prosessori käyttäytyy kuten 1P, mutta muistilatenssi on huonompi juuri tuon potentiaalisen GMI hypyn takia (muisti toisen ytimen muistiohjaimessa).

Kun kahdella ytimellä ei ole ollenkaan lokaalia muistia, niin NUMA-moodia voi olla vähän vaikea käyttää.

Alkuperäisellä TR:llä latenssipenaltti ei ollut kirkossa kuulutettu, koska UMA-moodissa haluttu data saattoi olla lokaalissa muistissa eikä toisen ytimen muistiohjaimeen kytketyssä muistissa.
 
Nuo muutama kuukaisi sitten Threadripperin korkanneet henkilöt (der8auer ym.) jotka löysivät 4 Zeppelin -sirua olivat tavallaan oikeassa: Threadripperin saa kuin saakin modattua tukemaan 32 zen-ydintä.

Eiköhän joku kohta ainakin kokeile vanhoilla prossuilla samaa temppua (tosin onnistuminen on varsin epätodennäköistä).

Ryzen Threadripper der8auerin käsittelyssä: kaikki 4 sirua ovat Zeppelinejä
 
Modata ne kaksi disabloitua lastua toimimaan ensimmäisen sukupolven TR:ssä?
 
Modata ne kaksi disabloitua lastua toimimaan ensimmäisen sukupolven TR:ssä?

Modaaminen ei ole ollut vuosiin mahdollista ja lisäksi AMD:lla ei ole mitään syytä käyttää toimivia piirejä niissä kahdessa täyteytimissä.
Halvimmissa AM4 Ryzeneissa voidaan käyttää paljonkin vikoja sisältäviä ytimiä, mutta mihinkään malliin kelpaamattomia ytimiä tulee silti aina jonkun verran ja TR:ssä on lähes 100% varmuudella käytetty juuri niitä täytteenä.
 
Modaaminen ei ole ollut vuosiin mahdollista ja lisäksi AMD:lla ei ole mitään syytä käyttää toimivia piirejä niissä kahdessa täyteytimissä.
Halvimmissa AM4 Ryzeneissa voidaan käyttää paljonkin vikoja sisältäviä ytimiä, mutta mihinkään malliin kelpaamattomia ytimiä tulee silti aina jonkun verran ja TR:ssä on lähes 100% varmuudella käytetty juuri niitä täytteenä.
Jos ottaa kaksi toimivaa piiriä yhdestä TR:stä ja lisää ne toiseen TR:ään disabloitujen paikalle.
Tiedän toki että ei onnistu ihan peltisepän tinakolvilla.
En luvannut toimivan, mutta ehkä joku kokeilee...
 
Kuulostaa aika kuohitulta :/ EPYC lienee noissa core-counteissa järkevämpi investointi jo...
 
Ilmeisesti tuo Intelin 5GHz 28-ytiminen HEDT-prossu ei sitte ollutkaan 5GHz ihan perinteisillä menetelmillä, Tomppa oli päässyt tarkasteleen ko. masiinaa hieman lähemmin.

Intel's 28-Core 5GHz Processor And Test System Breaks Cover

Eli jäähynä toimi chiller, jolla ilmeisemmin jäähdytyseho 1500W:n tuntumassa. Lisäks tuo jalkapallokentän kokonen emolevy on melko jäätävä kompleksi. LGA3647 kanta, 12-muistipaikkaa, 32-vaiheinen (!!!) virransyöttö, aktiivinen VRM-jäähdytys aivan jäätävän kokosen heatsinkin päällä.

Eli ei tuu halpa setti oleen mikäli mielii samanlaista kokoonpanoo kotikoneeks.
 
Viimeksi muokattu:
Jos nuo Threadripperin (toistaiseksi vahvistamattomat) kellot pitävät paikkaansa niin on kyllä pieni pettymys.

upload_2018-6-6_13-56-22.png
 
Eipä ihme et Intelillä tuli kiire julkistaa oma mörköprossunsa HEDT-alustalleen, AMD julkasti just X399 refreshin ja 32-ytimisen Threadripper 2:n:

AMD Reveals Threadripper 2 : Up to 32 Cores, 250W, X399 Refresh

Kellotaajuuksia ei oo kait vielä lyöty lukkoon, mut TDP on melko massiivinen 250W. Vähä tuli kyllä ainaki itelle puskista tämä.

Puskistahan tämä tuli vaikka tiesin sen teknisesti olevan mahdollista. Ollu kyllä Intelillä tieto asiasta koska tuon 28-core mallinsa julkaisivat.

EDIT: Mitäs arvon raati nyt on mieltä että kumpi olisi järkevämpää muistiohjainten osalta, vanha 2x2 vaiko 1x4?
 
Viimeksi muokattu:
Ilmeisesti tuo Intelin 5GHz 28-ytiminen HEDT-prossu ei sitte ollutkaan 5GHz ihan perinteisillä menetelmillä, Tomppa oli päässyt tarkasteleen ko. masiinaa hieman lähemmin.

Intel's 28-Core 5GHz Processor And Test System Breaks Cover

Eli jäähynä toimi chiller, jolla ilmeisemmin jäähdytyseho 1500W:n tuntumassa. Lisäks tuo jalkapallokentän kokonen emolevy on melko jäätävä kompleksi. LGA3647 kanta, 12-muistipaikkaa, 32-vaiheinen (!!!) virransyöttö, aktiivinen VRM-jäähdytys aivan jäätävän kokosen heatsinkin päällä.

Eli ei tuu halpa setti oleen mikäli mielii samanlaista kokoonpanoo kotikoneeks.
Kilowatin poweri... Tuon jälkeen se Threadripperin 250W ei tunnu missään.
 
Kilowatin poweri... Tuon jälkeen se Threadripperin 250W ei tunnu missään.

Eihän toi ollu kuin markkinointi stuntti inteliltä :D

Jos prossu on kiusattu niin äärimmilleen ettei edes joku tavallinen vesijäähytys riitä niin on aika selvää että tällä nyt haluttiin jotain haloa saada aikaiseksi.
 
Paljon se 5ghz 28-ydin kulutti? Jos alle kilowatin menee, niin aika tajuton hyötysuhde verrattuna siihen kilowatin rajan ylittäneeseen kiveen :p
 
Paljon se 5ghz 28-ydin kulutti? Jos alle kilowatin menee, niin aika tajuton hyötysuhde verrattuna siihen kilowatin rajan ylittäneeseen kiveen :p

No se kilowatin ylittäny oli 5,6GHz eli jollain tappojännitteillä. Ei siis täysin vertailukelpoisia jotkut kompura jäähytykset ln2 jäähytysten kanssa.
 
Jos nuo Threadripperin (toistaiseksi vahvistamattomat) kellot pitävät paikkaansa niin on kyllä pieni pettymys.

upload_2018-6-6_13-56-22.png

Ei niitä kelloja taivaisiin saada ihan jo tehonkulutuksen takia.
Esim. 1950X vetää 3.7GHz / 1.150V asetuksilla maksimissaan n. 220W tehoa.

Jos AMD:n tapa konffata AM4 Pinnacle Ridget pätee myös uusiin Threadrippereihin, niin toi 250W nimellis-TDP on käytännössä 337W.
Kaikkien AM4 Pinnacle Ridge prosessorien oikea tehoraja on 35% korkeampi kuin nimellinen TDP.
 
Ei niitä kelloja taivaisiin saada ihan jo tehonkulutuksen takia.
Esim. 1950X vetää 3.7GHz / 1.150V asetuksilla maksimissaan n. 220W tehoa.

Jos AMD:n tapa konffata AM4 Pinnacle Ridget pätee myös uusiin Threadrippereihin, niin toi 250W nimellis-TDP on käytännössä 337W.
Kaikkien AM4 Pinnacle Ridge prosessorien oikea tehoraja on 35% korkeampi kuin nimellinen TDP.

TDP on thermal design power eikä maximum power consumption. Saa hetkellisesti kuluttaa enemmän, jos lämpötila on rajan alla, ja järkevä suorituskykyoptimoitu turbo-mode nostaa kelloja jos ollaan sen lämpörajan alla.
 
TDP on thermal design power eikä maximum power consumption. Saa hetkellisesti kuluttaa enemmän, jos lämpötila on rajan alla, ja järkevä suorituskykyoptimoitu turbo-mode nostaa kelloja jos ollaan sen lämpörajan alla.

Määrittele hetkellisesti?
Esim. 105W Pinnacle Ridget saa kuluttaa 141.75W ilman mitään aikarajaa.
Intelillä TDP:n ylitys sallitaan sekunniksi (25%).
 

Statistiikka

Viestiketjuista
295 812
Viestejä
5 052 383
Jäsenet
80 985
Uusin jäsen
davids

Hinta.fi

Back
Ylös Bottom