Virallinen: AMD vs Intel keskustelu- ja väittelyketju

hsalonen · 19.03.2018

Dudem sanoi:
Itseä kiinnostaisi miten paljon nuo eri koneet ryystävät seinästä ja minkälaista jäähdytystä vaatii, että saadaan noita kellotustuloksia. Sekä paljonko on sitten se lopullinen hintaero vaikkapa 2200G pakettiin ja SER pakettiin kun lasketaan koko paketti. Ryzenissä tulee riittävä cooleri mukana ja kellotukseen riittävän saa noin 20 eurolla uutena. Muuten ei ole mitään vastaan SERrin käytölle, omakin kone on sellainen.

Lievästi OT, mutta tuo on vähän huono vaihtoehto, kun on vaan iso tuuletin ja pari heatpipea. Nämä on kumpikin parempia:
ID-Cooling SE-213v2 -prosessorijäähdytin - 19,90€
ID-Cooling SE-903-R -prosessorijäähdytin - 14,90€

svk sanoi:
Niin varmasti tekee erillisen näyttiksen ansiosta, mutta kumman luulet kestävän kauemmin pelikelpoisena? 2c4t vs 4c4t

Juu, Ryzeniä vastaan pitäisi olla i3-8100, mutta kun Intel ei vieläkään ole julkaissut niitä vuodenvaihteeseen suunnattuja halpisemolevyjä Coffee Lakelle..

Dudem · 19.03.2018

branch sanoi:
SER koneesta en osaa sanoa kun laatuvaihtelee. Mutta suurimmassa osassa testissä kaby lake pena+gtx1030 on halvempi ja nopeampi tai yhtä nopea pelikombo kuin 2200G.

Edit: äh otetaas sen verran takaisin että 2400g on siis kalliimpi kuin tämä intelnvidia kompo :^)

Niin yllätys että erillinen kortti on tehokkaampi kuin integroitu. Itse en kuolleeseen alustaan lähtisi uutena rahojani sijoittamaan. Omasta mielestäni tuo 2200G on parempi vaihtoehto, erillisen kortin lisäämällä saa budjetti alustaan lisää pelitehoa. Katsotaan vertailua uusiksi kun Inteli saisi ne halpis alustansa julkaistuksi.

hsalonen sanoi:
Lievästi OT, mutta tuo on vähän huono vaihtoehto, kun on vaan iso tuuletin ja pari heatpipea. Nämä on kumpikin parempia:
ID-Cooling SE-213v2 -prosessorijäähdytin - 19,90€
ID-Cooling SE-903-R -prosessorijäähdytin - 14,90€

Voi ollakin, en sanonut että se paras olisikaan. Tuota on useasti suositeltu korvaamaan boxed cooleria Ryzenin kohdalla.

Puurokulho · 19.03.2018

MrFoxZet sanoi:
Mites hyvin nuo ikivanhat emot ottaa nykyaikaisia käyttiksiä vastaan

Eikä taida olla mahdollisuutta päivittää prossua tehokkaampaan toisin kuin nykyaikaisten kantojen kanssa

980Ti on kyllä aika alarajoilla millä mielestäni voi prossun pelisuorituskykyä mitata. Näkisin esim. 1080/1080Ti paljon parempana, ei ainakaan tule GPU vastaan ensimmäisenä

Itellä on Asuksen GTX 1080 4.4GHz Westmeren kyljessä, tästä hieman osviittaa kulkuihi:

I scored 18 487 in Fire Strike

I scored 7 469 in Time Spy

PCI-E 2.0 x16 ei rajota näyttiksen kulkuja millään tasolla, katellaan sit ku Pascalin seuraajat julkastaan et jos sitte jo alkas PCI-E kaista kaulaan suorituskykyä. Noitakin tuloksia olis ehkä saanu hitusen vielä hilattua ylöspäin jos olis tarjonnu prossulla hieman enemmän volttia, Cinebenchiä on kuitenkin vedetty 4.6GHz:lla läpi.

Ja melko heikoilla on ollut prossunkin päivittäminen viimesen 7 aikana Intelin puolella, mikäli sattuu oleen jo i7 valmiiks alla eikä joku Pentiumin ruoska. Käytännössä AM4 on se ainoo alusta millä tuo on oikeesti relevantti asia.

JiiPee · 19.03.2018

HEDT sanoi:
Kun oli 29 testikuorman keskiarvot. Ei tämä kaveri nyt mikään noviisi ole.
Tuohon syyhyn voit aina tiukanpaikan tullen vedota.

Niin oli 29 ja voi hyvinkin olla että kaikki 29 on pelkästään intelille optimoituja. En ymmärrä miksi tämä on niin vaikeaa monen hyväksyä taikka käsittää että optimoinneilla on väliä eikä se ole mitään takertumista johonkin.
Enkä kritisoi sitä etteikö kaveri osaisi, kritisoin sitä että jätetään oleellisia asioita mainitsematta.

The Stilt sanoi:
Cinebenchejä, Linpackia sekä WinRAR:a lukuunottamatta kaikki kuormat on avointa lähdekoodia.
11:ta itse käännetyssä kuormassa kääntäjänä on GCC (6.3 tai 7.2), kahdeksassa ICL 2017 tai 2018 jonka tuottamat binäärit on pätsätty valmistajariippuvaisen polunohjauksen poistamiseksi.

Avoin lähdekoodi ei sinäänsä ole mikään tae sille että olisi optimoitu.

Tuossa hiukan samanlainen keissi. Kovasti yritetään mutta lopulta kuitenkin unohtuu se tärkein, eli noin suuret erot selittyy ainoastaan optimoinnin puutteella.
Ja jos tuosta vielä lukasee hiukan kaverin kommentteja niin:

If you want, I can show you a 2 core Pentium G3258 or a 6 year old i5-2500K being better at these 'workstation' tasks than the Ryzen. I've seen this on Youtube for years, people feeling the need to aggressively justify and defend their purchasing decisions with the inability to face staring hard cold facts in the face. I've no idea why, it's not personal, I've bought loads of stuff in my life which has turned out to be shite. People bang on like this is a religion they're sticking up for, it's crackers.

Ryzen siis toimii kyseisellä softalla erittäin huonosti jos saa pannuun jopa 6 vuotta vanhalta dualcore penalta. Ja varmaan jokainen ymmärtää että ei se Ryzen nyt noin paska ole, kattoo asiaa sitten minkä väristen lasien läpi tahansa.

Se minkä tämäkin kaveri videossaan lahjakkaasti ohittaa, on se optimointi ja sen merkitys.

Deleted member 4604 · 19.03.2018

JiiPee sanoi:
Avoin lähdekoodi ei sinäänsä ole mikään tae sille että olisi optimoitu.

Listaatko yleisimmät ohjelmat mitkä on optimoitu nimenomaan jollekin arkkitehtuurille?

hkultala · 19.03.2018

JiiPee sanoi:
Niin oli 29 ja voi hyvinkin olla että kaikki 29 on pelkästään intelille optimoituja.
En ymmärrä miksi tämä on niin vaikeaa monen hyväksyä taikka käsittää että optimoinneilla on väliä eikä se ole mitään takertumista johonkin.
Enkä kritisoi sitä etteikö kaveri osaisi, kritisoin sitä että jätetään oleellisia asioita mainitsematta.

Avoin lähdekoodi ei sinäänsä ole mikään tae sille että olisi optimoitu.

Käsittääkseni The Stilt on itse kääntänyt suurimman osan noista binääreistä, eli on itse valinnut, mille mikroarkkitehtuurille kääntäjä koodin optimoi (melko vähän väliä nykyaikaisilla prosessoreilla koska OoOE ja kaikilla yhtä pitkät välimuistilinjat) ja mitä käskykantalaajennoksia saa käyttää (tällä voikin olla väliä selvästi, mutta tämän AMD ei juuri voi jäädä "tappiolle" koska AVXn tms. poisjättäminen haittaisi paljon enemmän inteliä).

JiiPee · 19.03.2018

The Stilt sanoi:
Listaatko yleisimmät ohjelmat mitkä on optimoitu nimenomaan jollekin arkkitehtuurille?

Eiköhän tuo kata noin 100% kaikista ohjelmista viimeisen 6v aikana jotka on optimoitu täysin Intelille kun ei käytännössä ole ollut mitään muuta vaihtoehtoa tarjolla. Mikä tässä on niin vaikeaa ymmärtää?

EDIT: Ja en siis tarkoita että tuo olisi ollut mitenkään väärin toimia noin. Aika turhaa se olisi ollut haaskata resursseja johonkin AMD kaivuri optimointeihin kun ei niitä missään oikeissa täissä kukaan käytä/käyttänyt.

Se vain ärsyttää että niin monet testaajat lahjakkaasti sivuuttaa koko asian jolla on kuitenkin valtava merkitys.

MrFoxZet · 19.03.2018

Puurokulho sanoi:
Itellä on Asuksen GTX 1080 4.4GHz Westmeren kyljessä, tästä hieman osviittaa kulkuihi:

I scored 18 487 in Fire Strike

I scored 7 469 in Time Spy

PCI-E 2.0 x16 ei rajota näyttiksen kulkuja millään tasolla, katellaan sit ku Pascalin seuraajat julkastaan et jos sitte jo alkas PCI-E kaista kaulaan suorituskykyä. Noitakin tuloksia olis ehkä saanu hitusen vielä hilattua ylöspäin jos olis tarjonnu prossulla hieman enemmän volttia, Cinebenchiä on kuitenkin vedetty 4.6GHz:lla läpi.

Ja melko heikoilla on ollut prossunkin päivittäminen viimesen 7 aikana Intelin puolella, mikäli sattuu oleen jo i7 valmiiks alla eikä joku Pentiumin ruoska. Käytännössä AM4 on se ainoo alusta millä tuo on oikeesti relevantti asia.

Aika pahaltahan tuo omaan silmään näyttää, itsellä ottaa speksien kone Time Spystä sen ~7000 :beye:

Ja CPU-pisteissä melkein kaksinkertainen ero, ~5000 vs ~9000 :darra:

JiiPee · 19.03.2018

hkultala sanoi:
Käsittääkseni The Stilt on itse kääntänyt suurimman osan noista binääreistä, eli on itse valinnut, mille mikroarkkitehtuurille kääntäjä koodin optimoi (melko vähän väliä nykyaikaisilla prosessoreilla koska OoOE ja kaikilla yhtä pitkät välimuistilinjat) ja mitä käskykantalaajennoksia saa käyttää (tällä voikin olla väliä selvästi, mutta tämän AMD ei juuri voi jäädä "tappiolle" koska AVXn tms. poisjättäminen haittaisi paljon enemmän inteliä).

Se optimointi kun olisi noin helppoa että heitetään vaan prossu flägejä kääntäjästä päälle. Kyllä se itse koodi vaatii niitä optimointeja myös ja sieltä saadaan nipistettyä paljonkin ulos.

Vai meinaatko että tuolla aiemmin linkkaamani Ashes of Singularity optimointi hoidettiin niinkin yksinkertaisesti että kääntäjään vai heitettiin ryzen flagi päälle? Että noinkin yksinkertaisella kikalla tuli yli 16% suorituskykyä lisää? Epäilen.

Deleted member 4604 · 19.03.2018

JiiPee sanoi:
Mikä tässä on niin vaikeaa ymmärtää?

En vain ymmärrä miten lähdekoodi muuttuu yhtäkkiä Intel optimoiduksi, kun kääntäjä kääntää sen x86 konekielelle

Eli mielestäsi kaikki kääntäjät tuottaa Intelille optimoitua koodia ja vastaavasti kaikki assemblyllä kirjoitettu koodi on tehty suosimaan Inteliä?

Deleted member 4604 · 19.03.2018

hkultala sanoi:
Käsittääkseni The Stilt on itse kääntänyt suurimman osan noista binääreistä, eli on itse valinnut, mille mikroarkkitehtuurille kääntäjä koodin optimoi (melko vähän väliä nykyaikaisilla prosessoreilla koska OoOE ja kaikilla yhtä pitkät välimuistilinjat) ja mitä käskykantalaajennoksia saa käyttää (tällä voikin olla väliä selvästi, mutta tämän AMD ei juuri voi jäädä "tappiolle" koska AVXn tms. poisjättäminen haittaisi paljon enemmän inteliä).

Missään binäärissä minkä olen itse kääntänyt ei ole mitään spesifististä targettia laitettu (ts. geneerinen).
Intelin kääntäjillä (ICL & IFort) käännetyt binäärit ei myöskään sisällä uudemmissä kääntäjäversioissa olevaa tune-optiota ja polunohjauskin on disabloitu / laitettu käyttämään samoja koodipolkuja valmistajasta riippumatta (pätsätty).
Lisäksi kääntäjä on valittu puhtaasti sillä perusteella mitä on ollut mahdollista käyttää ja mikä on ollut nopein vaihtoehto kaikilla alustoilla.

JiiPee · 19.03.2018

The Stilt sanoi:
En vain ymmärrä miten lähdekoodi muuttuu yhtäkkiä Intel optimoiduksi, kun kääntäjä kääntää sen x86 konekielelle
Eli mielestäsi kaikki kääntäjät tuottaa Intelille optimoitua koodia ja vastaavasti kaikki assemblyllä kirjoitettu koodi on tehty suosimaan Inteliä?

Eli softaa ei pystytä lähdekoodissa optimoimaan tietylle prosessorille? Ottamalla huomioon sen eroavuuksia toiseen prosessoriin?

Zetteri · 19.03.2018

Laitetaas tähän noitten testejeni Cinebench scoret,video renderöinti ja 3dmark firestrike tulokset. Että ei tarvi valittaa että tulokset eivät ole "oikeita" tai jotain sinne päin.
3dmark tuloksista uupuu se i7 3820:n koska sitä mulla ei enää ollut kun aloin suorittaa näitä 3dmark testejä yleisöpalautteen takia.

Ja video renderöinnistä että näyttäis että tuo ei osaa hyödyntää oikein yli 8 säettä.
E5-2670 jossa 16 säettä niin CPU kuormat vain noin 60% ja 12 säikeisellä X5650:lla n.80%.

Deleted member 4604 · 19.03.2018

JiiPee sanoi:
Eli softaa ei pystytä lähdekoodissa optimoimaan tietylle prosessorille? Ottamalla huomioon sen eroavuuksia toiseen prosessoriin?

Kerrotko nyt jotain konkreettisia esimerkkejä (pl. täysin epärelevantti AoTS) ensin ohjelmista, jotka on nimenomaan optimoitu jollekkin tietylle mikroarkkitehtuurille?

Arkkitehtuuri joka vaatii koodin kirjoittamisen käsin suoriutuakseen kunnolla, ei ole hyvä / pitkäikäinen arkkitehtuuri. Tuo on täysin kohtuuton vaatimus.

jokumuu · 19.03.2018

Me olemme ainakin optimoineet omaa softaamme ihan puhtaasti Intel-alustalle. Tämä siitäkin huolimatta, että toimitamme softaa myös mm. ppc ja arm alustoille, joita ei optimoida.
Puhtaasti Intel-optimointeja on mm. cache-coherencyyn liittyvät puljaukset sekä TSX:n käyttäminen, jos CPU sitä tukee.
TSX antaa tietyissä tilanteissa todella hyvän edun, kun mutexeja voi karsia. AMD päätti syystä tai toisesta jättää tuen lisäämättä viimeisimpiin prossuihinsa.

Tokihan me elämme asiakkaistamme, joten jos joku (isompi) asiakas sanoisi, että ryhtyvät käyttämään AMD:tä, niin mehän kumartaisimme ja optimoisimme. Tätä ei kuitenkaan ole tapahtunut, CPU-alustan hinta ratkaisuiden kokonaishinnassa on olematon, ei kannata koettaa onneaan. Muita kuin Intel-alustoja käytetään lähinnä erikoisempiin tarkoituksiin tai sitten vain ihan legacy-syistä, tämä pätee varmaan myös "Intel-yhteensopivaan" AMD alustaan.

hkultala · 19.03.2018

JiiPee sanoi:
Se optimointi kun olisi noin helppoa että heitetään vaan prossu flägejä kääntäjästä päälle. Kyllä se itse koodi vaatii niitä optimointeja myös ja sieltä saadaan nipistettyä paljonkin ulos.

Koodaan töikseni kääntäjän optimointeja joten väitän tietäväni koodin optimoinnista aika paljon.

Kun kääntäjäni kääntää koodia liian hitaasti(kääntäjäni ajoaika liian pitkä), optimoin sitä pääasiassa siten, että ensin etsin profilointityökalulla funktiot, jotka vievät eniten aikaa.

Tämän jälkeen luen ihan C++-tasolla sitä koodia niistä eniten aikaa vievistä funktioista, että, onko siellä tehty jotain tyhmää.
Usein löydän sieltä esim. koodin

for (int i = 0; i < a.size(); i++) {
...
}

... jonka muutan muotoon

size = a.size();
for (int i = 0; i < size; i++) {
...
}

jossa size()-funktiolle tulee vähemmän kutsuja (se voi joskus olla hidas, jos tietorakenne on monimutkaisempi)

Toinen yleinen tilanne on, että siellä on jossain turhaan kaksi sisäkkäistä for-looppia (eli O(n²) ajoaika).
Vaihdan jonkun std::vectorin sieltä std::mapiksi ja saan sen avulla tämän rutiinin ajoajaksi O(n*log N).

Jonkin verran turhia dynamic_casteja olen myös vaihtanut static_casteiksi.

Kaikki näistä mainituista optimoinneista hyödyttää ihan yhtä paljon AMDn kuin intelin prosessoreilla, itseasiassa en ole vielä KOSKAAN tehnyt kääntäjääni mitään sellaista sen ajoaikaa nopeuttavaa optimointia, joka tähtäisi sen nopeuttamiseen nimenomaan intelin prossuilla(muiden mikroarkkitehtuurien kustannuksella), vaikka työkoneessani on aina ollut intelin prossu.

Kääntäjäni sen sijaan tuottaa koodia customoiduille staattisesti skeduloiduille prosessoreille. Niissä pitää kaikki laskea kellojaksontarkasti, ja teen todella paljon matalan tason nysväystä optimaalisemman loputuloksen saavuttamiseksi.

Nykyaikaiset CPUt vaan eivät tätä aggressivista käskyskedulointinysväystä tarvi, koska niiden dynaaminen skedulointi ajaa koodia nopeasti vaikka käskyt tulisi sisään missä järjestyksessä tahansa (ja niissä se järjestys muutenkin koko ajan vaihtelee välimuistihutien ja haarautumisennustushutien takia).

Ja keskimäärin softat on nykyään korkealla tasolla todella huonosti optimoituja. Ei ole mitään järkeä alkaa nysväämään softan lähdekoodiin hirveästi valmistajakohtaisia optimointeja joilla jonkun asian X, joka tehdään miljoona kertaa, voi tehdä 30% nopeammin, jos koko asian X voisi oikeasti tehdä vain kerran sen miljoonan kerran sijasta kun softan suunnittelisi vähän järkevämmin.

Tärkein jossain määrin mikroarkkitehtuurikohtainen optimointi nykyaikana on datan sijoitettelu muistissa siten, että se osuu mukavasti välimuistilinjoihin, mutta amdn ja intelin kaikkien nykyprosessorien välimuistilinjat ovat yhtä pitkiä joten optimointi kummalle tahansa valmistajalle takaa tässä suhteessa optimaalisen tuloksen myös toiselle

spede · 19.03.2018

@JiiPee nyt näyttää kuvittelevan, että ohjelmia optimoidaan koodareiden toimesta erinäisille mikroarkkitehtuureille useinkin.

Totuushan on se, että puhutaan aivan järkyttävän pienestä määrästä koodareita, joilla on enemmän kuin ylimalkainen käsitys mikroarkkitehtuureista ja niiden eroista - ja jotka voisivat edes teoriassa lähtä kehittämäänsä ohjelmaa optimoimaan tuolla tasolla.

Kyllä se on nimenomaan se kääntäjä, mikä ohjelman optimoi prosessorityypille eikä sitä jauheta käsin missään toimistossa.

Argumentti, että testit on paskoja "koska ohjelmia ei olla käsin optimoitu, kuulikko!" on vähän hankala, jos mitään tälläisiä optimointeja ei ole muutenkaan tehty mihinkään suuntaan ikinä eikä tulla ikinä tekemäänkään. Optimointi ohjelmistokehityksessä on profilointia ja raskaiden funktioiden uudelleenmiettimistä. Ei siinä kehitysympäristössä edes näy tai kiinnosta mitä arkkitehtuuria on alla.

Fenotype · 19.03.2018

Mitähän tapahtuu jos ajaa virtuaali konetta 1800x prosessorilla ja pakottaa sillä jonkun h3mmon keksimällä jutulla windowsin näkemään suorittimen Genuine Intel CPUna, siinä olisi testien testi että nopeutuuko ipc ja ohjelmat vai eikö nopeudu

svk · 19.03.2018

CompuBench - performance benchmark for various compute APIs (OpenCL, RenderScript)

Eikös tämä ole hieman sellainen tilanne?

Fenotype · 19.03.2018

svk sanoi:
CompuBench - performance benchmark for various compute APIs (OpenCL, RenderScript)

Eikös tämä ole hieman sellainen tilanne?

no tuossa taitaa olla intelin opengl ajuri parempi, mutta ihan winrar autodesk tms. kiinnostaisi myös

Deleted member 4604 · 19.03.2018

Fenotype sanoi:
Mitähän tapahtuu jos ajaa virtuaali konetta 1800x prosessorilla ja pakottaa sillä jonkun h3mmon keksimällä jutulla windowsin näkemään suorittimen Genuine Intel CPUna, siinä olisi testien testi että nopeutuuko ipc ja ohjelmat vai eikö nopeudu

Ikivanhalla (~2009, ennen oikeusjuttua) julkaistulla Intelin kääntäjällä käännetyt saattaa nopeutua huomattavasti.
Esim. Caselabin Euler3D testistä valmistajariippuvaisen polunohjauksen tappammalla AMD:n prosessorien suorituskyky paranee > 30%.

Huolimatta siitä että poistan polunohjauksen nykyisilläkin kääntäjäversioilla käännetyistä binääreistä, oikeusjutun jälkeen julkaistut kääntäjäversiot eivät enää hidasta AMD:n prosessoreita tarkoituksella.

hkultala · 19.03.2018

Fenotype sanoi:
no tuossa taitaa olla intelin opengl ajuri parempi, mutta ihan winrar autodesk tms. kiinnostaisi myös

OpenCL, ei OpenGL.

Fenotype · 19.03.2018

The Stilt sanoi:
Ikivanhalla (~2009, ennen oikeusjuttua) julkaistulla Intelin kääntäjällä käännetyt saattaa nopeutua huomattavasti.
Esim. Caselabin Euler3D testistä valmistajariippuvaisen polunohjauksen tappammalla AMD:n prosessorien suorituskyky paranee > 30%.

Huolimatta siitä että poistan polunohjauksen nykyisilläkin kääntäjäversioilla käännetyistä binääreistä, oikeusjutun jälkeen julkaistut kääntäjäversiot eivät enää hidasta AMD:n prosessoreita tarkoituksella.

Jooh, mutta silti kiinnostaisi,

kun ei taida kukaan olla testannut tuota. Eikös autodesk tms. softa talot ole laiskoja optimoimaan muulle kuin genuine intel cpu lle ?
Ah joo Computing eikä Graphic
En ole autodeskin softaa käyttänyt 10vuoteen joten myönnän että olen pudonnut kelkasta, mikä lie on nykyisin tilanne.

Deleted member 4604 · 19.03.2018

Fenotype sanoi:
Jooh, mutta silti kiinnostaisi, kun ei taida kukaan olla testannut tuota. Eikös autodesk tms. softa talot ole laiskoja optimoimaan muulle kuin genuine intel cpu lle ?
Ah joo Computing eikä Graphic

Monet prosessoririippuvaiset softat on käännetty nimenomaan Intelin kääntäjällä.
Noissa tuon voi testata helpommin muokkaamalla itse ohjelmaa, ilman virtuaalikonekikkailua.

Olen testannut tuon mm. kaikkien Cinebench versioiden / Cinema 4D, WinRAR:n sekä jonkun shakkiohjelman kanssa.
Vaikutus menee helposti virhemarginaaliin.

Muiden kääntäjien kohdalla en pidä kovin todennäköisenä, että joku ohjelmistotalo tekisi optimointeja joita käytettäsiin vain Intelillä

Myös AMD:n näyttisajurit sekä matematiikkakirjasto on käännetty Intelin kääntäjällä

Fenotype · 19.03.2018

Jees, odottelen kiinnolla tulevaa kk, että näkee The Stiltin testi raportin. Aikaisemmissakin oli selkeän näköiset palkit.

Dudem · 19.03.2018

Aiemmin kyselin mitä esim. Zetterin testikokoonpanot ottavat seinästä. Kaivelin sitten hieman esimerkkejä tuolta internetsin ihmeellisestä maailmasta. Ja kuinka vertailukelpoisia ovat, mutta on siinä ainakin jotain suuntaa antavaa näihin.

Xeon X5650 @ 4,37 GHz ja tehonkulutus oli 285 wattia. Linkki: Intel X5650 Overclocking – resulting a 4.37 GHz hexacore – tomrei.com
Ryzen 3 2200G @ vakio ja tehonkulutus 86 wattia. Linkki: Testissä AMD Ryzen 5 2400G & Ryzen 3 2200G (Raven Ridge) - io-tech.fi
Ryzen 5 2400G @ vakio ja tehonkulutus 100 wattia. Linkki: Testissä AMD Ryzen 5 2400G & Ryzen 3 2200G (Raven Ridge) - io-tech.fi
i7 860 @ vakio ja tehonkulutus 180 wattia. Linkki: The Intel Core i7 860 Review

Siinä saa SERriin laitella vähän järeämpää virtalähdettä jos lähtee kelloja hakemaan ja ei taideta ihan parin kympin coolereillakaan pärjätä noiden tehojen suhteen. Mutta jokainen joutuu itse päätöksensä tekemään, itse lähtisin mieluummin 2200G linjalle ja saa uuden alustan, takuunalaisen. Sekä saa niitä nykyajan ominaisuuksia (esim. M.2, USB3, Sata 3) ihan out of box. Vielä kun saisivat noita DDR4 hintoja alaspäin..

Zetteri · 19.03.2018

Dudem sanoi:
Aiemmin kyselin mitä esim. Zetterin testikokoonpanot ottavat seinästä. Kaivelin sitten hieman esimerkkejä tuolta internetsin ihmeellisestä maailmasta. Ja kuinka vertailukelpoisia ovat, mutta on siinä ainakin jotain suuntaa antavaa näihin.

Xeon X5650 @ 4,37 GHz ja tehonkulutus oli 285 wattia. Linkki: Intel X5650 Overclocking – resulting a 4.37 GHz hexacore – tomrei.com
Ryzen 3 2200G @ vakio ja tehonkulutus 86 wattia. Linkki: Testissä AMD Ryzen 5 2400G & Ryzen 3 2200G (Raven Ridge) - io-tech.fi
Ryzen 5 2400G @ vakio ja tehonkulutus 100 wattia. Linkki: Testissä AMD Ryzen 5 2400G & Ryzen 3 2200G (Raven Ridge) - io-tech.fi
i7 860 @ vakio ja tehonkulutus 180 wattia. Linkki: The Intel Core i7 860 Review

Siinä saa SERriin laitella vähän järeämpää virtalähdettä jos lähtee kelloja hakemaan ja ei taideta ihan parin kympin coolereillakaan pärjätä noiden tehojen suhteen. Mutta jokainen joutuu itse päätöksensä tekemään, itse lähtisin mieluummin 2200G linjalle ja saa uuden alustan, takuunalaisen. Sekä saa niitä nykyajan ominaisuuksia (esim. M.2, USB3, Sata 3) ihan out of box. Vielä kun saisivat noita DDR4 hintoja alaspäin..

Tuo X5650 tulos ei voi pitää paikkaansa mitenkään. Noctua NH-D15 oli mulla tuossa jääynä (yhdellä tuulettimella) niin Prime95 kuormalla lämmöt 86C. Peleissä 57-68C eli viileämpi kuin nykyiset Coffee Lake i7:t. Joten tuo watti määrä ei voi olla mahdollista. Tämä siis 4.50GHz kelloilla.

EDIT: Nuo DDR4 muistihinnat tekevät SER-vehkeistä paljon houkuttelevammat. Sitten jos päästään takas sinne n.40€ 8GB hintoihin niin sitten asia on aivan toinen.

svk · 19.03.2018

Zetteri sanoi:
Tuo X5650 tulos ei voi pitää paikkaansa mitenkään. Noctua NH-D15 oli mulla tuossa jääynä (yhdellä tuulettimella) niin Prime95 kuormalla lämmöt 86C. Peleissä 57-68C eli viileämpi kuin nykyiset Coffee Lake i7:t. Joten tuo watti määrä ei voi olla mahdollista. Tämä siis 4.50GHz kelloilla.

Olikos ton ajan intelit juotettuja vielä?

Zetteri · 19.03.2018

svk sanoi:
Olikos ton ajan intelit juotettuja vielä?

Toki olivat. Mutta ei Noctua NH-D15 jaksa 285W lämpökuormaa jaksa hoitaa mitenkään. Joten siksi kerroinkin että tulos ei voi vaan pitää paikkaansa.
Ja ei ollut edes kovin lämmin sitä koskettaessa.

Focus0 · 19.03.2018

Zetteri sanoi:
Laitetaas tähän noitten testejeni Cinebench scoret,video renderöinti ja 3dmark firestrike tulokset. Että ei tarvi valittaa että tulokset eivät ole "oikeita" tai jotain sinne päin.
3dmark tuloksista uupuu se i7 3820:n koska sitä mulla ei enää ollut kun aloin suorittaa näitä 3dmark testejä yleisöpalautteen takia.

Ja video renderöinnistä että näyttäis että tuo ei osaa hyödyntää oikein yli 8 säettä.
E5-2670 jossa 16 säettä niin CPU kuormat vain noin 60% ja 12 säikeisellä X5650:lla n.80%.

Firestriken testeissä on kyllä jotain hämärää.. Pelkkä ikivanha Xeon ei tuota eroa tee.
Aiemmalla kokoonpanolla sain i7 3820 ja SLI 980:llä 15847 pistettä... 2 x 980GTX:ää on nopeampi Firestrikessä kuin yksi 980Ti.
I scored 15 847 in Fire Strike

Zetteri · 19.03.2018

Sampza84 sanoi:
Firestriken testeissä on kyllä jotain hämärää.. Pelkkä ikivanha Xeon ei tuota eroa tee.
Aiemmalla kokoonpanolla sain i7 3820 ja SLI 980:llä 15847 pistettä... 2 x 980GTX:ää on nopeampi Firestrikessä kuin yksi 980Ti.
I scored 15 847 in Fire Strike

Epäile rauhassa.

I scored 15 999 in Fire Strike

I scored 5 808 in Time Spy

svk · 19.03.2018

Zetteri sanoi:
Toki olivat. Mutta ei Noctua NH-D15 jaksa 285W lämpökuormaa jaksa hoitaa mitenkään. Joten siksi kerroinkin että tulos ei voi vaan pitää paikkaansa.
Ja ei ollut edes kovin lämmin sitä koskettaessa.

TDP guidelines & cooler height Saattaa jaksaa, saattaa että ei. Mitä tuo 165W & OC sitten meinaakaan taulukossa.

Dudem · 19.03.2018

Zetteri sanoi:
Tuo X5650 tulos ei voi pitää paikkaansa mitenkään. Noctua NH-D15 oli mulla tuossa jääynä (yhdellä tuulettimella) niin Prime95 kuormalla lämmöt 86C. Peleissä 57-68C eli viileämpi kuin nykyiset Coffee Lake i7:t. Joten tuo watti määrä ei voi olla mahdollista. Tämä siis 4.50GHz kelloilla.

EDIT: Nuo DDR4 muistihinnat tekevät SER-vehkeistä paljon houkuttelevammat. Sitten jos päästään takas sinne n.40€ 8GB hintoihin niin sitten asia on aivan toinen.

Eikös sinulla ole kulutusmittaria jolla mitata? Ainakin olit laittanut serveri videoon tehonkulutuksesta juttua. Joten oletan että olit itse mittaillut?

svk sanoi:
TDP guidelines & cooler height Saattaa jaksaa, saattaa että ei. Mitä tuo 165W & OC sitten meinaakaan taulukossa.

The overclocking headroom (OC) is specified as follows:
*** = best overclocking potential
** = medium overclocking potential
* = low overclocking potential

Zetteri · 19.03.2018

Dudem sanoi:
Eikös sinulla ole kulutusmittaria jolla mitata? Ainakin olit laittanut serveri videoon tehonkulutuksesta juttua. Joten oletan että olit itse mittaillut?

No oli semmoinen. Mutta se nyt päätti ottaa ja hajota (Tokmannin joku halppis) eli ei näytä mitään ruudussa. Pitänee varmaan hommata uusi ja katsoa paljon tuo mörkö vie virtaa kun tein siitä X5650@4.5GHz:sta ja GTX980ti:sta nykyisen koneeni edellisen E5-2670 tilalle.

EDIT: Mainittakoon muuten että Bloomfield Core i7:a (ja sen Xeon veljiä) kellottelin yli 4GHz:n niin Noctua ei meinannut saada niitä pysymään mitenkään alle 97C prime95 kuormalla. Ne oli oikeita lämpöpattereita

copter · 19.03.2018

Zetteri sanoi:
EDIT: Nuo DDR4 muistihinnat tekevät SER-vehkeistä paljon houkuttelevammat. Sitten jos päästään takas sinne n.40€ 8GB hintoihin niin sitten asia on aivan toinen.

Muistien hinnat oli itsellä kanssa aika pitkälti syynä miksi en kakkoskonetta alkanut päivittämään. Sitten kun emolevy sanoi sopimuksen irti X5460 kiven alta niin kävin hakemassa toisen, mutta ei suostunut toimimaan LGA771 kiven kanssa mitenkään loogisesti, niin päätin panostaa vasta 2400G settiin. Kalliiksi tuli vs SER, mutta eipähän tarvinnut kikkailla että sai koneen taas käyttöön.

JiiPee · 19.03.2018

The Stilt sanoi:
Kerrotko nyt jotain konkreettisia esimerkkejä (pl. täysin epärelevantti AoTS) ensin ohjelmista, jotka on nimenomaan optimoitu jollekkin tietylle mikroarkkitehtuurille?

Arkkitehtuuri joka vaatii koodin kirjoittamisen käsin suoriutuakseen kunnolla, ei ole hyvä / pitkäikäinen arkkitehtuuri. Tuo on täysin kohtuuton vaatimus.

Miten se AoTS optimointi nyt yht äkkiää muuttuu epärelevantiksi? Ei sovi agendaasi? Kyllähän niitä tuli muitakin suorituskykyä parantavia pätsejä muihin ohjelmiin Ryzenin julkaisun jälkeen, jotkut jopa hyödytti myös Inteliä ei tosin niin paljoa. Eli kyllä sillä softaoptimoinnilla on merkitystä.

Mutta jos sinä väität että Intel ja AMD prosessorit ajaa samaa koodia täysin optimaalisesti tilanteessa kuin tilanteessa täysin samalla koodilla niin onhan se sitten meidän kaikkien uskottava sinun sanaasi ja joku AoTS optimointi on pakko olla jotain illuusiota.

hkultala sanoi:
Koodaan töikseni kääntäjän optimointeja joten väitän tietäväni koodin optimoinnista aika paljon.

Eli sama kysymys: Prosessorikohtaisilla optimoinneilla ei ole merkitystä?

Se että nykyisin ei nysvätä juurikaan optimointeja johtuu ihan siitä että Intel puolella helpot tyhjät on jo vuosia sitten otettu pois ja vaikka tyhjää edelleen olisi, ei niiden pois nysväämisellä enää saavuteta paljoa. AMD:n puolella tilanne on eri,
vaikka molemmat on x86_64 prosessoreita, niin ei ne TOIMI identtisesti, eivätkä muutenkaan ole identtisiä.

svk · 19.03.2018

JiiPee sanoi:
Miten se AoTS optimointi nyt yht äkkiää muuttuu epärelevantiksi? Ei sovi agendaasi? Kyllähän niitä tuli muitakin suorituskykyä parantavia pätsejä muihin ohjelmiin Ryzenin julkaisun jälkeen, jotkut jopa hyödytti myös Inteliä ei tosin niin paljoa. Eli kyllä sillä softaoptimoinnilla on merkitystä.

Nopeutti se ryzen patchi myös inteliä hieman.

hkultala · 19.03.2018

JiiPee sanoi:
Eli sama kysymys: Prosessorikohtaisilla optimoinneilla ei ole merkitystä?

Ei, vaan niitä löytyy melko harvan softan lähdekoodista.

Prosessorikohtaiset optimoinnit on toteutettu kääntäjiin ja kääntäviin tulkattavien kielten virtuaalikoneisiin, ja sitten kun softa käännetään, kääntäjälle sanotaan mille arkkitehtuurille se optimoi, ja mitä käskykantalaajennuksia saa käyttää, tai kun virtuaalikone kääntää tulkattavaa kieltä natiivikoodiksi, se haistelee, millä prossulla sitä ajetaan, ja tekee sille optimoitua koodia käyttäen käskykantalaajennuksia, jotka siinä on tuettu.

Ja tämä keskustelu lähti niistä The Stiltin testaamista 29 softasta, joista suurimman osan The Stilt oli kääntänyt itse siten että niitä ei oltu käännetty mitkään intel-optiot päällä.

Ja sitten sinä aloit epäilemään että kuitenkin olivat "intel-optimoituja softia". Eivät olleet.

Joissain softissa, pääasiassa peleissä, toki on myös prosessorisoftaisia optimointeja ihan lähdekoodissa, mutta nämä on harvinaisia.

Ja The Stilt ei käsittääkseni ollut testannut AoTSää , mikään niistä 29 softasta ei ollut AoTS, joten sillä ei tämän kanssa ole mitään tekemistä.

Deleted member 4604 · 19.03.2018

JiiPee sanoi:
Miten se AoTS optimointi nyt yht äkkiää muuttuu epärelevantiksi? Ei sovi agendaasi?

Optimointi ei ole epärelevantti, vaan tuo "peli" itsessään on täysi vitsi.

Mikä se agenda mahtaa olla?

Kun kerran tiedät tarkkaan miten suorituskykyerot johtuu Intelin suosimisesta, niin voisitko näyttää esimerkkiä tämän koodin optimoimisesta Ryzenille?
Tässä geneerisessä NBodyssa Ryzenin IPC on ~47% Skylaken ja uudempien Intelien vastaavasta.

Koodi:

#include <math.h>
#include <stdio.h>
#include <stdlib.h>
#include "timer.h"

#define CACHELINE 64 // size of cache line [bytes]
#define SOFTENING 1e-9f

typedef struct { float *x, *y, *z, *vx, *vy, *vz; } BodySystem;

void randomizeBodies(float *data, int n) {
  for (int i = 0; i < n; i++) {
    data[i] = 2.0f * (rand() / (float)RAND_MAX) - 1.0f;
  }
}


void bodyForce(BodySystem p, float dt, int n, int tileSize) {
  for (int tile = 0; tile < n; tile += tileSize) {
    int to = tile + tileSize;
    if (to > n) to = n;

    for (int i = 0; i < n; i++) {
      float Fx = 0.0f; float Fy = 0.0f; float Fz = 0.0f;

      #pragma vector aligned
      #pragma simd
      for (int j = tile; j < to; j++) {
        float dy = p.y[j] - p.y[i];
        float dz = p.z[j] - p.z[i];
        float dx = p.x[j] - p.x[i];
        float distSqr = dx*dx + dy*dy + dz*dz + SOFTENING;
        float invDist = 1.0f / sqrtf(distSqr);
        float invDist3 = invDist * invDist * invDist;

        Fx += dx * invDist3; Fy += dy * invDist3; Fz += dz * invDist3;     
      }
   
      p.vx[i] += dt*Fx; p.vy[i] += dt*Fy; p.vz[i] += dt*Fz;
    }
  }
}

int main(const int argc, const char** argv) {
 
  int nBodies = 30000;
  if (argc > 1) nBodies = atoi(argv[1]);

  int tileSize = 24400;
  if (tileSize > nBodies) tileSize = nBodies;

  const float dt = 0.01f; // time step
  const int nIters = 10;  // simulation iterations

  if ( tileSize % (CACHELINE/sizeof(float)) ) {
    printf("ERROR: blockSize not multiple of %d vector elements\n", CACHELINE/(int)sizeof(float));
    exit(1);
  }

  int bytes = 6*nBodies*sizeof(float);
  float *buf = (float*)_mm_malloc(bytes, CACHELINE);
  BodySystem p;
  p.x  = buf+0*nBodies; p.y  = buf+1*nBodies; p.z  = buf+2*nBodies;
  p.vx = buf+3*nBodies; p.vy = buf+4*nBodies; p.vz = buf+5*nBodies;

  randomizeBodies(buf, 6*nBodies); // Init pos / vel data

  double totalTime = 0.0;

  for (int iter = 1; iter <= nIters; iter++) {
    StartTimer();

    bodyForce(p, dt, nBodies, tileSize); // compute interbody forces

    for (int i = 0 ; i < nBodies; i++) { // integrate position
      p.x[i] += p.vx[i]*dt;
      p.y[i] += p.vy[i]*dt;
      p.z[i] += p.vz[i]*dt;
    }

    const double tElapsed = GetTimer() / 1000.0;
    if (iter > 1) { // First iter is warm up
      totalTime += tElapsed;
    }
  }
  double avgTime = totalTime / (double)(nIters-1);
  printf("\nBodies: %d", nBodies);
  printf("\nTotal time elapsed: %0.3f seconds", totalTime);
  printf("\nAverage time per iteration: %0.4f seconds", avgTime);
  printf("\nAverage %0.4f BIPS\n", 1e-9 * nBodies * nBodies / avgTime);

  _mm_free(buf);
}

JiiPee · 19.03.2018

hkultala sanoi:
Ja sitten sinä aloit epäilemään että kuitenkin olivat "intel-optimoituja softia". Eivät olleet.

Ja The Stilt ei käsittääkseni ollut testannut AoTSää , mikään niistä 290 softasta ei ollut AoTS, joten sillä ei tämän kanssa ole mitään tekemistä.

En minä ole missään epäillyt että olisi intel-optimoinnit päällä käännetty ne softat, vaan olen koko ajan tarkoittanut sitä että Softan tekijät on menneet Intelin ehdoilla jo vuosia.
@jokumuu myös asiaan otti kantaa ja on hyvin linjassa siihen mitä kaveri on jutellut ja hän työkseen päivittäin koodaa. AMD:lle ei ole järkevää optimoida, kun ei rautaa ole juurikaan missään käytössä, mutta toki tilanne voi muuttua.
Virallinen: AMD vs Intel keskustelu- ja väittelyketju

AoTS on varsin oiva esimerkki juuri siitä että optimoinneilla on merkitystä. Minä sanoin että itse luotan cinebench lukuihin koska se näyttäisi olevan suhteellisen hyvin optimoitu molemmille, jonka sinä halusit ampua alas väittäen että ei ole hyvin optimoitu jolloin keskustelu ohjautui softaoptimointiin ja sen merkitykseen IPC:n.

Deleted member 4604 · 19.03.2018

JiiPee sanoi:
Minä sanoin että itse luotan cinebench lukuihin koska se näyttäisi olevan suhteellisen hyvin optimoitu molemmille, jonka sinä halusit ampua alas väittäen että ei ole hyvin optimoitu jolloin keskustelu ohjautui softaoptimointiin ja sen merkitykseen IPC:n.

Cinebench on hyvä yleinen mittari suorituskyvylle, mutta melko koomista että väität sen olevan hyvin optimoitu molemmille kun kaikki Maxonin softat on nimenomaan käännetty Intelin kääntäjillä.
Ja voit olla varma että Intelin kääntäjät eivät sisällä mitään optimointeja nimenomaan AMD:lle.

Syy miksi Cinebench sopii hyvin AMD:lle on siinä että ohjelma käyttää maksimissaan SSE3 käskykantaa (R15).
Siinä vaiheessa kun Cinebench päivittyy tukemaan AVX/AVX2/AVX512/FMA käskyjä niin se voi yllättäen muuttua "huonosti AMD:lle optimoiduksi".

Lisäksi toki Intelin kääntäjä on keskimäärin nopein vaihtoehto, myös AMD:lle.

JiiPee · 20.03.2018

The Stilt sanoi:
Optimointi ei ole epärelevantti, vaan tuo "peli" itsessään on täysi vitsi.

Onko sillä väliä millainen se "peli" on jos voidaan osoittaa että patchin jälkeen suorituskykyä tuli rutkasti lisää?
Mistä se parannus sinun mielestäsi sitten tuohon kyseiseen "peliin" tuli jos ei optimoinnista?

The Stilt sanoi:
Kun kerran tiedät tarkkaan miten suorituskykyerot johtuu Intelin suosimisesta, niin voisitko näyttää esimerkkiä tämän koodin optimoimisesta Ryzenille?

En minä ole koodaaja joten en todellakaan osaa sanoa että voisiko tuota koodia mitenkään optimoida Ryzenille. Mutta sen olen vuosien varrella oppinut että jokaiselle hevoselle kyllä löytyy kengittäjä. Eli vaikka itse luulee että on tehnyt ihan parhautta, niin joku muu saattaakin tehdä asian paremmin.

JiiPee · 20.03.2018

BOT sanoi:
EDIT. Ja AotS on hyvä esimerkki tässä yhteydessä, ainoastaan sillä huomiolla, että näytönohjaimen ajurilla on oma roolinsa välissä. Kannattaa sekin muistaa että jotkin pelit performoivat huomattavasti paremmin kun paritetaan esimerkiksi Ryzen ja Vega verrattuna Ryzen ja Pascal.

Siinä AoTS testissä oli käytetty mittarina ainoastaan CPU painotettua testiä, eli näyttiksen ajureiden merkitys pitäisi olla lähes nolla.

rapukala · 20.03.2018

Dudem sanoi:
Aiemmin kyselin mitä esim. Zetterin testikokoonpanot ottavat seinästä. Kaivelin sitten hieman esimerkkejä tuolta internetsin ihmeellisestä maailmasta. Ja kuinka vertailukelpoisia ovat, mutta on siinä ainakin jotain suuntaa antavaa näihin.

Xeon X5650 @ 4,37 GHz ja tehonkulutus oli 285 wattia. Linkki: Intel X5650 Overclocking – resulting a 4.37 GHz hexacore – tomrei.com
Ryzen 3 2200G @ vakio ja tehonkulutus 86 wattia. Linkki: Testissä AMD Ryzen 5 2400G & Ryzen 3 2200G (Raven Ridge) - io-tech.fi
Ryzen 5 2400G @ vakio ja tehonkulutus 100 wattia. Linkki: Testissä AMD Ryzen 5 2400G & Ryzen 3 2200G (Raven Ridge) - io-tech.fi
i7 860 @ vakio ja tehonkulutus 180 wattia. Linkki: The Intel Core i7 860 Review

Siinä saa SERriin laitella vähän järeämpää virtalähdettä jos lähtee kelloja hakemaan ja ei taideta ihan parin kympin coolereillakaan pärjätä noiden tehojen suhteen. Mutta jokainen joutuu itse päätöksensä tekemään, itse lähtisin mieluummin 2200G linjalle ja saa uuden alustan, takuunalaisen. Sekä saa niitä nykyajan ominaisuuksia (esim. M.2, USB3, Sata 3) ihan out of box. Vielä kun saisivat noita DDR4 hintoja alaspäin..

Paljonkohan tämä imutteli sitten virtaa jos tuo linkkaamasi veti jo 285W edestä :think:

Totuus: 450W rutku poweri ja 780ti :sidea:

hkultala · 20.03.2018

JiiPee sanoi:
En minä ole missään epäillyt että olisi intel-optimoinnit päällä käännetty ne softat, vaan olen koko ajan tarkoittanut sitä että Softan tekijät on menneet Intelin ehdoilla jo vuosia.

ja tässä olet väärässä vähintään 90% tapauksista.

Suurinta osaa koodista mitä ihmisten koneilla pyörii ole optimoitu edes GENEERISESTI JÄRKEVÄSTI. Niissä olisi saatavissa suuria parannuksia helpolla samalla koodimuutoksella KAIKILLA ALUSTOILLA.

Korkealla tasolla Intelille ja AMDlle toimii aivan samat optimoinnit.

Molemmille toimii ihan samat muistiinsijoittelusäännöt.

Hyvin pitkälle "Intelin ehdoilla meneminen" tuottaa myös AMDlle optimaalisen koodin. Se tuottaa ehkä Itaniumille tai Cortex A-53lle epäoptimaalisen koodin.

Ja ylivoimaisesti suurinta osaa softia ei optimoida (lähdekoodissa) niin pitkälle että mitään eroa tulisi.

Selvä ero voisi sitten tulla esim. siinä, miten vektorikäskykantoja käytetään.

Tosin käytännössä tässäkin tilanne on tyypillisesti se, että melko harvoissa softissa on kuitenkaan mitään vektori-intrinsiccejä alettu kirjoittelemaan käsin. Suurimmassa osassa softia kääntäjä autovektoroi muutaman loopin, mutta paljon jää vektoroimatta, kun koodari ei ole edes vaivautunut kirjoittamaan looppia sillä tavalla, että autovektoroija saisi sen vektoroida. (tai koska koodin tyyliopas käskee kirjoittamaan koodin sellaisella tavalla, että autovektoroija ei siihen pure)

jokumuu myös asiaan otti kantaa ja on hyvin linjassa siihen mitä kaveri on jutellut ja hän työkseen päivittäin koodaa. AMD:lle ei ole järkevää optimoida, kun ei rautaa ole juurikaan missään käytössä, mutta toki tilanne voi muuttua.
Virallinen: AMD vs Intel keskustelu- ja väittelyketju

Heillä koodataan ilmeisesti jotain suorituskykykriittistä palvelinkoodia.

Ja hänen mainitsemansa TSX ei toimi myöskään Intelin i5-prosessoreilla, ja AMDn vastine TSX:lle, ASF, ei ole tuettu yhdessäkään prosessorissa.

TSXn tukeminen ei kuitenkaan millään tavalla ole AMDltä pois.

Ja mikään the Stiltin käyttämistä 29 softasta ei ollut jokumuun firman koodaama.

AoTS on varsin oiva esimerkki juuri siitä että optimoinneilla on merkitystä. Minä sanoin että itse luotan cinebench lukuihin koska se näyttäisi olevan suhteellisen hyvin optimoitu molemmille, jonka sinä halusit ampua alas väittäen että ei ole hyvin optimoitu jolloin keskustelu ohjautui softaoptimointiin ja sen merkitykseen IPC:n.

AoTS on täysin erilainen tilanne kuin se, että geneerisesti optimoitua koodia käännetään geneerisillä kääntäjäoptioilla. Mistä tämä keskustelu lähti.

AoTS:ssä oli yritetty alkaa optimoimaan matalalla tasolla ja tehtykin pessimointeja ja mokattu homma sillä . Ylivoimaisesti suurinta osaa softista ei edes yritetä optimoida tällä tasolla.

Että nyt kaivat nuo The Stiltin koodit käyttämien softien lähdekoodit esille ja näytät sieltä ne Intel-spesifiset optimoinnit tai lopetat tuon höpöttämisen siitä kuinka ne muka on "intelille optimoituja".

ps. Softien listalta löytyy esim. C-ray joka on aivan järkyttävän kamalan huonosti kirjoitettua koodia jonka kamaluudesta kärsii intel vielä paljon enemmän kuin AMD, silmäilin joskus tuon lähdekoodin läpi.

Imgur

Deleted member 4604 · 20.03.2018

JiiPee sanoi:
Mistä se parannus sinun mielestäsi sitten tuohon kyseiseen "peliin" tuli jos ei optimoinnista?

Todennäköisesti enemmän tuossa on korjattu joku ongelma, kuin varsinaisesti optimoitu.
Veikkaisin että ovat pakottaneet tietyt tehtävät kiinteästi tietyille ytimille saman CCX:n sisällä (~25ns), jolloin vältytään CCX2CCX (120-160ns) penaltilta.

JiiPee · 20.03.2018

hkultala sanoi:
Että nyt kaivat nuo The Stiltin koodit käyttämien softien lähdekoodit esille ja näytät sieltä ne Intel-spesifiset optimoinnit tai lopetat tuon höpöttämisen siitä kuinka ne muka on "intelille optimoituja".

Okei. Koska sinä käsket minun lopettaa ja sinä yhdessä stiltin kanssa olette todennäköisesti planeetan ellei jopa koko universumin parhaita koodaaji joilla on aikaa räksyttää eri forumeilla kuinka hommat tulisi tehdä, niin onhan se uskottava!

Uskottava on myös se fakta että Intelin ja AMD:n prosessorit on täysin samanlaisia ja ihan sama miten niille koodia kirjoittaa niin ne toimii täysin opti maalisesti kunhan koodi on mennyt kääntäjästä läpi.

Ihan turha oli varmaan myös se AMD:n julkaisema KPTI pätsi linux kerneliin tuossa taannoin.

Eli lopulta pitää myös tunnustaa se fakta että Intel on vain yksinkertaisesti paljon parempi prosessori koska sillä kaikki pyörii niin paljon paremmin. Eiköhän tuo IPC ero ens kuussa ole jo 50% luokkaa Intelin hyväksi.

Jatkakaa.

jokumuu · 20.03.2018

hkultala sanoi:
Heillä koodataan ilmeisesti jotain suorituskykykriittistä palvelinkoodia.

Kyllä. Mm. mainitsemani cache coherency liittyy moniprosessorijärjestelmiin ja fence-käskyjen käyttöön, joissa AMD ei kyllä tuo itsestään parhaimpia puolia esiin. Fencet on AMD:llä monessa paikassa korvattu ihan vain syncillä, kun suorituskykyetu on ollut negatiivinen tai sitä ei ole ollut.

Cache coherency protocol liittyy ccNUMA arkkitehtuuriin ja niiden välisten cachejen synkronointiin. Protokolla pitää huolen, että CPU-cachet ovat synkassa, mutta se ei pidä huolta, että sisältö on järjestyksessä. Kun tehdään context switchejä, on mahdollista, että mennään datassa sekaisin, kun oletetussa positiossa olevat tavarat eivät olekaan siellä.

En valitsisi AMD:n prosessoria mihinkään tarkoitukseen, jossa suorituskykykriittisen prosessin säikeet jaetaan kahdelle eri CPU:lle. Riski huonoon suorituskykyyn - tai vakausongelmiin - on liian iso. En tosin ole testannut EPYCillä, mutta riskit on olemassa, etenkin kun arkkitehtuuri on vähän liimatun oloinen.

Ja hänen mainitsemansa TSX ei toimi myöskään Intelin i5-prosessoreilla, ja AMDn vastine TSX:lle, ASF, ei ole tuettu yhdessäkään prosessorissa.

TSXn tukeminen ei kuitenkaan millään tavalla ole AMDltä pois.

Kummatkin, sekä Intel i5-tuen puute, sekä AMD:n täysi välinpitämättömyys ovat todella outoja päätöksiä. TSX on yksi merkittävimmistä kehityksistä transaktiohallinnassa pitkään aikaan. TSX:stä hyötyy massiivisesti oikeastaan mikä tahansa useampaan säikeeseen skaalautuva sovellus, jonka pitää ottaa lukkoja.
Näkisin, että esim. monet pelit varmasti hyötyisivät tästä merkittävästi, mutta kun alustatuki on vajavainen, niin eipä sitä kannata tehdä, työmäärä kun käytännössä tuplaantuu (uusi ja vanha erikseen).

TeroP · 20.03.2018

JiiPee sanoi:
Okei. Koska sinä käsket minun lopettaa ja sinä yhdessä stiltin kanssa olette todennäköisesti planeetan ellei jopa koko universumin parhaita koodaaji joilla on aikaa räksyttää eri forumeilla kuinka hommat tulisi tehdä, niin onhan se uskottava!

Uskottava on myös se fakta että Intelin ja AMD:n prosessorit on täysin samanlaisia ja ihan sama miten niille koodia kirjoittaa niin ne toimii täysin opti maalisesti kunhan koodi on mennyt kääntäjästä läpi.

Valitettavasti se, että hkultala ja the stilt näyttäisivät tietävän asiat paljon paremmin kuin moni muu tällä foorumilla ja vielä perustellusti, ei tee heistä räksyttäjiä. Jos sitä räksyttäjää pitää etsiä, niin kannattaisikohan ehkä katsoa peiliin, varsinkin kun argumenttien loppuessa mentiin henkilökohtaisuuksiin. The Stilt esitti testituloksia, joita sinä rupesit kyseenalaistamaan vaikka minkälaisilla mutuiluilla.

hkultala · 20.03.2018

JiiPee sanoi:
Okei. Koska sinä käsket minun lopettaa ja sinä yhdessä stiltin kanssa olette todennäköisesti planeetan ellei jopa koko universumin parhaita koodaaji joilla on aikaa räksyttää eri forumeilla kuinka hommat tulisi tehdä, niin onhan se uskottava!

Uskottava on myös se fakta että Intelin ja AMD:n prosessorit on täysin samanlaisia ja ihan sama miten niille koodia kirjoittaa niin ne toimii täysin opti maalisesti kunhan koodi on mennyt kääntäjästä läpi.

Ihan turha oli varmaan myös se AMD:n julkaisema KPTI pätsi linux kerneliin tuossa taannoin.

Eli lopulta pitää myös tunnustaa se fakta että Intel on vain yksinkertaisesti paljon parempi prosessori koska sillä kaikki pyörii niin paljon paremmin. Eiköhän tuo IPC ero ens kuussa ole jo 50% luokkaa Intelin hyväksi.

Jatkakaa.

Noniin, sen sijaan, että olisit kaivanut ne mainittujen softien lähdekoodit esille ja alkanut näyttää niistä niitä intel-optimoituja paikkoja esille, aloit uhriutua ja vetää aivan naurettavia olkiukkoja esille.

Virallinen: AMD vs Intel keskustelu- ja väittelyketju

Deleted member 4604

Vieras (tunnus poistettu)

R♿ T Virallinen™ Autisti

Deleted member 4604

Vieras (tunnus poistettu)

Deleted member 4604

Vieras (tunnus poistettu)

Deleted member 4604

Vieras (tunnus poistettu)

Apua, avatarini on sormi!

Deleted member 4604

Vieras (tunnus poistettu)

Deleted member 4604

Vieras (tunnus poistettu)

Apua, avatarini on sormi!

System Specialist

Apua, avatarini on sormi!

Last Man Standing

Apua, avatarini on sormi!

Deleted member 4604

Vieras (tunnus poistettu)

Deleted member 4604

Vieras (tunnus poistettu)

Official Ässrock advocate R♿T #46

Deleted member 4604

Vieras (tunnus poistettu)

Uutiset

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi