NVIDIA päivitti tekoälypuolen roadmapin: tänä vuonna Rubin, 2028 Feynman

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
24 898
NVIDIAn viime syksynä julkistama Rubin CPX on siirtynyt vähin äänin takavasemmalle ja sen sijasta roadmapissa nähtiin Groqilta peräisin olevia LPU- eli Language Processing Unit -piirejä.
nvidia-datacenter-roadmap-20260319.jpg

NVIDIA on esitellyt GTC 2026 -tapahtumassaan palvelinpuolen uutta roadmappia, johon kuuluu yhtiön nahkatakkista toimitusjohtaja Jensen Huangia lainaten ennennäkemättömiä piirejä. Lausahdus pitää paikkansa, mutta sen toteuttaminen on vaatinut myös tilan tekemistä jo julkistetun piirin muodossa.

NVIDIA julkisti viime syksynä uuden Rubin CPX -piirin, jonka oli tarkoitus tarjota järeämpien Rubin-kiihdytinpiirien rinnalla tehokasta suorituskykyä päättelytehtäviin. Nyt piiri on kadonnut suunnitelmista kuin kuppa töölöstä ja tilalla komeilee Groqin kehittämiä LPU- eli Language Processing Unit -piirejä.

NVIDIAn uuden sukupolven kiihdytinpiirien tähti on luonnollisesti Rubin-laskentapiiri HBM4-muistien kera. Piiri tullaan päivittämään kahden sirun tuplattuun malliin eli Rubin Ultraan ja HBM4e-muisteihin myöhemmin tänä tai viimeistään ensi vuonna. Rubinin rinnalla toimii Groq:n LP30 LPU ja se päivittyy myöhemmin LP35-versioon, johon on lisätty tuki NVFP4-tarkkuudelle. Prosessoritehtäviä piirien rinnalla hoitaa Vera-prosessori.

Verkkotehtäviä NVIDIA julkaisee BlueField-4 DPU- eli Data Processing Unit -piirin ja NVLink 6 Switch -kytkimen, joka tarjoaa kaistaa jopa 3,6 Gt/s. Se päivittyy myöhemmin NVLink 7 Switch -versioon, jonka erot edeltäjäänsä jäävät vielä kysymysmerkiksi, sillä kaistaa luvataan saman verran. Ethernet-yhteyksiä tarjoillaan uuden Spectrum6:n ja ConnectX 9:n voimin.

Vuonna 2028 NVIDIA aikoo julkaista puolestaan uuden Feynman-arkkitehtuurin, joka aikoo vaihtaa paketointimallia piirit päällekkäin pinoavaan malliin. Käytössä tulee olemaan roadmapin mukaan kustomoitu HBM-ratkaisu. Sen rinnalle tulee Groq-peräinen LP40-kiihdytin, joka saa uutena NVLink-tuen, sekä uusi Rosa-prosessori. Feynman-sukupolven verkkopuolelle luvassa on BlueField-5 DPU, optisia linkkejä tukevat NVLink 8 ja Spectrum7. Verkkokorttien puolelle saadaan odotetusti ConnectX 10.

Lähde: Tom’s Hardware
 
CPX piirin poistaminen roadmapista voi sataa pelaajien laariin. CPX:n spekseissä seisoi, että per piiri 128GB gddr7-muistia. Groq:in lpu ei käytä perinteistä keskusmuistia vaan per piiri 500MB sram:ia ja laskenta piiriensisäisessä muistissa. LPU pömpelissä 256LPU:ta joista kasataan kokonaisuus kiihdyttimeksi missä 128GB muistia.

Ehkä cpx:aan varattu gddr7 piirituotanto saadaan siirrettyä pelipuolen muisteihin. Ehkä kryptinen "Loppuvuodesta tilanne pelipuolella voi helpottua" lausunto nvidialta liittyy juurikin cpx:n perumisesta vapautuviin gddr7 muisteihin?

Jensen puhui samassa keynotessa, että 2025,2026,2027 yhteenlaskettu liikevaihto menee biljoonaan. Biljoonaan ei ole laskettu mukaan cpu, lpu yms. bisneksiä. Jensen sanoi, että LPU voi olla jopa neljänneksen lisäys konesalibisnekseen. Itsenäisen CPU bisneksen kooksi nvidia arvioi muutamia miljardeja.

Nvidian kiinalaiset asiakkaat saaneet ostolisenssejä ja h200 tuotanto käynnistetty. Nvidia gets Beijing's nod for H200 chip sales, adapts Groq chip for China, sources say
 
Viimeksi muokattu:
Heh, menipä sekaisin Groq ja Grok. Ihmettelin että mikäs sekametelisoppa tuosta nyt tulossa, mutta ovat tosiaan kaksi täysin eri firmaa. Groq on perustettu kuitenkin jo vuonna 2016. Groq itse asiassa pyytänyt Elon Muskin xAI:ta vaihtamaan Grokia poikkeavampaan nimeen sekaannusten välttämiseksi. Sen verran yhteistä toki, että xAI tilannut Nvidialta jäätävän määrän tekoälypiirejä datakeskuksiaan varten ja jatkossa siis Grokia voi olla pyörittämässä Groqin piirit... ;)
 
Heh, menipä sekaisin Groq ja Grok. Ihmettelin että mikäs sekametelisoppa tuosta nyt tulossa, mutta ovat tosiaan kaksi täysin eri firmaa. Groq on perustettu kuitenkin jo vuonna 2016. Groq itse asiassa pyytänyt Elon Muskin xAI:ta vaihtamaan Grokia poikkeavampaan nimeen sekaannusten välttämiseksi. Sen verran yhteistä toki, että xAI tilannut Nvidialta jäätävän määrän tekoälypiirejä datakeskuksiaan varten ja jatkossa siis Grokia voi olla pyörittämässä Groqin piirit... ;)
Sekin jännä että groq:in perustaja tyyppi joka teki googlella ensimmäisen tpu:n. Nvidia palkkasi groq:in perustajan ja noin 400 Groq:in työntekijää 20 miljardin diilissä.
 

Statistiikka

Viestiketjuista
303 141
Viestejä
5 159 230
Jäsenet
82 300
Uusin jäsen
AKV

Hinta.fi

Back
Ylös Bottom