Tekoäly

Se mitä lyhyellä aikavälillä haetaan on Super Human Intelligence ja tämä kohdistettuna erilaisiin niche sovelluksiin missä AI toimii ihmisen apurina. Koodiavustin, tekstin summarointi, kuvanluonti, lakiavustin, ai-tukibotti, matematiikan laskeminen, kielestä toiseen kääntäminen jne. Osassa näistä voisi väittää että SHI toteutui jo 2025 aikana jos mittarina käytetään 99.9% ihmisistä eikä sitä kourallista jotka ovat miljardeista ihmisistä parhaat. AI:lle triviaalia laskea laajan matematiikan yo-kokeen tehtävät, suurin osa ihmisistä no can do jos aikaa päivä työkaluina maol, kynä, paperi, peruslaskukone. Otetaan random 100 ihmistä kun kävelee citymarkettiin ekana aamusta sisään ja koepaperit nenäneteen.

AGI ei ole millään tavalla relevantti lyhyellä tähtäimellä kun SHI tyyliset järjestelmät on se mistä saadaan käytännön hyödyt.
Eikö AGI:n idea ole se, että se tekee vaivattomasti saman, mitä unioni noista kaikista sovelluskohtaisista sovelluksista tekee. Siis samaan tyyliin, mitä J.A.R.V.I.S. Ironman elokuvissa.
 
Eikö AGI:n idea ole se, että se tekee vaivattomasti saman, mitä unioni noista kaikista sovelluskohtaisista sovelluksista tekee. Siis samaan tyyliin, mitä J.A.R.V.I.S. Ironman elokuvissa.
AGI määritelty yleensä keinotekoisena älynä. Moni ajattelee, että AGI olisi kuten ihminen. Tiedostaa itsensä, osaa toimia itsenäisesti, omaa omia päämääriä, oppii dynaamisesti kokemuksen ja ajattelutyön pohjalta, osaa ratkaista aikaisemmin näkemättömiä ongelmia jne. Singulariteetti AGI joka parantaa itse itseänsä. Johtaa siihen että keinoäly muodostuu(fysiikan rajojen salliessa) äärettömän älykkääksi ja ihminen jää nielemään pölyä.

Super Human Intelligence taas voi olla kuin laskukone. Osaa ratkoa sen nichen tehtäviä kuten matematiikkaa mihin SHI kehitetty. Ei tiedosta itseänsä, tekee vain sen mitä pyydetään.

Keinoäly voi osata tehdä paljonkin erilaisia taskeja ilman että se olisi AGI. Esim pelata shakkia/go paremmin kuin yksikään ihminen, laskea matematiikkaa paremmin kuin 99.9% ihmisistä jne.
 
Onhan noita putiikkeja jotka yrittävät tehdä AGI:ta. Moni uskoo, että AGI on loppujen lopuksi hyvin yksinkertainen toteuttaa, mutta ei tiedetä miten. Esim. john carmack pyörittää pientä puljua missä kovia tyyppejä ja yrittävät vain AGI:ta


Se mitä lyhyellä aikavälillä haetaan on Super Human Intelligence ja tämä kohdistettuna erilaisiin niche sovelluksiin missä AI toimii ihmisen apurina. Koodiavustin, tekstin summarointi, kuvanluonti, lakiavustin, ai-tukibotti, matematiikan laskeminen, kielestä toiseen kääntäminen jne. Osassa näistä voisi väittää että SHI toteutui jo 2025 aikana jos mittarina käytetään 99.9% ihmisistä eikä sitä kourallista jotka ovat miljardeista ihmisistä parhaat. AI:lle triviaalia laskea laajan matematiikan yo-kokeen tehtävät, suurin osa ihmisistä no can do jos aikaa päivä työkaluina maol, kynä, paperi, peruslaskukone. Otetaan random 100 ihmistä kun kävelee citymarkettiin ekana aamusta sisään ja koepaperit nenäneteen.

AGI ei ole millään tavalla relevantti lyhyellä tähtäimellä kun SHI tyyliset järjestelmät on se mistä saadaan käytännön hyödyt.
Entä sitten kun työkaluina on koko internet ja kaikki kirjat? Aika vähän on yo-koe kysymyksiä joihin ei löydy netistä ainakin osittaisia vastauksia.

Aika heikosti llm-pohjaisilla tekoälyillä menee kun otetaan koulutusmateriaalista radikaalisti poikkeavia tehtäviä. Itse asiassa llm ei varsinaisesti edes täysin ymmärrä perusalgebran laskusääntöjä.
 
Entä sitten kun työkaluina on koko internet ja kaikki kirjat? Aika vähän on yo-koe kysymyksiä joihin ei löydy netistä ainakin osittaisia vastauksia.
Eikö tää ole jo keskuseltu? Sekä openai että googlen puhdas LLM ilman työkaluja otti kultaan oikeuttavat pisteet 2025 IMO:ssa(ínternational math olympiad). Olivat ajossa samaan aikaan kuin IMO pidettiin joten ei voitu oltu treenata noita kokeessa esiintyneillä kysymyksillä. Koneille päti myös samat säännöt kuin ihmisille eikä autettu tehtävänantojen kanssa toisin kuin 2024 vuonna. Linkit näihin varmaan x-kertaa jo ketjussa, en kaiva uusiksi. Matemaatikoista esim. terence tao vaihtoi mielipidettä llm:sta matematiikassa 2025 IMO:n jälkeen.

Moniko tältä palstalta ottaisi 2025 IMO:sta kultaan oikeuttavat pisteet, ei edes tiiminä,... IMO hyvä mittari kun ei riitä että vastaus on X, pitää generoida todistus vastaukselle.

Voit heitellä vaikka ens keväänä reaaliajassa laajan matikan kysymykset openai:n pro versioon ja en usko että jää ratkeamatta, todnak. se perus 20e/kk versiokin ratkoo.
 
Eikö tää ole jo keskuseltu? Sekä openai että googlen puhdas LLM ilman työkaluja otti kultaan oikeuttavat pisteet 2025 IMO:ssa(ínternational math olympiad). Olivat ajossa samaan aikaan kuin IMO pidettiin joten ei voitu oltu treenata noita kokeessa esiintyneillä kysymyksillä. Koneille päti myös samat säännöt kuin ihmisille eikä autettu tehtävänantojen kanssa toisin kuin 2024 vuonna. Linkit näihin varmaan x-kertaa jo ketjussa, en kaiva uusiksi. Matemaatikoista esim. terence tao vaihtoi mielipidettä llm:sta matematiikassa 2025 IMO:n jälkeen.

Moniko tältä palstalta ottaisi 2025 IMO:sta kultaan oikeuttavat pisteet, ei edes tiiminä,...

Voit heitellä vaikka ens keväänä reaaliajassa laajan matikan kysymykset openai:n pro versioon ja en usko että jää ratkeamatta, todnak. se perus 20e/kk versiokin ratkoo.
Voisi kuvitella jos LLM on niin loistava matematiikassa sillä olisi todistettu jotain ratkaisemattomia ongelmia. Aika hiljaista on vain sillä saralla ollut.
 
Voisi kuvitella jos LLM on niin loistava matematiikassa sillä olisi todistettu jotain ratkaisemattomia ongelmia. Aika hiljaista on vain sillä saralla ollut.
Mun väite oli allaoleva
2025 aikana jos mittarina käytetään 99.9% ihmisistä eikä sitä kourallista jotka ovat miljardeista ihmisistä parhaat.

Hyvä proxy 1:1000:sta vaikka juurikin IMO tai ylioppilaskokeen laaja matikka. katsotaan jotain 1:1000000 tai 1:1000000000 5v päästä eli 2031 tai vaikka 2035.
 
Mun väite oli. ts. 1/1000:een. Hyvä proxy 1:1000:sta vaikka juurikin IMO tai ylioppilaskokeen laaja matikka. katsotaan jotain 1:1000000 tai 1:1000000000 5v päästä eli 2031 tms.
Entä sitten? On turha vertailla oppilaiden suoriutumista yo-kokeissa LLM:ään jolla on käytössä käytännössä kaikki julkaistu materiaali. Suurin osa yo-kirjoitusten tekijöistä saisivat täydet pisteet jos saisivat kokeen aikana käyttää Googlea ja kaikkia kurssikirjoja.
 
Entä sitten? On turha vertailla oppilaiden suoriutumista yo-kokeissa LLM:ään jolla on käytössä käytännössä kaikki julkaistu materiaali. Suurin osa yo-kirjoitusten tekijöistä saisivat täydet pisteet jos saisivat kokeen aikana käyttää Googlea ja kaikkia kurssikirjoja.
Edelleen 2025 IMO materiaali ei ollut opetusdatassa kun llm:t osallistuivat samaan aikaan kisaan kuin ihmiset ja samat säännöt kuin ihmisille. Voit tän myös omakohtaisesti testata vaikka reaaliajassa 2026 kevään ylioppilaskokeen tehtävillä.

Huomionarvoista ettei llm:lla ollut työkalut käytössä. Pärjäävät vielä paremmin jos kytköstää llm:aan kiinni pythonin/matlab:in/wolfram alphan/... llm voi käyttää työkaluja siinä missä ihminenkin.
 
Edelleen 2025 IMO materiaali ei ollut opetusdatassa kun llm:t osallistuivat samaan aikaan kisaan kuin ihmiset ja samat säännöt kuin ihmisille. Voit tän myös omakohtaisesti testata vaikka reaaliajassa 2026 kevään ylioppilaskokeen tehtävillä.
Vaikka aivan sama materiaali ei ollut opetusdatassa, niin ainakin osittain vastaavia tehtäviä aivan varmasti löytyi koulutusdatasta. Tämän vuoksi todellista suorituskykyä mittaavien benchmarkkien luominen on erittäin vaikeaa.
 
Vaikka aivan sama materiaali ei ollut opetusdatassa, niin ainakin osittain vastaavia tehtäviä aivan varmasti löytyi koulutusdatasta. Tämän vuoksi todellista suorituskykyä mittaavien benchmarkkien luominen on erittäin vaikeaa.
Ihminenkin käyttää ihan samalla lailla opetusdataa. Arvelen että jää 12*12 laskematta ihmisellä joka ei ole koskaan opetellut matematiikkaan saati sitten laajan matematiikoan yo-koe. Voi pelkkä nollan käsitekin olla aika vaikea. Sama asia jos kysyt että kuka oli suomen ensimmäinen presidentti tai milloin suomi sai itsenäisyyden. Ihminenkin joutuu opettelemaan eikä tiedä kovinkaan paljoa ilman sisäänajettua opetusdataa.

Ajatusleikkejä voi heitellä, mutta todellinen maailma etenee omalla tavallansa vaikka kuinka ottaisi pattiin että väärin tehty.
 
Viimeksi muokattu:
Niinno mikä sitten on se "todellinen suorituskyky"? Ei ihmiset mene koulun testiin ja siellä onkin kyssäreinä yhtäkkiä jotain ihan muuta, kyllä niitä vastaavia ongelmia treenataan ennen testiä.

Se on kyllä totta että noi ai testit on usein aika turhia, pienikin malli voidaan kouluttaa extra hyväksi minkälaisia testejä varten vaan mutta sitten tosielämässä se malli ei pärjää huomattavasti isommalle mallille mitenkään kun siihen mahtuu paljon enemmän dataa sisään mistä voi soveltaa asioita jotta ongelmat ratkeaa.
 
Artikkelissa teknologia-alan merkkihenkilöiden näkemyksiä työn tulevaisuudesta pitkällä aikavälillä. Lyhyellä aikavälillä varmasti kohdataan tuskaa. Artikkelissa myös muskin, altmanin, huangin, amodein jne. näkemykset
Bill Gates said humans will reserve some tasks for themselves, but AI will make it possible to consider once-unthinkable changes, such as a two- or three-day workweek.

"In terms of making things, and moving things, and growing food over time, those will be basically solved problems," Gates told late-night host Jimmy Fallon in February.
Deep mindin hassabis
"We've got to make sure it gets distributed fairly, but that's more of a political question," Hassabis told The Guardian in August. "And if it is, we should be in an amazing world of abundance for maybe the first time in human history, where things don't have to be zero sum. And if that works, we should be travelling to the stars, really."
 
Axiom tekee AI matemaatikkoa missä pohjalla AI ja Lean-oikeudentodistusjärjestelmä.
Axiom's mission is to build a self-improving superintelligent reasoner, starting with an AI mathematician.

Axiom pärjäsi todella hyvin joulukuussa 2025 järjestetyssä putnam matematiikkakilpailussa. Järjestelmä toki menestyksestään huolimatta vielä ihan alkuvaiheessa, mutta jostain tänkaltaisesta voi kuvitella tulevan hyvän kaverin matemaatikoille.

Axiomin ai-työkalu ratkaisi aikarajan puitteissa 8/12 kysymystä ja yhdeksännen hieman kilpailun loppumisen jälkeen. Tuo tulos on yleensä top 3:ssa, eli erittäin kova suoritus.
1767527196033.png

The William Lowell Putnam Mathematical Competition® (the Putnam) is the preeminent mathematics competition for undergraduate college students in the United States, Canada, and Mexico.

Kuinka vaikea kisa,...
The competition is considered to be very difficult: it is typically attempted by students specializing in mathematics, but the median score is usually zero or one point out of 120 possible, and there have been only five perfect scores as of 2021 Putnam Competition - Wikipedia
 
Terence Tao ottaa kantaa AI:n käyttämiseen tieteessä(etenkin matematiikka). Puhuu myös mitä viimeaikaiset AI:n pärjäämiset eri matematiikkakilpailuissa merkitsevät. Isoin juttu on, että vuosi sitten TAO piti AI:ta turhana, nyt se on jo hyvä apuri ja uskoa että auttaa ihmistutkijaa nyt ja tulevaisuudessa. Puhuu myös LEAN tyylisistä AI/koneavusteisista todistustyökaluista joita on olemassa ja joita on työn alla "still a bit clunky" mutta paranevat nopeasti.
🔹 How AI can generate massive volumes of ideas, examples, and insights
🔹 Why humans still excel at abstraction, intuition, and generalisation
🔹 The emerging workflows where AI explores and humans refine
🔹 What comes after benchmarks, and why usability is the next frontier
🔹 A hopeful future where human creativity + AI scale reshapes research
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Linkki: https://www.youtube.com/watch?v=AkXnZr3p4A8
 

Statistiikka

Viestiketjuista
296 873
Viestejä
5 066 844
Jäsenet
81 226
Uusin jäsen
ProtoWilliam

Hinta.fi

Back
Ylös Bottom