AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

Joo samoja fiiliksiä täällä. Mitähän ai sanoo jos kirjoitat 2 sääntöä joiden sisältö ovat ristiriidassa toistensa kanssa.
Saman kuin juniori ihminenkin, "wtf" ja tapahtuu mystisiä asioita. Oli sitten AI tai juniori niin saa parempaa ulos hyvillä ohjeilla versus jos ei anna ohjeita tai antaa ristiriitaisia ohjeita.

Itselläni sellainen kokemus, että Cursorissa ainakin unohtaa vähän väliä vaikka olisikin sääntöjä laatinut. Tarkkana saa olla.
Riippuu paljon käytetystä kielimallista miten hyvin noudattaa ohjeita. Uusin claude sonnet max versiona imho parhain. Eihän nuo täydellisiä ole, mutta heittävät vähemmän noppaa jos jaksaa kirjoitella paremmat ohjeet(agents.md) ja dokumentaation koodin sekaan.
 
Lieköhän Windsurf kuolee hiljalleen pois? cursor ja claude code lienevät suositumpia. Itse en ole hetkeen käyttänyt Windsurfia kun CC on niin paljon parempi. Uusin versio Claude Codesta toimii myös natiivisti Windowsissa!
 
Saman kuin juniori ihminenkin, "wtf" ja tapahtuu mystisiä asioita. Oli sitten AI tai juniori niin saa parempaa ulos hyvillä ohjeilla versus jos ei anna ohjeita tai antaa ristiriitaisia ohjeita.


Riippuu paljon käytetystä kielimallista miten hyvin noudattaa ohjeita. Uusin claude sonnet max versiona imho parhain. Eihän nuo täydellisiä ole, mutta heittävät vähemmän noppaa jos jaksaa kirjoitella paremmat ohjeet(agents.md) ja dokumentaation koodin sekaan.
Maxia taisin 3.7 sonnetin kanssa kokeilla vielä kun kuului kk tilaukseen. Silloin en vielä ollut noita sääntöjä niin paljon käyttänyt.

Joku taisi tässä ketjussa mainita, että kannattaa käyttää parasta mallia ja siinä kyllä olen tullut samaan lopputulokseen. Suoraan parhaalla mikä itsellä käytössä niin säästää aikaa ja hermoja.
 
Lieköhän Windsurf kuolee hiljalleen pois? cursor ja claude code lienevät suositumpia. Itse en ole hetkeen käyttänyt Windsurfia kun CC on niin paljon parempi. Uusin versio Claude Codesta toimii myös natiivisti Windowsissa!
Kyllähän tuosta systeemistä jäi sellainen kuva, että johto rahasti itsensä ulos acquisition hire+lisensoinnin kautta ja windsurf jäi "support" moodin. Ajan kanssa google tehnee itse paremman ai-koodaustyökalun. Windsurf näivettyy marginaaliin jos poislähteneet tyypit oli kriittisiä toiminnan kannalta.

En kyllä usko, että cursor ai:kaan pidemmän päälle jää eloon erillisenä yrityksenä ellei sitten amazon/anthropic osta osuutta/kokonaan cursor ai:sya. Varmaan foundation model firmojen omat avustimet se mikä voittaa. Vaikea 3rdparty firmana kilpailla kun pitää maksaa google/anthropic/openai jengille per token ja sitä kautta voitollisen palvelun hinta väistämättä oltava kovempi kuin google/anthropic/openai oma avustin.

Koodausavustimia on enemmän kuin sieniä sateella niin jossain kohtaa on tultava jonkinlainen pudotus ja konsolidaatiokierros.
 
Kyllä, veikkaan itsekin vahvasti sitä, että mallien omistajat ovat ne, jotka hommaa loppupelissä määräävät.
 
Enemmän matemaattinen kuin koodausongelma mutta jos joku haluaa koittaa vaikka Grok v4:sta
"can you calculate Approximate inverse function for Pt100 RTD (IEC 751) from resistance to temperature. 5th order polynomial equation for -200 to 0cel range with 0.001cel precision"

Grok v3 hallusinoi jotkut kertoimet joiden väittää olevan oikein, virhettä kuitenkin helvetisti, tarkistuslaskentaa pyydettäessä huomaa virheen, yrittää laskea uudet kertoimet jotka eivät ole sen paremmat.
Deepseekin kanssa sama homma paitsi että se feikkaa tai ei osaa edes pluslaskua tarkistuslaskussa, deepthought moodissa yrittää monikertaan ja huomaa aina laskevansa jotain väärin. lopulta antaa jotkut netistä löytyneet kertoimet jotka sinällään ok.
Chatgpt laskee toimivat kertoimet ja osaa tarkistaa/validoida ne pyydettäessä.
 
Taitaa olla kielimalleille tyypillistä se hassu juttu, että osaavat paremmin kertoa miten joku laskenta tehdään, vaikka koodina, kuin varsinaisesti suorittaa monimutkaisia laskuja varsinaisilla numeroilla.
 
Taitaa olla kielimalleille tyypillistä se hassu juttu, että osaavat paremmin kertoa miten joku laskenta tehdään, vaikka koodina, kuin varsinaisesti suorittaa monimutkaisia laskuja varsinaisilla numeroilla.
Piti paikkansa viime viikkoon asti, International math olympiadissa googlen keinoälylle virallinen kultamitali ja openai:lle epävirallinen kultamitali. Molemmat llm pohjaisia, ei työkalujenkäyttöä, ei internettiä, ei helpotuksia ja samat säännöt kuin ihmisille. Kisat järjestetty 1959 vuodesta alkaen, osallistujia yli sadasta maasta ja alle 10% osallistujista saa kultamitaliin oikeuttavat pisteet.

Google aikoo integroida tuon matematiikkajutun ultra-tason llm-palveluunsa. Varmaan 6kk-12kk sisään hyppää kielimallien laatu ylöspäin kun matematiikkapuolen järkeilyasiat generalisoidaan ja tuodaan tarjolle openai ja google palveluissa.
researchers behind OpenAI and Google’s IMO efforts claimed that these gold-medal performances represent breakthroughs around AI reasoning models in non-verifiable domains.

1753241243277.png
 
Viimeksi muokattu:
Nuo matematiikkaolympialaisten tehtävät ei pääsääntöisesti olekaan laskemista numeroilla vaan erilaisia todistus ja päättelytehtäviä, joihin vastaaminen ei edellytä mitään numerolaskuja. Tai näin ainakin noihin harjoittelevien tehtävät Suomessa ja taitaa ne tehtävät olla usein noista eri kisoista otettu.
 
Nuo matematiikkaolympialaisten tehtävät ei pääsääntöisesti olekaan laskemista numeroilla vaan erilaisia todistus ja päättelytehtäviä, joihin vastaaminen ei edellytä mitään numerolaskuja. Tai näin ainakin noihin harjoittelevien tehtävät Suomessa ja taitaa ne tehtävät olla usein noista eri kisoista otettu.
Matematiikkaolympialaisten tehtäviä pidetty erittäin vaikeina llm:lle kun pitäisi ymmärtää sanallinen tehtävänanto ja todistaa tuloksen oikeellisuus. Vastaus ei ole numero tms. jonka keinoälylle voisi helposti opettaa esm. reinforcement learninging avulla. Terence Tao(yksi tän ajan kovimmista matemaatikoista) ennusti kesäkuussa huonoa menestystä llm:lle IMO:ssa(IMO=kisa missä openai ja googlen ai otti kultamitalipisteet).
In June, Tao predicted on Lex Fridman's podcast that AI would not score high on the IMO. He suggested researchers shoot a bit lower. "There are smaller competitions. There are competitions where the answer is a number rather than a long-form proof," he said.

IMO tulokset puhtailla llm:lla. Saadaan nuo uudet llm:t käyttöön lähitulevaisuudessa + työkalut niihin päälle niin puhutaan todella kovanluokan matematiikan osaamisesta konemallissa. Työkalujen käyttämisessä ei ole mitään pahaa, käyttäähän ihminenkin kynää, paperia, laskukonetta, matlab:ia,...

Yksi merkittävä kulma IMO kisassa pärjänneissä llm:ssa, että llm pystyy hallusinoimatta ajattelemaan pitkään. Toivottavasti samankaltaista hallusinoimatonta pitkää ajattelua saadaan sovellettua koodausagentteihin tulevaisuudessa. Ainakin openai:n blogipostaus + twitter viestit antavat olettaa, että periaate IMO:ssa pärjänneessä kielimallissa on siirrettävissä muihinkin kuin matemaattisiin taskeihin.
"IMO problems demand a new level of sustained creative thinking compared to past benchmarks," he said. "This model thinks for a long time."
 
Viimeksi muokattu:
Onko jotain claude coden tyyppistä toolsettiä joka toimisi lokaalien mallien kanssa?

Asian hakeminen hakukoneilla todistaa aika hyvin miten AI slop on tuhonnut internetin. Helvetti miten paljon paskaa löytyy...
 
Onko jotain claude coden tyyppistä toolsettiä joka toimisi lokaalien mallien kanssa?

Asian hakeminen hakukoneilla todistaa aika hyvin miten AI slop on tuhonnut internetin. Helvetti miten paljon paskaa löytyy...
On, mutta lokaalit mallit ainakin mun kokemuksen pohjalta suoltaa silkkaa paskaa ellei kysymys ole joku leetcode pulma tai vaikka quicksort algoritmi joka on ollut opetussetissä mukana. Mä olen testannut aider:ia ja jotain vscode plugareita. Nvidialla blogipostaus asiasta
How to Run Coding Assistants for Free on RTX AI PCs and Workstations
 
Eiköhän se googgeli oo rahan himoissaan tuhonnut netin haut. Ainakin omalta osaltaan. Ei sieltä oo pitkään mitään järkevää löytänyt.
 
Eiköhän se googgeli oo rahan himoissaan tuhonnut netin haut. Ainakin omalta osaltaan. Ei sieltä oo pitkään mitään järkevää löytänyt.
Ei ole, vaan AI generoitu roska joka päätyy hakukoneiden indeksointeihin ja nyt uusimpana asioista mitään ymmärtävien kirjoittelut redditissä kun yrittävät tehdä asioita AI työkaluilla.
On, mutta lokaalit mallit ainakin mun kokemuksen pohjalta suoltaa silkkaa paskaa ellei kysymys ole joku leetcode pulma tai vaikka quicksort algoritmi joka on ollut opetussetissä mukana. Mä olen testannut aider:ia ja jotain vscode plugareita. Nvidialla blogipostaus asiasta

Tarkoitus onkin kokeilla toimivatko pienten ja spesifien ongelmien kanssa
 
Saman ilmiön huomaa usein niinkin, että tekoäly tekee ihan oikean koodin johonkin hommaan mutta kun pyytää laskemaan esimerkkitapauksen (esim testin tekoa varten) niin se tulos saattaa olla ihan päin mäntyä.
 

Statistiikka

Viestiketjuista
282 639
Viestejä
4 852 853
Jäsenet
78 453
Uusin jäsen
Oravankarva

Hinta.fi

Back
Ylös Bottom