AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

Joo samoja fiiliksiä täällä. Mitähän ai sanoo jos kirjoitat 2 sääntöä joiden sisältö ovat ristiriidassa toistensa kanssa.
Saman kuin juniori ihminenkin, "wtf" ja tapahtuu mystisiä asioita. Oli sitten AI tai juniori niin saa parempaa ulos hyvillä ohjeilla versus jos ei anna ohjeita tai antaa ristiriitaisia ohjeita.

Itselläni sellainen kokemus, että Cursorissa ainakin unohtaa vähän väliä vaikka olisikin sääntöjä laatinut. Tarkkana saa olla.
Riippuu paljon käytetystä kielimallista miten hyvin noudattaa ohjeita. Uusin claude sonnet max versiona imho parhain. Eihän nuo täydellisiä ole, mutta heittävät vähemmän noppaa jos jaksaa kirjoitella paremmat ohjeet(agents.md) ja dokumentaation koodin sekaan.
 
Lieköhän Windsurf kuolee hiljalleen pois? cursor ja claude code lienevät suositumpia. Itse en ole hetkeen käyttänyt Windsurfia kun CC on niin paljon parempi. Uusin versio Claude Codesta toimii myös natiivisti Windowsissa!
 
Saman kuin juniori ihminenkin, "wtf" ja tapahtuu mystisiä asioita. Oli sitten AI tai juniori niin saa parempaa ulos hyvillä ohjeilla versus jos ei anna ohjeita tai antaa ristiriitaisia ohjeita.


Riippuu paljon käytetystä kielimallista miten hyvin noudattaa ohjeita. Uusin claude sonnet max versiona imho parhain. Eihän nuo täydellisiä ole, mutta heittävät vähemmän noppaa jos jaksaa kirjoitella paremmat ohjeet(agents.md) ja dokumentaation koodin sekaan.
Maxia taisin 3.7 sonnetin kanssa kokeilla vielä kun kuului kk tilaukseen. Silloin en vielä ollut noita sääntöjä niin paljon käyttänyt.

Joku taisi tässä ketjussa mainita, että kannattaa käyttää parasta mallia ja siinä kyllä olen tullut samaan lopputulokseen. Suoraan parhaalla mikä itsellä käytössä niin säästää aikaa ja hermoja.
 
Lieköhän Windsurf kuolee hiljalleen pois? cursor ja claude code lienevät suositumpia. Itse en ole hetkeen käyttänyt Windsurfia kun CC on niin paljon parempi. Uusin versio Claude Codesta toimii myös natiivisti Windowsissa!
Kyllähän tuosta systeemistä jäi sellainen kuva, että johto rahasti itsensä ulos acquisition hire+lisensoinnin kautta ja windsurf jäi "support" moodin. Ajan kanssa google tehnee itse paremman ai-koodaustyökalun. Windsurf näivettyy marginaaliin jos poislähteneet tyypit oli kriittisiä toiminnan kannalta.

En kyllä usko, että cursor ai:kaan pidemmän päälle jää eloon erillisenä yrityksenä ellei sitten amazon/anthropic osta osuutta/kokonaan cursor ai:sya. Varmaan foundation model firmojen omat avustimet se mikä voittaa. Vaikea 3rdparty firmana kilpailla kun pitää maksaa google/anthropic/openai jengille per token ja sitä kautta voitollisen palvelun hinta väistämättä oltava kovempi kuin google/anthropic/openai oma avustin.

Koodausavustimia on enemmän kuin sieniä sateella niin jossain kohtaa on tultava jonkinlainen pudotus ja konsolidaatiokierros.
 
Kyllä, veikkaan itsekin vahvasti sitä, että mallien omistajat ovat ne, jotka hommaa loppupelissä määräävät.
 
Enemmän matemaattinen kuin koodausongelma mutta jos joku haluaa koittaa vaikka Grok v4:sta
"can you calculate Approximate inverse function for Pt100 RTD (IEC 751) from resistance to temperature. 5th order polynomial equation for -200 to 0cel range with 0.001cel precision"

Grok v3 hallusinoi jotkut kertoimet joiden väittää olevan oikein, virhettä kuitenkin helvetisti, tarkistuslaskentaa pyydettäessä huomaa virheen, yrittää laskea uudet kertoimet jotka eivät ole sen paremmat.
Deepseekin kanssa sama homma paitsi että se feikkaa tai ei osaa edes pluslaskua tarkistuslaskussa, deepthought moodissa yrittää monikertaan ja huomaa aina laskevansa jotain väärin. lopulta antaa jotkut netistä löytyneet kertoimet jotka sinällään ok.
Chatgpt laskee toimivat kertoimet ja osaa tarkistaa/validoida ne pyydettäessä.
 
Taitaa olla kielimalleille tyypillistä se hassu juttu, että osaavat paremmin kertoa miten joku laskenta tehdään, vaikka koodina, kuin varsinaisesti suorittaa monimutkaisia laskuja varsinaisilla numeroilla.
 
Taitaa olla kielimalleille tyypillistä se hassu juttu, että osaavat paremmin kertoa miten joku laskenta tehdään, vaikka koodina, kuin varsinaisesti suorittaa monimutkaisia laskuja varsinaisilla numeroilla.
Piti paikkansa viime viikkoon asti, International math olympiadissa googlen keinoälylle virallinen kultamitali ja openai:lle epävirallinen kultamitali. Molemmat llm pohjaisia, ei työkalujenkäyttöä, ei internettiä, ei helpotuksia ja samat säännöt kuin ihmisille. Kisat järjestetty 1959 vuodesta alkaen, osallistujia yli sadasta maasta ja alle 10% osallistujista saa kultamitaliin oikeuttavat pisteet.

Google aikoo integroida tuon matematiikkajutun ultra-tason llm-palveluunsa. Varmaan 6kk-12kk sisään hyppää kielimallien laatu ylöspäin kun matematiikkapuolen järkeilyasiat generalisoidaan ja tuodaan tarjolle openai ja google palveluissa.
researchers behind OpenAI and Google’s IMO efforts claimed that these gold-medal performances represent breakthroughs around AI reasoning models in non-verifiable domains.

1753241243277.png
 
Viimeksi muokattu:

Uusimmat viestit

Statistiikka

Viestiketjuista
282 595
Viestejä
4 852 752
Jäsenet
78 449
Uusin jäsen
H4RTSA80

Hinta.fi

Back
Ylös Bottom