AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

Nyt kun pystynyt koneella istumaan niin on tuo opus 4.6 paljon hitaampi kuin 4.5. Miettii ja miettii, tosin tekee hyvää. Alkaa olemaan sen tason hidas, että pitäisi ehkä suosiolla siirtyä ajamaan rinnakkaisia agentteja+taskeja.
Luin tuossa juuri pöhinää ja oli mielenkiintoista miten paljon Codexia kehutaan nyt, valittivat paljon tuosta Opuksen hitaudesta ja kuinka juuri mikään ei ole muka parantunut. Siihen päälle vielä Codexia surkeammat käyttörajat. Jännä nähdä miten Anthropic vastaa jos tuo asenne tuosta nyt yleistyy. Oletko itse vertaillut noita?
 
Luin tuossa juuri pöhinää ja oli mielenkiintoista miten paljon Codexia kehutaan nyt, valittivat paljon tuosta Opuksen hitaudesta ja kuinka juuri mikään ei ole muka parantunut. Siihen päälle vielä Codexia surkeammat käyttörajat. Jännä nähdä miten Anthropic vastaa jos tuo asenne tuosta nyt yleistyy. Oletko itse vertaillut noita?
Mulla on vain anthropicin max tilaus nyt. Tykkään tuosta claude code:sta sen verran + tekee niin hyvin ettei tällä erää ole tarvetta ajaa jotain toista palvelua sen rinnalla. Hidas tuo 4.6 on, jos olisi kiire niin kannattaisi ajaa useampaa taskia rinnakkaisilla agenteilla niin saisi enemmän taskeja läpi samassa ajassa.

En tiedä kannattaako noita palveluita vaihdella kuin kalsareita. Tilanteet muuttuu kovin nopeasti. Kohta enivei multa loppuu koodauskausi kun tyrähomma paranee ja alkaa kalastus+kesäkausi. Ens talvena uutta matoa koukkuun sen hetkisen tilanteen pohjalta. Mulla aika lyhyt slotti talvella missä koodaus jaksaa kiinnostaa, muu vuosi toisten harrastusten parissa. Tosin tää agenttijuttu voi muuttaa tilannetta, jos/kun tuntuu ettei tarvi enää itse koodata, riittää tikettien kirjoittaminen. Tehnyt tyyliin ihan kourallisen koodirivejä parin viime viikon aikana, claude toimittaa upeasti sellaista mihin ei tarvi itse koskea.
 
Viimeksi muokattu:
Manaillut tässä, että harmi kun winuae:hen ei voi helposti lähettää komentoja. Kysyin AI:lta, että kirjoitappa skripti joka lähettaa prosessin ikkunaan tekstin ja sehän suoritti. Nyt on integroituna agenttilooppiin systeemi missä agentti saa laukaistua emulaattorissa binaarin päälle. Emulaattorissa ajossa oleva binaari tallettaa logit tiedostoon jonka agentti pystyy lukemaan. Nyt pystyy agentti itsenäisesti verifioimaan osan asioista. Mietin, että teen samalla tapaa framebufferin tallettamista tiedostoihin niin ehkä agentti pystyy katsomaan myös piirtyikö asiat edes suurinpiirtein oikein. Heikkous tässä skriptissä, että pitää emulaattorissa olla shell-aktiivisena että applikaatio käynnistyy. Jos jaksaisi voisi lisätä hiiren klikkauksen shellin aukaisemiseksi/aktivoinniksi.

Koodi:
# Send a command to a running WinUAE instance
# Usage: .\run_in_winuae.ps1 [command]
# Default command: mighty.exe
param(
    [string]$Command = "mighty.exe"
)
Add-Type @"
using System;
using System.Runtime.InteropServices;
public class Win32 {
    [DllImport("user32.dll")]
    public static extern bool SetForegroundWindow(IntPtr hWnd);
    [DllImport("user32.dll")]
    public static extern bool ShowWindow(IntPtr hWnd, int nCmdShow);
}
"@
$process = Get-Process | Where-Object { $_.ProcessName -like "*winuae*" } | Select-Object -First 1
if (-not $process) {
    Write-Error "WinUAE is not running."
    exit 1
}
$hwnd = $process.MainWindowHandle
if ($hwnd -eq [IntPtr]::Zero) {
    Write-Error "WinUAE window handle not found."
    exit 1
}
# Restore if minimized (SW_RESTORE = 9), then bring to foreground
[Win32]::ShowWindow($hwnd, 9) | Out-Null
[Win32]::SetForegroundWindow($hwnd) | Out-Null
Start-Sleep -Milliseconds 500
Add-Type -AssemblyName System.Windows.Forms
[System.Windows.Forms.SendKeys]::SendWait("$Command{ENTER}")

---

Tässä kun isompia juttuja antanut AI:n agentin koodata ja verifioida itsenäisesti niin alkaa tuntumaan että aika se ja sama mikä mallin nopeus on olettaen että agentti tekee isomman taskin hyvälaatuisesti valmiiksi. Asia on aika erilainen jos malli pystyy tekemään 30min, 1h, 8h, viikon,... työtä itsenäisesti versus pitää ihmisen olla loopissa 30s välein korjaamassa. Siinä kun eka taski raksuttaa niin laittaa seuraavaa sisään ja seuraavaa sisään jne. Nopeus tulee rinnakkain asioiden tekemisestä/tutkimisesta. Ehkä opus 4.6 "hitaus" oletusasetuksilla ei ole niin huono asia kun tulee priimaa ulos. Kai tuon sais nopeammaksi, jos ruuvais asetuksia alaspäin mutta sitten ottaa riskiä että pitää iteroida useampi kerta. Toki tässä on se heikkous, että pitää olla jonkinlainen looppi mitä agentti voi iteroida eli tapa varmistaa tuloksen oikeellisuus. TDD onkin uusi vanha juttu ja taas pinnalla.
 
Viimeksi muokattu:
Toisin sanoen, hyvällä TDD:llä Opus voisi tehdä implementaation, vielä paremmin jos joku muu on jo tehnyt itse testit . Mikä ei ole välttämättä yhtään huono asia, mutta alun: "We tasked Opus 4.6 using agent teams to build a C Compiler, and then (mostly) walked away." on täyttä hevonpuppua.
Tähän näin vielä selityksen, että sen kääntäjän tekeminen maksoi 20k. Juu, kun joku muu oli kaikki ne testit ym. kirjoittanut ja Claudella oli ainakin pari esimerkkitoteutusta käytössä.
 
Äh, Claudella teettänyt tilastokäppyröitä parina iltana, mutta nyt loppui hyvin nopeasti tokenit ja hommat jatkuu vasta viiden jälkeen. En kuitenkaan viitsi alkaa enempää maksamaan tästä harrastuksesta niin eipä tässä auta kuin odottaa.
 
Äh, Claudella teettänyt tilastokäppyröitä parina iltana, mutta nyt loppui hyvin nopeasti tokenit ja hommat jatkuu vasta viiden jälkeen. En kuitenkaan viitsi alkaa enempää maksamaan tästä harrastuksesta niin eipä tässä auta kuin odottaa.
Tsekkaa settings->usage asetus. Siellä voi olla odottamassa lahjanappi millä saa 50$ edestä tokeneita lisää. Anthropicilla tuollainen kampanja menossa, sain ton lahjan eilen lunastettua.
 
Huomasin joo, mutta siinä pitäisi sallia että Claude ajelee yli minun varojen. Minulla on se extra usage pois päältä ettei tule kivoja ylläreitä.

Ja ai niin, käytän tuota VS Coden kautta, se ei vielä tuo 4.6:tta. Tein yhden projektin sillä Clauden terminaalilla ja siinä lähti itsellä homma lapasesta, en vaan oikein pysynyt kärryillä. Tässä on paljon helpompi seurata mitä tapahtuu. Neovimiin olisi kanssa kiva viritellä tämä mutta en tiedä onko tällaisessa hommassa niin paljon etua.
 
Viimeksi muokattu:
Huomasin joo, mutta siinä pitäisi sallia että Claude ajelee yli minun varojen. Minulla on se extra usage pois päältä ettei tule kivoja ylläreitä.

Ja ai niin, käytän tuota VS Coden kautta, se ei vielä tuo 4.6:tta. Tein yhden projektin sillä Clauden terminaalilla ja siinä lähti itsellä homma lapasesta, en vaan oikein pysynyt kärryillä. Tässä on paljon helpompi seurata mitä tapahtuu. Neovimiin olisi kanssa kiva viritellä tämä mutta en tiedä onko tällaisessa hommassa niin paljon etua.
Naksauttaa rajoitukset takaisin päälle kun alkaa olemaan 50$ käytetty. Claude Coden kanssa joutuu hyväksymään, että se on kuin ihminen. Suunnittelun käyttäminen auttaa kun näkee, että askeleet ja valitut lähestymistavat/palikat hyviä ennen kuin säntää toteutukseen. Roolien käyttäminen hyvä kun voi käskeä koneen tekemään suunnitelmalle/koodille/testeille/... esim. vertaisarvioinnin ennen ihmiselle tuotoksen esittelyä. VIBE code kirja on oikeasti hyvä.

En oikein näe tarvetta enää käyttää AI:ta parempana auto completena kun ainakin tuo 4.5 ja 4.6 opus claude code:ssa toimii isompienkin taskien kanssa hyvin itsenäisesti. Ei tarvi enää murunen kerrallaan yrittää kuten vuosi sitten.
 
Ei tuo Code VS:ssäkään toimi auto completena. Ihan samalla tavalla ne ohjeet annetaan chatissa. Mutta tuo UI toimii itsellä paremmin ylipäätään. Jos haluan vielä vaikka uudestaan tarkastaa, mitä CC teki, niin se on tuossa samassa työkalussa, terminaalin kanssa pitää oikeastaan olla samat koodit toisessa editorissa auki samaan aikaan. Anthropic toki haluaa että kaikki hirttäytyy tuohon heidän terminaaliinsa, silloin ei mallia vaihdeta niin vain.

Minä taidan monimutkaisempia konsteja odotella. Jos nyt säntää jokaisen uuden idean perään niin ei tässä muuta ehtisikään. Joka viikko tulee joku uusi muka mullistava konsti käyttää AI:ta. Katsotaan mihin suuntaan homma kääntyy ja mitkä oikeasti todetaan best practiceiksi.
 

Statistiikka

Viestiketjuista
300 015
Viestejä
5 114 223
Jäsenet
81 727
Uusin jäsen
character6

Hinta.fi

Back
Ylös Bottom