AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

El Toro · eilen klo 21:05

finWeazel sanoi:
Nyt kun pystynyt koneella istumaan niin on tuo opus 4.6 paljon hitaampi kuin 4.5. Miettii ja miettii, tosin tekee hyvää. Alkaa olemaan sen tason hidas, että pitäisi ehkä suosiolla siirtyä ajamaan rinnakkaisia agentteja+taskeja.

Luin tuossa juuri pöhinää ja oli mielenkiintoista miten paljon Codexia kehutaan nyt, valittivat paljon tuosta Opuksen hitaudesta ja kuinka juuri mikään ei ole muka parantunut. Siihen päälle vielä Codexia surkeammat käyttörajat. Jännä nähdä miten Anthropic vastaa jos tuo asenne tuosta nyt yleistyy. Oletko itse vertaillut noita?

finWeazel · eilen klo 21:18

El Toro sanoi:
Luin tuossa juuri pöhinää ja oli mielenkiintoista miten paljon Codexia kehutaan nyt, valittivat paljon tuosta Opuksen hitaudesta ja kuinka juuri mikään ei ole muka parantunut. Siihen päälle vielä Codexia surkeammat käyttörajat. Jännä nähdä miten Anthropic vastaa jos tuo asenne tuosta nyt yleistyy. Oletko itse vertaillut noita?

Mulla on vain anthropicin max tilaus nyt. Tykkään tuosta claude code:sta sen verran + tekee niin hyvin ettei tällä erää ole tarvetta ajaa jotain toista palvelua sen rinnalla. Hidas tuo 4.6 on, jos olisi kiire niin kannattaisi ajaa useampaa taskia rinnakkaisilla agenteilla niin saisi enemmän taskeja läpi samassa ajassa.

En tiedä kannattaako noita palveluita vaihdella kuin kalsareita. Tilanteet muuttuu kovin nopeasti. Kohta enivei multa loppuu koodauskausi kun tyrähomma paranee ja alkaa kalastus+kesäkausi. Ens talvena uutta matoa koukkuun sen hetkisen tilanteen pohjalta. Mulla aika lyhyt slotti talvella missä koodaus jaksaa kiinnostaa, muu vuosi toisten harrastusten parissa. Tosin tää agenttijuttu voi muuttaa tilannetta, jos/kun tuntuu ettei tarvi enää itse koodata, riittää tikettien kirjoittaminen. Tehnyt tyyliin ihan kourallisen koodirivejä parin viime viikon aikana, claude toimittaa upeasti sellaista mihin ei tarvi itse koskea.

finWeazel · tänään klo 00:00

Manaillut tässä, että harmi kun winuae:hen ei voi helposti lähettää komentoja. Kysyin AI:lta, että kirjoitappa skripti joka lähettaa prosessin ikkunaan tekstin ja sehän suoritti. Nyt on integroituna agenttilooppiin systeemi missä agentti saa laukaistua emulaattorissa binaarin päälle. Emulaattorissa ajossa oleva binaari tallettaa logit tiedostoon jonka agentti pystyy lukemaan. Nyt pystyy agentti itsenäisesti verifioimaan osan asioista. Mietin, että teen samalla tapaa framebufferin tallettamista tiedostoihin niin ehkä agentti pystyy katsomaan myös piirtyikö asiat edes suurinpiirtein oikein. Heikkous tässä skriptissä, että pitää emulaattorissa olla shell-aktiivisena että applikaatio käynnistyy. Jos jaksaisi voisi lisätä hiiren klikkauksen shellin aukaisemiseksi/aktivoinniksi.

Koodi:

# Send a command to a running WinUAE instance
# Usage: .\run_in_winuae.ps1 [command]
# Default command: mighty.exe
param(
    [string]$Command = "mighty.exe"
)
Add-Type @"
using System;
using System.Runtime.InteropServices;
public class Win32 {
    [DllImport("user32.dll")]
    public static extern bool SetForegroundWindow(IntPtr hWnd);
    [DllImport("user32.dll")]
    public static extern bool ShowWindow(IntPtr hWnd, int nCmdShow);
}
"@
$process = Get-Process | Where-Object { $_.ProcessName -like "*winuae*" } | Select-Object -First 1
if (-not $process) {
    Write-Error "WinUAE is not running."
    exit 1
}
$hwnd = $process.MainWindowHandle
if ($hwnd -eq [IntPtr]::Zero) {
    Write-Error "WinUAE window handle not found."
    exit 1
}
# Restore if minimized (SW_RESTORE = 9), then bring to foreground
[Win32]::ShowWindow($hwnd, 9) | Out-Null
[Win32]::SetForegroundWindow($hwnd) | Out-Null
Start-Sleep -Milliseconds 500
Add-Type -AssemblyName System.Windows.Forms
[System.Windows.Forms.SendKeys]::SendWait("$Command{ENTER}")

---

Tässä kun isompia juttuja antanut AI:n agentin koodata ja verifioida itsenäisesti niin alkaa tuntumaan että aika se ja sama mikä mallin nopeus on olettaen että agentti tekee isomman taskin hyvälaatuisesti valmiiksi. Asia on aika erilainen jos malli pystyy tekemään 30min, 1h, 8h, viikon,... työtä itsenäisesti versus pitää ihmisen olla loopissa 30s välein korjaamassa. Siinä kun eka taski raksuttaa niin laittaa seuraavaa sisään ja seuraavaa sisään jne. Nopeus tulee rinnakkain asioiden tekemisestä/tutkimisesta. Ehkä opus 4.6 "hitaus" oletusasetuksilla ei ole niin huono asia kun tulee priimaa ulos. Kai tuon sais nopeammaksi, jos ruuvais asetuksia alaspäin mutta sitten ottaa riskiä että pitää iteroida useampi kerta. Toki tässä on se heikkous, että pitää olla jonkinlainen looppi mitä agentti voi iteroida eli tapa varmistaa tuloksen oikeellisuus. TDD onkin uusi vanha juttu ja taas pinnalla.

AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

El Toro

finWeazel

finWeazel

Uutiset

Uutisia lyhyesti

Uusimmat viestit

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi