finWeazel
Tukijäsen
- Liittynyt
- 15.12.2019
- Viestejä
- 11 685
Hinnat on nousseet jo aika valtavasti vuodentakaiseen verrattuna ainakin koodauskontekstissa. Vuosi sitten cursor ai:n 20e/kk tilauksella tuli toimeen kuukauden, nykyään 200e/kk tilauksen tokenit loppuu kesken nopeasti ja pitää jatkaa toimintaa per token hinnoilla. Johtuu pitkälti siitä, että tuli isommat ajattelevat mallit mitkä syövät enemmän tokeneita kuin vuodentakaiset "arvailijat". Agenttijutut myös toki kun AI hoitaa isompia palasia ja iterointia eikä tee vain yhtä arvausta per kysymys.Onhan se selvää että kaikki eivät voi olla voittajia. Eri firmojen tekoälymalleja on tällä hetkellä liian monta, kaikki niistä eivät voi mitenkään löytää riittävän isoa maksavaa asiakaskuntaa että bisnes muuttuisi koskaan kannattavaksi. Lisäksi tekoälypalveluiden kuluttajahinnat ovat tällä hetkellä keinotekoisen alhaiset, kovan kilpailun takia. Pudotuspelit alkavat viimeistään siinä vaiheessa kun hintoja pitää ruveta hilaamaan reilusti ylöspäin tasapainottamaan kustannuksia ja datakeskusinvestointeja. Ilmaiskäyttäjiä on aina helpompi haalia kuin maksavia asiakkaita.
Anthropicin claude code on todella kallis jos sitä käyttää isomman koodipinon kanssa. Tän takia tuo uusi 1/3 hinnalla toimiva malli on todella tervetullut.
Rautapuolella tapahtuu myös innovaatiota vuosittain mikä laskee tokeneiden hintaa. Esim. 2026h2:lla nvidian vera rubin + rubin cpx tai amd mi450. Softa/mallipuolella myös optimointeja ja puristellaan myös mehuja irti enemmän pienistä malleista. Kaikkeen ei kannata käyttää isointa frontier mallia.
Meta, google, microsoft lienee ainakin suojassa kun tekevät vuositasolla kymmenien miljardien voitot konesali-investoinneista huolimatta. Anthropic, openai jne. heikommissa kantimissa, tosin vielä tuntuu VC-rahaa riittävän.
Viimeksi muokattu: