Money
$10,000
Gold
5

Alpha Arena: Seks AI-modeller, 60 000 dollar live på Perps – hvem vinner?

Jane Savitskaya

Seks AI-er. $60k. Én handelsarena.

Det er oppsettet bak Alpha Arena – et live-eksperiment utført av den New York-baserte ingeniøren Jay Azhang, som bestemte seg for å sette dagens smarteste AI-modeller der det virkelig gjør vondt: i markedene.

Hver modell får 10 000 dollar i ekte penger for å handle evigvarende krypto på Hyperliquid. Ingen falske data, ingen papirhandel. Bare rå kode som prøver å overliste kaoset i BTC, ETH og noen få andre ustabile tokens. 

Ideen er enkel, men dristig: hvis milliarder dollar AI-er angivelig kan «forutsi alt», la oss se om de kan overleve det mest uforutsigbare av alt – markedet.

Oppsett: Slik fungerer Alpha Arena

Her er det du trenger å vite:

  • Seks store AI-modeller mottar hver 10 000 USD i livekapital for denne konkurransen (så totalpotten = 60 000 USD).

  • De handler perpetual futures («perps») på kryptobørsen Hyperliquid på tvers av de største aktivaene: BTC, ETH, SOL, BNB, DOGE, XRP.

  • Alle modeller begynner med identiske spørsmål og det samme datasettet: pris-/volumdata, markedshistorikk osv. Tanken er rettferdighet og sammenlignbarhet.

  • Konkurransen er live, transparent og offentlig: Du kan se åpne posisjoner for hver modell på nof1s leaderboard.

  • Målet: maksimere avkastningen og samtidig styre risikoen. Hver modell velger sin egen strategi: når den skal gå inn, hvilke aktiva som skal velges, hvilken gearing som skal brukes, og når den skal avsluttes. Mennesker blander seg ikke inn under handler.

Leaderboard, ytelse og strategier

Her er de seks modellene i ringen, hvordan de gjør det, og hva slags spill de gjør (basert på offentlig rapporterte data). 

Alle tall er øyeblikksbilder fra nylig dekning av Alpha Arena på nof1.ai.

Modell Siste kontoverdi* Omtrentlig avkastning Strategi og eiendeler
DeepSeek V3.1 ~13 800 USD +38% Aggressiv strategi.
Lange posisjoner med høy giring (~15×) i ETH og SOL. Handler også BTC, DOGE og BNB. Liten rapportert tap på XRP.
Grok 4 ~13 400 USD +35% Sterk momentbasert tilnærming.
Ligner portefølje som DeepSeek. Kjent for god «kontekstforståelse av markedets mikrostruktur».
Claude Sonnet 4.5 ~12 500 USD +25% Mer konservativ enn de to øverste.
Færre åpne posisjoner og lavere aktivitet. Handler for det meste ETH og XRP, samt noe BNB.
Qwen3 Max ~10 900 USD +9% Moderat ytelse.
Fortsatt i pluss, men klarer ikke fange oppside. Handler mindre aggressivt.
GPT‑5 (ChatGPT) ~7 300 USD –27% Har slitt til nå.
Blanding av lange og korte posisjoner fungerte ikke. Ble overrasket av volatilitet.
Gemini 2.5 Pro ~6 800 USD –32% Den svakeste så langt.
Tidlig short-bias (satset på fall), men byttet til long for sent. Dårlig timing påvirket resultatene negativt.

Screenshot fra Nof1.ai

Hurtige lærdommer fra strategiene

  • Vinnerne (DeepSeek, Grok) satset på lange, belånte handler når markedet gikk opp. Det betalte seg.

  • Claude holdt det jevnere: færre handler, mindre giring, noe som betyr mindre oppside, men også mindre risiko.

  • Qwen spiller på det trygge.

  • GPT-5 og Gemini så ut til å ta feil tid: enten for forsiktige, eller for tidlig/sen på reverseringer.

  • GPT-5 og Gemini så ut til å ta feil tid.

Det er også verdt å merke seg at noen modeller gjorde mange handler (f.eks. Gemini ~15 handler/dag), mens andre (Claude) bare utførte noen få store bevegelser.

Hvorfor det er viktig (og hva du bør se på)

Dette eksperimentet er ikke bare en kul demo. Det signaliserer noe dypere om fremtiden for AI i handel.

  • Når generelle AI-modeller begynner å gjøre meningsfylte P&L i virkelige markeder, vil det rokke ved spillereglene.
  • Men et stort forbehold: Noen få dager med gevinst garanterer ikke langsiktig avkastning. Markedsregimer endrer seg.
  • Hvis én eller to modeller dominerer i flere uker, vil du se at kopihandel, ETF-produkter og hedgefond jakter på dem. Faktisk er det å følge DeepSeek allerede en strategi som noen detaljhandelsaktører bruker.
  • På den andre siden: Hvis mange modeller handler på samme måte (samme instruksjoner, samme data), kan deres kollektive handlinger påvirke markedene – refleksiviteten blir reell.

Hva tradere faktisk kan lære av Alpha Arena

Det er ikke bare underholdende å se seks modeller med flere millioner parametere gå long og short som koffeinholdige hedgefondpraktikanter – det er også merkelig lærerikt. Alpha Arena-eksperimentet byr på noen nyttige lærdommer som menneskelige tradere (og botbyggere) faktisk kan bruke.

1. Risikostyring slår rå IQ

DeepSeek og Grok vinner ikke fordi de er «smartere» – de vinner fordi de følger konsekvente regler. Posisjonsstørrelse, plassering av Stop Loss og ikke få panikk på grunn av støy. I mellomtiden viser Gemini og GPT-5 hva som skjer når selv en genial modell ignorerer disiplin. Og det er da alle disiplinerte tradere i det stille mumler: «Hva var det jeg sa.»

2. Handle mindre, men smartere

Claude topper ikke listene, men det er positivt – hovedsakelig fordi det handles mindre. Overtrading ødelegger resultatene, enten du er en person eller et transformatornettverk. Kvalitetsoppsett >>>> konstant handling.

3. Diversifiser, men ikke spre deg

De beste aktørene har eksponering mot 2-3 hovedaktiva (ETH, SOL, BTC) og jakter sjelden på alle skinnende mynter. Denne balansen mellom fokus og fleksibilitet er verdt å stjele .

4. Forspranget ligger fortsatt i utførelsen

Groks mikro-timing viser hvor mye små forsinkelser eller slurv koster over tid. Mennesker kan ikke tenke like raskt, men de kan automatisere presisjonen i ordren, backteste oppføringer og stramme inn på utførelsesrutinene.

5. Prompt engineering = strategiutforming

Alle AI-er i Alpha Arena bruker sin egen logikk – momentum, mean reversion, skalpering. For tradere er dette en påminnelse: Rammeverket er viktigere enn prognosen. Definer systemet ditt, ikke magefølelsen din.

6. Du kan ikke kopiere resultater blindt

Selv om du prøver å etterligne DeepSeeks bevegelser, vil du fortsatt ha problemer med glidning, ventetid og ulik risikotoleranse. Bruk Alpha Arena som inspirasjon, ikke som en kopier-og-lim-guide.

Kommentar: AI er ikke en snarvei til lettjente penger. Det er et speil som viser hvordan struktur, disiplin og tilpasningsevne lønner seg. Hvis tradere låner disse vanene i stedet for å jage signaler, handler de allerede smartere enn halve markedet.

Hvilken AI kan du faktisk stole på med pengene dine?

Kort svar: ingen fullstendig.
Langt svar: noen mer enn andre.

Resultatene fra Alpha Arena gjør én ting klart: Selv den skarpeste AI-en kan gå fra helt til margin call på en uke. DeepSeek og Grok ser strålende ut nå, men den samme logikken kan underprestere i et sidelengs marked eller under en plutselig BTC-dump. AI «lærer» ikke risikotoleranse, den bare utfører den.

Hvis du tenker på å la AI handle for deg, kan du tenke på det som å ansette en pilot som av og til hallusinerer skyer. Du må fortsatt holde øye med dashbordet.

Slik gjør du det på en smart måte:

  • Start i det små. Ikke overlat hele stakken til en hvilken som helst bot – test, observer og skaler gradvis.
  • Bruk overvåkingsverktøy. Med plattformer som 3Commas og Cryptohopper kan du automatisere strategier samtidig som du beholder kontrollen over risikoinnstillingene.
  • Eksperimenter, men verifiser. Selv ChatGPT Agent, som vi nylig testet mot tradisjonelle handelsroboter, fungerer best som et beslutningsstøtteverktøy, ikke en «sett-og-glem»-løsning.

Denne sammenligningen, ChatGPT Agent vs Cryptohopper vs 3Commas, dykker ned i akkurat dette spørsmålet: hvor mye kontroll du egentlig bør gi maskinen. Alpha Arena legger bare til et lag med live-penger til den samme debatten.

Så kan du stole på AI med pengene dine?

Måskje. Men bare hvis du er klar til å overvåke den som en hauk, eller i det minste som en trader som har blitt brent før.

Tidligere
decor

Vuk Martinovic

Kryptokasinoer forklart: Hvordan de fungerer, juridisk status og viktige risikoer

decor

Jane Savitskaya

Aster, Avantis og Lighter: de nye gutta i Perp DEX-gamet

decor

Jane Savitskaya

Hva skjedde med Hamster Kombat?