KI zeigte geringe Effektivität bei Sportwetten und verlor alle Gelder in Spielen der englischen Premier League.

KI zeigte geringe Effektivität bei Sportwetten und verlor alle Gelder in Spielen der englischen Premier League.

3 hardware

Kurz zum Ergebnis des Experiments

Das Startup *General Reasoning* führte einen Test namens KellyBench durch, bei dem acht führende KI‑Systeme (Google Gemini 3.1 Pro, OpenAI ChatGPT‑4, Anthropic Claude Opus 4.6, xAI Grok 4.20 und weitere) auf ihre Fähigkeit bewertet wurden, während der Saison der englischen Premier League 2023–2024 Wetten abzuschließen.

Jeder Agent erhielt eine vollständige statistische Beschreibung aller Teams und vergangenen Spiele, jedoch war Internetzugang verboten – die Modelle konnten nur die zuvor erhaltenen Daten nutzen.

Wie der Test ablief

1. Drei Versuche: jede System konnte drei Wettserien über die Saison hinweg durchführen.
2. Wetten: auf Spielausgänge (Sieg/Unentschieden/Niederlage) und Toranzahl.
3. Ziel: den Gewinn maximieren, indem Risiken gesteuert werden.

Wer gewann, wer verlor

KI‑SystemDurchschnittliches ErgebnisBemerkung
Anthropic Claude Opus 4.611 % (etwa Break‑Even bei einem Versuch)Der „fairste“ Teilnehmer, aber dennoch Geld verloren
Google Gemini 3.1 Pro+34 % beim ersten Versuch, dann InsolvenzAnfangs Gewinn, danach Verlust
xAI Grok 4.20Sofort insolvent, konnte die beiden folgenden Versuche nicht abschließenDer schwächste aller

Am Ende verlor jedes Modell Geld in der Saison, und einige gingen sogar vollständig „bankrott“. Das bestätigt die Erkenntnisse der Forscher: selbst die fortschrittlichsten KI‑Systeme haben Schwierigkeiten mit langfristiger Prognose im realen Leben.

Was das für die Zukunft der KI bedeutet

- Die Befürchtungen einer menschlichen Ersetzung wirken sich noch zu übertrieben an.
- Aktuelle Benchmarks nutzen oft „statische“ Bedingungen, die den Chaos und die Komplexität des wirklichen Lebens nicht widerspiegeln.
- Obwohl KI bereits Aufgaben wie das Schreiben von Code erfolgreich löst, bleibt sie in den meisten anderen Bereichen der menschlichen Tätigkeit begrenzt.

Damit zeigt das KellyBench‑Experiment, dass KI derzeit noch nicht bereit ist, mit dem Menschen bei dynamischen, unvorhersehbaren Aufgaben wie Sportwetten zu konkurrieren.

Kommentare (0)

Teile deine Meinung — bitte bleib höflich und beim Thema.

Noch keine Kommentare. Hinterlasse einen Kommentar und teile deine Meinung!

Um einen Kommentar zu hinterlassen, melde dich bitte an.

Zum Kommentieren anmelden