Google hat Gemini 3 Deep Think gestartet – einen fortschrittlichen KI-Service für wissenschaftliche Aufgaben, der Antworten weiterhin auf Anfragen zuschneidet.

Google hat Gemini 3 Deep Think gestartet – einen fortschrittlichen KI-Service für wissenschaftliche Aufgaben, der Antworten weiterhin auf Anfragen zuschneidet.

10 software

Google präsentiert eine aktualisierte Version von Gemini 3 Deep Think

Das Unternehmen Google kündigte ein bedeutendes Update seiner Plattform Gemini 3 Deep Think an – einen künstlichen Intelligenz, der in der Lage ist zu überdenken und komplexe wissenschaftlich-technische Aufgaben zu lösen.

Was sich geändert hat
Parameter Neues Wie es aussieht Ziel Wechsel von reiner Theorie zur praktischen Anwendung Lösen von Aufgaben ohne klare Grenzen, mit unvollständigen Daten Zugänglichkeit Eingebettet in die Gemini-App Google AI Ultra-Abonnenten können nutzen, über API – Ingenieure und Unternehmen (Antrag erforderlich) Entwicklungs­partner Wissenschaftler‑Forscher Gemeinsame Arbeit an komplexen Problemen

Leistungskennzahlen
Test Ergebnis Kommentar Humanity’s Last Exam 48,4 % Ohne Drittanbieter ARC‑AGI‑284,6 % Benchmark für AI‑Assistenten Codeforces (Elo) 3455 Hohe Bewertung unter Softwarelösungen IMO 2025 Goldmedaille Äquivalent zum Niveau internationaler Olympiadenteilnehmer Chemie/Physik Derselbe Ergebnis Zeigte Vielseitigkeit in verschiedenen Disziplinen CMT‑Benchmark (theoretische Physik) 50,5 % Gute Beherrschung komplexer Konzepte

KI-Agent „Aletheia“
Im DeepMind-Labor von Google wurde der Agent Aletheia auf Basis von Gemini 3 Deep Think entwickelt. Kernfunktionen:

1. Hypothesenprüfung – Der Agent erkennt Schwächen in vorgeschlagenen Lösungen und korrigiert sie iterativ.

2. Anerkennung von Unsicherheit – Er kann mitteilen, dass er die Antwort nicht kennt.

3. Interaktion mit externen Quellen – Nutzt Googles Suchdienst und Web‑Navigation, vermeidet jedoch das Erfinden von Links.

Erfolgsstufen
Google hat die Erfolge von Aletheia in fünf Stufen unterteilt:

Stufe Beschreibung Beispiele 0 – „geringe Neuheit“ Vollständig autonomer Modus, drei Aufgaben von P. Erdős gelöst (erste Ebene) Drei Erdős‑Aufgaben 1 – „minimale Neuheit“ Ein zusätzlicher Erfolg im autonomen Modus Vierte Aufgabe 2 – „publikationsfähig“ Ergebnisse sowohl autonom als auch in Zusammenarbeit mit Menschen sowie unterstützende Werkzeuge Aufgaben 3–4 – „signifikante/erhebliche Durchbruch“ Noch nicht erreicht—

Wie Aletheia Erdős‑Aufgaben löst
* Von den 700 bisher ungelösten Problemen des Agenten wurden 13 gelöst.

* Davon sind jedoch nur 4 tatsächlich neu – die übrigen sind bereits in der wissenschaftlichen Gemeinschaft bekannt.

* Von den 212 eingereichten Lösungen waren lediglich 6,5 % inhaltlich korrekt; 68,5 % enthielten fundamentale Fehler, und 31,5 % interpretieren die Aufgabe falsch.

Die Entwickler betonen, dass KI dazu neigt, „die Frage so neu zu interpretieren, dass die Antwort einfacher wird“, und bleibt „sehr fehleranfällig im Vergleich zu Menschen“. Letztlich kann Mathematiker noch nicht durch künstliche Intelligenz ersetzt werden.

Zusammenfassung: Gemini 3 Deep Think und sein Agent Aletheia zeigen beeindruckende Ergebnisse in verschiedenen wissenschaftlichen Bereichen, behalten jedoch erhebliche Einschränkungen hinsichtlich Genauigkeit und Zuverlässigkeit bei. Google arbeitet weiterhin an der Verbesserung der Fähigkeit von KI zum tiefen Überdenken und zur eigenen Prüfung von Schlussfolgerungen.

Kommentare (0)

Teile deine Meinung — bitte bleib höflich und beim Thema.

Noch keine Kommentare. Hinterlasse einen Kommentar und teile deine Meinung!

Um einen Kommentar zu hinterlassen, melde dich bitte an.

Zum Kommentieren anmelden