Alibaba startet kompakte Qwen 3.5‑Modelle, die direkt auf Laptops laufen und die von OpenAI angebotenen Modelle übertreffen.

Alibaba startet kompakte Qwen 3.5‑Modelle, die direkt auf Laptops laufen und die von OpenAI angebotenen Modelle übertreffen.

12 hardware

Alibaba Qwen 3.5 – neue Serie kompakter KI-Modelle

Im Rahmen seiner AI-Abteilung kündigte Alibaba die Einführung der Qwen 3.5-Modellreihe an, die „kleine Größe + hohe Effizienz“ verspricht. Im Vergleich zu amerikanischen Pendants zeigen sie höhere Genauigkeit bei geringerem Speicherbedarf.

ModellGrößeHauptmerkmale
Qwen 3.5‑0.8B0,8 Mrd. Parameter„Miniatur“ und „schnell“, für Prototypen und mobile Geräte mit begrenzter Autonomie
Qwen 3.5‑2B2 Mrd. ParameterÄhnlich wie 0.8B, aber etwas leistungsfähiger
Qwen 3.5‑4B4 Mrd. ParameterMultimodal, Kontextfenster 262 144 Token; geeignet für leichte Agentenlösungen
Qwen 3.5‑9B9 Mrd. ParameterKann logisch denken, übertrifft OpenAI gpt‑oss‑120B (13,5× mehr Parameter) und erreicht Graduierten-Niveau im logischen Denken

Alle Modelle sind unter der Apache 2.0-Lizenz verfügbar, was ihre Nutzung in kommerziellen Projekten sowie das Nachtrainieren ermöglicht.

Was ist neu in der Architektur?
Alibaba verzichtete auf klassische Transformer und setzte stattdessen ein hybrides Schema um:

* Gated Delta Networks (GDN) – bieten hohe Durchsatzrate und niedrige Latenz.
* Mixture‑of‑Experts (MoE) – lösen das Speicherlimit, typisch für kleine Modelle.

Dankdessen kann Qwen 3.5 multimodale Token sofort verarbeiten, anstatt Bildgeneratoren wie bei früheren Generationen anzuhängen. Die Versionen 4B und 9B erkennen UI-Elemente und zählen Objekte in Videos.

Tests und Ergebnisse
Benchmark | Qwen 3.5‑9B | Vergleich
--- | --- | ---
MMMU‑Pro (visuell) | 70,1 % | Übertrifft Google Gemini 2.5 Flash‑Lite (59,7) und spezialisierte Qwen 3‑VL‑30B‑A3B (63,0)
Logisches Denken | 81,7 % | Mehr als OpenAI gpt‑oss‑120B (80,1), obwohl Letzteres 10× mehr Parameter hat
HMMT Feb 2025 (Mathematik) | 83,2 % (9B), 74,0 % (4B) | Zeigt, dass für komplexe naturwissenschaftliche Aufgaben keine riesigen Cloud-Ressourcen nötig sind
OmniDocBench v1.58 | 7,87 % | Führend unter allen Modellen
MMMLU (Mehrsprachigkeit) | 81,2 % | Übertrifft gpt‑oss‑120B (78,2 %)

Warum ist das wichtig?
Die Einführung von Qwen 3.5 fiel mit der steigenden Nachfrage nach autonomen KI-Agenten zusammen. Moderne Nutzer verlangen nicht nur Chatbots, sondern Systeme, die:

1. Denken – Probleme logisch analysieren.
2. Sehen – Bilder, Videos und UI-Elemente verarbeiten.
3. Handeln – Werkzeuge nutzen (Formulare ausfüllen, Dateien sortieren).

Da große Modelle (mehrere Milliarden Parameter) teuer im Betrieb sind, bietet Qwen 3.5 eine kostengünstigere Lösung. Die Modelle können lokal ohne Cloud‑ oder API-Verbindung betrieben werden; Reinforcement‑Learning ermöglicht „menschliche Entscheidungen“ – z.B. das Organisieren eines Desktops oder die Codeentwicklung anhand von Videoaufzeichnungen.

Praktische Anwendung
* Mobile Geräte – 0,8 Mrd. Parameter passen leicht in ein Smartphone und ermöglichen autonome Nutzung.
* Arbeitsstationen – 9 Mrd. Parameter liefern einen vollständigen Agenten-Set ohne Cloud.
* Interface-Agentur – Durch „Pixel‑Level‑Binding“ können Modelle UI‑Elemente bewegen, Formulare ausfüllen und Dateien sortieren, wobei sie einfache Sprachbefehle mit etwa 90 % Genauigkeit ausführen.

Damit ebnet Alibaba Qwen 3.5 den Weg zu zugänglicheren, flexibleren und leistungsfähigeren KI-Agenten, die sowohl in der Cloud als auch lokal betrieben werden können und den wachsenden Anforderungen moderner Nutzer gerecht werden.

Kommentare (0)

Teile deine Meinung — bitte bleib höflich und beim Thema.

Noch keine Kommentare. Hinterlasse einen Kommentar und teile deine Meinung!

Um einen Kommentar zu hinterlassen, melde dich bitte an.

Zum Kommentieren anmelden