Alibaba startet kompakte Qwen 3.5‑Modelle, die direkt auf Laptops laufen und die von OpenAI angebotenen Modelle übertreffen.
Alibaba Qwen 3.5 – neue Serie kompakter KI-Modelle
Im Rahmen seiner AI-Abteilung kündigte Alibaba die Einführung der Qwen 3.5-Modellreihe an, die „kleine Größe + hohe Effizienz“ verspricht. Im Vergleich zu amerikanischen Pendants zeigen sie höhere Genauigkeit bei geringerem Speicherbedarf.
| Modell | Größe | Hauptmerkmale |
|---|---|---|
| Qwen 3.5‑0.8B | 0,8 Mrd. Parameter | „Miniatur“ und „schnell“, für Prototypen und mobile Geräte mit begrenzter Autonomie |
| Qwen 3.5‑2B | 2 Mrd. Parameter | Ähnlich wie 0.8B, aber etwas leistungsfähiger |
| Qwen 3.5‑4B | 4 Mrd. Parameter | Multimodal, Kontextfenster 262 144 Token; geeignet für leichte Agentenlösungen |
| Qwen 3.5‑9B | 9 Mrd. Parameter | Kann logisch denken, übertrifft OpenAI gpt‑oss‑120B (13,5× mehr Parameter) und erreicht Graduierten-Niveau im logischen Denken |
Alle Modelle sind unter der Apache 2.0-Lizenz verfügbar, was ihre Nutzung in kommerziellen Projekten sowie das Nachtrainieren ermöglicht.
Was ist neu in der Architektur?
Alibaba verzichtete auf klassische Transformer und setzte stattdessen ein hybrides Schema um:
* Gated Delta Networks (GDN) – bieten hohe Durchsatzrate und niedrige Latenz.
* Mixture‑of‑Experts (MoE) – lösen das Speicherlimit, typisch für kleine Modelle.
Dankdessen kann Qwen 3.5 multimodale Token sofort verarbeiten, anstatt Bildgeneratoren wie bei früheren Generationen anzuhängen. Die Versionen 4B und 9B erkennen UI-Elemente und zählen Objekte in Videos.
Tests und Ergebnisse
Benchmark | Qwen 3.5‑9B | Vergleich
--- | --- | ---
MMMU‑Pro (visuell) | 70,1 % | Übertrifft Google Gemini 2.5 Flash‑Lite (59,7) und spezialisierte Qwen 3‑VL‑30B‑A3B (63,0)
Logisches Denken | 81,7 % | Mehr als OpenAI gpt‑oss‑120B (80,1), obwohl Letzteres 10× mehr Parameter hat
HMMT Feb 2025 (Mathematik) | 83,2 % (9B), 74,0 % (4B) | Zeigt, dass für komplexe naturwissenschaftliche Aufgaben keine riesigen Cloud-Ressourcen nötig sind
OmniDocBench v1.58 | 7,87 % | Führend unter allen Modellen
MMMLU (Mehrsprachigkeit) | 81,2 % | Übertrifft gpt‑oss‑120B (78,2 %)
Warum ist das wichtig?
Die Einführung von Qwen 3.5 fiel mit der steigenden Nachfrage nach autonomen KI-Agenten zusammen. Moderne Nutzer verlangen nicht nur Chatbots, sondern Systeme, die:
1. Denken – Probleme logisch analysieren.
2. Sehen – Bilder, Videos und UI-Elemente verarbeiten.
3. Handeln – Werkzeuge nutzen (Formulare ausfüllen, Dateien sortieren).
Da große Modelle (mehrere Milliarden Parameter) teuer im Betrieb sind, bietet Qwen 3.5 eine kostengünstigere Lösung. Die Modelle können lokal ohne Cloud‑ oder API-Verbindung betrieben werden; Reinforcement‑Learning ermöglicht „menschliche Entscheidungen“ – z.B. das Organisieren eines Desktops oder die Codeentwicklung anhand von Videoaufzeichnungen.
Praktische Anwendung
* Mobile Geräte – 0,8 Mrd. Parameter passen leicht in ein Smartphone und ermöglichen autonome Nutzung.
* Arbeitsstationen – 9 Mrd. Parameter liefern einen vollständigen Agenten-Set ohne Cloud.
* Interface-Agentur – Durch „Pixel‑Level‑Binding“ können Modelle UI‑Elemente bewegen, Formulare ausfüllen und Dateien sortieren, wobei sie einfache Sprachbefehle mit etwa 90 % Genauigkeit ausführen.
Damit ebnet Alibaba Qwen 3.5 den Weg zu zugänglicheren, flexibleren und leistungsfähigeren KI-Agenten, die sowohl in der Cloud als auch lokal betrieben werden können und den wachsenden Anforderungen moderner Nutzer gerecht werden.
Kommentare (0)
Teile deine Meinung — bitte bleib höflich und beim Thema.
Zum Kommentieren anmelden