Ollama unterstützt jetzt Hardwarebeschleunigung auf Apple M5-Chips, wenn 32 GB RAM installiert sind

05.04.2026 23 software

Ollama – die App zum lokalen Ausführen von KI-Modellen ist jetzt auf M5‑Chips schneller

So sieht es aus
Neue Version: Ollama 0.19
Unterstützte Betriebssysteme: Windows, macOS, Linux
Hardwarebeschleunigung: Nur für Apple‑M5-Chips (M5 Pro, M5 Max)
Speicheranforderungen: Mindestens 32 GB Unified RAM

Was sich geändert hat
Ollama ermöglicht es Benutzern, KI-Modelle direkt auf ihrem Computer zu laden und auszuführen. Im Gegensatz zu Cloud-Diensten wie ChatGPT ist keine ständige Internetverbindung erforderlich.

Ab Version 0.19 haben die Entwickler Unterstützung für Apple MLX – das maschinelle Lernframework – sowie für Unified Memory Architecture hinzugefügt. Dadurch wird die Modellleistung auf den neuen Apple‑M5-Chips beschleunigt, die Zeit bis zum ersten Token verkürzt und die Gesamtgenerierungsgeschwindigkeit erhöht.

Wie es funktioniert
* Neuronale Beschleuniger: Ollama greift auf spezialisierte neuronale Netzblöcke innerhalb der M5-Chips zu, wodurch Tokens schneller ausgegeben werden.

* Modelle: Schnellere Ausführung sowohl für persönliche KI‑Agenten (z. B. OpenClaw) als auch für größere Systeme – OpenCode, Anthropic Claude Code, OpenAI Codex und mehr.

Beschränkungen
1. Beschleunigung ist nur auf Apple‑M5-Chips (M5 Pro/Max) verfügbar.

2. Der Computer muss mindestens 32 GB Unified RAM haben; sonst funktioniert die Beschleunigung nicht.

Daher können Sie mit einem Mac, der einen M5-Chip und ausreichenden RAM besitzt, die Leistung Ihrer lokalen KI-Anwendung Ollama deutlich steigern.

Ollama unterstützt jetzt Hardwarebeschleunigung auf Apple M5-Chips, wenn 32 GB RAM installiert sind

Related news

Google Gemini hat 750 Millionen monatlich aktive Nutzer erreicht und lässt ChatGPT nur noch einen kleinen Abstand zum Marktführer zurücklassen.

Nothing stellte die Beta-Version von Essential Apps vor – eine Plattform zur Erstellung von Mini-Anwendungen mithilfe künstlicher Intelligenz

Microsoft erklärte, warum die Konten von VeraCrypt und anderer öffentlicher Dienste blockiert wurden – aufgrund der Fahrlässigkeit ihrer Entwickler.

Die Anwendung Meta✴ AI belegte nach dem Start von Muse Spark den fünften Platz im App Store

Kommentare (0)

Zum Kommentieren anmelden

Ollama unterstützt jetzt Hardwarebeschleunigung auf Apple M5-Chips, wenn 32 GB RAM installiert sind

Related news

Google Gemini hat 750 Millionen monatlich aktive Nutzer erreicht und lässt ChatGPT nur noch einen kleinen Abstand zum Marktführer zurücklassen.

Nothing stellte die Beta-Version von Essential Apps vor – eine Plattform zur Erstellung von Mini-Anwendungen mithilfe künstlicher Intelligenz

Microsoft erklärte, warum die Konten von VeraCrypt und anderer öffentlicher Dienste blockiert wurden – aufgrund der Fahrlässigkeit ihrer Entwickler.

Die Anwendung Meta✴ AI belegte nach dem Start von Muse Spark den fünften Platz im App Store

Zum Kommentieren anmelden

Ollama unterstützt jetzt Hardwarebeschleunigung auf Apple M5-Chips, wenn 32 GB RAM installiert sind

Nothing stellte die Beta-Version von Essential Apps vor – eine Plattform zur Erstellung von Mini-Anwendungen mithilfe künstlicher Intelligenz

Die Anwendung Meta✴ AI belegte nach dem Start von Muse Spark den fünften Platz im App Store