Nvidia bereitet sich auf den Kampf um Inferenz vor, indem es einen Chip auf Basis der Groq-Technologien für OpenAI und KI-Agenten entwickelt.
Neuer Nvidia-Chip – ein Schritt zu schnelleren KI-Anwendungen
Nvidia plant, im März einen neuen Prozessor vorzustellen, der speziell für die Beschleunigung von Inferenz (Berechnungen bereits trainierter Modelle) entwickelt wurde und sich an Kunden wie OpenAI richtet. Dies ist eine Richtungsänderung des Unternehmens, das zuvor überwiegend auf das Training von KI-Systemen fokussiert war.
Was genau kommt
- Die neue Plattform wird bei der Entwicklerkonferenz GTC (Graphics Technology Conference) vorgestellt.
- Im Kern der Plattform steht ein Chip vom Startup Groq – einer der schnellsten Lösungen für Inferenz.
- Die Plattform soll mit den eigenen Beschleunigern von Google und Amazon konkurrieren, die bereits erhebliche Erfolge erzielt haben.
Warum das wichtig ist
Mit dem wachsenden Trend zum „Web‑Coding“ (KI-Codegenerierung aus Text) steigt die Nachfrage nach schnellerer und energieeffizienterer Infrastruktur.
Für OpenAI wird der neue Prozessor zu einem entscheidenden Faktor:
- Im Januar schloss das Unternehmen eine Vereinbarung mit Cerebras über einen auf Inferenz ausgelegten Chip, den sie als schneller als die Konkurrenz bewerten.
- Kurz vor dem Termin kündigte OpenAI einen großen Deal mit Nvidia an, bei dem sie „dedizierte Inferenzkapazitäten“ erhielten und 30 Mrd. USD von einem „grünen“ Hersteller investierten.
Wettbewerbsumfeld
Unternehmen | Produkt | Ausrichtung
Nvidia | GPU-Familie Hopper, Blackwell, Rubin | Training und Inferenz
Google | TPU | Inferenz
Amazon | Trainium | Inferenz
Cerebras | Spezialchip | Inferenz
Groq | Chips mit „Sprachverarbeitungsblöcken“ | Inferenz
Nvidia hält mehr als 90 % des GPU-Marktes, aber seine Chips gelten oft als teuer und energieintensiv für Inferenzaufgaben. Das zieht Unternehmen an, die nach Alternativen suchen.
Kernanwendungen
- Codegenerierung: Dienste wie Claude Code (Anthropic) und Codex (OpenAI) nutzen Cloud-Infrastrukturen von Amazon und Google, aber Codex plant den Wechsel zur neuen Nvidia-Plattform.
- Werbeanalyse: Meta arbeitet mit Nvidia zusammen für KI‑Inferenz, bei der zentrale Prozessoren am effizientesten sind.
Fazit
Nvidia erweitert nicht nur seine Produktpalette, sondern tritt auch in direkten Wettbewerb mit Branchenriesen. Der neue Chip, integriert mit dem Startup Groq, könnte ein entscheidender Faktor für Unternehmen sein, die eine schnellere und kostengünstigere Verarbeitung von KI‑Modellen anstreben.
Kommentare (0)
Teile deine Meinung — bitte bleib höflich und beim Thema.
Zum Kommentieren anmelden