• Über uns
  • Ankündigen
  • Datenschutzrichtlinie
  • Kontaktieren Sie uns
MasterTrend Info – Technologie, Neuigkeiten und Tutorials
  • HOME
    • BLOG
  • Tutorials
  • Hardware
  • Gaming
  • Mobile
  • Sicherheit
  • Windows
  • IA
  • Software
  • Netzwerke
  • Was ist neu
  • de_DEGerman
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
Kein Ergebnis
Sehen Sie alle Ergebnisse
  • HOME
    • BLOG
  • Tutorials
  • Hardware
  • Gaming
  • Mobile
  • Sicherheit
  • Windows
  • IA
  • Software
  • Netzwerke
  • Was ist neu
  • de_DEGerman
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
Kein Ergebnis
Sehen Sie alle Ergebnisse
MasterTrend Info – Technologie, Neuigkeiten und Tutorials
Kein Ergebnis
Sehen Sie alle Ergebnisse
Start Hardware

Groq 3 LPU und Nvidias neue Inferenzstrategie

MasterTrend Einblicke von MasterTrend Einblicke
23. April 2026
in Hardware
Lesen Zeit:6 min Lesen
0
Vergleich der Groq 3 LPU und der Rubin GPU von Nvidia in diesem Bild, das das Chipdesign für KI-Inferenz und Nvidias neue Strategie im Bereich KI-Beschleunigerhardware zeigt.

Groq 3 LPU und Nvidias neue Inferenzstrategie: Ein visueller Vergleich zwischen Nvidias Rubin-GPU und dem Groq 3 LPU-Chip verdeutlicht die Unterschiede in Architektur, Leistung und Effizienz für KI-Workloads. Ein Blick in die Zukunft spezialisierter KI-Inferenzhardware, Hochleistungsbeschleuniger und für generative Modelle und LLMs optimierter Rechenzentren.

50
FREIGEGEBEN
140
Ansichten
Share on FacebookAuf Twitter teilen

Inhalt

  1. Groq 3 LPU und der strategische Wandel bei Rubin
  2. Groq 3 und die Funktion in Rubin
  3. Was passiert mit Rubin CPX?
  4. Konsolidierung des Marktes für Inferenzchips
  5. Kundenspezifische Siliziumchips in Hyperscalern

Groq 3 LPU und der strategische Wandel bei Rubin

Die Vorstellung des Groq 3 auf der GTC 2026 ist mehr als nur eine technische Neuerscheinung: Sie markiert einen strategischen Wandel in der Struktur der Inferenzplattform von Nvidia. Er ist mehr als nur ein neuer Chip; er definiert die interne Hierarchie von Rubin neu und läutet eine neue Phase im Wettbewerb um spezialisierte Siliziumchips ein.

Auf der GTC 2026 in San Jose stellte Nvidia den Inferenzbeschleuniger Groq 3 vor: den ersten Chip, der aus dem am 24. Dezember 2025 unterzeichneten Lizenz- und Talentabkommen im Wert von 20 Milliarden US-Dollar hervorgeht. Es handelt sich um eine LPU (Sprachverarbeitungseinheit). basierend auf SRAM, das Nvidia Es ist als dedizierter Coprozessor für die Dekodierungsphase in die Vera-Rubin-Plattform integriert. Der Hersteller kündigte als voraussichtlichen Liefertermin das dritte Quartal 2026 an; die Produktion übernimmt Samsung im 4-nm-Verfahren. Es handelt sich zudem um Nvidias erstes Rack-Scale-Produkt, das auf Nicht-GPU-Chips basiert, und seine Markteinführung hat eine Neuordnung der eigenen Komponenten in der Roadmap erforderlich gemacht.

Das Herzstück des Groq 3 LPX ist der LP30-Chip: 512 MB SRAM pro Chip und 150 TB/s Speicherbandbreite. Zum Vergleich: Eine Rubin-GPU mit 288 GB HBM4 bietet etwa 22 TB/s; der Größenordnungsunterschied ist keine Nuance, sondern eine architektonische Entscheidung. Ein komplettes LPX-Rack beherbergt 256 LPUs mit insgesamt 128 GB SRAM und 40 PB/s Gesamtbandbreite. Nvidia gibt an, dass ein LPX-Rack in Kombination mit einem Rubin NVL72 in Modellen mit Billionen Parametern bis zu 35-mal so viel Leistung pro Megawatt liefert wie ein NVL72 allein, bei angestrebten Betriebskosten von 45 US-Dollar pro Million Token.

Groq 3 und die Funktion in Rubin

Rubin-Rack-Darstellung zur Veranschaulichung der SuperPOD-Architektur
Nvidia stellte seine Strategie für den Rubin SuperPOD mit sieben Chips auf der GTC 2026 vor. (Bildquelle: Nvidia)

Im geplanten Betrieb übernehmen Rubin-GPUs die Vorfüllphase – die Verarbeitung langer Kontexte und rechenintensiver Aufgaben –, während Groq-LPUs die Dekodierung und Token-Generierung mit reduzierter Latenz durchführen. Dynamo orchestriert diese heterogene Verteilung und weist Aufgaben basierend auf Batchgröße und Parallelität zu, um Leistung und Energieverbrauch optimal auszubalancieren.

Groqs ursprüngliches LPU-Design priorisierte Deterministik: eine VLIW-Pipeline (Very Long Instruction Word) mit großen SRAM-Speichern und einem Compiler, der die Ausführung vorplante und so Cache-Fehler und unerwartete Stopps eliminierte. Dies führte zu sehr hohen Token-Raten pro Benutzer, offenbarte aber ein Kapazitätsproblem: Frühere Generationen mit 230 MB SRAM pro Chip benötigten viele Dies, um mittelgroße Modelle unterzubringen, und die Architektur Es wurde von Anfang an auf Faltungsnetzwerke und nicht auf moderne Sprachmodelle ausgerichtet.

Die LP30 mildert einige dieser Einschränkungen mit 512 MB SRAM pro Chip und einer FP8-Rechenleistung von 1,23 PFLOPS. Samsung hat die Produktion – laut Ankündigungen – durch den Übergang von der Musterfertigung zur kommerziellen Produktion von rund 9.000 auf rund 15.000 Wafer erhöht. Auf der GTC wurde außerdem bekannt gegeben, dass AWS im Rahmen seiner Infrastrukturerweiterung Groq 3 LPUs zusammen mit über einer Million Nvidia-GPUs einsetzen wird.

Neben dem LP30 erwähnte Nvidia eine Produkt-Roadmap: einen LP35 mit NVFP4-Unterstützung, der auf die Rubin Ultra-Generation abgestimmt sein soll, und einen LP40, der später für den Feynman-Architekturzyklus geplant ist.

Was passiert mit Rubin CPX?

Bei GTC fehlte der Rubin CPX, der auf Inferenzbeschleuniger basierende GDDR7, das Nvidia Es war für September 2025 angekündigt worden. Es tauchte weder in den Hauptfolien auf, noch war es auf der Bühne präsent. Alles deutet darauf hin – ohne vollständige offizielle Bestätigung –, dass die CPX aus der Roadmap entfernt und in der Plattformhierarchie durch die LPX Groq 3 ersetzt wurde.

CPX wurde ursprünglich als kostengünstigere Alternative zur Beschleunigung der Kontextphase mit GDDR7 konzipiert, um dessen höhere Verfügbarkeit angesichts der HBM-Engpässe auszunutzen. Die LPUs von Groq machen jedoch große externe Speichermodule überflüssig und bieten eine deutlich höhere Bandbreite pro Chip – ein klarer Vorteil in einem Markt, in dem HBM weiterhin knapp ist und die GDDR7-Produktion noch im Aufbau begriffen ist. Bereits an Kunden bestellte CPX-Einheiten werden zwar weiterhin ausgeliefert, die strategische Ausrichtung scheint sich jedoch nun hin zur LPU-Integration zu verlagern.

Es gibt auch eine operative Analogie zur Übernahme von Mellanox im Jahr 2019: Startup-Technologien, die schließlich neue Architekturschichten innerhalb der Infrastruktur von Nvidia bilden – in ihrem Fall NVLink/InfiniBand – und in diesem Szenario könnte Groq zu einer ähnlichen Strukturkomponente innerhalb des Rubin-Ökosystems werden.

Konsolidierung des Marktes für Inferenzchips

Der Deal mit Groq war der sichtbarste Teil einer Konsolidierungswelle im Bereich der Inferenzchips, die bis 2025 erwartet wurde. In diesem Jahr übernahm AMD das KI-Team von Untether, Nvidia erwarb die Ausrüstung und das geistige Eigentum von Enfabrica für über 900 Millionen US-Dollar, Meta kaufte Rivos, und es gab – letztlich abgebrochene – Gespräche zwischen Intel und SambaNova, die zu einer Investition von 350 Millionen US-Dollar und einer Partnerschaft führten. Dieser Schritt verdeutlicht, dass der unabhängige Wettbewerb mit Nvidias CUDA-Ökosystem und dessen Größe erhebliche wirtschaftliche Herausforderungen mit sich bringt, selbst wenn die Technologie technisch überzeugend ist.

Das wiederkehrende Muster ist die Übernahme von Talenten und Technologien durch die großen Marktteilnehmer. Groq beispielsweise rechnete bis 2025 mit einem Umsatz von rund 500 Millionen Euro, doch diese Summe reichte nicht aus, um angesichts des strategischen Drucks dominanter Hersteller die Unabhängigkeit zu wahren. Analysten weisen darauf hin, dass nicht-exklusive Lizenzvereinbarungen zwar den Anschein von Wettbewerb erwecken, Konkurrenten aber in der Praxis neutralisieren, indem sie deren Technologie in die Plattform des Käufers integrieren.

Kundenspezifische Siliziumchips in Hyperscalern

Meta MTIA Roadmap-Diagramm für Inferenzbeschleuniger
Meta präsentierte seine MTIA-Roadmap kürzlich. (Bildnachweis: Meta)

Während Startups in größere Unternehmen integriert werden, treiben große Cloud-Anbieter ihre eigenen Silizium-Inferenzpipelines voran.

Meta kündigte die aufeinanderfolgenden Generationen von MTIA an, die gemeinsam mit Broadcom entwickelt wurden: von MTIA 300 – bereits im Produktiveinsatz für Ranking und Empfehlungen – bis hin zu MTIA 500, das auf generative Inferenz ausgerichtet ist und für den Masseneinsatz im Jahr 2027 geplant ist. Google hält an seiner TPU-Produktlinie (Ironwood v7) mit TFLOPS-Werten und großen Pods fest, und AWS entwickelt Trainium und Inferentia weiter, obwohl interne Daten bis 2024 eine relativ geringe Akzeptanz im Vergleich zu GPUs in der eigenen Infrastruktur von AWS zeigten.

Branchenumfragen und Prognosen unterstreichen die Bedeutung der Diversifizierung: Im November 2025 stufte die Futurum Group XPU-Beschleuniger als das am schnellsten wachsende Segment bei den Ausgaben für Rechenzentren im Jahr 2026 ein, und TrendForce prognostizierte für dasselbe Jahr einen deutlichen Anstieg der Lieferungen von kundenspezifischen ASICs durch Cloud-Anbieter.

Nvidias Reaktion war eindeutig: die Präsenz von Nicht-GPU-Chips auf der eigenen Plattform zu sichern, bevor Dritte dies tun. Die Groq 3 LPU ist der konkrete Beweis für diese Strategie; die Zukunft des Rubin CPX bleibt jedoch vorerst ungewiss.

Teilen Sie dies:
auf facebook.LinkedInPinterestXRedditTumblrBlueskyThemenAktieChatGPTClaudeGoogle AIGrok
Tags: EvergreenContentGPUNvidia
Frühere Publikation

C2-Botnetz-Infrastruktur: Auswirkungen nach der internationalen Operation

Nächste Veröffentlichung

Minecraft auf E Ink: Reale Bildschirmgrenzen

MasterTrend Einblicke

MasterTrend Einblicke

Unsere Redaktion teilt sich einen deep-dive-Analyse, tutorials und Empfehlungen für das erhalten die die meisten aus Ihrem Geräte und digitale tools.

RelatedPublikationen

AMD UDNA-Architektur für PS6 und Xbox Next, Details zum GPU-Chip der nächsten Generation mit fortschrittlichem Design für Hochleistungsspielkonsolen.
Hardware

UDNA-Architektur in PS6 und Xbox Next: Mehr als nur Zahlen

4. Mai 2026
136
FSR 4.1 AMD: Werbeillustration der FidelityFX Super Resolution mit einem futuristischen rot-schwarzen Design, die die Leistungs- und Qualitätsverbesserungen der RDNA 4 GPUs hervorhebt.
Hardware

FSR 4.1 AMD: Tatsächliche Verbesserungen und Einschränkungen in RDNA 4

4. Mai 2026
206
ThinkPad X9-14 Gen 1 Laptop (unverpackt) mit Windows 11 Display und Copilot, Premium-Ultradünn-Design, Tastatur mit Hintergrundbeleuchtung sowie technische Analyse der Leistung und wichtiger Kaufentscheidungen.
Hardware

ThinkPad X9-14 Gen 1: Technische Analyse und wichtige Entscheidungen

18. Februar 2026
211
ThinkPad T14 Gen 4 AMD-Wartung im realen Einsatz, Laptop geöffnet und in Betrieb während einer technischen Überprüfung in einer professionellen Umgebung.
Hardware

ThinkPad T14 Gen 4 AMD-Wartung im realen Einsatz

28. April 2026
166
Haltbarkeit der Wärmeleitpaste – Auftragen von Wärmeleitpaste auf den Prozessor zur Verbesserung der Kühlung und Erklärung, wie lange die Wärmeleitpaste auf der CPU hält.
Hardware

Lebensdauer der Wärmeleitpaste und ihre Auswirkungen auf die PC-Leistung

28. Januar 2026
419
Lohnt es sich, heute in PCIe 7.0 zu investieren? – PCI-SIG gibt die endgültigen PCIe 7.0-Spezifikationen bekannt und hebt den neuen PCI-Express-Standard mit Geschwindigkeiten von bis zu 128 GT/s für die nächste Computergeneration hervor.
Hardware

Lohnt es sich, heute in PCIe 7.0 zu investieren? Reale Auswirkungen und Szenarien

28. Januar 2026
199
Nächste Veröffentlichung
Minecraft auf E Ink: Minecraft läuft auf einem Tablet mit einem E Ink-Graustufendisplay und zeigt die tatsächlichen Grenzen von E Ink in Bezug auf Leistung und Bildqualität während des Spielens.

Minecraft auf E Ink: Reale Bildschirmgrenzen

5 1 Abstimmung
Artikelbewertung
Abonnieren
Zugang
Benachrichtigen Sie über
Gast
Gast
0 Kommentare
älteste
Neueste Die meisten haben abgestimmt
Online-Kommentare
Alle Kommentare anzeigen

In Verbindung Bleiben

  • 976 Fans
  • 118 Anhänger
  • 1.4 k Anhänger
  • 1.8 k Abonnenten
  • Trends
  • Kommentare
  • Letzten
🖥️ How to öffnen Sie "Geräte und Drucker" unter Windows 11: 4 einfache Schritte,

🌟 How to öffnen Sie "Geräte und Drucker" unter Windows 11: ¡Erstaunlichen trick!

21. Juni 2026
Permanente Uhr in Windows 11: Optionen zur Anzeige einer permanenten Uhr, Einschränkungen und praktische Entscheidungen, mit blauem Hintergrund, Windows-Symbol und minimalistischer analoger Uhr.

Permanente Uhr in Windows 11: Optionen, Grenzen und wichtige Entscheidungen

21. Juni 2026
Ethernet funktioniert nicht unter Windows 11: 9 einfache Tricks

Ethernet funktioniert nicht unter Windows 11: 3-Minuten-Lösung ⚡🌐

13. November 2025
Wie zu speichern Spiel in REPO

Wie zu speichern Spiel in REPO 🔥 Entdecken Sie das Geheimnis, um nicht zu verlieren Fortschritte

7 Juli 2025
Features von Gmail auf Android: Sparen Sie Zeit, mit 5 Tipps,

Features von Gmail in Android: 5 tricks, die Sie nicht kennen! 📱✨

12
Reparatur des Notebook-Motherboards: Innenansicht mit Motherboard, Kühlsystem, Lüftern und wichtigen Komponenten, die bei einem geöffneten Laptop überprüft werden müssen

Reparatur des Notebook-Motherboards – Schritt-für-Schritt-Diagnose

10
Installieren Sie Windows 11 zu Hause ohne Internet

Installieren Sie Windows 11 zu Hause ohne Internet

10
Wie backup-Treiber in der Windows-11/10 in 4 Schritten!

Wie backup-Treiber in Windows 11/10 Es Verhindert, dass Fehler! 🚨💾

10
Datenschutz in Windows 11 – Eine Frau konfiguriert zu Hause mit O&O ShutUp10++ die Datenschutzoptionen in Windows 11 auf ihrem Laptop und zeigt dabei Sicherheitseinstellungen und Datenkontrolle auf dem Bildschirm an.

Datenschutz in Windows 11 mit O&O ShutUp10++

21. Juni 2026
Optionale Windows 11-Funktionen – Eine Frau aktiviert optionale Funktionen in den Systemeinstellungen eines Windows 11-Laptops; Leitfaden zur Aktivierung bzw. Deaktivierung optionaler Windows 11-Funktionen in einer modernen Büroumgebung

Optionale Funktionen in Windows 11: Wann man sie ein- oder ausschalten sollte

21. Juni 2026
Saros-Enden: A. Devraj in futuristischer Soltari-Rüstung in einer düsteren und dramatischen Szene, Analyse des Hauptendes und des geheimen Endes des Videospiels.

Saros-Enden: Analyse des Haupt- und des geheimen Endes

14. Juni 2026
AMD UDNA-Architektur für PS6 und Xbox Next, Details zum GPU-Chip der nächsten Generation mit fortschrittlichem Design für Hochleistungsspielkonsolen.

UDNA-Architektur in PS6 und Xbox Next: Mehr als nur Zahlen

4. Mai 2026

Aktuelle Nachrichten

Datenschutz in Windows 11 – Eine Frau konfiguriert zu Hause mit O&O ShutUp10++ die Datenschutzoptionen in Windows 11 auf ihrem Laptop und zeigt dabei Sicherheitseinstellungen und Datenkontrolle auf dem Bildschirm an.

Datenschutz in Windows 11 mit O&O ShutUp10++

21. Juni 2026
59
Optionale Windows 11-Funktionen – Eine Frau aktiviert optionale Funktionen in den Systemeinstellungen eines Windows 11-Laptops; Leitfaden zur Aktivierung bzw. Deaktivierung optionaler Windows 11-Funktionen in einer modernen Büroumgebung

Optionale Funktionen in Windows 11: Wann man sie ein- oder ausschalten sollte

21. Juni 2026
65
Saros-Enden: A. Devraj in futuristischer Soltari-Rüstung in einer düsteren und dramatischen Szene, Analyse des Hauptendes und des geheimen Endes des Videospiels.

Saros-Enden: Analyse des Haupt- und des geheimen Endes

14. Juni 2026
97
AMD UDNA-Architektur für PS6 und Xbox Next, Details zum GPU-Chip der nächsten Generation mit fortschrittlichem Design für Hochleistungsspielkonsolen.

UDNA-Architektur in PS6 und Xbox Next: Mehr als nur Zahlen

4. Mai 2026
136
MasterTrend Info-Logo

MasterTrend-Info ist Ihre Quelle Technologie: entdecken Sie news, tutorials und Analyse von hardware -, software -, gaming -, mobile und künstliche Intelligenz. Abonnieren Sie unseren newsletter und verpassen Sie keine Trends.

Folgen Sie uns

Durchsuchen durch Kategorie

  • Gaming
  • Hardware
  • IA
  • Mobile
  • Was ist neu
  • Netzwerke
  • Sicherheit
  • Software
  • Tutorials
  • Windows

Aktuelle Nachrichten

Datenschutz in Windows 11 – Eine Frau konfiguriert zu Hause mit O&O ShutUp10++ die Datenschutzoptionen in Windows 11 auf ihrem Laptop und zeigt dabei Sicherheitseinstellungen und Datenkontrolle auf dem Bildschirm an.

Datenschutz in Windows 11 mit O&O ShutUp10++

21. Juni 2026
Optionale Windows 11-Funktionen – Eine Frau aktiviert optionale Funktionen in den Systemeinstellungen eines Windows 11-Laptops; Leitfaden zur Aktivierung bzw. Deaktivierung optionaler Windows 11-Funktionen in einer modernen Büroumgebung

Optionale Funktionen in Windows 11: Wann man sie ein- oder ausschalten sollte

21. Juni 2026
  • Über uns
  • Ankündigen
  • Datenschutzrichtlinie
  • Kontaktieren Sie uns

Copyright © 2025 https://mastertrend.info/ – Alle Rechte vorbehalten. Alle Marken sind Eigentum ihrer jeweiligen Inhaber.

We've detected you might be speaking a different language. Do you want to change to:
es_ES Spanish
es_ES Spanish
en_US English
pt_BR Portuguese
fr_FR French
it_IT Italian
ru_RU Russian
de_DE German
zh_CN Chinese
ko_KR Korean
ja Japanese
th Thai
hi_IN Hindi
ar Arabic
tr_TR Turkish
pl_PL Polish
id_ID Indonesian
nl_NL Dutch
sv_SE Swedish
Change Language
Close and do not switch language
Kein Ergebnis
Sehen Sie alle Ergebnisse
  • de_DEGerman
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • pl_PLPolish
    • id_IDIndonesian
    • tr_TRTurkish
    • hi_INHindi
    • thThai
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
  • Gaming
  • Hardware
  • IA
  • Mobile
  • Was ist neu
  • Netzwerke
  • Sicherheit
  • Software
  • Tutorials
  • Windows

Copyright © 2025 https://mastertrend.info/ – Alle Rechte vorbehalten. Alle Marken sind Eigentum ihrer jeweiligen Inhaber.

wpDiscuz
RedditBlueskyXMastodonHacker News
Teilen Sie dies:
MastodonVKWhatsAppTelegrammSMSLineMessengerFlipboardHacker NewsMixNextdoorRatlosigkeitXingYummly
Ihre Mastodon-Instanz