{"id":109305,"date":"2026-04-19T01:36:23","date_gmt":"2026-04-19T04:36:23","guid":{"rendered":"https:\/\/mastertrend.info\/?p=109305"},"modified":"2026-04-23T16:20:19","modified_gmt":"2026-04-23T19:20:19","slug":"groq-3-lpu","status":"publish","type":"post","link":"https:\/\/mastertrend.info\/de\/groq-3-lpu\/","title":{"rendered":"Groq 3 LPU und Nvidias neue Inferenzstrategie"},"content":{"rendered":"<h2>Groq 3 LPU und der strategische Wandel bei Rubin<\/h2>\n<p>Die Vorstellung des Groq 3 auf der GTC 2026 ist mehr als nur eine technische Neuerscheinung: Sie markiert einen strategischen Wandel in der Struktur der Inferenzplattform von Nvidia. Er ist mehr als nur ein neuer Chip; er definiert die interne Hierarchie von Rubin neu und l\u00e4utet eine neue Phase im Wettbewerb um spezialisierte Siliziumchips ein.<\/p>\n<p id=\"c893b5ed-9214-4d2c-9a26-a64e3b2f0213\">Auf der GTC 2026 in San Jose stellte Nvidia den Inferenzbeschleuniger Groq 3 vor: den ersten Chip, der aus dem am 24. Dezember 2025 unterzeichneten Lizenz- und Talentabkommen im Wert von 20 Milliarden US-Dollar hervorgeht. Es handelt sich um eine LPU (Sprachverarbeitungseinheit). <a title=\"PSSR-Technologie f\u00fcr PS5 Pro: So wandeln Sie 1080p-Spiele in 4K um, ohne FPS-Einbu\u00dfen zu erleiden\" href=\"https:\/\/mastertrend.info\/de\/pssr-ps5-pro-technologie\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34712\">basierend auf SRAM, das Nvidia<\/a> Es ist als dedizierter Coprozessor f\u00fcr die Dekodierungsphase in die Vera-Rubin-Plattform integriert. Der Hersteller k\u00fcndigte als voraussichtlichen Liefertermin das dritte Quartal 2026 an; die Produktion \u00fcbernimmt Samsung im 4-nm-Verfahren. Es handelt sich zudem um Nvidias erstes Rack-Scale-Produkt, das auf Nicht-GPU-Chips basiert, und seine Markteinf\u00fchrung hat eine Neuordnung der eigenen Komponenten in der Roadmap erforderlich gemacht.<\/p>\n<p>Das Herzst\u00fcck des Groq 3 LPX ist der LP30-Chip: 512 MB SRAM pro Chip und 150 TB\/s Speicherbandbreite. Zum Vergleich: Eine Rubin-GPU mit 288 GB HBM4 bietet etwa 22 TB\/s; der Gr\u00f6\u00dfenordnungsunterschied ist keine Nuance, sondern eine architektonische Entscheidung. Ein komplettes LPX-Rack beherbergt 256 LPUs mit insgesamt 128 GB SRAM und 40 PB\/s Gesamtbandbreite. Nvidia gibt an, dass ein LPX-Rack in Kombination mit einem Rubin NVL72 in Modellen mit Billionen Parametern bis zu 35-mal so viel Leistung pro Megawatt liefert wie ein NVL72 allein, bei angestrebten Betriebskosten von 45 US-Dollar pro Million Token.<\/p>\n<h2 id=\"groq-3-and-vera-rubin-3\">Groq 3 und die Funktion in Rubin<\/h2>\n<figure id=\"bede7762-1a1c-4278-92c5-37773fe99ee3\" class=\"van-image-figure inline-layout\" data-bordeaux-image-check=\"\"><picture data-new-v2-image=\"true\"><source type=\"image\/webp\" \/><\/picture> <picture data-new-v2-image=\"true\"><img decoding=\"async\" class=\"inline\" src=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.jpg\" alt=\"Rubin-Rack-Darstellung zur Veranschaulichung der SuperPOD-Architektur\" data-new-v2-image=\"true\" data-pin-media=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.jpg\" title=\"\"><\/picture><figcaption class=\"inline-layout\"><span class=\"caption-text\">Nvidia stellte seine Strategie f\u00fcr den Rubin SuperPOD mit sieben Chips auf der GTC 2026 vor. <\/span><span class=\"credit\">(Bildquelle: Nvidia)<\/span><\/figcaption><\/figure>\n<p id=\"02ddbe2c-294b-402e-b0ab-38bdf2539030\">Im geplanten Betrieb \u00fcbernehmen Rubin-GPUs die Vorf\u00fcllphase \u2013 die Verarbeitung langer Kontexte und rechenintensiver Aufgaben \u2013, w\u00e4hrend Groq-LPUs die Dekodierung und Token-Generierung mit reduzierter Latenz durchf\u00fchren. Dynamo orchestriert diese heterogene Verteilung und weist Aufgaben basierend auf Batchgr\u00f6\u00dfe und Parallelit\u00e4t zu, um Leistung und Energieverbrauch optimal auszubalancieren.<\/p>\n<aside class=\"hawk-root\" data-block-type=\"embed\" data-render-type=\"fte\" data-skip=\"dealsy\" data-widget-type=\"seasonal\"><\/aside>\n<p id=\"02ddbe2c-294b-402e-b0ab-38bdf2539030-1\">Groqs urspr\u00fcngliches LPU-Design priorisierte Deterministik: eine VLIW-Pipeline (Very Long Instruction Word) mit gro\u00dfen SRAM-Speichern und einem Compiler, der die Ausf\u00fchrung vorplante und so Cache-Fehler und unerwartete Stopps eliminierte. Dies f\u00fchrte zu sehr hohen Token-Raten pro Benutzer, offenbarte aber ein Kapazit\u00e4tsproblem: Fr\u00fchere Generationen mit 230 MB SRAM pro Chip ben\u00f6tigten viele Dies, um mittelgro\u00dfe Modelle unterzubringen, und die <a title=\"Ein KI-Modell auf der Xbox 360 ausf\u00fchren: Fantastisch \ud83d\udc7e\" href=\"https:\/\/mastertrend.info\/de\/fuhren-sie-ein-ki-modell-auf-der-xbox-360-aus\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34713\">Architektur<\/a> Es wurde von Anfang an auf Faltungsnetzwerke und nicht auf moderne Sprachmodelle ausgerichtet.<\/p>\n<p>Die LP30 mildert einige dieser Einschr\u00e4nkungen mit 512 MB SRAM pro Chip und einer FP8-Rechenleistung von 1,23 PFLOPS. Samsung hat die Produktion \u2013 laut Ank\u00fcndigungen \u2013 durch den \u00dcbergang von der Musterfertigung zur kommerziellen Produktion von rund 9.000 auf rund 15.000 Wafer erh\u00f6ht. Auf der GTC wurde au\u00dferdem bekannt gegeben, dass AWS im Rahmen seiner Infrastrukturerweiterung Groq 3 LPUs zusammen mit \u00fcber einer Million Nvidia-GPUs einsetzen wird.<\/p>\n<p>Neben dem LP30 erw\u00e4hnte Nvidia eine Produkt-Roadmap: einen LP35 mit NVFP4-Unterst\u00fctzung, der auf die Rubin Ultra-Generation abgestimmt sein soll, und einen LP40, der sp\u00e4ter f\u00fcr den Feynman-Architekturzyklus geplant ist.<\/p>\n<h2 id=\"rubin-cpx-axed-3\">Was passiert mit Rubin CPX?<\/h2>\n<p id=\"7dd89f1a-8ce4-4fe4-b7a6-6c732560941c\">Bei GTC fehlte der Rubin CPX, der auf Inferenzbeschleuniger basierende <a title=\"Die Zukunft der Nvidia GeForce RTX 50-Serie: Gr\u00fcnde zur Vorfreude! \ud83c\udfae\" href=\"https:\/\/mastertrend.info\/de\/zukunft-der-nvidia-geforce-rtx-50-serie\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34711\">GDDR7, das Nvidia<\/a> Es war f\u00fcr September 2025 angek\u00fcndigt worden. Es tauchte weder in den Hauptfolien auf, noch war es auf der B\u00fchne pr\u00e4sent. Alles deutet darauf hin \u2013 ohne vollst\u00e4ndige offizielle Best\u00e4tigung \u2013, dass die CPX aus der Roadmap entfernt und in der Plattformhierarchie durch die LPX Groq 3 ersetzt wurde.<\/p>\n<p id=\"54eeb077-5d53-4ff6-afc2-39c0708b5eb1\">CPX wurde urspr\u00fcnglich als kosteng\u00fcnstigere Alternative zur Beschleunigung der Kontextphase mit GDDR7 konzipiert, um dessen h\u00f6here Verf\u00fcgbarkeit angesichts der HBM-Engp\u00e4sse auszunutzen. Die LPUs von Groq machen jedoch gro\u00dfe externe Speichermodule \u00fcberfl\u00fcssig und bieten eine deutlich h\u00f6here Bandbreite pro Chip \u2013 ein klarer Vorteil in einem Markt, in dem HBM weiterhin knapp ist und die GDDR7-Produktion noch im Aufbau begriffen ist. Bereits an Kunden bestellte CPX-Einheiten werden zwar weiterhin ausgeliefert, die strategische Ausrichtung scheint sich jedoch nun hin zur LPU-Integration zu verlagern.<\/p>\n<p>Es gibt auch eine operative Analogie zur \u00dcbernahme von Mellanox im Jahr 2019: Startup-Technologien, die schlie\u00dflich neue Architekturschichten innerhalb der Infrastruktur von Nvidia bilden \u2013 in ihrem Fall NVLink\/InfiniBand \u2013 und in diesem Szenario k\u00f6nnte Groq zu einer \u00e4hnlichen Strukturkomponente innerhalb des Rubin-\u00d6kosystems werden.<\/p>\n<h2 id=\"inference-chip-consolidation-3\">Konsolidierung des Marktes f\u00fcr Inferenzchips<\/h2>\n<p id=\"02efd3bd-85e4-438e-80ce-bbd81597025b\">Der Deal mit Groq war der sichtbarste Teil einer Konsolidierungswelle im Bereich der Inferenzchips, die bis 2025 erwartet wurde. In diesem Jahr \u00fcbernahm AMD das KI-Team von Untether, Nvidia erwarb die Ausr\u00fcstung und das geistige Eigentum von Enfabrica f\u00fcr \u00fcber 900 Millionen US-Dollar, Meta kaufte Rivos, und es gab \u2013 letztlich abgebrochene \u2013 Gespr\u00e4che zwischen Intel und SambaNova, die zu einer Investition von 350 Millionen US-Dollar und einer Partnerschaft f\u00fchrten. Dieser Schritt verdeutlicht, dass der unabh\u00e4ngige Wettbewerb mit Nvidias CUDA-\u00d6kosystem und dessen Gr\u00f6\u00dfe erhebliche wirtschaftliche Herausforderungen mit sich bringt, selbst wenn die Technologie technisch \u00fcberzeugend ist.<\/p>\n<p>Das wiederkehrende Muster ist die \u00dcbernahme von Talenten und Technologien durch die gro\u00dfen Marktteilnehmer. Groq beispielsweise rechnete bis 2025 mit einem Umsatz von rund 500 Millionen Euro, doch diese Summe reichte nicht aus, um angesichts des strategischen Drucks dominanter Hersteller die Unabh\u00e4ngigkeit zu wahren. Analysten weisen darauf hin, dass nicht-exklusive Lizenzvereinbarungen zwar den Anschein von Wettbewerb erwecken, Konkurrenten aber in der Praxis neutralisieren, indem sie deren Technologie in die Plattform des K\u00e4ufers integrieren.<\/p>\n<h2 id=\"hyperscaler-custom-silicon-3\">Kundenspezifische Siliziumchips in Hyperscalern<\/h2>\n<figure id=\"2ef100e3-6e87-4247-ab65-65c55ffa1aa1\" class=\"van-image-figure inline-layout\" data-bordeaux-image-check=\"\"><picture data-new-v2-image=\"true\"><source type=\"image\/webp\" \/><\/picture> <picture data-new-v2-image=\"true\"><img decoding=\"async\" class=\"inline\" src=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.png\" alt=\"Meta MTIA Roadmap-Diagramm f\u00fcr Inferenzbeschleuniger\" data-new-v2-image=\"true\" data-pin-media=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.png\" title=\"\"><\/picture><figcaption class=\"inline-layout\"><span class=\"caption-text\"><a href=\"https:\/\/ai.meta.com\/blog\/meta-mtia-scale-ai-chips-for-billions\/\" target=\"_blank\" rel=\"noopener\" data-schema-attribute=\"mentions\">Meta pr\u00e4sentierte seine MTIA-Roadmap<\/a> k\u00fcrzlich. <\/span><span class=\"credit\">(Bildnachweis: Meta)<\/span><\/figcaption><\/figure>\n<p id=\"2084220b-976c-4b0b-b57a-6176d6a5af92\">W\u00e4hrend Startups in gr\u00f6\u00dfere Unternehmen integriert werden, treiben gro\u00dfe Cloud-Anbieter ihre eigenen Silizium-Inferenzpipelines voran.<\/p>\n<p>Meta k\u00fcndigte die aufeinanderfolgenden Generationen von MTIA an, die gemeinsam mit Broadcom entwickelt wurden: von MTIA 300 \u2013 bereits im Produktiveinsatz f\u00fcr Ranking und Empfehlungen \u2013 bis hin zu MTIA 500, das auf generative Inferenz ausgerichtet ist und f\u00fcr den Masseneinsatz im Jahr 2027 geplant ist. Google h\u00e4lt an seiner TPU-Produktlinie (Ironwood v7) mit TFLOPS-Werten und gro\u00dfen Pods fest, und AWS entwickelt Trainium und Inferentia weiter, obwohl interne Daten bis 2024 eine relativ geringe Akzeptanz im Vergleich zu GPUs in der eigenen Infrastruktur von AWS zeigten.<\/p>\n<p>Branchenumfragen und Prognosen unterstreichen die Bedeutung der Diversifizierung: Im November 2025 stufte die Futurum Group XPU-Beschleuniger als das am schnellsten wachsende Segment bei den Ausgaben f\u00fcr Rechenzentren im Jahr 2026 ein, und TrendForce prognostizierte f\u00fcr dasselbe Jahr einen deutlichen Anstieg der Lieferungen von kundenspezifischen ASICs durch Cloud-Anbieter.<\/p>\n<p>Nvidias Reaktion war eindeutig: die Pr\u00e4senz von Nicht-GPU-Chips auf der eigenen Plattform zu sichern, bevor Dritte dies tun. Die Groq 3 LPU ist der konkrete Beweis f\u00fcr diese Strategie; die Zukunft des Rubin CPX bleibt jedoch vorerst ungewiss.<\/p>\n<p><!-- hermes-editorial-review:related-links:end --><\/p>","protected":false},"excerpt":{"rendered":"<p>Groq 3 LPU markiert die Integration von Nicht-GPU-Silizium in Rubin und spiegelt die Konsolidierung des Marktes f\u00fcr Inferenzchips gegen\u00fcber Hyperscalern und Konkurrenten wider.<\/p>","protected":false},"author":1,"featured_media":109306,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ai_generated_summary":"","iawp_total_views":92,"jnews-multi-image_gallery":[],"jnews_single_post":{"format":"standard","override":[{"template":"1","parallax":"1","fullscreen":"1","layout":"right-sidebar","sidebar":"default-sidebar","second_sidebar":"default-sidebar","sticky_sidebar":"1","share_position":"top","share_float_style":"share-monocrhome","show_share_counter":"1","show_view_counter":"1","show_featured":"1","show_post_meta":"1","show_post_author":"1","show_post_author_image":"1","show_post_date":"1","post_date_format":"default","post_date_format_custom":"Y\/m\/d","show_post_category":"1","show_post_reading_time":"1","post_reading_time_wpm":"300","post_calculate_word_method":"str_word_count","zoom_button_out_step":"2","zoom_button_in_step":"3","show_post_tag":"1","show_prev_next_post":"1","show_popup_post":"1","show_comment_section":"1","number_popup_post":"1","show_author_box":"1","show_post_related":"1","show_inline_post_related":"0"}],"image_override":[{"single_post_thumbnail_size":"crop-500","single_post_gallery_size":"crop-500"}],"trending_post_position":"meta","trending_post_label":"Trending","sponsored_post_label":"Sponsored by","disable_ad":"0","subtitle":""},"jnews_primary_category":[],"jnews_social_meta":[],"jnews_review":[],"enable_review":"","type":"percentage","name":"","summary":"","brand":"","sku":"","good":[],"bad":[],"score_override":"","override_value":"","rating":[],"price":[],"jnews_override_counter":{"view_counter_number":"0","share_counter_number":"0","like_counter_number":"0","dislike_counter_number":"0"},"footnotes":""},"categories":[74],"tags":[1445,1709,1603],"class_list":["post-109305","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-hardware","tag-evergreencontent","tag-gpu","tag-nvidia"],"_links":{"self":[{"href":"https:\/\/mastertrend.info\/de\/wp-json\/wp\/v2\/posts\/109305","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mastertrend.info\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mastertrend.info\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/de\/wp-json\/wp\/v2\/comments?post=109305"}],"version-history":[{"count":11,"href":"https:\/\/mastertrend.info\/de\/wp-json\/wp\/v2\/posts\/109305\/revisions"}],"predecessor-version":[{"id":110474,"href":"https:\/\/mastertrend.info\/de\/wp-json\/wp\/v2\/posts\/109305\/revisions\/110474"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/de\/wp-json\/wp\/v2\/media\/109306"}],"wp:attachment":[{"href":"https:\/\/mastertrend.info\/de\/wp-json\/wp\/v2\/media?parent=109305"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mastertrend.info\/de\/wp-json\/wp\/v2\/categories?post=109305"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mastertrend.info\/de\/wp-json\/wp\/v2\/tags?post=109305"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}