• Over Ons
  • Aankondigen
  • Privacy beleid
  • Contact met ons
MasterTrend Info - Technologie, nieuws en tutorials
  • THUIS
    • BLOG
  • Tutorials
  • Hardware
  • Gaming
  • Mobiel
  • Veiligheid
  • Windows
  • IA
  • Software
  • Netwerken
  • Wat is er nieuw
  • nl_NLDutch
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
Geen resultaat
Zie alle resultaten
  • THUIS
    • BLOG
  • Tutorials
  • Hardware
  • Gaming
  • Mobiel
  • Veiligheid
  • Windows
  • IA
  • Software
  • Netwerken
  • Wat is er nieuw
  • nl_NLDutch
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
Geen resultaat
Zie alle resultaten
MasterTrend Info - Technologie, nieuws en tutorials
Geen resultaat
Zie alle resultaten
Thuis Hardware

Groq 3 LPU en Nvidia's nieuwe inferentiestrategie

MasterTrend Inzichten door MasterTrend Inzichten
23 april 2026
in Hardware
Leestijd:6 min lezen
0
De Groq 3 LPU en Rubin GPU van Nvidia worden in deze afbeelding vergeleken, waarbij het chipontwerp voor inferentie met kunstmatige intelligentie en Nvidia's nieuwe strategie voor AI-acceleratorhardware wordt getoond.

Groq 3 LPU en Nvidia's nieuwe inferentiestrategie: een visuele vergelijking tussen Nvidia's Rubin GPU en de Groq 3 LPU-chip, waarbij de verschillen in architectuur, prestaties en efficiëntie voor AI-workloads worden belicht. Een blik op de toekomst van gespecialiseerde AI-inferentiehardware, krachtige accelerators en datacenters geoptimaliseerd voor generatieve modellen en LLM's.

50
GEDEELD
138
Uitzicht
Deel op FacebookDelen op Twitter

Inhoud

  1. Groq 3 LPU en de strategische verschuiving bij Rubin
  2. Groq 3 en de functie in Rubin
  3. Wat is er aan de hand met Rubin CPX?
  4. Consolidatie van de markt voor inferentiechips
  5. Op maat gemaakte siliciumchips in hyperscalers

Groq 3 LPU en de strategische verschuiving bij Rubin

De onthulling van de Groq 3 op GTC 2026 is meer dan alleen een technische lancering: het markeert een strategische verschuiving in de manier waarop Nvidia zijn inferentieplatform structureert. Het is meer dan alleen een nieuwe chip; het herdefinieert de interne hiërarchie van Rubin en loopt vooruit op een nieuwe fase in de concurrentie om gespecialiseerde siliciumchips.

Tijdens GTC 2026 in San Jose onthulde Nvidia de Groq 3 inferentieversneller: de eerste chip die voortkomt uit de licentie- en talentovereenkomst van 20 miljard dollar die op 24 december 2025 werd getekend. Het is een LPU (taalverwerkingseenheid). gebaseerd op SRAM dat Nvidia Het is geïntegreerd in het Vera Rubin-platform als een speciale coprocessor voor de decoderingsfase. De fabrikant kondigde een verwachte leveringsdatum aan voor het derde kwartaal van 2026; de productie zal door Samsung worden verzorgd op een 4nm-node. Het is tevens Nvidia's eerste rack-scale product dat is ontworpen rondom niet-GPU-chips, en de komst ervan heeft geleid tot een herziening van de eigen componenten in de roadmap.

Het hart van de Groq 3 LPX is de LP30-chip: 512 MB SRAM per chip en een geheugenbandbreedte van 150 TB/s per chip. Ter vergelijking: een Rubin GPU met 288 GB HBM4 biedt ongeveer 22 TB/s; het verschil in orde van grootte is geen nuance, maar een architectonische keuze. Een volledig LPX-rack bevat 256 LPU's, goed voor in totaal 128 GB SRAM en een totale bandbreedte van 40 PB/s. Nvidia beweert dat een LPX-rack, in combinatie met een Rubin NVL72, tot 35 keer de prestaties per megawatt levert vergeleken met een NVL72 alleen in modellen met biljoenen parameters, met een beoogde operationele kostprijs van $45 per miljoen tokens.

Groq 3 en de functie in Rubin

Een rendering van een Rubin-rack ter illustratie van de SuperPOD-architectuur.
Nvidia heeft tijdens GTC 2026 zijn Rubin SuperPOD-strategie met zeven chips uiteengezet. (Afbeelding: Nvidia)

In de geplande werking verzorgen Rubin GPU's de prefill-fase – het verwerken van lange contexten en complexe berekeningen – terwijl Groq LPU's het decoderen en genereren van tokens met een lagere latentie afhandelen. Dynamo coördineert deze heterogene verdeling en wijst taken toe op basis van batchgrootte en parallellisatie om een ​​balans te vinden tussen prestaties en energieverbruik.

Groq's oorspronkelijke LPU-ontwerp gaf prioriteit aan determinisme: een VLIW-pipeline (Very Long Instruction Word) met grote SRAM-banken en een compiler die de uitvoering vooraf plande, waardoor cachemissers en onverwachte stops werden geëlimineerd. Dit resulteerde in zeer hoge tokensnelheden per gebruiker, maar bracht een capaciteitsprobleem aan het licht: eerdere generaties met 230 MB SRAM per chip vereisten veel chips om middelgrote modellen te kunnen huisvesten, en de architectuur Het is ontstaan ​​vanuit een focus op convolutionele netwerken in plaats van moderne taalmodellen.

De LP30 verzacht een aantal van deze beperkingen met 512 MB SRAM per chip en een FP8-rekenkracht van 1,23 PFLOPS. Samsung heeft de productie opgeschaald – van ongeveer 9.000 naar ongeveer 15.000 wafers, volgens de aankondigingen – door over te stappen van samples naar commerciële productie. Tijdens GTC werd ook aangekondigd dat AWS Groq 3 LPU's zal inzetten naast meer dan een miljoen Nvidia GPU's als onderdeel van de uitbreiding van de infrastructuur.

Naast de LP30 noemde Nvidia een productroadmap: een LP35 met NVFP4-ondersteuning, bedoeld om aan te sluiten bij de Rubin Ultra-generatie, en een LP40 die later gepland staat voor de Feynman-architectuurcyclus.

Wat is er aan de hand met Rubin CPX?

Bij GTC was de Rubin CPX, de inferentieversneller gebaseerd op, afwezig. GDDR7 van Nvidia Het was aangekondigd voor september 2025. Het verscheen niet op de belangrijkste slides en was ook niet op het podium te zien. Alles wijst erop – zonder volledige officiële bevestiging – dat de CPX van de roadmap is verwijderd en in de platformhiërarchie is vervangen door de LPX Groq 3.

CPX werd aanvankelijk bedacht als een goedkoper alternatief om de contextfase te versnellen met behulp van GDDR7, profiterend van de grotere beschikbaarheid ervan in een markt met een tekort aan HBM-geheugen. De LPU's van Groq maken echter grote externe geheugenmodules overbodig en bieden een aanzienlijk hogere bandbreedte per chip – een duidelijk voordeel in een markt waar de HBM-voorraad krap blijft en de GDDR7-productie nog steeds wordt opgeschaald. Hoewel reeds aan klanten geleverde CPX-eenheden mogelijk nog steeds worden geleverd, lijkt de strategische voorkeur nu te verschuiven naar LPU-integratie.

Er is ook een operationele analogie met de overname van Mellanox in 2019: start-uptechnologieën die uiteindelijk nieuwe architectonische lagen vormen binnen de infrastructuur van Nvidia — in hun geval NVLink/InfiniBand — en in dit scenario zou Groq een vergelijkbare structurele component kunnen worden binnen het Rubin-ecosysteem.

Consolidatie van de markt voor inferentiechips

De deal met Groq was het meest in het oog springende onderdeel van een consolidatiegolf in 2025, gericht op inferentiechips. Dat jaar nam AMD het Untether AI-team over, verwierf Nvidia de apparatuur en het intellectueel eigendom van Enfabrica voor meer dan 900 miljoen dollar, kocht Meta Rivos, en waren er gesprekken – die uiteindelijk werden afgebroken – tussen Intel en SambaNova die resulteerden in een investering en partnerschap van 350 miljoen dollar. Deze stap weerspiegelt het feit dat onafhankelijk concurreren met Nvidia's CUDA-ecosysteem en schaalvoordelen ernstige economische uitdagingen met zich meebrengt, zelfs wanneer de technologie technisch gezien de moeite waard is.

Het terugkerende patroon is de absorptie van talent en technologie door de grote spelers. Groq verwachtte bijvoorbeeld een omzet van ongeveer €500 miljoen in 2025, maar dat bedrag was niet voldoende om de onafhankelijkheid te behouden onder de strategische druk van dominante fabrikanten. Analisten wijzen erop dat niet-exclusieve licentieovereenkomsten de schijn van concurrentie ophouden, maar in de praktijk concurrenten neutraliseren door hun technologie te integreren in het platform van de koper.

Op maat gemaakte siliciumchips in hyperscalers

Meta MTIA-routekaartdiagram voor inferentieversnellers
Meta presenteerde zijn MTIA-routekaart. onlangs. (Afbeelding: Meta)

Terwijl startups integreren in grotere bedrijven, zetten grote cloudproviders hun eigen hardwarematige inferentiepipelines in.

Meta kondigde opeenvolgende generaties van MTIA aan, ontwikkeld in samenwerking met Broadcom: van MTIA 300 – die al in productie is voor ranking en aanbevelingen – tot MTIA 500, gericht op generatieve inferentie en gepland voor massale implementatie in 2027. Google handhaaft zijn TPU-lijn (Ironwood v7) met TFLOPS-cijfers en grootschalige pods, en AWS blijft Trainium en Inferentia ontwikkelen, hoewel interne gegevens tot 2024 een relatief lage adoptie lieten zien in vergelijking met GPU's in de eigen infrastructuur van AWS.

Brancheverkenningen en -prognoses bevestigen de noodzaak tot diversificatie: in november 2025 rangschikte Futurum Group XPU-acceleratoren als het snelstgroeiende segment in de uitgaven van datacenters voor 2026, en TrendForce voorspelde een aanzienlijke toename in de leveringen van op maat gemaakte ASIC's door cloudproviders voor datzelfde jaar.

Nvidia's reactie was duidelijk: de aanwezigheid van niet-GPU-chips binnen het eigen platform veiligstellen voordat derden dat doen. De Groq 3 LPU is de concrete manifestatie van die strategie; de ​​toekomst van de Rubin CPX blijft echter voorlopig onzeker.

Deel dit:
FacebookLinkedInPinterestXRedditTumblrBlueskyThreadsDelenChatGPTClaudeGoogle AIGrok
Tags: EvergreenContentGPUNvidia
Eerdere Publicatie

C2-botnetinfrastructuur: impact na de internationale operatie

Volgende publicatie

Minecraft op E Ink: echte schermlimieten

MasterTrend Inzichten

MasterTrend Inzichten

Onze redactie aandelen een diepgaande analyse, tutorials en aanbevelingen voor het krijgen van het meeste uit uw apparaten en digitale tools.

GerelateerdPublicaties

AMD UDNA-architectuur voor PS6 en Xbox Next: details van de volgende generatie GPU-chip met geavanceerd ontwerp voor krachtige gameconsoles.
Hardware

UDNA-architectuur in PS6 en Xbox Next: meer dan alleen cijfers

4 mei 2026
133
FSR 4.1 AMD: Promotionele afbeelding van FidelityFX Super Resolution met een futuristisch rood-zwart ontwerp, waarin de prestatie- en kwaliteitsverbeteringen van RDNA 4 GPU's worden benadrukt.
Hardware

FSR 4.1 AMD: Echte verbeteringen en beperkingen in RDNA 4

4 mei 2026
202
Een unboxing van de ThinkPad X9-14 Gen 1 laptop met Windows 11-scherm en Copilot, een hoogwaardig ultradun ontwerp, een verlicht toetsenbord en een technische analyse van de prestaties en belangrijke aankoopbeslissingen.
Hardware

Technische analyse en belangrijkste beslissingen van de ThinkPad X9-14 Gen 1

18 de februari de 2026
208
Onderhoud van de ThinkPad T14 Gen 4 AMD in de praktijk: de laptop is geopend en draait tijdens een technische beoordeling in een professionele omgeving.
Hardware

ThinkPad T14 Gen 4 AMD-onderhoud in de praktijk

28 april 2026
164
Levensduur van de koelpasta - Het aanbrengen van koelpasta op de processor om de koeling te verbeteren en een uitleg over hoe lang de koelpasta op de CPU meegaat.
Hardware

De levensduur van thermische pasta en de impact ervan op de prestaties van uw pc.

28 de januari de 2026
410
Is het verstandig om vandaag de dag in PCIe 7.0 te investeren? - PCI-SIG kondigt de definitieve PCIe 7.0-specificaties aan en benadrukt de nieuwe PCI Express-standaard met snelheden tot 128 GT/s voor de volgende generatie computers.
Hardware

Is het verstandig om vandaag de dag in PCIe 7.0 te investeren? Werkelijke impact en scenario's.

28 de januari de 2026
196
Volgende publicatie
Minecraft op E Ink: Minecraft draait op een tablet met een E Ink-grijswaardenscherm, waarmee de daadwerkelijke beperkingen van e-ink op het gebied van prestaties en beeldkwaliteit tijdens het spelen worden getoond.

Minecraft op E Ink: echte schermlimieten

5 1 stemmen
Artikel Beoordeling
Inschrijven
Toegang
De hoogte van de
gast
gast
0 Opmerkingen
Oudste
De nieuwste De meeste gestemd
In line opmerkingen
Bekijk alle beoordelingen

Blijf Verbonden

  • 976 Fans
  • 118 Volgelingen
  • 1.4 k Volgelingen
  • 1.8 k Abonnees
  • Trends
  • Opmerkingen
  • Vorig
🖥️ Hoe open 'Apparaten en printers' in Windows 11: 4 simpele stappen

🌟 Hoe open 'Apparaten en printers' in het Windows-11: ¡Geweldige truc!

28 april 2026
Windows 11 Permanente Klok

Windows 11 Permanente Klok: Opties, Beperkingen en Echte Keuzes

28 april 2026
Ethernet werkt niet in Windows 11: 9 eenvoudige trucs

Ethernet werkt niet in Windows 11: een oplossing in 3 minuten ⚡🌐

13 november 2025
Hoe op te slaan spel, REPO

Hoe save game in REPO 🔥 Ontdek het geheim is om niet te verliezen van de vooruitgang

7 juli 2025
Functies van Gmail op Android: Bespaar tijd met 5 tips

Functies van Gmail op Android: u 5 trucs die u niet kent! 📱✨

12
Reparatie van moederborden - Reparatie-Moederborden

Reparatie van de moederborden van Laptops

10
Windows installeren 11 Thuis zonder Internet

Windows installeren 11 Thuis zonder Internet

10
Hoe een back-up drivers in Windows 11/10 in 4 stappen!

Hoe een back-up drivers in Windows 11/10 Het Voorkomt fouten! 🚨💾

10
Saros-eindes: A. Devraj in een futuristisch Soltari-pantser in een donkere en dramatische scène, analyse van het hoofdeinde en het geheime einde van de videogame.

Saros-eindes: analyse van het hoofdeinde en het geheime einde

14 juni 2026
AMD UDNA-architectuur voor PS6 en Xbox Next: details van de volgende generatie GPU-chip met geavanceerd ontwerp voor krachtige gameconsoles.

UDNA-architectuur in PS6 en Xbox Next: meer dan alleen cijfers

4 mei 2026
FBC Firebreak Wapens: Ontgrendelen en Prioriteiten - Tactische operators met shotguns en vlammenwerpers in een gevecht omringd door vuur in een intense videogame-scène.

FBC Firebreak-wapens: ontgrendelen en prioriteiten

3 mei 2026
Strategy Heroes Olden Era: Een heldin met wit haar die cruciale beslissingen neemt in een episch fantasygevecht dat het verloop van het spel verandert.

Strategie voor Heroes Olden Era: Spelbepalende beslissingen

3 mei 2026

Recent Nieuws

Saros-eindes: A. Devraj in een futuristisch Soltari-pantser in een donkere en dramatische scène, analyse van het hoofdeinde en het geheime einde van de videogame.

Saros-eindes: analyse van het hoofdeinde en het geheime einde

14 juni 2026
87
AMD UDNA-architectuur voor PS6 en Xbox Next: details van de volgende generatie GPU-chip met geavanceerd ontwerp voor krachtige gameconsoles.

UDNA-architectuur in PS6 en Xbox Next: meer dan alleen cijfers

4 mei 2026
133
FBC Firebreak Wapens: Ontgrendelen en Prioriteiten - Tactische operators met shotguns en vlammenwerpers in een gevecht omringd door vuur in een intense videogame-scène.

FBC Firebreak-wapens: ontgrendelen en prioriteiten

3 mei 2026
112
Strategy Heroes Olden Era: Een heldin met wit haar die cruciale beslissingen neemt in een episch fantasygevecht dat het verloop van het spel verandert.

Strategie voor Heroes Olden Era: Spelbepalende beslissingen

3 mei 2026
163
MasterTrend Info-logo

MasterTrend Info is uw bron van verwijzing in de technologie: ontdek nieuws, tutorials, en de analyse van hardware, software, gaming, mobiel en kunstmatige intelligentie. Abonneer u op onze nieuwsbrief en mis geen enkele trend.

Volg ons

Bladeren door Categorie

  • Gaming
  • Hardware
  • IA
  • Mobiel
  • Wat is er nieuw
  • Netwerken
  • Veiligheid
  • Software
  • Tutorials
  • Windows

Recent Nieuws

Saros-eindes: A. Devraj in een futuristisch Soltari-pantser in een donkere en dramatische scène, analyse van het hoofdeinde en het geheime einde van de videogame.

Saros-eindes: analyse van het hoofdeinde en het geheime einde

14 juni 2026
AMD UDNA-architectuur voor PS6 en Xbox Next: details van de volgende generatie GPU-chip met geavanceerd ontwerp voor krachtige gameconsoles.

UDNA-architectuur in PS6 en Xbox Next: meer dan alleen cijfers

4 mei 2026
  • Over Ons
  • Aankondigen
  • Privacy beleid
  • Contact met ons

Copyright © 2025 https://mastertrend.info/ - Alle rechten voorbehouden. Alle handelsmerken zijn eigendom van hun respectievelijke eigenaren.

We've detected you might be speaking a different language. Do you want to change to:
es_ES Spanish
es_ES Spanish
en_US English
pt_BR Portuguese
fr_FR French
it_IT Italian
ru_RU Russian
de_DE German
zh_CN Chinese
ko_KR Korean
ja Japanese
th Thai
hi_IN Hindi
ar Arabic
tr_TR Turkish
pl_PL Polish
id_ID Indonesian
nl_NL Dutch
sv_SE Swedish
Change Language
Close and do not switch language
Geen resultaat
Zie alle resultaten
  • nl_NLDutch
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • pl_PLPolish
    • id_IDIndonesian
    • tr_TRTurkish
    • hi_INHindi
    • thThai
    • arArabic
    • sv_SESwedish
  • Gaming
  • Hardware
  • IA
  • Mobiel
  • Wat is er nieuw
  • Netwerken
  • Veiligheid
  • Software
  • Tutorials
  • Windows

Copyright © 2025 https://mastertrend.info/ - Alle rechten voorbehouden. Alle handelsmerken zijn eigendom van hun respectievelijke eigenaren.

wpDiscuz
RedditBlueskyXMastodonHacker News
Deel dit:
MastodonVKWhatsAppTelegramSMSLijnMessengerFlipboardHacker NewsMixNextdoorVerwarringXingYummly
Uw Mastodon Exemplaar