{"id":109305,"date":"2026-04-19T01:36:23","date_gmt":"2026-04-19T04:36:23","guid":{"rendered":"https:\/\/mastertrend.info\/?p=109305"},"modified":"2026-04-23T16:20:19","modified_gmt":"2026-04-23T19:20:19","slug":"groq-3-lpu","status":"publish","type":"post","link":"https:\/\/mastertrend.info\/nl\/groq-3-lpu\/","title":{"rendered":"Groq 3 LPU en Nvidia's nieuwe inferentiestrategie"},"content":{"rendered":"<h2>Groq 3 LPU en de strategische verschuiving bij Rubin<\/h2>\n<p>De onthulling van de Groq 3 op GTC 2026 is meer dan alleen een technische lancering: het markeert een strategische verschuiving in de manier waarop Nvidia zijn inferentieplatform structureert. Het is meer dan alleen een nieuwe chip; het herdefinieert de interne hi\u00ebrarchie van Rubin en loopt vooruit op een nieuwe fase in de concurrentie om gespecialiseerde siliciumchips.<\/p>\n<p id=\"c893b5ed-9214-4d2c-9a26-a64e3b2f0213\">Tijdens GTC 2026 in San Jose onthulde Nvidia de Groq 3 inferentieversneller: de eerste chip die voortkomt uit de licentie- en talentovereenkomst van 20 miljard dollar die op 24 december 2025 werd getekend. Het is een LPU (taalverwerkingseenheid). <a title=\"PSSR-technologie voor PS5 Pro: Hoe je 1080p-games omzet naar 4K zonder verlies van FPS\" href=\"https:\/\/mastertrend.info\/nl\/ps5-pro-pssr-technologie\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34712\">gebaseerd op SRAM dat Nvidia<\/a> Het is ge\u00efntegreerd in het Vera Rubin-platform als een speciale coprocessor voor de decoderingsfase. De fabrikant kondigde een verwachte leveringsdatum aan voor het derde kwartaal van 2026; de productie zal door Samsung worden verzorgd op een 4nm-node. Het is tevens Nvidia's eerste rack-scale product dat is ontworpen rondom niet-GPU-chips, en de komst ervan heeft geleid tot een herziening van de eigen componenten in de roadmap.<\/p>\n<p>Het hart van de Groq 3 LPX is de LP30-chip: 512 MB SRAM per chip en een geheugenbandbreedte van 150 TB\/s per chip. Ter vergelijking: een Rubin GPU met 288 GB HBM4 biedt ongeveer 22 TB\/s; het verschil in orde van grootte is geen nuance, maar een architectonische keuze. Een volledig LPX-rack bevat 256 LPU's, goed voor in totaal 128 GB SRAM en een totale bandbreedte van 40 PB\/s. Nvidia beweert dat een LPX-rack, in combinatie met een Rubin NVL72, tot 35 keer de prestaties per megawatt levert vergeleken met een NVL72 alleen in modellen met biljoenen parameters, met een beoogde operationele kostprijs van $45 per miljoen tokens.<\/p>\n<h2 id=\"groq-3-and-vera-rubin-3\">Groq 3 en de functie in Rubin<\/h2>\n<figure id=\"bede7762-1a1c-4278-92c5-37773fe99ee3\" class=\"van-image-figure inline-layout\" data-bordeaux-image-check=\"\"><picture data-new-v2-image=\"true\"><source type=\"image\/webp\" \/><\/picture> <picture data-new-v2-image=\"true\"><img decoding=\"async\" class=\"inline\" src=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.jpg\" alt=\"Een rendering van een Rubin-rack ter illustratie van de SuperPOD-architectuur.\" data-new-v2-image=\"true\" data-pin-media=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.jpg\" title=\"\"><\/picture><figcaption class=\"inline-layout\"><span class=\"caption-text\">Nvidia heeft tijdens GTC 2026 zijn Rubin SuperPOD-strategie met zeven chips uiteengezet. <\/span><span class=\"credit\">(Afbeelding: Nvidia)<\/span><\/figcaption><\/figure>\n<p id=\"02ddbe2c-294b-402e-b0ab-38bdf2539030\">In de geplande werking verzorgen Rubin GPU's de prefill-fase \u2013 het verwerken van lange contexten en complexe berekeningen \u2013 terwijl Groq LPU's het decoderen en genereren van tokens met een lagere latentie afhandelen. Dynamo co\u00f6rdineert deze heterogene verdeling en wijst taken toe op basis van batchgrootte en parallellisatie om een \u200b\u200bbalans te vinden tussen prestaties en energieverbruik.<\/p>\n<aside class=\"hawk-root\" data-block-type=\"embed\" data-render-type=\"fte\" data-skip=\"dealsy\" data-widget-type=\"seasonal\"><\/aside>\n<p id=\"02ddbe2c-294b-402e-b0ab-38bdf2539030-1\">Groq's oorspronkelijke LPU-ontwerp gaf prioriteit aan determinisme: een VLIW-pipeline (Very Long Instruction Word) met grote SRAM-banken en een compiler die de uitvoering vooraf plande, waardoor cachemissers en onverwachte stops werden ge\u00eblimineerd. Dit resulteerde in zeer hoge tokensnelheden per gebruiker, maar bracht een capaciteitsprobleem aan het licht: eerdere generaties met 230 MB SRAM per chip vereisten veel chips om middelgrote modellen te kunnen huisvesten, en de <a title=\"Een AI-model draaien op Xbox 360: geweldig \ud83d\udc7e\" href=\"https:\/\/mastertrend.info\/nl\/een-ai-model-uitvoeren-op-xbox-360\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34713\">architectuur<\/a> Het is ontstaan \u200b\u200bvanuit een focus op convolutionele netwerken in plaats van moderne taalmodellen.<\/p>\n<p>De LP30 verzacht een aantal van deze beperkingen met 512 MB SRAM per chip en een FP8-rekenkracht van 1,23 PFLOPS. Samsung heeft de productie opgeschaald \u2013 van ongeveer 9.000 naar ongeveer 15.000 wafers, volgens de aankondigingen \u2013 door over te stappen van samples naar commerci\u00eble productie. Tijdens GTC werd ook aangekondigd dat AWS Groq 3 LPU's zal inzetten naast meer dan een miljoen Nvidia GPU's als onderdeel van de uitbreiding van de infrastructuur.<\/p>\n<p>Naast de LP30 noemde Nvidia een productroadmap: een LP35 met NVFP4-ondersteuning, bedoeld om aan te sluiten bij de Rubin Ultra-generatie, en een LP40 die later gepland staat voor de Feynman-architectuurcyclus.<\/p>\n<h2 id=\"rubin-cpx-axed-3\">Wat is er aan de hand met Rubin CPX?<\/h2>\n<p id=\"7dd89f1a-8ce4-4fe4-b7a6-6c732560941c\">Bij GTC was de Rubin CPX, de inferentieversneller gebaseerd op, afwezig. <a title=\"De toekomst van de Nvidia GeForce RTX 50-serie: Redenen om vandaag al enthousiast te worden! \ud83c\udfae\" href=\"https:\/\/mastertrend.info\/nl\/toekomst-van-de-nvidia-geforce-rtx-50-serie\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34711\">GDDR7 van Nvidia<\/a> Het was aangekondigd voor september 2025. Het verscheen niet op de belangrijkste slides en was ook niet op het podium te zien. Alles wijst erop \u2013 zonder volledige offici\u00eble bevestiging \u2013 dat de CPX van de roadmap is verwijderd en in de platformhi\u00ebrarchie is vervangen door de LPX Groq 3.<\/p>\n<p id=\"54eeb077-5d53-4ff6-afc2-39c0708b5eb1\">CPX werd aanvankelijk bedacht als een goedkoper alternatief om de contextfase te versnellen met behulp van GDDR7, profiterend van de grotere beschikbaarheid ervan in een markt met een tekort aan HBM-geheugen. De LPU's van Groq maken echter grote externe geheugenmodules overbodig en bieden een aanzienlijk hogere bandbreedte per chip \u2013 een duidelijk voordeel in een markt waar de HBM-voorraad krap blijft en de GDDR7-productie nog steeds wordt opgeschaald. Hoewel reeds aan klanten geleverde CPX-eenheden mogelijk nog steeds worden geleverd, lijkt de strategische voorkeur nu te verschuiven naar LPU-integratie.<\/p>\n<p>Er is ook een operationele analogie met de overname van Mellanox in 2019: start-uptechnologie\u00ebn die uiteindelijk nieuwe architectonische lagen vormen binnen de infrastructuur van Nvidia \u2014 in hun geval NVLink\/InfiniBand \u2014 en in dit scenario zou Groq een vergelijkbare structurele component kunnen worden binnen het Rubin-ecosysteem.<\/p>\n<h2 id=\"inference-chip-consolidation-3\">Consolidatie van de markt voor inferentiechips<\/h2>\n<p id=\"02efd3bd-85e4-438e-80ce-bbd81597025b\">De deal met Groq was het meest in het oog springende onderdeel van een consolidatiegolf in 2025, gericht op inferentiechips. Dat jaar nam AMD het Untether AI-team over, verwierf Nvidia de apparatuur en het intellectueel eigendom van Enfabrica voor meer dan 900 miljoen dollar, kocht Meta Rivos, en waren er gesprekken \u2013 die uiteindelijk werden afgebroken \u2013 tussen Intel en SambaNova die resulteerden in een investering en partnerschap van 350 miljoen dollar. Deze stap weerspiegelt het feit dat onafhankelijk concurreren met Nvidia's CUDA-ecosysteem en schaalvoordelen ernstige economische uitdagingen met zich meebrengt, zelfs wanneer de technologie technisch gezien de moeite waard is.<\/p>\n<p>Het terugkerende patroon is de absorptie van talent en technologie door de grote spelers. Groq verwachtte bijvoorbeeld een omzet van ongeveer \u20ac500 miljoen in 2025, maar dat bedrag was niet voldoende om de onafhankelijkheid te behouden onder de strategische druk van dominante fabrikanten. Analisten wijzen erop dat niet-exclusieve licentieovereenkomsten de schijn van concurrentie ophouden, maar in de praktijk concurrenten neutraliseren door hun technologie te integreren in het platform van de koper.<\/p>\n<h2 id=\"hyperscaler-custom-silicon-3\">Op maat gemaakte siliciumchips in hyperscalers<\/h2>\n<figure id=\"2ef100e3-6e87-4247-ab65-65c55ffa1aa1\" class=\"van-image-figure inline-layout\" data-bordeaux-image-check=\"\"><picture data-new-v2-image=\"true\"><source type=\"image\/webp\" \/><\/picture> <picture data-new-v2-image=\"true\"><img decoding=\"async\" class=\"inline\" src=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.png\" alt=\"Meta MTIA-routekaartdiagram voor inferentieversnellers\" data-new-v2-image=\"true\" data-pin-media=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.png\" title=\"\"><\/picture><figcaption class=\"inline-layout\"><span class=\"caption-text\"><a href=\"https:\/\/ai.meta.com\/blog\/meta-mtia-scale-ai-chips-for-billions\/\" target=\"_blank\" rel=\"noopener\" data-schema-attribute=\"mentions\">Meta presenteerde zijn MTIA-routekaart.<\/a> onlangs. <\/span><span class=\"credit\">(Afbeelding: Meta)<\/span><\/figcaption><\/figure>\n<p id=\"2084220b-976c-4b0b-b57a-6176d6a5af92\">Terwijl startups integreren in grotere bedrijven, zetten grote cloudproviders hun eigen hardwarematige inferentiepipelines in.<\/p>\n<p>Meta kondigde opeenvolgende generaties van MTIA aan, ontwikkeld in samenwerking met Broadcom: van MTIA 300 \u2013 die al in productie is voor ranking en aanbevelingen \u2013 tot MTIA 500, gericht op generatieve inferentie en gepland voor massale implementatie in 2027. Google handhaaft zijn TPU-lijn (Ironwood v7) met TFLOPS-cijfers en grootschalige pods, en AWS blijft Trainium en Inferentia ontwikkelen, hoewel interne gegevens tot 2024 een relatief lage adoptie lieten zien in vergelijking met GPU's in de eigen infrastructuur van AWS.<\/p>\n<p>Brancheverkenningen en -prognoses bevestigen de noodzaak tot diversificatie: in november 2025 rangschikte Futurum Group XPU-acceleratoren als het snelstgroeiende segment in de uitgaven van datacenters voor 2026, en TrendForce voorspelde een aanzienlijke toename in de leveringen van op maat gemaakte ASIC's door cloudproviders voor datzelfde jaar.<\/p>\n<p>Nvidia's reactie was duidelijk: de aanwezigheid van niet-GPU-chips binnen het eigen platform veiligstellen voordat derden dat doen. De Groq 3 LPU is de concrete manifestatie van die strategie; de \u200b\u200btoekomst van de Rubin CPX blijft echter voorlopig onzeker.<\/p>\n<p><!-- hermes-editorial-review:related-links:end --><\/p>","protected":false},"excerpt":{"rendered":"<p>De Groq 3 LPU markeert de integratie van niet-GPU-chips in Rubin en weerspiegelt de consolidatie van de markt voor inferentiechips ten opzichte van hyperscalers en concurrenten.<\/p>","protected":false},"author":1,"featured_media":109306,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ai_generated_summary":"","iawp_total_views":90,"jnews-multi-image_gallery":[],"jnews_single_post":{"format":"standard","override":[{"template":"1","parallax":"1","fullscreen":"1","layout":"right-sidebar","sidebar":"default-sidebar","second_sidebar":"default-sidebar","sticky_sidebar":"1","share_position":"top","share_float_style":"share-monocrhome","show_share_counter":"1","show_view_counter":"1","show_featured":"1","show_post_meta":"1","show_post_author":"1","show_post_author_image":"1","show_post_date":"1","post_date_format":"default","post_date_format_custom":"Y\/m\/d","show_post_category":"1","show_post_reading_time":"1","post_reading_time_wpm":"300","post_calculate_word_method":"str_word_count","zoom_button_out_step":"2","zoom_button_in_step":"3","show_post_tag":"1","show_prev_next_post":"1","show_popup_post":"1","show_comment_section":"1","number_popup_post":"1","show_author_box":"1","show_post_related":"1","show_inline_post_related":"0"}],"image_override":[{"single_post_thumbnail_size":"crop-500","single_post_gallery_size":"crop-500"}],"trending_post_position":"meta","trending_post_label":"Trending","sponsored_post_label":"Sponsored by","disable_ad":"0","subtitle":""},"jnews_primary_category":[],"jnews_social_meta":[],"jnews_review":[],"enable_review":"","type":"percentage","name":"","summary":"","brand":"","sku":"","good":[],"bad":[],"score_override":"","override_value":"","rating":[],"price":[],"jnews_override_counter":{"view_counter_number":"0","share_counter_number":"0","like_counter_number":"0","dislike_counter_number":"0"},"footnotes":""},"categories":[74],"tags":[1445,1709,1603],"class_list":["post-109305","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-hardware","tag-evergreencontent","tag-gpu","tag-nvidia"],"_links":{"self":[{"href":"https:\/\/mastertrend.info\/nl\/wp-json\/wp\/v2\/posts\/109305","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mastertrend.info\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mastertrend.info\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/nl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/nl\/wp-json\/wp\/v2\/comments?post=109305"}],"version-history":[{"count":11,"href":"https:\/\/mastertrend.info\/nl\/wp-json\/wp\/v2\/posts\/109305\/revisions"}],"predecessor-version":[{"id":110474,"href":"https:\/\/mastertrend.info\/nl\/wp-json\/wp\/v2\/posts\/109305\/revisions\/110474"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/nl\/wp-json\/wp\/v2\/media\/109306"}],"wp:attachment":[{"href":"https:\/\/mastertrend.info\/nl\/wp-json\/wp\/v2\/media?parent=109305"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mastertrend.info\/nl\/wp-json\/wp\/v2\/categories?post=109305"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mastertrend.info\/nl\/wp-json\/wp\/v2\/tags?post=109305"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}