{"id":109305,"date":"2026-04-19T01:36:23","date_gmt":"2026-04-19T04:36:23","guid":{"rendered":"https:\/\/mastertrend.info\/?p=109305"},"modified":"2026-04-23T16:20:19","modified_gmt":"2026-04-23T19:20:19","slug":"groq-3-lpu","status":"publish","type":"post","link":"https:\/\/mastertrend.info\/it\/groq-3-lpu\/","title":{"rendered":"Groq 3 LPU e la nuova strategia di inferenza di Nvidia"},"content":{"rendered":"<h2>Groq 3 LPU e il cambiamento strategico in Rubin<\/h2>\n<p>La presentazione del Groq 3 al GTC 2026 \u00e8 molto pi\u00f9 di un semplice lancio tecnico: segna un cambiamento strategico nel modo in cui Nvidia struttura la sua piattaforma di inferenza. Pi\u00f9 che un semplice nuovo chip, ridefinisce la gerarchia interna di Rubin e anticipa una fase distinta nella competizione per i semiconduttori specializzati.<\/p>\n<p id=\"c893b5ed-9214-4d2c-9a26-a64e3b2f0213\">Al GTC 2026, tenutosi a San Jose, Nvidia ha svelato l'acceleratore di inferenza Groq 3: il primo chip derivante dall'accordo di licenza e talenti da 20 miliardi di dollari firmato il 24 dicembre 2025. Si tratta di un'unit\u00e0 di elaborazione del linguaggio (LPU) <a title=\"Tecnologia PSSR per PS5 Pro: come trasformare i giochi 1080p in 4K senza perdere FPS\" href=\"https:\/\/mastertrend.info\/it\/tecnologia-pssr-ps5-pro\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34712\">basato su SRAM che Nvidia<\/a> \u00c8 integrato nella piattaforma Vera Rubin come coprocessore dedicato per la fase di decodifica. Il produttore ha annunciato una data di spedizione prevista per il terzo trimestre del 2026; la produzione sar\u00e0 gestita da Samsung su un nodo a 4 nm. \u00c8 anche il primo prodotto rack-scale di Nvidia progettato attorno a silicio non GPU, e il suo arrivo ha portato a una riorganizzazione dei componenti nella roadmap dell'azienda.<\/p>\n<p>Il cuore del Groq 3 LPX \u00e8 il chip LP30: 512 MB di SRAM per die e 150 TB\/s di larghezza di banda di memoria per chip. Per dare un'idea, una GPU Rubin con 288 GB di HBM4 offre circa 22 TB\/s; la differenza di ordine di grandezza non \u00e8 una sfumatura, ma una scelta architetturale. Un rack LPX completo ospita 256 LPU, per un totale di 128 GB di SRAM e 40 PB\/s di larghezza di banda aggregata. Nvidia afferma che, in combinazione con un Rubin NVL72, un rack LPX offre prestazioni fino a 35 volte superiori per megawatt rispetto a un NVL72 da solo, in modelli con trilioni di parametri, con un costo operativo target di 45 dollari per milione di token.<\/p>\n<h2 id=\"groq-3-and-vera-rubin-3\">Groq 3 e la funzione in Rubin<\/h2>\n<figure id=\"bede7762-1a1c-4278-92c5-37773fe99ee3\" class=\"van-image-figure inline-layout\" data-bordeaux-image-check=\"\"><picture data-new-v2-image=\"true\"><source type=\"image\/webp\" \/><\/picture> <picture data-new-v2-image=\"true\"><img decoding=\"async\" class=\"inline\" src=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.jpg\" alt=\"Rendering del rack Rubin che illustra l&#039;architettura del SuperPOD.\" data-new-v2-image=\"true\" data-pin-media=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.jpg\" title=\"\"><\/picture><figcaption class=\"inline-layout\"><span class=\"caption-text\">In occasione del GTC 2026, Nvidia ha illustrato la sua strategia Rubin SuperPOD, basata su sette chip. <\/span><span class=\"credit\">(Crediti immagine: Nvidia)<\/span><\/figcaption><\/figure>\n<p id=\"02ddbe2c-294b-402e-b0ab-38bdf2539030\">Nell'operazione pianificata, le GPU Rubin gestiscono la fase di precaricamento, elaborando contesti lunghi e calcoli ad alta densit\u00e0, mentre le LPU Groq gestiscono la decodifica e la generazione dei token con latenza ridotta. Dynamo orchestra questa distribuzione eterogenea, assegnando i compiti in base alla dimensione del batch e al parallelismo per bilanciare prestazioni e consumo energetico.<\/p>\n<aside class=\"hawk-root\" data-block-type=\"embed\" data-render-type=\"fte\" data-skip=\"dealsy\" data-widget-type=\"seasonal\"><\/aside>\n<p id=\"02ddbe2c-294b-402e-b0ab-38bdf2539030-1\">Il design LPU originale di Groq dava priorit\u00e0 al determinismo: una pipeline VLIW (Very Long Instruction Word) con grandi banchi SRAM e un compilatore che pre-pianificava l'esecuzione, eliminando i cache miss e gli arresti imprevisti. Ci\u00f2 ha portato a tassi di token per utente molto elevati, ma ha rivelato un problema di capacit\u00e0: le generazioni precedenti con 230 MB di SRAM per chip richiedevano molti die per ospitare modelli di medie dimensioni e il <a title=\"Eseguire un modello di intelligenza artificiale su Xbox 360: incredibile \ud83d\udc7e\" href=\"https:\/\/mastertrend.info\/it\/eseguire-un-modello-ai-su-xbox-360\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34713\">architettura<\/a> \u00c8 nato con un orientamento verso le reti convoluzionali piuttosto che verso i moderni modelli linguistici.<\/p>\n<p>L'LP30 attenua alcune di queste limitazioni con 512 MB di SRAM per die e una capacit\u00e0 di calcolo FP8 di 1,23 PFLOPS. Samsung ha incrementato la produzione, passando da circa 9.000 a circa 15.000 wafer, secondo gli annunci, dalla fase di campionatura alla produzione commerciale. Al GTC \u00e8 stato inoltre annunciato che AWS implementer\u00e0 le LPU Groq 3 insieme a oltre un milione di GPU Nvidia nell'ambito della sua espansione infrastrutturale.<\/p>\n<p>Oltre alla LP30, Nvidia ha accennato a una roadmap di prodotto: una LP35 con supporto NVFP4, pensata per essere integrata nella generazione Rubin Ultra, e una LP40 prevista per il ciclo di architettura Feynman in un secondo momento.<\/p>\n<h2 id=\"rubin-cpx-axed-3\">Che cosa sta succedendo con Rubin CPX?<\/h2>\n<p id=\"7dd89f1a-8ce4-4fe4-b7a6-6c732560941c\">Al GTC, l'assenza del Rubin CPX, l'acceleratore di inferenza basato su <a title=\"Il futuro della serie Nvidia GeForce RTX 50: motivi per essere entusiasti oggi stesso! \ud83c\udfae\" href=\"https:\/\/mastertrend.info\/it\/futuro-della-serie-nvidia-geforce-rtx-50\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34711\">GDDR7 che Nvidia<\/a> Era stato annunciato a settembre 2025. Non compariva nelle slide principali n\u00e9 era presente sul palco. Tutto lascia intendere, pur in assenza di una conferma ufficiale completa, che il CPX sia stato rimosso dalla roadmap e sostituito nella gerarchia della piattaforma dal LPX Groq 3.<\/p>\n<p id=\"54eeb077-5d53-4ff6-afc2-39c0708b5eb1\">Inizialmente, CPX \u00e8 stato concepito come un'alternativa a basso costo per accelerare la fase di contesto utilizzando GDDR7, sfruttandone la maggiore disponibilit\u00e0 a fronte della carenza di HBM. Tuttavia, le LPU di Groq eliminano la necessit\u00e0 di grandi moduli di memoria esterni e offrono una larghezza di banda per die significativamente superiore, un chiaro vantaggio in un mercato in cui l'offerta di HBM rimane limitata e la produzione di GDDR7 \u00e8 ancora in fase di espansione. Sebbene le unit\u00e0 CPX gi\u00e0 assegnate ai clienti possano continuare a essere consegnate, la preferenza strategica sembra ora spostarsi verso l'integrazione delle LPU.<\/p>\n<p>Esiste anche un'analogia operativa con l'acquisizione di Mellanox nel 2019: tecnologie di startup che finiscono per formare nuovi livelli architetturali all'interno dell'infrastruttura di Nvidia \u2014 nel loro caso NVLink\/InfiniBand \u2014 e, in questo scenario, Groq potrebbe diventare una componente strutturale simile all'interno dell'ecosistema Rubin.<\/p>\n<h2 id=\"inference-chip-consolidation-3\">Consolidamento del mercato dei chip di inferenza<\/h2>\n<p id=\"02efd3bd-85e4-438e-80ce-bbd81597025b\">L'accordo con Groq \u00e8 stato l'elemento pi\u00f9 visibile di un'ondata di consolidamento del 2025 incentrata sui chip per l'inferenza. Quell'anno, AMD acquis\u00ec il team di intelligenza artificiale di Untether, Nvidia acquis\u00ec le apparecchiature e la propriet\u00e0 intellettuale di Enfabrica per oltre 900 milioni di dollari, Meta acquist\u00f2 Rivos e ci furono trattative \u2013 poi abbandonate \u2013 tra Intel e SambaNova che portarono a un investimento e a una partnership da 350 milioni di dollari. Questa mossa riflette il fatto che competere in modo indipendente con l'ecosistema CUDA e la scalabilit\u00e0 di Nvidia presenta serie sfide economiche, anche quando la tecnologia ha un valore tecnico.<\/p>\n<p>Lo schema ricorrente \u00e8 l'assorbimento di talenti e tecnologie da parte dei principali attori del settore. Groq, ad esempio, prevedeva un fatturato di circa 500 milioni di euro entro il 2025, ma questa cifra non \u00e8 stata sufficiente a mantenere la sua indipendenza di fronte alle pressioni strategiche dei produttori dominanti. Gli analisti sottolineano che gli accordi di licenza non esclusiva preservano l'apparenza di concorrenza, ma in pratica neutralizzano i rivali integrando la loro tecnologia nella piattaforma dell'acquirente.<\/p>\n<h2 id=\"hyperscaler-custom-silicon-3\">Silicio personalizzato nei fornitori di servizi su larga scala<\/h2>\n<figure id=\"2ef100e3-6e87-4247-ab65-65c55ffa1aa1\" class=\"van-image-figure inline-layout\" data-bordeaux-image-check=\"\"><picture data-new-v2-image=\"true\"><source type=\"image\/webp\" \/><\/picture> <picture data-new-v2-image=\"true\"><img decoding=\"async\" class=\"inline\" src=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.png\" alt=\"Diagramma della roadmap Meta MTIA per gli acceleratori di inferenza\" data-new-v2-image=\"true\" data-pin-media=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.png\" title=\"\"><\/picture><figcaption class=\"inline-layout\"><span class=\"caption-text\"><a href=\"https:\/\/ai.meta.com\/blog\/meta-mtia-scale-ai-chips-for-billions\/\" target=\"_blank\" rel=\"noopener\" data-schema-attribute=\"mentions\">Meta ha presentato la sua roadmap MTIA<\/a> recentemente. <\/span><span class=\"credit\">(Crediti immagine: Meta)<\/span><\/figcaption><\/figure>\n<p id=\"2084220b-976c-4b0b-b57a-6176d6a5af92\">Mentre le startup si integrano in aziende pi\u00f9 grandi, i principali fornitori di servizi cloud stanno promuovendo le proprie pipeline di inferenza su silicio.<\/p>\n<p>Meta ha annunciato le successive generazioni di MTIA, sviluppate con Broadcom: da MTIA 300, gi\u00e0 in produzione per il ranking e la raccomandazione, a MTIA 500, orientata all'inferenza generativa e con implementazione su larga scala prevista per il 2027. Google mantiene la sua linea di TPU (Ironwood v7) con prestazioni in TFLOPS e pod di grandi dimensioni, e AWS continua a sviluppare Trainium e Inferentia, sebbene i dati interni fino al 2024 mostrassero un'adozione relativamente bassa rispetto alle GPU nell'infrastruttura di AWS.<\/p>\n<p>Indagini e proiezioni di settore rafforzano la diversificazione: nel novembre 2025, Futurum Group ha classificato gli acceleratori XPU come il segmento in pi\u00f9 rapida crescita nella spesa per i data center per il 2026, e TrendForce ha previsto un notevole aumento delle spedizioni di ASIC personalizzati da parte dei fornitori di servizi cloud per lo stesso anno.<\/p>\n<p>La reazione di Nvidia \u00e8 stata chiara: assicurarsi la presenza di chip non GPU all'interno della propria piattaforma prima che lo facciano terze parti. La Groq 3 LPU \u00e8 la manifestazione tangibile di questa strategia; il futuro della Rubin CPX, tuttavia, rimane per ora incerto.<\/p>\n<p><!-- hermes-editorial-review:related-links:end --><\/p>","protected":false},"excerpt":{"rendered":"<p>Groq 3 LPU segna l'integrazione di silicio non GPU in Rubin e riflette il consolidamento del mercato dei chip per l'inferenza contro gli hyperscaler e i concorrenti.<\/p>","protected":false},"author":1,"featured_media":109306,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ai_generated_summary":"","iawp_total_views":126,"jnews-multi-image_gallery":[],"jnews_single_post":{"format":"standard","override":[{"template":"1","parallax":"1","fullscreen":"1","layout":"right-sidebar","sidebar":"default-sidebar","second_sidebar":"default-sidebar","sticky_sidebar":"1","share_position":"top","share_float_style":"share-monocrhome","show_share_counter":"1","show_view_counter":"1","show_featured":"1","show_post_meta":"1","show_post_author":"1","show_post_author_image":"1","show_post_date":"1","post_date_format":"default","post_date_format_custom":"Y\/m\/d","show_post_category":"1","show_post_reading_time":"1","post_reading_time_wpm":"300","post_calculate_word_method":"str_word_count","zoom_button_out_step":"2","zoom_button_in_step":"3","show_post_tag":"1","show_prev_next_post":"1","show_popup_post":"1","show_comment_section":"1","number_popup_post":"1","show_author_box":"1","show_post_related":"1","show_inline_post_related":"0"}],"image_override":[{"single_post_thumbnail_size":"crop-500","single_post_gallery_size":"crop-500"}],"trending_post_position":"meta","trending_post_label":"Trending","sponsored_post_label":"Sponsored by","disable_ad":"0","subtitle":""},"jnews_primary_category":[],"jnews_social_meta":[],"jnews_review":[],"enable_review":"","type":"percentage","name":"","summary":"","brand":"","sku":"","good":[],"bad":[],"score_override":"","override_value":"","rating":[],"price":[],"jnews_override_counter":{"view_counter_number":"0","share_counter_number":"0","like_counter_number":"0","dislike_counter_number":"0"},"footnotes":""},"categories":[74],"tags":[1445,1709,1603],"class_list":["post-109305","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-hardware","tag-evergreencontent","tag-gpu","tag-nvidia"],"_links":{"self":[{"href":"https:\/\/mastertrend.info\/it\/wp-json\/wp\/v2\/posts\/109305","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mastertrend.info\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mastertrend.info\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/it\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/it\/wp-json\/wp\/v2\/comments?post=109305"}],"version-history":[{"count":0,"href":"https:\/\/mastertrend.info\/it\/wp-json\/wp\/v2\/posts\/109305\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/it\/wp-json\/wp\/v2\/media\/109306"}],"wp:attachment":[{"href":"https:\/\/mastertrend.info\/it\/wp-json\/wp\/v2\/media?parent=109305"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mastertrend.info\/it\/wp-json\/wp\/v2\/categories?post=109305"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mastertrend.info\/it\/wp-json\/wp\/v2\/tags?post=109305"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}