• Chi siamo
  • Annunciare
  • politica sulla riservatezza
  • Contattaci
MasterTrend Info - Tecnologia, notizie e tutorial
  • CASA
    • BLOG
  • Tutorial
  • Hardware
  • Gioco
  • Mobile
  • Sicurezza
  • Windows
  • IA
  • Software
  • Reti
  • Cosa c'è di nuovo
  • it_ITItalian
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
Nessun risultato
Vedi tutti i risultati
  • CASA
    • BLOG
  • Tutorial
  • Hardware
  • Gioco
  • Mobile
  • Sicurezza
  • Windows
  • IA
  • Software
  • Reti
  • Cosa c'è di nuovo
  • it_ITItalian
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
Nessun risultato
Vedi tutti i risultati
MasterTrend Info - Tecnologia, notizie e tutorial
Nessun risultato
Vedi tutti i risultati
Inizio Hardware

Groq 3 LPU e la nuova strategia di inferenza di Nvidia

MasterTrend Approfondimenti da MasterTrend Approfondimenti
23 de Aprile de 2026
in Hardware
Tempo di lettura:6 min leggere
0
Un'immagine mette a confronto la LPU Groq 3 e la GPU Rubin di Nvidia, mostrando il design del chip per l'inferenza dell'intelligenza artificiale e la nuova strategia di Nvidia nell'hardware per l'accelerazione dell'IA.

Groq 3 LPU e la nuova strategia di inferenza di Nvidia: un confronto visivo tra la GPU Rubin di Nvidia e il chip Groq 3 LPU, che evidenzia le differenze in termini di architettura, prestazioni ed efficienza per i carichi di lavoro di intelligenza artificiale. Uno sguardo al futuro dell'hardware specializzato per l'inferenza di IA, degli acceleratori ad alte prestazioni e dei data center ottimizzati per modelli generativi e LLM.

50
CONDIVISA
140
Vista
Condividi su FacebookShare on Twitter

Contenuto

  1. Groq 3 LPU e il cambiamento strategico in Rubin
  2. Groq 3 e la funzione in Rubin
  3. Che cosa sta succedendo con Rubin CPX?
  4. Consolidamento del mercato dei chip di inferenza
  5. Silicio personalizzato nei fornitori di servizi su larga scala

Groq 3 LPU e il cambiamento strategico in Rubin

La presentazione del Groq 3 al GTC 2026 è molto più di un semplice lancio tecnico: segna un cambiamento strategico nel modo in cui Nvidia struttura la sua piattaforma di inferenza. Più che un semplice nuovo chip, ridefinisce la gerarchia interna di Rubin e anticipa una fase distinta nella competizione per i semiconduttori specializzati.

Al GTC 2026, tenutosi a San Jose, Nvidia ha svelato l'acceleratore di inferenza Groq 3: il primo chip derivante dall'accordo di licenza e talenti da 20 miliardi di dollari firmato il 24 dicembre 2025. Si tratta di un'unità di elaborazione del linguaggio (LPU) basato su SRAM che Nvidia È integrato nella piattaforma Vera Rubin come coprocessore dedicato per la fase di decodifica. Il produttore ha annunciato una data di spedizione prevista per il terzo trimestre del 2026; la produzione sarà gestita da Samsung su un nodo a 4 nm. È anche il primo prodotto rack-scale di Nvidia progettato attorno a silicio non GPU, e il suo arrivo ha portato a una riorganizzazione dei componenti nella roadmap dell'azienda.

Il cuore del Groq 3 LPX è il chip LP30: 512 MB di SRAM per die e 150 TB/s di larghezza di banda di memoria per chip. Per dare un'idea, una GPU Rubin con 288 GB di HBM4 offre circa 22 TB/s; la differenza di ordine di grandezza non è una sfumatura, ma una scelta architetturale. Un rack LPX completo ospita 256 LPU, per un totale di 128 GB di SRAM e 40 PB/s di larghezza di banda aggregata. Nvidia afferma che, in combinazione con un Rubin NVL72, un rack LPX offre prestazioni fino a 35 volte superiori per megawatt rispetto a un NVL72 da solo, in modelli con trilioni di parametri, con un costo operativo target di 45 dollari per milione di token.

Groq 3 e la funzione in Rubin

Rendering del rack Rubin che illustra l'architettura del SuperPOD.
In occasione del GTC 2026, Nvidia ha illustrato la sua strategia Rubin SuperPOD, basata su sette chip. (Crediti immagine: Nvidia)

Nell'operazione pianificata, le GPU Rubin gestiscono la fase di precaricamento, elaborando contesti lunghi e calcoli ad alta densità, mentre le LPU Groq gestiscono la decodifica e la generazione dei token con latenza ridotta. Dynamo orchestra questa distribuzione eterogenea, assegnando i compiti in base alla dimensione del batch e al parallelismo per bilanciare prestazioni e consumo energetico.

Il design LPU originale di Groq dava priorità al determinismo: una pipeline VLIW (Very Long Instruction Word) con grandi banchi SRAM e un compilatore che pre-pianificava l'esecuzione, eliminando i cache miss e gli arresti imprevisti. Ciò ha portato a tassi di token per utente molto elevati, ma ha rivelato un problema di capacità: le generazioni precedenti con 230 MB di SRAM per chip richiedevano molti die per ospitare modelli di medie dimensioni e il architettura È nato con un orientamento verso le reti convoluzionali piuttosto che verso i moderni modelli linguistici.

L'LP30 attenua alcune di queste limitazioni con 512 MB di SRAM per die e una capacità di calcolo FP8 di 1,23 PFLOPS. Samsung ha incrementato la produzione, passando da circa 9.000 a circa 15.000 wafer, secondo gli annunci, dalla fase di campionatura alla produzione commerciale. Al GTC è stato inoltre annunciato che AWS implementerà le LPU Groq 3 insieme a oltre un milione di GPU Nvidia nell'ambito della sua espansione infrastrutturale.

Oltre alla LP30, Nvidia ha accennato a una roadmap di prodotto: una LP35 con supporto NVFP4, pensata per essere integrata nella generazione Rubin Ultra, e una LP40 prevista per il ciclo di architettura Feynman in un secondo momento.

Che cosa sta succedendo con Rubin CPX?

Al GTC, l'assenza del Rubin CPX, l'acceleratore di inferenza basato su GDDR7 che Nvidia Era stato annunciato a settembre 2025. Non compariva nelle slide principali né era presente sul palco. Tutto lascia intendere, pur in assenza di una conferma ufficiale completa, che il CPX sia stato rimosso dalla roadmap e sostituito nella gerarchia della piattaforma dal LPX Groq 3.

Inizialmente, CPX è stato concepito come un'alternativa a basso costo per accelerare la fase di contesto utilizzando GDDR7, sfruttandone la maggiore disponibilità a fronte della carenza di HBM. Tuttavia, le LPU di Groq eliminano la necessità di grandi moduli di memoria esterni e offrono una larghezza di banda per die significativamente superiore, un chiaro vantaggio in un mercato in cui l'offerta di HBM rimane limitata e la produzione di GDDR7 è ancora in fase di espansione. Sebbene le unità CPX già assegnate ai clienti possano continuare a essere consegnate, la preferenza strategica sembra ora spostarsi verso l'integrazione delle LPU.

Esiste anche un'analogia operativa con l'acquisizione di Mellanox nel 2019: tecnologie di startup che finiscono per formare nuovi livelli architetturali all'interno dell'infrastruttura di Nvidia — nel loro caso NVLink/InfiniBand — e, in questo scenario, Groq potrebbe diventare una componente strutturale simile all'interno dell'ecosistema Rubin.

Consolidamento del mercato dei chip di inferenza

L'accordo con Groq è stato l'elemento più visibile di un'ondata di consolidamento del 2025 incentrata sui chip per l'inferenza. Quell'anno, AMD acquisì il team di intelligenza artificiale di Untether, Nvidia acquisì le apparecchiature e la proprietà intellettuale di Enfabrica per oltre 900 milioni di dollari, Meta acquistò Rivos e ci furono trattative – poi abbandonate – tra Intel e SambaNova che portarono a un investimento e a una partnership da 350 milioni di dollari. Questa mossa riflette il fatto che competere in modo indipendente con l'ecosistema CUDA e la scalabilità di Nvidia presenta serie sfide economiche, anche quando la tecnologia ha un valore tecnico.

Lo schema ricorrente è l'assorbimento di talenti e tecnologie da parte dei principali attori del settore. Groq, ad esempio, prevedeva un fatturato di circa 500 milioni di euro entro il 2025, ma questa cifra non è stata sufficiente a mantenere la sua indipendenza di fronte alle pressioni strategiche dei produttori dominanti. Gli analisti sottolineano che gli accordi di licenza non esclusiva preservano l'apparenza di concorrenza, ma in pratica neutralizzano i rivali integrando la loro tecnologia nella piattaforma dell'acquirente.

Silicio personalizzato nei fornitori di servizi su larga scala

Diagramma della roadmap Meta MTIA per gli acceleratori di inferenza
Meta ha presentato la sua roadmap MTIA recentemente. (Crediti immagine: Meta)

Mentre le startup si integrano in aziende più grandi, i principali fornitori di servizi cloud stanno promuovendo le proprie pipeline di inferenza su silicio.

Meta ha annunciato le successive generazioni di MTIA, sviluppate con Broadcom: da MTIA 300, già in produzione per il ranking e la raccomandazione, a MTIA 500, orientata all'inferenza generativa e con implementazione su larga scala prevista per il 2027. Google mantiene la sua linea di TPU (Ironwood v7) con prestazioni in TFLOPS e pod di grandi dimensioni, e AWS continua a sviluppare Trainium e Inferentia, sebbene i dati interni fino al 2024 mostrassero un'adozione relativamente bassa rispetto alle GPU nell'infrastruttura di AWS.

Indagini e proiezioni di settore rafforzano la diversificazione: nel novembre 2025, Futurum Group ha classificato gli acceleratori XPU come il segmento in più rapida crescita nella spesa per i data center per il 2026, e TrendForce ha previsto un notevole aumento delle spedizioni di ASIC personalizzati da parte dei fornitori di servizi cloud per lo stesso anno.

La reazione di Nvidia è stata chiara: assicurarsi la presenza di chip non GPU all'interno della propria piattaforma prima che lo facciano terze parti. La Groq 3 LPU è la manifestazione tangibile di questa strategia; il futuro della Rubin CPX, tuttavia, rimane per ora incerto.

Condividi questo:
Fai clic su Mi PiaceLinkedInPinterestXRedditTumblrCielo bluDiscussioniCondividereChatGPTClaudeGoogle AIGrok
Tags: EvergreenContentGPUNvidia
Precedente Pubblicazione

Infrastruttura C2 della botnet: impatto dopo l'operazione internazionale

Prossima pubblicazione

Minecraft su E Ink: limiti reali dello schermo

MasterTrend Approfondimenti

MasterTrend Approfondimenti

Il nostro team editoriale azioni di approfondite analisi, tutorial e consigli per ottenere il massimo dai tuoi dispositivi e strumenti digitali.

CorrelatiPubblicazioni

Architettura AMD UDNA per PS6 e Xbox Next: dettaglio del chip GPU di nuova generazione con design avanzato per console di gioco ad alte prestazioni.
Hardware

Architettura UDNA in PS6 e Xbox Next: più che semplici numeri

4 de Maggio de 2026
136
FSR 4.1 AMD: Illustrazione promozionale di FidelityFX Super Resolution con un design futuristico rosso e nero, che evidenzia i miglioramenti in termini di prestazioni e qualità delle GPU RDNA 4.
Hardware

FSR 4.1 AMD: miglioramenti reali e limitazioni in RDNA 4

4 de Maggio de 2026
206
Laptop ThinkPad X9-14 Gen 1 senza scatola con display Windows 11 e Copilot, design ultrasottile premium, tastiera retroilluminata e analisi tecnica delle prestazioni e delle principali decisioni di acquisto.
Hardware

Analisi tecnica e decisioni chiave del ThinkPad X9-14 Gen 1

18 de Febbraio de 2026
211
Manutenzione del ThinkPad T14 Gen 4 AMD in uso reale, laptop aperto e funzionante durante la revisione tecnica in un ambiente professionale.
Hardware

Manutenzione del ThinkPad T14 Gen 4 AMD in uso reale

28 aprile 2026
166
Durata della pasta termica: applicazione della pasta termica al processore per migliorare il raffreddamento e spiegazione della durata della pasta termica sulla CPU.
Hardware

Durata della pasta termica e il suo impatto sulle prestazioni del PC

28 gennaio 2026
419
Ha senso investire oggi in PCIe 7.0? - PCI-SIG annuncia le specifiche definitive di PCIe 7.0, evidenziando il nuovo standard PCI Express con velocità fino a 128 GT/s per la prossima generazione di elaborazione.
Hardware

Ha senso investire in PCIe 7.0 oggi? Impatto reale e scenari

28 gennaio 2026
199
Prossima pubblicazione
Minecraft en E Ink: Minecraft ejecutándose en una tablet con pantalla E Ink en escala de grises, mostrando las limitaciones reales de la tinta electrónica en rendimiento y calidad de imagen durante el juego.

Minecraft su E Ink: limiti reali dello schermo

5 1 votare
Valutazione dell'articolo
Iscriviti
Accesso
Notifica di
ospite
ospite
0 Commenti
più antico
Più recente I più votati
Commenti in linea
Vedi tutti i commenti

Soggiorno Collegato

  • 976 I fan
  • 118 Seguaci
  • 1.4 k Seguaci
  • 1.8 k Abbonati
  • Tendenze
  • Commenti
  • Ultimo
🖥️ Come aprire i Dispositivi e stampanti in Windows 11: 4 semplici passi

🌟 Come aprire i Dispositivi e stampanti in Windows 11: ¡Incredibile trucco!

21 giugno 2026
Orologio permanente di Windows 11: opzioni per la visualizzazione di un orologio permanente, limitazioni e decisioni pratiche, con sfondo blu, icona di Windows e orologio analogico minimalista.

Orologio persistente di Windows 11: opzioni, limiti e decisioni reali

21 giugno 2026
Ethernet non funziona in Windows 11: 9 semplici trucchi

Ethernet non funziona in Windows 11: soluzione in 3 minuti ⚡🌐

13 novembre 2025
Come salvare il gioco in REPO

Come salvare il gioco nel REPO 🔥 Scoprire il segreto per non perdere i progressi

7 luglio 2025
Caratteristiche di Gmail su Android: è possibile Risparmiare tempo con 5 punte

Le funzioni di Gmail in Android: 5 trucchi che non conosci! 📱✨

12
Riparazione della scheda madre del notebook: vista interna con scheda madre, sistema di raffreddamento, ventole e componenti chiave da controllare in un notebook aperto.

Riparazione della scheda madre del notebook: diagnosi passo passo

10
Installare Windows 11 di Casa senza Internet

Installare Windows 11 di Casa senza Internet

10
Come fare il backup dei driver in Windows 11/10 in 4 semplici passi!

Come fare il backup dei driver in Windows 11/10 Previene errori! 🚨💾

10
Privacy in Windows 11 - Una donna a casa configura le opzioni di privacy di Windows 11 con il suo laptop utilizzando O&O ShutUp10++, mostrando le impostazioni di sicurezza e il controllo dei dati sullo schermo.

Privacy in Windows 11 con O&O ShutUp10++

21 giugno 2026
Funzionalità opzionali di Windows 11 - Una donna lavora su un laptop con Windows 11 e attiva le funzionalità opzionali nelle impostazioni di sistema; guida su quando abilitare o disabilitare le funzionalità opzionali di Windows 11 in un moderno ambiente d'ufficio.

Funzionalità opzionali in Windows 11: quando attivarle o disattivarle

21 giugno 2026
Finali di Saros: A. Devraj in un'armatura Soltari futuristica in una scena oscura e drammatica, analisi del finale principale e del finale segreto del videogioco.

Finali di Saros: Analisi del Finale Principale e del Finale Segreto

14 de Giugno de 2026
Architettura AMD UDNA per PS6 e Xbox Next: dettaglio del chip GPU di nuova generazione con design avanzato per console di gioco ad alte prestazioni.

Architettura UDNA in PS6 e Xbox Next: più che semplici numeri

4 de Maggio de 2026

Notizie Recenti

Privacy in Windows 11 - Una donna a casa configura le opzioni di privacy di Windows 11 con il suo laptop utilizzando O&O ShutUp10++, mostrando le impostazioni di sicurezza e il controllo dei dati sullo schermo.

Privacy in Windows 11 con O&O ShutUp10++

21 giugno 2026
59
Funzionalità opzionali di Windows 11 - Una donna lavora su un laptop con Windows 11 e attiva le funzionalità opzionali nelle impostazioni di sistema; guida su quando abilitare o disabilitare le funzionalità opzionali di Windows 11 in un moderno ambiente d'ufficio.

Funzionalità opzionali in Windows 11: quando attivarle o disattivarle

21 giugno 2026
65
Finali di Saros: A. Devraj in un'armatura Soltari futuristica in una scena oscura e drammatica, analisi del finale principale e del finale segreto del videogioco.

Finali di Saros: Analisi del Finale Principale e del Finale Segreto

14 de Giugno de 2026
97
Architettura AMD UDNA per PS6 e Xbox Next: dettaglio del chip GPU di nuova generazione con design avanzato per console di gioco ad alte prestazioni.

Architettura UDNA in PS6 e Xbox Next: più che semplici numeri

4 de Maggio de 2026
136
Logo MasterTrend Info

MasterTrend Info è la vostra fonte di riferimento per la tecnologia: scopri le notizie, le esercitazioni e analisi di hardware, software, giochi, cellulare, e l'intelligenza artificiale. Iscriviti alla nostra newsletter per non perdere nessuna tendenza.

Seguici

Sfoglia per Categoria

  • Gioco
  • Hardware
  • IA
  • Mobile
  • Cosa c'è di nuovo
  • Reti
  • Sicurezza
  • Software
  • Tutorial
  • Windows

Notizie Recenti

Privacy in Windows 11 - Una donna a casa configura le opzioni di privacy di Windows 11 con il suo laptop utilizzando O&O ShutUp10++, mostrando le impostazioni di sicurezza e il controllo dei dati sullo schermo.

Privacy in Windows 11 con O&O ShutUp10++

21 giugno 2026
Funzionalità opzionali di Windows 11 - Una donna lavora su un laptop con Windows 11 e attiva le funzionalità opzionali nelle impostazioni di sistema; guida su quando abilitare o disabilitare le funzionalità opzionali di Windows 11 in un moderno ambiente d'ufficio.

Funzionalità opzionali in Windows 11: quando attivarle o disattivarle

21 giugno 2026
  • Chi siamo
  • Annunciare
  • politica sulla riservatezza
  • Contattaci

Copyright © 2025 https://mastertrend.info/ - Tutti i diritti riservati. Tutti i marchi commerciali appartengono ai rispettivi proprietari.

We've detected you might be speaking a different language. Do you want to change to:
es_ES Spanish
es_ES Spanish
en_US English
pt_BR Portuguese
fr_FR French
it_IT Italian
ru_RU Russian
de_DE German
zh_CN Chinese
ko_KR Korean
ja Japanese
th Thai
hi_IN Hindi
ar Arabic
tr_TR Turkish
pl_PL Polish
id_ID Indonesian
nl_NL Dutch
sv_SE Swedish
Change Language
Close and do not switch language
Nessun risultato
Vedi tutti i risultati
  • it_ITItalian
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • pl_PLPolish
    • id_IDIndonesian
    • tr_TRTurkish
    • hi_INHindi
    • thThai
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
  • Gioco
  • Hardware
  • IA
  • Mobile
  • Cosa c'è di nuovo
  • Reti
  • Sicurezza
  • Software
  • Tutorial
  • Windows

Copyright © 2025 https://mastertrend.info/ - Tutti i diritti riservati. Tutti i marchi commerciali appartengono ai rispettivi proprietari.

wpDiscuz
RedditCielo bluXMastodonteHacker News
Condividi questo:
MastodonteVKMessaggio di WhatsAppTelegrammaSMSLineaMessengerFlipboardHacker NewsMixNextdoorPerplessitàXingYummly
Il Mastodonte Istanza