• À propos de nous
  • Annoncer
  • politique de confidentialité
  • Contactez-nous
MasterTrend Info - Technologie, actualités et tutoriels
  • La MAISON
    • BLOG
  • Tutoriels
  • Matériel
  • Jeu
  • Mobile
  • Sécurité
  • Fenêtres
  • IA
  • Logiciel
  • Réseaux
  • Ce qui est nouveau
  • fr_FRFrench
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
Aucun résultat
Voir tous les résultats
  • La MAISON
    • BLOG
  • Tutoriels
  • Matériel
  • Jeu
  • Mobile
  • Sécurité
  • Fenêtres
  • IA
  • Logiciel
  • Réseaux
  • Ce qui est nouveau
  • fr_FRFrench
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
Aucun résultat
Voir tous les résultats
MasterTrend Info - Technologie, actualités et tutoriels
Aucun résultat
Voir tous les résultats
Commencer Matériel

Groq 3 LPU et la nouvelle stratégie d'inférence de Nvidia

MasterTrend Idées par MasterTrend Idées
23 de avril de 2026
dans Matériel
Temps de lecture:6 min en lecture
0
L'image compare le LPU Groq 3 et le GPU Rubin de Nvidia, illustrant la conception de la puce pour l'inférence d'intelligence artificielle et la nouvelle stratégie de Nvidia en matière de matériel d'accélération de l'IA.

Comparaison visuelle entre le GPU Rubin de Nvidia et la puce Groq 3 LPU, mettant en évidence les différences d'architecture, de performances et d'efficacité pour les charges de travail d'IA. Aperçu de l'avenir du matériel d'inférence IA spécialisé, des accélérateurs hautes performances et des centres de données optimisés pour les modèles génératifs et les LLM.

50
PARTAGÉ
140
Vues
Partager sur FacebookPartager sur Twitter

Contenu

  1. Groq 3 LPU et le changement stratégique chez Rubin
  2. Groq 3 et la fonction dans Rubin
  3. Que se passe-t-il avec Rubin CPX ?
  4. Consolidation du marché des puces d'inférence
  5. Silicium sur mesure dans les hyperscalers

Groq 3 LPU et le changement stratégique chez Rubin

La présentation du Groq 3 à la GTC 2026 représente bien plus qu'un simple lancement technique : elle marque un tournant stratégique dans la manière dont Nvidia structure sa plateforme d'inférence. Plus qu'une simple nouvelle puce, elle redéfinit la hiérarchie interne de Rubin et annonce une nouvelle phase dans la course aux semi-conducteurs spécialisés.

Lors de la GTC 2026, qui s'est tenue à San Jose, Nvidia a dévoilé l'accélérateur d'inférence Groq 3 : la première puce issue de son accord de licence et de recrutement de talents de 20 milliards de dollars signé le 24 décembre 2025. Il s'agit d'une unité de traitement du langage (LPU). basé sur la SRAM que Nvidia Il est intégré à la plateforme Vera Rubin en tant que coprocesseur dédié à la phase de décodage. Le fabricant a annoncé une date de livraison prévue pour le troisième trimestre 2026 ; la production sera assurée par Samsung avec une gravure en 4 nm. Il s’agit également du premier produit à l’échelle d’un rack conçu par Nvidia autour d’une puce non-GPU, et son arrivée a entraîné une réorganisation de sa feuille de route en matière de composants.

Le cœur du Groq 3 LPX est la puce LP30 : 512 Mo de SRAM par puce et une bande passante mémoire de 150 To/s par puce. À titre de comparaison, un GPU Rubin doté de 288 Go de HBM4 offre environ 22 To/s ; cette différence d’ordre de grandeur n’est pas une nuance, mais un choix architectural. Un rack LPX complet embarque 256 LPU, totalisant 128 Go de SRAM et une bande passante agrégée de 40 Po/s. Nvidia affirme qu’associé à un Rubin NVL72, un rack LPX offre des performances jusqu’à 35 fois supérieures par mégawatt à celles d’un NVL72 seul, selon des modèles à mille milliards de paramètres, avec un objectif de coût d’exploitation de 45 $ par million de jetons.

Groq 3 et la fonction dans Rubin

rendu du rack Rubin illustrant l'architecture SuperPOD
Nvidia a présenté sa stratégie Rubin SuperPOD à sept puces lors de la GTC 2026. (Crédit image : Nvidia)

Dans le fonctionnement prévu, les GPU Rubin prennent en charge la phase de préremplissage (traitement des contextes longs et des calculs haute densité), tandis que les LPU Groq gèrent le décodage et la génération de jetons avec une latence réduite. Dynamo orchestre cette distribution hétérogène en attribuant les tâches en fonction de la taille des lots et du parallélisme afin d'optimiser les performances et la consommation énergétique.

La conception LPU originale de Groq privilégiait le déterminisme : un pipeline VLIW (Very Long Instruction Word) avec de grandes banques de SRAM et un compilateur qui pré-planifiait l’exécution, éliminant ainsi les défauts de cache et les arrêts inattendus. Il en résultait des débits de jetons par utilisateur très élevés, mais révélait un problème de capacité : les générations précédentes, avec 230 Mo de SRAM par puce, nécessitaient de nombreuses puces pour accueillir les modèles de taille moyenne. architecture Il a été conçu dès le départ avec une orientation vers les réseaux convolutionnels plutôt que vers les modèles de langage modernes.

Le LP30 atténue certaines de ces limitations grâce à ses 512 Mo de SRAM par puce et sa capacité de calcul FP8 de 1,23 PFLOPS. Samsung a augmenté sa production – d'environ 9 000 à environ 15 000 plaquettes, selon les annonces – en passant de la production de prototypes à la fabrication commerciale. Lors de la GTC, il a également été annoncé qu'AWS déploierait des LPU Groq 3 aux côtés de plus d'un million de GPU Nvidia dans le cadre de l'extension de son infrastructure.

Au-delà de la LP30, Nvidia a mentionné une feuille de route produit : une LP35 avec prise en charge NVFP4 destinée à s’aligner sur la génération Rubin Ultra, et une LP40 prévue pour le cycle d’architecture Feynman ultérieurement.

Que se passe-t-il avec Rubin CPX ?

Au GTC, l'absence du Rubin CPX, l'accélérateur d'inférence basé sur GDDR7 de Nvidia Annoncée en septembre 2025, la CPX n'apparaissait ni dans les diapositives principales ni sur scène. Tout porte à croire, sans confirmation officielle, que la CPX a été retirée de la feuille de route et remplacée dans la hiérarchie des plateformes par la LPX Groq 3.

Le CPX a été initialement conçu comme une alternative moins coûteuse pour accélérer la phase de contexte grâce à la GDDR7, tirant parti de sa plus grande disponibilité face à la pénurie de HBM. Cependant, les LPU de Groq éliminent le besoin de modules de mémoire externes de grande taille et offrent une bande passante par puce nettement supérieure, un avantage indéniable sur un marché où l'approvisionnement en HBM reste tendu et où la production de GDDR7 est encore en phase d'augmentation. Bien que les unités CPX déjà commandées puissent continuer à être livrées, la préférence stratégique semble désormais s'orienter vers l'intégration des LPU.

Il existe également une analogie opérationnelle avec l'acquisition de Mellanox en 2019 : des technologies de start-up qui finissent par former de nouvelles couches architecturales au sein de l'infrastructure de Nvidia — dans leur cas NVLink/InfiniBand — et, dans ce scénario, Groq pourrait devenir un composant structurel similaire au sein de l'écosystème Rubin.

Consolidation du marché des puces d'inférence

L'accord avec Groq a été l'élément le plus visible d'une vague de consolidation en 2025 axée sur les puces d'inférence. Cette année-là, AMD a acquis l'équipe d'IA d'Untether, Nvidia a racheté les équipements et la propriété intellectuelle d'Enfabrica pour plus de 900 millions de dollars, Meta a acquis Rivos, et des discussions – finalement abandonnées – ont eu lieu entre Intel et SambaNova, qui devaient aboutir à un investissement et un partenariat de 350 millions de dollars. Cette situation illustre le fait que concurrencer directement l'écosystème et l'envergure de Nvidia en matière de CUDA représente un défi économique considérable, même lorsque la technologie présente un réel potentiel technique.

Le phénomène récurrent est l'absorption des talents et des technologies par les acteurs majeurs. Groq, par exemple, prévoyait un chiffre d'affaires d'environ 500 millions d'euros d'ici 2025, mais ce montant s'est avéré insuffisant pour préserver son indépendance face à la pression stratégique des fabricants dominants. Les analystes soulignent que les accords de licence non exclusifs maintiennent une apparence de concurrence, mais neutralisent en réalité les concurrents en intégrant leur technologie à la plateforme de l'acheteur.

Silicium sur mesure dans les hyperscalers

Diagramme de feuille de route Meta MTIA pour les accélérateurs d'inférence
Meta a présenté sa feuille de route MTIA récemment. (Crédit photo : Meta)

Tandis que les startups s'intègrent aux grandes entreprises, les principaux fournisseurs de cloud développent leurs propres pipelines d'inférence sur silicium.

Meta a annoncé les générations successives de MTIA, développées avec Broadcom : de MTIA 300 — déjà en production pour le classement et la recommandation — à MTIA 500, orientée vers l’inférence générative et dont le déploiement à grande échelle est prévu pour 2027. Google maintient sa gamme de TPU (Ironwood v7) avec des chiffres de TFLOPS et des pods à grande échelle, et AWS continue de développer Trainium et Inferentia, bien que les données internes jusqu’en 2024 aient montré une adoption relativement faible par rapport aux GPU dans la propre infrastructure d’AWS.

Les études et projections sectorielles renforcent la diversification : en novembre 2025, Futurum Group a classé les accélérateurs XPU comme le segment à la croissance la plus rapide des dépenses des centres de données pour 2026, et TrendForce a projeté une augmentation notable des livraisons d’ASIC personnalisés par les fournisseurs de cloud pour cette même année.

La réaction de Nvidia a été claire : s’assurer la présence de puces non-GPU au sein de sa plateforme avant que des tiers ne le fassent. Le Groq 3 LPU est la concrétisation de cette stratégie ; l’avenir du Rubin CPX, en revanche, reste incertain pour le moment.

Partagez ceci :
FacebookLinkedInPinterestXRedditTumblrCiel bleuFilsPartagerChatGPTClaudeGoogle IAGrok
Tags: EvergreenContentGPUNvidia
Précédente Publication

Infrastructure du botnet C2 : impact après l’opération internationale

Prochaine publication

Minecraft sur E Ink : limites réelles de l'écran

MasterTrend Idées

MasterTrend Idées

Notre équipe de rédaction actions d'une analyse approfondie, des tutoriels et des recommandations pour obtenir les la plupart hors de vos appareils et les outils numériques.

LiéesPublications

Architecture AMD UDNA pour PS6 et Xbox Next : détail de la puce GPU de nouvelle génération dotée d’une conception avancée pour les consoles de jeux hautes performances.
Matériel

Architecture UDNA sur PS6 et Xbox : bien plus que de simples chiffres

4 mai 2026
136
FSR 4.1 AMD : Illustration promotionnelle de FidelityFX Super Resolution avec un design futuriste rouge et noir, mettant en évidence les améliorations de performances et de qualité des GPU RDNA 4.
Matériel

FSR 4.1 AMD : Améliorations et limitations réelles dans RDNA 4

4 mai 2026
206
Ordinateur portable ThinkPad X9-14 Gen 1 déballé avec écran Windows 11 et Copilot, design ultra-fin haut de gamme, clavier rétroéclairé et analyse technique des performances et des principales décisions d'achat.
Matériel

Analyse technique et décisions clés du ThinkPad X9-14 Gen 1

18 de février de 2026
211
Maintenance d'un ThinkPad T14 Gen 4 AMD en conditions réelles d'utilisation : ordinateur portable ouvert et en fonctionnement lors d'un contrôle technique en environnement professionnel.
Matériel

Maintenance du ThinkPad T14 Gen 4 AMD en conditions réelles d'utilisation

28 de avril de 2026
166
Durée de vie de la pâte thermique - Application de la pâte thermique sur le processeur pour améliorer le refroidissement et explication de sa durée de vie sur le CPU.
Matériel

Durée de vie de la pâte thermique et son impact sur les performances du PC

28 de janvier de 2026
419
Est-il judicieux d'investir dans le PCIe 7.0 aujourd'hui ? – PCI-SIG annonce les spécifications finales du PCIe 7.0, mettant en avant la nouvelle norme PCI Express avec des vitesses allant jusqu'à 128 GT/s pour la prochaine génération d'informatique.
Matériel

Est-il judicieux d'investir dans PCIe 7.0 aujourd'hui ? Impact réel et scénarios d'utilisation

28 de janvier de 2026
199
Prochaine publication
Minecraft sur écran E Ink : Minecraft fonctionnant sur une tablette dotée d’un écran E Ink en niveaux de gris, illustrant les véritables limites de l’encre électronique en termes de performances et de qualité d’image pendant le jeu.

Minecraft sur E Ink : limites réelles de l'écran

5 1 voter
Évaluation de l'article
S'abonner
Accéder
Notifier de
invité
invité
0 Commentaires
le plus ancien
Le plus récent Les plus votés
Commentaires en ligne
Voir tous les commentaires

Restez Connecté

  • 976 Les Fans
  • 118 Les adeptes
  • 1.4 k Les adeptes
  • 1.8 k Les abonnés
  • Les tendances
  • Commentaires
  • Dernière
🖥️ Comment ouvrir "Périphériques et imprimantes" dans Windows 11: 4 étapes simples

🌟 Comment ouvrir "Périphériques et imprimantes" dans Windows 11: ¡truc Incroyable!

21 de juin de 2026
Horloge persistante Windows 11 : options d’affichage d’une horloge permanente, limitations et choix pratiques, avec fond bleu, icône Windows et horloge analogique minimaliste.

Horloge persistante de Windows 11 : options, limites et choix concrets

21 de juin de 2026
Problème de connexion Ethernet sous Windows 11 : 9 astuces faciles

Problème de connexion Ethernet sous Windows 11 : solution en 3 minutes ⚡🌐

13 novembre 2025
Comment faire pour enregistrer le jeu en REPO

Comment faire pour enregistrer le jeu en REPO 🔥 Découvrir le secret pour ne pas perdre le progrès

7 juillet 2025
Les fonctionnalités de Gmail sur Android: gagnez du temps avec les 5 conseils

Les fonctionnalités de Gmail sur Android: vous 5 trucs que vous ne saviez pas! 📱✨

12
Réparation de carte mère d'ordinateur portable : vue interne avec la carte mère, le système de refroidissement, les ventilateurs et les composants clés à vérifier sur un ordinateur portable ouvert.

Réparation de carte mère d'ordinateur portable – Diagnostic étape par étape

10
Installer Windows 11 Domicile sans Internet

Installer Windows 11 Domicile sans Internet

10
Comment sauvegarder les pilotes dans Windows 11/10 en 4 étapes!

Comment sauvegarder les pilotes dans Windows 11/10 Il Évite les erreurs! 🚨💾

10
Confidentialité sous Windows 11 - Une femme utilise un ordinateur portable à domicile pour configurer les options de confidentialité sous Windows 11 avec O&O ShutUp11++, affichant les paramètres de sécurité et le contrôle des données à l'écran.

Protection de la vie privée sous Windows 11 avec O&O ShutUp10++

21 de juin de 2026
Fonctionnalités optionnelles de Windows 11 - Une femme travaillant sur un ordinateur portable Windows 11 active des fonctionnalités optionnelles dans les paramètres système ; guide sur l’activation ou la désactivation des fonctionnalités optionnelles de Windows 11 dans un environnement de bureau moderne

Fonctionnalités optionnelles de Windows 11 : quand les activer ou les désactiver

21 de juin de 2026
Saros Endings : A. Devraj en armure Soltari futuriste dans une scène sombre et dramatique, analyse de la fin principale et de la fin secrète du jeu vidéo.

Fins de Saros : Analyse des fins principales et secrètes

14 de juin de 2026
Architecture AMD UDNA pour PS6 et Xbox Next : détail de la puce GPU de nouvelle génération dotée d’une conception avancée pour les consoles de jeux hautes performances.

Architecture UDNA sur PS6 et Xbox : bien plus que de simples chiffres

4 mai 2026

Les Dernières Nouvelles

Confidentialité sous Windows 11 - Une femme utilise un ordinateur portable à domicile pour configurer les options de confidentialité sous Windows 11 avec O&O ShutUp11++, affichant les paramètres de sécurité et le contrôle des données à l'écran.

Protection de la vie privée sous Windows 11 avec O&O ShutUp10++

21 de juin de 2026
59
Fonctionnalités optionnelles de Windows 11 - Une femme travaillant sur un ordinateur portable Windows 11 active des fonctionnalités optionnelles dans les paramètres système ; guide sur l’activation ou la désactivation des fonctionnalités optionnelles de Windows 11 dans un environnement de bureau moderne

Fonctionnalités optionnelles de Windows 11 : quand les activer ou les désactiver

21 de juin de 2026
65
Saros Endings : A. Devraj en armure Soltari futuriste dans une scène sombre et dramatique, analyse de la fin principale et de la fin secrète du jeu vidéo.

Fins de Saros : Analyse des fins principales et secrètes

14 de juin de 2026
97
Architecture AMD UDNA pour PS6 et Xbox Next : détail de la puce GPU de nouvelle génération dotée d’une conception avancée pour les consoles de jeux hautes performances.

Architecture UDNA sur PS6 et Xbox : bien plus que de simples chiffres

4 mai 2026
136
Logo MasterTrend Info

MasterTrend Info est votre source de référence dans la technologie: découvrir des news, des tutoriels, et l'analyse du matériel, des logiciels, des jeux, mobile, et de l'intelligence artificielle. Abonnez-vous à notre newsletter et ne manquez aucune tendance.

Suivez-nous

Parcourir par Catégorie

  • Jeu
  • Matériel
  • IA
  • Mobile
  • Ce qui est nouveau
  • Réseaux
  • Sécurité
  • Logiciel
  • Tutoriels
  • Fenêtres

Les Dernières Nouvelles

Confidentialité sous Windows 11 - Une femme utilise un ordinateur portable à domicile pour configurer les options de confidentialité sous Windows 11 avec O&O ShutUp11++, affichant les paramètres de sécurité et le contrôle des données à l'écran.

Protection de la vie privée sous Windows 11 avec O&O ShutUp10++

21 de juin de 2026
Fonctionnalités optionnelles de Windows 11 - Une femme travaillant sur un ordinateur portable Windows 11 active des fonctionnalités optionnelles dans les paramètres système ; guide sur l’activation ou la désactivation des fonctionnalités optionnelles de Windows 11 dans un environnement de bureau moderne

Fonctionnalités optionnelles de Windows 11 : quand les activer ou les désactiver

21 de juin de 2026
  • À propos de nous
  • Annoncer
  • politique de confidentialité
  • Contactez-nous

Copyright © 2025 https://mastertrend.info/ - Tous droits réservés. Toutes les marques déposées appartiennent à leurs détenteurs respectifs.

We've detected you might be speaking a different language. Do you want to change to:
es_ES Spanish
es_ES Spanish
en_US English
pt_BR Portuguese
fr_FR French
it_IT Italian
ru_RU Russian
de_DE German
zh_CN Chinese
ko_KR Korean
ja Japanese
th Thai
hi_IN Hindi
ar Arabic
tr_TR Turkish
pl_PL Polish
id_ID Indonesian
nl_NL Dutch
sv_SE Swedish
Change Language
Close and do not switch language
Aucun résultat
Voir tous les résultats
  • fr_FRFrench
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • pl_PLPolish
    • id_IDIndonesian
    • tr_TRTurkish
    • hi_INHindi
    • thThai
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
  • Jeu
  • Matériel
  • IA
  • Mobile
  • Ce qui est nouveau
  • Réseaux
  • Sécurité
  • Logiciel
  • Tutoriels
  • Fenêtres

Copyright © 2025 https://mastertrend.info/ - Tous droits réservés. Toutes les marques déposées appartiennent à leurs détenteurs respectifs.

wpDiscuz
RedditCiel bleuXMastodonteHacker News
Partagez ceci :
MastodonteVKWhatsAppTélégrammeSMSLigneMessengerFlipboardHacker NewsMélangerÀ côtéPerplexitéXingYummly
Votre Mastodon Exemple