{"id":109305,"date":"2026-04-19T01:36:23","date_gmt":"2026-04-19T04:36:23","guid":{"rendered":"https:\/\/mastertrend.info\/?p=109305"},"modified":"2026-04-23T16:20:19","modified_gmt":"2026-04-23T19:20:19","slug":"groq-3-lpu","status":"publish","type":"post","link":"https:\/\/mastertrend.info\/fr\/groq-3-lpu\/","title":{"rendered":"Groq 3 LPU et la nouvelle strat\u00e9gie d'inf\u00e9rence de Nvidia"},"content":{"rendered":"<h2>Groq 3 LPU et le changement strat\u00e9gique chez Rubin<\/h2>\n<p>La pr\u00e9sentation du Groq 3 \u00e0 la GTC 2026 repr\u00e9sente bien plus qu'un simple lancement technique\u00a0: elle marque un tournant strat\u00e9gique dans la mani\u00e8re dont Nvidia structure sa plateforme d'inf\u00e9rence. Plus qu'une simple nouvelle puce, elle red\u00e9finit la hi\u00e9rarchie interne de Rubin et annonce une nouvelle phase dans la course aux semi-conducteurs sp\u00e9cialis\u00e9s.<\/p>\n<p id=\"c893b5ed-9214-4d2c-9a26-a64e3b2f0213\">Lors de la GTC 2026, qui s'est tenue \u00e0 San Jose, Nvidia a d\u00e9voil\u00e9 l'acc\u00e9l\u00e9rateur d'inf\u00e9rence Groq 3\u00a0: la premi\u00e8re puce issue de son accord de licence et de recrutement de talents de 20 milliards de dollars sign\u00e9 le 24 d\u00e9cembre 2025. Il s'agit d'une unit\u00e9 de traitement du langage (LPU). <a title=\"Technologie PSSR pour PS5 Pro\u00a0: Comment convertir les jeux 1080p en 4K sans perte de FPS\" href=\"https:\/\/mastertrend.info\/fr\/technologie-pssr-ps5-pro\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34712\">bas\u00e9 sur la SRAM que Nvidia<\/a> Il est int\u00e9gr\u00e9 \u00e0 la plateforme Vera Rubin en tant que coprocesseur d\u00e9di\u00e9 \u00e0 la phase de d\u00e9codage. Le fabricant a annonc\u00e9 une date de livraison pr\u00e9vue pour le troisi\u00e8me trimestre 2026\u00a0; la production sera assur\u00e9e par Samsung avec une gravure en 4\u00a0nm. Il s\u2019agit \u00e9galement du premier produit \u00e0 l\u2019\u00e9chelle d\u2019un rack con\u00e7u par Nvidia autour d\u2019une puce non-GPU, et son arriv\u00e9e a entra\u00een\u00e9 une r\u00e9organisation de sa feuille de route en mati\u00e8re de composants.<\/p>\n<p>Le c\u0153ur du Groq 3 LPX est la puce LP30\u00a0: 512\u00a0Mo de SRAM par puce et une bande passante m\u00e9moire de 150\u00a0To\/s par puce. \u00c0 titre de comparaison, un GPU Rubin dot\u00e9 de 288\u00a0Go de HBM4 offre environ 22\u00a0To\/s\u00a0; cette diff\u00e9rence d\u2019ordre de grandeur n\u2019est pas une nuance, mais un choix architectural. Un rack LPX complet embarque 256\u00a0LPU, totalisant 128\u00a0Go de SRAM et une bande passante agr\u00e9g\u00e9e de 40\u00a0Po\/s. Nvidia affirme qu\u2019associ\u00e9 \u00e0 un Rubin NVL72, un rack LPX offre des performances jusqu\u2019\u00e0 35\u00a0fois sup\u00e9rieures par m\u00e9gawatt \u00e0 celles d\u2019un NVL72 seul, selon des mod\u00e8les \u00e0 mille milliards de param\u00e8tres, avec un objectif de co\u00fbt d\u2019exploitation de 45\u00a0$ par million de jetons.<\/p>\n<h2 id=\"groq-3-and-vera-rubin-3\">Groq 3 et la fonction dans Rubin<\/h2>\n<figure id=\"bede7762-1a1c-4278-92c5-37773fe99ee3\" class=\"van-image-figure inline-layout\" data-bordeaux-image-check=\"\"><picture data-new-v2-image=\"true\"><source type=\"image\/webp\" \/><\/picture> <picture data-new-v2-image=\"true\"><img decoding=\"async\" class=\"inline\" src=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.jpg\" alt=\"rendu du rack Rubin illustrant l&#039;architecture SuperPOD\" data-new-v2-image=\"true\" data-pin-media=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.jpg\" title=\"\"><\/picture><figcaption class=\"inline-layout\"><span class=\"caption-text\">Nvidia a pr\u00e9sent\u00e9 sa strat\u00e9gie Rubin SuperPOD \u00e0 sept puces lors de la GTC 2026. <\/span><span class=\"credit\">(Cr\u00e9dit image\u00a0: Nvidia)<\/span><\/figcaption><\/figure>\n<p id=\"02ddbe2c-294b-402e-b0ab-38bdf2539030\">Dans le fonctionnement pr\u00e9vu, les GPU Rubin prennent en charge la phase de pr\u00e9remplissage (traitement des contextes longs et des calculs haute densit\u00e9), tandis que les LPU Groq g\u00e8rent le d\u00e9codage et la g\u00e9n\u00e9ration de jetons avec une latence r\u00e9duite. Dynamo orchestre cette distribution h\u00e9t\u00e9rog\u00e8ne en attribuant les t\u00e2ches en fonction de la taille des lots et du parall\u00e9lisme afin d'optimiser les performances et la consommation \u00e9nerg\u00e9tique.<\/p>\n<aside class=\"hawk-root\" data-block-type=\"embed\" data-render-type=\"fte\" data-skip=\"dealsy\" data-widget-type=\"seasonal\"><\/aside>\n<p id=\"02ddbe2c-294b-402e-b0ab-38bdf2539030-1\">La conception LPU originale de Groq privil\u00e9giait le d\u00e9terminisme\u00a0: un pipeline VLIW (Very Long Instruction Word) avec de grandes banques de SRAM et un compilateur qui pr\u00e9-planifiait l\u2019ex\u00e9cution, \u00e9liminant ainsi les d\u00e9fauts de cache et les arr\u00eats inattendus. Il en r\u00e9sultait des d\u00e9bits de jetons par utilisateur tr\u00e8s \u00e9lev\u00e9s, mais r\u00e9v\u00e9lait un probl\u00e8me de capacit\u00e9\u00a0: les g\u00e9n\u00e9rations pr\u00e9c\u00e9dentes, avec 230\u00a0Mo de SRAM par puce, n\u00e9cessitaient de nombreuses puces pour accueillir les mod\u00e8les de taille moyenne. <a title=\"Faire tourner un mod\u00e8le d&#039;IA sur Xbox 360\u00a0: G\u00e9nial\u00a0! \ud83d\udc7e\" href=\"https:\/\/mastertrend.info\/fr\/executer-un-modele-ia-sur-xbox-360\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34713\">architecture<\/a> Il a \u00e9t\u00e9 con\u00e7u d\u00e8s le d\u00e9part avec une orientation vers les r\u00e9seaux convolutionnels plut\u00f4t que vers les mod\u00e8les de langage modernes.<\/p>\n<p>Le LP30 att\u00e9nue certaines de ces limitations gr\u00e2ce \u00e0 ses 512 Mo de SRAM par puce et sa capacit\u00e9 de calcul FP8 de 1,23 PFLOPS. Samsung a augment\u00e9 sa production \u2013 d'environ 9\u00a0000 \u00e0 environ 15\u00a0000 plaquettes, selon les annonces \u2013 en passant de la production de prototypes \u00e0 la fabrication commerciale. Lors de la GTC, il a \u00e9galement \u00e9t\u00e9 annonc\u00e9 qu'AWS d\u00e9ploierait des LPU Groq 3 aux c\u00f4t\u00e9s de plus d'un million de GPU Nvidia dans le cadre de l'extension de son infrastructure.<\/p>\n<p>Au-del\u00e0 de la LP30, Nvidia a mentionn\u00e9 une feuille de route produit\u00a0: une LP35 avec prise en charge NVFP4 destin\u00e9e \u00e0 s\u2019aligner sur la g\u00e9n\u00e9ration Rubin Ultra, et une LP40 pr\u00e9vue pour le cycle d\u2019architecture Feynman ult\u00e9rieurement.<\/p>\n<h2 id=\"rubin-cpx-axed-3\">Que se passe-t-il avec Rubin CPX ?<\/h2>\n<p id=\"7dd89f1a-8ce4-4fe4-b7a6-6c732560941c\">Au GTC, l'absence du Rubin CPX, l'acc\u00e9l\u00e9rateur d'inf\u00e9rence bas\u00e9 sur <a title=\"L&#039;avenir des cartes graphiques Nvidia GeForce RTX s\u00e9rie 50\u00a0: des raisons de s&#039;enthousiasmer d\u00e8s aujourd&#039;hui\u00a0! \ud83c\udfae\" href=\"https:\/\/mastertrend.info\/fr\/avenir-de-la-serie-nvidia-geforce-rtx-50\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34711\">GDDR7 de Nvidia<\/a> Annonc\u00e9e en septembre 2025, la CPX n'apparaissait ni dans les diapositives principales ni sur sc\u00e8ne. Tout porte \u00e0 croire, sans confirmation officielle, que la CPX a \u00e9t\u00e9 retir\u00e9e de la feuille de route et remplac\u00e9e dans la hi\u00e9rarchie des plateformes par la LPX Groq 3.<\/p>\n<p id=\"54eeb077-5d53-4ff6-afc2-39c0708b5eb1\">Le CPX a \u00e9t\u00e9 initialement con\u00e7u comme une alternative moins co\u00fbteuse pour acc\u00e9l\u00e9rer la phase de contexte gr\u00e2ce \u00e0 la GDDR7, tirant parti de sa plus grande disponibilit\u00e9 face \u00e0 la p\u00e9nurie de HBM. Cependant, les LPU de Groq \u00e9liminent le besoin de modules de m\u00e9moire externes de grande taille et offrent une bande passante par puce nettement sup\u00e9rieure, un avantage ind\u00e9niable sur un march\u00e9 o\u00f9 l'approvisionnement en HBM reste tendu et o\u00f9 la production de GDDR7 est encore en phase d'augmentation. Bien que les unit\u00e9s CPX d\u00e9j\u00e0 command\u00e9es puissent continuer \u00e0 \u00eatre livr\u00e9es, la pr\u00e9f\u00e9rence strat\u00e9gique semble d\u00e9sormais s'orienter vers l'int\u00e9gration des LPU.<\/p>\n<p>Il existe \u00e9galement une analogie op\u00e9rationnelle avec l'acquisition de Mellanox en 2019\u00a0: des technologies de start-up qui finissent par former de nouvelles couches architecturales au sein de l'infrastructure de Nvidia \u2014 dans leur cas NVLink\/InfiniBand \u2014 et, dans ce sc\u00e9nario, Groq pourrait devenir un composant structurel similaire au sein de l'\u00e9cosyst\u00e8me Rubin.<\/p>\n<h2 id=\"inference-chip-consolidation-3\">Consolidation du march\u00e9 des puces d'inf\u00e9rence<\/h2>\n<p id=\"02efd3bd-85e4-438e-80ce-bbd81597025b\">L'accord avec Groq a \u00e9t\u00e9 l'\u00e9l\u00e9ment le plus visible d'une vague de consolidation en 2025 ax\u00e9e sur les puces d'inf\u00e9rence. Cette ann\u00e9e-l\u00e0, AMD a acquis l'\u00e9quipe d'IA d'Untether, Nvidia a rachet\u00e9 les \u00e9quipements et la propri\u00e9t\u00e9 intellectuelle d'Enfabrica pour plus de 900 millions de dollars, Meta a acquis Rivos, et des discussions \u2013 finalement abandonn\u00e9es \u2013 ont eu lieu entre Intel et SambaNova, qui devaient aboutir \u00e0 un investissement et un partenariat de 350 millions de dollars. Cette situation illustre le fait que concurrencer directement l'\u00e9cosyst\u00e8me et l'envergure de Nvidia en mati\u00e8re de CUDA repr\u00e9sente un d\u00e9fi \u00e9conomique consid\u00e9rable, m\u00eame lorsque la technologie pr\u00e9sente un r\u00e9el potentiel technique.<\/p>\n<p>Le ph\u00e9nom\u00e8ne r\u00e9current est l'absorption des talents et des technologies par les acteurs majeurs. Groq, par exemple, pr\u00e9voyait un chiffre d'affaires d'environ 500 millions d'euros d'ici 2025, mais ce montant s'est av\u00e9r\u00e9 insuffisant pour pr\u00e9server son ind\u00e9pendance face \u00e0 la pression strat\u00e9gique des fabricants dominants. Les analystes soulignent que les accords de licence non exclusifs maintiennent une apparence de concurrence, mais neutralisent en r\u00e9alit\u00e9 les concurrents en int\u00e9grant leur technologie \u00e0 la plateforme de l'acheteur.<\/p>\n<h2 id=\"hyperscaler-custom-silicon-3\">Silicium sur mesure dans les hyperscalers<\/h2>\n<figure id=\"2ef100e3-6e87-4247-ab65-65c55ffa1aa1\" class=\"van-image-figure inline-layout\" data-bordeaux-image-check=\"\"><picture data-new-v2-image=\"true\"><source type=\"image\/webp\" \/><\/picture> <picture data-new-v2-image=\"true\"><img decoding=\"async\" class=\"inline\" src=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.png\" alt=\"Diagramme de feuille de route Meta MTIA pour les acc\u00e9l\u00e9rateurs d&#039;inf\u00e9rence\" data-new-v2-image=\"true\" data-pin-media=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.png\" title=\"\"><\/picture><figcaption class=\"inline-layout\"><span class=\"caption-text\"><a href=\"https:\/\/ai.meta.com\/blog\/meta-mtia-scale-ai-chips-for-billions\/\" target=\"_blank\" rel=\"noopener\" data-schema-attribute=\"mentions\">Meta a pr\u00e9sent\u00e9 sa feuille de route MTIA<\/a> r\u00e9cemment. <\/span><span class=\"credit\">(Cr\u00e9dit photo : Meta)<\/span><\/figcaption><\/figure>\n<p id=\"2084220b-976c-4b0b-b57a-6176d6a5af92\">Tandis que les startups s'int\u00e8grent aux grandes entreprises, les principaux fournisseurs de cloud d\u00e9veloppent leurs propres pipelines d'inf\u00e9rence sur silicium.<\/p>\n<p>Meta a annonc\u00e9 les g\u00e9n\u00e9rations successives de MTIA, d\u00e9velopp\u00e9es avec Broadcom\u00a0: de MTIA 300 \u2014 d\u00e9j\u00e0 en production pour le classement et la recommandation \u2014 \u00e0 MTIA 500, orient\u00e9e vers l\u2019inf\u00e9rence g\u00e9n\u00e9rative et dont le d\u00e9ploiement \u00e0 grande \u00e9chelle est pr\u00e9vu pour 2027. Google maintient sa gamme de TPU (Ironwood v7) avec des chiffres de TFLOPS et des pods \u00e0 grande \u00e9chelle, et AWS continue de d\u00e9velopper Trainium et Inferentia, bien que les donn\u00e9es internes jusqu\u2019en 2024 aient montr\u00e9 une adoption relativement faible par rapport aux GPU dans la propre infrastructure d\u2019AWS.<\/p>\n<p>Les \u00e9tudes et projections sectorielles renforcent la diversification\u00a0: en novembre 2025, Futurum Group a class\u00e9 les acc\u00e9l\u00e9rateurs XPU comme le segment \u00e0 la croissance la plus rapide des d\u00e9penses des centres de donn\u00e9es pour 2026, et TrendForce a projet\u00e9 une augmentation notable des livraisons d\u2019ASIC personnalis\u00e9s par les fournisseurs de cloud pour cette m\u00eame ann\u00e9e.<\/p>\n<p>La r\u00e9action de Nvidia a \u00e9t\u00e9 claire\u00a0: s\u2019assurer la pr\u00e9sence de puces non-GPU au sein de sa plateforme avant que des tiers ne le fassent. Le Groq 3 LPU est la concr\u00e9tisation de cette strat\u00e9gie\u00a0; l\u2019avenir du Rubin CPX, en revanche, reste incertain pour le moment.<\/p>\n<p><!-- hermes-editorial-review:related-links:end --><\/p>","protected":false},"excerpt":{"rendered":"<p>Groq 3 LPU marque l'int\u00e9gration de silicium non-GPU dans Rubin et refl\u00e8te la consolidation du march\u00e9 des puces d'inf\u00e9rence face aux hyperscalers et aux concurrents.<\/p>","protected":false},"author":1,"featured_media":109306,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ai_generated_summary":"","iawp_total_views":92,"jnews-multi-image_gallery":[],"jnews_single_post":{"format":"standard","override":[{"template":"1","parallax":"1","fullscreen":"1","layout":"right-sidebar","sidebar":"default-sidebar","second_sidebar":"default-sidebar","sticky_sidebar":"1","share_position":"top","share_float_style":"share-monocrhome","show_share_counter":"1","show_view_counter":"1","show_featured":"1","show_post_meta":"1","show_post_author":"1","show_post_author_image":"1","show_post_date":"1","post_date_format":"default","post_date_format_custom":"Y\/m\/d","show_post_category":"1","show_post_reading_time":"1","post_reading_time_wpm":"300","post_calculate_word_method":"str_word_count","zoom_button_out_step":"2","zoom_button_in_step":"3","show_post_tag":"1","show_prev_next_post":"1","show_popup_post":"1","show_comment_section":"1","number_popup_post":"1","show_author_box":"1","show_post_related":"1","show_inline_post_related":"0"}],"image_override":[{"single_post_thumbnail_size":"crop-500","single_post_gallery_size":"crop-500"}],"trending_post_position":"meta","trending_post_label":"Trending","sponsored_post_label":"Sponsored by","disable_ad":"0","subtitle":""},"jnews_primary_category":[],"jnews_social_meta":[],"jnews_review":[],"enable_review":"","type":"percentage","name":"","summary":"","brand":"","sku":"","good":[],"bad":[],"score_override":"","override_value":"","rating":[],"price":[],"jnews_override_counter":{"view_counter_number":"0","share_counter_number":"0","like_counter_number":"0","dislike_counter_number":"0"},"footnotes":""},"categories":[74],"tags":[1445,1709,1603],"class_list":["post-109305","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-hardware","tag-evergreencontent","tag-gpu","tag-nvidia"],"_links":{"self":[{"href":"https:\/\/mastertrend.info\/fr\/wp-json\/wp\/v2\/posts\/109305","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mastertrend.info\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mastertrend.info\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/fr\/wp-json\/wp\/v2\/comments?post=109305"}],"version-history":[{"count":11,"href":"https:\/\/mastertrend.info\/fr\/wp-json\/wp\/v2\/posts\/109305\/revisions"}],"predecessor-version":[{"id":110474,"href":"https:\/\/mastertrend.info\/fr\/wp-json\/wp\/v2\/posts\/109305\/revisions\/110474"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/fr\/wp-json\/wp\/v2\/media\/109306"}],"wp:attachment":[{"href":"https:\/\/mastertrend.info\/fr\/wp-json\/wp\/v2\/media?parent=109305"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mastertrend.info\/fr\/wp-json\/wp\/v2\/categories?post=109305"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mastertrend.info\/fr\/wp-json\/wp\/v2\/tags?post=109305"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}