{"id":109305,"date":"2026-04-19T01:36:23","date_gmt":"2026-04-19T04:36:23","guid":{"rendered":"https:\/\/mastertrend.info\/?p=109305"},"modified":"2026-04-23T16:20:19","modified_gmt":"2026-04-23T19:20:19","slug":"groq-3-lpu","status":"publish","type":"post","link":"https:\/\/mastertrend.info\/pt\/groq-3-lpu\/","title":{"rendered":"Groq 3 LPU e a nova estrat\u00e9gia de infer\u00eancia da Nvidia"},"content":{"rendered":"<h2>Groq 3 LPU e a mudan\u00e7a estrat\u00e9gica na Rubin<\/h2>\n<p>A apresenta\u00e7\u00e3o do Groq 3 na GTC 2026 \u00e9 mais do que um simples lan\u00e7amento t\u00e9cnico: marca uma mudan\u00e7a estrat\u00e9gica na forma como a Nvidia estrutura sua plataforma de infer\u00eancia. Mais do que um novo chip, ele redefine a hierarquia interna da Rubin e antecipa uma nova fase na competi\u00e7\u00e3o por sil\u00edcio especializado.<\/p>\n<p id=\"c893b5ed-9214-4d2c-9a26-a64e3b2f0213\">Na GTC 2026, realizada em San Jose, a Nvidia apresentou o acelerador de infer\u00eancia Groq 3: o primeiro chip fruto do seu acordo de licenciamento e aquisi\u00e7\u00e3o de talentos de US$ 20 bilh\u00f5es, assinado em 24 de dezembro de 2025. Trata-se de uma LPU (unidade de processamento de linguagem). <a title=\"Tecnologia PSSR para PS5 Pro: Como transformar jogos em 1080p em 4K sem perder FPS\" href=\"https:\/\/mastertrend.info\/pt\/pssr-ps5-pro-tecnologia\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34712\">baseado em SRAM que a Nvidia<\/a> Est\u00e1 integrado \u00e0 plataforma Vera Rubin como um coprocessador dedicado para a fase de decodifica\u00e7\u00e3o. O fabricante anunciou uma previs\u00e3o de entrega para o terceiro trimestre de 2026; a produ\u00e7\u00e3o ser\u00e1 feita pela Samsung em um processo de 4nm. \u00c9 tamb\u00e9m o primeiro produto em escala de rack da Nvidia projetado com sil\u00edcio n\u00e3o relacionado a GPUs, e seu lan\u00e7amento levou a uma reorganiza\u00e7\u00e3o de seus pr\u00f3prios componentes no planejamento de desenvolvimento.<\/p>\n<p>O cora\u00e7\u00e3o do Groq 3 LPX \u00e9 o chip LP30: 512 MB de SRAM por die e 150 TB\/s de largura de banda de mem\u00f3ria por chip. Para colocar isso em perspectiva, uma GPU Rubin com 288 GB de HBM4 oferece cerca de 22 TB\/s; a diferen\u00e7a de ordem de grandeza n\u00e3o \u00e9 uma nuance, mas sim uma escolha arquitet\u00f4nica. Um rack LPX completo abriga 256 LPUs, totalizando 128 GB de SRAM e 40 PB\/s de largura de banda agregada. A Nvidia afirma que, combinado com um Rubin NVL72, um rack LPX oferece at\u00e9 35 vezes mais desempenho por megawatt em compara\u00e7\u00e3o com um NVL72 sozinho em modelos com trilh\u00f5es de par\u00e2metros, com uma meta de custo operacional de US$ 45 por milh\u00e3o de tokens.<\/p>\n<h2 id=\"groq-3-and-vera-rubin-3\">Groq 3 e a fun\u00e7\u00e3o em Rubin<\/h2>\n<figure id=\"bede7762-1a1c-4278-92c5-37773fe99ee3\" class=\"van-image-figure inline-layout\" data-bordeaux-image-check=\"\"><picture data-new-v2-image=\"true\"><source type=\"image\/webp\" \/><\/picture> <picture data-new-v2-image=\"true\"><img decoding=\"async\" class=\"inline\" src=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.jpg\" alt=\"Renderiza\u00e7\u00e3o em rack Rubin ilustrando a arquitetura do SuperPOD.\" data-new-v2-image=\"true\" data-pin-media=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.jpg\" title=\"\"><\/picture><figcaption class=\"inline-layout\"><span class=\"caption-text\">A Nvidia apresentou sua estrat\u00e9gia Rubin SuperPOD de sete chips na GTC 2026. <\/span><span class=\"credit\">(Cr\u00e9dito da imagem: Nvidia)<\/span><\/figcaption><\/figure>\n<p id=\"02ddbe2c-294b-402e-b0ab-38bdf2539030\">Na opera\u00e7\u00e3o planejada, as GPUs Rubin lidam com a fase de pr\u00e9-preenchimento \u2014 processando contextos longos e c\u00e1lculos de alta densidade \u2014 enquanto as LPUs Groq gerenciam a decodifica\u00e7\u00e3o e a gera\u00e7\u00e3o de tokens com lat\u00eancia reduzida. O Dynamo orquestra essa distribui\u00e7\u00e3o heterog\u00eanea, atribuindo tarefas com base no tamanho do lote e no paralelismo para equilibrar desempenho e custo de energia.<\/p>\n<aside class=\"hawk-root\" data-block-type=\"embed\" data-render-type=\"fte\" data-skip=\"dealsy\" data-widget-type=\"seasonal\"><\/aside>\n<p id=\"02ddbe2c-294b-402e-b0ab-38bdf2539030-1\">O projeto original da LPU da Groq priorizava o determinismo: um pipeline VLIW (Very Long Instruction Word) com grandes bancos de SRAM e um compilador que pr\u00e9-planejava a execu\u00e7\u00e3o, eliminando falhas de cache e paradas inesperadas. Isso resultou em taxas de tokens muito altas por usu\u00e1rio, mas revelou um problema de capacidade: as gera\u00e7\u00f5es anteriores com 230 MB de SRAM por chip exigiam muitos dies para acomodar modelos de tamanho m\u00e9dio, e o <a title=\"Executando um modelo de IA no Xbox 360: Incr\u00edvel \ud83d\udc7e\" href=\"https:\/\/mastertrend.info\/pt\/execute-um-modelo-de-ia-no-xbox-360\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34713\">arquitetura<\/a> Foi concebida com foco em redes convolucionais em vez de modelos de linguagem modernos.<\/p>\n<p>O LP30 atenua algumas dessas limita\u00e7\u00f5es com 512 MB de SRAM por chip e 1,23 PFLOPS de capacidade de computa\u00e7\u00e3o FP8. A Samsung aumentou a produ\u00e7\u00e3o \u2014 de aproximadamente 9.000 para aproximadamente 15.000 wafers, de acordo com os an\u00fancios \u2014 passando da produ\u00e7\u00e3o de amostras para a fabrica\u00e7\u00e3o comercial. Na GTC, tamb\u00e9m foi anunciado que a AWS implantar\u00e1 LPUs Groq 3 juntamente com mais de um milh\u00e3o de GPUs da Nvidia como parte de sua expans\u00e3o de infraestrutura.<\/p>\n<p>Al\u00e9m do LP30, a Nvidia mencionou um roteiro de produtos: um LP35 com suporte a NVFP4, projetado para coincidir com a gera\u00e7\u00e3o Rubin Ultra, e um LP40 planejado para o ciclo da arquitetura Feynman posteriormente.<\/p>\n<h2 id=\"rubin-cpx-axed-3\">O que est\u00e1 acontecendo com o Rubin CPX?<\/h2>\n<p id=\"7dd89f1a-8ce4-4fe4-b7a6-6c732560941c\">Na GTC, a aus\u00eancia do Rubin CPX, o acelerador de infer\u00eancia baseado em <a title=\"O futuro da s\u00e9rie Nvidia GeForce RTX 50: motivos para se animar hoje! \ud83c\udfae\" href=\"https:\/\/mastertrend.info\/pt\/futuro-da-nvidia-geforce-rtx-serie-50\/\" target=\"_blank\" rel=\"noopener\" data-wpil-monitor-id=\"34711\">GDDR7 da Nvidia<\/a> O an\u00fancio havia sido feito em setembro de 2025. N\u00e3o apareceu nos slides principais nem foi apresentado no palco. Tudo indica \u2014 embora n\u00e3o haja confirma\u00e7\u00e3o oficial completa \u2014 que o CPX foi removido do roadmap e substitu\u00eddo na hierarquia de plataformas pelo LPX Groq 3.<\/p>\n<p id=\"54eeb077-5d53-4ff6-afc2-39c0708b5eb1\">Inicialmente, o CPX foi concebido como uma alternativa de menor custo para acelerar a fase de contexto usando GDDR7, aproveitando sua maior disponibilidade diante da escassez de HBM. No entanto, as LPUs da Groq eliminam a necessidade de grandes m\u00f3dulos de mem\u00f3ria externa e oferecem largura de banda significativamente maior por chip \u2014 uma clara vantagem em um mercado onde o fornecimento de HBM permanece restrito e a produ\u00e7\u00e3o de GDDR7 ainda est\u00e1 em fase de expans\u00e3o. Embora as unidades CPX j\u00e1 encomendadas aos clientes possam continuar sendo entregues, a prefer\u00eancia estrat\u00e9gica agora parece estar se voltando para a integra\u00e7\u00e3o de LPUs.<\/p>\n<p>Existe tamb\u00e9m uma analogia operacional com a aquisi\u00e7\u00e3o da Mellanox em 2019: tecnologias de startups que acabam formando novas camadas arquitet\u00f4nicas dentro da infraestrutura da Nvidia \u2014 no caso deles, NVLink\/InfiniBand \u2014 e, nesse cen\u00e1rio, a Groq poderia se tornar um componente estrutural semelhante dentro do ecossistema Rubin.<\/p>\n<h2 id=\"inference-chip-consolidation-3\">Consolida\u00e7\u00e3o do mercado de chips de infer\u00eancia<\/h2>\n<p id=\"02efd3bd-85e4-438e-80ce-bbd81597025b\">O acordo com a Groq foi a pe\u00e7a mais vis\u00edvel de uma onda de consolida\u00e7\u00e3o de 2025 focada em chips de infer\u00eancia. Naquele ano, a AMD adquiriu a equipe da Untether AI, a Nvidia adquiriu os equipamentos e a propriedade intelectual da Enfabrica por mais de US$ 900 milh\u00f5es, a Meta comprou a Rivos e houve negocia\u00e7\u00f5es \u2014 que acabaram sendo abandonadas \u2014 entre a Intel e a SambaNova, que resultaram em um investimento e parceria de US$ 350 milh\u00f5es. Essa movimenta\u00e7\u00e3o reflete o fato de que competir de forma independente contra o ecossistema e a escala do CUDA da Nvidia apresenta s\u00e9rios desafios econ\u00f4micos, mesmo quando a tecnologia tem m\u00e9rito t\u00e9cnico.<\/p>\n<p>O padr\u00e3o recorrente \u00e9 a absor\u00e7\u00e3o de talentos e tecnologia pelos principais players. A Groq, por exemplo, esperava faturar cerca de \u20ac 500 milh\u00f5es at\u00e9 2025, mas esse valor n\u00e3o foi suficiente para manter sua independ\u00eancia diante da press\u00e3o estrat\u00e9gica dos fabricantes dominantes. Analistas apontam que os contratos de licenciamento n\u00e3o exclusivos preservam a apar\u00eancia de concorr\u00eancia, mas, na pr\u00e1tica, neutralizam os rivais ao integrar sua tecnologia \u00e0 plataforma do comprador.<\/p>\n<h2 id=\"hyperscaler-custom-silicon-3\">Sil\u00edcio personalizado em hiperescaladores<\/h2>\n<figure id=\"2ef100e3-6e87-4247-ab65-65c55ffa1aa1\" class=\"van-image-figure inline-layout\" data-bordeaux-image-check=\"\"><picture data-new-v2-image=\"true\"><source type=\"image\/webp\" \/><\/picture> <picture data-new-v2-image=\"true\"><img decoding=\"async\" class=\"inline\" src=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.png\" alt=\"Diagrama do roteiro Meta MTIA para aceleradores de infer\u00eancia\" data-new-v2-image=\"true\" data-pin-media=\"https:\/\/mastertrend.info\/wp-content\/uploads\/2026\/03\/Como-el-acuerdo-de-20000-millones-de-dolares-de-Nvidia.png\" title=\"\"><\/picture><figcaption class=\"inline-layout\"><span class=\"caption-text\"><a href=\"https:\/\/ai.meta.com\/blog\/meta-mtia-scale-ai-chips-for-billions\/\" target=\"_blank\" rel=\"noopener\" data-schema-attribute=\"mentions\">A Meta apresentou seu roteiro MTIA.<\/a> recentemente. <\/span><span class=\"credit\">(Cr\u00e9dito da imagem: Meta)<\/span><\/figcaption><\/figure>\n<p id=\"2084220b-976c-4b0b-b57a-6176d6a5af92\">Enquanto as startups se integram a empresas maiores, os principais provedores de nuvem est\u00e3o impulsionando seus pr\u00f3prios pipelines de infer\u00eancia de sil\u00edcio.<\/p>\n<p>A Meta anunciou gera\u00e7\u00f5es sucessivas do MTIA, desenvolvidas em parceria com a Broadcom: do MTIA 300 \u2014 j\u00e1 em produ\u00e7\u00e3o para classifica\u00e7\u00e3o e recomenda\u00e7\u00e3o \u2014 ao MTIA 500, voltado para infer\u00eancia generativa e com implanta\u00e7\u00e3o em massa prevista para 2027. O Google mant\u00e9m sua linha de TPUs (Ironwood v7) com n\u00fameros de TFLOPS e pods de grande escala, e a AWS continua desenvolvendo o Trainium e o Inferentia, embora dados internos at\u00e9 2024 mostrem uma ado\u00e7\u00e3o relativamente baixa em compara\u00e7\u00e3o com as GPUs na pr\u00f3pria infraestrutura da AWS.<\/p>\n<p>Pesquisas e proje\u00e7\u00f5es do setor refor\u00e7am a diversifica\u00e7\u00e3o: em novembro de 2025, o Futurum Group classificou os aceleradores XPU como o segmento de crescimento mais r\u00e1pido em gastos com data centers para 2026, e a TrendForce projetou um aumento not\u00e1vel nas remessas de ASICs personalizados por provedores de nuvem para o mesmo ano.<\/p>\n<p>A rea\u00e7\u00e3o da Nvidia foi clara: garantir a presen\u00e7a de sil\u00edcio n\u00e3o relacionado a GPUs em sua plataforma antes que terceiros o fa\u00e7am. O Groq 3 LPU \u00e9 a manifesta\u00e7\u00e3o tang\u00edvel dessa estrat\u00e9gia; o futuro do Rubin CPX, no entanto, permanece incerto por enquanto.<\/p>\n<p><!-- hermes-editorial-review:related-links:end --><\/p>","protected":false},"excerpt":{"rendered":"<p>O Groq 3 LPU marca a integra\u00e7\u00e3o de sil\u00edcio n\u00e3o-GPU no Rubin e reflete a consolida\u00e7\u00e3o do mercado de chips de infer\u00eancia contra hiperescaladores e concorrentes.<\/p>","protected":false},"author":1,"featured_media":109306,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ai_generated_summary":"","iawp_total_views":92,"jnews-multi-image_gallery":[],"jnews_single_post":{"format":"standard","override":[{"template":"1","parallax":"1","fullscreen":"1","layout":"right-sidebar","sidebar":"default-sidebar","second_sidebar":"default-sidebar","sticky_sidebar":"1","share_position":"top","share_float_style":"share-monocrhome","show_share_counter":"1","show_view_counter":"1","show_featured":"1","show_post_meta":"1","show_post_author":"1","show_post_author_image":"1","show_post_date":"1","post_date_format":"default","post_date_format_custom":"Y\/m\/d","show_post_category":"1","show_post_reading_time":"1","post_reading_time_wpm":"300","post_calculate_word_method":"str_word_count","zoom_button_out_step":"2","zoom_button_in_step":"3","show_post_tag":"1","show_prev_next_post":"1","show_popup_post":"1","show_comment_section":"1","number_popup_post":"1","show_author_box":"1","show_post_related":"1","show_inline_post_related":"0"}],"image_override":[{"single_post_thumbnail_size":"crop-500","single_post_gallery_size":"crop-500"}],"trending_post_position":"meta","trending_post_label":"Trending","sponsored_post_label":"Sponsored by","disable_ad":"0","subtitle":""},"jnews_primary_category":[],"jnews_social_meta":[],"jnews_review":[],"enable_review":"","type":"percentage","name":"","summary":"","brand":"","sku":"","good":[],"bad":[],"score_override":"","override_value":"","rating":[],"price":[],"jnews_override_counter":{"view_counter_number":"0","share_counter_number":"0","like_counter_number":"0","dislike_counter_number":"0"},"footnotes":""},"categories":[74],"tags":[1445,1709,1603],"class_list":["post-109305","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-hardware","tag-evergreencontent","tag-gpu","tag-nvidia"],"_links":{"self":[{"href":"https:\/\/mastertrend.info\/pt\/wp-json\/wp\/v2\/posts\/109305","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mastertrend.info\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mastertrend.info\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/pt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/pt\/wp-json\/wp\/v2\/comments?post=109305"}],"version-history":[{"count":11,"href":"https:\/\/mastertrend.info\/pt\/wp-json\/wp\/v2\/posts\/109305\/revisions"}],"predecessor-version":[{"id":110474,"href":"https:\/\/mastertrend.info\/pt\/wp-json\/wp\/v2\/posts\/109305\/revisions\/110474"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mastertrend.info\/pt\/wp-json\/wp\/v2\/media\/109306"}],"wp:attachment":[{"href":"https:\/\/mastertrend.info\/pt\/wp-json\/wp\/v2\/media?parent=109305"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mastertrend.info\/pt\/wp-json\/wp\/v2\/categories?post=109305"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mastertrend.info\/pt\/wp-json\/wp\/v2\/tags?post=109305"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}