• Sobre Nosotros
  • Anunciar
  • Política de privacidad
  • Contacta con nosotros
MasterTrend Info - Tecnologia, Notícias e Tutoriais
  • HOME
    • BLOG
  • Tutoriales
  • Hardware
  • Gaming
  • Móviles
  • Seguridad
  • Windows
  • IA
  • Software
  • Redes
  • Novedades
  • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
Sin resultado
Ver todos los resultados
  • HOME
    • BLOG
  • Tutoriales
  • Hardware
  • Gaming
  • Móviles
  • Seguridad
  • Windows
  • IA
  • Software
  • Redes
  • Novedades
  • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
Sin resultado
Ver todos los resultados
MasterTrend Info - Tecnologia, Notícias e Tutoriais
Sin resultado
Ver todos los resultados
Inicio Hardware

Groq 3 LPU y la nueva estrategia de Nvidia en inferencia

MasterTrend Insights por MasterTrend Insights
23 de abril de 2026
en Hardware
Tiempo de lectura:Lectura de 6 minutos
0
Groq 3 LPU y Rubin GPU de Nvidia comparados en imagen, mostrando el diseño de los chips para inferencia de inteligencia artificial y la nueva estrategia de Nvidia en hardware acelerador de IA.

Groq 3 LPU y la nueva estrategia de Nvidia en inferencia: Comparativa visual entre la GPU Rubin de Nvidia y el chip Groq 3 LPU, destacando las diferencias en arquitectura, rendimiento y eficiencia para cargas de trabajo de inteligencia artificial. Una mirada al futuro del hardware especializado en inferencia de IA, aceleradores de alto rendimiento y centros de datos optimizados para modelos generativos y LLMs.

50
COMPARTIDOS
138
Vistas
Share on FacebookShare on Twitter

Contents

  1. Groq 3 LPU y el giro estratégico en Rubin
  2. Groq 3 y la función en Rubin
  3. ¿Qué sucede con Rubin CPX?
  4. Consolidación del mercado de chips de inferencia
  5. Silicio a medida en los hyperscalers

Groq 3 LPU y el giro estratégico en Rubin

La presentación del Groq 3 en GTC 2026 no es solo un lanzamiento técnico: marca un giro estratégico en cómo Nvidia estructura su plataforma de inferencia. Más que un nuevo chip, redefine la jerarquía interna de Rubin y anticipa una fase distinta en la competencia por el silicio especializado.

En GTC 2026, celebrado en San José, Nvidia presentó el acelerador de inferencia Groq 3: el primer chip que surge de su acuerdo de licencia y talento valorado en 20.000 millones de dólares firmado el 24 de diciembre de 2025. Se trata de un LPU (language processing unit) basado en SRAM que Nvidia inserta en la plataforma Vera Rubin como coprocesador dedicado a la fase de decodificación. El fabricante anunció un envío previsto para el tercer trimestre de 2026; la producción correrá a cargo de Samsung en un nodo de 4 nm. Es además el primer producto a escala de rack de Nvidia diseñado alrededor de silicio no GPU, y su llegada ha provocado la reordenación de piezas propias en la hoja de ruta.

El corazón del Groq 3 LPX es el chip LP30: 512 MB de SRAM por die y 150 TB/s de ancho de banda de memoria por chip. Para poner esto en perspectiva, una GPU Rubin con 288 GB de HBM4 ofrece alrededor de 22 TB/s; la diferencia de orden de magnitud no es un matiz sino una elección arquitectural. Un rack LPX completo agrupa 256 LPUs, sumando 128 GB de SRAM y 40 PB/s de ancho de banda agregado. Nvidia afirma que, combinado con un Rubin NVL72, un rack LPX ofrece hasta 35 veces más rendimiento por megavatio frente a un NVL72 solo en modelos de billones de parámetros, con un objetivo de coste operativo de 45 dólares por cada millón de tokens.

Groq 3 y la función en Rubin

Render de racks Rubin que ilustra la arquitectura del SuperPOD
Nvidia describió su estrategia Rubin SuperPOD de siete chips en GTC 2026. (Image credit: Nvidia)

En la operación prevista, las GPUs Rubin ejecutan la fase de prefill —procesamiento de contextos largos y cálculos de alta densidad— mientras que las LPUs de Groq gestionan la decodificación y la generación de tokens con latencias reducidas. La orquestación de este reparto heterogéneo corre a cargo de Dynamo, que asigna tareas según tamaño de lote y paralelismo, buscando equilibrar rendimiento y coste energético.

El diseño original de las LPUs de Groq priorizaba determinismo: una tubería VLIW (Very Long Instruction Word) con grandes bancos de SRAM y un compilador que preplanificaba la ejecución, eliminando fallos de caché y paradas imprevistas. Eso dio token rates por usuario muy altos, pero reveló un problema de capacidad: generaciones previas con 230 MB de SRAM por chip exigían muchos dies para alojar modelos medianos, y la arquitectura nació orientada a redes convolucionales más que a modelos de lenguaje modernos.

El LP30 mitiga parte de esas limitaciones con 512 MB de SRAM por die y 1,23 PFLOPS en FP8 de capacidad de cómputo. Samsung ha escalado la producción —según los anuncios, del orden de ~9.000 a ~15.000 obleas— al pasar de muestras a fabricación comercial. En GTC también se anunció que AWS desplegará LPUs Groq 3 junto a más de un millón de GPUs Nvidia como parte de su expansión de infraestructuras.

Más allá del LP30, Nvidia mencionó una hoja de ruta de producto: un LP35 con soporte NVFP4 pensado para alinearse con la generación Rubin Ultra, y un LP40 previsto para el ciclo de arquitectura Feynman posteriormente.

¿Qué sucede con Rubin CPX?

En GTC llamó la atención la ausencia del Rubin CPX, el acelerador de inferencia basado en GDDR7 que Nvidia había anunciado en septiembre de 2025. No apareció en las diapositivas principales ni tuvo presencia en el escenario. Todo indica —sin confirmación oficial completa— que el CPX ha sido eliminado de la hoja de ruta y sustituido en la jerarquía de la plataforma por el LPX Groq 3.

El CPX se había planteado como una alternativa de coste más bajo para acelerar la fase de contexto usando GDDR7, aprovechando mayor disponibilidad frente a la escasez de HBM. Sin embargo, las LPUs de Groq prescinden de grandes memorias externas y ofrecen un ancho de banda muy superior por die, una ventaja clara en un mercado donde la provisión de HBM sigue ajustada y la producción de GDDR7 aún escala. Es posible que unidades CPX ya comprometidas a clientes sigan entregándose, pero la preferencia estratégica ahora parece inclinarse hacia la integración de las LPUs.

Hay además una analogía operativa con la adquisición de Mellanox en 2019: tecnologías de startups que acaban formando nuevas capas arquitectónicas dentro de la infraestructura de Nvidia —en su caso NVLink/InfiniBand— y, en este escenario, Groq podría convertirse en un componente estructural similar dentro del ecosistema Rubin.

Consolidación del mercado de chips de inferencia

El acuerdo con Groq fue la pieza más visible de una ola de consolidación en 2025 centrada en chips de inferencia. En ese año, AMD incorporó al equipo de Untether AI, Nvidia adquirió equipo e IP de Enfabrica por más de 900 millones, Meta compró Rivos y hubo conversaciones —finalmente truncadas— entre Intel y SambaNova que terminaron en una inversión y asociación de 350 millones. El movimiento refleja que competir de forma independiente contra el ecosistema CUDA y la escala de Nvidia plantea retos económicos severos, incluso cuando la tecnología tiene mérito técnico.

El patrón recurrente es la absorción de talento y tecnología por parte de los grandes actores. Groq, por ejemplo, esperaba unos 500 millones en ingresos para 2025, pero esa cifra no bastó para sostener la independencia frente a la presión estratégica de los fabricantes dominantes. Analistas apuntan que los acuerdos con licencias no exclusivas preservan la apariencia de competencia, pero en la práctica neutralizan rivales al integrar su tecnología en la plataforma del comprador.

Silicio a medida en los hyperscalers

Diagrama de la hoja de ruta MTIA de Meta para aceleradores de inferencia
Meta presentó su hoja de ruta MTIA recientemente. (Image credit: Meta)

Mientras las startups se integran en empresas mayores, los grandes proveedores de nube impulsan sus propias líneas de silicio de inferencia.

Meta anunció sucesivas generaciones MTIA, desarrolladas con Broadcom: desde MTIA 300 —ya en producción para ranking y recomendación— hasta MTIA 500, orientadas a la inferencia generativa y previstas para despliegue masivo en 2027. Google mantiene su línea TPU (Ironwood v7) con cifras de TFLOPS y pods a gran escala, y AWS sigue desarrollando Trainium e Inferentia, aunque los datos internos hasta 2024 mostraban una adopción relativamente reducida frente a las GPUs en la propia infraestructura de AWS.

Encuestas y proyecciones del sector refuerzan la diversificación: en noviembre de 2025, Futurum Group situó a los aceleradores XPU como el segmento con mayor crecimiento en gasto de centros de datos para 2026, y TrendForce proyectó un aumento notable en los envíos de ASICs personalizados por parte de proveedores de nube para ese mismo año.

La reacción de Nvidia ha sido clara: asegurar la presencia de silicio no GPU dentro de su plataforma antes de que lo hagan terceros. El Groq 3 LPU es la manifestación tangible de esa estrategia; la continuidad del Rubin CPX, en cambio, queda en entredicho por ahora.

Comparte esto:
FacebookLinkedInPinterestXRedditTumblrBlueskyThreadsShareChatGPTClaudeGoogle AIGrok
Etiquetas: EvergreenContentGPUNvidia
Publicación Anterior

Infraestructura C2 botnet: impacto tras la operación internacional

Próxima publicación

Minecraft en E Ink: límites reales de la pantalla

MasterTrend Insights

MasterTrend Insights

Nuestro equipo editorial comparte análisis profundos, tutoriales y recomendaciones para que aproveches al máximo tus dispositivos y herramientas digitales.

RelacionadoPublicaciones

Arquitectura UDNA AMD para PS6 y Xbox Next, detalle de chip GPU de nueva generación con diseño avanzado para consolas gaming de alto rendimiento.
Hardware

Arquitectura UDNA en PS6 y Xbox Next: más que cifras

4 de mayo de 2026
133
FSR 4.1 AMD: ilustración promocional de FidelityFX Super Resolution con diseño futurista en rojo y negro, destacando mejoras de rendimiento y calidad en GPUs RDNA 4.
Hardware

FSR 4.1 AMD: mejoras reales y límites en RDNA 4

4 de mayo de 2026
203
ThinkPad X9-14 Gen 1 laptop abierto con pantalla Windows 11 y Copilot, diseño premium ultradelgado, teclado retroiluminado y análisis técnico de rendimiento y decisiones clave de compra.
Hardware

ThinkPad X9-14 Gen 1 Análisis Técnico Y Decisiones Clave

18 de febrero de 2026
209
Mantenimiento ThinkPad T14 Gen 4 AMD en uso real, portátil abierto y en funcionamiento durante revisión técnica en entorno profesional.
Hardware

Mantenimiento ThinkPad T14 Gen 4 AMD En Uso Real

28 de abril de 2026
166
Duración De La Pasta Térmica - Aplicación de pasta térmica sobre el procesador para mejorar la refrigeración y explicar cuánto dura la pasta térmica en la CPU.
Hardware

Duración De La Pasta Térmica Y Su Impacto En El Rendimiento Del PC

28 de enero de 2026
416
¿Tiene sentido apostar por PCIe 7.0 hoy? - PCI-SIG anuncia las especificaciones finales de PCIe 7.0, destacando el nuevo estándar PCI Express con velocidad de hasta 128 GT/s para la próxima generación de computación.
Hardware

¿Tiene sentido apostar por PCIe 7.0 hoy? Impacto real y escenarios

28 de enero de 2026
197
Próxima publicación
Minecraft en E Ink: Minecraft ejecutándose en una tablet con pantalla E Ink en escala de grises, mostrando las limitaciones reales de la tinta electrónica en rendimiento y calidad de imagen durante el juego.

Minecraft en E Ink: límites reales de la pantalla

5 1 votar
Article Rating
Suscribirse
Acceso
Notificar de
guest
guest
0 Comments
Más antiguo
El más nuevo Más votado
Comentarios en línea
Ver todos los comentarios

Mantente Conectado

  • 976 Fans
  • 118 Seguidores
  • 1.4k Seguidores
  • 1.8k Suscriptores
  • Tendencias
  • Comentarios
  • Último
🖥️ Cómo abrir 'Dispositivos e impresoras' en Windows 11: 4 pasos sencillos

🌟 Cómo abrir ‘Dispositivos e impresoras’ en Windows 11: ¡Asombroso truco!

21 de junio de 2026
Reloj persistente Windows 11: opciones para mostrar un reloj persistente, limitaciones y decisiones prácticas, con fondo azul, icono de Windows y reloj analógico minimalista.

Reloj persistente Windows 11: Opciones, Límites Y Decisiones Reales

21 de junio de 2026
Ethernet no funciona en Windows 11: 9 trucos fáciles

Ethernet no funciona en Windows 11: solución en 3 minutos ⚡🌐

13 de noviembre de 2025
Cómo guardar partida en REPO

Cómo guardar partida en REPO 🔥 Descubre el secreto para no perder progreso

7 de julio de 2025
Funciones de Gmail en Android: Ahorra tiempo con 5 tips

Funciones de Gmail en Android: ¡5 trucos que no conocías! 📱✨

12
Reparacion de Placas Madres de notebooks: vista interna con motherboard, sistema de refrigeración, ventiladores y componentes clave a revisar en laptop abierta

Reparacion de Placas Madres de Notebooks – Diagnóstico paso a paso

10
Instalar Windows 11 Home sin Internet

Instalar Windows 11 Home sin Internet

10
Cómo respaldar controladores en Windows 11/10 ¡en 4 pasos!

Cómo respaldar controladores en Windows 11/10 ¡Evita errores! 🚨💾

10
Privacidad en Windows 11 - Mujer usando un portátil en casa configurando opciones de privacidad en Windows 11 con O&O ShutUp10++, mostrando ajustes de seguridad y control de datos en pantalla.

Privacidad en Windows 11 con O&O ShutUp10++

21 de junio de 2026
Funciones opcionales Windows 11 - Mujer trabajando en portátil con Windows 11 activando funciones opcionales en la configuración del sistema, guía sobre cuándo activar o desactivar características opcionales de Windows 11 en entorno de oficina moderno

Funciones opcionales Windows 11: cuándo activarlas o quitarlas

21 de junio de 2026
Finales de Saros: A. Devraj con armadura futurista de los Soltari en una escena oscura y dramática, análisis del final principal y el final secreto del videojuego.

Finales de Saros: análisis del principal y secreto

14 de junio de 2026
Arquitectura UDNA AMD para PS6 y Xbox Next, detalle de chip GPU de nueva generación con diseño avanzado para consolas gaming de alto rendimiento.

Arquitectura UDNA en PS6 y Xbox Next: más que cifras

4 de mayo de 2026

Noticias Recientes

Privacidad en Windows 11 - Mujer usando un portátil en casa configurando opciones de privacidad en Windows 11 con O&O ShutUp10++, mostrando ajustes de seguridad y control de datos en pantalla.

Privacidad en Windows 11 con O&O ShutUp10++

21 de junio de 2026
0
Funciones opcionales Windows 11 - Mujer trabajando en portátil con Windows 11 activando funciones opcionales en la configuración del sistema, guía sobre cuándo activar o desactivar características opcionales de Windows 11 en entorno de oficina moderno

Funciones opcionales Windows 11: cuándo activarlas o quitarlas

21 de junio de 2026
59
Finales de Saros: A. Devraj con armadura futurista de los Soltari en una escena oscura y dramática, análisis del final principal y el final secreto del videojuego.

Finales de Saros: análisis del principal y secreto

14 de junio de 2026
92
Arquitectura UDNA AMD para PS6 y Xbox Next, detalle de chip GPU de nueva generación con diseño avanzado para consolas gaming de alto rendimiento.

Arquitectura UDNA en PS6 y Xbox Next: más que cifras

4 de mayo de 2026
133
MasterTrend Info logo

MasterTrend Info es tu fuente de referencia en tecnología: descubre novedades, tutoriales y análisis sobre hardware, software, gaming, móviles e inteligencia artificial. Suscríbete a nuestro boletín y no te pierdas ninguna tendencia.

Síguenos

Browse by Category

  • Gaming
  • Hardware
  • IA
  • Móviles
  • Novedades
  • Redes
  • Seguridad
  • Software
  • Tutoriales
  • Windows

Recent News

Privacidad en Windows 11 - Mujer usando un portátil en casa configurando opciones de privacidad en Windows 11 con O&O ShutUp10++, mostrando ajustes de seguridad y control de datos en pantalla.

Privacidad en Windows 11 con O&O ShutUp10++

21 de junio de 2026
Funciones opcionales Windows 11 - Mujer trabajando en portátil con Windows 11 activando funciones opcionales en la configuración del sistema, guía sobre cuándo activar o desactivar características opcionales de Windows 11 en entorno de oficina moderno

Funciones opcionales Windows 11: cuándo activarlas o quitarlas

21 de junio de 2026
  • Sobre Nosotros
  • Anunciar
  • Política de privacidad
  • Contacta con nosotros

Copyright © 2025 https://mastertrend.info/ - Reservados todos los derechos. Todas las marcas registradas son propiedad de sus respectivos dueños.

We've detected you might be speaking a different language. Do you want to change to:
es_ES Spanish
es_ES Spanish
en_US English
pt_BR Portuguese
fr_FR French
it_IT Italian
ru_RU Russian
de_DE German
zh_CN Chinese
ko_KR Korean
ja Japanese
th Thai
hi_IN Hindi
ar Arabic
tr_TR Turkish
pl_PL Polish
id_ID Indonesian
nl_NL Dutch
sv_SE Swedish
Change Language
Close and do not switch language
Sin resultado
Ver todos los resultados
  • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • pl_PLPolish
    • id_IDIndonesian
    • tr_TRTurkish
    • hi_INHindi
    • thThai
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
  • Gaming
  • Hardware
  • IA
  • Móviles
  • Novedades
  • Redes
  • Seguridad
  • Software
  • Tutoriales
  • Windows

Copyright © 2025 https://mastertrend.info/ - Reservados todos los derechos. Todas las marcas registradas son propiedad de sus respectivos dueños.

wpDiscuz
RedditBlueskyXMastodonHacker News
Comparte esto:
MastodonVKWhatsAppTelegramSMSLineMessengerFlipboardHacker NewsMixNextdoorPerplexityXingYummly
Su instancia de Mastodon