• 關於我們
  • 宣布
  • 隱私權政策
  • 联系我们
MasterTrend Info - 技术、新闻和教程
  • 家
    • 博客
  • 教程
  • 硬體
  • 游戏
  • 移动
  • 安全
  • 視窗
  • IA
  • 軟體
  • 网络
  • 什么是新的
  • zh_CNChinese
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
没有结果
看到的所有结果
  • 家
    • 博客
  • 教程
  • 硬體
  • 游戏
  • 移动
  • 安全
  • 視窗
  • IA
  • 軟體
  • 网络
  • 什么是新的
  • zh_CNChinese
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
没有结果
看到的所有结果
MasterTrend Info - 技术、新闻和教程
没有结果
看到的所有结果
開始 硬體

Groq 3 LPU 和英伟达的新推理策略

MasterTrend的见解 通过 MasterTrend的见解
2026年4月23日
在 硬體
阅读时间:6分钟阅读
0
图片对比了英伟达的 Groq 3 LPU 和 Rubin GPU,展示了用于人工智能推理的芯片设计以及英伟达在 AI 加速器硬件方面的新战略。

Groq 3 LPU 和英伟达全新推理策略:对英伟达 Rubin GPU 和 Groq 3 LPU 芯片进行直观对比,重点展示它们在架构、性能和 AI 工作负载效率方面的差异。展望未来,我们将探讨专用 AI 推理硬件、高性能加速器以及针对生成模型和 LLM 优化的数据中心的发展方向。

44
共享
121
的风景
分享在Facebook分享上Twitter

內容

  1. Groq 3 LPU 和 Rubin 的战略转变
  2. Groq 3 和 Rubin 中的函数
  3. Rubin CPX 发生了什么事?
  4. 推理芯片市场的整合
  5. 超大规模数据中心中的定制硅

Groq 3 LPU 和 Rubin 的战略转变

在2026年GTC大会上发布的Groq 3不仅仅是一次技术发布:它标志着英伟达推理平台架构的战略转变。它不仅仅是一款新芯片,更重新定义了鲁宾设计中心内部的架构,并预示着专用芯片竞争进入了一个全新的阶段。

在圣何塞举行的 GTC 2026 大会上,英伟达发布了 Groq 3 推理加速器:这是该公司于 2025 年 12 月 24 日签署的价值 200 亿美元的授权和人才协议中推出的首款芯片。它是一款 LPU(语言处理单元)。 基于英伟达的SRAM 它作为专用的协处理器集成到 Vera Rubin 平台中,用于解码阶段。制造商宣布预计将于 2026 年第三季度发货;生产将由三星采用 4nm 工艺制程。这也是英伟达首款基于非 GPU 芯片设计的机架级产品,它的问世促使英伟达重新调整了其产品路线图中的组件顺序。

Groq 3 LPX 的核心是 LP30 芯片:每个芯片拥有 512 MB SRAM 和 150 TB/s 的内存带宽。为了便于理解,配备 288 GB HBM4 显存的 Rubin GPU 的带宽约为 22 TB/s;数量级上的差异并非细微差别,而是架构选择。一个完整的 LPX 机架包含 256 个 LPU,总计 128 GB SRAM 和 40 PB/s 的总带宽。Nvidia 声称,在万亿参数模型中,LPX 机架与 Rubin NVL72 结合使用时,每兆瓦的性能是单独使用 NVL72 的 35 倍,运营成本目标为每百万个代币 45 美元。

Groq 3 和 Rubin 中的函数

Rubin机架渲染图展示了SuperPOD架构
英伟达在 2026 年 GTC 大会上概述了其七芯片 Rubin SuperPOD 战略。 (图片来源:英伟达)

在计划的操作中,Rubin GPU 负责预填充阶段——处理长上下文和高密度计算——而 Groq LPU 则负责解码和令牌生成,从而降低延迟。Dynamo 负责协调这种异构分布,根据批处理大小和并行度分配任务,以平衡性能和能耗。

Groq 最初的 LPU 设计优先考虑确定性:采用 VLIW(超长指令字)流水线,配备大容量 SRAM 存储体和一个预先规划执行的编译器,从而消除缓存未命中和意外停机。这使得每个用户的令牌获取率非常高,但也暴露出容量问题:前几代产品每个芯片配备 230 MB SRAM,需要多个芯片才能容纳中等尺寸的型号,而 建筑学 它诞生之初就面向卷积神经网络,而不是现代语言模型。

LP30芯片通过每芯片512MB的SRAM和1.23 PFLOPS的FP8计算能力,缓解了部分上述限制。三星已将LP30的产量从约9000片晶圆提升至约15000片(根据官方公告),实现了从样品生产到商业化生产的全面转型。在GTC大会上,AWS还宣布将在其基础设施扩展计划中部署Groq 3 LPU以及超过一百万个英伟达GPU。

除了 LP30 之外,Nvidia 还提到了一个产品路线图:一款支持 NVFP4 的 LP35,旨在与 Rubin Ultra 系列保持一致;以及一款计划在稍后的 Feynman 架构周期中推出的 LP40。

Rubin CPX 发生了什么事?

在GTC大会上,Rubin CPX(基于……的推理加速器)的缺席令人遗憾。 英伟达的 GDDR7 该产品于2025年9月发布,但并未出现在主要幻灯片或发布会上。尽管尚未得到官方的完全确认,但种种迹象表明,CPX已从产品路线图中移除,并在平台层级结构中被LPX Groq 3所取代。

CPX 最初的设计理念是利用 GDDR7 内存的更高可用性,在 HBM 内存短缺的情况下,提供一种成本更低的替代方案来加速上下文阶段的开发。然而,Groq 的 LPU 芯片无需大型外部内存模块,并且每个芯片的带宽显著更高——这在 HBM 内存供应依然紧张、GDDR7 芯片产能仍在提升的市场中,无疑是一项明显的优势。虽然已交付给客户的 CPX 芯片可能会继续交付,但目前的战略重点似乎正在转向 LPU 集成。

这与 2019 年收购 Mellanox 的情况在操作上也有相似之处:初创技术最终在英伟达的基础设施中形成新的架构层——在他们的案例中是 NVLink/InfiniBand——在这种情况下,Groq 可能会成为 Rubin 生态系统中类似的结构组件。

推理芯片市场的整合

与 Groq 的交易是 2025 年推理芯片领域整合浪潮中最引人注目的一环。同年,AMD 收购了 Untether AI 团队,英伟达斥资超过 9 亿美元收购了 Enfabrica 的设备和知识产权,Meta 收购了 Rivos,英特尔和 SambaNova 之间也曾进行过谈判——尽管最终未能达成,但双方曾计划进行 3.5 亿美元的投资和合作。这一举动反映出,即使技术本身具有优势,独立与英伟达的 CUDA 生态系统及其规模竞争也会面临严峻的经济挑战。

反复出现的模式是,大型企业不断吸收人才和技术。例如,Groq 曾预计到 2025 年营收将达到 5 亿欧元左右,但面对主导制造商的战略压力,这一数字不足以使其保持独立性。分析人士指出,非独家许可协议表面上维持了竞争,但实际上却通过将竞争对手的技术整合到买方平台中而削弱了竞争对手的作用。

超大规模数据中心中的定制硅

Meta MTIA推理加速器路线图
Meta公司展示了其MTIA路线图 最近。 (图片来源:Meta)

当初创企业纷纷并入大型公司时,大型云服务提供商正在大力推进自己的硅推理管道。

Meta宣布推出与博通合作开发的MTIA系列多代产品:从已投入生产用于排名和推荐的MTIA 300,到面向生成式推理并计划于2027年大规模部署的MTIA 500。谷歌继续推进其TPU产品线(Ironwood v7),该系列产品拥有TFLOPS的性能和大规模的Pod。AWS也在持续开发Trainium和Inferentia,但截至2024年的内部数据显示,与AWS自身基础设施中的GPU相比,它们的采用率相对较低。

行业调查和预测强化了多元化趋势:2025 年 11 月,Futurum Group 将 XPU 加速器评为 2026 年数据中心支出中增长最快的细分市场,而 TrendForce 预测,同年云提供商定制 ASIC 的出货量将显著增长。

英伟达的回应很明确:在第三方之前,确保非GPU芯片在其平台中的存在。Groq 3 LPU正是这一战略的切实体现;然而,Rubin CPX的未来目前仍不明朗。

分享這個:
Facebook領英興趣X紅迪網豆瓣藍天執行緒數分享聊天GPT克劳德AI谷歌神交
标签: EvergreenContentGPU英偉達
以前的出版物

C2僵尸网络基础设施:国际行动后的影响

下一期

在 E Ink 上玩 Minecraft:真正的屏幕限制

MasterTrend的见解

MasterTrend的见解

我们的编辑团队共用一个深入的分析,辅导和建议越来越多的设备以及数字工具。

相关的出版物

AMD UDNA 架构适用于 PS6 和 Xbox Next,详细介绍了采用先进设计、面向高性能游戏机的下一代 GPU 芯片。
硬體

PS6 和 Xbox Next 中的 UDNA 架构:不仅仅是数字

4 de 5 月 de 2026
112
FSR 4.1 AMD:FidelityFX 超分辨率的宣传插图,采用未来主义的红黑设计,突出了 RDNA 4 GPU 的性能和质量改进。
硬體

FSR 4.1 AMD:RDNA 4 的真正改进和局限性

4 de 5 月 de 2026
182
ThinkPad X9-14 Gen 1 开箱笔记本电脑,配备 Windows 11 显示屏和 Copilot,采用优质超薄设计,配备背光键盘,并对性能和关键购买决策进行技术分析。
硬體

ThinkPad X9-14 第一代技术分析及关键决策

2026年2月18日
201
ThinkPad T14 Gen 4 AMD 实际使用中的维护,笔记本电脑在专业环境下进行技术审查时已打开并运行。
硬體

ThinkPad T14 Gen 4 AMD 实际使用中的维护

2026年4月28日
154
导热硅脂使用时长 - 将导热硅脂涂抹到处理器上以改善散热,并解释导热硅脂在 CPU 上的使用时长。
硬體

导热硅脂寿命及其对电脑性能的影响

2026年1月28日
376
现在投资 PCIe 7.0 有意义吗? - PCI-SIG 发布了最终的 PCIe 7.0 规范,重点介绍了速度高达 128 GT/s 的全新 PCI Express 标准,旨在为下一代计算提供支持。
硬體

现在投资 PCIe 7.0 是否明智?实际影响和应用场景

2026年1月28日
187
下一期
在 E Ink 上运行的 Minecraft:在配备 E Ink 灰阶显示屏的平板电脑上运行 Minecraft,显示了 E Ink 在游戏过程中性能和图像质量方面的真正局限性。

在 E Ink 上玩 Minecraft:真正的屏幕限制

5 1 投票
文章評級
訂閱
使用权
通知
客人
客人
0 評論
最古老的
最新 投票最多
線上評論
查看所有評論

保持连接

  • 976 球迷
  • 118 追随者
  • 1.4k 追随者
  • 1.8k 用户
  • 趋势
  • 评论意见
  • 最后一个
🖥每天都会如何打开设备和打印机,在Windows11:4简单的步骤

🌟如何打开设备和打印机,在Windows11:¡惊人的把戏!

2026年4月28日
Windows 11 持久时钟

Windows 11 持久时钟:选项、限制和实际决策

2026年4月28日
Windows 11 中以太网无法工作:9 个简单技巧

Windows 11 以太网无法工作:3 分钟解决方案 ⚡🌐

13 11月2025
如何保存游戏在REPO

如何保存游戏在REPO🔥发现这个秘密不要丢失取得进展

7 7月2025
失败在节省时间,有5个提示

失败在安卓,你5的技巧,你不知道! 📱✨

12
修复的主板-修复的主板

修复的主板的笔记本电脑

10
安装Windows11家没有互联网

安装Windows11家没有互联网

10
如何备驱动程序,在Windows11月10日在4个步骤!

如何备驱动程序,在Windows11/10它可以防止的错误! 🚨💾

10
AMD UDNA 架构适用于 PS6 和 Xbox Next,详细介绍了采用先进设计、面向高性能游戏机的下一代 GPU 芯片。

PS6 和 Xbox Next 中的 UDNA 架构:不仅仅是数字

4 de 5 月 de 2026
FBC Firebreak 武器:解锁和优先级 - 战术操作员在激烈的电子游戏场景中,被火焰包围,使用霰弹枪和火焰喷射器进行战斗。

FBC 火线武器:解锁与优先级

2026年5月3日
策略英雄 古代篇:白发女战士在史诗般的奇幻战斗中做出关键决策,从而改变游戏的走向。

英雄:古代战略:改变战局的决策

2026年5月3日
《Arc Raiders》中的 Shoring Up Defenses:实战策略——玩家在沙漠中与敌方无人机展开激烈的科幻战术战斗。

《Arc Raiders》中的 Shoring Up Defenses:实战策略

2026年5月3日

最近的新闻

AMD UDNA 架构适用于 PS6 和 Xbox Next,详细介绍了采用先进设计、面向高性能游戏机的下一代 GPU 芯片。

PS6 和 Xbox Next 中的 UDNA 架构:不仅仅是数字

4 de 5 月 de 2026
112
FBC Firebreak 武器:解锁和优先级 - 战术操作员在激烈的电子游戏场景中,被火焰包围,使用霰弹枪和火焰喷射器进行战斗。

FBC 火线武器:解锁与优先级

2026年5月3日
101
策略英雄 古代篇:白发女战士在史诗般的奇幻战斗中做出关键决策,从而改变游戏的走向。

英雄:古代战略:改变战局的决策

2026年5月3日
144
《Arc Raiders》中的 Shoring Up Defenses:实战策略——玩家在沙漠中与敌方无人机展开激烈的科幻战术战斗。

《Arc Raiders》中的 Shoring Up Defenses:实战策略

2026年5月3日
105
MasterTrend Info 标志

MasterTrend信息是你的参考来源的技术:探索的新闻、教程和分析的硬件、软件、游戏、移动和人工智能。 订阅我们的通讯和不错过任何趋势。

按照我们的

按类别浏览

  • 游戏
  • 硬體
  • IA
  • 移动
  • 什么是新的
  • 网络
  • 安全
  • 軟體
  • 教程
  • 視窗

最近的新闻

AMD UDNA 架构适用于 PS6 和 Xbox Next,详细介绍了采用先进设计、面向高性能游戏机的下一代 GPU 芯片。

PS6 和 Xbox Next 中的 UDNA 架构:不仅仅是数字

4 de 5 月 de 2026
FBC Firebreak 武器:解锁和优先级 - 战术操作员在激烈的电子游戏场景中,被火焰包围,使用霰弹枪和火焰喷射器进行战斗。

FBC 火线武器:解锁与优先级

2026年5月3日
  • 關於我們
  • 宣布
  • 隱私權政策
  • 联系我们

版权所有 © 2025 https://mastertrend.info/ - 保留所有权利。所有商标均为其各自所有者的财产。

We've detected you might be speaking a different language. Do you want to change to:
es_ES Spanish
es_ES Spanish
en_US English
pt_BR Portuguese
fr_FR French
it_IT Italian
ru_RU Russian
de_DE German
zh_CN Chinese
ko_KR Korean
ja Japanese
th Thai
hi_IN Hindi
ar Arabic
tr_TR Turkish
pl_PL Polish
id_ID Indonesian
nl_NL Dutch
sv_SE Swedish
Change Language
Close and do not switch language
没有结果
看到的所有结果
  • zh_CNChinese
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • ru_RURussian
    • pl_PLPolish
    • id_IDIndonesian
    • tr_TRTurkish
    • hi_INHindi
    • thThai
    • arArabic
    • sv_SESwedish
    • nl_NLDutch
  • 游戏
  • 硬體
  • IA
  • 移动
  • 什么是新的
  • 网络
  • 安全
  • 軟體
  • 教程
  • 視窗

版权所有 © 2025 https://mastertrend.info/ - 保留所有权利。所有商标均为其各自所有者的财产。

wpDiscuz
紅迪網藍天X乳齒象黑客的消息
分享這個:
乳齒象VKWhatsApp电报短信线使者好黑客的消息混合隔壁困惑兴程序
你的乳齿象的实例