وحدة المعالجة المنطقية Groq 3 تعيد تعريف خارطة طريق Nvidia

Groq 3 LPU والتحول الاستراتيجي في روبين

إن الكشف عن معالج Groq 3 في مؤتمر GTC 2026 ليس مجرد إطلاق تقني، بل يمثل تحولاً استراتيجياً في هيكلة منصة الاستدلال الخاصة بشركة Nvidia. فهو ليس مجرد شريحة جديدة، بل يعيد تعريف التسلسل الهرمي الداخلي لشركة Rubin، ويستبق مرحلة مميزة في المنافسة على رقائق السيليكون المتخصصة.

في مؤتمر GTC 2026 الذي عقد في سان خوسيه، كشفت شركة Nvidia النقاب عن معالج الاستدلال Groq 3: أول شريحة تخرج من اتفاقية الترخيص والمواهب التي تبلغ قيمتها 20 مليار دولار والتي تم توقيعها في 24 ديسمبر 2025. وهي وحدة معالجة لغوية (LPU). يعتمد على ذاكرة الوصول العشوائي الثابتة (SRAM) التي تستخدمها شركة Nvidia تم دمجها في منصة Vera Rubin كمعالج مساعد مخصص لمرحلة فك التشفير. أعلنت الشركة المصنعة عن تاريخ شحن متوقع في الربع الثالث من عام 2026؛ وستتولى سامسونج عملية الإنتاج بتقنية 4 نانومتر. كما أنها أول منتج من Nvidia بحجم رف مصمم باستخدام رقائق سيليكون غير مخصصة لوحدات معالجة الرسومات، وقد دفع وصولها إلى إعادة ترتيب مكوناتها في خارطة الطريق.

يُعدّ معالج LP30 قلب جهاز Groq 3 LPX، حيث يضم 512 ميجابايت من ذاكرة SRAM لكل شريحة، و150 تيرابايت/ثانية من عرض نطاق الذاكرة لكل شريحة. ولتوضيح ذلك، توفر وحدة معالجة الرسومات Rubin المزودة بـ 288 جيجابايت من ذاكرة HBM4 حوالي 22 تيرابايت/ثانية؛ وهذا الفرق الشاسع ليس مجرد فرق بسيط، بل هو نتيجة لاختيار معماري. يحتوي رف LPX الكامل على 256 وحدة معالجة منطقية (LPU)، بإجمالي 128 جيجابايت من ذاكرة SRAM و40 بيتابايت/ثانية من عرض النطاق الإجمالي. وتدّعي Nvidia أنه عند دمجه مع وحدة Rubin NVL72، يُقدّم رف LPX أداءً يصل إلى 35 ضعفًا لكل ميجاواط مقارنةً بوحدة NVL72 وحدها في نماذج ذات تريليون مُعامل، مع تكلفة تشغيل مستهدفة تبلغ 45 دولارًا لكل مليون رمز.

Groq 3 والوظيفة في Rubin

رسم توضيحي لرفوف روبين يوضح بنية SuperPOD — عرضت شركة Nvidia استراتيجيتها المكونة من سبع رقائق Rubin SuperPOD في مؤتمر GTC 2026. (مصدر الصورة: Nvidia)

في العملية المخطط لها، تتولى وحدات معالجة الرسومات Rubin مرحلة التعبئة المسبقة - معالجة السياقات الطويلة والحسابات عالية الكثافة - بينما تتولى وحدات معالجة البيانات Groq إدارة فك التشفير وتوليد الرموز مع تقليل زمن الاستجابة. يقوم Dynamo بتنسيق هذا التوزيع غير المتجانس، حيث يخصص المهام بناءً على حجم الدفعة والتوازي لتحقيق التوازن بين الأداء وتكلفة الطاقة.

ركز تصميم وحدة المعالجة المنطقية (LPU) الأصلي من Groq على الحتمية: خط أنابيب VLIW (كلمة تعليمات طويلة جدًا) مع بنوك SRAM كبيرة ومترجم يخطط للتنفيذ مسبقًا، مما يمنع أخطاء ذاكرة التخزين المؤقت والتوقفات غير المتوقعة. وقد أدى ذلك إلى معدلات عالية جدًا للرموز المميزة لكل مستخدم، ولكنه كشف عن مشكلة في السعة: فقد تطلبت الأجيال السابقة التي تحتوي على 230 ميجابايت من ذاكرة SRAM لكل شريحة العديد من الرقاقات لاستيعاب النماذج متوسطة الحجم، و بنيان لقد وُلدت هذه التقنية موجهة نحو الشبكات الالتفافية بدلاً من نماذج اللغة الحديثة.

يُخفف معالج LP30 بعض هذه القيود بفضل ذاكرة SRAM بسعة 512 ميجابايت لكل شريحة، وقدرة حسابية تبلغ 1.23 بيتافلوب من نوع FP8. وقد رفعت سامسونج إنتاجها من حوالي 9000 إلى حوالي 15000 رقاقة، وفقًا للإعلانات، وذلك بالانتقال من مرحلة العينات إلى التصنيع التجاري. كما أُعلن في مؤتمر GTC أن AWS ستنشر وحدات معالجة Groq 3 LPU جنبًا إلى جنب مع أكثر من مليون وحدة معالجة رسومية من Nvidia كجزء من توسيع بنيتها التحتية.

إلى جانب LP30، ذكرت Nvidia خارطة طريق للمنتجات: LP35 مع دعم NVFP4 يهدف إلى التوافق مع جيل Rubin Ultra، وLP40 مخطط له لدورة بنية Feynman في وقت لاحق.

ما الذي يحدث مع روبين سي بي إكس؟

في مركز GTC، كان غياب معالج Rubin CPX، وهو معالج الاستدلال القائم على GDDR7 التي تستخدمها Nvidia أُعلن عنه في سبتمبر 2025. لم يظهر في الشرائح الرئيسية ولم يُعرض على المنصة. تشير كل الدلائل -دون تأكيد رسمي كامل- إلى أن منصة CPX قد أُزيلت من خارطة الطريق واستُبدلت في هيكلية المنصة بمنصة LPX Groq 3.

صُممت وحدة CPX في البداية كبديل منخفض التكلفة لتسريع مرحلة السياق باستخدام ذاكرة GDDR7، مستفيدةً من وفرتها في ظل نقص ذاكرة HBM. مع ذلك، تُغني وحدات LPU من Groq عن الحاجة إلى وحدات ذاكرة خارجية كبيرة، وتوفر نطاقًا تردديًا أعلى بكثير لكل شريحة، ما يُمثل ميزة واضحة في سوق لا يزال فيه إمداد ذاكرة HBM محدودًا، بينما لا يزال إنتاج ذاكرة GDDR7 في طور التوسع. في حين أن وحدات CPX التي تم الالتزام بتسليمها للعملاء قد تستمر في الوصول، يبدو أن التوجه الاستراتيجي الآن يتجه نحو دمج وحدات LPU.

هناك أيضًا تشابه تشغيلي مع عملية الاستحواذ على شركة Mellanox في عام 2019: تقنيات الشركات الناشئة التي ينتهي بها المطاف بتشكيل طبقات معمارية جديدة داخل البنية التحتية لشركة Nvidia - في حالتهم NVLink/InfiniBand - وفي هذا السيناريو، يمكن أن تصبح Groq مكونًا هيكليًا مشابهًا داخل النظام البيئي Rubin.

توحيد سوق رقائق الاستدلال

كانت صفقة الاستحواذ على شركة Groq أبرز ملامح موجة اندماجات عام 2025 التي ركزت على رقائق الاستدلال. في ذلك العام، استحوذت AMD على فريق Untether AI، واستحوذت Nvidia على معدات Enfabrica وحقوق الملكية الفكرية الخاصة بها بأكثر من 900 مليون دولار، واشترت Meta شركة Rivos، كما جرت مفاوضات - تم التخلي عنها في نهاية المطاف - بين Intel وSambaNova أسفرت عن استثمار وشراكة بقيمة 350 مليون دولار. تعكس هذه الخطوة حقيقة أن المنافسة المستقلة ضد منظومة CUDA التابعة لشركة Nvidia وحجمها الهائل تُشكل تحديات اقتصادية جسيمة، حتى وإن كانت التكنولوجيا تتمتع بمزايا تقنية.

يتمثل النمط المتكرر في استحواذ الشركات الكبرى على المواهب والتقنيات. فعلى سبيل المثال، توقعت شركة Groq تحقيق إيرادات تُقارب 500 مليون يورو بحلول عام 2025، إلا أن هذا الرقم لم يكن كافيًا للحفاظ على استقلاليتها في مواجهة الضغوط الاستراتيجية من الشركات المصنعة المهيمنة. ويشير المحللون إلى أن اتفاقيات الترخيص غير الحصرية تُحافظ على مظهر المنافسة، ولكنها في الواقع تُحيد المنافسين من خلال دمج تقنياتهم في منصة المشتري.

السيليكون المخصص في شركات الحوسبة السحابية العملاقة

مخطط خارطة طريق Meta MTIA لمسرعات الاستدلال — قدمت شركة ميتا خارطة طريقها الخاصة بـ MTIA حديثاً. (مصدر الصورة: ميتا)

بينما تندمج الشركات الناشئة في شركات أكبر، يقوم مزودو الخدمات السحابية الرئيسيون بالترويج لخطوط استدلال السيليكون الخاصة بهم.

أعلنت شركة Meta عن أجيال متتالية من MTIA، التي تم تطويرها بالتعاون مع Broadcom: من MTIA 300 - الموجودة بالفعل في الإنتاج لأغراض التصنيف والتوصية - إلى MTIA 500، الموجهة نحو الاستدلال التوليدي والمخطط لها للنشر على نطاق واسع في عام 2027. وتحافظ Google على خط إنتاجها من وحدات معالجة الموتر (Ironwood v7) بأرقام TFLOPS ووحدات pods واسعة النطاق، وتواصل AWS تطوير Trainium وInferentia، على الرغم من أن البيانات الداخلية حتى عام 2024 أظهرت معدل اعتماد منخفضًا نسبيًا مقارنة بوحدات معالجة الرسومات في البنية التحتية الخاصة بـ AWS.

تؤكد استطلاعات الرأي والتوقعات الصناعية على أهمية التنويع: ففي نوفمبر 2025، صنفت مجموعة Futurum مسرعات XPU كأسرع القطاعات نموًا في الإنفاق على مراكز البيانات لعام 2026، وتوقعت TrendForce زيادة ملحوظة في شحنات ASICs المخصصة من قبل مزودي الخدمات السحابية لنفس العام.

كان رد فعل إنفيديا واضحًا: ضمان وجود رقائق السيليكون غير المخصصة لوحدات معالجة الرسومات ضمن منصتها قبل أن تفعل ذلك جهات خارجية. تُعدّ وحدة معالجة الرسومات Groq 3 LPU تجسيدًا ملموسًا لهذه الاستراتيجية؛ إلا أن مستقبل Rubin CPX لا يزال غامضًا في الوقت الراهن.

حصة هذا: