Groq 3 LPU ने Nvidia के रोडमैप को नया रूप दिया है।

ग्रोक 3 एलपीयू और रुबिन में रणनीतिक बदलाव

जीटीसी 2026 में ग्रोक 3 का अनावरण मात्र एक तकनीकी लॉन्च से कहीं अधिक है: यह इस बात का प्रतीक है कि एनवीडिया अपने इन्फरेंस प्लेटफॉर्म की संरचना में एक रणनीतिक बदलाव ला रहा है। यह सिर्फ एक नई चिप नहीं है, बल्कि यह रुबिन की आंतरिक संरचना को पुनर्परिभाषित करता है और विशिष्ट सिलिकॉन के लिए प्रतिस्पर्धा में एक नए चरण की शुरुआत का संकेत देता है।

सैन जोस में आयोजित जीटीसी 2026 में, एनवीडिया ने ग्रोक 3 इन्फरेंस एक्सेलेरेटर का अनावरण किया: यह 24 दिसंबर, 2025 को हस्ताक्षरित 20 बिलियन डॉलर के लाइसेंसिंग और टैलेंट समझौते से उत्पन्न होने वाला पहला चिप है। यह एक एलपीयू (भाषा प्रसंस्करण इकाई) है। SRAM पर आधारित जिसे Nvidia इसे डिकोडिंग चरण के लिए एक समर्पित कोप्रोसेसर के रूप में वेरा रुबिन प्लेटफॉर्म में एकीकृत किया गया है। निर्माता ने 2026 की तीसरी तिमाही में इसके शिपमेंट की संभावित तिथि की घोषणा की है; इसका उत्पादन सैमसंग द्वारा 4nm नोड पर किया जाएगा। यह एनवीडिया का पहला रैक-स्केल उत्पाद भी है जिसे गैर-जीपीयू सिलिकॉन के आधार पर डिज़ाइन किया गया है, और इसके आगमन ने रोडमैप में इसके अपने घटकों के पुनर्व्यवस्थापन को प्रेरित किया है।

ग्रोक 3 एलपीएक्स का मुख्य घटक एलपी30 चिप है: प्रति डाई 512 एमबी एसआरएम और प्रति चिप 150 TB/s की मेमोरी बैंडविड्थ। तुलनात्मक रूप से देखें तो, 288 जीबी एचबीएम4 मेमोरी वाला रुबिन जीपीयू लगभग 22 TB/s की बैंडविड्थ प्रदान करता है; यह परिमाण का अंतर मामूली नहीं बल्कि आर्किटेक्चरल विकल्प है। एक पूर्ण एलपीएक्स रैक में 256 एलपीयू होते हैं, जिनमें कुल 128 जीबी एसआरएम और 40 PB/s की समग्र बैंडविड्थ होती है। एनवीडिया का दावा है कि रुबिन एनवीएल72 के साथ संयुक्त रूप से, एक एलपीएक्स रैक ट्रिलियन-पैरामीटर मॉडल में अकेले एनवीएल72 की तुलना में प्रति मेगावाट 35 गुना तक अधिक प्रदर्शन प्रदान करता है, और परिचालन लागत का लक्ष्य $45 प्रति मिलियन टोकन है।

ग्रोक 3 और रुबिन में फ़ंक्शन

सुपरपॉड आर्किटेक्चर को दर्शाने वाला रुबिन रैक का रेंडरिंग — एनवीडिया ने जीटीसी 2026 में अपनी सात-चिप वाली रुबिन सुपरपॉड रणनीति की रूपरेखा प्रस्तुत की। (छवि साभार: एनवीडिया)

योजनाबद्ध प्रक्रिया में, रुबिन जीपीयू प्रीफिल चरण (लंबे संदर्भों और उच्च-घनत्व गणनाओं को संसाधित करना) को संभालते हैं, जबकि ग्रोक एलपीयू कम विलंबता के साथ डिकोडिंग और टोकन जनरेशन का प्रबंधन करते हैं। डायनेमो इस विषम वितरण को व्यवस्थित करता है, प्रदर्शन और ऊर्जा लागत को संतुलित करने के लिए बैच आकार और समानांतरता के आधार पर कार्यों को आवंटित करता है।

ग्रोक के मूल एलपीयू डिज़ाइन में नियतात्मकता को प्राथमिकता दी गई थी: एक वीएलआईडब्ल्यू (वेरी लॉन्ग इंस्ट्रक्शन वर्ड) पाइपलाइन जिसमें बड़े एसआरएएम बैंक और एक कंपाइलर था जो निष्पादन की पूर्व-योजना बनाता था, जिससे कैश मिस और अप्रत्याशित रुकावटें समाप्त हो जाती थीं। इसके परिणामस्वरूप प्रति उपयोगकर्ता टोकन दर बहुत अधिक हो गई, लेकिन एक क्षमता समस्या सामने आई: पिछली पीढ़ियों में प्रति चिप 230 एमबी एसआरएएम के साथ मध्यम आकार के मॉडल को समायोजित करने के लिए कई डाइज़ की आवश्यकता होती थी, और वास्तुकला इसका जन्म आधुनिक भाषा मॉडलों के बजाय कनवोल्यूशनल नेटवर्क की ओर उन्मुख होकर हुआ था।

LP30 प्रत्येक डाई में 512 MB SRAM और 1.23 PFLOPS की FP8 कंप्यूट क्षमता के साथ इनमें से कुछ कमियों को दूर करता है। सैमसंग ने घोषणाओं के अनुसार, सैंपल उत्पादन से वाणिज्यिक उत्पादन की ओर बढ़ते हुए उत्पादन को लगभग 9,000 से बढ़ाकर लगभग 15,000 वेफर्स तक कर दिया है। GTC में यह भी घोषणा की गई कि AWS अपने बुनियादी ढांचे के विस्तार के हिस्से के रूप में दस लाख से अधिक Nvidia GPUs के साथ Groq 3 LPUs को भी तैनात करेगा।

LP30 के अलावा, Nvidia ने एक उत्पाद रोडमैप का उल्लेख किया: Rubin Ultra पीढ़ी के साथ तालमेल बिठाने के लिए NVFP4 समर्थन वाला LP35, और बाद में Feynman आर्किटेक्चर चक्र के लिए नियोजित LP40।

रुबिन सीपीएक्स के साथ क्या हो रहा है?

जीटीसी में, रुबिन सीपीएक्स की अनुपस्थिति, जो कि अनुमान त्वरक पर आधारित है, GDDR7 जो Nvidia इसकी घोषणा सितंबर 2025 में की गई थी। यह मुख्य स्लाइड्स में नहीं दिखा और न ही मंच पर उपस्थित था। पूर्ण आधिकारिक पुष्टि के बिना भी, सभी संकेत यही बताते हैं कि CPX को रोडमैप से हटा दिया गया है और प्लेटफॉर्म पदानुक्रम में इसकी जगह LPX Groq 3 को शामिल कर लिया गया है।

CPX को शुरू में GDDR7 का उपयोग करके कॉन्टेक्स्ट फेज को तेज करने के लिए एक कम लागत वाले विकल्प के रूप में तैयार किया गया था, ताकि HBM की कमी के बावजूद इसकी अधिक उपलब्धता का लाभ उठाया जा सके। हालांकि, Groq के LPU बड़े बाहरी मेमोरी मॉड्यूल की आवश्यकता को समाप्त करते हैं और प्रति डाई काफी अधिक बैंडविड्थ प्रदान करते हैं—यह एक स्पष्ट लाभ है ऐसे बाजार में जहां HBM की आपूर्ति सीमित है और GDDR7 का उत्पादन अभी भी बढ़ रहा है। हालांकि ग्राहकों को पहले से ही दिए गए CPX यूनिट्स की डिलीवरी जारी रह सकती है, लेकिन अब रणनीतिक प्राथमिकता LPU इंटीग्रेशन की ओर बढ़ती दिख रही है।

2019 में मेलानॉक्स के अधिग्रहण के साथ एक परिचालन सादृश्य भी है: स्टार्टअप प्रौद्योगिकियां जो अंततः एनवीडिया के बुनियादी ढांचे के भीतर नई वास्तुशिल्प परतें बनाती हैं - उनके मामले में एनवीलिंक/इनफिनिबैंड - और, इस परिदृश्य में, ग्रोक रुबिन पारिस्थितिकी तंत्र के भीतर एक समान संरचनात्मक घटक बन सकता है।

अनुमान चिप बाजार का समेकन

ग्रोक के साथ हुआ सौदा 2025 में इन्फरेंस चिप्स पर केंद्रित समेकन की लहर का सबसे प्रमुख हिस्सा था। उसी वर्ष, एएमडी ने अनटेथर एआई टीम का अधिग्रहण किया, एनवीडिया ने एनफैब्रिका के उपकरण और आईपी को 900 मिलियन डॉलर से अधिक में खरीदा, मेटा ने रिवोस को खरीदा, और इंटेल और सांबा नोवा के बीच बातचीत हुई - जिसे अंततः छोड़ दिया गया - जिसके परिणामस्वरूप 350 मिलियन डॉलर का निवेश और साझेदारी हुई। यह कदम इस तथ्य को दर्शाता है कि एनवीडिया के CUDA इकोसिस्टम और उसके व्यापक विस्तार के खिलाफ स्वतंत्र रूप से प्रतिस्पर्धा करना गंभीर आर्थिक चुनौतियां पेश करता है, भले ही तकनीक तकनीकी रूप से कितनी भी उन्नत क्यों न हो।

प्रमुख कंपनियों द्वारा प्रतिभा और प्रौद्योगिकी को अपने अधीन करने का पैटर्न बार-बार देखने को मिलता है। उदाहरण के लिए, ग्रोक ने 2025 तक लगभग 500 मिलियन यूरो के राजस्व की उम्मीद की थी, लेकिन यह आंकड़ा प्रमुख निर्माताओं के रणनीतिक दबाव के सामने अपनी स्वतंत्रता बनाए रखने के लिए पर्याप्त नहीं था। विश्लेषकों का कहना है कि गैर-विशिष्ट लाइसेंसिंग समझौते प्रतिस्पर्धा का आभास तो कराते हैं, लेकिन व्यवहार में प्रतिद्वंद्वियों की प्रौद्योगिकी को खरीदार के प्लेटफॉर्म में एकीकृत करके उन्हें निष्क्रिय कर देते हैं।

हाइपरस्केलर में कस्टम सिलिकॉन

इनफरेंस एक्सेलरेटर के लिए मेटा एमटीआईए रोडमैप आरेख — मेटा ने अपना एमटीआईए रोडमैप प्रस्तुत किया। हाल ही में। (छवि साभार: मेटा)

जहां एक ओर स्टार्टअप बड़ी कंपनियों में एकीकृत हो रहे हैं, वहीं दूसरी ओर प्रमुख क्लाउड प्रदाता अपनी खुद की सिलिकॉन इन्फरेंस पाइपलाइन को बढ़ावा दे रहे हैं।

मेटा ने ब्रॉडकॉम के साथ मिलकर विकसित MTIA की क्रमिक पीढ़ियों की घोषणा की: रैंकिंग और अनुशंसा के लिए पहले से ही उत्पादन में मौजूद MTIA 300 से लेकर जनरेटिव इन्फरेंस पर केंद्रित MTIA 500 तक, जिसका 2027 में बड़े पैमाने पर उपयोग शुरू करने की योजना है। गूगल अपने TPU लाइन (आयरनवुड v7) को TFLOPS आंकड़ों और बड़े पैमाने के पॉड्स के साथ बनाए रखता है, और AWS ट्रेनियम और इन्फरेंटिया का विकास जारी रखता है, हालांकि 2024 तक के आंतरिक आंकड़ों से पता चलता है कि AWS के अपने बुनियादी ढांचे में GPU की तुलना में इसका उपयोग अपेक्षाकृत कम है।

उद्योग सर्वेक्षण और अनुमान विविधीकरण को सुदृढ़ करते हैं: नवंबर 2025 में, फ्यूचरम ग्रुप ने एक्सपीयू एक्सेलेरेटर को 2026 के लिए डेटा सेंटर खर्च में सबसे तेजी से बढ़ते सेगमेंट के रूप में स्थान दिया, और ट्रेंडफोर्स ने उसी वर्ष क्लाउड प्रदाताओं द्वारा कस्टम एएसआईसी की शिपमेंट में उल्लेखनीय वृद्धि का अनुमान लगाया।

एनवीडिया की प्रतिक्रिया स्पष्ट रही है: तीसरे पक्ष द्वारा गैर-जीपीयू सिलिकॉन की उपस्थिति सुनिश्चित करने से पहले ही इसे अपने प्लेटफॉर्म में शामिल करना। ग्रोक 3 एलपीयू इसी रणनीति का मूर्त उदाहरण है; हालांकि, रुबिन सीपीएक्स का भविष्य फिलहाल अनिश्चित बना हुआ है।

इस पर साझा करें: