🌟 xAI Colossus の秘密: イーロン・マスクの 100,000 GPU AI クラスターを発見する 🚀
人工知能と最先端のテクノロジーに情熱を持っているなら、イーロン・マスク氏が AI クラスターを使って何をしているのかを調べずにはいられません。 xAI Colossus として知られるこのテクノロジー巨人は、テクノロジー業界で大きな波紋を巻き起こしています。 100,000 GPU という驚異的な処理能力を備えたこのクラスターは、現代エンジニアリングの真の驚異です。 🤖💻
この記事では、この驚くべきイノベーションの背後にある秘密を解き明かしていきます。 技術的な。 xAI Colossus が人工知能の分野にどのような革命をもたらしているのか、そしてこれが将来に何を意味するのかを探っていきます。 🌟 偉大な偉業の中心へ向かう魅力的な旅の準備をしましょう 技術的な 私たちの時代の。 🚀 お見逃しなく!
イーロン・マスク氏の高額な新プロジェクト、xAI Colossus AI スーパーコンピューターの詳細が初めて明らかになった。 YouTuber の ServeTheHome は、100,000 GPU の猛獣内部の Supermicro サーバーにアクセスし、このスーパーコンピューターのさまざまな側面を見せました。マスク氏の xAI Colossus スーパークラスターは、122 日かかった組み立て後、ほぼ 2 か月間稼働し続けています。 🔧💡
100,000 GPU クラスターの内部には何が入っているのでしょうか? 🤔
ServeTheHome の Patrick が、カメラを持ってサーバーのさまざまな部分を巡るツアーに私たちを連れて行き、サーバーの動作のパノラマ ビューを提供します。多少ですが 詳細 スーパーコンピューターの消費電力や爆弾のサイズなど、より具体的な情報は機密保持契約により明らかにできなかったが、xAI は公開前にビデオの一部のぼかしや検閲を行った。 🎥
それにもかかわらず、最も重要なのは、サーバーのような グラフィックプロセッサ Supermicro の製品は、映像全体を通じてほぼ無傷のままでした。これらのGPUサーバーは エヌビディア HGX H100 は、それぞれ 8 つの H100 GPU を備えた強力なサーバー ソリューションです。 🚀 HGX H100 プラットフォームは 4U Universal GPU Liquid システム内に統合されています 冷却された Supermicro の製品で、各 GPU に簡単にホットスワップ可能な液体冷却を提供します。 ❄️
これらのサーバーは、それぞれ8台のサーバーが入ったラックにまとめられており、合計64台になります。 グラフィックプロセッサ フレームごとに。各 HGX H100 の間に 1U ヘッダーが挟まれ、サーバーに必要な液体冷却を提供します。各ラックの下部には、冗長ポンプ システムとラック監視システムを備えた別の Supermicro 4U ユニットがあります。 🔍


🖥️ これらのラックは8つのグループに分かれており、512の グラフィックプロセッサ マトリックスによって。各サーバーには4つの 電源 冗長です。ラックの裏側に グラフィックプロセッサ3 相電源、イーサネット スイッチ、およびすべての液体冷却を提供するラック サイズのマニホールドがあります。 💧
Colossus クラスターには 1,500 を超えるラックがあります。 グラフィックプロセッサ, distribuidos en cerca de 200 conjuntos de bastidores. Según Jensen Huang, director ejecutivo de Nvidia, las GPU de estas 200 matrices se instalaron completamente en solo tres semanas. 🚀
AIスーパークラスターがモデルを継続的にトレーニングするには膨大な帯域幅が必要となるため、xAIは相互接続性をさらに強化しました。 赤。各グラフィック カードには専用の 400GbE NIC (ネットワーク インターフェイス コントローラー) があり、サーバーごとに追加の 400Gb NIC があります。 🔗 これは、各 HGX H100 サーバーが 3.6 テラビット/秒のイーサネットを備えていることを意味します。すごいですね。そして、はい、クラスター全体は、スーパーコンピューティングの世界で標準となっている InfiniBand やその他の特殊な接続ではなく、イーサネット上で実行されます。 🌐


もちろん、AIモデルを訓練するGrok 3チャットボットのようなスーパーコンピューターには、 グラフィックプロセッサ 最高の状態で機能する。 🔥 ColossusのストレージとCPUサーバーの詳細はやや限られていますが、Patrickのビデオと ブログ投稿、これらのサーバーは通常、Supermicro シャーシ内にあることがわかっています。 🚀
x86 プラットフォーム CPU を搭載した 1U NVMe フォワード サーバーが内部で使用され、ストレージとコンピューティング能力の両方を提供し、背面に水冷を備えています。 💧 さらに、屋外には非常にコンパクトな Tesla Megapack バッテリー バンクが見えます。 ⚡️
このアレイのスタートストップ機能は、バンク間のミリ秒単位の遅延を伴うため、従来の電力網やマスク氏のディーゼル発電機には多すぎた。このため、複数のテスラ メガパック (それぞれの容量は 3.9 MWh) が、テスラ メガパック間の中間エネルギー源として使用されています。 赤 電気とスーパーコンピューター。 🖥️🔋 これにより、最適かつ効率的な運用が保証され、中断が回避されます。 🚦✨
🌟 Colossus と Musk の安定したスーパーコンピューターの使用 🌟
Nvidia によると、xAI Colossus スーパーコンピューターは現在、世界最大の AI スーパーコンピューターです。 🤯 世界有数のスーパーコンピューターの多くは、気象パターン、病気、その他の複雑なタスクを研究するために請負業者や学者による研究に使用されていますが、Colossus は X (旧 Twitter) のさまざまな AI モデルのトレーニングに単独で責任を負っています。主に、X Premium 加入者のみが利用できる Elon の「アンチウェイク」チャットボットである Grok 3 です。 🤖
さらに、ServeTheHomeはコロッサスが訓練中であることを知らされた。 AIモデル «del futuro»; modelos cuyos usos y capacidades supuestamente están más allá de las capacidades actuales de la IA. 🚀 La primera fase de construcción de Colossus está completa y el clúster está completamente operativo, pero aún no está todo terminado. La supercomputadora de Memphis pronto se actualizará para duplicar su capacidad de GPU, con 50.000 GPU H100 adicionales y 50.000 GPU H200 de próxima generación. 🔥
これ アップデート また、エネルギー消費量も2倍以上となり、マスク氏が7月に敷地内に追加した14台のディーゼル発電機ではすでに多すぎて対応できない。 ⚡ マスク氏が約束したコロッサス内での 300,000 H200 を下回っていますが、これはフェーズ 3 の一部となる可能性があります。 アップデート。 🔋
一方、テスラの「ギガテキサス」工場にある5万GPUのCortexスーパーコンピューターもマスク社のものだ。 Cortex は、テスラの自律型ロボットやその他の AI プロジェクトだけでなく、カメラ ストリーミングや画像検出を通じてテスラの自律型 AI テクノロジーのトレーニングに専念しています。 🤖🚗
さらに、テスラは間もなくニューヨーク州バッファローに5億ドル規模のスーパーコンピューター「Dojo」の建設を予定している。 💸 一方、Baidu CEO の Robin Li のような業界の投機家は、バブルが崩壊すると AI 企業の 99% が崩壊する可能性があると予測しています。マスク氏のAIへの記録的な支出が裏目に出るか、それとも報われるかはまだ分からない。 ⏳




















