Nenhum resultado

Ver todos os resultados

Nenhum resultado

Ver todos os resultados

Nenhum resultado

Ver todos os resultados

Os segredos do xAI Colossus: 100.000 GPUs

por Insights da MasterTrend

20 de fevereiro de 2025

em IA

Tempo de leitura:Leitura de 8 minutos

🌟 Os segredos do xAI Colossus: Descubra o cluster de IA de 100.000 GPUs de Elon Musk 🚀

5

COMPARTILHADO

14

Visualizações

Compartilhe no Facebook Compartilhe no Twitter

🌟 Os segredos do xAI Colossus: Descubra o cluster de IA de 100.000 GPUs de Elon Musk 🚀

Se você é apaixonado por inteligência artificial e tecnologia de ponta, não pode deixar de descobrir o que Elon Musk está fazendo com seu cluster de IA. Este gigante da tecnologia, conhecido como xAI Colossus, está criando um grande rebuliço no mundo da tecnologia. Com um impressionante poder de processamento de 100.000 GPUs, este cluster é uma verdadeira maravilha da engenharia moderna. 🤖💻

Neste artigo vamos desvendar os segredos por trás desta incrível inovação tecnológica. Exploraremos como o xAI Colossus está revolucionando o campo de inteligência artificial e o que isso significa para o futuro. 🌟 Prepare-se para uma viagem fascinante ao coração de uma das maiores façanhas tecnológica do nosso tempo. 🚀 Não perca!

O caro novo projeto de Elon Musk, o supercomputador xAI Colossus AI, foi detalhado pela primeira vez. Youtuber ServeTheHome teve acesso aos servidores da Supermicro dentro da fera 100.000 GPU, mostrando várias facetas deste supercomputador. O superaglomerado xAI Colossus de Musk está online há quase dois meses, após a montagem que durou 122 dias. 🔧💡

Por dentro do maior superaglomerado de IA do mundo, xAI Colossus – YouTube

O que há dentro de um cluster de 100.000 GPUs? 🤔

Patrick da ServeTheHome nos leva em um tour com sua câmera por diferentes partes do servidor, oferecendo uma visão panorâmica de seu funcionamento. Embora alguns detalhes Mais específicos do supercomputador, como seu consumo de energia e o tamanho das bombas, não puderam ser revelados devido a um acordo de confidencialidade, a xAI se encarregou de desfocar e censurar partes do vídeo antes de seu lançamento. 🎥

Apesar disso, o mais importante, como os servidores GPU da Supermicro, permaneceu praticamente intacto durante toda a filmagem. Esses servidores GPU são Nvidia HGX H100, uma solução de servidor poderosa com oito GPUs H100 cada. 🚀 A plataforma HGX H100 está integrada ao sistema 4U Universal GPU Liquid Resfriado da Supermicro, fornecendo resfriamento líquido facilmente hot-swap para cada GPU. ❄️

Esses servidores são organizados em racks contendo oito servidores cada, totalizando 64 GPU por quadro. Cabeçalhos 1U são colocados entre cada HGX H100, fornecendo o resfriamento líquido necessário para os servidores. Na parte inferior de cada rack, encontramos outra unidade Supermicro 4U, desta vez equipada com um sistema de bomba redundante e um sistema de monitoramento de rack. 🔍

Quatro bancos de racks de servidores xAI HGX H100, com capacidade para oito servidores cada.

(Crédito da imagem: ServeTheHome)

O acesso traseiro de um servidor GPU xAI Colossus. Nove cabos Ethernet saem de cada servidor, com quatro fontes de alimentação em cada um. As mangueiras de abastecimento e de refrigeração líquida também são visíveis.

(Crédito da imagem: ServeTheHome)

🖥️ Esses racks são organizados em grupos de oito, permitindo 512 GPU por matriz. Cada servidor está equipado com quatro fontes de alimentação redundante. Na parte de trás das prateleiras de GPU, há fontes de alimentação trifásicas, switches Ethernet e um coletor do tamanho de um rack que fornece todo o resfriamento líquido. 💧

Há mais de 1.500 racks no cluster Colossus. GPU, distribuídos em cerca de 200 conjuntos de quadros. De acordo com Jensen Huang, CEO da Nvidia, as GPUs dessas 200 matrizes foram totalmente instaladas em apenas três semanas. 🚀

Como um supercluster de IA que treina constantemente modelos requer uma enorme largura de banda, o xAI foi mais longe em sua interconectividade de grade. Cada placa de vídeo tem uma NIC (controlador de interface de rede) dedicada de 400 GbE, com uma NIC adicional de 400 Gb por servidor. 🔗 Isso significa que cada servidor HGX H100 tem 3,6 Terabits por segundo de Ethernet. Impressionante, não é? E sim, todo o cluster roda em Ethernet, em vez de InfiniBand ou outras conexões exóticas que são padrão no mundo da supercomputação. 🌐

Uma foto olhando para as ondas e mais ondas de cabos Ethernet amarelos conectando o cluster xAI Colossus a si mesmo. Várias camadas de cabos excessivamente largos estão embutidas no teto.

(Crédito da imagem: ServeTheHome)

Os servidores de computação Colossus CPU da xAI, que se parecem exatamente com os servidores de armazenamento da Supermicro, também são amplamente usados no site.

(Crédito da imagem: ServeTheHome)

É claro que um supercomputador como o chatbot Grok 3, que treina modelos de IA, precisa de mais do que apenas GPU para funcionar da melhor forma possível. 🔥 Embora os detalhes sobre armazenamento e servidores de CPU no Colossus sejam um tanto limitados, graças ao vídeo de Patrick e ao postagem no blog, sabemos que esses servidores geralmente estão em chassis Supermicro. 🚀

Servidores 1U NVMe-forward com CPUs de plataforma x86 são usados internamente, fornecendo armazenamento e capacidade. computação, e estão equipados com refrigeração líquida na parte traseira. 💧 Além disso, do lado de fora você pode ver bancos de baterias Tesla Megapack muito compacto. ⚡️

O recurso start-stop do array, com sua latência de milissegundos entre os bancos, era demais para a rede elétrica convencional ou para os geradores a diesel de Musk. Por esta razão, vários Tesla Megapacks (cada um com capacidade de 3,9 MWh) são utilizados como fonte de energia intermediária entre o grade eletricidade e o supercomputador. 🖥️🔋 Isso garante um funcionamento ideal e eficiente, evitando interrupções. 🚦✨

🌟 O uso do supercomputador estável de Colossus e Musk 🌟

O supercomputador xAI Colossus é atualmente, segundo a Nvidia, o maior supercomputador de IA do mundo. 🤯 Embora muitos dos principais supercomputadores do mundo sejam usados em pesquisas por empreiteiros ou acadêmicos para estudar padrões climáticos, doenças ou outras tarefas complexas, a Colossus é a única responsável por treinar os vários modelos de IA do X (anteriormente Twitter). Principalmente, Grok 3, o chatbot “anti-woke” de Elon que está disponível apenas para assinantes X Premium. 🤖

Além disso, ServeTheHome foi informado de que o Colossus está treinando Modelos de IA «do futuro»; modelos cujos usos e capacidades supostamente estão além das capacidades atuais da IA. 🚀 A primeira fase da construção do Colossus foi concluída e o cluster está totalmente operacional, mas ainda não acabou. O supercomputador Memphis estará em breve irá atualizar para dobrar sua capacidade de GPU, com 50.000 GPUs H100 adicionais e 50.000 GPUs H200 de próxima geração. 🔥

Esse atualizar Também mais do que duplicará o seu consumo de energia, o que já é demasiado para os 14 geradores a diesel que Musk adicionou ao local em julho. ⚡ Embora esteja abaixo da promessa de Musk de 300.000 H200 dentro do Colossus, isso pode fazer parte da fase 3 do atualizações. 🔋

Por outro lado, o supercomputador Cortex de 50.000 GPUs da fábrica “Giga Texas” da Tesla também pertence a uma empresa de Musk. Cortex se dedica a treinar o tecnologia A tecnologia de IA autônoma da Tesla por meio de streaming de câmera e detecção de imagens, bem como os robôs autônomos da Tesla e outros projetos de IA. 🤖🚗

Além disso, a Tesla verá em breve a construção do supercomputador Dojo em Buffalo, Nova York, um projeto de US$ 500 milhões que será lançado em breve. 💸 Enquanto isso, especuladores do setor, como o CEO do Baidu, Robin Li, prevêem que 99% das empresas de IA poderão entrar em colapso quando a bolha estourar. Resta saber se os gastos recordes de Musk em IA serão um tiro pela culatra ou serão recompensados. ⏳

Etiquetas: Conteúdo Evergreen GPU Inovação

Postagem anterior

Fechamento inesperado do Microsoft Edge no Windows

Próxima publicação

Como usar o AdGuard DNS no Android em 2025

Insights da MasterTrend

Nossa equipe editorial compartilha análises detalhadas, tutoriais e recomendações para ajudar você a aproveitar ao máximo seus dispositivos e ferramentas digitais.

Próxima publicação

Como usar o AdGuard DNS no Android em 2025

5 3 votos

Classificação do artigo

Inscrever-se

0 Comentários

mais antigo

Mais recente Mais votados

Comentários on-line

Ver todos os comentários

MasterTrend Info é a sua fonte de referência em tecnologia: descubra notícias, tutoriais e análises sobre hardware, software, jogos, dispositivos móveis e inteligência artificial. Assine nossa newsletter e não perca nenhuma tendência.

Siga-nos

Navegar por categoria

Notícias recentes

Desativar a correção automática no iPhone: tela do WhatsApp com teclado aberto, etapas para desativar a correção automática do teclado no iOS.

Desative a correção automática AGORA: escreva livremente em 1 minuto ⏱️🔥

16 de outubro de 2025

WhatsApp seguro: O logotipo do WhatsApp é protegido por uma corrente e um cadeado, um símbolo de segurança, criptografia e privacidade, protegendo os bate-papos com verificação em duas etapas.

WhatsApp seguro: 5 passos rápidos para evitar ser espionado 🔒

16 de outubro de 2025

Copyright © 2025 https://mastertrend.info/ - Todos os direitos reservados. Todas as marcas registradas são propriedade de seus respectivos proprietários.

Nenhum resultado

Ver todos os resultados

Copyright © 2025 https://mastertrend.info/ - Todos os direitos reservados. Todas as marcas registradas são propriedade de seus respectivos proprietários.

Sua instância Mastodon