AMD apresenta a primeira placa de rede pronta para Ultra Ethernet do setor em IA e HPC.
O Ultra Ethernet Consortium (UEC) atrasou o lançamento da versão 1.0 da especificação do terceiro trimestre de 2024 para o primeiro trimestre de 2025, mas parece que AMD está pronta para anunciar uma verdadeira placa de interface de rede para data centers de IA que está pronta para ser implantada em data centers Ultra Ethernet. A nova unidade é o AMD Pensando Pollara 400, que promete um aumento de desempenho de até seis vezes para cargas de trabalho de IA.
A AMD Pensando Pollara 400 é uma placa Ultra Ethernet 400GbE baseada em um processador projetado pela unidade Pensando da empresa. O processador de rede possui pipeline de hardware programável, transporte RDMA programável, controle de congestionamento programável e aceleração da biblioteca de comunicações. A NIC será testada no quarto trimestre e estará disponível comercialmente no primeiro semestre de 2025, logo após o Ultra Ethernet Consortium lançar formalmente a especificação UEC 1.0.
A NIC AMD Pensando Pollara 400 AI foi projetada para otimizar redes de IA e HPC por meio de vários recursos avançados. Um de seus principais recursos é o multipathing inteligente, que distribui dinamicamente pacotes de dados por caminhos ideais, evitando congestionamentos na rede e melhorando a eficiência geral. A NIC também inclui controle de congestionamento baseado em caminho, que redireciona os dados para longe de caminhos temporariamente congestionados para garantir um fluxo contínuo de dados em alta velocidade.
(Crédito da imagem: AMD)Pollara 400 é uma solução inovadora que oferece failover rápido, o que significa que pode detectar e prevenir falhas de rede de forma muito rápida e eficaz. Isso garante que a comunicação entre as unidades de processamento gráfico (GPUs) permaneça ininterrupta, o que é crucial para aplicações que exigem alto desempenho e disponibilidade contínua. Ao garantir uma comunicação perfeita de GPU para GPU, o Pollara 400 oferece desempenho robusto, ao mesmo tempo que otimiza a utilização de clusters de inteligência artificial (IA) e minimiza a latência que pode impactar negativamente o processamento de dados.
Esses recursos avançados do Pollara 400 são especialmente promissores, pois têm o potencial de melhorar significativamente a escalabilidade e a confiabilidade da infraestrutura de IA. Isto torna a solução ideal para implantações em larga escala, onde a eficiência e a continuidade do serviço são de extrema importância.
Paralelamente, o crescimento do Consórcio Ultra Ethernet reflete o interesse e a expansão no desenvolvimento de tecnologias de rede avançadas. Com 97 membros, um aumento significativo em relação aos 55 de março de 2024, o consórcio está trabalhando na especificação UEC 1.0. Esta especificação visa dimensionar a onipresente tecnologia Ethernet, em termos de desempenho e recursos, para atender às demandas de cargas de trabalho de inteligência artificial (IA) e computação de alto desempenho (HPC).
A nova especificação UEC 1.0 se beneficiará da reutilização do máximo possível da tecnologia Ethernet original. Isto não só garante o desenvolvimento e a implantação rentáveis de novas tecnologias, mas também assegura a interoperabilidade com as infraestruturas existentes, o que é crucial para uma adoção harmoniosa pelo mercado.
Além disso, a especificação UEC 1.0 incluirá perfis diferenciados para IA e HPC. Embora esses tipos de cargas de trabalho compartilhem diversas semelhanças, eles também apresentam diferenças significativas em suas necessidades e características. Portanto, para maximizar a eficiência de cada um, serão desenvolvidos protocolos separados que atendam especificamente aos requisitos exclusivos de IA e HPC. Isto permitirá que as organizações aproveitem ao máximo as suas infraestruturas tecnológicas, otimizando o desempenho e garantindo que as soluções são adequadas para uma ampla gama de aplicações e cenários.