AMD 在 AI 和 HPC 领域推出业界首款支持超以太网的网卡。
超以太网联盟 (UEC) 已将规范 1.0 版本的发布时间从 2024 年第三季度推迟到 2025 年第一季度,但看来 AMD 准备宣布 适用于人工智能数据中心的真正网络接口卡,可部署在超以太网数据中心中。新设备是 AMD Pensando Pollara 400,它有望将 AI 工作负载的性能提升六倍。
AMD Pensando Pollara 400 是一款 400GbE 超以太网卡,基于该公司 Pensando 部门设计的处理器。该网络处理器具有可编程硬件管道、可编程 RDMA 传输、可编程拥塞控制和通信库加速功能。该NIC将于第四季度进行测试,并于2025年上半年,即超以太网联盟正式发布UEC 1.0规范之后商用。
La NIC AMD Pensando Pollara 400 AI está diseñada para optimizar las redes de IA y HPC a través de varias capacidades avanzadas. Una de sus características clave es la ruta múltiple inteligente, que distribuye dinámicamente paquetes de datos a través de rutas óptimas, evitando la congestión de la red y mejorando la eficiencia general. La NIC también incluye control de congestión según la ruta, que redirige los datos lejos de rutas temporalmente congestionadas para garantizar un flujo continuo de datos de alta velocidad.
(图片来源:AMD)Pollara 400 es una innovadora solución que ofrece una conmutación por error rápida, lo que significa que puede detectar y evitar fallas de red con gran rapidez y eficacia. Esto garantiza que la comunicación entre las unidades de procesamiento gráfico (GPU) se mantenga ininterrumpida, lo cual es crucial para aplicaciones que requieren un alto 表现 y disponibilidad continua. Al asegurar una comunicación fluida de GPU a GPU, Pollara 400 proporciona un rendimiento robusto, optimizando al mismo tiempo la utilización de los clústeres de inteligencia artificial (IA) y minimizando la latencia que podría afectar negativamente el procesamiento de datos.
Pollara 400 的这些先进功能尤其有前途,因为它们有可能显着提高人工智能基础设施的可扩展性和可靠性。这使得该解决方案非常适合大规模部署,其中效率和服务连续性至关重要。
En paralelo, el crecimiento del Consorcio Ultra Ethernet refleja el interés y la expansión en el desarrollo de 技术 avanzadas de red. Con 97 miembros, un aumento significativo en comparación con los 55 que había en marzo de 2024, el consorcio está trabajando en la especificación UEC 1.0. Esta especificación tiene como objetivo escalar la 技术 Ethernet, que es omnipresente, en términos de rendimiento y características, para satisfacer las demandas de las cargas de trabajo de inteligencia artificial (IA) y computación de alto rendimiento (HPC).
新的 UEC 1.0 规范将受益于尽可能多地重用原始以太网技术。这不仅确保了新技术的开发和部署具有成本效益,而且还确保了与现有基础设施的互操作性,这对于市场的顺利采用至关重要。
Además, la especificación UEC 1.0 incluirá perfiles diferenciados para IA y HPC. Aunque estos tipos de cargas de trabajo comparten diversas similitudes, también presentan diferencias significativas en sus necesidades y características. Por lo tanto, para maximizar la eficiencia de cada una, se desarrollarán protocolos separados que se ajusten específicamente a los requisitos únicos de IA y HPC. Esto permitirá a las organizaciones aprovechar al máximo sus infraestructuras tecnológicas, optimizando el rendimiento y asegurando que las soluciones sean adecuadas para una amplia gama de aplicaciones y escenarios.