Primera tarjeta de red Ultra Ethernet de la industria para IA y HPC

AMD presenta la primera tarjeta de red preparada para Ultra Ethernet de la industria para IA y HPC

AMD presenta la primera tarjeta de red de la industria preparada para Ultra Ethernet en IA y HPC.

El Consorcio Ultra Ethernet (UEC) ha retrasado el lanzamiento de la versión 1.0 de la especificación del tercer trimestre de 2024 al primer trimestre de 2025, pero parece que AMD está listo para anunciar una tarjeta de interfaz de red real para centros de datos de IA que está lista para implementarse en centros de datos Ultra Ethernet. La nueva unidad es el AMD Pensando Pollara 400, que promete un aumento de rendimiento hasta seis veces mayor para cargas de trabajo de IA.

La AMD Pensando Pollara 400 es una tarjeta Ultra Ethernet de 400 GbE basada en un procesador diseñado por la unidad Pensando de la empresa. El procesador de red cuenta con una canalización de hardware programable, transporte RDMA programable, control de congestión programable y aceleración de biblioteca de comunicaciones. La NIC se probará en el cuarto trimestre y estará disponible comercialmente en la primera mitad de 2025, justo después de que el Consorcio Ultra Ethernet publique formalmente la especificación UEC 1.0.

La NIC AMD Pensando Pollara 400 AI está diseñada para optimizar las redes de IA y HPC a través de varias capacidades avanzadas. Una de sus características clave es la ruta múltiple inteligente, que distribuye dinámicamente paquetes de datos a través de rutas óptimas, evitando la congestión de la red y mejorando la eficiencia general. La NIC también incluye control de congestión según la ruta, que redirige los datos lejos de rutas temporalmente congestionadas para garantizar un flujo continuo de datos de alta velocidad.

(Crédito de la imagen: AMD)

Pollara 400 es una innovadora solución que ofrece una conmutación por error rápida, lo que significa que puede detectar y evitar fallas de red con gran rapidez y eficacia. Esto garantiza que la comunicación entre las unidades de procesamiento gráfico (GPU) se mantenga ininterrumpida, lo cual es crucial para aplicaciones que requieren un alto rendimiento y disponibilidad continua. Al asegurar una comunicación fluida de GPU a GPU, Pollara 400 proporciona un rendimiento robusto, optimizando al mismo tiempo la utilización de los clústeres de inteligencia artificial (IA) y minimizando la latencia que podría afectar negativamente el procesamiento de datos.

Estas características avanzadas de Pollara 400 son especialmente prometedoras, ya que tienen el potencial de mejorar significativamente la escalabilidad y la confiabilidad de la infraestructura de IA. Esto hace que la solución sea ideal para implementaciones a gran escala, donde la eficiencia y la continuidad del servicio son de suma importancia.

En paralelo, el crecimiento del Consorcio Ultra Ethernet refleja el interés y la expansión en el desarrollo de tecnologías avanzadas de red. Con 97 miembros, un aumento significativo en comparación con los 55 que había en marzo de 2024, el consorcio está trabajando en la especificación UEC 1.0. Esta especificación tiene como objetivo escalar la tecnología Ethernet, que es omnipresente, en términos de rendimiento y características, para satisfacer las demandas de las cargas de trabajo de inteligencia artificial (IA) y computación de alto rendimiento (HPC).

La nueva especificación UEC 1.0 se beneficiará de la reutilización de la mayor cantidad posible de tecnología Ethernet original. Esto no solo asegura la rentabilidad del desarrollo y la implementación de nuevas tecnologías, sino que también garantiza la interoperabilidad con las infraestructuras existentes, lo cual es crucial para una adopción fluida en el mercado.

Además, la especificación UEC 1.0 incluirá perfiles diferenciados para IA y HPC. Aunque estos tipos de cargas de trabajo comparten diversas similitudes, también presentan diferencias significativas en sus necesidades y características. Por lo tanto, para maximizar la eficiencia de cada una, se desarrollarán protocolos separados que se ajusten específicamente a los requisitos únicos de IA y HPC. Esto permitirá a las organizaciones aprovechar al máximo sus infraestructuras tecnológicas, optimizando el rendimiento y asegurando que las soluciones sean adecuadas para una amplia gama de aplicaciones y escenarios.

5 2 votos
Article Rating
Suscribirse
Notificar de
guest

0 Comments
Más antiguo
El más nuevo Más votado
Comentarios en línea
Ver todos los comentarios