La prima scheda di rete Ultra Ethernet del settore per AI e HPC

AMD presenta la prima scheda di rete predisposta per Ultra Ethernet del settore per AI e HPC

AMD presenta la prima scheda di rete predisposta per Ultra Ethernet del settore in AI e HPC.

L'Ultra Ethernet Consortium (UEC) ha ritardato il rilascio della versione 1.0 della specifica dal terzo trimestre del 2024 al primo trimestre del 2025, ma sembra che AMD è pronta ad annunciare una vera scheda di interfaccia di rete per data center AI pronta per essere implementata nei data center Ultra Ethernet. La nuova unità è l'AMD Pensando Pollara 400, che promette un incremento delle prestazioni fino a sei volte per i carichi di lavoro AI.

L'AMD Pensando Pollara 400 è una scheda Ultra Ethernet da 400GbE basata su un processore progettato dall'unità Pensando dell'azienda. Il processore di rete è dotato di pipeline hardware programmabile, trasporto RDMA programmabile, controllo di congestione programmabile e accelerazione della libreria di comunicazione. La NIC sarà testata nel quarto trimestre e sarà disponibile in commercio nella prima metà del 2025, subito dopo che l'Ultra Ethernet Consortium avrà rilasciato formalmente la specifica UEC 1.0.

La scheda NIC AMD Pensando Pollara 400 AI è progettata per ottimizzare le reti AI e HPC attraverso diverse funzionalità avanzate. Una delle sue caratteristiche principali è il multipathing intelligente, che distribuisce dinamicamente i pacchetti di dati su percorsi ottimali, evitando la congestione della rete e migliorando l'efficienza complessiva. La scheda NIC include anche il controllo della congestione basato sul percorso, che reindirizza i dati lontano dai percorsi temporaneamente congestionati per garantire un flusso continuo di dati ad alta velocità.

(Credito immagine: AMD)

Pollara 400 è una soluzione innovativa che offre un failover rapido, ovvero è in grado di rilevare e prevenire guasti di rete in modo molto rapido ed efficace. Ciò garantisce che la comunicazione tra le unità di elaborazione grafica (GPU) rimanga ininterrotta, il che è fondamentale per le applicazioni che richiedono prestazioni elevate e disponibilità continua. Garantendo una comunicazione perfetta da GPU a GPU, Pollara 400 offre prestazioni robuste, ottimizzando al contempo l'utilizzo dei cluster di intelligenza artificiale (AI) e riducendo al minimo la latenza che potrebbe avere un impatto negativo sull'elaborazione dei dati.

Queste funzionalità avanzate di Pollara 400 sono particolarmente promettenti in quanto hanno il potenziale per migliorare significativamente la scalabilità e l’affidabilità dell’infrastruttura AI. Ciò rende la soluzione ideale per implementazioni su larga scala, dove l'efficienza e la continuità del servizio sono della massima importanza.

Parallelamente, la crescita del Consorzio Ultra Ethernet riflette l'interesse e l'espansione nello sviluppo di tecnologie di rete avanzate. Con 97 membri, un aumento significativo rispetto ai 55 del marzo 2024, il consorzio sta lavorando alla specifica UEC 1.0. Questa specifica mira a scalare l'onnipresente tecnologia Ethernet, in termini di prestazioni e funzionalità, per soddisfare le esigenze dei carichi di lavoro di intelligenza artificiale (AI) e calcolo ad alte prestazioni (HPC).

La nuova specifica UEC 1.0 trarrà vantaggio dal riutilizzo della maggior parte possibile della tecnologia Ethernet originale. Ciò non solo garantisce uno sviluppo e un’implementazione economicamente vantaggiosi di nuove tecnologie, ma garantisce anche l’interoperabilità con le infrastrutture esistenti, che è fondamentale per un’adozione agevole sul mercato.

Además, la especificación UEC 1.0 incluirá perfiles diferenciados para IA y HPC. Aunque estos tipos de cargas de trabajo comparten diversas similitudes, también presentan diferencias significativas en sus necesidades y características. Por lo tanto, para maximizar la eficiencia de cada una, se desarrollarán protocolos separados que se ajusten específicamente a los requisitos únicos de IA y HPC. Esto permitirá a las organizaciones aprovechar al máximo sus infraestructuras tecnológicas, optimizando el rendimiento y asegurando que las soluciones sean adecuadas para una amplia gama de aplicaciones y escenarios.

5 2 voti
Valutazione dell'articolo
Iscriviti
Notifica di
ospite

0 Commenti
più antico
Più recente I più votati
Commenti in linea
Vedi tutti i commenti