Первая в отрасли сетевая карта Ultra Ethernet для искусственного интеллекта и высокопроизводительных вычислений

AMD представляет первую в отрасли сетевую карту с поддержкой Ultra Ethernet для искусственного интеллекта и высокопроизводительных вычислений

AMD представляет первую в отрасли сетевую карту с поддержкой Ultra Ethernet для AI и HPC.

Консорциум Ultra Ethernet (UEC) отложил выпуск версии 1.0 спецификации с третьего квартала 2024 года на первый квартал 2025 года, но, похоже, AMD готова объявить настоящая сетевая карта для центров обработки данных AI, готовая к развертыванию в центрах обработки данных Ultra Ethernet. Новым устройством является AMD Pensando Pollara 400, который обещает шестикратное повышение производительности для рабочих нагрузок искусственного интеллекта.

AMD Pensando Pollara 400 — это карта 400GbE Ultra Ethernet, основанная на процессоре, разработанном подразделением компании Pensando. Сетевой процессор имеет программируемый аппаратный конвейер, программируемый транспорт RDMA, программируемый контроль перегрузки и ускорение коммуникационной библиотеки. Сетевая карта будет протестирована в четвертом квартале и будет коммерчески доступна в первой половине 2025 года, сразу после того, как консорциум Ultra Ethernet официально опубликует спецификацию UEC 1.0.

Сетевая плата искусственного интеллекта AMD Pensando Pollara 400 предназначена для оптимизации сетей искусственного интеллекта и высокопроизводительных вычислений с помощью ряда расширенных возможностей. Одной из его ключевых особенностей является интеллектуальное управление несколькими путями, которое динамически распределяет пакеты данных по оптимальным путям, избегая перегрузки сети и повышая общую эффективность. NIC также включает в себя управление перегрузкой на основе путей, которое перенаправляет данные с временно перегруженных путей, чтобы обеспечить непрерывный поток высокоскоростных данных.

(Изображение предоставлено: AMD)

Pollara 400 — это инновационное решение, обеспечивающее быстрое переключение при сбое, что означает, что оно может очень быстро и эффективно обнаруживать и предотвращать сбои в сети. Это гарантирует бесперебойность связи между графическими процессорами (GPU), что крайне важно для приложений, которым требуется высокая производительность и постоянная доступность. Обеспечивая бесперебойную связь между графическими процессорами, Pollara 400 обеспечивает надежную производительность, одновременно оптимизируя использование кластеров искусственного интеллекта (ИИ) и минимизируя задержки, которые могут негативно повлиять на обработку данных.

Эти расширенные функции Pollara 400 особенно многообещающи, поскольку они могут значительно улучшить масштабируемость и надежность инфраструктуры искусственного интеллекта. Это делает решение идеальным для крупномасштабных развертываний, где эффективность и непрерывность обслуживания имеют первостепенное значение.

Параллельно рост Консорциума Ultra Ethernet отражает интерес и расширение развития передовых сетевых технологий. Консорциум, насчитывающий 97 членов, что значительно больше по сравнению с 55 в марте 2024 года, работает над спецификацией UEC 1.0. Эта спецификация направлена на масштабирование повсеместно распространенной технологии Ethernet с точки зрения производительности и функций для удовлетворения требований рабочих нагрузок искусственного интеллекта (ИИ) и высокопроизводительных вычислений (HPC).

Новая спецификация UEC 1.0 выиграет от повторного использования исходной технологии Ethernet, насколько это возможно. Это не только обеспечивает экономически эффективную разработку и внедрение новых технологий, но также обеспечивает совместимость с существующими инфраструктурами, что имеет решающее значение для плавного внедрения на рынке.

Además, la especificación UEC 1.0 incluirá perfiles diferenciados para IA y HPC. Aunque estos tipos de cargas de trabajo comparten diversas similitudes, también presentan diferencias significativas en sus necesidades y características. Por lo tanto, para maximizar la eficiencia de cada una, se desarrollarán protocolos separados que se ajusten específicamente a los requisitos únicos de IA y HPC. Esto permitirá a las organizaciones aprovechar al máximo sus infraestructuras tecnológicas, optimizando el rendimiento y asegurando que las soluciones sean adecuadas para una amplia gama de aplicaciones y escenarios.

5 2 голоса
Article Rating
Подписаться
Уведомить о
гость

0 Comments
Самый старый
Самый новый Наибольшее количество голосов
онлайн-комментарии
Посмотреть все комментарии