Первая в отрасли сетевая карта Ultra Ethernet для искусственного интеллекта и высокопроизводительных вычислений

AMD представляет первую в отрасли сетевую карту с поддержкой Ultra Ethernet для искусственного интеллекта и высокопроизводительных вычислений

AMD представляет первую в отрасли сетевую карту с поддержкой Ultra Ethernet для AI и HPC.

Консорциум Ultra Ethernet (UEC) отложил выпуск версии 1.0 спецификации с третьего квартала 2024 года на первый квартал 2025 года, но, похоже, AMD готова объявить настоящая сетевая карта для центров обработки данных AI, готовая к развертыванию в центрах обработки данных Ultra Ethernet. Новым устройством является AMD Pensando Pollara 400, который обещает шестикратное повышение производительности для рабочих нагрузок искусственного интеллекта.

AMD Pensando Pollara 400 — это карта 400GbE Ultra Ethernet, основанная на процессоре, разработанном подразделением компании Pensando. Сетевой процессор имеет программируемый аппаратный конвейер, программируемый транспорт RDMA, программируемый контроль перегрузки и ускорение коммуникационной библиотеки. Сетевая карта будет протестирована в четвертом квартале и будет коммерчески доступна в первой половине 2025 года, сразу после того, как консорциум Ultra Ethernet официально опубликует спецификацию UEC 1.0.

Сетевая плата искусственного интеллекта AMD Pensando Pollara 400 предназначена для оптимизации сетей искусственного интеллекта и высокопроизводительных вычислений с помощью ряда расширенных возможностей. Одной из его ключевых особенностей является интеллектуальное управление несколькими путями, которое динамически распределяет пакеты данных по оптимальным путям, избегая перегрузки сети и повышая общую эффективность. NIC также включает в себя управление перегрузкой на основе путей, которое перенаправляет данные с временно перегруженных путей, чтобы обеспечить непрерывный поток высокоскоростных данных.

(Изображение предоставлено: AMD)

Pollara 400 — это инновационное решение, обеспечивающее быстрое переключение при сбое, что означает, что оно может очень быстро и эффективно обнаруживать и предотвращать сбои в сети. Это гарантирует бесперебойность связи между графическими процессорами (GPU), что крайне важно для приложений, которым требуется высокая производительность и постоянная доступность. Обеспечивая бесперебойную связь между графическими процессорами, Pollara 400 обеспечивает надежную производительность, одновременно оптимизируя использование кластеров искусственного интеллекта (ИИ) и минимизируя задержки, которые могут негативно повлиять на обработку данных.

Эти расширенные функции Pollara 400 особенно многообещающи, поскольку они могут значительно улучшить масштабируемость и надежность инфраструктуры искусственного интеллекта. Это делает решение идеальным для крупномасштабных развертываний, где эффективность и непрерывность обслуживания имеют первостепенное значение.

Параллельно рост Консорциума Ultra Ethernet отражает интерес и расширение развития передовых сетевых технологий. Консорциум, насчитывающий 97 членов, что значительно больше по сравнению с 55 в марте 2024 года, работает над спецификацией UEC 1.0. Эта спецификация направлена на масштабирование повсеместно распространенной технологии Ethernet с точки зрения производительности и функций для удовлетворения требований рабочих нагрузок искусственного интеллекта (ИИ) и высокопроизводительных вычислений (HPC).

Новая спецификация UEC 1.0 выиграет от повторного использования исходной технологии Ethernet, насколько это возможно. Это не только обеспечивает экономически эффективную разработку и внедрение новых технологий, но также обеспечивает совместимость с существующими инфраструктурами, что имеет решающее значение для плавного внедрения на рынке.

Кроме того, спецификация UEC 1.0 будет включать дифференцированные профили для искусственного интеллекта и высокопроизводительных вычислений. Хотя эти типы рабочих нагрузок имеют некоторые общие черты, они также имеют существенные различия в своих потребностях и характеристиках. Поэтому, чтобы максимизировать эффективность каждого из них, будут разработаны отдельные протоколы, специально соответствующие уникальным требованиям ИИ и HPC. Это позволит организациям максимально эффективно использовать свою технологическую инфраструктуру, оптимизируя производительность и гарантируя, что решения подходят для широкого спектра приложений и сценариев.

5 2 голоса
Article Rating
Подписаться
Уведомить о
гость

0 Comments
Самый старый
Самый новый Наибольшее количество голосов
онлайн-комментарии
Посмотреть все комментарии