AMD는 AI 및 HPC 분야에서 업계 최초의 울트라 이더넷 지원 네트워크 카드를 출시했습니다.
UEC(Ultra Ethernet Consortium)는 사양 버전 1.0의 출시를 2024년 3분기에서 2025년 1분기로 연기했지만 AMD는 발표할 준비가 되어있습니다 울트라 이더넷 데이터 센터에 배포할 준비가 된 AI 데이터 센터를 위한 진정한 네트워크 인터페이스 카드입니다. 새로운 장치는 AMD Pensando Pollara 400으로, AI 워크로드에 대해 최대 6배의 성능 향상을 약속합니다.
AMD Pensando Pollara 400은 회사의 Pensando 장치에서 설계한 프로세서를 기반으로 하는 400GbE Ultra 이더넷 카드입니다. 네트워크 프로세서는 프로그래밍 가능한 하드웨어 파이프라인, 프로그래밍 가능한 RDMA 전송, 프로그래밍 가능한 혼잡 제어 및 통신 라이브러리 가속 기능을 갖추고 있습니다. NIC는 4분기에 테스트를 거쳐 Ultra Ethernet Consortium이 공식적으로 UEC 1.0 사양을 출시한 직후인 2025년 상반기에 상용화될 예정입니다.
AMD Pensando Pollara 400 AI NIC는 여러 고급 기능을 통해 AI 및 HPC 네트워크를 최적화하도록 설계되었습니다. 주요 기능 중 하나는 최적의 경로에 데이터 패킷을 동적으로 배포하여 네트워크 정체를 방지하고 전반적인 효율성을 향상시키는 지능형 다중 경로 지정입니다. NIC에는 또한 일시적으로 혼잡한 경로에서 데이터를 리디렉션하여 고속 데이터의 지속적인 흐름을 보장하는 경로 기반 혼잡 제어 기능이 포함되어 있습니다.
(이미지 출처: AMD)Pollara 400은 빠른 장애 조치를 제공하는 혁신적인 솔루션입니다. 즉, 네트워크 오류를 매우 빠르고 효과적으로 감지하고 예방할 수 있습니다. 이를 통해 GPU(그래픽 처리 장치) 간의 통신이 중단 없이 유지되며, 이는 고성능과 지속적인 가용성이 필요한 애플리케이션에 매우 중요합니다. 원활한 GPU 간 통신을 보장함으로써 Pollara 400은 강력한 성능을 제공하는 동시에 인공 지능(AI) 클러스터 활용을 최적화하고 데이터 처리에 부정적인 영향을 미칠 수 있는 대기 시간을 최소화합니다.
Pollara 400의 이러한 고급 기능은 AI 인프라의 확장성과 안정성을 크게 향상시킬 수 있는 잠재력을 가지고 있기 때문에 특히 유망합니다. 따라서 이 솔루션은 효율성과 서비스 연속성이 가장 중요한 대규모 배포에 이상적입니다.
동시에 울트라 이더넷 컨소시엄의 성장은 고급 네트워크 기술 개발에 대한 관심과 확장을 반영합니다. 2024년 3월의 55명보다 크게 늘어난 97명의 회원으로 구성된 이 컨소시엄은 UEC 1.0 사양을 연구하고 있습니다. 이 사양은 성능 및 기능 측면에서 유비쿼터스 이더넷 기술을 확장하여 인공 지능(AI) 및 고성능 컴퓨팅(HPC) 워크로드의 요구 사항을 충족하는 것을 목표로 합니다.
새로운 UEC 1.0 사양은 원래 이더넷 기술을 최대한 많이 재사용함으로써 이점을 얻을 수 있습니다. 이는 새로운 기술의 비용 효율적인 개발 및 배포를 보장할 뿐만 아니라 원활한 시장 채택에 중요한 기존 인프라와의 상호 운용성을 보장합니다.
또한 UEC 1.0 사양에는 AI 및 HPC에 대한 차별화된 프로필이 포함됩니다. 이러한 유형의 워크로드는 몇 가지 유사점을 공유하지만 요구 사항과 특성 면에서는 상당한 차이도 있습니다. 따라서 각각의 효율성을 극대화하기 위해 AI 및 HPC의 고유한 요구 사항에 특별히 맞는 별도의 프로토콜이 개발될 것입니다. 이를 통해 조직은 기술 인프라를 최대한 활용하고 성능을 최적화하며 솔루션이 광범위한 애플리케이션 및 시나리오에 적합하도록 보장할 수 있습니다.