인공지능 기반 기술 분야의 리더 기업인 리벨리온은 최신 AI 반도체 '리벨 100'을 장착한 서버 제품이 개방형 AI 모델 작동에서 업계 최고 수준을 입증했다고 밝혔습니다. 이 제품은 AI의 학습에서 추론으로 전환되는 수요를 충족시키기 위해 성능과 효율성을 강조하며 데이터센터 시장 공략을 가속화할 계획입니다.
리벨리온은 최근 'gpt-oss-120b', '미니맥스(MiniMax)' 등 최신 오픈소스 추론 모델에서 리벨 100을 기반으로 한 서버용 카드가 엔비디아 H200 대비 3배 높은 전성비(전력 대비 성능)를 기록했다고 발표했습니다. 이는 gpt-oss-120b와 미니맥스가 갖는 뛰어난 추론 능력과 효율성을 보다 효과적으로 지원하고 있다는 것을 의미합니다.
리벨 100 AI 반도체 기반 카드는 효율 모드에서 gpt-oss-120b의 4.0ms 출력토큰당생성시간(TPOT)을 기록하며, 성능 모드에서는 최대 3.2ms까지 TPOT를 구현합니다. TPOT는 사용자가 응답을 체감하는 속도를 나타내는 중요한 지표이며, 이는 실제 AI 서비스 품질에 큰 영향을 미칩니다.
리벨리온은 이같은 성과를 달성하기 위해 리벨 100을 추론에 초점을 맞춘 기획을 통해 개발했다고 강조했습니다. 또한, UCIe 기반 칩렛 아키텍처를 최초로 도입하여 페타플롭스급 연산 성능을 구현했으며, 144GB HBM3E 메모리를 탑재하고 서버 및 랙스케일까지 확장 가능한 시스템 아키텍처를 고려해 제품을 출시했습니다.
리벨리온은 이번 평가에 만족하지 않고 추가적인 소프트웨어 최적화를 통해 성능을 계속 향상시킬 계획이며, 하드웨어 측면에서도 실시간으로 지연시간과 처리효율을 개선하고 있습니다. AI 반도체 칩과 카드 뿐만 아니라 서버 및 랙스케일용 제품도 준비 중이며, 올해 하반기에 양산할 예정입니다. 리벨리온은 엔비디아의 데이터센터 고성능 서버용 제품 H200과의 경쟁에 본격적으로 뛰어들 것이며, 국내외 다양한 기업들이 개발한 오픈소스 모델을 지원해 범용적인 AI 추론 플랫폼으로 자리매김할 것이라 밝혔습니다.