엔비디아가 미국 캘리포니아주 산호세에서 개최된 'GTC 2026'에서 새로운 AI 플랫폼 '베라 루빈'의 세부 사항을 공개했습니다. 이 플랫폼은 에이전틱 AI 시대에 필요한 인프라 표준을 제시하며, CPU, GPU, LPU를 단일 생태계로 통합하여 고대역폭과 저지연 요구 사항을 충족시킵니다.
베라 루빈은 총 7개의 신규 칩과 5개의 랙 타입으로 구성되어 있으며, 전문가 혼합 모델 훈련 시 GPU 수량을 크게 줄였습니다. 또한, 추론 처리량과 와트당 성능이 10배 향상되었고, 토큰당 비용은 10분의 1로 감소했습니다. 베라 CPU는 '올림푸스 코어' 아키텍처를 탑재하여 이전 세대 대비 2배의 성능 향상을 보여줍니다.
루빈 GPU는 고대역폭 메모리를 탑재하고, 새로운 그로크 3 LPU는 예외적인 대역폭으로 초저지연 토큰 생성에 최적화되어 있습니다. 엔비디아는 또한 AI 모델 성장의 새로운 단계인 '에이전틱 스케일링'을 제시했는데, 이는 AI가 다른 AI와 상호작용하는 새로운 패러다임을 의미합니다.
CEO 젠슨 황은 베라 루빈을 "AI의 모든 단계를 지원하는 세대적 도약"으로 소개하며, 이 플랫폼이 역사상 가장 큰 규모의 인프라 구축을 시작하고 에이전트 기반 AI의 변곡점을 맞이했다고 강조했습니다.