그래픽 콘퍼런스 시그라프에서 네모트론·코스모스 확장 공개

엔비디아가 글로벌 최대 컴퓨터 그래픽 콘퍼런스인 시그라프에서 추론 기능을 갖춘 2개의 모델 제품군인 엔비디아 네모트론과 엔비디아 코스모스의 확장을 13일 발표했다.
캡제미니에 따르면 AI 에이전트는 2028년까지 매출 증가와 비용 절감을 통해 최대 4500억 달러의 가치를 창출할 것으로 예상된다. 이러한 에이전트를 개발하는 개발자들은 AI 에이전트 플랫폼과 피지컬 AI 시스템을 개선하기 위해 성능이 더 우수한 추론 모델을 활용하고 있다.
업계 선도 기업들은 AI 에이전트와 휴머노이드 로봇을 통해 생산성을 높이는 데 엔비디아의 확장된 모델 제품군을 활용하고 있다. 크라우드스트라이크, 우버, 마그나, 넷앱, 줌이 그 대표적인 기업들이다.
새로운 엔비디아 네모트론 나노 2와 라마 네모트론 슈퍼 1.5 모델은 과학적 추론, 수학, 코딩, 툴 호출, 명령어 준수, 채팅 분야에서 해당 크기 범주 내 최고 정확도를 제공한다. 이 새로운 모델은 AI 에이전트가 더 깊이 생각하고 효율적으로 작업할 수 있도록 지원한다. 이를 통해 더 폭넓은 옵션을 탐색하고, 연구 속도를 높이며, 설정된 시간 내에서 더 우수한 결과를 제공한다.
모델은 AI 에이전트의 두뇌와 같다. 핵심 지능을 제공하는 것이다. 그러나 이 두뇌가 비즈니스에 유용하려면 특정 워크플로우뿐 아니라 산업과 비즈니스 용어를 파악하고 안전하게 작동하는 에이전트에 탑재돼야 한다. 엔비디아는 선도적인 라이브러리와 AI 블루프린트를 제공해 기업이 AI 에이전트를 대규모로 도입하고 맞춤화하며 관리할 수 있도록 지원한다.
코스모스 리즌은 피지컬 AI 애플리케이션을 위해 개발된 새로운 추론 비전 언어 모델(VLM)이다. 이는 구조화된 추론을 통해 물리학, 객체 영속성, 시공간 정렬과 같은 개념을 이해하는 데 탁월하다.
코스모스 리즌은 로봇 비전언어행동(VLA) 모델의 추론 기반 구조로 설계됐으며, 로보틱스와 자율주행 차량을 위한 훈련 데이터의 평가와 캡션 생성에 활용된다. 또한 공장이나 도시와 같은 환경에서 물리적 작업에 대한 시공간 이해와 추론 능력을 런타임 시각 AI 에이전트에 제공한다.
기업들은 복잡한 다단계의 작업에 대응하기 위해 AI 에이전트를 개발하고 있다. 이에 따라 강력한 추론 정확도와 효율적인 토큰 생성을 제공하는 모델은 지능적이고 자율적인 의사결정을 대규모로 수행하고 있다.
엔비디아 네모트론은 선도적인 모델과 엔비디아가 선별한 오픈 데이터세트 그리고 첨단 AI 기술을 활용해 AI 에이전트에 정확하고 효율적인 출발점을 제공하는 고급 오픈 추론 모델 제품군이다.
최신 네모트론 모델은 세 가지 방식으로 업계 최고의 효율성을 제공한다. 새로운 하이브리드 모델 아키텍처, 소형 양자화 모델 그리고 토큰 생성 과정을 개발자가 제어할 수 있는 구성 가능한 사고 예산(thinking budget)이다. 이를 통해 추론 비용을 약 60% 절감할 수 있다. 이 조합은 모델이 더 깊이 추론하고 더 빠르게 응답할 수 있도록 하며, 추가적인 시간이나 컴퓨팅 파워를 요구하지 않는다. 즉, 더 낮은 비용으로 더 나은 결과를 제공하는 것이다.
네모트론 나노 2는 동급의 다른 주요 모델 대비 최대 6배 높은 토큰 생성 성능을 제공한다.
라마 네모트론 슈퍼 1.5는 동급 최고 성능과 가장 높은 추론 정확도를 달성해, AI 에이전트가 더 뛰어난 추론을 수행하고, 더 현명한 결정을 내리며, 복잡한 작업을 독립적으로 처리할 수 있도록 한다. 현재 NVFP4(4비트 부동소수점) 버전으로 제공되며, 엔비디아 B200 GPU에서 엔비디아 H100 GPU 대비 최대 6배 높은 처리량을 제공한다.
그래도 삭제하시겠습니까?