성능시험에서 챗GPT, 제미나이 앞서
"실수를 반성할 수 있는 능력 있다"
머스크 "세상에서 가장 똑똑한 AI"

18일 일론 머스크(맨 오른쪽)와 xAI 관계자들이 AI챗봇 '그록3'을 발표하고 있다. (사진=엑스의 xAI계정 라이브스트리밍 캡처)
18일 일론 머스크(맨 오른쪽)와 xAI 관계자들이 AI챗봇 '그록3'을 발표하고 있다. (사진=엑스의 xAI계정 라이브스트리밍 캡처)

일론 머스크가 소유한 스타트업 엑스에이아이(xAI)가 인공지능(AI) 챗봇인 '그록3'를 18일 발표했다.

xAI는 머스크가 참여한 가운데 이날 사회관계망서비스인 엑스(옛 트위터)로 생중계된 시연회에서 자사의 챗봇인 '그록'의 세번 째 모델 '그록3'와 '그록3-미니'를 베타 버전으로 소개했다.

xAI 관계자들은 '그록3'와 '그록3-미니'가 수학(AIME), 과학(GPQA), 코딩(LCB Oct-Feb) 등 여러 성능평가(벤치마크) 테스트에서 구글의 '제미나이' 시리즈, 오픈A의 '01-pro', 앤트로픽의 '클로드 3.5', 메타의 '라마3.1' 등 첨단 AI 챗봇들을 모두 앞질렀다고 주장했다. 

xAI가 공개한 '그록3'의 벤치마크 결과. 구글 제미나이나 오픈AI의 챗GPT를 모두 앞질렀다고 설명했다. (표= xAI의 라이브스트리밍에서 캡처)
xAI가 공개한 '그록3'의 벤치마크 결과. 구글 제미나이나 오픈AI의 챗GPT를 모두 앞질렀다고 설명했다. (표= xAI의 라이브스트리밍에서 캡처)

xAI는 이날 시연회에서 '그록3'에게 "지구에서 발사해 화성에 착륙한 다음 지구로 돌아오는 우주선의 궤적을 3D 애니메이션으로 만들 수 있는 코드를 생성하라"고 입력했고 모델은 즉각 "생각중(Thinking)..."이라며 장문의 코드를 줄줄이 생성해냈다.

머스크는 "그록3를 선보이게 돼 기쁘다"며 "매우 짧은 기간에 그록2보다 훨씬 더 유능해졌다"고 말했다. 앞서 그는 '그록3' 출시를 예고하면서 "세상에서 가장 똑똑한 AI"라거나 "무섭도록 똑똑하다"고 했다.

이날 시연회에서 그는 "우리의 목표는 우주의 본질을 이해하는 것"이라며 "그러자면 정치적으로 올바른 것과 상충되더라도 진실을 엄격하게 추구해야 한다"고 강조했다.

xAI 관계자들은 "추론모델은 문제를 해결하기 전에 생각하는데 상당한 시간이 걸리는 모델을 말한다"면서 "약 한 달 전에 그록3의 사전 훈련이 완료됐고 이후 추론 기능을 이 모델에 통합하기 위해 노력해왔다"고 전했다. 

그러면서 "오늘 시연하는 것은 그록3 추론 모델의 일부"며 "여전히 훈련되고 있기 때문에 엄청난 잠재력이 있다"고 설명했다. 이와 관련해 머스크는 이날 공개한 베타 버전에 대해 "더 세련된 버전을 찾고 있다면 일주일만 기다리라"고 말했다. 

그는 "오늘 (그록3이) 꽤 잘 작동하고 있지만 아직 다듬어야 할 부분이 있다"면서 "목표는 마치 사람과 대화하듯이 만드는 것"이라고 했다. 

일론 머스크(맨 오른쪽)가 "우리 목표는 우주를 이해하는 것"이라고 말하고 있다.(사진=xAI 엑스 계정 캡처)
일론 머스크(맨 오른쪽)가 "우리 목표는 우주를 이해하는 것"이라고 말하고 있다.(사진=xAI 엑스 계정 캡처)

머스크는 이와 함께 이 모델은 논리적 일관성을 위해 정보를 재분석하기 때문에 실수를 반성할 수 있는 능력이 있으며 추론 과정 일부를 '가리기' 때문에 '증류(모델 베끼기)'가 되지 않는다고 설명했다.

xAI는 '그록3'가 엔비디아의 고성능 GPU칩인 H100을 10만개 장착한 데이터센터(콜로서스)에서 합성데이터로 훈련됐으며 "앞으로 엔비디아가 출시할 예정인 B200칩도 추가해 더 빠른 성능과 스마트한 기능을 제공하게 될 것"이라고 밝혔다.

또 이날부터 엑스 프리미엄 플러스 사용자들이 사용할 수 있도록 출시했고 '슈퍼 그록'이라는 별도의 구독모델도 출시할 것이라고 발표했다. 

한편 미 CNBC 방송은 이 모델이 복잡한 추론 작업에서 '챗GPT'나 '제미나이' 같은 경쟁 모델을 능가한 것으로 나타났지만 이런 주장은 독립적인 평가가 아닌 내부 지표에 근거한 것이라는 전문가들의 지적을 전했다.

앞서 지난 12일엔 xAI의 인간데이터 팀에 6개월간 근무해오던 벤저민 드 크라커라는 엔지니어가 엑스에 코딩 부문에서는 '그록3'가 챗GPT와 o3-미니 등에 뒤진다고 본다는 글을 올렸다가 회사측이 삭제를 요구하자 거절하고 퇴사해 버린 일이 있었다.  

기사제보
저작권자 © 뉴스프리존 무단전재 및 재배포 금지
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
SNS 기사보내기
뉴스프리존을 응원해주세요.

여러분의 후원이 지속가능한 저널리즘을 만듭니다.

정기후원 하기