오픈AI, 딥시크의 데이터 도용 혐의 조사중

MS “허가 없이 오픈AI 모델 사용 흔적” 알려 트럼프 정부 AI 책임자 “상당한 증거 있다”

2025-01-29 정병일 기자

오픈AI와 마이크로소프트(MS)가 저비용·고성능 인공지능(AI) 모델을 발표한 중국 스타트업 딥시크에 대해 데이터 도용 혐의를 조사중이라고 블룸버그통신이 28일(현지시각) 보도했다.

오픈AI와 중국 딥시크의 로고(이미지=로이터, 연합뉴스)

오픈AI가 개발한 AI모델들을 허가 없이 이용하면서 데이터를 빼내가 자체 모델 개발에 썼다는 혐의다. 특히 이와 관련해 트럼프 신정부의 AI정책 책임자(czar)인 데이비드 삭스도 “상당한 증거가 있다”고 발언해 주목된다.

블룸버그는 MS의 보안 연구원들이 지난해 가을부터 오픈AI의 API(컴퓨터 프로그램 간의 통신을 돕는 소프트웨어)를 무단사용해 대량의 데이터를 빼내가는 딥시크 관계자를 관찰해왔다고 전했다.

오픈AI가 개발한 GPT 시리즈나 추론 모델들은 라이선스 비용을 내야 API를 사용할 수 있지만 딥시크 측은 이를 몰래 사용해 오픈AI의 데이터를 추출해간 것으로 MS 측은 보고 있다고 한다.

오픈AI는 기술파트너이자 최대 투자자인 MS로부터 이런 내용을 통보받고 조사에 착수했다고 블룸버그는 보도했다.

데이비드 삭스는 28일 폭스뉴스와의 인터뷰에서 한 AI 모델이 다른 모델의 출력을 이용해 비슷한 기능을 개발하는 훈련을 의미하는 ‘증류(distillation)’ 개념에 대해 설명했다. 그는 “딥시크가 오픈AI 모델에서 지식을 빼내갔다(증류했다)는 상당한(substantial) 증거가 있다”면서 “오픈AI는 별로 좋아하지 않을 것”이라고 말했다.

트럼프 정부의 AI분야 최고책임자 데이비드 삭스(사진=AFP, 연합뉴스)

이와 관련해 오픈AI는 대변인 명의의 성명을 통해 “우리는 중국 기반 기업이나 다른 기업들이 선도적인 미국 AI기업의 모델을 끊임없이 ‘증류’하려든다는 것을 알고 있다”고 밝혔다.

그러면서 “AI의 선도적 구축자로서 우리는 지적재산(IP) 보호를 위한 조치들을 취하고 있으며 첨단 기능을 모델에 포함할 지를 신중하게 결정하고 있다”고 강조했다.

또 “적대자와 경쟁자가 미국 기술을 차지하려는 시도로부터 가장 유능한 모델을 보호하기 위해 미국 정부와 긴밀히 협력하는 것이 매우 중요하다고 믿는다”고 밝혔다.