오픈AI·MS “中 AI 딥시크 조사…데이터 무단 수집 가능성” 딥시크측 “‘증류’ 기술 사용했지만 자체 모델에 기반한 것”
챗GPT 개발사 오픈AI와 마이크로소프트(MS)가 중국 인공지능(AI) 스타트업 딥시크가 AI 모델 훈련을 위해 오픈AI 데이터를 무단으로 수집했는지 여부에 대한 조사에 착수했다. 딥시크는 오픈AI보다 훨씬 낮은 비용으로 챗GPT에 맞먹는 성능의 AI 모델을 선보이며 미국 테크 업계에 충격을 줬다. 이런 일은 오픈AI의 데이터를 도용해 가능했을 것이라는 의혹이 제기돼 왔다.
블룸버그 통신과 월스트리트저널(WSJ) 등은 오픈AI의 데이터가 딥시크와 관련된 그룹에 의해 허가 없이 무단으로 획득됐는지에 대해 오픈AI와 MS가 조사하고 있다고 소식통을 인용해 29일(현지시간) 보도했다.
27일 베이징의 한 유저가 휴대폰에 설치된 딥시크 앱을 실행하고 있다. 연합뉴스
오픈AI는 “중국에 기반을 둔 기관들이 자사의 AI 도구에서 대량의 데이터를 빼내려고 하는 여러 시도를 목격했다”며 “이는 ‘증류’(distillation)라고 불리는 기술적 과정을 통해 자체 모델을 훈련하기 위한 것으로 보인다”고 설명했다. ‘증류’는 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 사용, 유사한 기능을 개발하는 것을 의미한다.
MS 보안 연구원들도 지난해 가을 딥시크와 관련 있을 것으로 보이는 사람들이 오픈AI 애플리케이션 프로그래밍 인터페이스(API)를 사용해 대량의 데이터를 빼돌리는 것을 관찰했다고 말했다. API는 소프트웨어 개발자들이 AI 기능을 자신들의 프로그램이나 앱에 넣을 수 있게 해주는 도구다. 이를 사용하기 위해서는 허가를 받아야 한다.
오픈AI는 “적과 경쟁자가 가장 강력한 미국 기술을 탈취하려는 노력을 막기 위해 미국 정부와 긴밀히 협력하는 것이 매우 중요하다”며 “중국 기반 기업들이 주요 미국 AI 기업의 모델을 지속적으로 증류하려고 노력하고 있다”고 전했다.
딥시크와 오픈AI CI. 연합뉴스
딥시크측은 ‘증류’ 기술을 사용했지만 자체 모델에 기반 한 것이라고 주장하고 있다.
십시크의 최근 연구 논문에서 ‘증류’를 사용해 가장 강력한 모델인 R1에서 가져온 결과물로 유사한 추론 능력을 보이는 더 작은 모델들을 훈련시켰다는 것이다.
도널드 트럼프 행정부의 AI·가상화폐 정책을 총괄하는 차르로 임명된 데이비드 색스는 폭스뉴스와 인터뷰에서 딥시크가 오픈AI의 독점 모델을 이용해 기술을 개발했다는 “상당한 증거가 있다”며 미국에서 지식 재산을 훔쳤는지 묻는 말에 “가능하다”고 말했다. 한편 미국 도널드 트럼프 행정부가 인공지능(AI) 칩 선두 주자 엔비디아의 대중국 수출에 추가 제재를 검토하고 있는 것으로 전해졌다.
지난 28일 중국 수도 베이징의 한 사용자 휴대전화 화면에 딥시크(DeepSeek)와 챗GPT(ChatGPT)의 애플리케이션이 보이고 있다. AP뉴시스
블룸버그통신은 이날 복수의 익명 소식통을 인용해 아직 정부 출범 초기인 만큼 논의가 매우 초기 단계라면서도 엔비디아의 H20 칩 제품으로 수출 통제 범위가 확대될 가능성을 전했다.
H20은 엔비디아가 미국 정부의 기존 대중국 수출 통제에 따라 저사양으로 출시한 제품이다.
소식통들은 전임 조 바이든 행정부 때도 H20을 수출 통제 대상에 포함하는 방안이 거론됐지만 현실화하지 않았다면서, 트럼프 행정부가 이제 막 유관부서의 인원 확충을 시작한 만큼 규제가 나오려면 시간이 걸릴 것으로 예상했다. 김기환 기자 kkh@segye.com
<본 콘텐츠의 저작권 및 법적 책임은 세계일보(www.segye.com)에 있으며, 뽐뿌는 제휴를 통해 제공하고 있습니다.>
中 딥시크의 성공 비결, 오픈AI 데이터 무단도용?… 칼 빼든 오픈AI·MS
오픈AI·MS “中 AI 딥시크 조사…데이터 무단 수집 가능성”딥시크측 “‘증류’ 기술 사용했지만 자체 모델에 기반한 것”챗GPT 개발사 오픈AI와 마이크로소프트(MS)가 중국 인공지능(AI) 스타트업 딥시크가 AI 모델 훈련을 위해 오픈AI 데이터를 무단으로 수집했는지 여부에 대한...