지난해 3월 설립된 중국 스타트업, 동영상 생성 AI ‘비두’ 선보여
미국 오픈AI ‘소라’의 대항마…중국은 첨단 AI칩 수입 규제받아
중국 스타트업의 동영상 생성 인공지능 ‘Vidu’가 만든 판다 이미지. 발가락 숫자가 5개보다 많다.
중국 중앙(CC)TV는 29일 중국 스타트업 ‘셍슈 테크놀로지’가 명문 칭화대와 공동 노력을 통해 문자를 영상으로 만들어내는 AI인 ‘비두’를 출시했다고 보도했다.
오픈AI의 소라가 60초의 동영상을 제작하는 데 비해 중국의 비두는 간단한 텍스트를 기반으로 1080p 해상도의 16초 이하 비디오를 생성할 수 있다.
셍슈 테크놀로지의 최고 과학자이자 칭화대 AI 연구소의 부원장이기도 한 주쥔은 베이징 중관춘 포럼에서 “비두는 자립적 혁신의 최신 성과이며 많은 분야에서 획기적인 발전을 이루었다”라고 말했다.
중국 스타트업의 동영상 생성 인공지능 ‘Vidu’가 만든 이미지. 중국 중앙(CC)TV 캡처
모델 공개 과정에서 셍슈 테크놀로지는 기타를 연주하는 판다와 수영장에서 수영하는 강아지 등 여러 데모 영상 클립을 공개했는데 생생한 디테일을 보여준다는 평가를 받았다.
하지만 인공지능이 손가락, 발가락 등 섬세한 이미지 생성에서 보이는 오류를 비두 역시 반복했다. 기타를 치는 판다의 발가락이 5개가 아니라 6~7개로 보인다고 중국 네티즌들은 지적했다. 게다가 판다의 앞발에는 발톱이 아예 없다.
그럼에도 지난 2월 오픈AI가 동영상 생성 인공지능 소라를 공개한 지 두 달여 만에 중국에서 비슷한 서비스를 내놓자 일각에서는 희망 섞인 전망을 내놓고 있다. 경쟁이 치열한 AI 시장에서 짧은 시간에 제품을 생산한 것은 고무적이란 평가다.
중국 스타트업의 동영상 생성 인공지능 ‘Vidu’가 만든 이미지.
예를 들어 소라가 1분짜리 동영상을 제작하려면 8개의 엔비디아 A100 그래픽 처리 장치(GPU)가 3시간 이상 돌아가야만 한다. 하지만 미국은 A100, H100 GPU 등 엔비디아 등이 생산하는 첨단 칩을 중국으로 수출하는 것을 금지했다. 엔비디아의 A100과 H100 GPU는 AI 시스템 훈련용 부품으로 인기가 높다.
중국 베이징에 본사를 둔 셍슈 테크놀로지는 2023년 3월에 설립되었으며 핵심 연구원은 칭화대 AI 연구소 및 알리바바, 텐센트, 바이트댄스 등에서 온 직원 80여명으로 구성됐다. 알리바바 역시 자체적으로 문자를 영상으로 생성하는 AI 모델을 개발 중이다.