구글 딥마인드가 동영상 생성 인공지능(AI) 모델 ‘비오 2’를 공개했습니다. 이번 모델은 최대 4K 해상도로 2분 이상의 영상을 제작할 수 있으며 오픈AI의 ‘소라’에 비해 해상도와 지속 시간이 각각 4배, 6배 이상 높습니다.
비오 2는 텍스트 프롬프트나 이미지를 기반으로 동영상을 생성하며 물리적 움직임과 카메라 제어 능력이 크게 개선됐습니다. 가상 카메라를 세밀히 조작해 다양한 각도에서 객체와 사람을 인식할 수 있습니다. 유체 동역학과 빛의 특성 등 현실적인 물리적 재현 능력이 향상됐습니다. 영화적 기법과 미세한 인간 표정 구현도 가능합니다.
구글은 비오 2가 현실 세계의 물리적 법칙과 인간 움직임에 대한 이해에서 소라보다 우수하다고 강조했습니다. 자체 테스트 결과에서도 ‘프롬프트 준수’와 ‘전체 선호도’ 측면에서 경쟁 모델들보다 높은 평가를 받았습니다. 하지만 손가락 수 생성 등 일부 기술적 불안정성은 여전히 존재합니다.
비오 2는 현재 실험적 비디오 제작 도구인 ‘비디오FX’를 통해 일부 사용자에게 제공되며, 내년에는 개발자 플랫폼 ‘버텍스 AI’에 통합될 예정입니다. 구글은 다양한 피드백을 통해 모델을 개선해 나갈 계획입니다.