구글이 Google I/O 2026에서 새로운 생성형 AI 모델 제품군 ‘제미나이 옴니(Gemini Omni)’를 공개했습니다. 첫 모델은 ‘제미나이 옴니 플래시(Gemini Omni Flash)’입니다. 구글은 이 모델을 “어떤 입력값에서도 원하는 것을 만들 수 있는 모델”로 설명하며, 우선 영상 생성과 편집 기능부터 제공합니다.
제미나이 옴니는 텍스트, 이미지, 오디오, 영상 입력을 함께 사용할 수 있습니다. 사용자는 기존 영상을 올린 뒤 자연어로 장면을 바꾸거나, 배경을 수정하거나, 카메라 각도를 바꾸는 식으로 영상을 편집할 수 있습니다. 구글은 이전 요청의 맥락을 유지하면서 등장인물의 일관성, 물리적 자연스러움, 장면 흐름을 이어가는 것을 핵심 기능으로 소개했습니다.
기존 영상 생성 모델인 Veo가 주로 텍스트 기반 영상 생성에 가까웠다면, 옴니 플래시는 영상 자체를 입력으로 받아 새로운 영상을 만들 수 있다는 점이 다릅니다. The Verge에 따르면 옴니 플래시는 현재 오디오가 포함된 최대 10초 길이의 영상을 만들 수 있으며, 구글은 더 긴 영상 생성을 준비하고 있습니다.
구글은 제미나이 옴니를 ‘나노 바나나(Nano Banana)의 영상 버전’에 가깝게 배치하고 있습니다. 나노 바나나가 이미지 생성과 편집에서 제미나이의 멀티모달 능력을 보여줬다면, 옴니는 그 방향을 영상으로 확장합니다. 구글 딥마인드는 옴니가 물리, 역사, 과학, 문화적 맥락에 대한 제미나이의 지식을 활용해 장면을 구성한다고 설명했습니다.
출시 범위도 넓습니다. 제미나이 옴니 플래시는 제미나이 앱, 구글 플로우(Google Flow), 유튜브 쇼츠에 적용됩니다. 구글 AI Plus, Pro, Ultra 구독자는 제미나이 앱과 구글 플로우에서 사용할 수 있고, 유튜브 쇼츠와 유튜브 크리에이트 앱에서는 이번 주부터 무료로 제공될 예정입니다. 개발자와 기업 고객을 위한 API 제공도 예정돼 있습니다.
콘텐츠 신뢰성 장치도 함께 포함됩니다. 구글 딥마인드는 제미나이 옴니로 생성되거나 편집된 콘텐츠에 SynthID 디지털 워터마크와 C2PA 콘텐츠 자격 증명이 포함된다고 밝혔습니다. 사용자는 제미나이 앱에서 생성 여부를 확인할 수 있으며, 향후 크롬과 구글 검색에서도 검증 기능을 지원할 예정입니다.
더 보기 및 출처
https://blog.google/intl/ko-kr/company-news/technology/gemini-omni-kr