구글이 새로운 AI 모델 ‘제미나이 2.0’을 출시했습니다. 텍스트, 이미지, 영상 등 다양한 형태의 데이터를 처리할 수 있는 멀티모달 기능을 갖췄으며 AI 에이전트 시대를 대비하기 위해 최적화되었습니다.
이번 발표에는 유니버설 AI 어시스턴트의 미래를 탐구하는 프로토타입인 **‘프로젝트 아스트라(Project Astra)’**의 업데이트, 브라우저에서 시작해 인간과 에이전트간 상호 작용을 탐구하는 새로운 ‘프로젝트 마리너(Project Mariner)’, 개발자를 지원하는 AI 기반 코드 에이전트인 ‘줄스(Jules)’가 포함됐습니다.
프로젝트 아스트라는 제미나이 2.0 기반의 AI 어시스턴트로 다양한 언어와 억양을 이해하며 구글 검색, 렌즈, 맵스를 활용해 유용한 도움을 주고, 대화 내용을 기억해 개인화된 경험을 제공하며, 빠른 응답 속도를 자랑합니다. 이 기능은 구글 제품과 안경 등 다양한 폼 팩터에 도입될 예정으로 테스트 프로그램도 확대될 계획입니다.
프로젝트 마리너는 제미나이 2.0 기반의 초기 연구 프로토타입으로 브라우저 내에서 픽셀, 텍스트, 코드, 이미지, 양식 등 웹 요소를 이해하고 활용하여 작업을 완료하는 에이전트입니다. WebVoyager 벤치마크에서 높은 성능을 보였으며, 구글은 이를 안전하게 구축하기 위해 다양한 연구를 진행 중입니다. 현재 실험적인 크롬 확장 프로그램으로 테스트 중입니다.
새로운 AI 기반 코드 에이전트 ‘줄스’는 개발자 워크플로우에 통합되어 Python과 Javascript 코딩 작업을 대행합니다. 줄스는 비동기적으로 작동하며 버그 수정 등 시간 소모적인 작업을 처리해 개발자들이 실제로 구축하고자 하는 것에 집중할 수 있게 합니다. 줄스는 다단계 계획을 수립하고, 여러 파일을 효율적으로 수정하며, 버그 수정 내용을 직접 GitHub에 푸시합니다.
또한 구글 딥마인드는 제미나이 2.0을 사용해 비디오 게임의 가상 세계 탐색을 지원하는 AI 에이전트를 구축했습니다. 이 에이전트는 화면의 동작을 기반으로 게임에 대해 추론하고, 실시간 대화를 통해 다음에 해야 할 일을 제안합니다. 구글은 슈퍼셀과 협력해 다양한 게임에서 에이전트의 규칙과 과제 해석 능력을 테스트 중입니다.
구글은 제미나이 2.0을 통해 AI 검색 기능과 비서를 더 많은 국가와 언어로 확장할 계획입니다. 구글 CEO 순다르 피차이는 “멀티모달 기술의 발전이 구글의 보편적인 비서 구현에 한 걸음이 될 것”이라고 밝혔습니다1. 이제 제미나이 2.0은 웹 애플리케이션에서 사용할 수 있으며, 앞으로 더 많은 구글 플랫폼과 제품에 적용될 예정입니다.