뉴스, 서비스

ChatGPT Image 2.0 공개

26. 04. 22.

ChatGPT Images 2.0은 오픈AI가 공개한 새 이미지 생성 모델입니다. 오픈AI는 이 모델을 단순한 이미지 렌더링 도구가 아니라, 복잡한 시각 작업을 바로 실무에 쓸 수 있는 수준으로 끌어올린 모델로 소개했습니다. 공식 발표 기준으로 오늘부터 ChatGPT, Codex, API에서 사용할 수 있습니다.

핵심 변화는 정밀도입니다. 오픈AI는 이 모델이 복잡한 지시를 더 잘 따르고, 객체의 위치와 관계를 더 정확하게 배치하며, 작은 글자와 아이콘, UI 요소, 복잡한 화면 구성도 더 안정적으로 표현한다고 설명했습니다. 다양한 화면 비율을 지원하는 점도 함께 강조했습니다.

언어 처리도 강화됐습니다. 영어뿐 아니라 일본어, 한국어, 중국어, 힌디어, 벵골어 같은 비라틴 문자 기반 언어에서도 텍스트 렌더링 정확도가 높아졌다고 밝혔습니다. 포스터, 다이어그램, 만화처럼 텍스트 자체가 디자인 일부가 되는 작업을 더 자연스럽게 만들 수 있다는 설명입니다.

스타일 표현 범위도 넓어졌습니다. 사진, 시네마틱 스틸, 픽셀아트, 만화 같은 여러 시각 언어를 더 높은 일관성으로 다룰 수 있고, 질감·조명·구도·세부 표현의 완성도도 개선됐다고 했습니다. 그래서 게임 프로토타입, 스토리보드, 마케팅 크리에이티브, 특정 장르의 비주얼 제작에 유용하다고 소개했습니다.

이번 버전에서 가장 큰 차이점 중 하나는 생각 기능이 붙었다는 점입니다. 오픈AI는 Images 2.0이 자사 첫 “thinking” 이미지 모델이라고 설명했습니다. Thinking 또는 Pro 모델을 선택하면 웹 검색을 활용해 최신 정보를 반영하고, 한 번에 여러 이미지를 만들고, 결과를 다시 점검하는 방식으로 더 복잡한 작업을 수행할 수 있습니다.

출력 활용성도 넓혔습니다. 3:1부터 1:3까지 다양한 비율을 지원해 배너, 슬라이드, 포스터, 모바일 화면, 북마크, 소셜 이미지 같은 형식에 맞춰 만들 수 있습니다. API에서는 최대 2K 해상도 출력도 지원합니다.

오픈AI는 이 모델을 정보 시각화와 실무 제작에도 맞추고 있습니다. 설명형 그래픽, 교육용 자료, 시각 요약물처럼 정확성과 구조가 중요한 작업에서 더 잘 작동하도록 설계했다고 밝혔습니다. Codex 안에서도 이미지 생성 기능을 쓸 수 있고, API에서는 gpt-image-2 모델로 제품에 통합할 수 있습니다.

다만 한계도 남아 있습니다. 오픈AI는 종이접기 가이드, 루빅스 큐브 같은 퍼즐, 숨겨진 면이나 기울어진 면의 정확한 디테일, 아주 촘촘하고 반복적인 패턴, 정밀한 화살표와 라벨이 필요한 도표에서는 아직 오류가 생길 수 있다고 적었습니다.