뉴스, 서비스

이제 만화까지 그리는 ChatGPT 이미지 생성

25. 03. 26.

오픈AI가 챗GPT에 새로운 이미지 생성 기능을 도입하였습니다. 샘 알트만 오픈AI 최고경영자(CEO)는 화요일 라이브스트림을 통해 챗GPT의 이미지 생성 기능이 GPT-4o 모델을 활용하여 대폭 개선되었다고 발표하였습니다. 이제 이미지 내 글자 묘사, 만화, 투명 이미지 등이 가능해졌습니다.

GPT-4o는 기존의 DALL-E 모델을 대체하는 새로운 이미지 생성 기능을 제공하며 이미지 생성뿐만 아니라 편집도 가능합니다. 텍스트 삽입 기능이 향상되어 보다 정확한 문자를 포함한 이미지를 제작할 수 있습니다. 오픈AI에 따르면 새로운 모델은 공개적으로 이용 가능한 데이터와 셔터스톡과 같은 파트너사로부터 제공받은 데이터를 학습하여 개발되었습니다.

GPT-4o는 이미지 생성 과정에서 더 많은 연산을 수행해 기존 모델보다 더욱 정밀하고 사실적인 결과물을 만들어냅니다. 기존 모델에서는 구현할 수 없었던 사각형 바퀴를 가진 자전거와 같은 개념적 이미지도 생성할 수 있습니다. 사용자의 요청에 따라 이미지의 일부를 수정하거나 배경을 변경하는 등의 편집 기능도 제공합니다.

기존의 AI 이미지 생성 모델은 텍스트 삽입 시 정확도가 낮아 편집이 필요했지만 GPT-4o는 정확한 문자를 이미지에 삽입할 수 있어 추가적인 수정 없이 즉시 활용할 수 있습니다. 오픈AI가 공개한 예제에서는 스펙트럼 원리를 설명하는 다이어그램을 포함한 이미지가 생성되었으며 사용자가 시점과 배경을 변경해 요청하면 이에 맞춰 변형된 이미지가 제작되었습니다.

오픈AI의 연구 과학자인 가브리엘 고는 “이 모델은 교육 분야에서 혁신을 일으킬 가능성이 큽니다”라고 기대감을 드러냈습니다.

현재 ChatGPT에서 무료 및 유료 사용자 모두에게 제공되며, API를 통한 개발자 접근도 곧 가능해질 예정입니다. 다만, 크롭핑, 다국어 텍스트 렌더링, 고밀도 정보 표현 등 몇 가지 한계가 있으며, 안전을 위해 부적절한 콘텐츠 생성은 차단됩니다.