오픈AI, 이미지 생성 모델 'ChatGPT Images 2.0' 공개… 출시 12시간 만에 글로벌 1위
오픈AI(OpenAI)가 4월 21일 차세대 이미지 생성 모델 'ChatGPT Images 2.0'을 공개했다. 공개 직후 반응은 폭발적이었다. 출시 12시간 만에 글로벌 이미지 모델 평가 지표인 이미지 아레나(Image Arena) 리더보드 전 카테고리에서 1위를 기록했으며, 2위 모델과의 격차는 242점으로 해당 리더보드 역사상 가장 큰 점수 차이였다. 직전까지 1위를 지키던 구글 제미나이(Google Gemini) 모델을 단숨에 2위로 밀어냈다.
역대 최대 격차로 리더보드 압도
"이미지 생성의 시대가 바뀌었다"
오픈AI(OpenAI)가 4월 21일 차세대 이미지 생성 모델 'ChatGPT Images 2.0'을 공개했다. 공개 직후 반응은 폭발적이었다. 출시 12시간 만에 글로벌 이미지 모델 평가 지표인 이미지 아레나(Image Arena) 리더보드 전 카테고리에서 1위를 기록했으며, 2위 모델과의 격차는 242점으로 해당 리더보드 역사상 가장 큰 점수 차이였다. 직전까지 1위를 지키던 구글 제미나이(Google Gemini) 모델을 단숨에 2위로 밀어냈다.
업계의 평가는 단순한 업그레이드를 넘어 '리셋'에 가깝다. 기존 AI 이미지 생성 모델들이 멕시코 음식 메뉴를 만들면 존재하지 않는 음식 이름을 만들어냈던 것과 달리, ChatGPT Images 2.0은 즉시 식당에서 사용할 수 있는 수준의 메뉴를 생성한다는 평가를 받고 있다.
가장 큰 변화는 '생각하는(Thinking)' 이미지 모델의 등장이다. 챗GPT에서 추론 모델 또는 프로(Pro) 모델을 선택하면 Images 2.0이 웹을 검색해 최신 정보를 반영하고, 하나의 프롬프트로 최대 8개의 이미지를 한 번에 생성하며, 결과물을 스스로 검토하고 수정하는 방식으로 작동한다. 만화 시리즈 페이지, 방별 인테리어 리디자인 세트, 다양한 비율의 소셜미디어 콘텐츠 묶음 등 기존에는 번거롭던 작업을 한 번에 처리할 수 있다.

정밀도도 크게 높아졌다. 작은 텍스트, 아이콘, UI 요소, 복잡한 구성 등 기존 이미지 모델이 취약했던 세부 표현에서 뚜렷한 개선이 이뤄졌으며, API에서는 최대 2K 해상도 출력을 지원한다. 가로 3:1에서 세로 1:3까지 다양한 화면 비율도 지원해 배너·포스터·모바일 화면·소셜 그래픽 등 용도에 맞는 결과물을 바로 사용할 수 있다.
다국어 지원도 강화됐다. 기존 모델이 영어와 라틴 문자 중심이었던 것과 달리 Images 2.0은 일본어·한국어·중국어·힌디어·벵골어 등 비라틴 문자 텍스트의 렌더링 정확도를 대폭 높였다. 언어가 디자인의 일부로 기능하는 포스터·만화·도해 등도 자연스럽게 만들어낼 수 있다.

한편 기존 모델인 달리(DALL-E) 2와 달리 3는 오는 5월 12일 공식 서비스를 종료하며, ChatGPT Images 2.0이 챗GPT와 오픈AI API 전반의 기본 이미지 모델로 대체된다. 달리 3 API를 사용 중인 개발자는 5월 12일 이전까지 gpt-image-2로 마이그레이션을 완료해야 한다.
챗GPT 플러스(Plus)·프로(Pro)·비즈니스(Business) 구독자는 추론 기반 고급 출력 기능을 포함한 전체 기능을 이용할 수 있으며, 무료 사용자도 기본 이미지 생성 기능은 즉시 사용 가능하다. 캔바(Canva), 어도비(Adobe), 피그마(Figma) 등 주요 파트너사들은 이미 실제 업무 워크플로에 gpt-image-2를 적용하고 있다.