오픈AI가 21일(현지시간) 챗GPT 이미지 2.0을 공개했다. 이 모델은 실무에서 활용 가능한 AI 이미지 생성 모델로, 작은 텍스트부터 복잡한 레이아웃까지 정밀하게 구현할 수 있다. 또한 영어뿐 아니라 한국어 등 다국어 텍스트 구현 정확도가 대폭 개선되었다.
오픈AI의 이미지 생성 모델은 구글의 독주를 깨고 시장 판도를 변화시킬 수 있는 가능성이 있으며, 이번 업데이트로 업무용 시장에서도 챗GPT 이미지의 채택률이 늘어날 것으로 전망된다. 2.0 모델은 사용자의 세부 지시를 정밀하게 반영하여 기존보다 더 활용도 높은 결과물을 제공한다.
이 모델은 이미지 내 사물 위치와 관계를 정교하게 구성하고 작은 글자, 아이콘, 사용자 환경(UI) 요소, 촘촘한 레이아웃, 스타일 제약 등 고난도 영역에서 향상된 결과를 제공한다. 또한 최대 3대 1~1대3의 화면 비율을 지원하고 사진, 만화, 영화 등 여러 스타일을 정밀하게 재현하여 활용범위를 넓혔다.
다국어 성능도 강화되었는데, 챗GPT 이미지 2.0은 한국어, 일본어, 중국어, 힌디어, 벵골어 등 다양한 언어에서 텍스트 렌더링 품질을 개선했으며, 최대 10개 이미지를 한 번에 생성할 수 있다. 또한 한글 맞춤법의 정확성과 레이아웃, 구성 등이 개선되어 사용자들이 보다 정확하고 만족스러운 결과물을 얻을 수 있다.
오픈AI는 챗GPT 이미지 2.0을 기반으로 기획서, 마케팅 소재, 교육 자료, 인포그래픽, 소셜 콘텐츠 등을 쉽게 생성할 수 있다고 강조했다. 이 모델은 오픈AI 최초의 싱킹(사고) 기반 이미지 모델로, 검증된 결과물을 생성하는 과정으로 이어질 수 있다. 이 모델은 챗GPT와 코덱스에서 사용 가능하며, 챗GPT 이미지 싱킹 기반 고급 출력 기능은 챗GPT 플러스 이상 사용자에게 제공된다.
AI 이미지 생성 시장 내 경쟁은 심화되고 있는 가운데, 구글뿐만 아니라 감마, 캔바 등 AI 디자인 특화 서비스도 계속해서 업데이트되고 있으며, 어도비 역시 마케팅용 AI 에이전트를 공개하여 생성형 AI 서비스와 정면승부를 예고하고 있다.