본문 바로가기

FINANCE SCOPE

구독하기
인공지능

오픈AI, 이미지 생성 신모델로 블라인드 평가 1위 탈환…구글과 업계 격전 가속화

윤영훈 기자

입력 2025.12.17 08:23

숏컷

X

구글 이마젠3 제치고 정상 등극, 어도비도 동영상 편집 기능 강화

사진=Gemini

오픈AI(OpenAI)가 인공지능(AI) 이미지 제작 및 수정 프로그램 'DALL-E 3.5' 버전을 16일(현지시간) 공개했다.

이번 발표는 구글이 유사한 기능의 이미지 제작 프로그램 '이마젠3'를 선보인 지 26일 만에 이뤄졌다. 개선된 프로그램의 핵심은 기존 이미지를 수정할 때 텍스트 지시를 통해 세밀한 부분까지 유지하며 정교하게 조정할 수 있다는 점이다.

구체적으로 한 인물이 나오는 사진을 만든 뒤 전체 구도는 그대로 둔 채 의상과 모자 색상만 변경하거나 그림 내 특정 문구만 교체하는 작업이 가능해졌다. 사진 속 인물을 캐릭터처럼 활용해 포스터 같은 새로운 창작물을 제작하는 것도 지원한다.

오픈AI 측은 과거 버전에서 '가로 6칸, 세로 6줄 표 그리기' 같은 지시를 제대로 이행하지 못해 표 일부가 누락되는 경우가 있었으나, 신규 버전은 사용자 요구를 훨씬 정확하게 반영한다고 설명했다.

이마젠3의 강점으로 평가받았던 텍스트 표현 능력도 보강해 문자가 들어간 이미지를 자연스럽게 생성할 수 있게 됐다. 이를 통해 사진이나 그림은 물론 실용적인 인포그래픽까지 제작 가능하다는 것이 회사 측 설명이다.

다수 이용자가 정보가림 방식으로 선호 모델을 고르는 'LM아레나 리더보드'에서 DALL-E 3.5는 발표 당일 기존 선두였던 구글 이마젠3를 제치고 최상위에 올랐다.

오픈AI는 이 프로그램을 당일부터 전 세계 전체 이용자에게 순차적으로 제공하기 시작했다. 챗GPT(ChatGPT) 화면 왼편에 '이미지' 탭을 신설해 과거 생성한 이미지를 한곳에서 확인할 수 있도록 사용 편의성도 높였다.

샘 올트먼 오픈AI 최고경영자(CEO)는 구글이 지난달 AI 모델 '제미나이 2.0 프로'와 이미지 프로그램 이마젠3를 발표하자 사내에 긴급 경보 체제를 가동하고, 직원들에게 다른 업무를 제쳐두고 챗GPT 신규 모델 및 이미지 도구 개선에 총력을 기울이라고 지시한 것으로 전해졌다.

오픈AI는 11일 GPT-4o를 공개한 데 이어 이날 DALL-E 3.5를 내놓았지만 아직 긴급 체제를 해제하지 않은 것으로 알려졌다. 올트먼 CEO는 내년 1월 초 추가 AI 모델 업데이트를 선보인 뒤 경보를 풀 계획이라고 최근 언론에 밝혔다.

같은 날 어도비(Adobe)도 이미지 생성 프로그램 '파이어플라이(Firefly)'에 AI 기업 토파즈랩스의 '아스트라' 모델을 적용했다고 발표했다. 이를 통해 AI 영상을 생성하고 텍스트 지시로 일관성을 지키면서 세밀하게 수정하는 기능을 출시했다.


윤영훈 기자 jihyunengen@finance-scope.com

섹터 VIEW