구글 제미나이 2.0, 네이티브 이미지 생성 기능으로 AI 경쟁 판도 바꾼다

구글이 멀티모달 모델 '제미나이'에 혁신적인 기능을 추가했습니다. 이제 별도의 이미지 생성 도구 없이도 제미나이가 직접 이미지를 생성할 수 있게 되었는데요. 이번에 공개된 '제미나이-2.0-플래시-exp(gemini-2.0-flash-exp)'는 대형언어모델(LLM)에 네이티브 이미지 생성 기능을 내장한 최초의 사례로 주목받고 있습니다.

제미나이, 이제 이미지도 직접 생성한다

구글 딥마인드는 3월 13일(현지시간) '제미나이 2.0 플래시'에 네이티브 이미지 생성 기능을 추가한 실험 버전을 공개했습니다. 이전까지는 '이매진 3(Imagen 3)'과 같은 별도의 이미지 생성 모델을 연결해야 했지만, 이제는 멀티모달 모델 안에 이미지 생성 기능이 직접 탑재된 것입니다.

제미나이 2.0 플래시는 지난해 12월 발표된 모델로, 텍스트와 코드, 이미지, 오디오, 비디오 등 다양한 콘텐츠 형식을 이해하고 처리할 수 있는 멀티모달 모델(LMM)입니다. 이번 업데이트로 사용자들은 별도의 이미지 생성 도구 없이 제미나이 2.0 플래시에서 직접 이미지를 생성할 수 있게 되었습니다.

기존 방식과의 차별점

이번 네이티브 이미지 생성 기능은 트랜스포머 구조인 대형언어모델(LLM)에 '확산 모델(Diffusion)'인 이미지 생성기를 통합한 기존 방식과는 완전히 다릅니다. 언어 생성과 이미지 생성이 하나의 LLM에 통합된 첫 사례로, 이는 AI 기술의 새로운 지평을 열었다고 볼 수 있습니다.

구글에 따르면 이러한 통합 방식은 여러 가지 장점을 가지고 있습니다:

일관성 있는 스토리텔링

제미나이 2.0 플래시의 강력한 언어 능력을 바탕으로 등장인물과 설정의 일관성을 유지하면서 삽화가 포함된 이야기를 생성할 수 있습니다. 이는 창작자들에게 새로운 도구가 될 수 있습니다.

맥락에 맞는 이미지 생성

이 모델은 자체적인 지식과 향상된 추론 능력을 활용하여 맥락에 완벽하게 맞는 이미지를 생성합니다. 예를 들어, 실제 재료와 요리 방법에 맞는 상세한 비주얼로 레시피를 생성하는 것이 가능합니다. 이는 기존 이미지 생성 모델이 맥락을 정확히 이해하지 못하는 한계를 극복한 것입니다.

멀티턴 대화를 통한 이미지 편집

사용자와 AI가 번갈아 대화하는 '멀티턴 대화' 기능을 통해 이미지를 자연스럽게 점진적으로 수정할 수 있습니다. 이는 마치 전문 디자이너와 소통하듯 이미지를 세부적으로 조정할 수 있게 해주는 기능입니다.

활용 방안과 접근성

이 혁신적인 모델은 '구글 AI 스튜디오'를 통해 개발자들에게 공개되었습니다. 또한 제미나이 API를 사용하여 자신의 애플리케이션에 이미지 생성 기능을 쉽게 통합할 수 있습니다.

구글은 이 기술의 활용 방안에 대해 "제미나이 2.0 플래시는 멀티모달 입력과 향상된 추론, 자연어 이해를 결합해 이미지를 생성한다"라며 "이를 AI 에이전트 구축에 활용할 수 있고, 그림으로 표현된 대화형 스토리 앱을 개발할 수 있으며, 채팅 내용에서 이미지를 생성하는 등 다양한 용도로 활용할 수 있다"라고 밝혔습니다.

사용자 반응과 전망

초기 사용자들의 반응은 매우 긍정적입니다. 특히 이미지를 다양한 각도와 효과로 변형하는 과정에서 보여준 뛰어난 일관성이 높은 평가를 받고 있습니다. 한 사용자는 이 기능을 경험한 후 "이건 넥스트 레벨"이라는 간결하지만 강렬한 평가를 남겼습니다.

이번 네이티브 이미지 생성 기능의 추가는 AI 기술의 진화 방향을 보여주는 중요한 이정표가 될 것으로 보입니다. 별도의 모델을 연결하는 방식에서 벗어나 하나의 통합된 모델에서 다양한 기능을 제공하는 방향으로 AI 기술이 발전하고 있음을 보여줍니다.

앞으로 구글이 이 기술을 더욱 발전시켜 어떤 혁신적인 서비스를 선보일지 기대됩니다. 멀티모달 AI의 발전은 우리가 컴퓨터와 상호작용하는 방식을 근본적으로 변화시킬 가능성이 높기 때문입니다. 제미나이의 네이티브 이미지 생성 기능은 그 첫 걸음에 불과할지도 모릅니다.

저작자표시 비영리 변경금지

'IT' 카테고리의 다른 글

AI 디지털 교과서 도입, 그 의미와 과제 (0)	2025.03.22
유발 하라리, AI의 위험성과 인류의 대응 방안 (0)	2025.03.21
노벨상 수상자 데미스 허사비스가 예측한 AI의 미래: 5~10년 내 인간 지능 수준 도달 가능 (0)	2025.03.21
한국, 글로벌 AI 혁신의 중심으로 부상하다 (0)	2025.03.20
스태빌리티 AI의 혁신: 2D 이미지를 3D 비디오로 바꾸는 스테이블 버추얼 카메라 (1)	2025.03.20

러닝포레스트

구글 제미나이 2.0, 네이티브 이미지 생성 기능으로 AI 경쟁 판도 바꾼다

구글 제미나이 2.0, 네이티브 이미지 생성 기능으로 AI 경쟁 판도 바꾼다

제미나이, 이제 이미지도 직접 생성한다