본문 바로가기

AI 소식/유용한 AI 도구

Gemini 2.5 Flash Image (nano-banana)|구글 최신 이미지 생성 모델 특징과 성능

안녕하세요,

최근 업계와 커뮤니티에서 ‘nano-banana’라는 이름으로 불리며 뛰어난 성능으로 큰 화제를 모았던 이미지 생성 모델이 드디어 정식으로 공개되었습니다. 바로 구글이 개발한 최신 이미지 생성·편집 모델, Gemini 2.5 Flash Image입니다. 이 모델은 이전 세대인 Gemini 2.0 Flash를 기반으로 기술을 한층 고도화하여, 이미지 품질과 창작 과정에서의 제어력을 크게 향상시킨 것이 특징입니다. 특히 캐릭터 일관성, 세밀한 편집, 창의적인 스타일링 등 다양한 이미지 작업에서 탁월한 결과를 보여주며, 공개 직후부터 큰 주목을 받고 있습니다.

이번 글에서는 Gemini 2.5 Flash Image의 주요 특징과 함께, 누구나 손쉽게 체험할 수 있는 플랫폼을 간단히 소개해 드리겠습니다.


반응형

Gemini 2.5 Flash Image (aka nano-banana) 란

2025년 8월 26일, 구글은 Gemini 2.5 Flash Image(별칭 nano-banana)를 공식 발표했습니다. 이 모델은 기존 Gemini 2.0 Flash를 기반으로 기술을 한층 고도화하여, 이미지 품질은 물론 창작 과정에서의 활용성과 제어력을 크게 향상시킨 최신 이미지 생성·편집 모델입니다.

Gemini 2.5 Flash Image는 LMArena에서 ‘nano-banana’라는 이름으로 처음 등장해 공개 직후 1위를 차지하며 큰 화제를 모았습니다. 탁월한 성능 덕분에 구글의 차세대 이미지 생성 모델이라는 소문이 빠르게 퍼졌지만, 그동안 공식적인 발표는 없었습니다. 이후 구글이 공식 블로그를 통해 이 모델을 정식으로 공개하면서 소문이 사실로 확인되었으며, 현재도 LMArena에서 1위를 유지하며 업계와 사용자들의 높은 관심을 받고 있습니다.

 

 

Introducing Gemini 2.5 Flash Image, our state-of-the-art image model- Google Developers Blog

Today, we’re excited to introduce Gemini 2.5 Flash Image (aka nano-banana), our state-of-the-art image generation and editing model. This update enables you to blend multiple images into a single image, maintain character consistency for rich storytellin

developers.googleblog.com

 

 

주요 특징

  1. 캐릭터 및 스타일 일관성 유지 : 한 사람 또는 특정 스타일의 캐릭터를 여러 장의 이미지에 걸쳐 동일하게 유지하면서, 다른 장면이나 포즈, 설정에 자연스럽게 배치할 수 있습니다.
  2. 자연어 기반 정밀 이미지 편집 : 프롬프트 한 줄로 이미지의 특정 부분만을 편집할 수 있습니다. 예를 들어 배경 흐리기, 티셔츠 얼룩 제거, 인물 삭제 또는 포즈 변경, 흑백 사진에 색 입히기 등이 가능합니다.
  3. 세계 지식 기반의 이해 : 단순한 미적 이미지 생성 수준을 넘어, Gemini의 ‘세계 지식’을 활용합니다. 손으로 그린 그림을 이해하고, 실제 개념을 설명하는 튜토리얼 이미지로 변환하거나 복잡한 편집 요청을 한 번에 처리할 수 있습니다.
  4. 다중 이미지 병합 (Multi-image Fusion) : 여러 입력 이미지를 하나의 장면으로 통합할 수 있습니다. 예컨대, 제품을 장면에 배치하거나 방의 스타일·색감 등을 통일된 하나의 사진으로 생성할 수 있습니다.
  5. 벤치마크 & 업계 평가 : LMArena에서 ‘nano-banana’라는 익명 이름으로 테스트되었으며, 경쟁 모델보다 뛰어난 성능을 기록했습니다. 자연어 기반 정밀 편집 능력과 형태 일관성 유지 능력에서 업계 최고 수준으로 평가받고 있습니다.
  6. 책임 있는 사용을 위한 워터마킹 : 모든 생성 또는 편집된 이미지는 눈에 띄지 않으면서도 식별 가능한 SynthID 워터마크를 포함해, 해당 콘텐츠의 AI 생성 여부를 확인할 수 있도록 설계되었습니다.

 

 

모델 성능

LMArena의 Text-to-Image Arena 순위표에 따르면, Gemini 2.5 Flash Image(별칭 nano-banana)는 총점 1147점으로 전체 1위를 기록했습니다. 총 220,674표를 얻으며 Imagen 4.0 Ultra(1135점), OpenAI GPT-Image 1(1129점) 등을 제치고 최상위 자리를 차지했습니다. 공개 이후 현재까지도 1위를 유지하고 있으며, Google의 최신 이미지 생성 모델로서 경쟁 우위를 확실히 보여주고 있습니다.

출처: LMArena (클릭시 페이지 이동)

 

이미지 편집 항목별 Elo 점수(아래 이미지)를 보면, Gemini 2.5 Flash Image는 전반적으로 경쟁 모델보다 우수한 성능을 보여주었습니다.

  • 종합 선호도에서는 사용자들의 선택에서 확실한 우위를 차지했습니다.
  • 캐릭터 생성에서는 표현의 일관성과 세밀함에서 강점을 드러냈습니다.
  • 창의성 부문에서는 독창적인 아이디어를 구현하는 능력이 돋보였습니다.
  • 인포그래픽 영역에서는 정보 전달력과 시각적 구성에서 높은 평가를 받았습니다.
  • 객체 및 환경 묘사에서는 복잡한 배경과 다양한 요소를 안정적으로 표현하는 능력이 우수했습니다.
  • 스타일화의 경우 GPT Image 1 모델에는 다소 뒤처졌지만, 그 외 다른 모델들과 비교했을 때는 더욱 정교하게 특정 화풍이나 시각적 스타일을 구현하는 결과를 보여주었습니다.

출처: 구글 공식 블로그 (클릭시 이미지 확대)

 

 

사용 가능한 플랫폼

현재 공식적으로 Gemini 2.5 Flash Image를 활용할 수 있는 주요 플랫폼은 다음과 같습니다.

 

🔹 Gemini API

🔹 Google AI Studio

🔹 Vertex AI (Google Cloud)

 

 

사용 테스트

Google AI Studio를 통해 Gemini 2.5 Flash Image 모델을 직접 사용해 보았습니다. 실제 사용 과정에서 가장 인상적이었던 점은 자연어 지시만으로도 이미지 수정이 매우 정교하고 매끄럽게 이루어진다는 점이었습니다. 복잡한 편집 툴을 다루지 않아도 간단한 문장 입력만으로 원하는 결과를 얻을 수 있었으며, 특히 인물의 세부적인 요소나 색상 변경과 같은 작업에서 뛰어난 성능을 보여주었습니다.

 

테스트한 프롬프트는 다음과 같습니다.

  • 사용 프롬프트 : 마스크를 벗은 모습, 흰옷을 빨간옷으로 수정

(좌) 수정 전 이미지 / (우) 수정 후 이미지

 

해당 요청을 입력하자 약 37초 만에 수정된 이미지가 생성되었습니다. 모델은 마스크가 자연스럽게 제거된 얼굴을 표현했으며, 의상은 일부만 흰색에서 붉은색으로 변경되었습니다. 결과물은 원본의 자연스러움을 유지하면서도 편집된 요소가 어색하지 않게 조화를 이루었고, 실제 편집자가 손본 듯한 높은 완성도를 보여주었습니다.

 


 

Gemini 2.5 Flash Image는 기대 이상으로 뛰어난 성능을 보여주는 모델입니다. 자연어를 정확히 이해해 요청한 부분만 정교하게 수정하고 나머지는 그대로 유지하는 능력이 돋보이며, 이미지 생성 속도 또한 매우 빠릅니다. 다만 일부 상황에서는 요청을 완전히 반영하지 못하는 한계도 있었지만, 전반적으로 높은 완성도와 효율성을 갖춘 차세대 이미지 생성·편집 도구라고 평가할 수 있습니다.

 

향후 Gemini 플랫폼을 통해서도 이 모델이 제공될 가능성이 있으며, 이미 일부 사용자들 사이에서는 해당 플랫폼에서 활용할 수 있다는 이야기도 전해지고 있습니다. 미리 체험해 보고 싶으신 분들은 위에서 소개해 드린 플랫폼을 통해 직접 사용해 보시기를 권장합니다.

 

읽어주셔서 감사합니다. 😊

 

반응형