본문 바로가기

ComfyUI/이미지 생성 및 수정

[ComfyUI + Qwen-Image-Edit] AI 이미지 편집 가이드|빠르고 간편한 활용 방법

안녕하세요,

최근 알리바바 클라우드에서 공개한 Qwen-Image 계열 모델 중, 이미지 편집 기능에 최적화된 새로운 모델인 Qwen-Image-Edit가 발표되었습니다. 이 모델은 단순한 이미지 생성 기능을 넘어, 텍스트 수정, 객체 추가·삭제, 스타일 변경 등 정교한 편집 작업까지 지원하여 창의적인 활용도를 크게 확장해 주는 것이 특징입니다.

이번 포스팅에서는 Qwen-Image-Edit 모델의 주요 기능과 장점을 살펴보고, 로컬 환경에서 직접 실행하여 활용할 수 있는 방법까지 함께 소개해 드리겠습니다.


반응형

Qwen-Image-Edit 모델이란

Qwen-Image-Edit는 알리바바 클라우드에서 공개한 Qwen-Image 계열 모델의 확장판으로, 이미지 생성보다는 편집 기능에 집중하여 개발된 오픈소스 AI 모델입니다. 기존 Qwen-Image가 고품질 이미지 생성에 특화되어 있었다면, Qwen-Image-Edit는 기존 이미지를 보존하면서 텍스트나 객체를 자유롭게 수정·추가·삭제할 수 있다는 점에서 차별화됩니다. 특히 단순히 픽셀 단위의 편집이 아닌 의미 기반 제어를 지원하기 때문에, 사용자가 원하는 스타일이나 맥락을 자연스럽게 반영한 편집이 가능합니다.

 

 

Qwen-Image-Edit: Image Editing with Higher Quality and Efficiency

QWEN CHAT GITHUB HUGGING FACE MODELSCOPE DISCORD We are excited to introduce Qwen-Image-Edit, the image editing version of Qwen-Image. Built upon our 20B Qwen-Image model, Qwen-Image-Edit successfully extends Qwen-Image’s unique text rendering capabiliti

qwenlm.github.io

 

[모델 정보 요약]

구분 내용
모델명 Qwen-Image-Edit
개발사 Alibaba Cloud
출시일 2025년 8월 19일
주요 기능 정교한 텍스트 편집, 의미 기반 및 외관 편집, 객체 추가/삭제, 스타일 변환, 객체 회전 등
지원 해상도 3,072px (API 환경)
지원 언어 중국어, 영어
제한 사항 API 호출 시 이미지 해상도 및 크기(≤ 10MB) 제한
라이선스 Apache 2.0 (상업적 사용 가능)

 

 

주요 특징

Qwen-Image-Edit 모델의 주요 특징은 다음과 같습니다.

  • 텍스트 기반 편집 : 이미지 속 글자를 원래 폰트·스타일을 유지한 채 수정하거나 교체할 수 있으며, 영어와 중국어 모두 정밀하게 지원합니다.
  • 시맨틱 제어 : 단순한 색상 변경을 넘어, 객체의 회전·이동·대체, 스타일 전환 등 맥락에 맞는 의미 기반 편집을 수행합니다.
  • 원본 보존 편집 : 수정 대상 이외의 영역은 최대한 유지하면서 특정 요소만 정밀하게 추가·삭제할 수 있어 활용성이 높습니다.
  • 다양한 활용 가능성 : 광고 이미지 제작, 제품 사진 보정, 창작 일러스트 수정, 포토리얼 편집 등 실무와 창작 활동 모두에 유용하게 적용할 수 있습니다.

 

 

 

라이선스

Qwen-Image-Edit는 Apache 2.0 라이선스를 따르는 오픈소스 프로젝트입니다. 따라서 누구나 자유롭게 모델을 다운로드하여 사용할 수 있으며, 연구·개발 목적은 물론 상업적 활용까지 허용됩니다. 또한 필요에 따라 소스 코드를 수정하거나 재배포할 수 있는 권한이 보장되기 때문에, 개발자와 기업 모두가 유연하게 커스터마이징하여 다양한 응용 서비스에 적용할 수 있습니다.

 

 

사전준비사항

이 포스팅에서는 ComfyUI와 Qwen-Image 모델을 사용하여 이미지 생성 방법을 소개합니다. 본문을 따라 하기 전, ComfyUI를 미리 설치해 주시기 바랍니다. 이번 글에서는 Qwen-Image 모델을 중심으로 이미지 생성 과정을 단계별로 안내드립니다.

 

[Stabiliy Matrix&ComfyUI 설치하기] (포스팅에서 사용한 방식) - 추천

[로컬에 직접 ComfyUI 설치하기]

 


 

Qwen-Image-Edit 모델 사용하여 이미지 수정하기

로컬환경에서 ComfyUI에서 Qwen-Image-Edit 모델을 사용하여 이미지 생성하는 방법에 대해 알아보겠습니다.

 

1. 실행 환경

  • 운영체제 : Windows 11
  • ComfyUI : 0.3.52
  • ComfyUI-Manager : V3.30
  • Python : 3.10.11
  • torch : 2.8.0 + cu128
  • GPU : NVIDIA GeForce RTX 4060 Ti (vram : 16GB)

 

 

2. ComfyUI 사용 노드

이번 포스팅에서는 별도로 다운로드해야 할 커스텀 노드 없이 진행됩니다. 하지만 ComfyUI를 최신 버전으로 업데이트하는 것이 중요합니다. 최신 버전으로 업데이트하면 모델과의 호환성을 극대화할 수 있으며, 성능 개선 및 버그 수정을 통해 최적의 결과를 얻을 수 있습니다.

  • Stability Matrix를 사용하는 경우 → Stability Matrix 화면에서 "Update" 버튼을 클릭하여 간편하게 업데이트할 수 있습니다.
  • ComfyUI를 로컬에 설치한 경우ComfyUI-Manager에서 "Update ComfyUI" 버튼을 눌러 최신 버전으로 업데이트하세요.

(좌) Stability Matrix 화면 / (우) ComfyUI Manager 화면

 

 

3. Workflow 및 Qwen-Image-Edit 모델 다운로드

Qwen-Image-Edit 모델은 현재 허깅페이스를 통해 다양한 버전이 공개되어 있지만, 이번에는 ComfyUI에서 제공하는 모델을 사용하여 진행합니다. ComfyUI에서 제공하는 모델은 Qwen-Image-Edit 원본을 양자화하여, 로컬 환경에서 실행하기에 보다 적합하도록 최적화된 버전입니다.

 

1) 모델 파일 다운로드

ComfyUI에서 워크플로우 파일을 불러오면, 해당 모델을 자동으로 탐색하며, 로컬에 모델이 없는 경우 다운로드 링크를 안내해줍니다. 이 링크를 통해 손쉽게 필요한 모델 파일을 다운로드할 수 있습니다.

모델 다운로드 예시

 

모델 다운로드가 완료되면, 아래와 같이 지정된 폴더 구조에 맞게 파일을 이동해 줍니다.

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   └── qwen_image_edit_fp8_e4m3fn.safetensors
│   ├── 📂 loras/
│   │   └── Qwen-Image-Lightning-4steps-V1.0.safetensors
│   ├── 📂 vae/
│   │   └── qwen_image_vae.safetensors
│   └── 📂 text_encoders/
│       └── qwen_2.5_vl_7b_fp8_scaled.safetensors

 

모든 모델 파일을 다운로드하셨다면, 위와 같은 폴더 구조에 맞춰 각 파일을 옮겨줍니다. 만약 StabilityMatrix를 통해 ComfyUI를 실행 중이라면, [StabilityMatrix → Data → Packages] 경로 내부에서 ComfyUI 폴더 위치를 먼저 확인한 후, 동일하게 위 폴더 구조로 파일을 배치하시면 됩니다.

 

2) Workflow 다운로드

최신 ComfyUI에서는 웹 UI 내에서 워크플로우를 간편하게 불러올 수 있습니다.

  • ComfyUI를 실행
  • 왼쪽 탭에서 "Templates" 버튼 클릭
  • "Image" 항목에서 " Qwen Image Edit" 클릭

ComfyUI Workflow 불러오기

 

 

3) 이미지 수정

Qwen-Image-Edit 모델은 단순한 이미지 생성 기능을 넘어, 다양한 형태의 이미지 편집 작업을 지원합니다. 예를 들어, 이미지 속 인물이 다른 각도에서 바라보는 모습을 새롭게 만들어내거나, 배경을 전혀 다른 장면으로 교체하는 것은 물론, 텍스트를 교정·변경하는 세밀한 편집까지 수행할 수 있습니다. 이러한 기능을 통해 하나의 이미지를 여러 가지 버전으로 변형하거나, 원하는 목적에 맞게 자유롭게 수정할 수 있습니다.

 

아래에서는 실제 활용 사례를 중심으로 두 가지 방법을 통해 Qwen-Image-Edit 모델의 이미지 수정 결과를 확인해 보겠습니다.

 

[이미지 수정 결과 1 - 이미지 속 텍스트 수정]

첫 번째 실험에서는 이미지 속 텍스트를 직접 수정하는 과정을 진행하였습니다. 편집 작업에는 약 2분 30초의 시간이 소요되었으며, VRAM은 약 15.0GB 정도 사용되었습니다. 결과적으로 원본 이미지의 분위기와 스타일은 그대로 유지되면서도, 텍스트만 자연스럽게 교체된 결과를 얻을 수 있었습니다.

 

아래는 해당 결과를 얻기 위해 사용한 프롬프트입니다.

  • 사용 프롬프트 :
    Multiple rounds of editing: 
    Round 1: Change "ComfyUI News" to "Marcus' Story" 
    Round 2: Change "Qwen Image Edit is now available in ComfyUI" to "How to use Qwen Image Edit in local environment"

 

[생성 결과]

Qwen-Image-Edit 모델을 활용해 편집한 결과물은 원본 이미지의 전반적인 스타일과 분위기를 그대로 보존하면서도, 텍스트 부분만 자연스럽게 수정되었습니다. 텍스트는 기존 맥락을 크게 벗어나지 않으면서도 정확하게 변경되었으며, 글꼴과 배치 역시 어색하지 않게 유지되었습니다. 특히 편집 과정이 매우 빠르게 이루어져, 짧은 시간 안에 높은 완성도의 결과를 얻을 수 있었습니다.

 

아래는 수정되기 전/후 이미지입니다.

(좌) 수정 전 이미지 / (우) 수정 후 이미지

 

4) 이미지 수정 결과 2 - 이미지 속 인물 다른 배경으로 변환

이번 실험에서는 Qwen-Image-Edit 모델을 활용하여 동일한 인물을 전혀 다른 분위기의 배경으로 변환해 보았습니다. 원본 이미지는 야외의 밝고 평온한 정원 풍경이었지만, 편집된 결과물에서는 인물이 어두운 조명 아래 활기찬 펍(bar) 내부에 앉아 있는 모습으로 바뀌었습니다. 인물은 와인 잔을 손에 들고 있으며, 전경에는 은은한 조명이 비추어 영화적 분위기(cinematic look)를 강조하고 있습니다.

 

이 편집 과정은 약 2분 40초가 소요되었으며, VRAM 사용량은 약 15.0GB였습니다. 아래는 이미지 생성을 위해 사용된 프롬프트입니다.

  • 사용 프롬프트 :
    Have the character seated at the bar of a busy pub. Behind her, the scene is lively, but the background stays mostly dark. She’s holding a wine glass, facing the bar, with the light lighting up the foreground—giving the whole image a cinematic look and feel.

 

[생성 결과]

아래의 비교 이미지를 보면, 원본(왼쪽)에서는 인물이 봄날의 따뜻한 정원에서 서 있는 모습이 담겨 있고, 편집된 이미지(오른쪽)에서는 같은 인물이 실내 펍에서 와인을 즐기는 장면으로 자연스럽게 변환된 것을 확인할 수 있습니다. 원본의 디테일은 보존하면서도 배경과 분위기를 완전히 바꾸어낸 점에서 Qwen-Image-Edit 모델의 강력한 편집 능력을 잘 보여줍니다.

 

아래는 수정되기 전/후 이미지입니다.

(좌) 수정 전 이미지 / (우) 수정 후 이미지


 

종합하면 Qwen-Image-Edit는 높은 결과물 품질, 간편한 편집 과정, 빠른 처리 속도를 모두 갖춘 실용적인 이미지 편집 모델입니다. 텍스트 교정, 배경 전환, 스타일 수정 등 다양한 작업을 안정적으로 수행할 수 있으며, 원하는 규격과 비율에 맞춰 썸네일을 제작하는 데에도 매우 유용합니다. 따라서 콘텐츠 제작이나 마케팅 소재 준비, 블로그·쇼핑몰 운영 등 여러 분야에서 즉시 활용할 수 있는 완성도 높은 도구라 할 수 있습니다.

 

특히 썸네일 생성이나 이미지 속 텍스트 수정처럼 가볍고 직관적인 편집을 원하는 분들에게 적극적으로 권장드릴 만합니다.

 

읽어주셔서 감사합니다. 😊

 

반응형