본문 바로가기

ComfyUI

(48)

[ComfyUI] ACE-Step 1.5 음악 생성 모델 소개 – 성능, 벤치마크, 오픈소스 AI 안녕하세요,최근 굉장히 놀라운 성능을 보여주는 음악 생성 AI 모델이 등장했습니다. 텍스트 프롬프트와 가사만 입력하면 하나의 완성된 곡을 오디오 형태로 생성할 수 있는 수준까지 발전하면서, AI 기반 음악 제작의 진입 장벽도 점차 낮아지고 있습니다. 특히 상용 서비스 중심이던 영역에서 공개 모델이 경쟁력 있는 성능을 보여주기 시작했다는 점이 주목할 만합니다.이번 글에서는 이러한 흐름 속에서 공개된 ACE-Step 1.5 모델을 중심으로, 모델 개요와 주요 특징, 벤치마크 성능, 라이선스, 사용 방법에 대해 알아보겠습니다.Ace-Step1.5 란Ace-Step 1.5는 텍스트를 기반으로 음악 오디오를 생성하는 오픈소스 AI 음악 생성 모델입니다. 사용자가 입력한 프롬프트나 가사를 조건으로 받아, 하나의 완..

[AI 이미지 편집] ComfyUI에서 Qwen-Image-Edit 모델 사용하는 방법 안녕하세요,알리바바는 텍스트 생성 모델뿐만 아니라 다양한 이미지 생성 기술을 지속적으로 확장해왔으며, 특히 이미지 보정과 요소 변경에 특화된 모델을 꾸준히 선보여왔습니다. 이러한 개발 흐름 속에서 2025년 11월에는 새로운 버전의 이미지 수정 모델이 업데이트되어 공개되었습니다.이번 글에서는 해당 모델인 Qwen-Image-Edit 모델을 ComfyUI 환경에서 활용하는 기본 절차와 실사용 방법을 중심으로 정리하여 소개합니다.Qwen-Image-Edit-2511 Qwen-Image-Edit-2511 모델은 알리바바 AI 팀이 공개한 이미지 편집 특화 오픈소스 모델이며, 이전 버전인 Qwen-Image-Edit-2509의 기능을 확장·개선한 형태입니다. 이 모델은 기존 이미지에 텍스트 지시를 바탕으로 수..

[ComfyUI] 나노 바나나 프로에 견줄만한 오픈소스 이미지 생성 모델, Z-Image 소개 | 로컬환경 안녕하세요,최근 이미지 생성 모델 분야에서 커다란 변화가 일어나고 있습니다. 구글의 나노 바나나 프로(Nano Banana Pro) 모델이 등장하며 업계의 새로운 기준으로 주목받고 있습니다. 이에 대응하듯 알리바바에서도 강력한 성능의 오픈소스 이미지 생성 모델을 공개하였습니다. 해당 모델은 오픈소스임에도 불구하고 탁월한 표현력과 세밀한 이미지 품질을 제공하는 것으로 평가되고 있습니다.이번 글에서는 알리바바가 새롭게 선보인 이미지 생성 모델 Z-Image의 주요 특징과 ComfyUI를 사용하여 로컬에서 사용하는 방법에 대해 살펴보겠습니다.Z-Image 모델이란2025년 11월 26일, 알리바바 그룹 산하 Tongyi Lab에서 새로운 텍스트-이미지 생성 모델, Z-Image를 공개했습니다. 이 모델은 약 ..

[ComfyUI] 중국의 영상 생성 AI 모델, HuMo를 소개합니다 | 오픈소스 AI 안녕하세요,중국의 인공지능 기술이 빠르게 발전하면서, 다양한 모델들이 연구 성과와 함께 오픈소스로 공개되고 있습니다. 이러한 흐름 속에 HuMo라는 새로운 영상 생성 모델이 공개되었습니다. 이 모델은 텍스트, 이미지, 오디오를 함께 활용하여 사람 중심의 사실적이고 자연스러운 영상을 생성하는 멀티모달 비디오 생성 모델입니다.이번 포스팅에서는 HuMo의 주요 특징과 실제 영상 생성 결과를 중심으로 자세히 살펴보겠습니다.HuMo 모델이란HuMo 모델은 텍스트, 이미지, 오디오 등 다양한 입력 정보를 결합하여 사람 중심의 자연스럽고 사실적인 영상을 생성하는 최신 멀티모달 비디오 생성 모델입니다. 이 모델은 칭화대학교(Tsinghua University)와 바이트댄스(ByteDance) 인텔리전트 크리에이션 랩(..

[ComfyUI] OpenAI Sora 2로 AI 영상 생성하기 | 텍스트·이미지로 시네마틱 영상 제작 안녕하세요,최근 OpenAI가 Sora 2 모델을 공식 출시하면서, AI 영상 생성 분야가 다시 한 번 큰 주목을 받고 있습니다. Sora 2는 단순한 이미지 기반 생성 모델을 넘어, 실제 영화와 같은 질감과 움직임, 그리고 자연스러운 음성까지 결합된 차세대 영상 생성 모델로 평가받고 있습니다.이번 포스팅에서는 이러한 Sora 2 모델을 ComfyUI 환경에서 활용하여 영상을 생성하는 방법을 자세히 살펴보겠습니다. 별도의 복잡한 설정 없이, 이미지와 짧은 프롬프트만으로 시네마틱한 AI 영상을 손쉽게 제작하는 과정을 함께 알아보겠습니다.ComfyUI + Sora 22025년 9월 30일, OpenAI는 자사의 최신 영상 생성 모델 Sora 2를 공식 발표하였습니다. 이전 세대 모델이 영상 생성에만 초점을 ..

[ComfyUI] Lodestones에서 공개한 고성능 이미지 생성 모델, Chroma1을 소개합니다. | 오픈소스 AI 안녕하세요,인공지능(AI) 기술의 발전으로 텍스트를 이미지로 변환하는 '텍스트-투-이미지' 모델의 시대가 본격적으로 열렸습니다. 수많은 모델이 경쟁하는 가운데, 최근 Lodestones가 공개한 'Chroma1' 시리즈가 주목받고 있습니다. Chroma1은 변형된 FLUX.1-schnell 아키텍처를 기반으로, 정교하고 사실적인 이미지를 안정적으로 생성하는 대규모 생성 모델입니다. 특히 연구, 창작, 상업적 활용 등 목적에 따라 다양한 버전을 제공하여 폭넓은 확장성으로 높은 평가를 받습니다.이번 글에서는 Chroma1 시리즈의 핵심 특징과 구체적인 활용 방안까지 자세히 살펴보겠습니다. Chroma1 모델이란 Chroma1은 AI 모델 개발사 Lodestones에서 공개한 차세대 텍스트-투-이미지(Text..

[ComfyUI] 오디오·이미지 기반 AI 영상 생성 모델, Wan2.2-S2V 가이드 안녕하세요,이전에 알리바바에서 공개한 Wan 2.2 모델을 소개한 적이 있습니다. 이 모델은 텍스트 입력만으로 영상을 생성할 수 있는 모델로, 가벼운 모델 크기에도 불구하고 뛰어난 생성 품질과 우수한 성능으로 많은 관심을 받았습니다. 이번에는 이 모델이 한 단계 발전하여, 이미지와 오디오 입력을 함께 활용해 더욱 원하는 영상 결과를 만들 수 있는 기능을 갖추게 되었습니다.이번 포스팅에서는 새로운 Wan 2.2-S2V 모델에 대해 자세히 알아보겠습니다. 참고 : [Marcus' Story] - [ComfyUI + Wan 2.2] AI 영상 생성 오픈소스, Wan 2.2 사용법 | ComfyUI로 로컬에서 실행하기 Wan2.2-S2V 모델이란Wan2.2-S2V는 정적 이미지와 오디오를 함께 활용하여 영상 콘..

[AI 이미지 편집] Qwen-Image + ControlNet 활용 가이드｜ComfyUI로 쉽게 따라하기 안녕하세요,최근 알리바바에서 공개한 이미지 생성 모델 Qwen-Image가 큰 주목을 받고 있습니다. 특히 이를 기반으로 한 Qwen-Image-Edit 모델은 텍스트 입력만으로 이미지를 원하는 형태로 손쉽게 수정할 수 있다는 점에서 많은 관심을 모으고 있습니다.이번 포스팅에서는 이러한 Qwen-Image 모델에 ControlNet을 결합하여 이미지를 더욱 정밀하게 편집하는 방법을 소개하고자 합니다. ComfyUI 환경에서 ControlNet을 추가해 활용하면, 사용자가 원하는 방향으로 이미지 결과를 한층 더 섬세하게 제어할 수 있습니다.Qwen-Image + Controlnet Qwen-Image는 알리바바에서 공개한 이미지 생성 모델로, 텍스트 프롬프트만 입력하면 사용자가 상상하는 장면을 사실적이면서..

이전 1 2 3 4 ··· 6 다음

728x90

티스토리툴바