본문 바로가기

반응형

ComfyUI

(37)
포토샵처럼 이미지 수정하는 AI, OmniGen2를 소개합니다. | ComfyUI | 오픈소스 | 로컬환경 안녕하세요,최근 포토샵 수준의 이미지 편집이 가능한 오픈소스 이미지 생성 AI 모델 OmniGen2가 공개되었습니다. 이 모델은 텍스트 한 줄만으로 고품질 이미지를 생성할 수 있으며, 자연어 지시만으로 인물, 배경, 질감 등을 자유롭게 수정할 수 있어 디자인, 콘텐츠 제작, 개인 프로젝트 등 다양한 분야에서 활용할 수 있습니다.이번 글에서는 OmniGen2의 설치 방법부터 로컬 환경에서 직접 이미지를 생성하고 수정하는 과정을 소개해드리겠습니다.OmniGen2 란OmniGen2는 VectorSpaceLab에서 개발한 오픈소스 멀티모달 생성 모델로, 텍스트-이미지 생성, 이미지 편집, 시각적 이해, 인컨텍스트 생성 등 다양한 작업을 하나의 통합 프레임워크에서 처리할 수 있도록 설계되었습니다. Qwen‑VL‑..
[ComfyUI + Cosmos-Predict2] NVIDIA의 AI 이미지·영상 생성 모델 활용법 | 로컬 실행 | AI 이미지 | AI 영상 안녕하세요,최근 생성형 AI 기술의 발전으로, 텍스트만 입력해도 고해상도 이미지와 영상을 손쉽게 생성할 수 있는 시대가 열렸습니다. 그중에서도 이번에 소개할 모델은 NVIDIA에서 공개한 Cosmos-Predict2로, 강력한 성능을 자랑하는 멀티모달 생성 AI입니다. Cosmos-Predict2는 로컬 환경에서도 실행이 가능하며, 적절한 GPU 사양만 갖춰진다면 누구나 직접 고품질 이미지와 영상을 생성해볼 수 있습니다.그럼 지금부터 ComfyUI 환경에서 Cosmos-Predict2 모델을 실행하는 방법을 단계별로 살펴보겠습니다.Cosmos-Predict2란Cosmos-Predict2는 NVIDIA가 개발한 차세대 월드 파운데이션 모델(World Foundation Model, WFM)로, 물리 기반 ..
[ComfyUI + Wan2.1-VACE] AI 하나로 Text to Video부터 Video 편집까지!|오픈소스|영상 생성 AI 안녕하세요,최근 영상 생성 AI 기술은 눈부신 속도로 발전하고 있으며, 이제는 텍스트나 이미지 하나만으로도 고품질의 영상을 만드는 시대가 열리고 있습니다. 그 중 소개해드릴 모델은 바로 Wan2.1-VACE입니다.Wan2.1-VACE는 텍스트, 이미지, 비디오, 마스크 등 다양한 입력을 활용해 영상 생성은 물론, 세밀한 편집까지 가능한 올인원 오픈소스 모델로 주목받고 있습니다. 특히 ComfyUI와 연동해 누구나 시각적으로 손쉽게 테스트할 수 있어, AI 영상 제작의 진입 장벽을 크게 낮춰줍니다.이번 글에서는 Wan2.1-VACE 모델을 직접 활용해 Text to Video, Image to Video, Video to Video 방식으로 영상 생성하는 방법에 대해 알아보겠습니다.Wan2.1-VACEWa..
[ComfyUI + 오디오 생성 AI] Suno 무료 버전의 음원 생성 AI 모델, Ace-step를 소개합니다. 안녕하세요,최근 AI 기술의 발전으로 누구나 손쉽게 음악을 만들 수 있는 시대가 되었습니다. AI를 활용한 음원 생성 방법으로는 Suno, Udio와 같은 플랫폼을 이용하는 것이 가장 간편하지만, 오픈소스 모델인 Ace-step을 활용하는 방법도 있습니다.Ace-step은 오픈소스로 공개되었음에도 뛰어난 음원 생성 능력을 갖추고 있어, 비용 부담 없이 고품질 음악을 제작할 수 있습니다. 이번 글에서는 Ace-step의 주요 특징과 장점, 그리고 로컬 환경에 설치해 사용하는 방법을 자세히 소개해 드리겠습니다.ACE-Step 이란Ace-step은 기존 오디오에서 텍스트 설명과 가사를 입력하면 새로운 스타일의 고품질 음악을 빠르게 생성할 수 있는 최신 오픈소스 기반 음악 생성 AI 모델입니다. 중국의 ACE ..
[ComfyUI + ICEdit] GPT-4o보다 빠르게 이미지 편집하기 | 이미지 수정 AI 안녕하세요,최근 온라인 커뮤니티와 SNS를 중심으로 “GPT로 만든 지브리 스타일 이미지”가 큰 인기를 끌었습니다. 따뜻한 색감과 부드러운 터치, 감성적인 장면 연출이 돋보이는 이 스타일은, AI 이미지 생성 기술이 단순한 실험을 넘어 창의적인 표현 도구로 자리 잡고 있음을 보여주는 대표적인 사례입니다.최근에는 GPT나 Gemini보다도 뛰어난 성능을 보여주는 이미지 편집 도구인 ICEdit가 등장했습니다. ICEdit는 텍스트 지시문만으로 원본 이미지를 유지한 채 원하는 부분만 자연스럽게 수정할 수 있는 이미지 편집 프레임워크입니다. 이번 글에서는 ICEdit의 개념과 특징을 간단히 살펴보고, ComfyUI를 통해 실제로 이미지를 수정하는 방법을 단계별로 소개해드리겠습니다.ICEdit란 ICEdit는 ..
[ComfyUI × 영상 생성 AI] 6GB VRAM으로도 가능한 고품질 영상 생성 AI, FramePack을 소개합니다. 안녕하세요,최근, 낮은 VRAM 환경에서도 고품질의 영상을 생성할 수 있는 AI 모델이 등장하였습니다. 기존의 영상 생성 모델들은 연산량과 메모리 사용량이 비례하여, 긴 영상을 생성하려면 고사양 GPU가 필수적이었습니다. 하지만 새롭게 발표된 이번 영상 생성 모델은 이러한 한계를 극복하며, 일반적인 사양의 GPU에서도 놀라운 품질의 영상을 제작할 수 있도록 지원합니다. 이번 글에서는 이 모델의 원리와 주요 특징을 살펴보고, 설치 및 사용방법에 대해 알아보겠습니다.FramePack 이란FramePack은 스탠포드 대학교에서 개발한 차세대 비디오 생성 모델로, 입력 프레임을 압축해 고정된 길이로 유지함으로써 비디오 생성의 효율성과 품질을 동시에 향상시킵니다. 특히 이미지 기반 비디오 생성(image-to-v..
[ComfyUI + HiDream-I1] 무료로 고화질 이미지 생성하기 | 이미지 생성 AI 안녕하세요,최근 고성능의 오픈소스 이미지 생성 모델이 등장해 많은 주목을 받고 있습니다. 바로 HiDream-I1이라는 모델로, 현재 허깅페이스를 통해 누구나 자유롭게 사용할 수 있도록 공개되었습니다. 이번 포스팅에서는 HiDream-I1의 주요 특징과 설치 방법, 그리고 실제로 텍스트 프롬프트를 활용해 이미지를 생성하는 과정을 단계별로 소개해드리겠습니다.AI 이미지 생성에 관심 있는 분들께 유용한 가이드가 되길 바랍니다. HiDream-I1 란HiDream-I1은 HiDream-ai가 2025년 4월 7일 공식적으로 오픈소스로 공개한 텍스트-이미지 변환 모델입니다. 170억 개의 파라미터를 갖춘 이 모델은 텍스트 프롬프트를 기반으로 다양한 스타일(사진, 만화, 예술 등)의 고품질 이미지를 생성할 수 있..
[ComfyUI] HunyuanVideo보다 8.5배 빠른 영상 생성 AI, AccVideo를 소개합니다 안녕하세요,최근 생성형 AI 기술이 빠르게 발전하면서, 텍스트만으로도 고퀄리티의 영상을 생성할 수 있는 AI 기반 영상 생성이 큰 주목을 받고 있습니다. 그 중에서도 HunyuanVideo와 같은 오픈 소스 모델은 실제 활용 가능한 수준의 영상 품질을 제공하며 많은 관심을 받고 있습니다. 하지만 이러한 모델들은 여전히 영상 하나를 생성하는 데 많은 연산 자원과 시간이 소요되는 단점이 존재합니다. 이러한 한계를 극복하기 위해, HunyuanVideo를 기반으로 하면서도 훨씬 더 빠른 속도로 영상을 생성할 수 있는 새로운 영상 생성 AI 모델, "AccVideo"가 등장했습니다. AccVideo는 영상의 품질을 유지하면서도 생성 속도를 무려 8.5배나 향상시킨 것이 큰 특징입니다. 이번 글에서는 AccVid..

728x90
반응형