본문 바로가기

반응형

ComfyUI

(33)
[ComfyUI x 이미지 수정 AI] GPT-4o보다 빠른 이미지 편집 AI, ICEdit를 소개합니다 안녕하세요,최근 온라인 커뮤니티와 SNS를 중심으로 “GPT로 만든 지브리 스타일 이미지”가 큰 인기를 끌었습니다. 따뜻한 색감과 부드러운 터치, 감성적인 장면 연출이 돋보이는 이 스타일은, AI 이미지 생성 기술이 단순한 실험을 넘어 창의적인 표현 도구로 자리 잡고 있음을 보여주는 대표적인 사례입니다.최근에는 GPT나 Gemini보다도 뛰어난 성능을 보여주는 이미지 편집 도구인 ICEdit가 등장했습니다. ICEdit는 텍스트 지시문만으로 원본 이미지를 유지한 채 원하는 부분만 자연스럽게 수정할 수 있는 이미지 편집 프레임워크입니다. 이번 글에서는 ICEdit의 개념과 특징을 간단히 살펴보고, ComfyUI를 통해 실제로 이미지를 수정하는 방법을 단계별로 소개해드리겠습니다.ICEdit란 ICEdit는 ..
[ComfyUI × 영상 생성 AI] 6GB VRAM으로도 가능한 고품질 영상 생성 AI, FramePack을 소개합니다. 안녕하세요,최근, 낮은 VRAM 환경에서도 고품질의 영상을 생성할 수 있는 AI 모델이 등장하였습니다. 기존의 영상 생성 모델들은 연산량과 메모리 사용량이 비례하여, 긴 영상을 생성하려면 고사양 GPU가 필수적이었습니다. 하지만 새롭게 발표된 이번 영상 생성 모델은 이러한 한계를 극복하며, 일반적인 사양의 GPU에서도 놀라운 품질의 영상을 제작할 수 있도록 지원합니다. 이번 글에서는 이 모델의 원리와 주요 특징을 살펴보고, 설치 및 사용방법에 대해 알아보겠습니다.FramePack 이란FramePack은 스탠포드 대학교에서 개발한 차세대 비디오 생성 모델로, 입력 프레임을 압축해 고정된 길이로 유지함으로써 비디오 생성의 효율성과 품질을 동시에 향상시킵니다. 특히 이미지 기반 비디오 생성(image-to-v..
[ComfyUI × 이미지 생성 AI] 무료 고화질 이미지 생성 모델, HiDream-I1을 소개합니다. 안녕하세요,최근 고성능의 오픈소스 이미지 생성 모델이 등장해 많은 주목을 받고 있습니다. 바로 HiDream-I1이라는 모델로, 현재 허깅페이스를 통해 누구나 자유롭게 사용할 수 있도록 공개되었습니다. 이번 포스팅에서는 HiDream-I1의 주요 특징과 설치 방법, 그리고 실제로 텍스트 프롬프트를 활용해 이미지를 생성하는 과정을 단계별로 소개해드리겠습니다.AI 이미지 생성에 관심 있는 분들께 유용한 가이드가 되길 바랍니다. HiDream-I1 란HiDream-I1은 HiDream-ai가 2025년 4월 7일 공식적으로 오픈소스로 공개한 텍스트-이미지 변환 모델입니다. 170억 개의 파라미터를 갖춘 이 모델은 텍스트 프롬프트를 기반으로 다양한 스타일(사진, 만화, 예술 등)의 고품질 이미지를 생성할 수 있..
[ComfyUI] HunyuanVideo보다 8.5배 빠른 영상 생성 AI, AccVideo를 소개합니다 안녕하세요,최근 생성형 AI 기술이 빠르게 발전하면서, 텍스트만으로도 고퀄리티의 영상을 생성할 수 있는 AI 기반 영상 생성이 큰 주목을 받고 있습니다. 그 중에서도 HunyuanVideo와 같은 오픈 소스 모델은 실제 활용 가능한 수준의 영상 품질을 제공하며 많은 관심을 받고 있습니다. 하지만 이러한 모델들은 여전히 영상 하나를 생성하는 데 많은 연산 자원과 시간이 소요되는 단점이 존재합니다. 이러한 한계를 극복하기 위해, HunyuanVideo를 기반으로 하면서도 훨씬 더 빠른 속도로 영상을 생성할 수 있는 새로운 영상 생성 AI 모델, "AccVideo"가 등장했습니다. AccVideo는 영상의 품질을 유지하면서도 생성 속도를 무려 8.5배나 향상시킨 것이 큰 특징입니다. 이번 글에서는 AccVid..
[ComfyUI] [이미지 생성 AI] 텍스트만으로 이미지를 생성해주는 AI모델, Lumina image 2.0을 소개합니다. 안녕하세요,최근 OpenAI의 이미지 생성 기능이 큰 화제를 모으며 주목받고 있습니다. 기존에는 고품질 이미지를 생성하기 위해 특정한 형식의 프롬프트 입력이 필요했지만, 이제는 우리가 일상적으로 사용하는 언어(자연어)만으로도 이미지 생성과 수정이 가능해졌습니다.이번에 소개해드릴 Lumina는 이러한 자연어 기반 이미지 생성 기능을 제공하는 오픈소스 AI 모델입니다. 이 글에서는 Lumina 모델에 대한 간단한 소개와 함께, 로컬 환경에서 설치하고 사용하는 방법을 알아보겠습니다.Lumina image 2.0Lumina Image 2.0은 상하이 AI 랩의 Alpha VLLM 팀이 개발한 텍스트-이미지 생성(Text-to-Image) AI 모델로, 효율성과 고품질 이미지 생성 능력을 결합한 혁신적인 프레임워..
[ComfyUI] 알리바바가 공개한 무료 영상 생성 AI, "Wan 2.1" – ComfyUI 연동 가능한 오픈 소스! 안녕하세요,최근 AI 기술의 발전으로 텍스트나 이미지 생성은 물론, 영상 생성 AI까지 눈부신 성장을 이루고 있습니다. 얼마전 텐센트에서 공개했던 HunyuanVideo-I2V 모델을 공개했었는데, 이번에는 알리바바에서 강력한 영상 생성 오픈소스 AI, Wan 2.1을 공개했습니다. 특히 ComfyUI와 같은 노드 기반 AI 툴과도 연동이 가능해, 복잡한 설정 없이도 쉽게 고품질 영상을 만들어볼 수 있다는 점에서 큰 주목을 받고 있는데요. 이번 글에서는 Wan 2.1의 특징, 설치 방법, 그리고 직접 활용하는 방법에 대해 알아보겠습니다.Wan 2.1Wan 2.1은 알리바바 산하 연구팀에서 개발한 최첨단 AI 비디오 생성 모델로, 다양한 영상 생성 및 편집 작업을 손쉽게 수행할 수 있는 강력한 기능을 제공..
[ComfyUI] [영상 생성 AI] 텐센트의 비디오 생성 AI, HunyuanVideo-I2V를 소개합니다. 안녕하세요,최근 인공지능 기술이 빠르게 발전하면서 영상 생성 AI 분야에서도 혁신적인 모델들이 등장하고 있습니다. 특히, 텐센트는 놀라운 성능을 자랑하는 영상 생성 모델을 오픈 소스로 공개하며 많은 주목을 받았습니다. 이번에는 그 두 번째 영상 생성 모델을 새롭게 공개했데, 이 모델의 성능과 사용방법에 대해 알아보겠습니다.HunyuanVideo-I2VHunyuanVideo-I2V는 중국의 대표적인 기술 기업 텐센트(Tencent)에서 개발한 오픈소스 이미지-비디오 생성 AI 모델입니다. 이전 포스팅 내용에서 다뤘던 기존의 Text-to-Video(T2V) 모델을 기반으로 발전하였으며, 이미지를 고품질의 유동적인 비디오로 변환하는 기능을 제공합니다. 이 모델은 13B(130억 개의 매개변수) 규모를 가지며..
[오픈 소스 AI] [음성 생성 AI] 영상을 보고 알맞은 소리를 생성해주는 AI, MMAudio를 소개합니다. 안녕하세요,이번에 소개해 드릴 AI는 영상을 분석하여 그에 맞는 소리나 음성을 생성해 주는 모델입니다. 이 모델은 AI가 영상을 보고 적절한 효과음, 음성, 혹은 음악을 자동으로 만들어 줍니다. 이제 영상뿐만 아니라, 그에 어울리는 소리까지 AI가 생성할 수 있게 되었습니다. 그럼, 이 AI 모델에 대해 자세히 알아보겠습니다.MMAudio 란 MMAudio는 비디오와 텍스트 입력을 기반으로 동기화된 오디오를 생성하는 모델입니다. 이 모델의 핵심 혁신은 다양한 오디오-비주얼 및 오디오-텍스트 데이터 세트를 활용한 멀티모달 조인트 트레이닝을 가능하게 한다는 점입니다. 또한, 동기화 모듈을 통해 생성된 오디오가 비디오 프레임과 정밀하게 정렬되어, 자연스럽게 일치하는 영상과 오디오를 만들어냅니다.MMAudio ..

728x90
반응형