ComfyUI (45) 썸네일형 리스트형 [ComfyUI] 중국의 영상 생성 AI 모델, HuMo를 소개합니다 | 오픈소스 AI 안녕하세요,중국의 인공지능 기술이 빠르게 발전하면서, 다양한 모델들이 연구 성과와 함께 오픈소스로 공개되고 있습니다. 이러한 흐름 속에 HuMo라는 새로운 영상 생성 모델이 공개되었습니다. 이 모델은 텍스트, 이미지, 오디오를 함께 활용하여 사람 중심의 사실적이고 자연스러운 영상을 생성하는 멀티모달 비디오 생성 모델입니다.이번 포스팅에서는 HuMo의 주요 특징과 실제 영상 생성 결과를 중심으로 자세히 살펴보겠습니다.HuMo 모델이란HuMo 모델은 텍스트, 이미지, 오디오 등 다양한 입력 정보를 결합하여 사람 중심의 자연스럽고 사실적인 영상을 생성하는 최신 멀티모달 비디오 생성 모델입니다. 이 모델은 칭화대학교(Tsinghua University)와 바이트댄스(ByteDance) 인텔리전트 크리에이션 랩(.. [ComfyUI] OpenAI Sora 2로 AI 영상 생성하기 | 텍스트·이미지로 시네마틱 영상 제작 안녕하세요,최근 OpenAI가 Sora 2 모델을 공식 출시하면서, AI 영상 생성 분야가 다시 한 번 큰 주목을 받고 있습니다. Sora 2는 단순한 이미지 기반 생성 모델을 넘어, 실제 영화와 같은 질감과 움직임, 그리고 자연스러운 음성까지 결합된 차세대 영상 생성 모델로 평가받고 있습니다.이번 포스팅에서는 이러한 Sora 2 모델을 ComfyUI 환경에서 활용하여 영상을 생성하는 방법을 자세히 살펴보겠습니다. 별도의 복잡한 설정 없이, 이미지와 짧은 프롬프트만으로 시네마틱한 AI 영상을 손쉽게 제작하는 과정을 함께 알아보겠습니다.ComfyUI + Sora 22025년 9월 30일, OpenAI는 자사의 최신 영상 생성 모델 Sora 2를 공식 발표하였습니다. 이전 세대 모델이 영상 생성에만 초점을 .. [ComfyUI] Lodestones에서 공개한 고성능 이미지 생성 모델, Chroma1을 소개합니다. | 오픈소스 AI 안녕하세요,인공지능(AI) 기술의 발전으로 텍스트를 이미지로 변환하는 '텍스트-투-이미지' 모델의 시대가 본격적으로 열렸습니다. 수많은 모델이 경쟁하는 가운데, 최근 Lodestones가 공개한 'Chroma1' 시리즈가 주목받고 있습니다. Chroma1은 변형된 FLUX.1-schnell 아키텍처를 기반으로, 정교하고 사실적인 이미지를 안정적으로 생성하는 대규모 생성 모델입니다. 특히 연구, 창작, 상업적 활용 등 목적에 따라 다양한 버전을 제공하여 폭넓은 확장성으로 높은 평가를 받습니다.이번 글에서는 Chroma1 시리즈의 핵심 특징과 구체적인 활용 방안까지 자세히 살펴보겠습니다. Chroma1 모델이란 Chroma1은 AI 모델 개발사 Lodestones에서 공개한 차세대 텍스트-투-이미지(Text.. [ComfyUI] 오디오·이미지 기반 AI 영상 생성 모델, Wan2.2-S2V 가이드 안녕하세요,이전에 알리바바에서 공개한 Wan 2.2 모델을 소개한 적이 있습니다. 이 모델은 텍스트 입력만으로 영상을 생성할 수 있는 모델로, 가벼운 모델 크기에도 불구하고 뛰어난 생성 품질과 우수한 성능으로 많은 관심을 받았습니다. 이번에는 이 모델이 한 단계 발전하여, 이미지와 오디오 입력을 함께 활용해 더욱 원하는 영상 결과를 만들 수 있는 기능을 갖추게 되었습니다.이번 포스팅에서는 새로운 Wan 2.2-S2V 모델에 대해 자세히 알아보겠습니다. 참고 : [Marcus' Story] - [ComfyUI + Wan 2.2] AI 영상 생성 오픈소스, Wan 2.2 사용법 | ComfyUI로 로컬에서 실행하기 Wan2.2-S2V 모델이란Wan2.2-S2V는 정적 이미지와 오디오를 함께 활용하여 영상 콘.. [AI 이미지 편집] Qwen-Image + ControlNet 활용 가이드|ComfyUI로 쉽게 따라하기 안녕하세요,최근 알리바바에서 공개한 이미지 생성 모델 Qwen-Image가 큰 주목을 받고 있습니다. 특히 이를 기반으로 한 Qwen-Image-Edit 모델은 텍스트 입력만으로 이미지를 원하는 형태로 손쉽게 수정할 수 있다는 점에서 많은 관심을 모으고 있습니다.이번 포스팅에서는 이러한 Qwen-Image 모델에 ControlNet을 결합하여 이미지를 더욱 정밀하게 편집하는 방법을 소개하고자 합니다. ComfyUI 환경에서 ControlNet을 추가해 활용하면, 사용자가 원하는 방향으로 이미지 결과를 한층 더 섬세하게 제어할 수 있습니다.Qwen-Image + Controlnet Qwen-Image는 알리바바에서 공개한 이미지 생성 모델로, 텍스트 프롬프트만 입력하면 사용자가 상상하는 장면을 사실적이면서.. [ComfyUI + Qwen-Image-Edit] AI 이미지 편집 가이드|빠르고 간편한 활용 방법 안녕하세요,최근 알리바바 클라우드에서 공개한 Qwen-Image 계열 모델 중, 이미지 편집 기능에 최적화된 새로운 모델인 Qwen-Image-Edit가 발표되었습니다. 이 모델은 단순한 이미지 생성 기능을 넘어, 텍스트 수정, 객체 추가·삭제, 스타일 변경 등 정교한 편집 작업까지 지원하여 창의적인 활용도를 크게 확장해 주는 것이 특징입니다.이번 포스팅에서는 Qwen-Image-Edit 모델의 주요 기능과 장점을 살펴보고, 로컬 환경에서 직접 실행하여 활용할 수 있는 방법까지 함께 소개해 드리겠습니다. Qwen-Image-Edit 모델이란Qwen-Image-Edit는 알리바바 클라우드에서 공개한 Qwen-Image 계열 모델의 확장판으로, 이미지 생성보다는 편집 기능에 집중하여 개발된 오픈소스 AI 모.. [ComfyUI + Qwen-Image] 로컬 환경 고품질 이미지 생성 가이드 | 오픈소스 AI 활용 | 안녕하세요,최근 알리바바는 영상 생성 모델 Wan 2.2를 오픈소스로 공개해 주목을 받았는데, 이번에는 또 다른 강력한 모델인 Qwen-Image를 새롭게 선보였습니다. Qwen-Image는 뛰어난 이미지 생성 성능을 갖춘 최신 오픈소스 모델로, 다양한 창작 작업에서 활용 가능성이 매우 높습니다.이번 글에서는 이 모델의 주요 특징을 살펴보고, ComfyUI를 활용하여 로컬 환경에서 직접 고품질 이미지를 생성하는 방법을 자세히 소개하겠습니다.Qwen-Image 모델이란 Qwen‑Image는 Qwen 시리즈 최초의 이미지 생성 기반 모델입니다. 약 200억 개의 파라미터를 갖춘 MMDiT(Multi‑Modal Diffusion Transformer) 아키텍처 기반으로, 복잡한 텍스트 표현과 세밀한 이미지 편.. [ComfyUI + Wan 2.2] AI 영상 생성 오픈소스, Wan 2.2 사용법 | ComfyUI로 로컬에서 실행하기 안녕하세요,중국 기업 알리바바에서는 최근 눈에 띄는 인공지능 모델들을 오픈소스로 활발히 공개하고 있습니다. 이번에 소개해드릴 모델은 영상 생성 분야에서 주목받고 있는 Wan 2.2 모델입니다. 특히 Wan 2.2는 고화질의 사실적인 영상 생성이 가능하다는 점에서 많은 주목을 받고 있습니다.이 글에서는 Wan 2.2 모델에 대한 간단한 소개와 함께, ComfyUI를 활용하여 로컬 환경에서 직접 영상 생성하는 방법을 안내해드리겠습니다. Wan 2.2 모델Wan 2.2는 중국 알리바바가 공개한 차세대 오픈소스 AI 영상(비디오) 생성 모델로, 텍스트, 이미지, 혹은 둘을 조합한 입력을 받아 고해상도의 자연스러운 동영상을 생성하는 데 특화되어 있습니다. 이전 버전(Wan 2.1) 대비 해상도 품질, 스타일 제어.. 이전 1 2 3 4 ··· 6 다음