전체 글 (251) 썸네일형 리스트형 [ComfyUI + Qwen-Image-Edit] AI 이미지 편집 가이드|빠르고 간편한 활용 방법 안녕하세요,최근 알리바바 클라우드에서 공개한 Qwen-Image 계열 모델 중, 이미지 편집 기능에 최적화된 새로운 모델인 Qwen-Image-Edit가 발표되었습니다. 이 모델은 단순한 이미지 생성 기능을 넘어, 텍스트 수정, 객체 추가·삭제, 스타일 변경 등 정교한 편집 작업까지 지원하여 창의적인 활용도를 크게 확장해 주는 것이 특징입니다.이번 포스팅에서는 Qwen-Image-Edit 모델의 주요 기능과 장점을 살펴보고, 로컬 환경에서 직접 실행하여 활용할 수 있는 방법까지 함께 소개해 드리겠습니다. Qwen-Image-Edit 모델이란Qwen-Image-Edit는 알리바바 클라우드에서 공개한 Qwen-Image 계열 모델의 확장판으로, 이미지 생성보다는 편집 기능에 집중하여 개발된 오픈소스 AI 모.. [오픈소스 AI] GPT-5에 맞서는 오픈소스 AI, DeepSeek-V3.1 공개 안녕하세요,오픈소스 AI 생태계에 프론티어급 대형 언어 모델 시대의 개막을 알리며 강력한 변화를 이끌어낸 DeepSeek에서 새로운 모델 DeepSeek-V3.1을 공개했습니다. 이번 모델은 전작인 V3를 기반으로 성능과 효율성을 한층 강화했으며, 추론 모드와 일반 모드를 모두 지원하는 하이브리드 구조를 통해 활용 범위를 크게 넓혔습니다.이번 포스팅에서는 DeepSeek-V3.1의 개요와 주요 특징을 살펴보고, 어떤 점에서 발전이 있었는지, 그리고 실제로 어떤 방식으로 활용할 수 있는지 자세히 소개해드리겠습니다.DeepSeek-V3.1 모델이란2025년 8월 19일(현지 시각), DeepSeek은 전작 V3를 기반으로 성능과 효율성을 한층 강화한 차세대 오픈소스 언어 모델 DeepSeek-V3.1을 공개.. [오픈소스 AI] 중국 Z.ai의 최신 V-LLM, GLM-4.5V를 소개합니다. 안녕하세요,최근 Z.ai에서 오픈소스로 공개한 GLM-4.5 모델에 대한 포스팅을 진행한 바 있습니다. 이번에는 한 단계 더 발전된 형태로, 텍스트뿐만 아니라 이미지와 영상을 인식할 수 있는 비전 인식 통합 모델 GLM-4.5V를 새롭게 선보였습니다. GLM-4.5V는 기존 언어 처리 능력에 시각적 이해를 결합하여, 이미지 설명 생성, 멀티모달 질의응답, 시각적 추론 등 더욱 확장된 활용이 가능한 모델입니다. 특히 오픈소스로 제공되기 때문에 누구나 직접 실험하고 응용할 수 있다는 점에서 의미가 큽니다.이번 포스팅에서는 GLM-4.5V 모델의 특징, 그리고 실제로 어떠한 성능을 보여주는지 살펴보겠습니다. GLM-4.5V 모델2025년 8월 11일, 중국 Z.ai는 GLM-4.5V를 오픈소스 비전–언어 통.. [오픈소스 AI] LFM2-VL 모델 소개 | 온디바이스 최적화 멀티모달 비전-언어 모델 안녕하세요,최근 인공지능 기술은 대규모 모델에서부터 점차 온디바이스(On-Device) 환경 최적화 모델로 발전하고 있습니다. 클라우드 서버에 의존하지 않고도 스마트폰, 노트북, 웨어러블, 임베디드 기기와 같은 자원이 제한된 환경에서 직접 동작할 수 있는 경량 AI 모델의 수요가 급격히 높아지고 있기 때문입니다.이러한 흐름 속에서 등장한 LFM2-VL(LFM2-Vision-Language) 모델은 텍스트와 이미지를 동시에 이해할 수 있는 멀티모달 모델로, 크기는 작지만 빠른 속도와 효율성을 자랑합니다. 특히 실시간 응답이 가능하도록 설계되어 있어, 온디바이스 AI 모델이 지향하는 미래 방향성을 잘 보여주는 사례라 할 수 있습니다.이번 글에서는 LFM2-VL 모델의 특징과 성능을 살펴보고, 실제로 모델을 .. 구글의 이미지 생성 AI, Imagen 4 정식 출시 | Gemini·AI Studio에서 무료 체험 안녕하세요,최근 구글에서 새로운 이미지 생성 모델인 Imagen 4를 정식으로 공개했습니다. 이 모델은 빠른 속도와 고품질 이미지를 모두 지원하며, 사용 목적에 따라 선택할 수 있는 다양한 버전으로 제공되고 있습니다. 특히 구글 Gemini와 Google AI Studio를 통해 누구나 손쉽게 체험할 수 있어, 이미지 생성 AI를 처음 접하는 사용자부터 실제 프로젝트에 활용하려는 개발자까지 폭넓게 활용할 수 있습니다.이번 포스팅에서는 Imagen 4의 간단한 소개와 주요 특징, 그리고 어떤 플랫폼에서 서비스를 이용할 수 있는지에 대해 살펴보겠습니다. Imagen 4 모델 소개 2025년 8월 15일, 구글은 Gemini API와 Google AI Studio를 통해 이미지 생성 모델인 Imagen 4 패.. [오픈소스 AI] 1GB 이하 초소형 AI, 구글 Gemma 3 270M 모델 실행 가이드 안녕하세요.구글이 최근 공개한 Gemma 3 시리즈는 다양한 크기와 성능을 갖춘 언어 모델 가운데, 특히 초소형 버전인 Gemma 3 270M이 눈길을 끌고 있습니다. 이 모델은 크기가 1GB도 되지 않을 만큼 가볍고 효율적으로 설계되어, 로컬 환경이나 자원이 제한된 기기에서도 손쉽게 실행할 수 있다는 점에서 큰 장점을 가지고 있습니다.이번 글에서는 Gemma 3 270M 모델의 소개와 주요 특징, 그리고 직접 로컬 환경에서 실행해보는 방법까지 차례대로 살펴보겠습니다.Gemma 3 270M 모델이란2025년 8월 14일, 구글은 크기는 작지만 효율적이며 강력한 instruction-following 능력을 갖춘 모델인 Gemma 3 270M을 공개했습니다. 이 모델은 Gemma 시리즈에 새롭게 추가된 버.. GPT-5 출시 이후 논란과 대응, GPT-4o·4.1 다시 제공 시작 안녕하세요,최근 GPT-5가 공개되면서 다양한 논란이 이어지고 있습니다. 일부에서는 성능 향상을 긍정적으로 평가하는 반면, 오히려 퇴보했다는 의견도 나오고 있습니다. 이러한 상황 속에서 OpenAI는 한때 지원을 중단했던 GPT-4o, GPT-4.1 등 이전 모델들을 다시 선택할 수 있도록 조치했습니다.이번 글에서는 GPT-5 출시와 관련해 제기된 주요 이슈와 함께, 각 모델의 특징을 간단히 정리했습니다.GPT-5 개요2025년 8월 7일 OpenAI는 GPT-5를 공식적으로 공개했습니다. OpenAI는 이번 모델을 “지금까지 가장 똑똑하고, 가장 빠르며, 가장 유용한 모델”이라고 소개하며, 누구나 전문가 수준의 지능을 활용할 수 있다는 점을 강조했습니다. GPT-5는 o 시리즈의 사고 능력과 GPT 시.. [오픈소스 AI] 중국 MetaStone AI의 XBai-o4 공개 – 성능, 특징, 벤치마크 완전 분석 안녕하세요,최근 중국에서 또 한 번 주목할 만한 오픈소스 대규모 언어 모델(LLM)인 XBai-o4가 공개되었습니다. 이 모델은 뛰어난 추론 능력과 빠른 응답 속도를 바탕으로 공개 직후부터 AI 커뮤니티와 업계의 관심을 받고 있으며, 복잡한 문제 해결과 프로그래밍 과제에서도 우수한 성능을 보인다는 평가를 받고 있습니다.이번 포스팅에서는 XBai-o4의 주요 특징과 성능에 대해 알아보겠습니다. Xbai-o4 모델 XBai-o4는 2025년 8월 1일 중국 기업 MetaStone AI에서 공개한 4세대 오픈소스 대규모 언어 모델입니다. 이 모델은 복잡한 추론 작업에서 OpenAI의 o3-mini를 능가하는 성능을 보이며, 오픈소스 생태계에서 주목을 받고 있습니다. GitHub와 Hugging Face를 통해.. 이전 1 2 3 4 ··· 32 다음