전체 글 (252) 썸네일형 리스트형 Gemma 3n이란? 구글의 최신 경량 언어 모델을 소개합니다 | 온디바이스 AI · 오픈소스 · 로컬 실행 안녕하세요,최근에는 대규모 언어 모델(LLM)보다 경량화된 소형 언어 모델(SLM) 개발이 활발히 이루어지고 있습니다. 그중에서도 구글이 새롭게 공개한 Gemma 3n은 주목할 만한 온디바이스 AI 모델로, 작은 모델 크기에도 불구하고 매우 우수한 품질과 빠른 처리 속도로 큰 관심을 받고 있습니다.특히 “최고의 경량 LLM”이라는 평가를 받을 만큼 완성도가 높으며, 이번 글에서는 Gemma 3n의 주요 기능, 장점, 그리고 직접 사용해본 결과를 중심으로 자세히 소개하겠습니다. 로컬 환경에서 AI 모델을 활용하고자 하는 분들께 유용한 참고가 되길 바랍니다.Gemma 3n이란 2025년 5월 20일, Google DeepMind는 모바일 및 엣지 디바이스에 최적화된 오픈소스 AI 언어 모델인 Gemma 3n.. Flux.1 Kontext Dev란? 오픈소스 텍스트 기반 이미지 생성 AI 소개 | 이미지 생성 AI | 로컬환경 안녕하세요,AI 기반 이미지 편집 도구를 찾고 계신가요? FLUX.1 Kontext Dev는 텍스트와 이미지 입력을 동시에 이해하고, 고도의 맥락 인식을 통해 정확하고 정교한 이미지 편집을 실현하는 오픈소스 멀티모달 모델입니다. 특히 로컬 환경에서도 실행 가능한 구조로, 누구나 고성능 AI 이미지 편집 기능을 직접 실험하고 활용할 수 있는 강력한 도구로 주목받고 있습니다. 이번 포스팅을 통해 FLUX.1 Kontext Dev 모델의 핵심 기능부터 사용 방법에 대해 알아보겠습니다.Flux.1 Kontext Dev란?FLUX.1 Kontext Dev는 Black Forest Labs에서 개발한 오픈 소스 멀티모달 이미지 편집 모델입니다. 120억 개의 매개변수를 가진 이 모델은 텍스트와 이미지를 동시에 입력.. 무료로 사용할 수 있는 구글 AI 에이전트, Gemini CLI를 소개합니다. | 오픈소스 AI | AI 코딩 도구 안녕하세요,최근 AI 기술의 발전으로 인해 코딩은 더 이상 전문 개발자만의 영역이 아닙니다. 그 중심에는 AI 에이전트 기반 자동화 도구, 특히 구글이 새롭게 공개한 무료 AI 코드 생성 도구 "Gemini CLI"가 있습니다. Gemini CLI는 자연어로 명령만 입력하면, 코드 작성, 파일 수정, 셸 명령 실행 등 복잡한 개발 작업을 AI가 자동으로 처리해주는 오픈소스 AI 에이전트입니다. 기존에는 유료 플랫폼에서만 사용 가능했던 기능을, 이제 누구나 무료로 체험할 수 있게 된 것입니다.이번 포스팅에서는 Google이 공개한 AI 개발 도구 Gemini CLI의 특징과 사용법에 대해 자세히 알아보겠습니다.Gemini CLI란Gemini CLI는 구글이 개발한 오픈소스 AI 에이전트로, 명령줄 터미널 .. [Phi-4-mini-reasoning] 마이크로소프트의 경량 추론 모델, 온디바이스에서도 실행 가능한 Phi-4 Mini 소개 | 오픈소스 AI | 로컬 실행 | 추론 특화 안녕하세요,수학 및 논리 추론에 최적화된 경량 AI 모델을 찾고 계신가요? 마이크로소프트에서 공개한 Phi-4-mini-reasoning 모델은 3.8억 파라미터로 구성된 가벼운 구조임에도 불구하고, 복잡한 수학 문제 해결과 논리적 추론에서 매우 뛰어난 성능을 보여주는 모델입니다.이번 포스팅에서는 Phi-4-mini-reasoning 모델을 로컬 환경에서 실행하는 두 가지 방법(간편한 Ollama 기반 실행과 유연한 Python 코드 실행 방식)을 소개합니다. 이 글을 통해 로컬 환경에서 AI 추론 모델을 직접 실행하고 테스트하는 방법을 쉽게 따라 해보실 수 있습니다.Phi-4-mini-reasoning Phi‑4‑mini‑reasoning은 마이크로소프트가 개발한 3.8 B 파라미터급 경량 생성형 AI.. [Hailuo AI] Veo 3을 능가한 영상 생성 AI, Hailuo를 소개합니다. | 영상 생성 AI | 웹 플랫폼 안녕하세요,Hailuo AI는 텍스트나 이미지를 입력하기만 하면 고해상도의 시네마틱 영상을 자동으로 생성해주는 최신 AI 영상 생성 플랫폼입니다. 특히 최근 공개된 Hailuo 02 모델은 사실적인 물리 시뮬레이션, 고급 카메라 연출, 그리고 캐릭터 일관성 유지 기능 등을 통해 Google의 Veo 3 모델을 뛰어넘는 성능으로 주목받고 있습니다.이번 포스팅에서는 Hailuo AI의 주요 기능, 실제 사용 방법, 요금제, 경쟁 모델과의 비교 내용에 대해 알아보겠습니다.Hailuo AI란?Hailuo AI는 텍스트나 이미지를 입력으로 받아 고품질의 이미지 및 영상 콘텐츠를 생성할 수 있는 AI 플랫폼입니다. 중국의 AI 기업 MiniMax에서 개발한 이 플랫폼은 텍스트 한 줄만으로도 시네마틱한 영상이나 포토.. [GPT + MCP] GPT로 Notion 연동해 프로젝트 자동 분석하기 | Tool Call 기능 | Streaming API 안녕하세요,요즘 AI에게 다양한 기능을 연동해주는 MCP(Model Context Protocol) 서버가 많은 주목을 받고 있습니다. OpenAI 역시 이러한 흐름에 발맞춰, GPT와 MCP를 연동할 수 있는 기능을 지원하고 있습니다.이번 포스팅에서는 GPT에게 MCP 기반의 외부 도구 기능을 어떻게 연동할 수 있는지, 그 구체적인 방식과 예제를 소개해드리겠습니다.GPT + MCP 연동 개요 GPT와 MCP 서버를 연동하려면, OpenAI API를 통해 Tool Call 기능과 Streaming API 기능을 함께 활용해야 합니다. 현재 웹 기반 GPT(ChatGPT 웹 인터페이스)에서는 사용자 정의 MCP 서버와의 연동을 직접 지원하지 않기 때문에, 반드시 OpenAI API를 사용해야 합니다. Op.. Gemini Diffusion이란? 구글 딥마인드의 차세대 AI 언어 모델 안녕하세요,2025년 구글 I/O에서 새롭게 공개된 Gemini Diffusion은 언어 생성 모델의 새로운 패러다임으로 주목받고 있습니다. 기존의 AI 모델과는 전혀 다른, "확산 원리"를 적용한 언어 모델로, 생성 속도와 효율성, 일관성 면에서 큰 가능성을 보여주고 있습니다.이 포스팅에서는 Gemini Diffusion이 무엇인지, 그리고 기존 LLM과 어떻게 다른지, 주요 특징과 성능, 그리고 앞으로의 활용 전망까지 알아보겠습니다.제미나이 디퓨전(Gemini Diffusion)란 Gemini Diffusion은 지난달 구글 I/O에서 구글 딥마인드가 공개한 차세대 언어 생성 모델입니다. 이 모델은 기존의 자기회귀(autoregressive) 방식이 아닌, 확산(diffusion) 방식을 텍스트 생성.. [ComfyUI + Cosmos-Predict2] NVIDIA의 AI 이미지·영상 생성 모델 활용법 | 로컬 실행 | AI 이미지 | AI 영상 안녕하세요,최근 생성형 AI 기술의 발전으로, 텍스트만 입력해도 고해상도 이미지와 영상을 손쉽게 생성할 수 있는 시대가 열렸습니다. 그중에서도 이번에 소개할 모델은 NVIDIA에서 공개한 Cosmos-Predict2로, 강력한 성능을 자랑하는 멀티모달 생성 AI입니다. Cosmos-Predict2는 로컬 환경에서도 실행이 가능하며, 적절한 GPU 사양만 갖춰진다면 누구나 직접 고품질 이미지와 영상을 생성해볼 수 있습니다.그럼 지금부터 ComfyUI 환경에서 Cosmos-Predict2 모델을 실행하는 방법을 단계별로 살펴보겠습니다.Cosmos-Predict2란Cosmos-Predict2는 NVIDIA가 개발한 차세대 월드 파운데이션 모델(World Foundation Model, WFM)로, 물리 기반 .. 이전 1 ··· 4 5 6 7 8 9 10 ··· 32 다음