본문 바로가기

반응형

분류 전체보기

(265)
GPT-5 vs Gemini vs Claude|2025년 9월 LLM 성능 순위 & 가성비 추천 모델 정리 안녕하세요,최근에는 단일 LLM 모델의 성능 경쟁을 넘어, 다양한 시스템과 결합해 실제 환경에서 문제를 해결하는 AI 에이전트가 빠르게 확산되고 있습니다. 이제는 모델이 단순히 좋은 답변을 내는 것만으로는 충분하지 않으며, 도구 활용 능력과 멀티스텝 추론을 통해 실제 문제를 해결할 수 있는지까지 평가하는 것이 중요해졌습니다.이번 글에서는 LMArena와 Artificial Analysis 같은 모델 벤치마크와 최근 주목받는 GAIA 리더보드를 함께 살펴보고자 합니다. 이를 통해 모델의 순수 성능뿐 아니라 현실 환경에서의 활용 능력과 에이전트로서의 문제 해결력까지 종합적으로 비교해 보겠습니다.이번 글은 세 가지 주요 지표를 기반으로, 모델 자체의 성능뿐만 아니라 AI 에이전트로서 발휘하는 문제 해결 능력까..
AI 에이전트 최적화 모델, GUI-Owl 소개|오픈소스 VLM 안녕하세요,최근 인공지능 기술은 단순한 대화형 모델을 넘어 사용자의 의도를 이해하고 직접 행동으로 이어가는 AI 에이전트로 빠르게 확장되고 있습니다. 이러한 흐름 속에서 핵심 과제는 화면을 어떻게 이해하고 조작할 것인가입니다. 사용자가 클릭하는 버튼, 입력하는 텍스트 창, 예기치 않게 나타나는 팝업까지 정확하게 인식해야만 안정적인 자동화가 가능하기 때문입니다.이 글에서는 이러한 과제를 해결하기 위해 화면 속 UI 요소를 인식하고 위치를 파악하며, 주어진 목표에 맞는 행동까지 제안하도록 설계된 최적화된 AI 모델, GUI-Owl 모델에 대해 알아보겠습니다. GUI-Owl란 GUI-Owl은 알리바바 Tongyi Lab에서 개발한 GUI 전용 멀티모달 모델입니다. 이 모델은 스마트폰이나 PC 화면을 입력받아 ..
퍼플렉시티의 AI 기반 웹브라우저, Comet을 소개합니다. | Comet 특징 및 사용 방법 안녕하세요,최근 인공지능 기술은 검색과 브라우저 환경에도 빠르게 접목되고 있습니다. 이제는 단순히 정보를 찾는 단계를 넘어, 사용자의 탐색 과정을 지원하고 업무까지 자동화하는 방향으로 발전하고 있습니다. 이러한 흐름 속에서 퍼플렉시티는 AI 기반 웹브라우저 Comet을 선보였습니다. 이 브라우저는 AI 기술을 토대로 개발되어 다양한 기능을 지원합니다.이번 글에서는 Comet이 어떤 브라우저인지, 어떤 기능을 제공하는지, 그리고 기존 브라우저와 어떤 차별점을 갖고 있는지 살펴보겠습니다.Comet 이란 퍼플렉시티(Perplexity)는 2022년에 설립된 미국의 인공지능 스타트업으로, 웹 정보를 종합해 요약과 출처를 함께 제공하는 AI 검색 서비스를 개발하며 빠르게 주목받았습니다. 기존 검색 엔진과 달리 근..
[음성 생성 AI] 마이크로소프트 VibeVoice TTS 모델 소개 및 사용 가이드 (ComfyUI 활용) 안녕하세요,최근 인공지능 기술은 텍스트를 넘어 음성 생성 영역에서도 빠르게 발전하고 있습니다. 특히 마이크로소프트에서 공개한 VibeVoice는 텍스트 입력만으로도 자연스럽고 풍부한 음성을 만들어낼 수 있는 최신 TTS(Text-to-Speech) 모델입니다. 이 모델은 영어뿐만 아니라 한국어에서도 높은 품질을 보여주며, 연구와 창작, 실험적 활용 등 다양한 분야에서 가능성을 입증하고 있습니다.이번 글에서는 VibeVoice 모델의 주요 특징을 살펴보고, ComfyUI 환경에서 직접 활용할 수 있는 방법을 단계별로 소개합니다. 설치 과정부터 음성 스타일 참조, 실제 생성 예시까지 자세히 안내하여, 누구나 손쉽게 VibeVoice를 체험할 수 있도록 구성하였습니다.VibeVoice란 VibeVoice는 M..
[AI 이미지 편집] Qwen-Image + ControlNet 활용 가이드|ComfyUI로 쉽게 따라하기 안녕하세요,최근 알리바바에서 공개한 이미지 생성 모델 Qwen-Image가 큰 주목을 받고 있습니다. 특히 이를 기반으로 한 Qwen-Image-Edit 모델은 텍스트 입력만으로 이미지를 원하는 형태로 손쉽게 수정할 수 있다는 점에서 많은 관심을 모으고 있습니다.이번 포스팅에서는 이러한 Qwen-Image 모델에 ControlNet을 결합하여 이미지를 더욱 정밀하게 편집하는 방법을 소개하고자 합니다. ComfyUI 환경에서 ControlNet을 추가해 활용하면, 사용자가 원하는 방향으로 이미지 결과를 한층 더 섬세하게 제어할 수 있습니다.Qwen-Image + Controlnet Qwen-Image는 알리바바에서 공개한 이미지 생성 모델로, 텍스트 프롬프트만 입력하면 사용자가 상상하는 장면을 사실적이면서..
카카오 PlayMCP란 무엇인가|MCP 기반 AI 실험 공간 살펴보기 안녕하세요,국내 대표 IT 기업 카카오가 MCP(Model Context Protocol) 기반 개방형 플랫폼 ‘PlayMCP’를 공개했습니다. 이 플랫폼은 AI 모델이 외부 도구와 데이터를 연결해 더 많은 일을 수행할 수 있도록 돕는 환경으로, 이를 통해 단순한 대화를 넘어 일정 관리, 정보 탐색, 생활 편의 서비스까지 아우르는 보다 스마트한 사용자 경험을 제공합니다.이번 포스팅에서는 PlayMCP의 개념과 특징, 그리고 활용 방법에 대해 살펴보겠습니다.PlayMCP란 무엇인가카카오는 2025년 8월 13일, MCP(Model Context Protocol) 기반 개방형 플랫폼 ‘PlayMCP’를 베타 버전으로 선보였습니다. 이 플랫폼은 AI 모델이 외부 시스템과 유연하게 연결되고 소통할 수 있도록 지..
2025년 6월 생활화학제품 위반제품 정보 안녕하세요,세제, 방향제, 세정제, 섬유유연제 등 다양한 제품들이 가정과 직장에서 편리함을 제공하고 있지만, 안전 기준을 충족하지 못한 제품이 시중에 유통될 경우 소비자의 건강과 환경에 심각한 피해를 줄 수 있습니다. 특히, 2025년 6월에 발표된 생활화학제품 위반 사례는 우리 생활과 밀접한 제품들이 안전성을 위협할 수 있다는 점에서 많은 이들의 주목을 받고 있습니다. 이번 글에서는 2025년 6월에 적발된 생활화학제품 위반 사례를 살펴보고, 어떤 문제점들이 드러났는지 확인하며, 이를 통해 우리가 이러한 제품을 사용할 때 반드시 주의해야 함을 강조하고자 합니다.2025년 6월 생활화학제품 위반제품 정보제품종류업체명제품명조치일자결함(위반)내용조치내용초릴리아나공방금빛눈꽃소이캔들(레몬라벤더 향)2025-06..
[오픈소스 AI] 야놀자, 한국어 번역 특화 AI 모델 EEVE-Rosetta-4B 공개 | 로컬 실행 가이드 안녕하세요,최근 국내 대표 여행·레저 플랫폼 기업인 야놀자에서 한국어 활용에 특화된 AI 언어 모델 EEVE-Rosetta-4B를 공개했습니다. 이 모델은 구글 Gemma 기반을 토대로 파인튜닝된 것으로, 경량화된 구조를 갖추면서도 번역과 요약, 감성 분석 등 다양한 자연어 처리 작업을 지원합니다. 특히 한국어 번역 성능을 강화한 점이 돋보이며, 오픈소스로 제공되어 누구나 로컬 환경에서 직접 실행하고 활용해볼 수 있습니다.이번 글에서는 EEVE-Rosetta-4B 모델의 특징을 살펴보고, 로컬 환경에서 실행하는 방법까지 단계별로 소개해 드리겠습니다.EEVE-Rosetta-4B 모델이란2025년 9월 1일, 국내 기업 야놀자는 한국어 번역에 특화된 언어 모델 EEVE-Rosetta-4B를 공개했습니다. 이..

728x90
반응형