본문 바로가기

반응형

분류 전체보기

(255)
ChatGPT Agent 기능 업데이트: OpenAI가 만든 '작업형 AI'는 어떻게 달라졌나 안녕하세요,AI는 이제 정보를 알려주는 도우미를 넘어, 사용자의 업무를 직접 수행하는 조력자로 진화하고 있습니다. OpenAI가 새롭게 공개한 ChatGPT Agent는 이러한 흐름을 대표하는 기능으로, 단순한 응답 생성에 그치지 않고 웹 탐색, 파일 분석, 문서 작성, 반복 작업 자동화까지 가능하도록 설계되었습니다.이번 글에서는 ChatGPT Agent의 개념, 업데이트 내용, 주요 기능과 이용 조건을 간결하게 정리하였습니다. ChatGPT Agent 기능이란? OpenAI는 2025년 7월 25일, ChatGPT Agent 기능을 공식 출시하였습니다. 이 기능은 단순한 응답 생성에서 나아가, 브라우저 탐색, 파일 분석, 양식 작성, 반복 작업 예약 등 실제 업무를 수행할 수 있도록 확장된 기능입니다...
카카오 AI, Kanana-1.5-v-3b: 이미지·텍스트 동시 이해하는 국산 모델 소개 안녕하세요,우리나라 기업, 카카오에서 텍스트와 이미지를 동시에 이해할 수 있는 경량 멀티모달 언어모델, Kanana-1.5-v-3b를 공개했습니다. 이 모델은 약 36억 개의 파라미터를 기반으로 설계되어, 한국어와 영어 모두에 대응하며, 이미지 속 텍스트까지 정확하게 분석할 수 있는 기능을 갖추고 있습니다.이번 포스팅에서는 Kanana-1.5-v-3b의 핵심 기능과 실제 로컬 환경에서의 실행 결과를 중심으로, 한국어 이미지 인식 정확도, 응답 속도, VRAM 사용량 등을 직접 검증해 본 내용을 소개합니다. 국산 멀티모달 모델의 실용성을 확인하고자 하시는 분들께 유용한 정보가 될 수 있습니다.Kanana-1.5-v-3b 란 2025년 7월 24일, 카카오는 자사의 독자 기술로 개발한 경량형 멀티모달 언어모..
코난테크놀로지의 한국형 AI, Konan-LLM-OND 로컬 실행기 | 한국형 AI | KLLM 안녕하세요,최근 국내에서도 대형 언어 모델(LLM)에 대한 연구와 개발이 활발하게 이루어지고 있으며, 다양한 한국형 AI 모델들이 공개되고 있습니다. 이러한 흐름 속에서 코난테크놀로지에서 개발한 Konan-LLM-OND 모델을 공개했습니다. 이 모델은 Qwen3-4B-Base를 기반으로 파인튜닝된 한국어 특화 LLM 입니다.이번 포스팅에서는 Konan-LLM-OND 모델을 로컬 환경에서 직접 실행해보고, 그 성능과 활용 가능성에 대해 살펴보고자 합니다. Konan-LLM-OND 란?Konan-LLM-OND는 코난테크놀로지가 Qwen3-4B-Base 모델을 기반으로 개발한 대규모 언어 모델입니다. 이 모델은 한국어 환경에서의 성능과 효율성을 극대화하기 위해 어휘 확장, 지속적인 사전 학습, 그리고 명령어 ..
애플이 공개한 디퓨전 기반 LLM, DiffuCoder 모델 소개 및 사용법 안녕하세요,최근 들어 많은 테크 기업들이 AI 모델 개발에 적극적으로 투자하고 있으며, 그 중에서도 애플은 새로운 접근 방식을 적용한 dLLM(diffusion Language Model)을 공개하여 주목받고 있습니다. 이 모델은 기존의 LLM과는 다른 구조를 기반으로 작동하며, 정확도와 대규모 데이터 처리 측면에서 뛰어난 성능을 보이는 것으로 알려져 있습니다.이번 포스팅에서는 애플이 공개한 DiffuCoder 모델에 대해 살펴보고, 간단한 사용 예시를 통해 실제로 어떻게 활용할 수 있는지도 함께 알아보겠습니다. DiffuCoder란 DiffuCoder는 Apple에서 공개한 오픈소스 코드 생성 모델이며, Masked Diffusion Model(MDM)을 기반으로 한 대형 언어 모델입니다. DiffuC..
엔비디아 오디오 AI 모델 공개 - Audio Flamingo 3와 Canary-Qwen-2.5B 비교 | 오픈소스 AI | 오디오 AI 안녕하세요,AI 기술이 비약적으로 발전하면서, 이제는 텍스트를 넘어 소리를 이해하고 분석하는 '오디오 AI'의 시대가 열리고 있습니다. 이 기술 혁신의 중심에 있는 엔비디아(NVIDIA)가 최근 두 가지 강력한 오픈소스 오디오 AI 모델, 'Audio Flamingo 3'와 'Canary-Qwen-2.5B'를 공개했습니다. 하나는 소리의 의미를 깊이 있게 파악하는 '오디오 지능'에, 다른 하나는 압도적인 정확도로 음성을 텍스트로 변환하는 데에 초점을 맞추고 있습니다. 이 두 모델이 무엇이며, 어떤 차이가 있는지, 그리고 어떻게 활용할 수 있는지 알아보겠습니다.엔비디아의 오디오 AI 모델엔비디아(NVIDIA)는 2025년 7월, 불과 일주일 간격으로 두 가지의 혁신적인 오디오 AI 모델을 연이어 오픈소스로..
AgentSquad란? AWS가 만든 AI 에이전트 연결 프레임워크 | AI 에이전트 | AWS | 오픈소스 | 안녕하세요,요즘 AI 기술은 LLM 모델을 에이전트화 하는 방향으로 나가고 있습니다. 다양한 기업들이 이러한 AI 에이전트를 개발하고 있으며, AWS 또한 서로 다른 AI 모델이 상황에 따라 협력할 수 있도록 설계된 기술인 AgentSquad를 공개하였습니다. 이 기술은 각 AI 모델이 특정 역할을 맡아 유기적으로 협력할 수 있도록 구성되어 있으며, 다양한 상황에 맞춰 최적의 모델을 자동으로 선택해 사용할 수 있다는 점에서 매우 유용합니다.이번 포스팅에서는 AgentSquad란 무엇인지, 어떤 특징을 갖고 있는지, 그리고 간단한 실행 예시를 통해 어떻게 활용할 수 있는지를 함께 살펴보겠습니다. AgentSquad란 AgentSquad는 AWS(Amazon Web Services)에서 개발한 멀티 에이전트..
Kimi-K2란? Moonshot AI가 만든 초대형 오픈소스 언어 모델 정리 | 오픈소스 AI | 중국 AI 모델 | 안녕하세요,최근 중국의 AI 기업 Moonshot AI가 공개한 Kimi-K2 모델이 주목받고 있습니다. 이 모델은 1조 파라미터 규모의 MoE(Mixture-of-Experts) 구조, 128K 문맥 길이, 오픈소스 공개 등에서 강력한 스펙을 갖추고 있으며, 허깅페이스를 통해 누구나 사용할 수 있도록 제공되고 있습니다. 특히 GPT-4, Gemini 2.5 등 글로벌 대표 LLM과 비교 가능한 성능을 보여주면서도, 모델 구조와 벤치마크 성능을 투명하게 공개하고 있어 실용성과 신뢰성을 모두 갖춘 모델로 평가받고 있습니다.이 포스팅에서는 Kimi-K2 모델의 주요 특징과 성능, 오픈소스 제공 범위에 대해 상세히 살펴보겠습니다.Kimi AI란Kimi AI는 중국의 인공지능 기업 Moonshot AI에서 개발..
한국형 AI 모델 한눈에 보기: 네이버·LG·KT·SKT 최신 K-LLM 성능 비교 안녕하세요,최근 국내 AI 시장의 열기가 그 어느 때보다 뜨겁습니다. 네이버, LG, KT, SKT, 업스테이지 등 주요 기업들이 앞다투어 자사의 독자적인 AI 모델을 공개하며 본격적인 기술 경쟁에 나서고 있습니다. 이러한 흐름 속에서 어떤 한국형 AI 모델들이 등장했는지, 각 모델의 특징과 성능은 어떤지를 정리해 보았습니다.지금까지 공개된 K-LLM 현황을 한눈에 정리했으니, 관심 있는 분들께 유용한 참고 자료가 되기를 바랍니다.한국형 AI 모델, K-LLM최근 정부 주도의 AI 기술 자립 및 경쟁력 강화를 위한 다양한 사업이 본격적으로 추진되면서, 국내 인공지능 생태계에 큰 변화가 일어나고 있습니다. 이에 발맞춰 네이버, LG, KT, SKT, 업스테이지 등 다양한 기업들이 한국어에 최적화된 독자적인..

728x90
반응형