본문 바로가기

전체 글

(294)

이미지 인식 AI ‘FastVLM’ 출시｜애플의 비전-언어 모델 테스트 결과 정리 안녕하세요,최근 들어 다양한 기업들이 고도화된 AI 모델을 앞다투어 공개하고 있으며, 애플 또한 이 경쟁에 본격적으로 참여하고 있습니다.이번에 소개할 FastVLM은 애플이 공개한 비전‒언어 모델(Vision-Language Model)로, 이미지를 인식하고 텍스트로 설명할 수 있는 멀티모달 AI입니다.이 포스팅에서는 FastVLM 모델의 특징을 간략히 살펴보고, 실제로 로컬 환경에서 테스트를 진행한 결과를 함께 공유드리겠습니다.FastVLM 모델FastVLM은 입력 이미지 해상도를 높여도 토큰 수와 인코딩 지연(latency)을 최소화하도록 설계된 비전‒언어 모델입니다. FastViTHD 인코더를 사용해 시각 토큰 수를 줄이면서도 고해상도 이미지 분석 성능을 유지하며, LLaVA 기반 파이프라인에 쉽게..

[오픈소스 AI] 중국 Z.ai의 초강력 오픈소스 LLM, 'GLM-4.5'를 소개합니다. 안녕하세요,최근 오픈소스 대규모 언어모델(LLM)의 발전 속도가 눈에 띄게 빨라지고 있습니다. 특히 중국을 중심으로 공개되는 모델들은 기술적 완성도와 실제 성능 면에서 글로벌 상용 모델에 견줄 만큼 높은 수준을 보여주고 있습니다. 그중 Z.ai에서 발표한 GLM‑4.5는 뛰어난 추론 능력과 코드 생성, 에이전트 기능까지 아우르는 다재다능한 모델로 주목받고 있으며, MIT 라이선스를 통해 누구나 자유롭게 활용할 수 있도록 공개되었습니다.이번 글에서는 GLM‑4.5 모델의 구성과 성능, 활용 가능성에 대해 간략히 살펴보고자 합니다.GLM-4.5란 GLM‑4.5는 중국 Z.ai에서 2025년 7월에 공개한 오픈소스 인공지능 언어모델입니다. 복잡한 질문에 대한 추론, 코딩 작업, 에이전트 기능까지 모두 처리할 ..

알리바바가 만든 초강력 오픈소스 AI 코딩 모델, Qwen3-Coder를 소개합니다. | 오픈소스 AI | 코딩 특화 모델 | 안녕하세요,중국 기업 알리바바 클라우드에서 최근 매우 인상적인 코딩 특화 AI 모델을 공개하였습니다. 해당 모델은 오픈소스임에도 불구하고 챗봇 아레나(Chatbot Arena)에서 4위를 차지하며, 상위권 모델들과 어깨를 나란히 했습니다.이번 글에서는 알리바바가 공개한 AI 모델, Qwen3-Coder 모델의 구조와 주요 특징을 살펴보고, 글로벌 주요 모델들과의 벤치마크 결과를 통해 이 모델이 어느 수준의 성능을 보이는지 함께 알아보겠습니다.Qwen3-Coder 모델이란2025년 7월 22일, 알리바바 클라우드가 공개한 Qwen3-Coder 모델은 개발자 에이전트, 멀티턴 프로그래밍 워크플로, 소프트웨어 자동화 등 실제 개발 환경에 특화된 AI 코딩 에이전트입니다. 이 모델은 강력한 코드 생성 능력과 에..

Qwen3-Thinking 모델 공개｜글로벌 AI와 경쟁하는 알리바바의 오픈소스 LLM 안녕하세요,중국 알리바바에서 고성능 추론 능력을 갖춘 초대형 언어 모델을 새롭게 오픈소스로 공개하였습니다. 알리바바의 Qwen 시리즈는 그동안 다수의 한국형 AI 모델이 기술적 기반으로 삼아온 핵심 계열이며, 이번에 발표된 Qwen3‑235B‑A22B‑Thinking 모델은 특히 논리적 사고, 수학, 과학, 코딩 등 복잡한 추론 작업에 특화된 구조로 주목받고 있습니다.이 글에서는 알리바바가 공개한 Qwen3‑235B‑A22B‑Thinking 모델의 구조와 주요 특징을 살펴보고, 글로벌 주요 모델들과의 벤치마크 결과를 통해 이 모델이 어느 정도 수준의 성능을 갖추고 있는지 알아보겠습니다. Qwen3-235B-A22B-Thinking 모델알리바바는 Qwen 시리즈를 꾸준히 개발하며, 다양한 용도에 최적화된 ..

[오픈소스AI] NC소프트의 한국형 AI, VARCO‑VISION 2.0 모델을 소개합니다. 안녕하세요,최근 국내 대표 게임 기업 NC소프트가 자사 인공지능 연구 조직인 NC AI를 통해 한국어에 특화된 멀티모달 AI 모델을 공개했습니다. 이 모델은 중국 알리바바의 Qwen3 모델을 기반으로 파인튜닝된 것으로, 한국어 처리 능력을 대폭 향상시킨 것이 특징입니다.특히 이미지와 텍스트를 함께 이해하는 비전-언어 모델(VLM) 구조를 채택해, 문서 인식, OCR, 복잡한 시각 정보 해석 등 다양한 활용이 가능한 형태로 공개되었습니다. 이번 포스팅에서는 NC소프트가 공개한 대표 모델 중 하나인 VARCO‑VISION 2.0의 구조와 특징, 그리고 실제 사용 예시에 대해 자세히 살펴보겠습니다. Varco-Vision 2.0 이란2025년 7월 16일, 엔씨소프트의 인공지능 자회사 NC AI는 한국어 기반..

네이버 HyperCLOVA X SEED 14B Think 오픈소스 공개 | 한국형 AI | KLLM | 안녕하세요,최근 네이버는 자사의 대형 언어 모델인 HyperCLOVA를 공개한 데 이어, 경량화된 추론 특화 모델인 HyperCLOVA X SEED 14B Think를 오픈소스로 제공하였습니다. 이 모델은 상업적 이용까지 허용된 라이선스로 배포되어, 누구나 자유롭게 활용할 수 있다는 점에서 주목받고 있습니다. 특히 한국어 환경에 최적화된 성능과 뛰어난 추론 능력을 갖춘 점이 큰 장점입니다. 이번 글에서는 HyperCLOVA X SEED 14B Think 모델의 주요 특징과 함께, 로컬 환경에서 직접 실행하는 방법에 대해 자세히 알아보겠습니다.HyperCLOVAX-SEED-Think-14B HyperCLOVAX‑SEED‑Think‑14B는 2025년 7월 22일, 네이버 클라우드가 공개한 HyperCLOV..

AI를 노리는 새로운 해킹 수법, ‘프롬프트 인젝션’이란? 안녕하세요,최근 OpenAI에서도 AI 에이전트 기능을 공식적으로 출시하면서, 이제 AI는 단순한 LLM 모델을 넘어 다양한 시스템과 결합하여 '에이전트'로 진화하는 흐름이 뚜렷해지고 있습니다. 이러한 변화 속에서, AI 에이전트를 겨냥한 새로운 형태의 해킹 위협도 함께 주목받고 있습니다. 특히 사용자의 개입 없이도 공격이 이뤄지는 '제로 클릭 공격(Zero-Click Attack)'이 대표적인 예로 언급되고 있습니다. 이번 글에서는 이러한 보안 위협의 실체와 그 위험성에 대해 자세히 알아보겠습니다.프롬프트 인젝션이란?프롬프트 인젝션(Prompt Injection)은 생성형 AI의 취약점을 악용한 새로운 형태의 해킹 기법입니다. 공격자는 AI에게 전달되는 명령어(프롬프트)에 악의적인 지시를 몰래 숨겨 넣..

ChatGPT Agent 기능 업데이트: OpenAI가 만든 '작업형 AI'는 어떻게 달라졌나 안녕하세요,AI는 이제 정보를 알려주는 도우미를 넘어, 사용자의 업무를 직접 수행하는 조력자로 진화하고 있습니다. OpenAI가 새롭게 공개한 ChatGPT Agent는 이러한 흐름을 대표하는 기능으로, 단순한 응답 생성에 그치지 않고 웹 탐색, 파일 분석, 문서 작성, 반복 작업 자동화까지 가능하도록 설계되었습니다.이번 글에서는 ChatGPT Agent의 개념, 업데이트 내용, 주요 기능과 이용 조건을 간결하게 정리하였습니다. ChatGPT Agent 기능이란? OpenAI는 2025년 7월 25일, ChatGPT Agent 기능을 공식 출시하였습니다. 이 기능은 단순한 응답 생성에서 나아가, 브라우저 탐색, 파일 분석, 양식 작성, 반복 작업 예약 등 실제 업무를 수행할 수 있도록 확장된 기능입니다...

이전 1 ··· 6 7 8 9 10 11 12 ··· 37 다음

728x90

티스토리툴바