본문 바로가기

전체 글

(252)

알리바바가 만든 초강력 오픈소스 AI 코딩 모델, Qwen3-Coder를 소개합니다. | 오픈소스 AI | 코딩 특화 모델 | 안녕하세요,중국 기업 알리바바 클라우드에서 최근 매우 인상적인 코딩 특화 AI 모델을 공개하였습니다. 해당 모델은 오픈소스임에도 불구하고 챗봇 아레나(Chatbot Arena)에서 4위를 차지하며, 상위권 모델들과 어깨를 나란히 했습니다.이번 글에서는 알리바바가 공개한 AI 모델, Qwen3-Coder 모델의 구조와 주요 특징을 살펴보고, 글로벌 주요 모델들과의 벤치마크 결과를 통해 이 모델이 어느 수준의 성능을 보이는지 함께 알아보겠습니다.Qwen3-Coder 모델이란2025년 7월 22일, 알리바바 클라우드가 공개한 Qwen3-Coder 모델은 개발자 에이전트, 멀티턴 프로그래밍 워크플로, 소프트웨어 자동화 등 실제 개발 환경에 특화된 AI 코딩 에이전트입니다. 이 모델은 강력한 코드 생성 능력과 에..

Qwen3-Thinking 모델 공개｜글로벌 AI와 경쟁하는 알리바바의 오픈소스 LLM 안녕하세요,중국 알리바바에서 고성능 추론 능력을 갖춘 초대형 언어 모델을 새롭게 오픈소스로 공개하였습니다. 알리바바의 Qwen 시리즈는 그동안 다수의 한국형 AI 모델이 기술적 기반으로 삼아온 핵심 계열이며, 이번에 발표된 Qwen3‑235B‑A22B‑Thinking 모델은 특히 논리적 사고, 수학, 과학, 코딩 등 복잡한 추론 작업에 특화된 구조로 주목받고 있습니다.이 글에서는 알리바바가 공개한 Qwen3‑235B‑A22B‑Thinking 모델의 구조와 주요 특징을 살펴보고, 글로벌 주요 모델들과의 벤치마크 결과를 통해 이 모델이 어느 정도 수준의 성능을 갖추고 있는지 알아보겠습니다. Qwen3-235B-A22B-Thinking 모델알리바바는 Qwen 시리즈를 꾸준히 개발하며, 다양한 용도에 최적화된 ..

[오픈소스AI] NC소프트의 한국형 AI, VARCO‑VISION 2.0 모델을 소개합니다. 안녕하세요,최근 국내 대표 게임 기업 NC소프트가 자사 인공지능 연구 조직인 NC AI를 통해 한국어에 특화된 멀티모달 AI 모델을 공개했습니다. 이 모델은 중국 알리바바의 Qwen3 모델을 기반으로 파인튜닝된 것으로, 한국어 처리 능력을 대폭 향상시킨 것이 특징입니다.특히 이미지와 텍스트를 함께 이해하는 비전-언어 모델(VLM) 구조를 채택해, 문서 인식, OCR, 복잡한 시각 정보 해석 등 다양한 활용이 가능한 형태로 공개되었습니다. 이번 포스팅에서는 NC소프트가 공개한 대표 모델 중 하나인 VARCO‑VISION 2.0의 구조와 특징, 그리고 실제 사용 예시에 대해 자세히 살펴보겠습니다. Varco-Vision 2.0 이란2025년 7월 16일, 엔씨소프트의 인공지능 자회사 NC AI는 한국어 기반..

네이버 HyperCLOVA X SEED 14B Think 오픈소스 공개 | 한국형 AI | KLLM | 안녕하세요,최근 네이버는 자사의 대형 언어 모델인 HyperCLOVA를 공개한 데 이어, 경량화된 추론 특화 모델인 HyperCLOVA X SEED 14B Think를 오픈소스로 제공하였습니다. 이 모델은 상업적 이용까지 허용된 라이선스로 배포되어, 누구나 자유롭게 활용할 수 있다는 점에서 주목받고 있습니다. 특히 한국어 환경에 최적화된 성능과 뛰어난 추론 능력을 갖춘 점이 큰 장점입니다. 이번 글에서는 HyperCLOVA X SEED 14B Think 모델의 주요 특징과 함께, 로컬 환경에서 직접 실행하는 방법에 대해 자세히 알아보겠습니다.HyperCLOVAX-SEED-Think-14B HyperCLOVAX‑SEED‑Think‑14B는 2025년 7월 22일, 네이버 클라우드가 공개한 HyperCLOV..

AI를 노리는 새로운 해킹 수법, ‘프롬프트 인젝션’이란? 안녕하세요,최근 OpenAI에서도 AI 에이전트 기능을 공식적으로 출시하면서, 이제 AI는 단순한 LLM 모델을 넘어 다양한 시스템과 결합하여 '에이전트'로 진화하는 흐름이 뚜렷해지고 있습니다. 이러한 변화 속에서, AI 에이전트를 겨냥한 새로운 형태의 해킹 위협도 함께 주목받고 있습니다. 특히 사용자의 개입 없이도 공격이 이뤄지는 '제로 클릭 공격(Zero-Click Attack)'이 대표적인 예로 언급되고 있습니다. 이번 글에서는 이러한 보안 위협의 실체와 그 위험성에 대해 자세히 알아보겠습니다.프롬프트 인젝션이란?프롬프트 인젝션(Prompt Injection)은 생성형 AI의 취약점을 악용한 새로운 형태의 해킹 기법입니다. 공격자는 AI에게 전달되는 명령어(프롬프트)에 악의적인 지시를 몰래 숨겨 넣..

ChatGPT Agent 기능 업데이트: OpenAI가 만든 '작업형 AI'는 어떻게 달라졌나 안녕하세요,AI는 이제 정보를 알려주는 도우미를 넘어, 사용자의 업무를 직접 수행하는 조력자로 진화하고 있습니다. OpenAI가 새롭게 공개한 ChatGPT Agent는 이러한 흐름을 대표하는 기능으로, 단순한 응답 생성에 그치지 않고 웹 탐색, 파일 분석, 문서 작성, 반복 작업 자동화까지 가능하도록 설계되었습니다.이번 글에서는 ChatGPT Agent의 개념, 업데이트 내용, 주요 기능과 이용 조건을 간결하게 정리하였습니다. ChatGPT Agent 기능이란? OpenAI는 2025년 7월 25일, ChatGPT Agent 기능을 공식 출시하였습니다. 이 기능은 단순한 응답 생성에서 나아가, 브라우저 탐색, 파일 분석, 양식 작성, 반복 작업 예약 등 실제 업무를 수행할 수 있도록 확장된 기능입니다...

카카오 AI, Kanana-1.5-v-3b: 이미지·텍스트 동시 이해하는 국산 모델 소개 안녕하세요,우리나라 기업, 카카오에서 텍스트와 이미지를 동시에 이해할 수 있는 경량 멀티모달 언어모델, Kanana-1.5-v-3b를 공개했습니다. 이 모델은 약 36억 개의 파라미터를 기반으로 설계되어, 한국어와 영어 모두에 대응하며, 이미지 속 텍스트까지 정확하게 분석할 수 있는 기능을 갖추고 있습니다.이번 포스팅에서는 Kanana-1.5-v-3b의 핵심 기능과 실제 로컬 환경에서의 실행 결과를 중심으로, 한국어 이미지 인식 정확도, 응답 속도, VRAM 사용량 등을 직접 검증해 본 내용을 소개합니다. 국산 멀티모달 모델의 실용성을 확인하고자 하시는 분들께 유용한 정보가 될 수 있습니다.Kanana-1.5-v-3b 란 2025년 7월 24일, 카카오는 자사의 독자 기술로 개발한 경량형 멀티모달 언어모..

코난테크놀로지의 한국형 AI, Konan-LLM-OND 로컬 실행기 | 한국형 AI | KLLM 안녕하세요,최근 국내에서도 대형 언어 모델(LLM)에 대한 연구와 개발이 활발하게 이루어지고 있으며, 다양한 한국형 AI 모델들이 공개되고 있습니다. 이러한 흐름 속에서 코난테크놀로지에서 개발한 Konan-LLM-OND 모델을 공개했습니다. 이 모델은 Qwen3-4B-Base를 기반으로 파인튜닝된 한국어 특화 LLM 입니다.이번 포스팅에서는 Konan-LLM-OND 모델을 로컬 환경에서 직접 실행해보고, 그 성능과 활용 가능성에 대해 살펴보고자 합니다. Konan-LLM-OND 란?Konan-LLM-OND는 코난테크놀로지가 Qwen3-4B-Base 모델을 기반으로 개발한 대규모 언어 모델입니다. 이 모델은 한국어 환경에서의 성능과 효율성을 극대화하기 위해 어휘 확장, 지속적인 사전 학습, 그리고 명령어 ..

이전 1 2 3 4 5 6 7 ··· 32 다음

728x90

티스토리툴바