안녕하세요,
최근 카카오에서 한국형 대형 언어모델을 공개하였습니다. 해당 모델은 오픈소스로 제공되어, 국내 기업이 개발한 대형 언어모델을 개발자가 직접 실행하고 검토할 수 있는 선택지가 추가되었습니다. 이번에 새롭게 공개는 글로벌 모델과는 차별화된, 한국어 문맥과 문화에 최적화된 한국어 전용 모델이 등장했다는 점에서 큰 의미가 있습니다.
이번 포스팅에서는 카카오가 공개한 Kanana-2 모델을 중심으로 관련 내용을 정리해보고자 합니다. 모델의 세부 구조와 특징에 대한 내용은 본문에서 순차적으로 다루겠습니다.
Kanana-2 란
Kanana-2는 카카오가 자체 개발하여 오픈소스로 공개한 차세대 대형 언어 모델입니다. 이 모델은 에이전틱 AI 구현에 최적화된 구조를 바탕으로, 사용자 명령의 맥락을 깊이 이해하고 도구 호출 및 복잡한 단계별 요구를 수행하는 능력이 강화되어 있습니다. Kanana-2는 일반적인 텍스트 생성 능력뿐 아니라 지시 이행, 도구 호출, 추론 작업까지 다룰 수 있도록 설계된 LLM 계열 모델입니다.
- Kakao 공식 블로그 : https://tech.kakao.com/posts/804
더 똑똑하고 효율적인 Kanana-2 오픈소스 공개 - tech.kakao.com
Kanana-2: Agentic AI 구현에 최적화된 언어모델 카카오가 자체 개발...
tech.kakao.com
[모델 정보 요약]
| 항목 | 모델 종류 | ||
| 모델 버전 | kanana-2-30b-a3b-base | kanana-2-30b-a3b-instruct | kanana-2-30b-a3b-thinking |
| 파라미터 수 | 30B (A3B 구조) | 30B (A3B 구조) | 30B (A3B 구조) |
| 개발사 | Kakao | Kakao | Kakao |
| 아키텍처 | 디코더형 트랜스포머 | 디코더형 트랜스포머 | 디코더형 트랜스포머 |
| 학습 단계 | 사전 학습(Pre-training) 가중치 포함 기본 모델 | Base 기반 사후 학습(Post-training) 모델 | 추론 특화 학습 적용 모델 |
| 특징 | - 파인튜닝용으로 적합한 기본 가중치 제공- 연구 및 자체 데이터 학습에 활용 가능 | - 사용자 지시 이행 능력 강화- 일반적인 대화·명령 처리에 최적화 | - 카카오 최초 공개 추론 특화 모델- 복잡한 논리적 사고 과제에 강점 |
| 사용 환경 | 연구 목적, 커스텀 파인튜닝 | 지시 기반 대화, 서비스형 AI | 복잡한 문제 해결, 고난도 추론 과제 |
| 라이선스 | 비상업적 오픈소스 | 비상업적 오픈소스 | 비상업적 오픈소스 |
| 모델 경로 | Hugging Face 제공 | Hugging Face 제공 | Hugging Face 제공 |
주요 특징
1) 다양한 모델 변형 제공 : Kanana-2는 크게 Base, Instruct, Thinking의 세 가지 변형으로 구성되어 있습니다.
- Base: 일반 언어 과업에 적합한 기본 모델
- Instruct: 사후 학습을 통해 지시 이행 능력이 강화된 모델
- Thinking: 복잡한 추론 작업과 심도 있는 사고에 특화된 모델
2) 에이전틱 AI 최적화 : 도구 호출(Tool Calling)과 사용자 지시 이행 능력이 이전 세대 대비 크게 개선되었습니다. 특히 다중 대화 도구 호출 능력이 전 세대에 비해 세 배 이상 향상된 것으로 보고되었습니다.
3) 아키텍처 최적화
- MLA(Multi-head Latent Attention): 긴 문맥 입력 처리 효율성 향상
- MoE(Mixture of Experts): 필요한 파라미터만 활성화하는 구조로 연산 비용과 응답 속도 최적화
4) 다국어 지원 : 한국어, 영어 뿐 아니라 일본어, 중국어, 태국어, 베트남어 등 총 6개 언어를 지원하여 다양한 지역 환경에서 활용 가능하도록 설계되었습니다.
벤치마크 성능
Instruct 모델은 동일한 구조를 기반으로 한 최신 대형 언어 모델인 Qwen3-30B-A3B와 유사한 수준의 성능을 나타내었습니다. 또한 복잡한 추론 과제가 요구되는 벤치마크에서도 Thinking 모델이 Qwen3-30B-A3B와 비교 가능한 성능을 기록하며, 추론 중심 작업에서도 경쟁력을 확인할 수 있었습니다.
아래 표는 KaKao 공식 블로그에서 공개한 결과를 바탕으로 Kanana-2와 Qwen-3 계열 모델의 성능을 주요 벤치마크를 기준으로 작성되었습니다.
| 벤치마크 | 모델 버전 | |||
| 추론 모델 | 지시 이행 모델 | |||
| Kanana2-30b-a3b- thinking |
Qwen3-30B-A3B Thinking |
Kanana2-30b-a3b- instruct |
Qwen3-30B-A3B Instruct |
|
| MMLU-Pro (다분야 지식 이해와 종합 추론 능력 평가) |
75.3 | 78.5 | 66.4 | – |
| GPQA Diamond (고난도 과학 문제 기반 추론 능력 평가) |
61.3 | 62.6 | 42.9 | – |
| AIME2025 (수학 경시대회 수준의 수리 추론 평가) |
72.7 | 70.7 | 19.0 | – |
| LiveCodeBench (실제 환경 기반 코드 생성 성능 평가) |
60.8 | 62.3 | 27.2 | – |
| IFEval (prompt strict) (엄격한 조건에서의 지시 이행 정확도 평가) |
– | – | 84.47 | 82.62 |
| IFBench (prompt strict) (복합 지시에 대한 지시 이행 능력 평가) |
– | – | 41.84 | 30.27 |
| Multi-IF (EN) (영어 다중 지시 처리 능력 평가) |
– | – | 75.81 | 77.93 |
| Multi-challenge (다양한 지시 상황에서의 종합 이행 성능 평가) |
– | – | 34.8 | 41.76 |
출처: Kakao 공식 블로그
라이선스
Kanan2 모델의 가중치, 코드, 문서 등은 Kanan License에 따라 제공되며, 연구·개인 개발뿐 아니라 자체 서비스 개발 및 운영 목적의 사용까지 허용됩니다. 모델의 수정, 파인튜닝, 파생 모델 생성 또한 가능하며, Kanana를 활용해 생성된 출력물에 대해서는 사용자가 권리를 보유합니다.
다만 Kanana 또는 파생 모델을 API, 클라우드, 원격 서비스 형태로 제3자에게 제공하거나, 시스템 통합(SI), 온프레미스 납품, 디바이스 내장 제품 등으로 외부에 판매·제공하는 경우에는 별도의 상업 라이선스가 필요합니다. 또한 월간 활성 사용자 수(MAU)가 1,000만 명을 초과하는 서비스에서 사용하는 경우에도 카카오의 사전 승인에 따른 상업 라이선스가 요구됩니다.
요약하면, 모델을 내부적으로 활용하는 상업 서비스는 허용되지만, 모델 자체를 외부에 제공·유통하거나 대규모 사용자 기반 서비스에 적용하는 경우에는 추가적인 상업 라이선스 체결이 필요한 구조입니다.
출처: Kanana 2 허깅페이스 라이선스
간단한 사용 예시
Kanana-2 모델은 허깅페이스를 통해 공개되어 있으며, 로컬 실행부터 서버형 추론 환경까지 다양한 방식으로 활용할 수 있습니다. 모델의 특성과 사용 목적에 따라 Transformers 기반 실행, vLLM 기반 고속 서빙, SGLang 기반 에이전트형 추론 환경 중 적절한 방식을 선택할 수 있습니다.
1. 로컬 실행 기반 (Transformers 사용)
모델 가중치를 직접 다운로드하여 로컬 PC 또는 자체 서버에서 실행하는 방식입니다. transformers 라이브러리를 사용해 텍스트 생성이나 지시 이행을 수행하며, 연구·실험·커스터마이징 목적에 적합합니다.
- 특징: 직접 제어 가능, 실험 및 개발에 용이, 로컬 GPU 환경 의존.
- 비용: 무료
- 활용: 연구, 테스트, 커스텀 파이프라인 구성
- 허깅페이스: https://huggingface.co/collections/kakaocorp/kanana-2
2. vLLM 기반 서버 실행
Kanana-2 모델을 vLLM 엔진으로 로딩하여 고속 추론 서버 형태로 실행하는 방식입니다. 다수의 요청을 효율적으로 처리할 수 있어 서비스 환경에서 활용하기에 적합합니다.
- 특징: 고속 추론 처리, KV 캐시 기반 메모리 최적화, 다중 요청 처리에 유리
- 비용: GPU 사용 비용 발생
- 활용: API 서버 구축, 대규모 추론 서비스 운영
- 사용방법: https://huggingface.co/kakaocorp/kanana-2-30b-a3b-instruct#quickstart
3. SGLang 기반 실행
Kanana-2 모델을 SGLang 런타임에서 실행하여 다단계 추론과 에이전트형 작업 흐름을 구성하는 방식입니다. 조건 분기와 반복 로직을 포함한 복합 추론 시나리오에 적합합니다.
- 특징: 에이전트형 추론 지원, 다단계 워크플로 구성에 유리, 추론 호출 증가 가능
- 비용: GPU 사용 비용 발생
- 활용: AI 에이전트 구현, 복합 추론 및 워크플로 기반 서비스
- 사용방법: https://huggingface.co/kakaocorp/kanana-2-30b-a3b-instruct#quickstart
Kanana-2는 로컬 실행, vLLM 기반 서버 실행, SGLang 기반 실행 등 다양한 활용 방식을 통해 연구·개발부터 서비스 운영까지 폭넓은 적용이 가능한 한국형 대형 언어 모델입니다. 사용자는 목적과 환경에 따라 실행 방식을 선택함으로써 실험 중심의 개발, 고속 추론 서버 구축, 에이전트형 워크플로 구현 등 서로 다른 요구를 효율적으로 충족할 수 있으며, 이를 통해 모델 활용의 유연성과 실용성을 동시에 확보할 수 있습니다.
향후 Kanana-2와 같은 모델은 단순한 언어 처리 도구를 넘어, 복합 추론과 자동화된 의사결정을 수행하는 핵심 인프라로서의 역할을 강화해 나갈 것을 기대해봅니다.
감사합니다. 😊
'AI 소식 > 오픈소스 AI 모델' 카테고리의 다른 글
| [오픈소스 AI] Z.AI가 공개한 프론티어급 AI 모델, GLM-4.7을 소개합니다. (0) | 2026.01.12 |
|---|---|
| [오픈소스 AI] 알리바바가 공개한 최신 이미지 생성 모델, Qwen-Image-2512 소개 (1) | 2026.01.09 |
| [오픈소스 AI] AllenAI의 완전 공개 언어 모델, Olmo-3.1을 소개합니다. (0) | 2025.12.22 |
| [오픈소스 AI] Mistral에서 공개한 에이전트형 코드 모델, Devstral 2 소개 (0) | 2025.12.15 |
| [오픈소스 AI] Essential AI가 공개한 차세대 언어 모델, Rnj-1 소개 (1) | 2025.12.11 |
