본문 바로가기

AI 소식/오픈소스 AI 모델

[오픈소스 AI] LG가 공개한 한국형 AI 모델, K-EXAONE-236B 소개

안녕하세요,
최근 국내에서도 인공지능 기술 개발에 대한 관심과 투자가 빠르게 확대되고 있으며, 기업들은 자체 모델을 통해 고유한 기술 경쟁력을 확보하려는 노력을 이어가고 있습니다. 특히 LG가 공개한 K-EXAONE 시리즈는 이러한 흐름을 대표하는 한국형 대규모 언어 모델로, 다양한 실사용 환경을 지원하는 점에서 주목받고 있습니다.

이번 글에서는 K-EXAONE-236B-A23B 모델의 특징과 성능, 활용 방식 등을 중심으로 자세히 알아보겠습니다.


반응형

K-EXAONE-236B-A23B 모델이란

2026년 1월 12일, 국내 기업, LG AI 연구원에서 한국형 LLM, K-EXAONE-236B-A23B을 공개했습니다. K-EXAONE-236B-A23BLG AI Research에서 개발한 대규모 언어 모델로, 한국에서 독자적으로 설계한 파운데이션 AI 모델입니다. Mixture-of-Experts(MoE) 구조를 기반으로 설계되어 전체 파라미터 수는 약 2360억이지만 추론 시에는 활성화되는 파라미터가 약 230억 수준으로 효율적으로 동작합니다. 해당 모델은 다국어 지원과 긴 문맥 처리 능력, 복합적인 추론 능력 등을 목표로 만들어졌으며, 텍스트 기반 입력·출력 환경에서 활용할 수 있도록 설계되었습니다.

 

 

독자 기술로 완성한 대한민국 대표 AI: K-EXAONE - LG AI Research BLOG

 

www.lgresearch.ai

 

[모델 정보 요약]

항목 내용
모델명 K-EXAONE-236B-A23B
개발사 LG AI연구원
파라미터 수 23B / 236B (활성 / 전체)
아키텍처 Mixture-of-Experts(MoE)
특징 - 한국어·다국어 대응
- 256K 문맥 길이
- Multi-Token Prediction
사용 환경 API / 로컬 환경 / 외부 서버
라이선스 K-EXAONE AI Model License
모델 경로 Hugging Face 제공

 

 

주요 특징

K-EXAONE-236B-A23B 모델의 주요 특징은 다음과 같습니다.

  • 구조 및 효율성 : K-EXAONE-236B-A23B는 Mixture-of-Experts 아키텍처를 채택하여 필요에 따라 일부 전문가 네트워크만 활성화함으로써 연산 효율을 높였습니다. 이와 함께 Multi-Token Prediction(MTP) 기법을 적용해 추론 처리 속도를 약 1.5배 정도 향상하도록 설계되었습니다.
  • 긴 문맥 처리 : 기본적으로 256K 토큰 길이의 문맥을 지원하며, 메모리 부담을 줄이기 위한 하이브리드 어텐션 구조가 적용되어 장문 입력 처리에서의 성능을 높입니다.
  • 다국어 대응 : 한국어와 영어를 비롯하여 스페인어, 독일어, 일본어, 베트남어 등 6개 언어를 처리할 수 있는 다국어 지원 기능을 갖추고 있습니다. 어휘 사전은 SuperBPE 기반으로 구성되어 토큰 효율이 증가되었습니다.
  • 에이전트 및 도구 활용 : 도구 호출(tool call)이나 다중 에이전트 전략을 통한 복합 작업 수행 능력이 강화되어, 외부 함수 호출 등의 에이전트 특화 활용이 가능합니다.

 

 

벤치마크 성능

벤치마크 결과를 종합하면 K-EXAONE-236B-A23B 모델이 여러 영역에서 안정적인 성능을 보여준다는 점을 확인할 수 있습니다. 세계 지식, 고난도 수학, 실전 코딩 등 핵심 지표에서 경쟁 모델과 유사하거나 높은 수준을 기록하며 전반적인 균형이 돋보입니다. 특히 한국어 이해와 안전성 분야에서는 가장 높은 점수를 나타내어 국내 환경에서 활용성이 높다는 강점이 드러납니다.

벤치마크 항목 K-EXAONE gpt-oss-120b (high) Qwen3-235B-A22B-
Thinking-2507
MMLU-Pro
(다양한 분야의 일반 지식·전문 지식 이해도 평가)
83.8 80.7 84.4
AIME 2025
(고난도 수학 문제 해결 능력 평가)
92.8 92.5 92.3
LiveCodeBench v6
(코드 생성, 디버깅 등 실전 코딩 능력 평가)
80.7 81.9 74.1
τ²-Bench
(외부 도구·API를 이해하고 올바르게 사용하는 능력 평가)
73.2 63.9 58.6
IFBench
(사용자 지시를 정확하게 이해하고 수행하는 능력 평가)
67.3 69.5 52.6
KoBALT
(한국어 독해·추론·의미 파악 능력 평가)
61.8 54.3 56.1
MMMLU
(다양한 언어에 대한 지식·이해·추론 능력 평가)
85.7 83.8 87.3
KGC-Safety
(유해 발화 방지 및 안전한 응답 생성 능력 평가)
96.1 92.5 66.2
출처: LG AI 연구원 공식 블로그

 

 

라이선스

K-EXAONE-236B-A23B 모델은 K-EXAONE AI Model License Agreement를 기반으로 제공되는 개방형 모델입니다. 이 라이선스는 연구·교육 목적뿐 아니라 기업 환경에서의 응용과 상업적 서비스 개발까지 폭넓은 활용을 허용하도록 설계되었습니다. 사용자는 모델을 자유롭게 다운로드하여 분석하거나, 파인튜닝과 구조 개선을 포함한 파생 모델 개발에도 제한 없이 적용할 수 있으며, 생성된 결과물(Output)에 대한 별도의 이용 제한도 두지 않습니다. 특히 내부 시스템에 모델을 통합하거나 상용 서비스 운영에 사용하는 것도 허용되어 실용성과 개방성을 균형 있게 갖춘 라이선스로 평가됩니다. 다만 모델 자체 또는 파생 모델을 외부에 제공·판매·API 형태로 배포하려는 경우에는 별도의 계약이 필요하다는 점이 핵심적인 조건으로 제시됩니다.

 

주요 특징은 다음과 같습니다.

  • 상업적 사용 허용 : 모델을 활용한 제품 개발, 기업 시스템 구축, 서비스 운영 등 대부분의 비즈니스 목적 사용이 허용됩니다. 내부에서 모델을 실행하는 형태라면 별도의 승인 없이 상용 환경에 적용할 수 있습니다.
  • 수정·파생 모델 제작 가능 : 모델 수정, 파인튜닝, 경량화, 아키텍처 변경 등 파생 모델 개발이 자유롭게 허용되며, 이를 내부적으로 활용하는 경우 추가 조건이 요구되지 않습니다.
  • 배포 시 조건 부여 : 모델 또는 파생 모델을 외부에 재배포하거나 제3자에게 제공하는 경우, 반드시 K-EXAONE 라이선스를 함께 포함해야 하며, 모델 명칭은 “K-EXAONE”으로 시작해야 합니다. 또한 상업적 제공 형태(예: API 서비스, 판매)에는 별도 계약이 필요합니다.
  • 책임 있는 사용 원칙 준수 : 허위 정보 생성, 차별적 콘텐츠 생산, 불법적 활동, 개인 권리 침해 등 약관에서 금지한 사용 사례는 허용되지 않습니다. 사용자는 모델이 유해한 목적으로 악용되지 않도록 적절한 조치를 취해야 합니다.

자세한 내용은 아래 K-EXAONE AI Model License Agreement 전문을 확인하시기 바랍니다.

출처: K-EXAONE AI Model License Agreement

 


 

간단한 사용 예시

K-EXAONE-236B-A23B 모델은 Hugging Face를 비롯한 외부 서버 기반 추론 환경에서 활용할 수 있으며, API 서비스부터 고성능 GPU 인프라에서의 직접 실행까지 다양한 방식으로 적용할 수 있는 구조를 가지고 있습니다. 사용자는 목적에 따라 FriendliAI API, 허깅페이스 모델 다운로드, 또는 vLLM·SGLang 기반의 고속 서빙 옵션 중 적절한 방식을 선택할 수 있습니다.

 

1. FriendliAI (공식 API 기반 서비스)

K-EXAONE-236B-A23B는 FriendliAI 플랫폼을 통해 바로 실행할 수 있으며, 별도의 설치 과정 없이 API 형태로 고성능 추론 기능을 사용할 수 있습니다. 텍스트 생성, 분석, 요약 등 다양한 활용이 가능해 초기 검증 및 서비스 구축에 효율적입니다.

  • 특징: 클라우드 기반 추론, 설치 불필요, 서비스 지향 구조
  • 비용: FriendliAI 요금 정책 적용 (2026년 1월 28일까지 한시적 무료 제공)
  • 활용: 텍스트 생성, 문서 처리, 실시간 API 서비스 구축
  • 공식 페이지: https://friendli.ai/

출처: FriendliAI 공식페이지 (클릭시 페이지 이동)

 

2. 허깅페이스 (로컬 실행 기반)

K-EXAONE-236B-A23B는 Hugging Face에서 모델을 다운로드하여 직접 관리하는 GPU 서버 환경에서 실행할 수 있습니다. Transformers 기반 추론, 파인튜닝, 커스텀 파이프라인 구축 등이 가능하며, 파생 모델 연구나 기업 내부 시스템 통합에도 활용할 수 있습니다.

  • 특징: 모델 제어권 확보, 파인튜닝 가능, 다양한 프레임워크 지원
  • 비용: 무료 (라이선스 조건 범위 내)
  • 활용: 연구·개발 환경, 기업 내부 서비스, 커스텀 LLM 구축
  • 허깅페이스: https://huggingface.co/LGAI-EXAONE/K-EXAONE-236B-A23B

출처: LG AI 허깅페이스 (클릭시 페이지 이동)

3. 외부 서버 환경 (vLLM·SGLang 기반 고속 서빙)

K-EXAONE-236B-A23B는 모델 규모 특성상 고성능 GPU 인프라에서의 실행이 필요하며, vLLM·SGLang과 같은 고속 추론 엔진을 활용하여 효율적인 서빙 환경을 구축할 수 있습니다. 이러한 방식은 대규모 요청 처리나 낮은 레이턴시가 필요한 상용 서비스 환경에서 특히 유용합니다.

  • 특징: 고속 추론 처리, 대규모 동시 요청 대응, 효율적인 GPU 메모리 활용
  • 비용: 서버 인프라 비용
  • 활용: 실시간 챗봇 서비스, 대량 문서 처리 시스템, 기업용 AI API 구축
  • 지원 프레임워크: vLLM, SGLang, llama.cpp(GGUF 변환 기반)
  • 참고 리포지토리: LGAI 허깅페이스

 


 

K-EXAONE-236B-A23B 모델은 대규모 언어 모델이 요구하는 지식 이해, 다국어 처리, 안전성, 추론 능력 등 핵심 지표 전반에서 균형 잡힌 성능을 보여주는 구조로 설계되어 있습니다. API 기반 사용부터 고성능 서버 환경에서의 추론까지 폭넓은 활용 방식을 지원하며, 기업 시스템에 직접 통합하거나 연구·개발 과정에서 실질적인 생산성을 높일 수 있는 기술적 기반을 제공합니다. 모델 자체의 개방성과 수정·재구성이 가능한 라이선스 구조는 확장성과 실용성을 함께 담보하는 요소로 평가됩니다.

 

현재 FriendliAI를 통해 1월 28일까지 API가 한시적으로 무료로 제공되고 있어, 별도의 비용 부담 없이 직접 모델을 체험해볼 수 있는 기회를 제공합니다. 사용 환경에 맞는 방식으로 실행해보시면 실제 서비스 적용 가능성이나 프로젝트 활용성을 보다 명확하게 확인하실 수 있으니, 이번 기간을 활용하여 K-EXAONE 모델을 경험해보시기를 권합니다.

 

 

감사합니다. 😊

 

반응형