안녕하세요,
최근 국내에서 AI 개발 사업으로 인해 여러 기업들이 AI 모델 개발에 속도를 내고 있습니다. 이러한 흐름 속에서 국내 기업 업스테이지가 공개한 모델이 이슈로 인해 잠깐 화제를 모으기도 했지만, 공개 검증과 기술적 설명을 통해 빠르게 정리되며 오히려 더 큰 주목을 받는 계기가 되었습니다. 이번 글에서는 이러한 배경 속에서 등장한 Solar-Open-100B 모델의 특징과 성능, 그리고 실제 활용 방법까지 함께 살펴보겠습니다.
Solar-Open-100B 모델이란
2025년 12월 30일, 한국 AI 기업 업스테이지가 자체 기술로 개발한 초대형 언어 모델 Solar-Open-100B를 공식 공개했습니다. 이 모델은 약 1020억(102B) 파라미터 규모로 구축되었으며, 핵심 구조로 Mixture-of-Experts(MoE) 방식을 적용해 필요한 전문가 레이어만 선택적으로 활성화하도록 설계되어 있습니다. 이러한 구조는 대형 모델임에도 불구하고 보다 효율적인 추론과 안정적인 처리 속도를 확보하는 데 초점을 두고 있습니다.
해당 모델은 과학기술정보통신부가 추진한 ‘독자 AI 파운데이션 모델 프로젝트’의 일환으로 개발되었으며, 학습 데이터 구축부터 모델 훈련까지 전 과정이 업스테이지 내부에서 직접 수행되었습니다.
- Solar-Open-100B 허깅페이스 : https://huggingface.co/upstage/Solar-Open-100B
upstage/Solar-Open-100B · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
[모델 정보 요약]
| 항목 | 내용 |
| 모델명 | Solar-Open-100B |
| 개발사 | 업스테이지 |
| 아키텍처 | Mixture-of-Experts(MoE) |
| 파라미터 수 | 12B (활성) / 102B (전체) |
| 학습 단계 | 약 19.7조 토큰 기반 사전학습(From Scratch) |
| 특징 | - 12B 활성 파라미터 기반 효율적 추론 - 최대 128k 컨텍스트 - 한국어·영어·일본어 대응 |
| 사용 환경 | Hugging Face Transformers 기반 로컬/클라우드 실행 허깅페이스 / 로컬 환경 |
| 라이선스 | Solar-Apache License 2.0 (모델) |
| 모델 경로 | Hugging Face 제공 |
주요 특징
- Mixture-of-Experts(MoE) 아키텍처: 전체 102B 파라미터 중 약 12B만 활성화하여 효율적인 추론이 가능하도록 설계된 구조입니다.
- 광범위한 사전학습 데이터: 약 19.7조 토큰 규모의 데이터를 활용해 사전학습이 수행되어 다양한 도메인에 대응할 수 있는 폭넓은 언어 지식을 보유하고 있습니다.
- 대규모 컨텍스트 길이: 최대 128k 길이의 컨텍스트를 처리할 수 있어 긴 문장이나 문서 단위 입력에도 대응이 가능합니다.
- 추론 효율 최적화: MoE 구조를 통해 전통적인 대형 모델 대비 추론비용을 낮추는 설계가 포함되어 있습니다.
- 한국어 및 다국어 대응: 한국어를 포함한 영어, 일본어 등 다수 언어에 걸친 사전학습 성능을 목표로 제작되었습니다.
벤치마크 성능
한국어 벤치마크 전반에서 Solar-Open-100B는 동일급 글로벌 모델과 비교해 가장 안정적인 결과를 보여주는 것으로 확인됩니다. 특히 일반 지식 이해, 독해력, 상식 기반 추론 등 다양한 영역에서 균형 잡힌 성능을 나타내며, 한국어 특화 활용 환경에서 높은 신뢰도를 기대할 수 있는 점이 특징입니다.
반면 영어 벤치마크에서는 일부 항목에서 글로벌 대형 모델의 성능이 앞서지만, 핵심 지표에서는 유사한 수준을 유지하며 전반적으로 경쟁력 있는 결과를 기록하고 있습니다. 이러한 흐름은 Solar-Open-100B가 한국어 중심의 응용 분야에서 강점을 가진 모델임을 보여주는 대목입니다.
| 카테 고리 |
벤치마크 | Solar Open (102B) |
gpt-oss-120b (117B, high) |
GLM-4.5-Air (110B) |
| 한국어 | KMMLU (한국어 전반의 지식 이해와 문제 해결 능력을 평가) |
73.0 | 72.7 | 70.2 |
| MMLU-Pro (다분야 지식 이해와 종합 추론 능력 평가) |
64.0 | 62.6 | 60.7 | |
| CLIcK (한국어 기반 상식·추론 능력을 중심으로 평가) |
78.9 | 77.2 | 48.3 | |
| HAE-RAE v1.1 (한국어 읽기 이해 및 문맥 추론 능력을 평가) |
73.3 | 70.8 | 42.6 | |
| 영어 | MMLU (광범위한 분야 지식을 활용한 영어 문제 해결 능력 평가) |
88.2 | 88.6 | 83.3 |
| MMLU-Pro (다분야 지식 이해와 종합 추론 능력 평가) |
80.4 | 80.4 | 81.4 | |
| GPQA-Diamond (고난도 과학·전문 분야 중심의 reasoning 능력 평가) |
68.1 | 78.0 | 75.8 | |
| AIME 2025 (수학적 사고력과 문제 해결 능력을 평가하는 난도 높은 시험 기반) |
84.3 | 91.7 | 82.7 |
출처: Solar-Open-100B 허깅페이스
라이선스
Solar-Open-100B 모델은 Solar-Apache License 2.0을 기반으로 공개된 오픈소스 모델입니다. 이 라이선스는 Apache License 2.0의 기본 원칙을 그대로 계승하며, 연구·교육 목적은 물론 상업적 활용에 대해서도 폭넓은 권리를 보장합니다. 사용자에게는 별도의 로열티나 비용 부담 없이 모델을 비즈니스 환경에 도입하고 운영할 수 있는 자유가 제공됩니다. 특히 Solar-Apache License 2.0은 상업적 사용을 포함한 폭넓은 활용을 허용하면서도, 파생 모델을 재배포할 때 최소한의 브랜드 명시만 요구하는 점에서 실용성과 개방성을 모두 갖춘 라이선스라 할 수 있습니다.
주요 특징은 다음과 같습니다.
- 수정 및 재배포의 자유성 : 모델 수정과 파인튜닝이 자유롭게 허용되며, 원본 모델을 그대로 사용하는 경우 별도 조건 없이 상업적 서비스에 활용할 수 있습니다.
- 상용 서비스 구현 및 통합 : 유료 서비스 개발, 기업 시스템 연동 등 다양한 비즈니스 활용이 가능하며, 원본 사용 시 브랜드 표기 의무도 없습니다.
- 파생 모델 배포 시 최소 조건 : 파인튜닝한 모델을 외부에 배포할 경우에만 ‘Solar-’ 접두어와 ‘Built with Solar’ 표기를 요구합니다.
- 커스텀 최적화 보장 : 특정 목적의 파인튜닝·경량화 작업에 제약이 거의 없으며, 내부 활용 범위에서는 라이선스 제한이 사실상 없습니다.
자세한 사항은 아래에 연결된 Solar의 허깅페이스에서 제공하는 Solar-Apache License를 참고하시길 바랍니다.
출처: Solar-Apache License
간단한 사용 예시
Solar-Open-100B 모델은 허깅페이스를 통해 공개되어 있으며, 로컬 환경에서 직접 실행하거나 고성능 서버 기반의 추론 환경을 구성하는 등 다양한 방식으로 활용할 수 있는 구조를 갖추고 있습니다. 사용 목적에 따라 Transformers 기반 로컬 실행, vLLM 서버 추론, 또는 추후 제공될 공식 API 방식 중 적절한 활용 방법을 선택할 수 있습니다.
1. 허깅페이스 (로컬 실행 기반)
Solar-Open-100B는 허깅페이스 Transformers를 활용해 로컬 환경에서 바로 불러와 실행할 수 있습니다. 개발자는 모델과 토크나이저를 다운로드한 뒤 텍스트 생성, 질의응답, 문서 분석 등 다양한 작업을 Python 코드 한두 줄만으로 수행할 수 있습니다.
- 특징: Python 기반 실행, 모든 기능 직접 제어, 다양한 커스텀 가능
- 비용: 무료 (Apache License 2.0 라이선스 기반)
- 요구사항: GPU 환경(BF16 권장), 모델·토크나이저 다운로드 필요
- 활용: 텍스트 생성, 질의응답, 코드 생성, 연구·프로토타입 개발
- 참고: https://huggingface.co/upstage/Solar-Open-100B
2. 자체 서버 환경 (vLLM 기반 고속 서빙)
대규모 모델을 보다 효율적으로 서빙하려면 vLLM을 활용한 서버 환경 구축이 적합합니다. Solar-Open-100B는 길어진 컨텍스트 길이(최대 128k)를 효과적으로 처리할 수 있으며, 병렬 요청 처리에도 유리하여 실제 서비스용 API 서버 구성에 널리 활용됩니다.
- 특징: 고속 추론, 효율적인 메모리 사용, 긴 컨텍스트 지원
- 비용: 무료 (Apache License 2.0 라이선스 기반)
- 요구사항: GPU 서버 환경, vLLM 설치
- 활용: 서비스 백엔드 API, 다중 사용자 요청 처리, 대화형 애플리케이션
- 참고: https://huggingface.co/upstage/Solar-Open-100B#vllm
3. API 제공 (추후 예정)
Solar-Open-100B는 향후 업스테이지에서 제공할 공식 Public API를 통해 클라우드 기반으로 사용할 수 있을 예정입니다. 업스테이지는 1월 중 API 서비스를 공개할 계획이며, 관련 정보는 Upstage Console을 통해 제공될 예정입니다(TBA). 이 방식이 제공되면 모델을 직접 다운로드하지 않아도 웹·앱 서비스 내에서 손쉽게 추론 기능을 통합할 수 있다는 점에서 활용성이 더욱 확대될 것으로 기대됩니다.
- 특징: 설치 불필요, 클라우드 기반 추론, 간편한 서비스 연동
- 공개 예정: 1월 중 Public API 출시 예정
- 접속/문서: Upstage Console에서 공개 예정 (TBA)
Solar-Open-100B는 대규모 언어 모델 개발 흐름 속에서 독자적인 기술력과 개방성을 바탕으로 공개된 모델로, 다양한 환경에서 활용할 수 있는 유연한 구조를 갖추고 있습니다. 로컬 실행부터 고성능 서버 기반 추론까지 폭넓은 사용 방식을 제공하며, 앞으로 API 서비스가 추가되면 실서비스 적용 범위 역시 더욱 확대될 것으로 기대됩니다. 이러한 특성은 연구, 서비스 개발, 기업 내 시스템 구축 등 여러 분야에서 실질적인 활용 가치를 제공합니다.
한국형 AI 모델이 점차 경쟁력을 갖춰가고 있습니다. 앞으로 이어질 업스테이지의 기술 개발과 생태계 확장은 한국형 AI의 성장 가능성을 더욱 넓혀줄 것이며, 다양한 산업과 서비스에 새로운 기회를 제시할 것으로 기대됩니다.
감사합니다. 😊
'AI 소식 > 오픈소스 AI 모델' 카테고리의 다른 글
| [오픈소스 AI] LG가 공개한 한국형 AI 모델, K-EXAONE-236B 소개 (2) | 2026.01.22 |
|---|---|
| [AI 번역 모델] 구글의 최신 경량 모델, TranslateGemma 소개 | 오픈소스 AI (0) | 2026.01.19 |
| [오픈소스 AI] Z.AI가 공개한 프론티어급 AI 모델, GLM-4.7을 소개합니다. (0) | 2026.01.12 |
| [오픈소스 AI] 알리바바가 공개한 최신 이미지 생성 모델, Qwen-Image-2512 소개 (1) | 2026.01.09 |
| [오픈소스 AI] 카카오의 한국어 특화 모델, Kanana-2 공개 (0) | 2025.12.30 |
