안녕하세요,
최근 국내 생성형 AI 시장이 빠르게 성장하는 가운데, SKT, 네이버, KT 등 주요 기업들이 자체 AI 모델을 연이어 출시하고 있습니다. 이러한 흐름 속에서 국내 기업 업스테이지(Upstage)에서 언어모델 Solar Pro 2.0을 새롭게 공개하며 경쟁에 뛰어들었습니다. Solar Pro 2.0은 경량 대규모 언어모델(LLM)로, 특히 한국어 벤치마크에서 높은 성능을 기록했습니다.
이번 글에서는 Solar Pro 2.0의 주요 특징과 벤치마크 결과, 그리고 국내외 AI 모델들과의 비교를 중심으로 자세히 살펴보겠습니다.
Solar Pro 2.0 이란
2025년 5월 20일, 국내 기업 업스테이지(Upstage)는 차세대 대규모 언어모델(LLM)인 Solar Pro 2.0(솔라 프로 2.0)을 출시했습니다. 이 모델은 기존 Solar Pro보다 성능이 크게 향상되었으며, 최신 경량 구조를 기반으로 설계되었습니다. 정식 출시에 앞서 제공된 Solar Pro 2 Preview는 약 310억 개의 파라미터(31B)를 갖춘 경량 모델로, Qwen2-72B나 Llama 3.3 70B와 같은 70B급 대형 모델에 필적하는 성능을 더욱 작고 효율적인 구조로 구현했습니다. 일상적인 대화부터 복잡한 멀티스텝 추론, 장문 문서 처리에 이르기까지 다양한 업무 환경에 활용할 수 있도록 설계된 것이 특징입니다.
- Upstage 공식 소개페이지 : https://www.upstage.ai/blog/ko/solar-pro-2-preview-introduction?page_slug=ko%2Fsolar-pro-2-preview-introduction
주요 특징
- 경량 모델, 강력한 성능 : 31B 규모의 경량 모델이지만, 70B급 대형 모델에 필적하는 수준의 성능을 구현합니다. 최적화된 사전 학습을 통해 응답 속도를 높이고, 운영 비용을 효율적으로 절감할 수 있도록 설계되었습니다.
- 한국어에 특화된 언어 이해력 : 영어와 일본어를 포함한 다국어를 지원하며, 특히 한국어에 대한 이해도와 응답 품질이 뛰어납니다.
- 두 가지 모드를 통한 유연한 사용 방식 : 대화에 최적화된 Chat Mode와 고차원 추론에 특화된 Reasoning Mode를 모두 지원합니다. 사용자는 상황에 따라 reasoning_effort 플래그를 통해 손쉽게 모드를 전환할 수 있습니다.
- 고도화된 멀티스텝 추론 기능 : Reasoning Mode에서는 복잡한 질의에 대한 단계적 추론과 구조화된 사고, 계획 수립 기능까지 지원합니다. Qwen3-32B와 유사한 수준의 고차원 추론 능력을 제공합니다.
- 대용량 입력에 최적화된 문서 처리 능력 : 최대 64K 토큰까지 입력을 처리할 수 있어, 긴 문서도 한 번에 다룰 수 있습니다. 기존 대비 약 2배 늘어난 컨텍스트 길이를 지원하며, 문서 중심의 업무 환경에 효율적으로 활용할 수 있습니다.
성능 비교
Solar Pro 2 Preview는 한국어 벤치마크에서 전반적으로 뛰어난 성능을 보여줍니다. Ko-MMLU-0shot-CoT에서 84.08%, KMMLU-0shot에서 75.08%, Hae-Rae 1.0에서는 85.21%를 기록하여 대부분의 경쟁 모델을 앞서는 결과를 보였습니다. 특히 네이버와 LG 등 국내 AI 모델과 비교해도 큰 차이를 보이며 우위를 점하고 있습니다.
또한 Ko-IFEval에서 84.65%, Ko-MT-Bench에서 84.12%를 기록해, Qwen3-32B Reasoning과 거의 동등하거나 더 높은 수치를 나타냅니다.
[용어 설명]
- Ko-MMLU-0shot-CoT : 한국어로 번역된 MMLU 데이터셋을 기반으로, 추론 과정을 단계적으로 서술하는 Chain-of-Thought 방식으로 문제를 해결하는 평가입니다. 한국어에서의 고차 추론 능력을 측정합니다.
- KMMLU-0shot : KAIST에서 구축한 한국어 특화 멀티태스크 벤치마크로, 예시 없이 문제를 바로 풀게 하여 모델의 순수한 한국어 이해 능력을 평가합니다.
- Ko-IFEval : 정보 추출과 문서 이해 중심의 평가로, 실제 문서에 기반한 질의응답을 통해 한국어 정보 처리 능력을 측정합니다.
- Hae-Rae 1.0 : 업스테이지에서 자체 개발한 한국어 특화 벤치마크입니다. 뉴스, 법률, 금융 등 실제 업무 환경에 가까운 문서를 활용해 평가가 이루어지며, 단순 번역형 문제가 아닌 실전형 시나리오 기반 평가로 구성되어 있습니다. 한국어 기반 LLM의 실질적인 활용 능력을 종합적으로 진단할 수 있는 지표로 활용됩니다.
- Ko-MT-Bench : MT-Bench를 한국어로 번역한 버전으로, 다양한 유형의 질문에 대한 응답 품질과 대화 일관성을 한국어 기준에서 평가합니다.
미래 전망
Solar Pro 2.0은 국내 언어모델 개발의 수준을 한층 끌어올린 사례라고 생각됩니다. 특히 경량 구조를 유지하면서도 대형 모델과 견줄 만한 성능을 확보했다는 점에서, 기술적 효율성과 실용성의 균형이라는 중요한 방향성을 제시하고 있습니다.
향후 정식 버전 출시와 함께 기업 환경에 맞춘 기능 확장이 이루어지면, Solar Pro 2.0은 한국어 기반 업무 자동화, 대화형 에이전트, 문서 분석 등 다양한 분야에서 사용될 수 있습니다.
글로벌 AI 기업 중심의 모델 선택지가 여전히 주류를 이루는 가운데, Solar Pro 2.0과 같은 한국형 고성능 모델이 계속해서 등장한다면, 향후에는 국내 수요에 특화된 맞춤형 AI 도입이 더욱 활발해질 것으로 기대됩니다.
Solar Pro 2는 경량 구조를 유지하면서도 높은 수준의 성능을 구현한 국산 LLM으로, 한국어 처리 능력과 추론 성능에서 모두 인상적인 결과를 보여주고 있습니다. 특히 한국어 특화 벤치마크에서의 강점은 국내 환경에 적합한 AI 모델이 필요한 다양한 산업 현장에서 실질적인 대안이 될 수 있음을 시사합니다.
앞으로도 이와 같은 고성능 국산 모델들이 지속적으로 등장함으로써, 국내 AI 생태계가 더욱 다양해지고 경쟁력을 갖춰나가기를 기대합니다.
감사합니다. 😊
'AI 소식 > 유용한 AI 도구' 카테고리의 다른 글
Qwen3-Thinking 모델 공개|글로벌 AI와 경쟁하는 알리바바의 오픈소스 LLM (1) | 2025.07.31 |
---|---|
AgentSquad란? AWS가 만든 AI 에이전트 연결 프레임워크 | AI 에이전트 | AWS | 오픈소스 | (4) | 2025.07.21 |
Grok-4란? OpenAI o3-pro 넘어선 xAI의 차세대 AI 모델 (3) | 2025.07.11 |
구글의 AI 가상 피팅 서비스, Doppl을 소개합니다. | 모바일 어플 | AI 서비스 (0) | 2025.07.08 |
[Hailuo AI] Veo 3을 능가한 영상 생성 AI, Hailuo를 소개합니다. | 영상 생성 AI | 웹 플랫폼 (0) | 2025.06.24 |