본문 바로가기

AI 소식/오픈소스 AI 모델

[오픈소스 AI] AllenAI의 완전 공개 언어 모델, Olmo-3.1을 소개합니다.

안녕하세요,

최근 Allen Institute for AI가 완전 오픈소스로 공개한 Olmo-3.1 모델이 큰 주목을 받고 있습니다. 대형 언어 모델임에도 불구하고 누구나 직접 내려받아 실행할 수 있을 만큼 개방적이며, 성능 면에서도 기존 상용 모델에 견줄 만큼 우수한 결과를 보여주고 있습니다.

이번 글에서는 Olmo-3.1의 주요 특징과 벤치마크 성능, 그리고 실제로 사용할 수 있는 다양한 방식(API와 웹 환경)을 중심으로 정리하였습니다. 완전 공개형 모델이 어떤 수준까지 발전했는지, 그리고 이를 어떻게 활용할 수 있는지 함께 살펴보겠습니다.


반응형

Olmo-3.1 모델이란

2025년 11월 20일, Allen Institute for AI(AI2)에서 오픈소스로 공개한 대규모 언어 모델입니다. Olmo 시리즈는 모델의 순수 성능뿐 아니라 전체 개발 과정(model flow)을 투명하게 공개하는 데 초점을 맞춘 것이 특징입니다. Olmo-3.1은 기존 Olmo-3 모델 흐름을 바탕으로 강화학습(RL)과 추가 사후 훈련을 통해 성능을 향상시킨 업데이트된 32B 규모 모델들을 포함하며, 복잡한 추론(reasoning)과 지침 응답(instruction following) 능력을 강화한 모델입니다.

 

 

Olmo 3: Charting a path through the model flow to lead open-source AI | Ai2

Our new flagship Olmo 3 model family empowers the open source community with not only state-of-the-art open models, but the entire model flow and full traceability back to training data.

allenai.org

 

[모델 정보 요약]

항목 모델명
모델 버전 Olmo-3.1-32B-Instruct Olmo-3.1-32B-Think Olmo-3.1-7B-RL-Zero-Math Olmo-3.1-7B-RL-Zero-Code
파라미터 수 32B 32B 7B 7B
개발사 AllenAI AllenAI AllenAI AllenAI
아키텍처 디코더형 트랜스포머 디코더형 트랜스포머 디코더형 트랜스포머 디코더형 트랜스포머
컨텍스트 길이 최대 약 65K 토큰 지원 최대 약 65K 토큰 지원 제한적 제한적
특징 - 지침 수행 최적화·대화, 도구 호출, 멀티턴 챗에 강점 있는 인스트럭션 모델
- 32B 규모 중 가장 성능 좋은 대화/지시 수행 모델로 설계됨
- 추론·문제 해결 중심 모델, 강력한 수학·논리·복합 추론 능력 제공
- 장문 문맥 처리 및 연장된 사고 체인 지원
- 실험/연구용 강화학습(RL-Zero) 체크포인트
- 수학에 특화된 강화 학습 평가 기준 제공
- 실험/연구용 강화학습(RL-Zero) 체크포인트
- 코드 생성에 특화된 강화학습 평가 기준 제공
사용 환경 대화형 AI, 챗봇, 도구 활용 시나리오, 명령형 응답 시스템 복잡한 문제 해결, 리서치 및 고급 추론 워크로드, 장문 분석 강화학습 연구, 벤치마크 실험 강화학습 연구, 벤치마크 실험
라이선스 Apache 2.0 Apache 2.0 Apache 2.0 Apache 2.0
모델 경로
(허깅페이스)
Hugging Face 페이지 Hugging Face 페이지 Hugging Face 페이지 Hugging Face 페이지

 

 

주요 특징

  • 완전 오픈 투명성: Olmo-3.1은 학습 데이터, 코드, 체크포인트, 훈련 로그까지 포함한 전체 모델 플로우를 공개하여 연구자나 개발자가 모델 생성 과정을 직접 검토, 수정, 응용할 수 있도록 설계되어 있습니다.
  • 다양한 모델 구성: 7B 및 32B 파라미터 규모로 Base, Instruct, Think, RL Zero 등 여러 변형을 제공하여 기초 모델부터 추론, 대화, 강화학습 연구까지 폭넓게 활용할 수 있도록 구성되어 있습니다.
  • 향상된 추론 능력: Olmo-3.1 Think 32B는 추론·수학·코딩 문제 해결 능력 등에서 기존 모델 대비 향상된 성능을 보여 연구·실험 환경에서 활용도가 높습니다.
  • 긴 문맥 처리: 최대 65K 토큰 이상의 긴 문서를 처리할 수 있도록 설계되어 복잡한 장문 분석 등에도 적합합니다.

 

 

벤치마크 성능

Olmo-3.1 32B Think 모델은 여러 공개 LLM 벤치마크에서 Qwen 3 32B 및 Gemma 3 27B 와 비교 평가된 결과, 전반적으로 균형 잡힌 성능을 보였습니다. 특히 AIME (수학 문제 해결), IFEval (명령 이해 정확도), IFBench (지침 추론 및 응답 품질)에서 두드러진 향상을 보였으며, HumanEvalPlus (코드 생성 정확도) 에서도 경쟁 수준을 유지했습니다. MMLU (일반 지식 추론) 및 ZebraLogic (논리 이해) 부문에서는 Qwen 3 32B가 근소하게 앞섰지만, Olmo-3.1은 복합 추론 및 지시 수행 능력에서 가장 우수한 균형 모델로 평가됩니다.

벤치마크 항목 Olmo 3.1 32B ThinkQwen 3 32B Gemma 3 27B
AIME 2025
(수학 올림피아드 형태의 고난도 문제 해결 능력 평가)
78.1 70.9 22.9
ZebraLogic
(복잡한 논리 추론 및 상식 이해 능력 측정)
80.1 88.3 24.8
IFEval
(지침 이해 및 명령 수행 정확도 평가)
93.8 86.5 85.4
IFBench
(강화학습 후 지침 이해력 및 응답 품질 검증 벤치마크)
68.1 37.3 31.3
MMLU
(대학 수준 지식 문제 전반의 언어 이해·추론 성능)
86.4 88.8 74.6
HumanEvalPlus
(코드 이해 및 프로그래밍 문제 정확도 측정)
91.5 91.2 79.2
출처: Allenai 공식페이지

 

 

라이선스

Olmo-3.1 모델과 관련된 모델 가중치, 학습 데이터, 코드, 체크포인트 등은 Apache 2.0 라이선스 하에 공개되어 있습니다. 이 라이선스는 상업적 활용 가능성과 수정·재배포 자유를 폭넓게 허용하는 오픈 라이선스로, 연구 목적뿐 아니라 실제 응용 개발에서도 제한이 적은 형태로 제공됩니다.

필요한 경우 허깅페이스나 Ai2 Playground 등에서 직접 모델을 다운로드하거나 API를 통해 테스트하는 방법도 활용할 수 있습니다.

 


간단한 사용 예시

Olmo-3.1 모델은 완전한 오픈소스 형태로 공개된 언어 모델로, 활용 목적에 따라 다양한 방식으로 사용할 수 있습니다. 모델 파일을 직접 다운로드해 로컬 환경에서 독립적으로 실행하거나, AllenAI이 제공하는 API를 통해 외부 서비스나 애플리케이션에 통합하는 방식으로 운용할 수 있습니다.

 

 

1. 로컬 환경 (오픈소스 실행)

  • 목적: 독립된 환경에서 모델을 커스터마이징하거나 연구·실험 목적으로 활용
  • 방법: AllenAI 허깅페이스에서 모델 파일(.safetensors 등) 다운로드
  • 사용 방식: transformers, vLLM 등의 프레임워크를 통해 GPU 기반 로컬 환경에서 실행
  • 특징: 인터넷 연결이 불필요하며, 데이터 프라이버시를 보장함. 연구자와 개발자에게 적합한 방식
  • 허깅페이스 경로: https://huggingface.co/allenai/Olmo-3.1-32B-Instruct/tree/main

출처: AllenAI 허깅페이스 (클릭시 페이지 이동)

 

 

2. API 플랫폼 (개발자 중심)

  • 목적: 외부 서비스나 애플리케이션에 Olmo-3.1-32b-think 모델을 통합
  • 방법: API 키를 발급받아 API 형태로 호출
  • 사용 방식: OpenRouter SDK, OpenAI-Python, TypeScript, OpenAI-TypeScript, cURL 등 다양한 언어 및 SDK를 통해 엔드포인트 요청과 응답을 처리
  • 비용: 현재는 무료로 제공. (2025. 12. 21)
  • 특징: 서버 애플리케이션 통합과 자동화에 적합하며, 커스터마이징이 용이함
  • API Doc: https://openrouter.ai/allenai/olmo-3.1-32b-think:free

 

3. 웹 플랫폼 이용

  • 목적: 별도의 개발 환경 없이 웹 브라우저에서 Olmo-3.1-32B-Think 모델을 직접 체험
  • 방법: AI2 Playground 웹 페이지에 접속하여 모델을 선택한 뒤, 텍스트 입력창을 통해 질의와 응답을 수행
  • 사용 방식: 로그인 없이 웹 인터페이스를 이용해 대화·질문·문서 분석 등을 수행하며, 코드 작성 없이 실시간 결과 확인 가능
  • 비용: 무료 제공
  • 특징: 설치나 설정 과정이 필요 없고 즉시 사용이 가능하며, 일반 사용자와 비개발자에게 적합함. 한국어 입력도 자연스럽게 인식하고 빠르게 응답함
  • 접속 링크: https://playground.allenai.org/

출처: Ai2 Playground (클릭시 이미지 확대)

 


 

Olmo-3.1은 단순히 또 하나의 언어 모델이 아니라, 인공지능이 얼마나 투명하고 개방적인 방향으로 발전할 수 있는지를 보여주는 사례입니다. 모델의 구조와 학습 과정이 모두 공개되어 있어, 누구나 직접 실험하고 비교하며 성능을 체감할 수 있습니다. 특히 Think 버전은 복잡한 추론이나 수학 문제처럼 고난도의 작업에서도 안정적인 결과를 보여주어 연구와 실무 모두에서 주목받고 있습니다.

 

무엇보다 이런 오픈소스 모델의 등장은 AI를 더 많은 사람들이 함께 발전시킬 수 있는 환경을 만들어줍니다. 앞으로도 Olmo 시리즈처럼 투명하고 접근성 높은 모델이 늘어나면서, 인공지능이 더 공정하고 신뢰할 수 있는 기술로 자리 잡게 될 것으로 기대됩니다.

 

 

감사합니다. 😊

 

반응형