안녕하세요,
최근 AI 모델은 단순한 텍스트 생성 기능을 넘어, 실제 작업을 수행하고 문제를 해결하는 방향으로 빠르게 발전하고 있습니다. 특히 코드 작성이나 자동화 작업과 같이 복잡한 문제를 단계적으로 처리하는 능력이 중요해지면서, 에이전트형 구조를 기반으로 한 모델에 대한 관심도 함께 높아지고 있습니다. 이러한 흐름 속에서 Z.ai는 코딩과 작업 수행에 특화된 차세대 모델, GLM-5.1을 공개했습니다. 이 모델은 장기적인 작업 수행 능력과 코드 이해 및 실행 능력을 중심으로 설계된 것이 특징입니다.
이번 글에서는 GLM-5.1 모델의 개념과 주요 특징, 벤치마크 성능, 사용 비용, 그리고 간단한 활용 방법까지 함께 살펴보겠습니다.
GLM-5.1 모델이란
2026년 4월 7일, Z.ai에서 차세대 플래그십 모델 GLM-5.1을 공개했습니다. 이 모델은 기존 GLM-5를 기반으로 성능을 강화한 업그레이드 버전으로, 특히 코딩과 에이전트 기반 작업 수행 능력에 초점을 맞춘 것이 특징입니다. GLM-5.1은 단순한 텍스트 생성 모델이 아니라, 실제 소프트웨어 개발과 같은 복잡한 문제를 해결하기 위한 에이전틱 엔지니어링(Agentic Engineering) 모델로 설계되었습니다. 이는 하나의 질문에 답하는 것을 넘어, 문제를 분석하고 단계적으로 해결하는 작업 흐름을 수행할 수 있도록 구조화된 모델임을 의미합니다. 성능 측면에서는 실제 코드 수정 능력을 평가하는 SWE-Bench Pro에서 최상위 수준의 점수를 기록하며, 일부 폐쇄형 모델을 능가하는 결과를 보였습니다.
- Z.ai 공식 블로그 : https://z.ai/blog/glm-5.1
https://z.ai/blog/glm-5.1
z.ai
[모델 정보 요약]
| 항목 | 내용 |
| 모델 버전 | GLM-5.1 |
| 개발사 | Z.ai |
| 모델 유형 | 에이전트형 AI (코딩 및 작업 수행 중심) |
| 아키텍처 | Mixture-of-Experts (MoE) 기반 대형 언어 모델 |
| 컨텍스트 창 | 약 200K 토큰 |
| 지원 기능 | 텍스트 생성, 코드 생성/수정, 멀티스텝 작업 수행, 도구 호출 |
| 사용 환경 | 웹 인터페이스, API 연동, 로컬 배포 (오픈소스) |
| 라이선스 | MIT License (오픈소스) |
| 모델 경로 | https://huggingface.co/zai-org/GLM-5.1 |
주요 특징
GLM-5.1은 단순한 텍스트 생성 모델을 넘어, 실제 개발 작업과 문제 해결을 수행할 수 있도록 설계된 에이전트형 AI 모델로, 장기 작업 수행 능력과 코드 이해·실행 중심 구조를 함께 고려한 것이 특징입니다.
- 에이전트형 작업 수행 구조 : GLM-5.1은 단순한 응답 생성이 아니라 문제를 분석하고 해결 전략을 수립한 뒤, 실제 작업을 단계적으로 수행하는 흐름을 지원하도록 설계되었습니다. 코드 작성, 수정, 실행, 검증과 같은 일련의 과정을 하나의 모델에서 연속적으로 처리할 수 있도록 구성되었습니다.
- 코딩 및 소프트웨어 엔지니어링 특화 : GLM-5.1은 코드 생성뿐 아니라 실제 코드 수정과 디버깅까지 포함한 소프트웨어 엔지니어링 작업에 최적화된 성능을 갖추었습니다. 특히 복잡한 코드베이스를 이해하고 문제를 해결하는 능력을 중심으로 성능이 강화되었습니다.
- 장기 작업 수행 능력 : GLM-5.1은 단기 질의 응답을 넘어, 수십 단계 이상의 작업을 지속적으로 수행할 수 있도록 설계되었습니다. 반복적인 실행과 중간 결과 검증을 통해 작업 흐름을 유지하며, 장시간에 걸친 문제 해결을 지원합니다.
- 대규모 컨텍스트 처리 : 약 200K 토큰 수준의 긴 입력을 처리할 수 있도록 설계되어, 대규모 문서나 코드베이스를 한 번에 분석할 수 있는 구조를 갖추었습니다. 이를 통해 장기적인 맥락을 유지하면서 복잡한 작업을 수행할 수 있습니다.
- 추론·도구 활용 통합 : 논리적 추론 과정과 외부 도구 호출 기능을 하나의 구조로 결합하여, 단순한 답변 생성이 아닌 실제 실행 기반의 작업 수행이 가능하도록 구성되었습니다. 이를 통해 다양한 작업 환경에서도 일관된 처리 흐름을 유지할 수 있습니다.
- 오픈소스 및 확장성 : GLM-5.1은 MIT 라이선스로 공개되어 상업적 활용과 커스터마이징이 가능하며, 다양한 개발 환경과의 연동을 고려한 구조를 갖추었습니다. 이를 통해 실제 서비스 환경에서 유연하게 활용할 수 있습니다.
벤치마크 성능
GLM-5.1은 다양한 벤치마크에서 전반적으로 균형 잡힌 성능을 보이면서도, 특히 코딩과 에이전트 기반 작업 수행 영역에서 강점을 보이는 구조를 갖춘 모델입니다. 단순한 추론 능력뿐 아니라 실제 작업을 수행하는 과정까지 포함한 지표에서 안정적인 결과를 기록하고 있으며, 이는 실사용 환경을 고려한 설계 방향과도 연결됩니다.
특히 SWE-Bench, Terminal-Bench와 같은 실제 작업 기반 평가 지표에서 상위권 성능을 유지하고 있으며, BrowseComp와 τ³-Bench와 같은 에이전트형 벤치마크에서도 경쟁력 있는 결과를 보입니다. 반면 HLE, GPQA, AIME와 같은 전통적인 추론 및 수학 중심 지표에서는 최상위 모델 대비 일부 격차가 존재하지만, 전반적인 활용 목적을 고려하면 충분한 수준의 성능을 확보하고 있습니다.
전체적인 성능 흐름과 주요 모델 간 비교는 아래 표를 통해 확인할 수 있습니다.
| 벤치마크 지표 | GLM-5.1 | Qwen3.6-Plus | Gemini 3.1 Pro | GPT-5.4 |
| HLE (다양한 일반 문제 해결 및 논리적 사고 수준 평가) |
31.0 | 28.8 | 45.0 | 39.8 |
| AIME 2026 (고난도 수학 경시 문제 풀이 능력) |
95.3 | 95.1 | 98.2 | 98.7 |
| GPQA-Diamond (전문가 수준 과학 문제 해결 능력) |
86.2 | 90.4 | 94.3 | 92.0 |
| SWE-Bench Pro (실제 코드 수정 및 버그 해결 능력) |
58.4 | 56.6 | 54.2 | 57.7 |
| Terminal-Bench 2.0 (CLI 기반 명령 실행 및 자동화 처리 능력) |
63.5 | 61.6 | 68.5 | - |
| BrowseComp w/ Context (정보 탐색 및 맥락 유지 기반 작업 수행 능력) |
79.3 | - | 85.9 | 82.7 |
| τ³-Bench (여러 단계로 구성된 복합 작업 처리 능력) |
70.6 | 70.7 | 67.1 | 72.9 |
출처: Z.ai 공식 블로그
사용 비용
GLM-5.1은 오픈소스로 공개된 모델이면서, 동시에 API 형태로도 제공되어 로컬 배포와 클라우드 환경에서 모두 활용할 수 있습니다. 공식 API를 사용할 경우 입력(Input)과 출력(Output) 토큰 사용량을 기준으로 비용이 계산되는 토큰 기반 과금 방식을 따릅니다.
자세한 비용 구조는 아래 표를 통해 확인할 수 있습니다.
| 모델 | 입력 비용 (1M tokens) | 캐시 입력 비용 | 출력 비용 (1M tokens) |
| GLM-5.1 | $1.4 | $0.26 | $4.4 |
| GLM-5 | $1.0 | $0.20 | $3.2 |
출처: Z.ai API Doc
간단한 사용 예시
GLM-5.1은 에이전트 기반 작업 수행과 코딩 중심 활용을 고려하여 설계된 모델로, 사용 환경에 따라 활용 방식이 구분됩니다. 공식 웹 인터페이스를 통해 간단히 기능을 확인할 수 있으며, API를 통해 서비스에 직접 통합하거나, 오픈소스 모델을 로컬 환경에 배포하여 사용하는 것도 가능합니다. 정리하면 “간단한 테스트는 웹”, “서비스 적용은 API”, “자유로운 활용은 오픈소스” 형태로 이해할 수 있습니다.
1. 공식 웹 서비스에서 직접 사용
개발 환경 없이 모델 성능을 확인하려면 공식 웹 서비스를 활용하는 방식이 적절합니다. 브라우저에서 접속 후 모델을 선택하면 텍스트 생성, 코드 작성, 문제 해결과 같은 작업을 바로 수행할 수 있습니다.
- 특징: 브라우저 기반 인터페이스, 설치 없이 즉시 사용 가능
- 비용: 일부 기능 무료 제공 + 사용량 기반 과금
- 활용: 코드 생성, 문제 해결 테스트, 간단한 에이전트 작업 확인
- 경로: https://z.ai/

2. 공식 API 연동 (GLM-5.1)
서비스나 애플리케이션에 모델을 직접 적용하려면 API를 활용합니다. GLM-5.1은 장문 컨텍스트와 멀티스텝 작업을 처리할 수 있도록 설계되어 있어, 단순 응답 생성뿐 아니라 자동화된 작업 흐름 구성에도 활용할 수 있습니다.
- 특징: REST API 기반 호출, 장문 컨텍스트 및 에이전트 작업 지원
- 비용: 토큰 기반 과금 (입력/출력 기준)
- 활용: 코딩 에이전트, 업무 자동화, 문서 분석 시스템
- 참고 문서: https://docs.z.ai/guides/llm/glm-5.1
3. 오픈소스 모델 직접 배포
GLM-5.1은 오픈소스로 공개되어 있어, 로컬 환경 또는 자체 서버에 직접 배포하여 사용할 수 있습니다. 이를 통해 비용 구조를 직접 제어할 수 있으며, 보안이 중요한 환경이나 커스터마이징이 필요한 경우에 적합합니다.
- 특징: 모델 가중치 공개, 로컬 및 온프레미스 배포 가능
- 비용: 인프라(GPU 등) 기반 비용 발생, API 비용 없음
- 활용: 내부 서비스 구축, 맞춤형 모델 튜닝, 데이터 보안 환경
- 경로: https://huggingface.co/zai-org/GLM-5.1
GLM-5.1은 단순한 언어 생성 모델을 넘어, 코딩과 에이전트 기반 작업 수행을 중심으로 설계된 실행형 AI 모델입니다. 오픈소스와 API를 동시에 제공하는 구조를 통해 활용 유연성을 확보했으며, 장문 컨텍스트 처리와 멀티스텝 작업 수행 능력을 기반으로 실제 개발 및 자동화 환경에서 적용할 수 있는 실용적인 성능을 갖추고 있습니다. 이러한 점에서 GLM-5.1은 기존 LLM의 활용 범위를 확장하는 방향으로 발전한 모델이라고 정리할 수 있습니다.
직접 웹 환경에서 간단한 작업을 실행해 보거나, API 또는 로컬 배포를 통해 실제 프로젝트에 적용해 보면서 GLM-5.1의 활용 가능성을 확인해 보시기 바랍니다.
감사합니다. 😊
'AI 소식 > 오픈소스 AI 모델' 카테고리의 다른 글
| [오픈소스 AI] Qwen3.6-35B-A3B 공개 | 멀티모달·에이전트형 AI (0) | 2026.05.05 |
|---|---|
| [오픈소스 AI] VoxCPM2 모델 소개 | 음성 생성 · 보이스 클로닝 · TTS (1) | 2026.04.21 |
| [오픈소스 AI] 구글 Gemma 4 공개: 멀티모달·온디바이스 모델 정리 (0) | 2026.04.03 |
| [오픈소스 AI] Cohere에서 공개한 ARS 모델, Cohere Transcribe를 소개합니다. | 음성 인식 모델 | Speech-to-Text (0) | 2026.03.31 |
| [오픈소스 AI] Z.AI에서 공개한 OCR 모델, GLM-OCR을 소개합니다. (0) | 2026.03.26 |