안녕하세요,
최근 AI 모델은 단순한 텍스트 생성 기능을 넘어, 실제 작업을 수행하고 문제를 해결하는 방향으로 빠르게 발전하고 있습니다. 특히 긴 문맥을 이해하고 다양한 입력을 함께 처리하며, 개발 작업이나 문서 분석과 같은 실사용 환경에 적용할 수 있는 모델에 대한 관심이 높아지고 있습니다. 이러한 흐름 속에서 알리바바의 Qwen 팀은 새로운 오픈 웨이트 모델, Qwen3.6-35B-A3B를 공개했습니다. 이 모델은 효율적인 MoE 구조와 멀티모달 처리, 그리고 긴 컨텍스트 기반 작업 수행을 고려해 설계된 것이 특징입니다.
이번 글에서는 Qwen3.6-35B-A3B 모델의 개념과 주요 특징, 벤치마크 성능, 라이선스, 그리고 간단한 사용 방법에 대해 알아보겠습니다.
Qwen3.6-35B-A3B 모델이란
2026년 4월 15일, 알리바바의 Qwen 팀은 새로운 오픈소스 모델인 Qwen3.6-35B-A3B를 공개했습니다. 이 모델은 기존 Qwen3.5 계열의 흐름을 이어가면서, 더 긴 문맥 이해와 실사용 중심의 작업 수행 능력을 강화한 AI 모델입니다. 단순히 질문에 답변하는 언어 모델을 넘어, 코드 작성, 문서 이해, 이미지 기반 추론 등 다양한 작업에 활용할 수 있도록 설계되었습니다.
Qwen3.6-35B-A3B는 전체 35B 규모의 파라미터를 갖지만, 실제 추론 과정에서는 일부 파라미터만 활성화하는 효율적인 구조를 사용합니다. 이를 통해 대형 모델의 성능을 활용하면서도 추론 효율을 함께 고려한 형태로 구성되었습니다. 특히 개발 작업이나 긴 문서 처리처럼 많은 정보를 다뤄야 하는 상황에서 활용 가능성이 높은 모델입니다. 또한 텍스트뿐 아니라 이미지 입력도 함께 처리합니다. 문서, 화면 캡처, 이미지 자료 등을 함께 이해할 수 있어 일반적인 대화형 AI보다 더 넓은 범위의 작업에 적용할 수 있습니다. 결과적으로 Qwen3.6-35B-A3B는 긴 문맥 이해, 코딩 작업, 멀티모달 처리를 함께 고려한 실사용 중심의 오픈 웨이트 AI 모델이라고 정리할 수 있습니다.
- Qwen 공식 블로그 : https://qwen.ai/blog?id=qwen3.6-35b-a3b
Qwen Studio
qwen.ai
[모델 정보 요약]
| 항목 | 내용 | |
| 모델 버전 | Qwen3.6-35B-A3B | Qwen3.6-27B |
| 개발사 | Alibaba Qwen Team | Alibaba Qwen Team |
| 모델 유형 | 오픈 웨이트 멀티모달 MoE 모델 | 오픈 웨이트 멀티모달 Dense 모델 |
| 파라미터 구조 | 전체 35B / 활성 약 3B | 전체 27B |
| 아키텍처 | 하이브리드 MoE 구조Gated DeltaNet + Gated Attention + MoE | 하이브리드 Dense 구조Gated DeltaNet + Gated Attention + FFN |
| 컨텍스트 창 | 기본 262K 토큰최대 약 1M 토큰 확장 지원 | 기본 262K 토큰최대 약 1M 토큰 확장 지원 |
| 지원 기능 | 텍스트, 이미지, 문서, 영상 등 멀티모달 입력 처리 | 텍스트, 이미지, 문서, 영상 등 멀티모달 입력 처리 |
| 주요 특징 | 효율적인 활성 파라미터 구조, 에이전트형 코딩, 긴 문맥 처리, Thinking Preservation | 27B급 Dense 구조, 높은 일관성, 에이전트형 코딩, 긴 문맥 처리, Thinking Preservation |
| 활용 방향 | 효율성과 실사용성을 함께 고려한 코딩·에이전트 작업 | 더 높은 밀도의 연산 구조를 바탕으로 한 범용·코딩·멀티모달 작업 |
| 라이선스 | Apache 2.0 | Apache 2.0 |
| 모델 경로 | Hugging Face 제공 | Hugging Face 제공 |
주요 특징
Qwen3.6-35B-A3B는 긴 문맥 이해와 코딩 작업, 멀티모달 입력 처리를 함께 고려한 오픈 웨이트 모델입니다. 전체 35B 규모의 모델이지만 실제 추론 과정에서는 일부 파라미터만 활성화하는 구조를 사용해, 성능과 효율을 함께 확보한 것이 특징입니다.
- 효율적인 MoE 구조 : Qwen3.6-35B-A3B는 전체 35B 파라미터를 갖지만, 실제 추론 시에는 약 3B 수준의 파라미터만 활성화하는 구조를 사용합니다. 이를 통해 대형 모델의 표현력을 유지하면서도 추론 효율을 높일 수 있도록 설계되었습니다.
- 초장문 컨텍스트 처리 : 긴 문서나 대규모 코드베이스를 다룰 수 있도록 매우 긴 입력 처리를 지원합니다. 이를 통해 여러 문서, 프로젝트 파일, 긴 대화 흐름처럼 많은 정보를 한 번에 참고해야 하는 작업에 활용할 수 있습니다.
- 코딩 작업 중심 설계 : Qwen3.6-35B-A3B는 코드 작성, 수정, 이해와 같은 개발 작업에 활용하기 좋은 방향으로 설계되었습니다. 단일 코드 조각 생성뿐 아니라 프로젝트 구조를 이해하고, 여러 단계의 개발 작업을 이어가는 용도에 적합합니다.
- 멀티모달 입력 지원 : 텍스트뿐 아니라 이미지 입력도 함께 처리할 수 있는 구조를 갖추고 있습니다. 문서 이미지, 화면 캡처, 시각 자료 등을 바탕으로 내용을 이해할 수 있어 일반적인 텍스트 기반 모델보다 활용 범위가 넓습니다.
- 작업 맥락 유지 강화 : 긴 대화나 반복적인 작업 과정에서 이전 맥락을 더 안정적으로 활용할 수 있도록 설계되었습니다. 이를 통해 디버깅, 코드 리뷰, 문서 검토처럼 여러 단계로 이어지는 작업에서 일관된 흐름을 유지하는 데 도움이 됩니다.
- 실사용 환경 중심 호환성 : 다양한 추론 프레임워크와 개발 환경에서 활용할 수 있도록 공개되었습니다. 로컬 실행, 서버 배포, 개발 도구 연동 등 여러 방식으로 사용할 수 있어 연구용 테스트뿐 아니라 실제 개발 환경에서도 활용을 검토할 수 있습니다.
벤치마크 성능
Qwen3.6-35B-A3B는 코딩 에이전트, 일반 지식, 추론, 멀티모달 이해 등 주요 벤치마크에서 전반적으로 안정적인 성능을 보이는 모델입니다. 특히 코딩 및 개발 작업 관련 지표에서 이전 Qwen3.5-35B-A3B 대비 개선된 결과를 기록하며, 실사용 중심의 에이전트형 모델이라는 특징을 보여줍니다.
또한 지식 이해와 추론, 이미지·문서 기반 멀티모달 평가에서도 균형 잡힌 성능을 유지합니다. 즉, 특정 영역에만 치우친 모델이라기보다 코딩, 문서 이해, 시각 정보 처리까지 함께 고려한 오픈 웨이트 모델로 정리할 수 있습니다.
전체적인 성능 흐름과 모델 간 비교는 아래 표를 통해 확인할 수 있습니다.
| 벤치마크 지표 | Qwen3.6-35B-A3B | Qwen3.5-35B-A3B | Qwen3.5-27B | Gemma4-31B |
| SWE-bench Verified (코딩 에이전트) |
73.4 | 70.0 | 75.0 | 52.0 |
| Terminal-Bench 2.0 (터미널 작업) |
51.5 | 40.5 | 41.6 | 42.9 |
| QwenWebBench (웹 개발) |
1397 | 978 | 1068 | 1197 |
| MMLU-Pro (일반 지식) |
85.2 | 85.3 | 86.1 | 85.2 |
| GPQA (고난도 추론) |
86.0 | 84.2 | 85.5 | 84.3 |
| AIME26 (수학 추론) |
92.7 | 91.0 | 92.6 | 89.2 |
| RealWorldQA (현실 이미지 이해) |
85.3 | 84.1 | 83.7 | 72.3 |
| OmniDocBench1.5 (문서 이해) |
89.9 | 89.3 | 88.9 | 80.1 |
| RefCOCO(avg) (객체·영역 이해) |
92.0 | 89.2 | 90.9 | - |
출처: Qwen 공식 블로그
라이선스
Qwen3.6-35B-A3B는 Hugging Face를 통해 Apache 2.0 License로 공개되어 있습니다. Apache 2.0은 연구 목적뿐 아니라 상업적 활용까지 허용하는 오픈소스 라이선스로, 개인 프로젝트부터 기업 서비스까지 비교적 유연하게 활용할 수 있는 구조를 제공합니다. 또한 모델을 수정하거나 파생 모델을 만들고, 이를 재배포하는 것도 가능합니다.
Apache 2.0 License의 주요 특징은 다음과 같습니다.
- 연구 및 상업적 사용 모두 허용
- 모델 수정 및 파생 모델 생성 가능
- 재배포 및 배포 가능
- 라이선스 및 저작권 고지 유지 필요
- 특허 사용 권한 제공
- 개인, 기업, 서비스 등 다양한 환경에서 활용 가능
따라서 Qwen3.6-35B-A3B는 오픈 웨이트 모델을 기반으로 연구, 실험, 서비스 개발을 진행하려는 사용자에게 활용성이 높은 모델입니다. 특히 상업적 사용과 재배포가 가능한 라이선스 형태이기 때문에, 로컬 AI 실험뿐 아니라 실제 제품이나 개발 도구에 적용하는 방식도 검토할 수 있습니다.
간단한 사용 예시
Qwen3.6-35B-A3B는 오픈 웨이트로 공개된 모델이기 때문에 사용 방식이 비교적 유연합니다. 간단한 기능 확인은 Qwen Studio나 Alibaba Cloud Model Studio를 통해 진행할 수 있으며, 서비스 연동이 필요한 경우에는 Alibaba Cloud Model Studio API를 활용할 수 있습니다. 반대로 모델을 직접 제어하거나 자체 서버 환경에서 운영하고 싶다면, Hugging Face 모델을 내려받아 로컬 또는 온프레미스 환경에서 실행하는 방식도 가능합니다.
쉽게 정리하면, “빠른 테스트와 API 연동은 클라우드 방식”, “직접 실행과 커스텀 운영은 로컬 방식”으로 구분할 수 있습니다.
1. 클라우드 방식: Qwen Studio / Alibaba Cloud Model Studio
가장 간단한 사용 방식은 Qwen에서 제공하는 클라우드 기반 환경을 활용하는 것입니다. Qwen Studio에서는 별도의 설치 없이 브라우저에서 모델의 기능을 확인할 수 있으며, Alibaba Cloud Model Studio를 활용하면 API 형태로 모델을 호출해 애플리케이션이나 서비스에 연동할 수 있습니다. Qwen 공식 GitHub에서도 공식 Qwen API가 Alibaba Cloud Model Studio를 통해 제공되며, OpenAI 및 Anthropic API 사양과 호환된다고 안내하고 있습니다.
- 특징: 설치 없이 테스트 가능, API 기반 서비스 연동 지원
- 활용: 기능 테스트, 챗봇, 코딩 보조 도구, 문서 처리 시스템
- 경로: https://modelstudio.console.alibabacloud.com/ap-southeast-1?spm=a2ty_o05.31384571.0.0.2e1c9f6bbJKQVy&tab=doc#/doc/?type=model&url=2840914

2. 로컬 방식: Transformers / vLLM / SGLang
Qwen3.6-35B-A3B는 Hugging Face에 모델 가중치와 설정 파일이 공개되어 있어, 사용자가 직접 로컬 또는 자체 서버 환경에서 실행할 수 있습니다. 간단한 테스트는 Transformers로 시작할 수 있고, API 서버 형태로 구성하려면 vLLM을 사용할 수 있습니다. 더 복잡한 추론 흐름이나 고성능 추론 환경을 고려한다면 SGLang도 선택할 수 있습니다.
- 특징: 모델 직접 실행 가능, 운영 환경 제어 가능, 커스텀 구성에 적합
- 활용: 로컬 AI 실험, 자체 추론 서버, 사내 개발 도구, 에이전트형 코딩 환경
- 모델경로: https://huggingface.co/Qwen/Qwen3.6-35B-A3B/tree/main
Qwen3.6-35B-A3B는 효율적인 MoE 구조와 긴 컨텍스트 처리, 멀티모달 입력 지원을 결합한 Qwen3.6 계열의 오픈 웨이트 모델입니다. 전체 35B 규모의 모델이지만 실제 추론 과정에서는 일부 파라미터만 활성화하는 방식으로 효율성을 높였으며, 코딩 작업과 문서 이해, 이미지 기반 추론 등 실사용 중심의 작업에 활용할 수 있도록 설계되었습니다. 또한 Apache 2.0 라이선스로 공개되어 연구와 실험뿐 아니라 상업적 활용까지 검토할 수 있다는 점도 주요 장점입니다.
특히 이 모델은 클라우드 기반 테스트와 API 활용, 그리고 로컬 환경에서의 직접 실행을 모두 고려할 수 있다는 점에서 활용 범위가 넓습니다. 간단한 기능 확인은 Qwen Studio나 Alibaba Cloud Model Studio를 통해 시작할 수 있고, 더 높은 제어가 필요한 경우에는 Transformers, vLLM, SGLang 등을 활용해 직접 실행 환경을 구성할 수 있습니다. Qwen3.6-35B-A3B의 성능과 구조가 궁금하다면, 공식 페이지나 Hugging Face 모델 페이지를 통해 직접 테스트해 보시기 바랍니다.
감사합니다. 😊
'AI 소식 > 오픈소스 AI 모델' 카테고리의 다른 글
| [오픈소스 AI] 가장 가벼운 고성능 음성 AI, 샤오미 OmniVoice 모델 사용 가이드 (0) | 2026.05.14 |
|---|---|
| [오픈소스 AI] VoxCPM2 모델 소개 | 음성 생성 · 보이스 클로닝 · TTS (1) | 2026.04.21 |
| [오픈소스 AI] GLM-5.1 모델 소개 | 코딩·에이전트 AI 성능, 비용, 간단한 사용 예시 (1) | 2026.04.14 |
| [오픈소스 AI] 구글 Gemma 4 공개: 멀티모달·온디바이스 모델 정리 (0) | 2026.04.03 |
| [오픈소스 AI] Cohere에서 공개한 ARS 모델, Cohere Transcribe를 소개합니다. | 음성 인식 모델 | Speech-to-Text (0) | 2026.03.31 |
