본문 바로가기

AI 소식/유용한 AI 도구

알리바바 Qwen3.6-Plus 모델 공개 | 성능, 비용, 특징까지

안녕하세요,

최근 AI 모델은 단순한 텍스트 생성 기능을 넘어, 실제 작업을 수행하고 문제를 해결하는 방향으로 빠르게 발전하고 있습니다. 특히 단일 질의 응답을 넘어, 계획 수립과 실행까지 이어지는 에이전트형 구조가 중요해지며, 복잡한 작업을 처리할 수 있는 모델에 대한 요구도 함께 높아지고 있습니다. 이러한 흐름 속에서 알리바바의 Qwen 팀은 새로운 에이전트형 AI 모델, Qwen3.6-Plus를 공개했습니다. 이 모델은 장문 컨텍스트 이해와 멀티모달 처리, 그리고 작업 수행 능력을 통합한 구조로 설계된 것이 특징입니다.

이번 글에서는 Qwen3.6-Plus 모델의 개념과 주요 특징, 벤치마크 성능, API 비용, 그리고 간단한 사용 방법까지 함께 살펴보겠습니다.


반응형

Qwen3.6-Plus 모델이란

2026년 4월 2일, 알립바바의 Qwen 팀에서 또다시 새로운 최신 플래그십 모델, Qwen3.6-Plus를 공개했습니다. 이 모델은 기존 Qwen3.5 계열을 기반으로 성능과 구조를 확장한 차세대 AI 모델입니다. 이 모델은 단순한 언어 생성 능력을 넘어, 실제 환경에서 복잡한 작업을 수행할 수 있는 에이전트형 AI(Agentic AI)로의 발전을 목표로 설계되었습니다.

특히 Qwen3.6-Plus는 텍스트 처리 중심의 기존 LLM에서 한 단계 나아가, 멀티모달 이해와 실행 능력을 통합한 구조를 갖추고 있습니다. 문서, 이미지, 영상과 같은 다양한 입력을 기반으로 분석을 수행하고, 그 결과를 바탕으로 실제 작업 흐름까지 이어지는 형태로 동작합니다. 결과적으로 Qwen3.6-Plus는 기존 모델처럼 “질문에 답하는 AI”를 넘어, 현실 문제를 단계적으로 해결하는 실행형 AI로 확장된 모델이라고 정리할 수 있습니다.

 

 

Qwen

 

qwen.ai

 

[모델 정보 요약]

항목 내용
모델 버전 Qwen3.6-Plus
개발사 Alibaba (Qwen Team)
모델 유형 에이전트형 AI (추론 및 작업 수행 중심)
아키텍처 하이브리드 MoE (Linear Attention + Sparse MoE)
컨텍스트 창 최대 1M 토큰 (초장문 처리 지원)
지원 기능 텍스트, 이미지, 문서, 영상 등 멀티모달 입력 처리
주요 특징 에이전틱 워크플로우, 롱 컨텍스트 이해, 도구 호출(Tool-call) 최적화
모델 제공 방식 API / 클라우드 기반 서비스

 

 

주요 특징

Qwen3.6-Plus는 단순한 텍스트 생성 모델을 넘어, 복잡한 작업을 스스로 수행할 수 있도록 설계된 에이전트형 AI 모델로, 장문 맥락 이해와 멀티모달 처리, 실행 중심 구조를 함께 고려한 것이 특징입니다.

  • 에이전트형 작업 수행 구조 : Qwen3.6-Plus는 단순한 응답 생성이 아니라 문제를 이해하고, 해결 계획을 수립한 뒤 실제 작업을 수행하는 흐름을 지원하도록 설계되었습니다. 코드 작성, 수정, 실행과 같은 일련의 과정을 하나의 모델에서 연속적으로 처리할 수 있도록 구성되었습니다.
  • 초장문 컨텍스트 처리 : 최대 100만 토큰 수준의 긴 입력을 처리할 수 있도록 설계되어, 대규모 문서나 코드베이스를 한 번에 분석할 수 있는 구조를 갖추었습니다. 이를 통해 장기적인 맥락을 유지하면서 복잡한 문제를 해결할 수 있습니다.
  • 멀티모달 통합 이해 : 텍스트뿐 아니라 이미지, 문서, 영상 등 다양한 입력을 함께 처리할 수 있도록 구성되어, 서로 다른 형태의 데이터를 하나의 흐름으로 통합해 이해할 수 있도록 설계되었습니다. 이를 통해 복합적인 상황에서도 일관된 분석이 가능합니다.
  • 추론·메모리·도구 활용 통합 : 논리적 추론 과정과 이전 맥락에 대한 기억, 그리고 외부 도구 활용을 하나의 구조로 결합하여, 복잡한 작업에서도 일관된 처리 흐름을 유지할 수 있도록 설계되었습니다. 이를 통해 단일 질의 응답을 넘어 연속적인 작업 수행이 가능합니다.
  • 실사용 환경 중심 구조 : 실제 개발 및 서비스 환경에서의 활용을 고려하여 안정성과 확장성을 함께 확보한 구조를 갖추었습니다. 다양한 개발 도구 및 환경과 연동하여 실질적인 작업 수행에 활용할 수 있도록 설계되었습니다.

 

 

벤치마크 성능

Qwen3.6-Plus는 코딩, 일반 작업 수행, 지식 이해, 추론, 다국어 처리 등 다양한 영역의 주요 벤치마크에서 전반적으로 균형 잡힌 성능을 보이는 것이 특징입니다. 특히 에이전트 기반 작업 수행과 장문 컨텍스트 처리, 그리고 추론 능력과 관련된 지표에서 안정적인 결과를 기록하며, 단순 응답 생성이 아닌 실제 작업 수행 중심 모델로 설계된 특성이 반영되어 있습니다. 또한 특정 영역에 편중된 성능이 아니라 여러 지표에서 고르게 성능을 유지한다는 점에서, 다양한 활용 환경에서도 일관된 성능을 기대할 수 있는 구조를 갖추고 있습니다.

 

전체적인 성능 흐름과 모델 간 비교는 아래 표를 통해 확인할 수 있습니다.

 

벤치마크 지표 Qwen3.6-Plus Claude Opus 4.5 Qwen3.5-
397B-A17B
SWE-bench Verified (코딩 문제 해결 정확도) 78.8 80.9 76.2
Terminal-Bench 2.0 (터미널 기반 작업 수행 능력) 61.6 59.3 52.5
TAU3-Bench (일반 작업 수행 능력) 70.7 70.2 68.4
MCPMark (도구 활용 및 에이전트 성능) 48.2 42.3 46.1
MMLU-Pro (전문 지식 이해 능력) 88.5 89.5 87.8
C-Eval (중국어 기반 지식 평가) 93.3 92.2 93.0
IFEval (지시 수행 정확도) 94.3 90.9 92.6
LongBench v2 (장문 이해 능력) 62.0 64.4 63.2
GPQA (고난도 과학 추론) 90.4 87.0 88.4
AIME26 (수학 문제 해결 능력) 95.3 95.1 93.3
WMT24++ (다국어 번역 성능) 84.3 79.7 78.9
출처: Qwen 공식 블로그

 

 

사용 비용

Qwen3.6-Plus는 토큰 기반 과금 구조를 따르며, 입력 토큰과 출력 토큰을 기준으로 비용이 계산됩니다. 특히 입력 길이에 따라 가격이 구간별로 구분되며, 동일한 모델이라도 배포 지역(Global / International)에 따라 비용 구조가 다르게 적용되는 것이 특징입니다. 전반적으로 Global 환경은 상대적으로 낮은 비용 구조를 제공하는 대신 무료 할당량이 없으며, International 환경은 비용이 다소 높지만 일부 무료 사용 조건이 포함될 수 있는 형태로 구성되어 있습니다. 또한 출력 비용은 일반 응답과 추론(Thinking) 모드 간 차이가 거의 없도록 설계되어 있어, 사용 목적에 따른 비용 변동이 크지 않은 구조를 갖추고 있습니다.

아래 표를 통해 배포 환경별 API 비용을 확인할 수 있습니다.

기준 구분 입력 토큰 범위 입력 비용
(1M tokens)
출력 비용
(일반)
출력 비용
(Thinking)
International
배포
기본
구간
0 ~ 256K $0.5 $3 $3
확장
구간
256K ~ 1M $2 $6 $6
Global
배포
기본
구간
0 ~ 256K $0.276 $1.651 $1.651
확장
구간
256K ~ 1M $1.101 $6.602 $6.602
  • Global : 상대적으로 저렴한 비용, 무료 할당 없음
  • International : 비용은 높지만 무료 크레딧 제공 가능
  • 구간별 과금 구조 : 256K 기준으로 비용 상승
  • 출력 비용 : 일반/추론 모드 동일
출처: Qwen API Doc

 


 

간단한 사용 예시

Qwen3.6-Plus는 에이전트형 작업 수행과 장문 컨텍스트 처리를 지원하는 모델로, 사용 환경에 따라 활용 방식이 구분됩니다. 공식 웹 인터페이스를 통해 간단히 기능을 확인할 수 있으며, 모바일 및 데스크톱 앱을 통해 보다 편리하게 사용할 수도 있습니다. 또한 API를 활용하면 실제 서비스에 직접 통합하여 자동화된 작업 흐름을 구성하는 것도 가능합니다. 쉽게 정리하면 “간단한 테스트는 웹”, “일상 활용은 앱”, “서비스 적용은 API” 형태로 이해할 수 있습니다.

 

1. 공식 웹 서비스에서 직접 사용

개발 환경 없이 바로 기능을 확인하려면 공식 웹 서비스를 활용하는 방식이 적절합니다. 브라우저에서 접속 후 모델을 선택하면 텍스트 기반 작업뿐 아니라 코드 생성, 문서 분석, 추론 작업 등을 바로 수행할 수 있습니다.

  • 특징: 브라우저 기반 인터페이스, 설치 없이 즉시 사용 가능
  • 비용: 일부 기능은 무료 체험 제공, 이후 사용량 기반 과금
  • 활용: 코드 생성, 문서 요약, 추론 테스트, 간단한 작업 수행
  • 경로: https://chat.qwen.ai/

출처: Qwen 공식 플랫폼 (클릭시 페이지 이동)

 

2. 공식 앱 설치 (Mobile / Desktop)

Qwen은 모바일 및 데스크톱 환경에서 사용할 수 있는 공식 앱을 제공하며, 웹 대비 보다 안정적인 사용 환경을 제공합니다. 로그인 기반으로 작업 기록을 관리할 수 있으며, 반복적인 작업이나 장문 컨텍스트 기반 작업을 이어서 수행하는 데 적합합니다.

  • 특징: 앱 기반 환경, 세션 유지 및 작업 연속성 지원
  • 비용: 기본 기능 무료 + 사용량 기반 과금 구조
  • 활용: 장문 분석, 지속적인 작업 수행, 개인 업무 보조
  • 경로: https://qwen.ai/download

출처: Qwen 공식 다운로드 페이지 (클릭시 페이지 이동)

 

3. API 연동 (Qwen3.6-Plus)

서비스나 애플리케이션에 모델을 직접 적용하려면 API를 활용합니다. Qwen3.6-Plus는 장문 입력과 복합 작업을 처리할 수 있도록 설계되어 있어, 단순 응답 생성뿐 아니라 코드 실행 흐름이나 자동화된 작업 처리에도 활용할 수 있습니다.

 


 

Qwen3.6-Plus는 단순한 텍스트 생성 모델을 넘어, 복잡한 작업을 이해하고 실행까지 이어지는 에이전트형 AI로 확장된 모델입니다. 장문 컨텍스트 처리, 멀티모달 이해, 그리고 추론과 도구 활용을 통합한 구조를 통해 실제 개발 및 업무 환경에서 활용 가능한 수준의 기능을 제공하며, 다양한 벤치마크에서도 이러한 설계 방향이 반영된 성능을 확인할 수 있습니다.

 

직접 웹이나 앱을 통해 기능을 체험해보고, 필요하다면 API를 활용해 자신의 서비스나 프로젝트에 적용해보시기 바랍니다. 실제 사용 환경에서 어떻게 동작하는지 경험해보는 과정이 이 모델의 활용 가능성을 이해하는 데 도움이 됩니다.

 

 

감사합니다. 😊

 

반응형