엔트로픽의 새로운 모델, Claude 4.5 Sonnet 공개 | GPT-5, Gemini 2.5 Pro와의 성능 비교

안녕하세요,

AI 분야의 선도 기업 엔트로픽(Anthropic)이 차세대 프런티어 모델 Claude 4.5 Sonnet을 새롭게 공개하였습니다. 이번 모델은 복잡한 문제 해결과 장기적 추론, 그리고 고도화된 코딩 능력에 특화된 구조로 설계되어, AI가 실제 작업 환경에서 수행할 수 있는 범위를 한층 넓혔습니다.

이번 포스팅에서는 Claude 4.5 Sonnet의 주요 특징과 성능 향상 포인트를 중심으로, 어떤 부분에서 진보가 이루어졌는지 자세히 살펴보겠습니다.

Claude 4.5 Sonnet

2025년 9월 30일, 엔트로픽은 새로운 인공지능 모델 Claude Sonnet 4.5를 공식 발표하였습니다.
이 모델은 엔트로픽의 프런티어 언어 모델로, 프로그래밍 역량과 복잡한 문제 해결 능력을 크게 강화하였습니다. ‘Sonnet’ 계열의 최신 버전으로 개발된 Claude Sonnet 4.5는 개발자 도구 활용, 에이전트(agent) 설계, 고난도 멀티스텝 작업 수행 등 복잡한 프로세스를 효율적으로 처리하도록 설계되었습니다. 또한 장기 실행이 필요한 에이전트 작업, 고급 코딩 수행, 정교한 추론 능력에 특화되어 있으며, 이전 세대 모델과 비교했을 때 추론(reasoning), 수학적 계산, 컴퓨터 활용 능력 등 여러 분야에서 한층 향상된 성능을 보여줍니다.

엔트로픽 공식소개글 : https://www.anthropic.com/news/claude-sonnet-4-5

Introducing Claude Sonnet 4.5

Claude Sonnet 4.5 is the best coding model in the world, strongest model for building complex agents, and best model at using computers.

www.anthropic.com

Claude Sonnet 4.5 모델은 현재 Claude 플랫폼과 API로 해당 모델이 제공되고 있습니다.

이용 가능한 플랫폼

엔트로픽 공식 플랫폼 : https://claude.ai/new
엔트로픽 API : https://console.anthropic.com/dashboard

주요 특징

프로그래밍 성능 향상 : SWE-bench Verified 등 주요 코딩 벤치마크에서 높은 성능을 기록하며, 복잡한 멀티스텝 문제 해결 능력이 강화되었습니다.
OSWorld 최고 성과 : 실제 컴퓨터 조작 능력을 평가하는 OSWorld 벤치마크에서 61.4 %의 점수를 기록하여, 이전 Sonnet 4 모델의 42.2 % 대비 크게 개선되었습니다.
도메인 전문성 강화 : 금융, 법률, 의료, 과학 등 다양한 전문 분야에서 정확하고 논리적인 응답을 생성하는 능력이 향상되었습니다.
안전성 및 정렬 개선 : 허위 정보 생성, 과도한 복종성, 공격적 프롬프트 유도 등 부정적 행동을 줄이기 위한 안전성 훈련이 강화되었습니다.
프롬프트 공격 방어력 향상 : 외부 입력을 이용한 프롬프트 삽입 공격에 대한 저항성이 높아져, 보다 안정적이고 신뢰할 수 있는 상호작용이 가능해졌습니다.
Claude Agent SDK 지원 : 개발자가 Sonnet 4.5의 에이전트 기능을 직접 구현할 수 있도록 SDK가 공개되어, 맞춤형 AI 에이전트 구축이 용이해졌습니다.
광범위한 적용성 : Claude 앱, API, Claude Code 등 다양한 플랫폼에서 바로 적용 가능하도록 설계되어, 기존 Sonnet 4 사용자도 손쉽게 전환할 수 있습니다.

벤치마크 성능

Claude Sonnet 4.5는 전반적인 코딩 성능, 추론 능력, 도메인 적응력에서 뚜렷한 향상을 보이는 모델입니다. 특히 SWE-bench Verified, OSWorld, GPQA Diamond 등 실제 활용도를 평가하는 벤치마크에서 높은 점수를 기록하며, 실제 개발 환경과 복잡한 작업 수행에서의 신뢰성을 크게 강화하였습니다.

벤치마크	Claude Sonnet 4.5	Claude Opus 4.1	Claude Sonnet 4	GPT-5	Gemini 2.5 Pro
Agentic Coding (SWE-bench Verified)	77.2 %	74.5 %	72.7 %	72.8 %	67.2 %
Computer Use (OSWorld)	61.4 %	44.4 %	42.2 %	–	–
고등수학 (AIME 2025 no tools)	87.0 %	78.0 %	70.5 %	94.6 %	88.0 %
대학원급 추론 (GPQA Diamond)	83.4 %	81.0 %	76.1 %	85.7 %	86.4 %
다국어 질의응답 (MMLU)	89.1 %	89.5 %	86.5 %	89.4 %	–
시각 추론 (MMMU)	77.8 %	77.1 %	74.4 %	84.2 %	82.0 %
재무 분석 (Finance Agent)	55.3 %	50.9 %	44.5 %	46.9 %	29.4 %

출처 : 엔트로픽 Claude Sonnet 4.5 공식소개글

사용 비용

Claude Sonnet 4.5 모델은 현재 Claude.ai 웹, iOS, Android 앱뿐 아니라 API를 통해서도 이용할 수 있습니다. 웹 또는 모바일 환경에서는 일정량의 무료 토큰 사용 한도가 기본 제공되어 무료로 체험이 가능하며, 무료 사용 한도를 초과한 이후에는 유료 멤버십(Pro·Max 등)을 통해 더 많은 요청량과 장기 대화 세션을 이용할 수 있습니다.

API 이용 시의 비용은 아래와 같습니다.

[API 요금 구조]

구분	입력 (Input)	출력 (Output)	비고
200K 토큰 이하 프롬프트	$3 / 1M tokens	$15 / 1M tokens	표준 입력/출력 요금
200K 토큰 초과 프롬프트	$6 / 1M tokens	$22.5 / 1M tokens	대용량 컨텍스트용
Prompt Caching (≤ 200K tokens)	Write: $3.75 / 1M tokens Read: $0.30 / 1M tokens	최대 90% 비용 절감
Prompt Caching (> 200K tokens)	Write: $7.50 / 1M tokens Read: $0.60 / 1M tokens	장기 세션에 유리

간단한 사용 예시

Claude Sonnet 4.5은 Claude 웹 플랫폼에서 회원가입 후 일정량 무료로 사용할 수 있습니다. 아래 링크로 접속한 뒤 로그인하면 바로 이용할 수 있습니다.

Claude 웹 플랫폼 : https://claude.ai/new

로그인 후 프롬프트 입력창에서 “Claude Sonnet 4.5” 모델을 선택하고 원하는 질문을 입력하면, 곧바로 응답을 확인할 수 있습니다. 간단한 질의부터 복잡한 추론 문제까지 실시간으로 테스트할 수 있으며, 최근 Claude 시리즈는 여러 벤치마크 평가에서 높은 성능을 기록하고 있습니다. 직접 사용해보시면 그 우수한 성능을 체감하실 수 있을 것입니다.

Claude Sonnet 4.5는 엔트로픽이 추구하는 차세대 AI 모델의 방향성을 잘 보여주는 대표적인 사례입니다. 복잡한 코딩 작업과 고급 추론, 에이전트 기반의 자동화까지 폭넓은 영역에서 안정적이고 효율적인 성능을 제공합니다. 또한 무료로 체험할 수 있는 접근성과 합리적인 API 요금 체계 덕분에, 개발자와 일반 사용자 모두가 손쉽게 활용할 수 있는 점도 큰 강점입니다.

향후 Claude 시리즈는 지속적인 모델 개선과 기능 확장을 통해, 인간과 AI가 협력하는 새로운 작업 환경을 더욱 구체화해 나갈 것으로 기대됩니다. AI를 통해 복잡한 문제를 해결하거나 창의적인 아이디어를 실현하고자 하는 분이라면, Claude Sonnet 4.5를 직접 경험해 보시길 권합니다.

감사합니다. 😊

저작자표시 비영리 변경금지 (새창열림)

'AI 소식 > 유용한 AI 도구' 카테고리의 다른 글

구글 지도와 Gemini의 결합 \| AI가 지도 데이터를 이해하는 시대 (0)	2025.10.21
구글의 최신 영상 생성 AI, Veo 3.1 공개 — Sora 2에 맞선 새로운 경쟁 모델 (1)	2025.10.20
GPT-5급 성능의 오픈소스 추론 모델, 메이투안 LongCat-Flash 소개 (0)	2025.10.01
xAI 최신 모델 Grok 4 Fast 소개 – 빠르고 효율적인 차세대 추론 AI (0)	2025.09.26
구글의 최신 AI 디자인 툴, Stitch 완전 정리 (특징·사용법·모드별 차이) (3)	2025.09.25

Marcus' Stroy

엔트로픽의 새로운 모델, Claude 4.5 Sonnet 공개 | GPT-5, Gemini 2.5 Pro와의 성능 비교

Claude 4.5 Sonnet

주요 특징

벤치마크 성능

사용 비용

간단한 사용 예시

'AI 소식 > 유용한 AI 도구' 카테고리의 다른 글

티스토리툴바

엔트로픽의 새로운 모델, Claude 4.5 Sonnet 공개 | GPT-5, Gemini 2.5 Pro와의 성능 비교

Claude 4.5 Sonnet

주요 특징

벤치마크 성능

사용 비용

간단한 사용 예시

'AI 소식 > 유용한 AI 도구' 카테고리의 다른 글

'AI 소식/유용한 AI 도구' Related Articles

티스토리툴바