본문 바로가기

AI 소식

GPT-5 출시 이후 논란과 대응, GPT-4o·4.1 다시 제공 시작

안녕하세요,

최근 GPT-5가 공개되면서 다양한 논란이 이어지고 있습니다. 일부에서는 성능 향상을 긍정적으로 평가하는 반면, 오히려 퇴보했다는 의견도 나오고 있습니다. 이러한 상황 속에서 OpenAI는 한때 지원을 중단했던 GPT-4o, GPT-4.1 등 이전 모델들을 다시 선택할 수 있도록 조치했습니다.

이번 글에서는 GPT-5 출시와 관련해 제기된 주요 이슈와 함께, 각 모델의 특징을 간단히 정리했습니다.


반응형

GPT-5 개요

2025년 8월 7일 OpenAI는 GPT-5를 공식적으로 공개했습니다. OpenAI는 이번 모델을 “지금까지 가장 똑똑하고, 가장 빠르며, 가장 유용한 모델”이라고 소개하며, 누구나 전문가 수준의 지능을 활용할 수 있다는 점을 강조했습니다. GPT-5는 o 시리즈의 사고 능력과 GPT 시리즈의 고속 응답을 결합한 통합형 아키텍처로 설계되었으며, 입력의 특성에 따라 빠른 응답 모델과 깊이 사고형 모델을 자동으로 전환하는 실시간 라우터를 탑재했습니다.

이 모델은 코딩 분야에서 특히 강력한 성능을 보였으며, SWE-Bench Verified 벤치마크에서 기존 o3 모델 대비 더 높은 성능을 기록했습니다. 또한 토큰 사용량은 약 22% 줄었고, 툴 호출 횟수는 45% 감소해 효율성도 개선되었습니다. GPT-5는 텍스트와 이미지 입력을 지원하며 최대 40만 토큰 입력과 12만8천 토큰 출력을 처리할 수 있습니다.

 

 

출시 후 주요 논란과 문제점

GPT-5는 “더 똑똑한 AI”라는 슬로건과 달리, 기초적인 오류와 성능 저하, 과장된 마케팅으로 비판을 받았습니다. 여기에 기존 모델 지원을 중단했다가 다시 복구하는 정책 혼선까지 더해지며 사용자 불만이 크게 확산되었습니다.

다만 일부 사용자는 “코딩 성능은 뛰어나다”, “GPT-4o보다 개선된 부분이 있다”는 긍정적인 평가도 내놓았습니다. 결국 이번 출시의 결론은 점진적 발전은 있었지만, 기대에 미치지는 못했다는 점으로 요약할 수 있습니다.

 

[세부 쟁점 살펴보기]

1. 기초 오류와 할루시네이션(Hallucination)

  • 기초적인 상식 오류가 반복적으로 드러났습니다.
  • 지도 작성 같은 단순 과제에서도 오류가 잦아, 소셜미디어와 커뮤니티에서 조롱과 비판 확산.
  • 일부 사용자는 “GPT-4o보다 더 나빠졌다”는 평가를 제기했습니다.

2. 성능 저하 및 사용자 체감 논란

  • 실시간 라우터(모델 자동 선택 기능) 결함이 원인으로 지적.
  • 답변이 느리고 짧으며 정확도도 떨어진다는 평가.
  • “압도적 체감 향상이 없다”는 지적과 함께, 기대 대비 실망감이 확산.

3. 과도한 마케팅과 신뢰도 하락

  • “박사급 전문가 수준”이라는 마케팅이 과장됐다는 비판.
  • 사용자 기대치와 실제 성능의 괴리로 인해 “과도한 포장” 논란 발생.

4. 정책 변화와 사용자 반발

  • 출시 직후, GPT-4o 등 기존 모델 지원을 갑작스럽게 중단 → 사용자 강한 반발.
  • 현재는 GPT-4o, 4.1 등 구형 모델 재지원

5. 기타 논란

  • 성능 비교 자료 오류: 공식 발표 그래프의 막대 높이와 실제 수치가 불일치 → “성능 과포장” 논란.
  • 코딩 성능 논쟁: 코딩 분야에서 Claude 등 경쟁 모델 대비 우위가 명확하지 않다는 지적.

 

 

논란 이후의 변화와 대응

GPT-5는 출시 직후 여러 논란에 휩싸이며 많은 비판을 받았습니다. 기초적인 오류와 성능 저하, 과도한 마케팅에 대한 불신이 겹치면서 사용자 불만이 빠르게 확산되었고, 여기에 기존 모델 지원을 갑작스럽게 중단한 정책 혼선까지 더해지며 혼란이 가중되었습니다. 이러한 상황 속에서 OpenAI는 대응책으로 GPT-4o와 GPT-4.1 같은 이전 세대 모델을 다시 사용할 수 있도록 조치했습니다.

 

현재 사용자는 모델 선택 메뉴에서 ‘레거시 모델’을 선택하면 이전 세대 모델을 활용할 수 있습니다. 만약 해당 옵션이 보이지 않는 경우, 화면 좌측 하단의 사용자 계정 버튼 → 설정 → 추가 모델 보기를 활성화하면 표시됩니다.

 

아래 예시 이미지를 참고하시면 설정 방법을 확인할 수 있습니다.

출처: ChatGPT

 

 

현재 제공되는 모델 소개

GPT-5는 내부적으로 다양한 모드를 제공하여 사용자의 필요와 상황에 따라 최적의 응답을 받을 수 있도록 설계되었습니다. 단순히 빠른 답변이 필요한 경우부터, 복잡한 문제 해결을 위한 깊은 사고가 필요한 경우까지 유연하게 대응할 수 있다는 점이 특징입니다. 또한 연구 및 전문적인 활용을 위한 Pro 모델까지 제공되어, 일반 사용자부터 기업·연구자까지 폭넓은 선택이 가능하도록 구성되었습니다.

아울러 이전 세대 모델인 GPT-4o, GPT-4.1, o3, o4-mini도 여전히 선택할 수 있어, 사용자들이 익숙한 환경을 유지하거나 특정 작업에 적합한 모델을 활용할 수 있습니다. 이를 통해 OpenAI는 최신 성능을 원하는 사용자와 안정성과 친숙함을 중시하는 사용자의 요구를 모두 충족시키고 있습니다.

 

각 모델 모델 한눈에 보기

범주 주요 모델 설명 추천 사용 사례
GPT-5
내부 모델
Auto 자동 모드, 상황에 맞게 사고 시간을 조정 일상 대화, 일반적인 질문, 혼합형 작업
Fast 빠른 답변, 최소한의 사고 과정으로 즉시 응답 간단한 질의응답, 짧은 요약, 검색형 질문
Thinking mini 신속한 사고, 짧은 사고 시간으로 기본 추론 코드 디버깅, 수학 계산, 단순 논리 문제
Thinking 깊이 사고, 더 긴 시간으로 정밀한 응답 창의적 글쓰기, 다단계 추론, 복잡한 문제 해결
Pro
(유료 업그레이드)
리서치급 인텔리전스, 방대한 지식 탐색·고급 추론 논문 작성, 전략 설계, 연구·기업용 멀티모달 분석
레거시 모델
(GPT-5 이전)
GPT-4o 멀티모달, 따뜻한 톤의 대화형 AI 일반 대화, 이미지/음성 기반 멀티모달 작업
GPT-4.1 코딩 및 연산 강화, 경량형 옵션 코드 작성·분석, 수학·논리 문제
o3 빠르고 신뢰성 있는 응답, 복잡 과제 적합 복잡한 질의응답, 구조적 사고가 필요한 작업
o4-mini 속도와 정확성 모두 강점 있는 기술형 모델 기술·수학 문제, 실시간 응답 요구 작업

 


 

GPT-5는 출시와 함께 기대와 논란이 동시에 뒤따른 모델이었습니다. “더 똑똑한 AI”라는 슬로건과 달리 기초적인 오류와 성능 저하, 과도한 마케팅에 대한 불신이 불거졌지만, 동시에 코딩 성능이나 일부 기능에서 확실히 개선된 점도 있다는 평가가 존재합니다. 이러한 상반된 반응은 GPT-5가 완벽한 도약은 아니었으나, 점진적인 발전을 이뤘다는 사실을 보여줍니다.

 

논란 이후 OpenAI가 기존 모델을 다시 지원하고, 다양한 응답 모드와 선택권을 제공한 점은 사용자 경험을 존중하려는 방향성을 드러냅니다. 현재는 GPT-5 내부 모델과 GPT-4o, 4.1 같은 레거시 모델을 모두 활용할 수 있기 때문에, 사용자는 자신의 필요에 맞는 모델을 선택해 최적의 결과를 얻는 것이 중요합니다.

 

결국 GPT-5는 기대에 미치지 못했다는 비판과 함께, AI 발전의 과정에서 얻어진 또 하나의 이정표로 평가할 수 있습니다. 앞으로의 개선과 진화를 통해 더 안정적이고 신뢰할 수 있는 AI로 나아가기를 기대해볼 수 있습니다.

 

감사합니다. 😊

 

반응형