오픈AI가 최신 AI 모델인 GPT-5.2를 11일(현지시각) 발표했다. 이 모델은 구글 의 제미나이 3 출시 이후 오픈AI 내부에서 긴급히 개발된 것으로, CEO 샘 올트먼이 “코드 레드”를 선언하며 개발 속도를 높인 결과다.

AI 모델의 성능을 평가하는 벤치마크 는 다양한 작업에서 모델의 능력을 측정하는 중요한 도구이다. GPT-5.2는 GDPval, SWE-Bench Pro, GPQA Diamond, ARC-AGI 등 다양한 테스트에서 우수한 성과를 보였다. 특히 ‘사고(Thinking)’ 모델은 GDPval 벤치마크에서 70.9% 이상의 성과를 기록하며, SWE-Bench Pro에서는 55.6%의 최고 성능을 달성했다.

GPT-5.2는 ‘즉시 대답(Instant)’, ‘사고(Thinking)’, ‘프로(Pro)’ 세 가지 버전으로 구성되어 있으며, 각각 속도, 복잡한 논리 작업, 최고 정확도에 초점을 맞추고 있다. 사고 모델은 이전 버전인 GPT-5.1 대비 사실 오류가 약 30% 줄어들었으며, 속도는 11배 빨라지고 비용은 1% 이하로 감소했다.

제미나이 3은 AI 업계에서 높은 평가를 받으며 오픈AI에게 강한 경쟁 압력을 가했다. 제미나이 3는 멀티모달 이해 능력과 장문 컨텍스트 처리에서 뛰어난 성능을 보여왔으며, 오픈AI는 이에 대응하기 위해 GPT-5.2의 개발을 가속화했다. 양사의 모델은 벤치마크 성능, 가격, 기능 면에서 직접 비교되고 있으며, 오픈AI는 특히 추론 능력과 응답 속도에서 경쟁력을 강화했다.

GPT-5.2의 API 가격은 입력 토큰당 $1.75, 출력 토큰당 $14이며, 프로 버전은 더 높은 가격을 책정하고 있다. 제미나이 3 프로는 입력 토큰당 $2, 출력 토큰당 $12로, 두 모델 간의 가격 경쟁이 치열하다.

GPT-5.2는 자살, 정신 건강 등 민감한 주제에 대한 응답에서 안전성을 강화했으며, 미성년자 보호를 위한 연령 예측 모델도 초기 도입 중이다. 이러한 기능은 향후 AI 규제 및 사용자 보호 기준에 부합하는 중요한 진전으로 평가된다. 또한, 2026년 1분기에는 “어덜트 모드” 기능이 출시될 예정으로, 사용자 경험을 더욱 다양화할 것으로 기대된다.

AI 시장은 GPT-5.2의 출시로 새로운 경쟁 국면에 접어들었다. OpenAI 는 Google과의 경쟁에서 주도권을 회복하려는 전략을 펼치고 있으며, 기업 고객은 고도화된 문서 분석, 코드 작성, 복잡한 프로젝트 관리 등에서 GPT-5.2를 적극 활용할 가능성이 높다. 그러나 빠른 출시 압박 속에서 안전성 테스트가 충분히 이루어졌는지에 대한 우려도 존재한다.

Exit mobile version