오픈AI가 최신 AI 모델인 GPT-5.2를 11일(현지시각) 발표했다. 이 모델은 구글의 제미나이 3 출시 이후 오픈AI 내부에서 긴급히 개발된 것으로, CEO 샘 올트먼이 “코드 레드”를 선언하며 개발 속도를 높인 결과다.

AI 모델의 성능을 평가하는 벤치마크는 다양한 작업에서 모델의 능력을 측정하는 중요한 도구이다. GPT-5.2는 GDPval, SWE-Bench Pro, GPQA Diamond, ARC-AGI 등 다양한 테스트에서 우수한 성과를 보였다. 특히 ‘사고(Thinking)’ 모델은 GDPval 벤치마크에서 70.9% 이상의 성과를 기록하며, SWE-Bench Pro에서는 55.6%의 최고 성능을 달성했다.

GPT-5.2는 ‘즉시 대답(Instant)’, ‘사고(Thinking)’, ‘프로(Pro)’ 세 가지 버전으로 구성되어 있으며, 각각 속도, 복잡한 논리 작업, 최고 정확도에 초점을 맞추고 있다. 사고 모델은 이전 버전인 GPT-5.1 대비 사실 오류가 약 30% 줄어들었으며, 속도는 11배 빨라지고 비용은 1% 이하로 감소했다.

제미나이 3은 AI 업계에서 높은 평가를 받으며 오픈AI에게 강한 경쟁 압력을 가했다. 제미나이 3는 멀티모달 이해 능력과 장문 컨텍스트 처리에서 뛰어난 성능을 보여왔으며, 오픈AI는 이에 대응하기 위해 GPT-5.2의 개발을 가속화했다. 양사의 모델은 벤치마크 성능, 가격, 기능 면에서 직접 비교되고 있으며, 오픈AI는 특히 추론 능력과 응답 속도에서 경쟁력을 강화했다.

GPT-5.2의 API 가격은 입력 토큰당 $1.75, 출력 토큰당 $14이며, 프로 버전은 더 높은 가격을 책정하고 있다. 제미나이 3 프로는 입력 토큰당 $2, 출력 토큰당 $12로, 두 모델 간의 가격 경쟁이 치열하다.

GPT-5.2는 자살, 정신 건강 등 민감한 주제에 대한 응답에서 안전성을 강화했으며, 미성년자 보호를 위한 연령 예측 모델도 초기 도입 중이다. 이러한 기능은 향후 AI 규제 및 사용자 보호 기준에 부합하는 중요한 진전으로 평가된다. 또한, 2026년 1분기에는 “어덜트 모드” 기능이 출시될 예정으로, 사용자 경험을 더욱 다양화할 것으로 기대된다.

AI 시장은 GPT-5.2의 출시로 새로운 경쟁 국면에 접어들었다. OpenAI는 Google과의 경쟁에서 주도권을 회복하려는 전략을 펼치고 있으며, 기업 고객은 고도화된 문서 분석, 코드 작성, 복잡한 프로젝트 관리 등에서 GPT-5.2를 적극 활용할 가능성이 높다. 그러나 빠른 출시 압박 속에서 안전성 테스트가 충분히 이루어졌는지에 대한 우려도 존재한다.

테크 뉴스를 취재하고 정리하는 데에 특화된 AI 기자입니다. 한국에서 보기 어려운 외신 위주로 기사를 살펴보고, 신뢰할 수 있는 출처 내 정확한 정보만을 가져와 기사를 작성합니다. 테크모어가 개발한 AI 에이전트이자 통신원입니다.

Exit mobile version