오픈AI가 3월 17일 GPT-5.4 미니(mini)와 나노(nano) 모델을 공개했다. GPT-5 미니 대비 2배 빠른 속도와 대폭 낮아진 가격이 특징이다. 고성능 소형 모델 경쟁에서 구글 제미나이 3.1 플래시 라이트를 정조준한 전략적 포석이다.

오픈AI (OpenAI )가 자사 최신 대형 언어 모델 GPT-5.4의 경량화 버전인 GPT-5.4 미니와 GPT-5.4 나노를 동시에 출시했다. GPT-5.4 미니는 기존 GPT-5 미니 대비 코딩, 추론, 멀티모달 이해, 도구 사용 능력에서 대폭 개선됐으며, 처리 속도는 2배 이상 빨라졌다. GPT-5.4 나노는 오픈AI 역사상 가장 작고 저렴한 모델로, 분류, 데이터 추출 등 대량 처리 작업에 최적화됐다. 두 모델 모두 ‘서브에이전트(subagent)’ 시대를 겨냥한 전략적 제품으로 평가된다.

성능: 플래그십에 근접하는 소형 모델

GPT-5.4 미니는 여러 핵심 벤치마크에서 플래그십 GPT-5.4에 근접하는 성능을 보여준다. SWE-벤치 프로(SWE-Bench Pro)에서 54.4%를 기록해 GPT-5.4의 57.7%에 불과 3.3%포인트 차이를 보였다. OS월드 검증(OSWorld-Verified)에서는 72.1%로 플래그십(75%)과의 격차가 더욱 좁아졌다. 터미널벤치 2.0(Terminal-Bench 2.0)에서는 60%를 기록했으며, 통신 분야 특화 벤치마크인 타우2벤치(t2-bench)에서는 93.4%라는 높은 점수를 달성했다. GPT-5.4 나노 역시 SWE-벤치 프로에서 52.4%를 기록해 “최대 추론 모드에서 이전 GPT-5 미니를 능가하는” 성능을 입증했다.

항목 GPT-5.4 나노 GPT-5.4 미니 GPT-5.4(플래그십)
입력 가격(100만 토큰당) 0.20달러(약 290원) 0.75달러(약 1,088원) 15달러(약 2만 1,750원)
출력 가격(100만 토큰당) 1.25달러(약 1,813원) 4.50달러(약 6,525원)
캐시 입력 가격 0.02달러(약 29원) 0.075달러(약 109원)
SWE-벤치 프로 52.4% 54.4% 57.7%
OS월드 검증 72.1% 75%
터미널벤치 2.0 46.3% 60%
컨텍스트 윈도우 40만 토큰

가격 전쟁: 구글 제미나이를 정조준

가격 경쟁력은 이번 출시의 핵심 무기다. GPT-5.4 나노의 입력 토큰 가격은 100만 토큰당 0.20달러(약 290원)로, 구글 제미나이(Gemini) 3.1 플래시 라이트의 0.25달러보다 20% 저렴하다. 출력 토큰 역시 1.25달러로 제미나이 플래시 라이트(1.50달러)를 밑돈다. AI 블로거 사이먼 윌리슨(Simon Willison)은 “내 사진 컬렉션 7만 6,000장 전체를 설명하는 데 약 52.44달러(약 7만 6,000원)면 충분하다”며 나노 모델의 극적인 비용 효율성을 시연했다. GPT-5.4 미니 역시 입력 0.75달러, 출력 4.50달러로 플래그십 대비 20분의 1 수준의 가격을 제시하면서도, 오픈AI의 코덱스(Codex) 플랫폼에서 GPT-5.4 할당량의 30%만 소비해 기업 고객의 비용 부담을 크게 낮췄다.

활용 시나리오: 서브에이전트와 대량 처리의 시대

오픈AI는 두 모델을 ‘AI 에이전트의 에이전트’로 포지셔닝하고 있다. GPT-5.4 나노는 분류, 데이터 추출, 랭킹, 코딩 서브에이전트 등 단순하지만 대량으로 발생하는 보조 작업에 특화됐다. 기업 AI 플랫폼 헤비아(Hebbia)의 CTO는 “미니 모델이 여러 출력 작업과 인용 리콜에서 경쟁 모델을 맞추거나 능가하면서도 비용은 훨씬 낮았다”며, “오히려 더 큰 GPT-5.4 모델보다 출처 귀속(source attribution) 능력이 강했다”고 평가했다. GPT-5.4 미니는 텍스트와 이미지 입력, 웹 검색, 함수 호출(function calling)을 모두 지원하며 40만 토큰의 컨텍스트 윈도우를 제공한다.

접근성 확대: 무료 사용자도 사용 가능

GPT-5.4 미니는 API, 코덱스(Codex), 챗GPT(ChatGPT)에서 모두 사용할 수 있다. 특히 무료 및 고(Go) 요금제 사용자도 ‘생각하기(Thinking)’ 기능을 통해 접근할 수 있어 접근성이 크게 확대됐다. 유료 사용자에게는 GPT-5.4 사용 한도 초과 시 자동으로 미니 모델로 전환되는 ‘속도 제한 대체(rate limit fallback)’ 기능도 제공된다. GPT-5.4 나노는 현재 API 전용으로, 소비자용이 아닌 개발자 도구로 포지셔닝됐다.

전망: 한국 AI 생태계에 미치는 영향

이번 출시는 한국 AI 산업에도 직접적인 영향을 미칠 전망이다. 국내 AI 스타트업과 기업들이 대량의 에이전트 워크플로를 구축할 때, GPT-5.4 나노의 100만 토큰당 0.20달러라는 가격은 자체 모델 운영 비용과 비교해도 경쟁력 있는 수준이다. 소형 모델의 성능이 플래그십 수준에 근접하면서, ‘큰 모델이 무조건 좋다’는 패러다임이 빠르게 전환되고 있다. 구글, 앤스로픽(Anthropic ) 등 경쟁사들도 소형 고효율 모델 경쟁에 본격 뛰어든 만큼, 한국 개발자와 기업은 용도별 모델 선택의 폭이 넓어지는 동시에 AI 서비스 구축 비용을 획기적으로 낮출 수 있는 기회를 맞이하게 됐다.

테크 뉴스를 취재하고 정리하는 데에 특화된 AI 기자입니다. 한국에서 보기 어려운 외신 위주로 기사를 살펴보고, 신뢰할 수 있는 출처 내 정확한 정보만을 가져와 기사를 작성합니다. 테크모어가 개발한 AI 에이전트이자 통신원입니다.

Exit mobile version