구글 딥마인드(DeepMind)가 제미나이(Gemini) 3.1 플래시 라이트를 개발자 프리뷰로 공개했다. 초당 최대 389토큰의 출력 속도로 132개 AI 모델 중 2위를 차지했으며, 100만 토큰 컨텍스트 윈도우와 4단계 사고 조절 기능을 갖췄다. 다만 전작 대비 가격이 최대 275% 인상돼 ‘성능은 올랐지만 가격도 3배’라는 평가가 나온다.
2026년 3월 3일 구글은 제미나이 3 라인업의 최경량 모델인 ‘제미나이 3.1 플래시 라이트(Gemini 3.1 Flash-Lite)’를 구글 AI 스튜디오와 버텍스 AI(Vertex AI)를 통해 개발자 프리뷰로 출시했다. 이 모델은 제미나이 3 프로(Gemini 3 Pro)에서 파생된 전문가 혼합(MoE, Mixture-of-Experts) 아키텍처를 기반으로 하며, 대량·저지연 기업 워크로드에 최적화됐다. 텍스트·이미지·오디오·비디오·PDF 입력을 지원하고 텍스트를 출력한다.
132개 모델 중 속도 2위, GPT-5 미니보다 5배 빠르다
플래시 라이트의 가장 큰 강점은 속도이다. 아티피셜 애널리시스(Artificial Analysis) 벤치마크 기준 초당 363~389토큰을 처리하며, 132개 평가 모델 중 2위에 올랐다. 오픈AI의 GPT-5 미니(초당 약 71토큰)보다 약 5배, 앤스로픽의 클로드 4.5 하이쿠(Claude 4.5 Haiku, 초당 약 108토큰)보다 약 3.5배 빠르다. 첫 토큰 생성 시간(TTFT)도 전작 제미나이 2.5 플래시 대비 2.5배 단축됐다.
벤치마크 성능도 경쟁력 있다. 대학원 수준 과학 문제(GPQA 다이아몬드)에서 86.9%, 다국어 QA(MMMLU)에서 88.9%, 코드 생성(LiveCodeBench)에서 72.0%를 기록했다. 구글에 따르면 11개 벤치마크 중 6개에서 GPT-5 미니와 클로드 4.5 하이쿠를 앞섰다.
| 항목 | 제미나이 3.1 플래시 라이트 | GPT-5 미니 | 클로드 4.5 하이쿠 |
|---|---|---|---|
| 입력 가격 (100만 토큰) | 0.25달러 (약 363원) | 0.25달러 | 0.25달러 |
| 출력 가격 (100만 토큰) | 1.50달러 (약 2,175원) | 0.60달러 | 1.25달러 |
| 처리 속도 | 363~389토큰/초 | 약 71토큰/초 | 약 108토큰/초 |
| 컨텍스트 윈도우 | 100만 토큰 | 12만 8,000토큰 | 20만 토큰 |
| 사고 단계 조절 | 4단계 | 미지원 | 미지원 |
‘사고 조절 기능’으로 비용·속도·정확도 맞춤 설정
플래시 라이트의 차별화 기능은 4단계 사고 조절(Adjustable Thinking Levels)이다. 미니멀(Minimal), 로우(Low), 미디엄(Medium), 하이(High) 중 선택할 수 있어 작업별로 추론 깊이를 조절한다. 대량 분류 작업에는 미니멀/로우로 비용과 속도를 최적화하고, 복잡한 다단계 추론에는 미디엄/하이로 정확도를 높이는 식이다. 이 기능은 현재 GPT-5 미니나 클로드 4.5 하이쿠에는 없다.
100만 토큰 컨텍스트 윈도우도 경쟁사 대비 5~8배 큰 강점이다. 한국어 법률 문서, 계약서 등 대용량 텍스트 처리에 유리하며, MMMLU 88.9% 점수는 다국어·한국어 성능이 상당 수준임을 시사한다.
성능은 올랐지만 가격도 3배…비용 민감 개발자 주시
그러나 가격 인상은 부담이다. 전작 제미나이 2.5 플래시 라이트 대비 입력 가격은 150%(0.10→0.25달러), 출력 가격은 275%(0.40→1.50달러) 올랐다. 더 디코더(The Decoder)는 “더 똑똑해졌지만 가격도 3배가 됐다”고 평가했다. 특히 출력 가격(100만 토큰당 1.50달러)은 GPT-5 미니(0.60달러)의 2.5배에 달해, 출력이 많은 워크로드에서는 비용 경쟁력이 떨어진다.
한국 개발자는 구글 AI 스튜디오에서 즉시 테스트할 수 있으며, 버텍스 AI를 통한 기업 배포도 가능하다. 입력 100만 토큰당 약 363원이라는 가격은 대량 번역·콘텐츠 검수에 매력적이지만, 출력 비용까지 고려한 총비용 계산이 필수적이다. 구글·오픈AI·앤스로픽의 경량 AI 모델 삼파전이 본격화되면서, 개발자들이 속도·비용·정확도의 균형점을 어디에 두느냐가 모델 선택의 핵심 변수가 되고 있다.
© 2026 TechMore. All rights reserved. 무단 전재 및 재배포 금지.
기사 제보
제보하실 내용이 있으시면 techmore.main@gmail.com으로 연락주세요.


