구글, 제미나이 3.1 플래시 라이트 공개… 초당 389토큰 '최속' AI

구글 딥마인드(DeepMind)가 제미나이(Gemini) 3.1 플래시 라이트를 개발자 프리뷰로 공개했다. 초당 최대 389토큰의 출력 속도로 132개 AI 모델 중 2위를 차지했으며, 100만 토큰 컨텍스트 윈도우와 4단계 사고 조절 기능을 갖췄다. 다만 전작 대비 가격이 최대 275% 인상돼 ‘성능은 올랐지만 가격도 3배’라는 평가가 나온다.

2026년 3월 3일 구글은 제미나이 3 라인업의 최경량 모델인 ‘제미나이 3.1 플래시 라이트(Gemini 3.1 Flash-Lite)’를 구글 AI 스튜디오와 버텍스 AI(Vertex AI)를 통해 개발자 프리뷰로 출시했다. 이 모델은 제미나이 3 프로(Gemini 3 Pro)에서 파생된 전문가 혼합(MoE, Mixture-of-Experts) 아키텍처를 기반으로 하며, 대량·저지연 기업 워크로드에 최적화됐다. 텍스트·이미지·오디오·비디오·PDF 입력을 지원하고 텍스트를 출력한다.

132개 모델 중 속도 2위, GPT-5 미니보다 5배 빠르다

플래시 라이트의 가장 큰 강점은 속도이다. 아티피셜 애널리시스(Artificial Analysis) 벤치마크 기준 초당 363~389토큰을 처리하며, 132개 평가 모델 중 2위에 올랐다. 오픈AI의 GPT-5 미니(초당 약 71토큰)보다 약 5배, 앤스로픽의 클로드 4.5 하이쿠(Claude 4.5 Haiku, 초당 약 108토큰)보다 약 3.5배 빠르다. 첫 토큰 생성 시간(TTFT)도 전작 제미나이 2.5 플래시 대비 2.5배 단축됐다.

벤치마크 성능도 경쟁력 있다. 대학원 수준 과학 문제(GPQA 다이아몬드)에서 86.9%, 다국어 QA(MMMLU)에서 88.9%, 코드 생성(LiveCodeBench)에서 72.0%를 기록했다. 구글에 따르면 11개 벤치마크 중 6개에서 GPT-5 미니와 클로드 4.5 하이쿠를 앞섰다.

항목	제미나이 3.1 플래시 라이트	GPT-5 미니	클로드 4.5 하이쿠
입력 가격 (100만 토큰)	0.25달러 (약 363원)	0.25달러	0.25달러
출력 가격 (100만 토큰)	1.50달러 (약 2,175원)	0.60달러	1.25달러
처리 속도	363~389토큰/초	약 71토큰/초	약 108토큰/초
컨텍스트 윈도우	100만 토큰	12만 8,000토큰	20만 토큰
사고 단계 조절	4단계	미지원	미지원

‘사고 조절 기능’으로 비용·속도·정확도 맞춤 설정

플래시 라이트의 차별화 기능은 4단계 사고 조절(Adjustable Thinking Levels)이다. 미니멀(Minimal), 로우(Low), 미디엄(Medium), 하이(High) 중 선택할 수 있어 작업별로 추론 깊이를 조절한다. 대량 분류 작업에는 미니멀/로우로 비용과 속도를 최적화하고, 복잡한 다단계 추론에는 미디엄/하이로 정확도를 높이는 식이다. 이 기능은 현재 GPT-5 미니나 클로드 4.5 하이쿠에는 없다.

100만 토큰 컨텍스트 윈도우도 경쟁사 대비 5~8배 큰 강점이다. 한국어 법률 문서, 계약서 등 대용량 텍스트 처리에 유리하며, MMMLU 88.9% 점수는 다국어·한국어 성능이 상당 수준임을 시사한다.

성능은 올랐지만 가격도 3배…비용 민감 개발자 주시

그러나 가격 인상은 부담이다. 전작 제미나이 2.5 플래시 라이트 대비 입력 가격은 150%(0.10→0.25달러), 출력 가격은 275%(0.40→1.50달러) 올랐다. 더 디코더(The Decoder)는 “더 똑똑해졌지만 가격도 3배가 됐다”고 평가했다. 특히 출력 가격(100만 토큰당 1.50달러)은 GPT-5 미니(0.60달러)의 2.5배에 달해, 출력이 많은 워크로드에서는 비용 경쟁력이 떨어진다.

한국 개발자는 구글 AI 스튜디오에서 즉시 테스트할 수 있으며, 버텍스 AI를 통한 기업 배포도 가능하다. 입력 100만 토큰당 약 363원이라는 가격은 대량 번역·콘텐츠 검수에 매력적이지만, 출력 비용까지 고려한 총비용 계산이 필수적이다. 구글·오픈AI·앤스로픽의 경량 AI 모델 삼파전이 본격화되면서, 개발자들이 속도·비용·정확도의 균형점을 어디에 두느냐가 모델 선택의 핵심 변수가 되고 있다.

기사 제보

제보하실 내용이 있으시면 techmore.main@gmail.com으로 연락주세요.

About

구글, 제미나이 3.1 플래시 라이트 공개… 초당 389토큰 ‘최속’ AI

이란 공습에 AI 투입, 테크업계가 뒤집어졌다

현대 아이오닉5, 미국 2월 판매 33% 급증… 보조금 없이 역대 최고

2월 VC 투자 1,890억 달러, 오픈AI·앤스로픽·웨이모 3사가 83% 독식

엔비디아, 포토닉스에 40억 달러 투자…’기가와트급 AI 팩토리’ 시대 연다

챗GPT 사용자 대탈출… 클로드, 앱스토어 1위 등극하고 메모리 가져오기까지

부부 창업자의 14.ai, AI로 고객지원팀 통째로 대체한다

앤스로픽, 펜타곤 AI 무제한 사용 거부로 블랙리스트에

현대 아이오닉5, 미국 2월 판매 33% 급증… 보조금 없이 역대 최고

앤스로픽 클로드, 펜타곤 블랙리스트 이틀 만에 앱스토어 1위

오픈AI, 펜타곤 계약 세부사항 공개… 앤스로픽 퇴출 직후 ‘합법적 목적’ 사용 허용 논란

삼성 갤럭시S26, AI 딥페이크에 C2PA 인증으로 맞선다