오픈라우터에 정체불명으로 등장해 딥시크 V4 추측을 낳았던 1조 파라미터 AI 모델 ‘헌터 알파(Hunter Alpha)’의 정체가 샤오미의 MiMo-V2-Pro로 확인됐다. 100만 토큰 컨텍스트와 무료 접근이라는 파격 조건으로 개발자 커뮤니티를 뒤흔든 이 모델은, 중국 AI 생태계의 경쟁 구도를 새롭게 보여주는 사례다. 샤오미는 올해 R&D에 56억 달러를 투입하며 AI 분야 존재감을 본격적으로 키우고 있다.
정체불명 모델, 1주일 만에 베일을 벗다
2026년 3월 11일, AI 모델 게이트웨이 오픈라우터(OpenRouter)에 개발자 귀속 정보 없이 ‘헌터 알파’라는 이름의 모델이 등장했다. 1조(1 trillion) 개의 파라미터, 100만 토큰 컨텍스트 윈도우, 그리고 무료 접근이라는 파격적인 사양이 즉각 개발자 커뮤니티의 관심을 끌었다. 출처가 불분명한 만큼 추측이 쏟아졌고, 가장 유력한 가설은 딥시크(DeepSeek) V4의 비밀 테스트라는 것이었다. 실제로 이 모델은 스스로를 “중국어로 주로 훈련된 중국 AI 모델”이라 칭해 의혹을 더했다. 그러나 3월 18일, 샤오미(Xiaomi) MiMo 팀이 공식 발표를 통해 헌터 알파가 자사 MiMo-V2-Pro의 초기 테스트 빌드였음을 밝혔다. 이는 2월에 스텔스 모델 ‘Pony Alpha’가 즈푸AI(Zhipu AI)의 GLM-5로 확인된 것에 이어 두 번째 ‘미스터리 모델’ 사례다.
1조 파라미터, 실제 추론은 420억 개로 작동
MiMo-V2-Pro의 기술 사양은 주목할 만하다. 총 파라미터 수는 1조 개 이상이지만, 실제 추론 시 활성화되는 파라미터는 420억 개에 불과하다. 이는 MoE(Mixture of Experts) 아키텍처를 활용해 연산 효율을 극대화한 결과다. 컨텍스트 윈도우는 100만 토큰으로 업계 최대 수준이며, 최대 출력은 32,000 토큰을 지원한다. 7:1 비율의 하이브리드 어텐션 메커니즘을 채택해 긴 문맥 처리와 정밀한 추론을 동시에 달성했다. AI 에이전트 시스템 엔지니어 나빌 하우암(Nabil Alouani)은 “눈에 띈 조합은 헌터 알파의 100만 토큰 컨텍스트와 추론 능력, 무료 접근의 결합이었다”고 평가했다. 대니얼 듀허스트(Daniel Dewhurst) AI 엔지니어 역시 “단계별 문제 해결과 ‘작업 과정 보여주기’ 패턴이 딥시크와 관련된 훈련 전략과 유사하다”고 분석해, 초기에 딥시크 V4 추측이 나온 배경을 설명했다.
벤치마크 성능: 톱티어에 근접한 저가 모델
MiMo-V2-Pro는 주요 벤치마크에서 톱티어 모델에 근접한 성능을 보여준다. 코딩 능력을 측정하는 SWE-bench Verified에서 78.0%를 기록했는데, 이는 클로드 오퍼스(Claude Opus) 4.6의 80.8%, GPT-5.2의 80.0%에 근소하게 뒤지는 수치다. ClawEval에서는 61.5%로 클로드 오퍼스/소네(Sonnet) 4.6의 66.3% 대비 약 5%포인트 차이를 보였고, PinchBench에서는 84.0%로 클로드 소네 4.6(86.9%)과 3%포인트 이내의 격차를 유지했다. 특히 인공지능 분석 기관 아티피셜 애널리시스(Artificial Analysis)의 인텔리전스 인덱스에서 100만 토큰당 0.15달러(약 218원) 이하 모델 중 최고점인 49점을 획득해, 가성비 측면에서 압도적 우위를 확인했다.
| 항목 | MiMo-V2-Pro | 클로드 오퍼스 4.6 | GPT-5.2 |
|---|---|---|---|
| SWE-bench Verified | 78.0% | 80.8% | 80.0% |
| ClawEval | 61.5% | 66.3% | – |
| PinchBench | 84.0% | 86.9%(소네) | – |
| 입력 가격(100만 토큰) | 1달러 | 3달러 | – |
| 출력 가격(100만 토큰) | 3달러 | 15달러 | – |
가격 파괴: 클로드 소네 대비 출력 비용 5분의 1
성능만큼 주목받는 것이 가격 정책이다. MiMo-V2-Pro의 API 가격은 입력 기준 100만 토큰당 1달러(약 1,450원), 출력 기준 100만 토큰당 3달러(약 4,350원)로 책정됐다(256K 토큰 이하 기준). 이는 클로드 소네 4.6과 비교하면 입력 비용은 67% 저렴하고, 출력 비용은 5분의 1 수준이다. 오픈라우터는 정체 공개와 함께 1주일간 무료 API 접근을 개시했으며, 5개 에이전트 프레임워크와의 파트너십도 동시에 발표했다. 이러한 공격적 가격 전략은 중국 AI 기업들이 서구 경쟁사 대비 비용 경쟁력을 무기로 글로벌 시장을 공략하는 패턴이 가속화되고 있음을 보여준다.
샤오미 AI 야심과 딥시크 V4의 그림자
MiMo 팀을 이끄는 뤄풀리(Luo Fuli) 팀장은 전 딥시크 연구원 출신으로, 샤오미가 중국 AI 인재 생태계에서 적극적으로 핵심 연구 인력을 영입하고 있음을 보여준다. 샤오미는 2026년 R&D 투자 목표를 56억 달러(약 8조 1,200억 원)로 설정했는데, 이는 전년 대비 25% 증가한 규모다. 스마트폰과 전기차에 이어 AI 모델 개발까지 사업 영역을 확장하는 샤오미의 전략이 본격화되고 있다. 한편, 이번 사건으로 관심이 높아진 딥시크 V4는 2026년 4월 출시가 예상된다. 내부 유출 정보에 따르면 SWE-bench Verified에서 83.7%를 달성한 것으로 추정되며, 텍스트·이미지·비디오를 아우르는 네이티브 멀티모달 모델이다. 딥시크는 화웨이(Huawei), 캠브리콘(Cambricon)과 협력해 중국산 AI 칩에 최적화 작업을 진행 중이다.
한국 시장에 던지는 메시지
헌터 알파 사건은 중국 AI 생태계의 역량이 단순한 추격을 넘어 글로벌 톱티어와 직접 경쟁하는 단계에 진입했음을 상징한다. 특히 ‘스텔스 론칭’ 전략이 반복되고 있다는 점은 주목할 만하다. 개발사 이름 없이 순수 성능으로 시장 반응을 테스트한 뒤 정체를 공개하는 방식은, 브랜드 편견을 제거하고 기술력만으로 평가받겠다는 자신감의 표현이다. 한국 기업과 개발자 입장에서는 톱티어 성능의 AI 모델을 기존 대비 5분의 1 비용으로 활용할 수 있는 선택지가 늘어난다는 점에서 긍정적이다. 다만 중국산 모델의 데이터 주권 이슈와 서비스 안정성은 여전히 검증이 필요하다. 4월로 예상되는 딥시크 V4 출시까지, 중국발 AI 경쟁의 다음 장이 곧 열린다.
© 2026 TechMore. All rights reserved. 무단 전재 및 재배포 금지.
기사 제보
제보하실 내용이 있으시면 techmore.main@gmail.com으로 연락주세요.


