문샷AI 키미 K2.5, 100개 에이전트가 동시에 일한다..."GPT-5.2 능가" 주장

3줄 요약

1조 개 파라미터 오픈소스 모델, 최대 100개 서브에이전트 병렬 실행
순차 실행 대비 4.5배 빠른 속도, 1,500개 도구 호출 동시 처리
HLE 벤치마크서 GPT-5.2·클로드 4.5 오푸스 능가…”비용은 10분의 1″

중국 AI 스타트업 문샷AI(Moonshot AI)가 최대 100개의 에이전트가 동시에 작업하는 ‘에이전트 스웜(Agent Swarm)’ 기술을 공개했다. 키미(Kimi) K2.5 모델의 핵심 기능으로, 단일 에이전트의 순차 실행 대비 4.5배 빠른 속도를 제공한다. 문샷AI는 이 모델이 일부 벤치마크에서 GPT-5.2와 클로드 4.5 오푸스를 능가한다고 주장했다.

에이전트 스웜은 복잡한 작업을 수행할 때 모델이 스스로 최대 100개의 서브에이전트를 생성하고 조율하는 기술이다. 미리 정의된 에이전트나 워크플로우 없이 자동으로 작동한다. 오케스트레이터(조율자) 에이전트가 작업을 분해하고, CEO처럼 연구원, 분석가, 팩트체커를 즉석에서 ‘고용’한다.

키미 블로그에 따르면 이 시스템은 “구조적 천장(structural ceiling)”을 해결하기 위해 설계됐다. 단일 에이전트의 순차 실행은 장기 작업에서 한계가 있다. 에이전트 스웜은 1,500개 이상의 도구 호출을 동시에 실행하며, 각 서브에이전트는 자체 작업 메모리로 실행되고 결과만 오케스트레이터에게 전송한다.

PARL: 병렬 에이전트 강화학습

이 기술의 핵심은 PARL(병렬 에이전트 강화 학습, Parallel-Agent Reinforcement Learning)이라는 새로운 학습 방식이다. 학습 가능한 오케스트레이터 에이전트가 작업을 병렬화 가능한 하위 작업으로 분해하고, 동적으로 생성된 고정 서브에이전트가 이를 실행한다.

흔한 실패 모드인 ‘직렬 붕괴(serial collapse)’를 방지하기 위해 PARL은 단계적 보상 설계를 사용한다. 학습 초기에는 병렬화를 장려하고, 점진적으로 작업 성공에 초점을 맞추도록 전환한다.

키미 K2.5는 총 1조 개(1 trillion) 파라미터의 혼합전문가(Mixture-of-Experts, MoE ) 아키텍처다. 하지만 요청당 320억 개만 활성화되어 효율적으로 작동한다. 61개 레이어로 구성되며, 첫 번째 레이어가 입력 임베딩을 표준화한 후 60개 레이어에서 MoE 로직이 작동한다.

약 15조 개의 시각·텍스트 혼합 토큰으로 사전학습됐으며, 네이티브 멀티모달 에이전트 모델로 설계됐다. 비전 코딩 작업에 특화되어 대화를 프론트엔드 인터페이스와 인터랙티브 레이아웃으로 변환할 수 있다.

벤치마크: HLE·BrowseComp서 GPT-5.2 능가

문샷AI는 키미 K2.5가 주요 벤치마크에서 경쟁 모델을 능가한다고 주장했다.

인류의 마지막 시험(HLE): 키미 K2.5는 50.2%를 기록해 GPT-5.2(45.5%)와 클로드 4.5 오푸스(43.2%)를 앞섰다.

BrowseComp(웹 내비게이션): 스웜 없이 74.9%, 스웜과 함께 78.4%를 기록해 GPT-5.2(57.8%)를 크게 앞섰다.

OCRBench(시각 문서 이해): 92.3%로 GPT-5.2(80.7%)보다 11.6%포인트 높았다.

다만 순수 코딩(SWE-Bench Verified)에서는 클로드 4.5 오푸스(80.9%)가 키미(76.8%)보다 높았고, 수학(AIME 2025)에서는 GPT-5.2가 100%로 키미(96.1%)를 앞섰다.

비용: 클로드 대비 10~14배 저렴

가격 경쟁력도 주목할 만하다. 문샷AI의 API 가격은 입력 100만 토큰당 0.60달러, 출력 100만 토큰당 3.00달러다. 클로드 4.5 오푸스(입력 5달러, 출력 25달러)와 비교하면 입력은 10~12.5배, 출력은 14.3배 저렴하다.

콘스텔레이션리서치는 “프론티어 모델과 오픈소스 사이의 격차가 빠르게 좁혀지고 있다”며 “이는 대형언어모델의 상품화를 의미하며, 기업들은 독점 vs 오픈소스 배포 전략을 재평가해야 한다”고 분석했다.

키미 K2.5는 K2.5 인스턴트, K2.5 씽킹, K2.5 에이전트, K2.5 에이전트 스웜(베타) 네 가지 모드로 제공된다. Kimi.com, 키미 앱, API, 키미 코드에서 사용할 수 있다.

에이전트 스웜 기능은 현재 최상위 구독자를 위한 초기 연구 프리뷰로 제공되며, 모델 가중치는 허깅페이스 (Hugging Face)에서 수정된 MIT 라이선스로 공개됐다. 다만 1조 파라미터 규모의 대형 모델이므로 로컬 실행에는 엔터프라이즈급 하드웨어가 필요하다.

구분	내용
모델명	키미(Kimi) K2.5
개발사	문샷AI (Moonshot AI, 중국)
출시일	2026년 1월 27일
총 파라미터	1조 개 (1 trillion)
활성 파라미터	320억 개 (요청당)
아키텍처	Mixture-of-Experts (MoE), 61레이어
학습 데이터	15조 개 시각·텍스트 혼합 토큰
에이전트 스웜	최대 100개 서브에이전트 병렬 실행
도구 호출	1,500개 이상 동시 실행
속도 향상	순차 실행 대비 4.5배
HLE 벤치마크	50.2% (GPT-5.2: 45.5%)
BrowseComp	78.4% (GPT-5.2: 57.8%)
API 가격	입력 $0.60/백만 토큰, 출력 $3.00/백만 토큰
라이선스	Modified MIT (허깅페이스 공개)

About

문샷AI 키미 K2.5, 100개 에이전트가 동시에 일한다…”GPT-5.2 능가” 주장

조니 아이브가 설계한 오픈AI 기기, 2027년으로 출시 연기…”상표권 분쟁 때문”

에어팟 프로에 카메라 탑재…비전 프로처럼 ‘손동작 제스처’ 지원하나

아마존, 언론사가 AI 기업에 콘텐츠 판매하는 ‘마켓플레이스’ 출시 검토