메타, '뮤즈 스파크' 공개…라마 버리고 추론 모델로 전환

메타 (Meta)가 4월 8일(현지 시간) 새 AI 모델 ‘뮤즈 스파크(Muse Spark)’를 공개했다. 전 스케일 AI(Scale AI ) CEO 알렉산드르 왕(Alexandr Wang)이 이끄는 ‘메타 슈퍼인텔리전스 랩스(Meta Superintelligence Labs )’의 첫 결과물로, 부진했던 라마 4(Llama 4)를 대체하는 ‘밑바닥부터 다시 쌓은’ 모델이다. GPQA 다이아몬드 89.5%, 헬스벤치 하드 42.8% 등 주요 벤치마크에서 오픈AI ·앤트로픽 ·구글과 정면 경쟁하는 수치를 내놨다. 라마와 달리 기본은 프로프라이어터리(proprietary)로 공개된다.

메타(Meta)가 4월 8일(현지 시간) 자사의 새로운 AI 모델 ‘뮤즈 스파크(Muse Spark)’를 공식 공개했다. 이 모델은 지난해 메타가 스케일 AI(Scale AI)에 143억 달러(약 20조 7,000억 원)를 투자하며 지분 49%를 확보하는 조건으로 영입한 알렉산드르 왕(Alexandr Wang) 최고AI책임자(CAO)가 이끄는 ‘메타 슈퍼인텔리전스 랩스(Meta Superintelligence Labs)’의 첫 결과물이다. 내부 코드네임은 ‘아보카도(Avocado)’였으며, 공식 명칭으로 사용된 ‘뮤즈(Muse)’는 메타가 새롭게 정립한 차세대 AI 모델 시리즈의 공식 브랜드다.

메타가 이번 모델을 ‘밑바닥부터의 전면 재설계(ground-up overhaul)’로 규정한 이유는 분명하다. 라마 4 패밀리가 기대 이하의 성능으로 글로벌 오픈 모델 경쟁에서 뒤처졌기 때문이다. 왕 CAO가 메타에 합류한 이후 9개월 동안, 슈퍼인텔리전스 랩스는 모델 학습·데이터·평가·안전 레이어를 통째로 다시 쌓았다. 그 결과 같은 수준의 성능을 내면서도 이전 모델인 라마 4 매버릭(Maverick) 대비 “1자릿수 이상 적은 컴퓨트”로 학습에 성공했다고 메타는 밝혔다. 효율성 측면에서 상당한 도약인 셈이다.

성능 수치도 경쟁적이다. 박사급 추론 능력을 평가하는 GPQA 다이아몬드(GPQA Diamond)에서 뮤즈 스파크는 89.5%를 기록했다. 같은 벤치마크에서 구글 제미나이 3.1 프로가 94.3%, 앤트로픽 클로드 오푸스 4.6이 92.7%, 오픈AI GPT-5.4가 92.8%를 기록한 것과 비교하면 상위권이지만 선두는 아니다. 반면 의료 분야의 까다로운 실사용 문제를 다루는 헬스벤치 하드(HealthBench Hard)에서는 42.8%로 세 경쟁 모델을 모두 앞섰다. 특정 도메인에서는 프런티어급 선두 자리를 잡았다는 의미다.

항목	내용
모델명	Muse Spark (코드네임 Avocado)
개발 조직	Meta Superintelligence Labs
리더	알렉산드르 왕 (CAO, 전 Scale AI CEO)
모델 특성	추론(Reasoning) 모델, 멀티모달(텍스트·이미지)
핵심 설계	‘작고 빠름’, 병렬 서브에이전트 기반 ‘컨템플레이션(Contemplation) 모드 ’
학습 효율	라마 4 매버릭 대비 ‘1자릿수 이상 적은 컴퓨트’
GPQA Diamond	89.5%
HealthBench Hard	42.8% (1위)
라이선스	프로프라이어터리 (향후 오픈소스 버전 예고)

모델 설계 철학도 주목할 만하다. 메타는 뮤즈 스파크를 ‘작고 빠르도록 설계된(small and fast by design)’ 추론 모델이라고 설명했다. 대형 단일 모델을 밀어붙이는 대신, ‘컨템플레이션 모드(Contemplation Mode)’를 통해 여러 서브 에이전트가 병렬로 사유(reasoning)하며 답을 만들어내는 구조다. 이는 오픈AI의 o시리즈, 앤트로픽의 확장 사고(Extended Thinking) 기능과 방향성이 비슷하지만, 메타는 더 작은 모델로 같은 수준에 도달하는 것을 목표로 삼았다. 동시에 멀티모달을 기본 지원해 텍스트와 이미지 입력을 동시에 처리할 수 있다.

그러나 가장 큰 변화는 라이선스다. 메타는 그동안 라마를 통해 ‘오픈모델 진영의 수장’ 이미지를 구축해 왔지만, 뮤즈 스파크는 프로프라이어터리(proprietary) 모델로 공개된다. 1차 사용처는 메타 자체 생태계에 한정된다. 메타 AI 앱, 왓츠앱(WhatsApp), 인스타그램(Instagram), 페이스북(Facebook), 메신저(Messenger), 그리고 레이밴 메타 (Ray-Ban Meta) 스마트 안경까지 포함된다. 일부 파트너에게는 프라이빗 API 프리뷰가 제공된다. 회사는 “향후 버전은 오픈소스로 공개할 수 있기를 희망한다”고 단서를 붙였지만, 현 시점에서는 오픈 진영과의 거리가 분명해졌다.

한국 산업·AI 생태계에 미치는 영향은 세 가지로 정리된다. 첫째, 오픈모델 진영의 지형이 흔들린다. 그동안 라마는 국내 대기업과 연구 기관이 파인튜닝·상용화에 가장 널리 활용해 온 기반 모델이었다. 뮤즈 스파크가 클로즈드로 가면서, 미스트랄(Mistral)·큐원(Qwen )·딥시크 (DeepSeek), 그리고 아씨(Arcee)의 트리니티 같은 대체 오픈 모델의 전략적 가치가 더 커졌다. 둘째, 메타가 ‘작은 모델로 프런티어 성능’을 내는 데 성공했다면, 국내 기업의 자체 모델 전략도 ‘거대화 경쟁’에서 ‘효율화 경쟁’으로 축을 옮길 필요가 있다. 셋째, 레이밴 메타 안경이 본격적인 AI 엔드포인트로 자리 잡는 흐름은, 국내 삼성전자·LG전자의 XR·AI 디바이스 전략에 상당한 압박 요인이다. 차세대 소비자 AI 인터페이스가 스마트폰이 아닌 안경·이어폰으로 이동할 수 있다는 신호가 점점 선명해지고 있다.

About

메타, ‘뮤즈 스파크’ 공개…라마 버리고 추론 모델로 전환

중국, 휴머노이드 로봇에 ‘주민등록번호’ 부여 시작

엑스리얼, 구글과 손잡고 스마트안경 시대 연다

스타십 V3 첫 비행, 성공과 실패가 교차한 124미터의 도전