Solar는 국내 AI 기업 업스테이지(Upstage)가 개발·공개한 언어 모델(LLM) 시리즈이다. 명칭은 “Specialized and Optimized LLM and Applications with Reliability”의 약자(SOLAR)로 알려져 있으며, 비교적 효율적인 규모의 모델부터 대규모 공개 가중치 모델까지 라인업을 확장해 왔다. Solar 계열은 한국어를 포함한 다국어 처리와 실사용(추론, 지시 이행, 도구 활용) 성능을 강조하는 흐름 속에서 공개 모델·API·기술 보고서 형태로 생태계를 구축해 왔다.
1. 개요와 개발 배경
업스테이지는 Solar를 “특정 업무에 특화(Specialized)되고, 비용·인프라 관점에서 최적화(Optimized)된 LLM과 그 응용(Application)을 신뢰성(Reliability) 있게 제공”한다는 방향으로 소개해 왔다. Solar 계열은 오픈 모델 공개(허깅페이스 등), 기술 문서(논문·테크니컬 리포트), 그리고 Upstage Console을 통한 API 제공을 통해 접근성을 높이는 전략을 취해 왔다. 또한 2023년 이후 오픈 LLM 성능 경쟁(리더보드 평가)이 대중화되면서, Solar는 비교적 작은 규모의 모델이 큰 모델과 경쟁할 수 있다는 “효율 중심”의 메시지를 함께 내세웠다.
Solar는 단일 제품명이 아니라 일련의 모델·배포 형태를 포괄하는 브랜드로 사용된다. 초기 공개 모델로는 10.7B급(SOLAR-10.7B)이 널리 알려졌고, 이후 단일 GPU 최적화를 강조한 Solar Pro Preview(22B) 및 추론 기능을 전면에 둔 Solar Pro 2(31B) 등이 소개되었다. 2025년 말~2026년 초에는 100B급 공개 가중치 모델인 Solar Open 100B(총 102B, MoE)가 공개되며 라인업이 확장되었다.
2. 핵심 특징
2.1 효율 중심의 스케일링과 단일 GPU 지향
Solar 계열은 “크기 자체의 확장”보다는 제한된 자원에서의 성능 극대화를 주요 가치로 제시해 왔다. 예를 들어 SOLAR 10.7B는 Depth Up-Scaling(DUS)라는 스케일링 방법을 제안하는 논문과 함께 공개되었고, Solar Pro Preview는 22B 규모임에도 단일 GPU 배포를 목표로 최적화되었다고 소개되었다. 이러한 방향성은 기업 환경에서 GPU 비용과 운영 복잡도를 줄이면서도 실용적인 성능을 얻고자 하는 요구와 맞물린다.
2.2 지시 이행·추론·도구 활용을 포함한 “실사용” 성능 강조
Solar Pro 2 계열 소개에서는 단순 대화형 응답을 넘어, 복잡한 질문에 대한 추론(reasoning)과 도구 활용(tool use) 능력을 전면에 배치한다. 이는 LLM이 문장 생성 모델을 넘어 “업무 자동화·에이전트형 활용”으로 확장되는 흐름과 연결된다. Solar Open(100B) 모델 카드에서도 에이전트 기능(도구 호출, 추론 파서 등)을 염두에 둔 구성과 예시가 포함되어, 모델 자체의 성능뿐 아니라 실제 서비스 통합을 고려한 배포 경험을 강조한다.
2.3 한국어를 포함한 다국어 및 도메인 성능 지향
Solar Open 100B 테크니컬 리포트는 한국어처럼 상대적으로 데이터가 부족한 언어(underserved languages)에서 경쟁력 있는 모델을 만들기 위한 데이터 구성·학습 방법론을 주요 주제로 다룬다. 모델 카드에는 한국어 벤치마크와 영어 벤치마크 결과가 함께 제시되며, 한국어 성능을 중요한 차별점으로 내세운다. Solar Pro 2 또한 한국어 성능을 반복적으로 강조하는 공개 자료가 존재한다.
2.4 공개 모델·API·문서 중심의 생태계 구축
Solar는 오픈 모델 공개와 함께 API 베타 제공, 콘솔 문서화, 기술 보고서 공개를 병행해 왔다. 이는 개발자들이 “즉시 사용 가능한 API”와 “재현 가능한 기술 문서”를 동시에 요구하는 흐름에 대응한 형태로 볼 수 있다. 특히 Solar Open 100B는 허깅페이스 모델 카드에 라이선스(가중치와 코드의 적용 범위 분리), 하드웨어 요구사항, 추론 실행 예시, 관련 리포트 링크가 포함되어 있어 공개 모델로서의 사용성(문서 품질)을 강조한다.
3. 모델 라인업
3.1 Solar Mini(대중적으로 SOLAR 10.7B 계열로 인식)
Solar Mini라는 명칭은 Solar 라인업에서 경량·효율 계열을 지칭하는 맥락에서 사용되며, 공개적으로 널리 알려진 대표 모델은 SOLAR-10.7B 및 SOLAR-10.7B-Instruct 계열이다. 해당 모델은 10.7B 파라미터 규모로 소개되었고, DUS(Depth Up-Scaling) 방법과 함께 공개되었다. Instruct 변형은 지시 이행(instruction-following)에 최적화된 버전으로 제공되어, 일반적인 챗봇형 사용과 태스크 지향 프롬프트에 활용되는 경우가 많다.
3.2 Solar Pro(Preview) 및 Solar Pro 2
Solar Pro Preview는 Solar 시리즈의 플래그십(당시 기준)으로 소개되었으며, 22B 파라미터 규모와 “단일 GPU 배포”를 목표로 한 최적화가 특징으로 제시되었다. 업스테이지는 이를 뒷받침하는 요소로 DUS 및 데이터 레시피를 언급하며, 비교적 작은 규모에서 강한 성능을 달성하는 접근을 강조했다.
Solar Pro 2는 이후 공개된 “프론티어급” 모델로 소개되며, 31B 규모에서 추론 기능과 다국어 성능, 도구 활용 능력을 강화한 방향으로 설명된다. 업스테이지 블로그 자료에서는 한국어 벤치마크에서 강점을 보였다는 주장과 함께, Upstage Console을 통한 체험 및 API 연동 가이드가 제공된다.
3.3 Solar Open 100B(총 102B, MoE)
Solar Open 100B는 업스테이지가 공개한 대규모 공개 가중치(open-weight) 모델로, 모델 카드 기준 총 102.6B 파라미터의 Mixture-of-Experts(MoE) 아키텍처를 사용하며 토큰당 활성 파라미터는 12B로 제시된다. 또한 128k 컨텍스트 길이, 19.7T 토큰 규모의 사전학습, 학습 하드웨어(NVIDIA B200) 등의 정보가 모델 카드에 포함되어 있다. 라이선스는 모델 가중치와 코드에 서로 다른 조건이 적용되는 형태로 안내되며(가중치: Upstage Solar License, 코드: Apache 2.0), 기술 보고서(arXiv)와 프로젝트 페이지 링크가 함께 제공된다.
4. Solar Open 100B 도용 의혹 및 공개 검증
2026년 1월 초, Solar Open 100B를 두고 “중국계 모델(GLM 계열)과의 유사성”을 근거로 한 도용(표절) 의혹이 제기되며 논란이 확산되었다. 보도에 따르면 의혹 제기는 주로 특정 신경망 구성 요소(예: LayerNorm 가중치)의 유사도 분석 결과를 근거로 제시되었고, 업스테이지는 Solar Open 100B가 ‘from scratch’로 학습되었다는 입장을 부인하지 않고 정면으로 반박했다.
업스테이지는 논란 대응 과정에서 공개 검증(현장·온라인 형태)을 진행하고 학습 로그·내부 데이터 등을 제시했다는 보도가 이어졌다. 이후 의혹을 제기한 측에서 “표절로 단정한 것이 성급했다”는 취지의 공개 사과가 나왔다는 영문권 보도도 존재한다. 다만 이러한 일련의 과정은 “대규모 모델의 독자 개발 여부를 외부에서 어떻게 검증할 것인가”라는 산업적 쟁점을 함께 드러냈다. 즉, 모델 가중치 유사성 분석이 어느 수준에서 결정적 근거가 되는지, 표준화된 아키텍처 요소가 많은 현대 LLM에서 단일 지표의 해석이 얼마나 신중해야 하는지, 그리고 정부·산업 프로젝트에서 ‘from scratch’ 요건을 어떤 증빙으로 확인할지 등의 논의로 연결되었다.
논란 이후의 보도에서는 이번 사건이 오히려 “투명한 검증 문화”의 필요성을 부각했고, 업계·정부 인사들이 공개 검증의 의미를 언급했다는 내용도 확인된다. 결과적으로 Solar Open 100B 관련 논란은 특정 모델의 진위 공방을 넘어, 공개 모델 생태계에서 신뢰를 형성하는 절차와 기준을 재정의하는 사례로 자주 인용되고 있다.
5. 관련 문서 및 참고 자료
- 모델 카드(허깅페이스): SOLAR-10.7B-Instruct, Solar Pro Preview Instruct, Solar Open 100B 등 공개 저장소에서 상세 사용법·라이선스·성능 정보를 제공한다.
- 기술 문서(논문/리포트): SOLAR 10.7B(DUS 제안) 및 Solar Open Technical Report는 학습 방법론과 설계 철학을 비교적 체계적으로 설명한다.
- API 및 제품 문서: Upstage Console을 통해 Solar 계열 모델 API를 제공하며, 블로그/문서에서 호출 방법과 활용 예시를 안내한다.
- 언론 보도 및 사건 기록: Solar Open 100B 관련 의혹 제기와 검증·사과 과정은 2026년 1월 초 다수 매체에서 보도되었다.
출처
- Upstage News: Solar 10.7B 소개(약자 SOLAR 설명 포함)
- arXiv: SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling
- Hugging Face: upstage/SOLAR-10.7B-Instruct-v1.0
- Upstage News: Solar API Beta(2024-02-22)
- Upstage News: Solar Pro Preview(2024-09-11)
- Hugging Face: upstage/solar-pro-preview-instruct
- Upstage Blog(ko): Solar Pro 2 Launch(2025-07-10)
- Upstage Blog(en): Solar Pro 2 Launch(2025-07-10)
- Hugging Face: upstage/Solar-Open-100B(모델 카드 및 사양/라이선스 안내)
- arXiv: Solar Open Technical Report(2026)
- ZDNet Korea: 업스테이지, 학습 로그·데이터 공개로 도용 의혹 반박(2026-01-02)
- Asiae(영문): Solar Open 100B 표절 논란 경과 보도(2026-01-04)
- Chosun Biz(영문): Solar Open 100B 공개 검증 관련 보도(2026-01-04)
- The Chosun(영문): 의혹 제기 측 공개 사과 관련 보도(2026-01-04)
- IT동아: Solar Open 100B 의혹 제기 및 분석 언급(2026-01-05)
© 2026 TechMore. All rights reserved. 무단 전재 및 재배포 금지.
기사 제보
제보하실 내용이 있으시면 techmore.main@gmail.com으로 연락주세요.


