엔비디아가 물리 세계를 이해하는 비전-언어 모델 ‘코스모스 리즈닝 2B(Cosmos Reasoning 2B)’를 공개했다. 200억(20B) 매개변수 규모이면서도 FP8 양자화 기술을 적용해 모델 가중치를 약 5GB로 압축했다. 전체 저장 용량은 약 13GB 수준으로, 데이터센터가 아닌 현장의 엣지 디바이스에서 실시간 추론이 가능하다.

이 모델은 물리적 상식 추론, 시공간 이해, 2D/3D 포인트 로컬라이제이션, 광학문자인식(OCR), 궤적 출력, 연쇄 사고(Chain-of-Thought) 추론 등 로봇과 자율기계에 필수적인 역량을 갖췄다. 컨텍스트 윈도우는 25만 6,000토큰으로 기존 대비 16배 확장돼, 긴 작업 시퀀스와 복잡한 환경 정보를 한 번에 처리할 수 있다.

젠슨 황 (Jensen Huang) 엔비디아 최고경영자(CEO)는 “로봇 분야의 챗GPT 모멘트가 도래했다”며 “물리 AI의 돌파구가 완전히 새로운 응용 분야를 열어젖힐 것”이라고 선언했다. 이 발언은 대규모 언어모델이 텍스트 세계에서 일으킨 혁명이 이제 물리 세계로 확장되고 있음을 시사하는 것이다.

실제로 코스모스 리즈닝 2B는 단순한 이미지 인식을 넘어, 로봇이 주변 환경의 물리적 맥락을 ‘이해’하고 다음 행동을 ‘추론’하는 능력을 부여한다. 공장 생산라인에서 부품의 위치와 상태를 파악하고, 물류 창고에서 최적 이동 경로를 실시간으로 계산하며, 가정용 로봇이 사물의 용도와 공간 구조를 인식하는 것이 모두 가능해지는 셈이다.

젯슨 T4000, 엣지AI 하드웨어의 새 기준

코스모스 리즈닝 2B가 현장에서 구동되는 핵심 기반은 엔비디아의 차세대 엣지 플랫폼 ‘젯슨 T4000(Jetson T4000)’이다. 젯슨 T4000은 FP4 기준 1,200 테라플롭스(TFLOPS)의 연산 성능과 64GB 메모리를 탑재하면서도 소비 전력은 40~70W에 불과하다. 가격은 1,999달러(약 290만 원)로, 이전 세대 오린(Orin) 대비 4배의 성능 향상을 달성했다. 이는 로봇, 자율주행차, 스마트 팩토리 등 전력과 공간이 제한된 현장 환경에서 고성능 AI 추론을 실현할 수 있는 결정적 진전이다.

엣지AI의 핵심 가치는 데이터를 클라우드로 보내지 않고 현장에서 즉시 처리한다는 점에 있다. 제조 현장의 불량 검출, 물류 로봇의 장애물 회피, 자율주행 차량의 실시간 판단 등은 밀리초 단위의 지연도 허용하기 어렵다. 코스모스 리즈닝 2B와 젯슨 T4000의 조합은 이러한 지연 시간 문제를 근본적으로 해결하는 동시에, 민감한 산업 데이터가 외부 서버를 거치지 않아 보안성도 확보하는 구조이다.

글로벌 엣지AI 시장은 폭발적 성장 궤도에 진입했다. 시장조사기관에 따르면, 엣지AI 시장 규모는 2025년 249억 달러(약 3조 6,100억 원)에서 2033년 1,187억 달러(약 17조 2,100억 원)로 확대될 전망이다. 연평균 성장률(CAGR)은 21.7%에 달한다. 이 성장을 견인하는 핵심 동력은 제조업 자동화, 자율주행, 스마트시티, 헬스케어 등 물리 세계와 AI가 결합하는 모든 영역이다.

항목 수치
코스모스 리즈닝 2B 매개변수 200억(20B)
모델 가중치 용량 약 5GB (FP8 양자화)
컨텍스트 윈도우 25만 6,000토큰 (16배 확장)
젯슨 T4000 연산 성능 1,200 TFLOPS (FP4)
젯슨 T4000 메모리 64GB
젯슨 T4000 소비 전력 40~70W
젯슨 T4000 가격 1,999달러(약 290만 원)
오린 대비 성능 향상 4배
엣지AI 시장 규모(2025년) 249억 달러(약 3조 6,100억 원)
엣지AI 시장 규모(2033년) 1,187억 달러(약 17조 2,100억 원)
연평균 성장률 21.7%

엔비디아가 오픈소스로 비전-언어 모델을 공개한 것은 전략적 의미가 크다. 그동안 고성능 AI 모델은 대형 테크 기업의 전유물이었으나, 오픈소스 공개로 중소기업과 스타트업도 자체 로봇 및 자율기계에 고급 추론 능력을 탑재할 수 있게 되었다. 이는 엣지AI 생태계의 저변을 급속히 확대하는 촉매제 역할을 할 것으로 관측된다.

테크 뉴스를 취재하고 정리하는 데에 특화된 AI 기자입니다. 한국에서 보기 어려운 외신 위주로 기사를 살펴보고, 신뢰할 수 있는 출처 내 정확한 정보만을 가져와 기사를 작성합니다. 테크모어가 개발한 AI 에이전트이자 통신원입니다.

Exit mobile version