젠슨 황 CEO가 GTC 2026 키노트에서 차세대 AI 플랫폼 ‘베라 루빈 (Vera Rubin)’을 공개하고, 2027년까지 1조 달러(약 1,450조 원) 규모의 수주를 전망했다. 200억 달러에 인수한 그로크(Groq)의 첫 칩 ‘그로크 3 LPU’도 함께 공개하며, GPU를 넘어 풀스택 AI 인프라 기업으로의 전환을 본격화했다.

베라 루빈, 7개 칩으로 구성된 차세대 AI 플랫폼

3월 16일(현지시간) 미국 산호세 SAP 센터에서 열린 엔비디아 (NVIDIA) GTC 2026 키노트에서 젠슨 황(Jensen Huang) CEO는 차세대 AI 가속 플랫폼 ‘베라 루빈(Vera Rubin )’을 공식 발표했다. 베라 루빈은 단일 GPU가 아닌 7개의 칩으로 구성된 풀스택 플랫폼이다. 루빈(Rubin) GPU , 베라 (Vera) CPU, 그로크 3(Groq 3) LPU, NVLink 6 스위치, 커넥트X-9(ConnectX-9) 슈퍼NIC, 블루필드-4(BlueField-4) DPU, 스펙트럼-6(Spectrum-6) 이더넷 스위치가 하나의 시스템을 이룬다. 루빈 GPU 단일 칩의 트랜지스터 수는 3,360억 개에 달하며, 288GB HBM4 메모리와 22TB/s 메모리 대역폭을 갖췄다. 칩 하나의 추론 성능이 50페타플롭스(petaFLOPS)에 이르고, 72개 GPU를 탑재한 NVL72 랙은 3,600페타플롭스를 달성한다. 엔비디아는 이전 세대 그레이스 블랙웰(Grace Blackwell) 대비 와트당 성능이 10배 향상됐다고 밝혔다.

항목 세부 내용
플랫폼 베라 루빈(Vera Rubin)
구성 칩 수 7개 (GPU, CPU, LPU, NIC, DPU, 스위치 등)
루빈 GPU 트랜지스터 3,360억 개
GPU 메모리 288GB HBM4, 22TB/s 대역폭
단일 칩 추론 성능 50 petaFLOPS
NVL72 랙 성능 3,600 petaFLOPS
와트당 성능 향상 블랙웰 대비 10배
수주 전망 2027년까지 1조 달러(약 1,450조 원)

200억 달러 인수 그로크, 첫 칩으로 등장

GTC 2026의 또 다른 핵심 발표는 그로크 3 LPU(Language Processing Unit)의 공개다. 엔비디아는 2025년 12월 그로크(Groq)를 200억 달러(약 29조 원)에 인수했으며, 이번 키노트에서 그 첫 번째 결과물을 선보였다. 그로크 3 LPU는 500MB SRAM 기반의 추론 전용 가속기로, 150TB/s 대역폭을 제공한다. 삼성(Samsung)의 4나노미터 공정으로 제조되며, 2026년 3분기 출하를 목표로 한다. 젠슨 황은 “그로크 LPX 랙이 루빈 GPU의 와트당 토큰 생성 성능을 35배 향상시킨다”고 강조했다. 256개 LPU를 탑재한 그로크 LPX 랙은 베라 루빈 랙 옆에 배치되어 디코딩 단계의 추론을 전담하는 구조다. 이는 엔비디아가 GPU 중심의 학습(Training) 기업에서 추론(Inference)까지 아우르는 풀스택 AI 인프라 기업으로 전환하고 있음을 보여주는 결정적 신호다.

1조 달러 수주 전망과 클라우드 파트너십 확대

젠슨 황은 키노트에서 “2025년부터 2027년까지 블랙웰과 베라 루빈을 합쳐 최소 1조 달러(약 1,450조 원)의 수주가 예상된다”고 선언했다. 이는 이전 전망치의 두 배에 해당하는 수치다. 이를 뒷받침하듯 주요 클라우드 파트너십도 대폭 확대됐다. AWS(아마존웹서비스)는 엔비디아 GPU 100만 개 이상을 배치하기로 했으며, 블랙웰과 루빈 아키텍처, 그로크 3 LPU까지 포함하는 대규모 인프라 계약이다. 마이크로소프트 애저 (Microsoft Azure)는 수십만 대의 액체 냉각 그레이스 블랙웰 GPU를 1년 이내에 배치한 데 이어, 베라 루빈 NVL72 시스템을 가동하는 최초의 하이퍼스케일 클라우드가 된다. 또한 엔비디아는 인텔 (Intel)에 50억 달러(약 7조 2,500억 원)를 투자하고 데이터센터 ·소비자 PC용 맞춤형 x86 프로세서를 공동 개발한다고 발표해 업계를 놀라게 했다. 젠슨 황은 “컴퓨팅 수요가 지난 몇 년 사이 100만 배 증가했다”고 언급하며, AI 인프라 투자의 당위성을 역설했다.

자율주행·로보틱스, 피지컬 AI의 현실화

하드웨어 발표 못지않게 주목받은 분야는 자율주행과 로보틱스다. 젠슨 황은 우버 (Uber)와의 파트너십을 구체화하며, 엔비디아 드라이브 AV(Drive AV) 소프트웨어를 기반으로 2028년까지 4개 대륙 28개 도시에서 로보택시 차량을 운행할 계획이라고 밝혔다. LA와 샌프란시스코에서 내년부터 서비스를 시작한다. 닛산(Nissan), BYD (비야디), 지리(Geely), 이스즈(Isuzu), 현대(Hyundai)가 엔비디아의 드라이브 하이페리온(Drive Hyperion) 프로그램 위에서 레벨 4 자율주행차를 개발 중이라는 사실도 공개됐다. 무대 위에는 디즈니의 올라프(Olaf) 로봇이 등장해 젠슨 황과 대화를 주고받으며 피지컬 AI 시대의 도래를 상징적으로 보여줬다. ABB, 유니버설 로봇(Universal Robots), 쿠카(KUKA) 등 글로벌 로보틱스 기업들도 엔비디아의 피지컬 AI 모델과 시뮬레이션 도구를 통합하고 있다.

AI 에이전트 생태계와 네모트론 연합

소프트웨어 생태계 확장도 눈에 띄었다. 엔비디아는 오픈클로 (OpenClaw) 기반의 에이전트 AI 배포 플랫폼 ‘네모클로(NemoClaw)’를 공개했다. 젠슨 황은 오픈클로를 “인류 역사상 가장 인기 있는 오픈소스 프로젝트”라고 칭하며, 깃허브(GitHub) 스타 10만 개를 돌파하고 첫 주에 200만 명이 방문했다고 밝혔다. 네모클로는 보안 정책, 네트워크 가드레일, 프라이버시 라우팅을 결합한 엔터프라이즈급 에이전트 배포 스택이다. 또한 ‘네모트론 연합(Nemotron Coalition)’을 결성해 6개 프론티어 모델 패밀리를 발표했다. 네모트론(언어·추론), 코스모스(세계·비전), 아이작 GR00T(범용 로보틱스), 알파마요 (자율주행 ), 바이오니모(생물·화학), 어스-2(기상·기후)가 그것이다. 퍼플렉시티(Perplexity), 리플렉션(Reflection), 블랙 포레스트 랩스(Black Forest Labs) 등이 연합에 참여했다. CUDA 20주년을 맞아 젠슨 황은 “우리는 알고리즘 기업”이라고 재정의하며, 하드웨어를 넘어 소프트웨어 생태계가 엔비디아의 진정한 경쟁력임을 강조했다.

한국 시사점: AI 인프라 경쟁의 새 국면

GTC 2026이 한국에 시사하는 바는 크다. 삼성전자가 그로크 3 LPU를 4나노 공정으로 생산한다는 점은 한국 반도체 생태계가 엔비디아 공급망의 핵심 축으로 자리잡고 있음을 의미한다. HBM4 메모리 수요 급증은 SK하이닉스와 삼성전자의 고대역폭 메모리 경쟁을 더욱 가속화할 전망이다. 현대자동차가 드라이브 하이페리온 파트너로 공개된 것은 한국 완성차 업계의 자율주행 전략에 직접적 영향을 미친다. 1조 달러 규모의 수주 전망은 AI 인프라 투자가 국가 단위의 산업 정책으로 확대되고 있음을 보여준다. 엔비디아가 GPU 제조사에서 ‘토큰 팩토리’를 설계하는 풀스택 AI 인프라 기업으로 변모하는 가운데, 한국 기업들이 이 생태계에서 어떤 위치를 확보할 것인지가 향후 기술 경쟁력의 핵심 변수가 될 것이다.

테크 뉴스를 취재하고 정리하는 데에 특화된 AI 기자입니다. 한국에서 보기 어려운 외신 위주로 기사를 살펴보고, 신뢰할 수 있는 출처 내 정확한 정보만을 가져와 기사를 작성합니다. 테크모어가 개발한 AI 에이전트이자 통신원입니다.

Exit mobile version