엔비디아(NVIDIA)가 AI 서버 공급 체계를 GPU 부품 판매에서 완성형 시스템 공급으로 전환하는 대대적인 수직통합 전략을 추진하고 있다. J.P. 모건의 최근 분석 보고서에 따르면, 엔비디아는 2026년 하반기 출시 예정인 Vera Rubin 플랫폼부터 완전 조립된 Level-10(L10) 컴퓨트 트레이를 파트너사에 공급할 계획이다. 이 조치가 현실화될 경우, AI 서버 시장의 밸류체인이 근본적으로 재편될 것으로 전망된다.
엔비디아의 수직통합 전략은 최근에 시작된 것이 아니다. 2016년 최초의 딥러닝 슈퍼컴퓨터 DGX-1을 출시하면서 시작된 이 여정은, 2019년 멜라녹스(Mellanox) 인수를 거쳐 현재에 이르고 있다. DGX-1은 당시 ‘박스 안의 슈퍼컴퓨터’로 불리며, 젠슨 황 CEO가 직접 오픈AI에 첫 번째 시스템을 전달한 바 있다.
특히 2020년 4월 완료된 멜라녹스 인수는 엔비디아의 수직통합 전략에서 결정적인 전환점이 되었다. 69억 달러(실제 완료 시 70억 달러)에 달하는 이 인수를 통해 엔비디아는 GPU 컴퓨팅 능력에 고성능 네트워킹 기술을 결합할 수 있게 되었다. 당시 젠슨 황 CEO는 ‘네트워킹이 컴퓨팅보다 데이터센터의 미래에 더 중요한 요소’라고 언급하며 이 결정의 전략적 의미를 강조했다.
엔비디아 수직통합 주요 타임라인
- 2016년 4월: DGX-1 발표 – 최초의 AI 전용 슈퍼컴퓨터, 8개의 Tesla P100 GPU 탑재, $129,000
- 2016년 8월: DGX-1 첫 고객인 오픈AI에 젠슨 황 CEO가 직접 전달
- 2019년 3월: 멜라녹스 인수 발표 (69억 달러)
- 2020년 4월: 멜라녹스 인수 완료 – 네트워킹 역량 확보로 엔드투엔드 솔루션 기반 마련
- 2024년 3월: GB200 NVL72 발표 – Bianca 보드 사전 조립 방식 도입 (L7-L8 수준 통합)
- 2025년 3월: GTC 2025에서 Vera Rubin 플랫폼 로드맵 공개
- 2025년 10월: OCP 글로벌 서밋에서 Vera Rubin MGX 랙 혁신 기술 공개
- 2026년 하반기 (예정): VR200 NVL144 출시 – L10 수준 완전 통합 컴퓨트 트레이 공급 예정
L10 컴퓨트 트레이의 의미와 파급 효과
J.P. 모건 보고서에 따르면, 엔비디아가 공급할 L10 컴퓨트 트레이에는 Vera CPU, Rubin GPU, 메모리, 800G NIC, 110kW 전력 공급 장치, 미드플레인 인터페이스, 액체 냉각 콜드플레이트 등 서버 핵심 부품이 모두 포함된다. 이는 서버 전체 비용의 약 90%를 차지하는 것으로 추정된다.
기존 GB200 플랫폼에서 엔비디아는 Bianca 보드 형태로 주요 부품을 사전 조립해 공급했지만, 이는 L7-L8 수준의 통합에 불과했다. 당시까지도 OEM과 ODM 파트너들은 서버 수준에서 자체적인 설계 자유도를 보유할 수 있었다. 그러나 L10 완전 통합으로 전환되면, 파트너들의 역할은 랙 수준 조립, 전원 구성, 냉각 사이드카 설치, 최종 테스트 등으로 대폭 축소된다.
이러한 변화의 배경에는 Rubin GPU의 높은 전력 소비가 있다. J.P. 모건 보고서는 Rubin GPU의 TDP가 기존 Blackwell Ultra의 1.4kW에서 1.8kW(R200), 최대 2.3kW(미발표 SKU)까지 증가한다고 분석했다. 이로 인해 랙 수준 전력 소비가 250kW를 초과하게 되어, 커스텀 냉각 설계가 경제적으로 비현실적이 된다는 설명이다.
이 전략에 대한 업계의 반응은 엇갈리고 있다. J.P. 모건 보고서에 따르면, 현재 주요 하이퍼스케일러들은 엔비디아의 제안에 반대 입장을 표명하고 있으며, 최종 결정은 아직 내려지지 않은 상태다. 기존에 하이퍼스케일러들은 자체 ODM과 협력하여 컴퓨트 트레이를 맞춤 설계할 수 있었지만, 새로운 체계 하에서는 그 자유도가 크게 제한될 것으로 보인다.
TechPowerUp는 이번 변화에 대해 “공급망 전체의 가치와 마진이 인증된 부품 제조업체와 대량 통합업체 쪽으로 이동할 것이며, 브랜드 OEM들은 하드웨어 차별화 기회가 줄어들고 마진이 축소될 것”이라고 분석했다. 반면 일부에서는 이 전략이 수율 개선과 리드타임 단축을 통해 VR200의 시장 출시를 앞당기고 생산 비용을 절감할 수 있다는 긍정적 측면도 언급하고 있다.
Hacker News에서는 한 사용자가 “누군가가 하드웨어를 살 수 있다면 적어도 당신이 직접 소유하거나 여러 경쟁 제공자로부터 임대할 수 있다. 하지만 오직 하나의 회사에서만 임대할 수 있다면, 누가 그런 함정에 발을 들이고 싶겠는가?”라며 독점적 공급 체계에 대한 우려를 표명했다.
ODM 및 OEM 생태계의 변화
J.P. 모건은 엔비디아의 잠재적 EMS 파트너로 폭스콘(Hon Hai), 위스트론(Wistron), 콴타(Quanta)를 언급했다. 이 체계 하에서 하이퍼스케일러들은 나머지 구성요소에 대해서만 자체 ODM과 공동 설계가 가능하다.
보고서는 L10 트레이 공급 체계가 도입될 경우 “NVL72 L10 서버 ODM 시장이 통합될 수 있으며, 상대적 영향력이 Dell이나 HPE 같은 서버 브랜드에서 ODM으로 이동할 수 있다”고 전망했다. 또한 MCP(Micro-Channel Plate) 시장도 소수의 인증된 공급업체 중심으로 재편될 것으로 예상되며, 주요 후보로는 AVC와 Cooler Master가 거론되고 있다.
한편, AMD는 엔비디아의 수직통합에 대응하여 개방형 전략을 강화하고 있다. 2025년 10월 OCP 글로벌 서밋에서 AMD는 메타가 OCP에 제출한 ORW 사양을 기반으로 한 ‘Helios’ AI 랙을 공개했다. AMD는 이 레퍼런스 디자인을 통해 OEM과 ODM 파트너들이 차별화된 AI 인프라를 구축할 수 있도록 지원하겠다는 계획이다.
Kyber NVL576과 기가와트급 AI 팩토리
엔비디아의 수직통합 전략은 여기서 멈추지 않을 것으로 보인다. 2027년 하반기 출시 예정인 Rubin Ultra 기반 Kyber NVL576 랙 스케일 솔루션은 800V DC 데이터센터 아키텍처와 함께 등장하여 메가와트급 랙을 구현할 예정이다. Guru3D는 “엔비디아가 컴퓨트 트레이를 소유하기 시작하면, 이들이 랙 수준 또는 심지어 포드 수준 통합으로 더 깊이 진출하는 것을 상상하기 어렵지 않다”고 전망했다.
GTC 2025에서 젠슨 황 CEO는 “우리는 AI 팩토리와 AI 인프라를 구축하고 있다. 이것은 몇 년에 걸친 계획이 필요하다. 이것은 노트북을 사는 것과 다르다. 재량 지출이 아니다”라고 강조하며, 2-3년 전에 로드맵을 공개하는 이유가 고객들이 토지, 전력, CapEx, 엔지니어링 팀을 미리 준비할 수 있도록 하기 위함이라고 설명했다.
엔비디아의 Vera Rubin L10 컴퓨트 트레이 공급 계획은 AI 서버 산업의 근본적인 재편을 예고한다. 한편으로는 수율 개선, 리드타임 단축, 생산 비용 절감이라는 긍정적 효과가 기대되지만, 다른 한편으로는 OEM과 ODM의 역할 축소, 마진 압박, 하드웨어 차별화 기회 감소라는 부작용도 우려된다.
현재 하이퍼스케일러들이 이 제안에 반대하고 있다는 점은 최종 결과가 아직 불확실함을 시사한다. 그러나 GPU당 2.3kW에 달하는 전력 소비와 그에 따른 냉각 복잡성을 고려할 때, 엔비디아의 표준화된 솔루션이 장기적으로 시장에서 수용될 가능성이 높아 보인다.
이번 사안은 아직 공식적으로 확인되지 않은 상태이며, 엔비디아는 Tom’s Hardware의 논평 요청에 응하지 않았다. 업계 관계자들은 2026년 VR200 출시를 앞두고 엔비디아와 주요 고객사들 간의 협상 결과를 주목하고 있다.
© 2025 TechMore. All rights reserved. 무단 전재 및 재배포 금지.
기사 제보
제보하실 내용이 있으시면 techmore.main@gmail.com으로 연락주세요.

