중국발 나노 바나나 프로, 텐센트가 오픈소스로 공개했다... 800억 파라미터 규모의 '괴물'

텐센트가 기존의 이미지 생성 기술적 한계를 뛰어넘은 차세대 네이티브 멀티모달 모델 ‘혼위안이미지(HunyuanImage)-3.0’을 오픈소스로 공개했다.

이번 모델은 텍스트와 이미지를 단일 오토레그레시브(Autoregressive) 프레임워크로 통합한 아키텍처를 통해, 기존 폐쇄형 상용 모델을 압도하는 성능을 구현한다. 오토리그레시브 모델은 입력 시퀀스를 따라가면서 다음 요소를 예측하는 방식으로, 긴 프롬프트나 복잡한 구성에서도 뛰어난 성능을 발휘한다.

혼위안이미지-3.0은 현존하는 오픈소스 이미지 생성 모델 중 최대 규모인 800억 개의 파라미터를 보유한 ‘혼합 전문가(MoE, Mixture of Experts)’ 구조를 채택했다. MoE 구조는 다양한 전문가 모델을 조합하여 더 높은 성능을 구현하는 기술로, 64개의 전문가 모델이 협력하여 이미지 생성의 정확성을 높인다. 또한 전문가 모델 중 토큰당 130억 개의 파라미터만 활성화하여 연산 효율성을 극대화했다.

또한 업계 표준처럼 여겨지던 DiT(Diffusion Transformer) 구조를 탈피하고, 텍스트와 이미지 모달리티를 직접적으로 통합 모델링하여 문맥에 더욱 최적화된 이미지 생성이 가능하다. 함께 배포된 ‘혼위안이미지-3.0-인스트럭트(Instruct)’ 체크포인트는 사용자의 의도를 지능적으로 해석한다. 자체 개발한 MixGRPO 알고리즘 덕분에 사람 의도를 파악하고, 멀쩡한 배경은 그대로 두고 원하는 부분만 수정하거나 여러 사진을 자연스럽게 합칠 수 있다.

공개된 가중치와 코드를 이용해 크리에이티브 스튜디오와 스타트업은 투명한 커스터마이징과 프라이빗 배포할 수 있다.

기사 제보

제보하실 내용이 있으시면 techmore.main@gmail.com으로 연락주세요.

About

중국발 나노 바나나 프로, 텐센트가 오픈소스로 공개했다… 800억 파라미터 규모의 ‘괴물’

오픈AI, 장기 연구 포기하고 챗GPT 올인… 핵심 인재 대거 유출

개발자가 직접 알려주는 ‘클로드 코드 32가지 활용법’… 생산성 극대화 노하우 공개

AI 에이전트 SNS ‘몰트북’, 데이터베이스 설정 오류로 150만 개 API 키 노출

실리콘밸리 대표 액셀러레이터 YC, 스테이블코인으로 투자금 지급한다

애플, Xcode 26.3 출시로 AI 에이전트 코딩 시대 본격화

아이폰 폴드 다음은 ‘플립’… 애플, 클램셀 폴더블 검토 중

오픈AI, 장기 연구 포기하고 챗GPT 올인… 핵심 인재 대거 유출

AI 에이전트 SNS ‘몰트북’, 데이터베이스 설정 오류로 150만 개 API 키 노출

아이폰 폴드 다음은 ‘플립’… 애플, 클램셀 폴더블 검토 중

오픈AI, 맥OS용 에이전틱 코딩 앱 ‘코덱스’ 출시… 클로드 코드와 본격 경쟁

테슬라, 모델Y 신규 전륜구동 버전 미국 출시… 5880만원 가격 경쟁력 강화

About

뉴스레터 구독하기

중국발 나노 바나나 프로, 텐센트가 오픈소스로 공개했다… 800억 파라미터 규모의 ‘괴물’

관련 기사