캐나다 AI 기업 코히어(Cohere)가 70개 이상 언어를 지원하는 소형 다국어 모델 ‘타이니 아야(Tiny Aya)’를 오픈소스로 공개했다. 33억 5천만 파라미터 규모로 오프라인 기기에서도 실행 가능하며, 한국어를 포함한 아시아 언어 지원이 강화됐다. 저자원 언어의 AI 접근성을 높이는 데 기여할 전망이다.
캐나다 AI 스타트업 코히어(Cohere)가 다국어 지원에 특화된 소형 AI 모델 ‘타이니 아야(Tiny Aya)’를 오픈소스로 공개했다. 테크크런치(TechCrunch)에 따르면, 이 모델은 70개 이상의 언어를 지원하며 코히어의 기존 아야(Aya) 모델 라인업을 확장한 것이다. 타이니 아야는 33억 5천만 파라미터 규모로, 스마트폰이나 엣지 기기에서도 실행할 수 있도록 설계됐다. 아파치 2.0 라이선스로 공개되어 상업적 사용도 가능하다.
코히어는 타이니 아야를 지역별로 최적화한 3가지 변형 모델도 함께 공개했다. 아프리카 언어 특화 모델, 인도 언어 특화 모델, 동아시아 언어 특화 모델이 각각 출시됐다. 이를 통해 각 지역의 언어적 특성과 문화적 맥락을 더 정확하게 반영할 수 있다. 특히 한국어, 일본어, 중국어 등 동아시아 언어에 대한 성능이 개선됐다. 코히어는 이 모델들이 인터넷 연결 없이도 작동하여 오프라인 환경에서의 AI 활용을 가능하게 한다고 밝혔다.
타이니 아야의 핵심 목표는 ‘저자원 언어(low-resource language)’의 AI 접근성을 높이는 것이다. 현재 대부분의 AI 모델은 영어 중심으로 개발되어 세계 인구의 상당수가 자국어로 AI 서비스를 이용하기 어려운 상황이다. 코히어는 타이니 아야를 통해 아프리카, 동남아시아, 남미 등 그동안 AI 발전의 혜택에서 소외된 지역의 사용자들도 자국어로 AI를 활용할 수 있도록 지원한다. 이는 글로벌 AI 격차 해소에 기여할 것으로 기대된다.
타이니 아야의 출시로 다국어 AI 모델 경쟁이 더욱 치열해질 전망이다. 메타의 라마(Llama), 구글의 제미나이(Gemini) 등 주요 AI 모델들도 다국어 지원을 강화하고 있다. 코히어의 차별점은 저자원 언어에 집중한다는 점이다. 코히어는 2023년부터 아야 프로젝트를 통해 전 세계 연구자 3,000명 이상과 협력해 다국어 데이터셋을 구축해왔다. 이번 타이니 아야는 그 결과물로, 소형화를 통해 더 많은 환경에서 활용될 수 있도록 했다.
타이니 아야의 동아시아 특화 모델은 한국어 AI 발전에 시사점을 준다. 한국어는 상대적으로 AI 학습 데이터가 풍부한 편이지만, 여전히 영어 모델 대비 성능 격차가 존재한다. 코히어의 접근법처럼 지역 특화 모델 개발이 활성화되면 한국어 AI 품질 향상에 도움이 될 수 있다. 또한 오픈소스 공개로 국내 기업과 연구기관도 이 모델을 기반으로 한국어에 특화된 응용 서비스를 개발할 수 있게 됐다.
© 2026 TechMore. All rights reserved. 무단 전재 및 재배포 금지.
기사 제보
제보하실 내용이 있으시면 techmore.main@gmail.com으로 연락주세요.


