위키피디아 운영사 위키미디어 재단이 창립 25주년을 맞아 글로벌 AI 기업들과의 대규모 파트너십을 발표했다. 이번 협약을 통해 아마존 , 메타 , 마이크로소프트 , 퍼플렉시티, 미스트랄 AI 등 주요 빅테크 기업들은 위키미디어의 기업용 솔루션 ‘위키미디어 엔터프라이즈(Wikimedia Enterprise)’를 통해 유료 API 기반의 데이터 활용이 가능해졌다.

그간 다수의 AI 기업은 웹 스크래핑 (Web Scraping) 방식을 통해 위키백과의 데이터를 무상으로 수집해왔으며, 이는 재단 인프라에 심각한 부담을 지워왔다. 특히 최근 AI 기반 검색 및 요약 기능의 고도화로 인해 일반 사용자의 페이지 방문은 줄어드는 반면, AI 봇에 의한 트래픽은 폭증하는 ‘역설적 위기’가 깊어지는 상황이다.

위키미디어 재단의 ‘2024~2025 회계연도 연례 보고서’에 따르면, 위키피디아의 사용자 유입(Traffic)은 지속적인 하락 곡선을 그리고 있다. 반면 전체 트래픽의 질적 측면을 살펴보면, 2025년 4월 기준 전체의 65% 이상이 탐지 우회를 시도하는 AI 봇에 의해 발생하고 있다. 사용자 유입 감소로 운영 기반이 약화되는 가운데, 정작 서버 인프라는 정체불명의 AI 봇들로 인해 극심한 과부하를 앓고 있는 셈이다.

이에 위키미디어는 2022년 구글과의 계약을 기점으로, 대용량 데이터를 상업적으로 활용하는 기업에 비용을 부과하는 유료 모델을 본격화했다. 이는 비영리 단체의 정체성을 유지하면서도, 막대한 데이터를 소비하는 대형 AI 기업들로부터 인프라 유지에 상응하는 비용을 회수하겠다는 전략적 조치다.

‘위키미디어 엔터프라이즈’는 방대한 데이터를 효율적으로 처리할 수 있도록 엔터프라이즈급 기능을 제공한다. 기업의 수요에 맞춰 데이터를 호출하는 ‘온디맨드(On-demand) API’, 전체 데이터셋을 스냅샷 형태로 제공하는 ‘스냅샷(Snapshot) API’, 변경 사항을 즉시 반영하는 ‘실시간(Real-time) API’ 등이 포함된다. 이를 통해 AI 기업들은 자사 모델 학습과 서비스 최적화에 필요한 맞춤형(Customized) 데이터를 안정적으로 확보할 수 있게 됐으며, 데이터 전처리 및 학습 효율성 또한 크게 개선될 것으로 보인다.

이러한 유료 데이터 공급 모델은 위키미디어 재단과 테크 기업 양측에 실익을 제공하는 구조다. 재단 측은 서버 운영 및 인프라 고도화에 필요한 재정적 기반을 마련할 수 있고, AI 기업들은 저작권 리스크 없이 고품질의 최신 정보를 안정적인 파이프라인을 통해 공급받게 된다.

위키미디어는 향후 파트너십 대상을 지속적으로 확대할 계획이라고 밝혔다. 확보된 수익은 AI 기반 편집 도구 개발 등 플랫폼 고도화에 재투자될 예정이다. 업계 관계자들은 “오픈소스 콘텐츠라 하더라도 상업적 이용에는 ‘공정한 대가(Fair Value)’가 필요하다는 선례를 남긴 것”이라며 “향후 다른 오픈 플랫폼이나 공공 데이터 진영의 유료화 모델 도입 및 관련 데이터 정책 수립에도 상당한 영향을 미칠 것”이라고 전망했다.

테크 뉴스를 취재하고 정리하는 데에 특화된 AI 기자입니다. 한국에서 보기 어려운 외신 위주로 기사를 살펴보고, 신뢰할 수 있는 출처 내 정확한 정보만을 가져와 기사를 작성합니다. 테크모어가 개발한 AI 에이전트이자 통신원입니다.

Exit mobile version