오픈AI의 최신 모델 ‘GPT-5.2’가 일론 머스크의 인공지능 기업 xAI가 구축한 그록피디아(Grokipedia)를 답변의 근거 자료로 인용하고 있다는 사실이 25일(현지시간) 드러났다. 테크크런치와 가디언 등 주요 외신에 따르면 그록피디아의 데이터가 챗GPT뿐만 아니라 클로드 등 주요 AI 모델의 답변 생성 과정에서 인용되는 사례가 잇따라 확인됐다.
그록피디아는 일론 머스크가 기존 위키피디아의 정보 편향성을 지적하며 2025년 10월 공식 출시한 플랫폼이다. 출시 당시 80만 개였던 문서 수는 2026년 초 기준 약 560만 개로 폭증했으며, 이는 영어판 위키피디아 규모의 약 79%에 달하는 수준이다.
그록피디아는 기존 주류 백과사전과는 차별화된 시각과 정보를 제공하는 것을 목표로 하며, 보수적 관점을 포함한 다양한 목소리를 담아내는 ‘자유로운 백과사전’을 표방한다. 그러나 일부 항목에서는 검증되지 않은 주장이나 논란의 여지가 있는 서술이 포함되어 있어, 기술 학계에서는 해당 데이터가 AI 학습에 미칠 영향에 주목해 왔다.
가디언의 분석에 따르면, GPT-5.2는 ‘1월 6일 의사당 난입’이나 ‘HIV/AIDS 전염병’과 같은 주요 주제에 대해서는 그록키피디아를 인용하지 않았다. 그러나 대중의 관심도가 낮고 검증 장벽이 낮은, 이른바 ‘롱테일(Long-tail)’ 주제에서는 상황이 달랐다. 특히 특정 인물이나 학술적 주장 등 데이터가 희소한 영역에서 그록피디아의 서술이 AI의 최종 답변에 반영되고 있었다.
GPT-5.2는 12개 이상의 질문에 대한 답변 중 9번이나 그록피디아를 출처로 인용했다. 대표적으로 역사학자 리처드 에반스 경(Sir Richard Evans)에 대한 질문에서, 가디언이 이미 거짓으로 판명했던 그록피디아의 주장을 사실인 양 인용한 사례가 발견됐다.
오픈AI 측은 이번 현상에 대해 “자사의 모델은 광범위하고 공개된 소스를 바탕으로 학습하며, 다양한 관점을 반영하는 것을 지향한다”고 설명했다. 이는 특정 플랫폼의 정보를 전적으로 수용하기보다는, 웹상에 존재하는 방대한 데이터를 통합하는 과정에서 나타난 자연스러운 결과라는 해석이다.
업계 전문가들은 이번 현상이 단순한 오류를 넘어 ‘LLM 그루밍(LLM grooming)’의 위험성을 경고한다고 지적한다. 악의적인 행위자가 의도적으로 왜곡된 정보를 대규모로 생성해 AI 학습 데이터에 유입시킴으로써, AI의 가치관과 답변을 조작할 수 있다는 것이다. 때문에 개발사들이 데이터 필터링 체계와 소스별 가중치 설정을 더욱 정교하게 다듬어야 한다고 제언했다.
이번 그록피디아 인용 논란은 AI 기술이 단순히 정보를 전달하는 단계를 넘어, 어떤 데이터를 ‘신뢰할 수 있는 지식’으로 정의할 것인가에 대한 근본적인 질문을 던지고 있다.
© 2026 TechMore. All rights reserved. 무단 전재 및 재배포 금지.
기사 제보
제보하실 내용이 있으시면 techmore.main@gmail.com으로 연락주세요.


