OpenAI가 FrontierMath 프로젝트에 비밀리에 자금을 지원하고 데이터 접근 권한을 가진 사실이 드러나면서, AI 커뮤니티 내에서 투명성과 공정성에 대한 논란이 뜨겁습니다. 이번 사건은 AI 발전과 윤리적 정합성 사이의 균형이 얼마나 중요한지를 보여줍니다.
FrontierMath는 AI 시스템의 고급 수학적 추론 능력을 평가하기 위해 Epoch AI와 수십 명의 수학자들이 협력해 만든 고난이도 수학 문제 벤치마크입니다. 그러나 OpenAI가 이 프로젝트에 비밀리에 자금을 지원하고 데이터 접근 권한을 가졌다는 사실이 드러나면서, 벤치마크의 공정성과 신뢰성이 의심받고 있습니다. OpenAI는 o3 모델을 FrontierMath에서 시험하며 25.2%라는 높은 성과를 기록했지만, 이러한 성과가 과연 진정한 AI의 능력을 반영하는 것인지에 대한 의문이 제기되었습니다.
어떻게 이러한 비밀 자금 지원과 데이터 접근이 가능했을까요? OpenAI는 FrontierMath 개발에 자금을 제공했으나, 수학자 기여자들에게 이 사실을 알리지 않았습니다. 또한, OpenAI는 대부분의 데이터셋에 접근할 수 있었으며, 훈련에 사용하지 않겠다는 구두 약속만 있었을 뿐, 문서화된 보장은 없었습니다. 이로 인해 수학자들은 자신들의 기여가 어떻게 사용될지 몰랐고, 이는 윤리적·법적 불확실성을 초래했습니다.
커뮤니티의 반응은 강력했습니다. 수학자들과 AI 연구자들은 배신감을 느끼며 강한 비판을 쏟아냈습니다. 이 사태는 AI 개발자들의 윤리적 책임과 협업 시 명확한 소통의 필요성을 재차 강조하게 만들었습니다. AI 전문가들, 예를 들어 Gary Marcus는 OpenAI의 o3 모델 성능 발표가 과장되고, 과학적으로 신뢰할 수 없다고 비판했습니다.
이번 사건은 AI 벤치마크 프로젝트에 대한 규제 강화와 투명성 기준 마련의 필요성을 촉발할 수 있습니다. 앞으로 수학자 및 연구자들은 참여 전 자금 출처와 데이터 활용 조건을 명확히 확인하려 할 것이며, 기관들은 투명한 협업 방식을 채택할 가능성이 높습니다. AI의 수학적 추론 능력이 빠르게 발전하는 가운데, 평가의 공정성과 신뢰성을 확보하는 것이 연구 및 상용화 모두에서 중요해질 것입니다.
