OpenAI 资助 AI 数学基准测试引发公正性质疑

OpenAI 资助 AI 数学基准测试引发公正性质疑

2025 年 1 月 20 日

AI 社区对 OpenAI 资助的数学基准测试 FrontierMath 的公正性提出质疑，因为 OpenAI 参与了该基准的审核，但合作信息直到去年 12 月才公开。社区成员担心 OpenAI 可能获得优先访问权，影响基准公正性。Epoch AI 副主任承认未能及时公开合作信息，但强调 FrontierMath 的完整性未被破坏。Epoch AI 首席数学家表示，将进行独立评估以确认 OpenAI 在 FrontierMath 上的表现准确性。

因延后披露受 OpenAI 资助事实，AI 基准测试组织 FrontierMath 被质疑行为不当

IT 之家

AI 基准组织因未及时披露 OpenAI 资金遭批评

aibase

OpenAI 资助 AI 数学基准测试引发公正性质疑

品玩

展开全部报道

2025-04-11

OpenAI 削减了在人工智能模型安全测试上花费的时间和资源

2025-04-03

OpenAI 宣布推出 AI Agent 评测基准 PaperBench

2025-02-19

OpenAI 推出 SWE-Lancer 基准测试

2025-01-20

OpenAI 资助 AI 数学基准测试引发公正性质疑

2024-08-20

OpenAI 关闭 SearchGPT 候补名单，首批万人测试已招满

2024-08-14

OpenAI 推出代码生成评估基准

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。