OpenAI 资助 AI 数学基准测试引发公正性质疑1 月 20 日

AI 社区对 OpenAI 资助的数学基准测试 FrontierMath 的公正性提出质疑,因为 OpenAI 参与了该基准的审核,但合作信息直到去年 12 月才公开。社区成员担心 OpenAI 可能获得优先访问权,影响基准公正性。Epoch AI 副主任承认未能及时公开合作信息,但强调 FrontierMath 的完整性未被破坏。Epoch AI 首席数学家表示,将进行独立评估以确认 OpenAI 在 FrontierMath 上的表现准确性。

企业微信二维码