o3模型基准测试分数仅为10%,远低于OpenAI宣传的25%
这并不意味着 OpenAI 在说谎!站长之家(ChinaZ.com) 4月21日 消息:OpenAI 的新 AI 模型 o3 在首先方和第三方基准测试结果上存在差异,这也引发了人们对该公司透明度和模型测试实践的质疑。去年 12 月, OpenAI 的 o3 模型初次亮相,当时,该公司宣称这款模型能够解答 FrontierMath(一组相当挑战性的数学问题)中超过 25% 的题目 —— 这个成绩