Bitget App
交易「智」變
快速買幣市場交易合約跟單BOT理財
OpenAI 員工公開指責 xAI 最新 AI 模型 Grok3 的基準測試結果具有誤導性

OpenAI 員工公開指責 xAI 最新 AI 模型 Grok3 的基準測試結果具有誤導性

查看原文
Bitget2025/02/23 03:37

最近,OpenAI的一名員工公開指責Elon Musk的xAI公司發布了其最新AI模型Grok3的誤導性基準測試結果。對此,xAI的聯合創始人Igor Babushkin堅稱沒有不當行為。

xAI的圖表顯示,Grok3的兩個版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025中表現優於OpenAI目前最強的可用模型o3-mini-high。然而,一名OpenAI員工迅速在平台X上指出,xAI的圖表未包含o3-mini-high在AIME 2025中“cons@64”條件下的得分。

在平台X上,Babushkin辯稱OpenAI過去也發布過類似的誤導性基準圖表,儘管這些圖表被用來比較他們自己的模型性能。

0

免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。

PoolX: 鎖倉獲得新代幣空投
不要錯過熱門新幣,且APR 高達 10%+
立即參與