Pracownicy OpenAI publicznie oskarżają wyniki testów porównawczych najnowszego modelu AI xAI, Grok3, o wprowadzanie w błąd
Ostatnio pracownik OpenAI publicznie oskarżył firmę xAI Elona Muska o publikowanie wprowadzających w błąd wyników testów porównawczych dla najnowszego modelu AI, Grok3. W odpowiedzi Igor Babushkin, współzałożyciel xAI, zapewnił, że nie doszło do żadnych nieprawidłowości.
Wykres xAI pokazuje, że dwie wersje Grok3 - Grok3 Reasoning Beta i Grok3 mini Reasoning - przewyższyły obecnie najmocniejszy dostępny model OpenAI, o3-mini-high, w AIME 2025. Jednak pracownik OpenAI szybko zauważył na platformie X, że wykres xAI nie uwzględniał wyniku o3-mini-high w warunku "cons@64" w AIME 2025.
Na platformie X Babushkin argumentował, że OpenAI również w przeszłości publikowało podobne wprowadzające w błąd wykresy porównawcze. Pomimo że te wykresy były używane do porównywania wydajności ich własnych modeli.
Zastrzeżenie: Treść tego artykułu odzwierciedla wyłącznie opinię autora i nie reprezentuje platformy w żadnym charakterze. Niniejszy artykuł nie ma służyć jako punkt odniesienia przy podejmowaniu decyzji inwestycyjnych.
Może Ci się również spodobać
Walrus: Strona do zgłaszania roszczeń airdropu WAL jest już otwarta
Walrus wkrótce uruchomi funkcję nagród za staking WAL
Popularne
WięcejCeny krypto
Więcej








