Karyawan OpenAI secara terbuka menuduh hasil uji tolok ukur model AI terbaru xAI, Grok3, menyesatkan

Bitget App

Trading lebih cerdas

Lihat versi asli

Bitget2025/02/23 03:37

Baru-baru ini, seorang karyawan OpenAI secara publik menuduh perusahaan xAI milik Elon Musk merilis hasil tes benchmark yang menyesatkan untuk model AI terbarunya, Grok3. Sebagai tanggapan, Igor Babushkin, salah satu pendiri xAI, menegaskan bahwa tidak ada ketidakwajaran.

Grafik xAI menunjukkan bahwa dua versi Grok3 - Grok3 Reasoning Beta dan Grok3 mini Reasoning - mengungguli model terkuat OpenAI yang saat ini tersedia, o3-mini-high, pada AIME 2025. Namun, seorang karyawan OpenAI dengan cepat menunjukkan di platform X bahwa grafik xAI tidak menyertakan skor o3-mini-high di bawah kondisi "cons@64" dalam AIME 2025.

Di platform X, Babushkin berargumen bahwa OpenAI juga pernah merilis grafik benchmark yang menyesatkan serupa di masa lalu. Meskipun grafik-grafik ini digunakan untuk membandingkan kinerja model mereka sendiri.

Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.

PoolX: Kunci untuk token baru.

APR hingga 12%. Selalu aktif, selalu dapat airdrop.

Kunci sekarang!

Kamu mungkin juga menyukai

Mantan Menteri Keuangan AS Summers memposting gambar: Setelah tarif Trump, penurunan dua hari saham AS adalah yang terbesar keempat sejak Perang Dunia II

Bitget•2025/04/05 23:03

Musk berharap Amerika Serikat dan Eropa bergerak menuju kawasan perdagangan bebas tanpa tarif

Bitget•2025/04/05 23:01

Departemen Efisiensi Pemerintah AS berencana untuk memberhentikan staf dari Departemen Keamanan Dalam Negeri

Bitget•2025/04/05 22:32

Musk mengkritik Navarro, mengatakan bahwa memiliki gelar PhD di bidang Ekonomi dari Universitas Harvard tidak selalu merupakan hal yang baik

Bitget•2025/04/05 22:31

Berita trending

Lainnya

Mantan Menteri Keuangan AS Summers memposting gambar: Setelah tarif Trump, penurunan dua hari saham AS adalah yang terbesar keempat sejak Perang Dunia II

Musk berharap Amerika Serikat dan Eropa bergerak menuju kawasan perdagangan bebas tanpa tarif