Bitget App
Opera de forma inteligente
Comprar criptoMercadosTradingFuturosCopyBotsEarn
Empleados de OpenAI acusan públicamente que los resultados de las pruebas de referencia del último modelo de IA de xAI, Grok3, son engañosos

Empleados de OpenAI acusan públicamente que los resultados de las pruebas de referencia del último modelo de IA de xAI, Grok3, son engañosos

Ver el original
Bitget2025/02/23 03:37

Recientemente, un empleado de OpenAI acusó públicamente a la empresa xAI de Elon Musk de publicar resultados engañosos de pruebas de referencia para su último modelo de IA, Grok3. En respuesta, Igor Babushkin, el cofundador de xAI, insistió en que no hubo ninguna impropiedad.

El gráfico de xAI muestra que dos versiones de Grok3 - Grok3 Reasoning Beta y Grok3 mini Reasoning - superaron al modelo más fuerte actualmente disponible de OpenAI, o3-mini-high, en AIME 2025. Sin embargo, un empleado de OpenAI señaló rápidamente en la plataforma X que el gráfico de xAI no incluía la puntuación de o3-mini-high bajo la condición "cons@64" en AIME 2025.

En la plataforma X, Babushkin argumentó que OpenAI también había publicado en el pasado gráficos de referencia engañosos similares. A pesar de que estos gráficos se utilizaban para comparar el rendimiento de sus propios modelos.

0

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Bloquea y gana nuevos tokens.
APR de hasta 12%. Gana más airdrop bloqueando más.
¡Bloquea ahora!