Empleados de OpenAI acusan públicamente que los resultados de las pruebas de referencia del último modelo de IA de xAI, Grok3, son engañosos

Bitget App

Opera de forma inteligente

Ver el original

Bitget2025/02/23 03:37

Recientemente, un empleado de OpenAI acusó públicamente a la empresa xAI de Elon Musk de publicar resultados engañosos de pruebas de referencia para su último modelo de IA, Grok3. En respuesta, Igor Babushkin, el cofundador de xAI, insistió en que no hubo ninguna impropiedad.

El gráfico de xAI muestra que dos versiones de Grok3 - Grok3 Reasoning Beta y Grok3 mini Reasoning - superaron al modelo más fuerte actualmente disponible de OpenAI, o3-mini-high, en AIME 2025. Sin embargo, un empleado de OpenAI señaló rápidamente en la plataforma X que el gráfico de xAI no incluía la puntuación de o3-mini-high bajo la condición "cons@64" en AIME 2025.

En la plataforma X, Babushkin argumentó que OpenAI también había publicado en el pasado gráficos de referencia engañosos similares. A pesar de que estos gráficos se utilizaban para comparar el rendimiento de sus propios modelos.

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Bloquea y gana nuevos tokens.

APR de hasta 12%. Gana más airdrop bloqueando más.

¡Bloquea ahora!

También te puede gustar

Una cierta ballena ha reducido sus tenencias en 188.1 mil millones de PEPE en la última hora, resultando en una pérdida de 2.63 millones de dólares estadounidenses

Bitget•2025/02/23 10:54

100 millones de USDT fueron transferidos de CEX a Aave

Bitget•2025/02/23 10:34

Fundación SOL: El escenario de aplicación de PayFi es la ballena blanca de la industria de la criptografía, y los tokens nunca desaparecerán realmente mientras tengan una comunidad

Bitget•2025/02/23 10:32

El índice de Miedo y Avaricia de hoy ha subido ligeramente a 50, el nivel sigue siendo neutral

Bitget•2025/02/23 08:35

En tendencia

Más

Una cierta ballena ha reducido sus tenencias en 188.1 mil millones de PEPE en la última hora, resultando en una pérdida de 2.63 millones de dólares estadounidenses

100 millones de USDT fueron transferidos de CEX a Aave