โมเดล o3 ที่แข็งแกร่งที่สุดของ OpenAI ถูกเปิดโปงเรื่องการฉ้อโกง โดยได้รับสิทธิ์เข้าถึงธนาคารคำถามทดสอบ FrontierMath ล่วงหน้า
ผู้รับเหมาจาก EpochAI ชื่อ "Meemi" เปิดเผยในฟอรัม Less Wrong ว่า OpenAI ไม่เพียงแต่ให้การสนับสนุนทางการเงินสำหรับการทดสอบมาตรฐาน FrontierMath แต่ยังได้รับสิทธิ์เข้าถึงพิเศษไปยังธนาคารคำถามของการทดสอบด้วย
Tamay Besiroglu รองผู้อำนวยการและหนึ่งในผู้ร่วมก่อตั้ง EpochAI ยอมรับเรื่องนี้บนแพลตฟอร์ม X เราทำผิดพลาดที่ไม่ได้เปิดเผยการมีส่วนร่วมของ OpenAI ใน FrontierMath ก่อนหน้านี้ สัญญาของเราห้ามไม่ให้เราทำเช่นนั้นก่อนที่ o3 จะถูกปล่อยออกมา เมื่อมองย้อนกลับไป เราควรพยายามให้มีความโปร่งใสมากขึ้นในเร็ววัน เรารับทราบเรื่องนี้และสัญญาว่าจะทำให้ดีขึ้นในอนาคต
Elliot Glazer หัวหน้านักคณิตศาสตร์ที่ EpochAI ยอมรับว่าเขาไม่ได้เปิดเผยข้อมูลเกี่ยวกับการสนับสนุนทางอุตสาหกรรมในระหว่างโครงการอย่างเชิงรุกและขอโทษนักคณิตศาสตร์ที่อาจไม่เข้าร่วมถ้าพวกเขารู้ล่วงหน้า เกี่ยวกับคะแนน o3 เขาแสดงความมั่นใจในความถูกต้องของคะแนนที่รายงานโดย OpenAI แต่เน้นว่า EpochAI จำเป็นต้องตรวจสอบผ่านชุดทดสอบการเก็บรักษาอิสระที่กำลังพัฒนาและสัญญาว่าคะแนนการประเมินจากชุดนี้จะถูกเปิดเผยต่อสาธารณะ เมื่อถูกถามเกี่ยวกับสถานะของชุดการเก็บรักษานี้ Glazer ชี้แจงว่ายังอยู่ระหว่างการพัฒนาไม่ใช่เสร็จสมบูรณ์
มีรายงานว่า FrontierMath เป็นมาตรฐานการประเมินความสามารถในการให้เหตุผลทางคณิตศาสตร์ขั้นสูงที่มีน้ำหนักสูง มันถูกสร้างขึ้นร่วมกันโดย EpochAI โดยมีนักคณิตศาสตร์ชั้นนำมากกว่า 60 คนเข้าร่วม รวมถึงผู้ชนะรางวัล Fields Medal หลายคนและผู้ตั้งปัญหาที่มีประสบการณ์สำหรับการแข่งขันคณิตศาสตร์โอลิมปิกนานาชาติ
ข้อสงวนสิทธิ์: เนื้อหาทั้งหมดในบทความนี้เป็นเพียงความคิดเห็นของผู้เขียนเท่านั้น ไม่ได้มีส่วนเกี่ยวข้องกับแพลตฟอร์มแต่อย่างใด บทความนี้ไม่มีจุดประสงค์เพื่อใช้เป็นข้อมูลอ้างอิงประกอบการตัดสินใจลงทุน
เผื่อคุณอาจชื่นชอบ
ทรัมป์หารือประเด็น TikTok: หากจีนไม่อนุมัติข้อตกลง อาจมีการเรียกเก็บภาษี 100% กับจีน
บัญชี X ของ Gary Gensler ไม่แสดงป้ายสีเทาที่แสดงถึงเจ้าหน้าที่รัฐบาลอีกต่อไป