Bitget App
تداول بذكاء
شراء العملات المشفرةنظرة عامة على السوقالتداولالعقود الآجلةالتداول بالنسخBotsEarn
أوبن إيه آي تطلق مراقبة CoT لمنع السلوك الضار في النماذج الكبيرة

أوبن إيه آي تطلق مراقبة CoT لمنع السلوك الضار في النماذج الكبيرة

عرض الأصل
Bitget2025/03/10 23:35

أصدرت OpenAI أحدث أبحاثها، مشيرة إلى أن استخدام مراقبة CoT (سلسلة التفكير) يمكن أن يمنع النماذج الكبيرة من نشر الهراء، وإخفاء النوايا الحقيقية والسلوكيات الخبيثة الأخرى. كما أنه يعد أحد الأدوات الفعالة للإشراف على النماذج الفائقة. استخدمت OpenAI النموذج المتطور الجديد o3-mini كموضوع للمراقبة، مع نموذج GPT-4o الأضعف ليعمل كمراقب. كانت بيئة الاختبار مهام البرمجة، حيث يتطلب من الذكاء الاصطناعي تنفيذ وظائف في مكتبات الأكواد لاجتياز اختبارات الوحدة. أظهرت النتائج أن مراقبي CoT أدوا بشكل ممتاز في اكتشاف سلوك "اختراق المكافآت" المنهجي، بمعدل استرجاع يصل إلى 95%، متجاوزًا بكثير نسبة 60% لمراقبة السلوك فقط.

thumbsUp
0

إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.

منصة PoolX: احتفظ بالعملات لتربح
ما يصل إلى 10% + معدل الفائدة السنوي. عزز أرباحك بزيادة رصيدك من العملات
احتفظ بالعملة الآن!