كلود فابل 5 لم يتم تقليله. الموجّه فقط شديد الشك.
تُظهر نتائج الاختبارات لكلود فابل 5 نتائج متناقضة — فاختبار يقيّمه على أنه أقل، وآخر يُظهر تحسّنًا. والاختلاف ليس تدهورًا في النموذج، بل توجيه أمان عدواني يعترض الاستفسارات قبل أن يعالجها النموذج. أفاد الباحثون في LMArena ومنصات تقييم أخرى أن نفس الأوامر يتم حظرها أو الرد عليها بحسب قواعد التوجيه.
يُشبه سلوك التوجيه هذا أنماط نشر الذكاء الاصطناعي داخل الشركات، حيث تمنع حواجز الأمان حالات استخدامًا مشروعة. يذكر المطورون أن الاختبارات تمرّ عندما تتجنب الأسئلة صياغات «مُعرّضة للخطر». يبقى النموذج نفسه دون تغيير؛ طبقة التحكم هي التي تقوم بعملية التصفية. تواجه عمليات النشر المؤسسية المشكلة نفسها — فسياسات الأمان تضيف احتكاكًا دون تحسين جودة النموذج.
يلاحظ المراقبون في الصناعة أن هذا يخلق سردية خاطئة مفادها أن النماذج «تصير أغبى». في الواقع، تضيف أنظمة الأمان المركزية لا وضوحًا إلى مؤشرات الأداء. ستُظهر البدائل اللامركزية مخرجات النموذج الخام للتقييم الشفاف والمقارنة العادلة عبر مقدمي الخدمات.
هل يفيد توجيه الأمان أم يضر بتقدم الذكاء الاصطناعي؟ هل يمكن أن يكشف القياس الكمي الشفاف الحقيقة؟ 👇
#LLMBenchmarks #AISafety #ModelTransparency