مهندسو Ant يعكسون كود Claude: كشف خط أنابيب القرار الرباعي في وضع Auto وآلية مصنف السلامة

BlockBeatNews

وفقًا لمراقبة 1M AI News، قام مهندس مجموعة Ant، مؤلف إطار العمل Umi.js، عكس هندسة مصدر Claude Code 2.1.81، واستعاد بشكل كامل ما يحدث بعد الضغط على وضع التشغيل التلقائي. الاكتشاف الرئيسي: كل استدعاء للأداة يمر عبر خط أنابيب قرار من أربع طبقات، ولا يتم استدعاء مصنف AI مستقل إلا عندما تعجز الثلاث طبقات الأولى عن الحكم.

خط أنابيب القرار الأربع هو: الطبقة الأولى تفحص قواعد الأذونات الموجودة، وإذا تم المطابقة يتم السماح مباشرة؛ الطبقة الثانية تحاكي وضع acceptEdits (أي مستوى الأذونات المسموح بتحرير الملفات)، وإذا تم المرور من خلاله، فهذا يدل على انخفاض المخاطر، ويتم تخطي المصنف؛ الطبقة الثالثة تفحص قائمة السماح للأدوات للقراءة فقط (Read، Grep، Glob، LSP، WebSearch، وغيرها)، وهذه الأدوات لا تعدل أي حالة، وتُسمح بدون قيد؛ إذا لم يتم تلبية أي من ذلك، يتم الانتقال إلى الطبقة الرابعة، حيث يتم إرسال طلب API مستقل إلى Claude Sonnet لإجراء تصنيف أمني.

التفاصيل الرئيسية لتصميم المصنف تشمل: استخدام Sonnet دائمًا بدلاً من Opus، وهو توازن بين التكلفة والكمون؛ ضبط درجة الحرارة على 0 لضمان إخراج حتمي؛ يُعرف المصنف بأنه “مراقب أمني لوكيل البرمجة الذاتي AI”، لحماية ثلاث فئات من المخاطر (حقن الكلمات المفتاحية، انتشار النطاق، الضرر غير المقصود)؛ يتم حقن ملف تكوين CLAUDE.md الخاص بالمستخدم في سياق المصنف، كأساس لفهم نية المستخدم.

قواعد الاعتراض تغطي أكثر من 22 فئة، بما في ذلك الدفع القسري، الدفع المباشر إلى الفرع الرئيسي، تحميل وتنفيذ رمز خارجي، النشر الإنتاجي، تسرب البيانات، تعديل الأذونات ذاتيًا، إنشاء ثغرات تنفيذ رمز عن بعد، تسريب الاعتمادات، وغيرها. أما الاستثناءات فهي 7 فئات: مفاتيح مشفرة مدمجة للاختبار، عمليات الملفات المحلية داخل دليل العمل، طلبات GET للقراءة فقط، تثبيت الاعتمادات المصرح بها، تثبيت أدوات السلسلة الرسمية، قراءة بيانات الاعتماد وإرسالها إلى مزود الخدمة المستهدف، ودفع التغييرات إلى الفرع الحالي.

هناك أيضًا آلية فاصل: بعد 3 مرات رفض متتالية أو 20 رفضًا مجمعة، يتم تقليل النظام إلى وضع التأكيد اليدوي؛ في وضع headless، يتم إيقاف الوكيل مباشرة. عند عدم توفر المصنف، يتم التحكم بواسطة علامة ميزة إما بـ “fail-closed” (رفض مباشر) أو “fail-open” (التراجع إلى التأكيد اليدوي).

وفي وضع التشغيل التلقائي، يتم التحكم في تردد حقن كلمات التحذير بشكل دقيق: يتم حقنها مرة واحدة كل 5 حوارات، وفي دورة الحقن الأولى من كل 5، يتم إدراج نسخة كاملة (حوالي 800 كلمة، تتضمن أوامر مثل “التنفيذ الفوري، تقليل المقاطعة، العمل أفضل من التخطيط”)، بينما الـ4 مرات الأخرى تكون نسخة مختصرة، لتحقيق توازن بين استهلاك سياق الحوار واستقرار السلوك.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات