أصدرت Anthropic نموذجين في 9 يونيو 2026: Claude Fable 5 وClaude Mythos 5. وكلاهما ينتميان إلى فئة تسمى “Mythos-class”. تقع هذه الطبقة فوق فئة Opus من حيث القدرة. Fable 5 هو الإصدار الذي يُزعم أنه آمن للاستخدام العام. Mythos 5 هو نفس النموذج مع رفع بعض الضمانات، والاحتفاظ به في إصدار محدود.
كلود فابل 5 و ميثوس 5
نماذج فئة ميثوس هي طبقة من نماذج كلود. إنهم يجلسون فوق فئة Opus في القدرة. الأول كان Claude Mythos Preview، وتم إصداره في أبريل من خلال Project Glasswing.
تشترك Fable 5 وMythos 5 في نفس النموذج الأساسي. الفرق هو الضمانات. تأتي Fable 5 مع مصنفات السلامة للاستخدام العام. تمت إزالة بعض المصنفات في Mythos 5 وتبقى في إصدار محدود.
تعكس الأسماء هذا الانقسام. “الحكاية” تأتي من اللاتينية فابولا، “ما يقال”. وهذا أقرب إلى اليونانية ميثوس. وتميز الضمانات بين النموذجين، لذا فإنهما يحملان أسماء مختلفة.
يصف الفريق الأنثروبي Fable 5 بأنه النموذج الأكثر قدرة الذي تم إصداره على نطاق واسع. إنه يستهدف التفكير المتطلب والعمل طويل المدى. تنص الأنثروبيات على أن قدرات Fable 5 تتجاوز أي نموذج جعلته متاحًا بشكل عام.
يدعم كلا الطرازين نافذة سياق رمز مميز يبلغ 1M بشكل افتراضي. أنها تسمح بما يصل إلى 128 ألف رمز إخراج لكل طلب. السعر هو 10 دولارات لكل مليون رمز إدخال و50 دولارًا لكل مليون رمز إخراج. وهذا أقل من نصف سعر Claude Mythos Preview.
قضية القدرة
التقارير الإنسانية Fable 5 هي أحدث ما توصلت إليه معايير القدرات التي تم اختبارها تقريبًا. يُظهر نتائج قوية في هندسة البرمجيات والعمل المعرفي والرؤية والبحث العلمي. كلما كانت المهمة أطول وأكثر تعقيدًا، زاد تفوقها على نماذج الأنثروبيك الأخرى.
فيما يتعلق بهندسة البرمجيات، اختبر Stripe Fable 5 أثناء الوصول المبكر. أجرى النموذج ترحيلًا على مستوى قاعدة التعليمات البرمجية في قاعدة بيانات روبي مكونة من 50 مليون سطر. بحسب سترايب: استغرق هذا يومًا واحدًا. باليد، كان الفريق يحتاج إلى أكثر من شهرين.
يعد Fable 5 أيضًا أكثر كفاءة من حيث الرمز المميز من نماذج Claude السابقة. في تقييم FrontierCode الخاص بـ Cognition، حصل Fable 5 على أعلى الدرجات بين النماذج الحدودية. وهذا ينطبق حتى في الجهد المتوسط. يختبر التقييم مهام البرمجة الصعبة بموجب معايير قاعدة بيانات الإنتاج.
فيما يتعلق بالعمل المعرفي، تستشهد الأنثروبيك بمعيار هيبيا المالي للاستدلال على المستوى الرفيع. تنشر Fable 5 أعلى الدرجات من أي نموذج هناك. تأتي المكاسب في التفكير المستند إلى المستندات، وتفسير المخططات والجداول، وحل المشكلات.
فيما يتعلق بالرؤية، تصف Anthropic Fable 5 بأنها أحدث ما توصلت إليه التكنولوجيا. يمكنه استخلاص أرقام دقيقة من أرقام علمية مفصلة. يمكنه إعادة بناء الكود المصدري لتطبيق الويب من لقطات الشاشة وحدها. كما أنها تحتاج إلى سقالات أقل من النماذج السابقة. تغلبت Fable 5 على Pokémon FireRed باستخدام الحد الأدنى من أدوات الرؤية فقط.
فيما يتعلق بالذاكرة والسياق الطويل، تظل Fable 5 مركزة عبر ملايين الرموز المميزة. يقوم بتحسين مخرجاته باستخدام الملاحظات الخاصة به. في اللعبة اذبح المستدقة، ساعدته الذاكرة المبنية على الملفات المستمرة ثلاث مرات أكثر من Opus 4.8.
Mythos 5 يحمل ادعاءات العلم. قام خبراء تصميم البروتين الداخلي بتسريع أجزاء من تصميم الدواء بحوالي عشر مرات. تقول Anthropic أيضًا أن Mythos 5 هو نموذجها الأول الذي ينتج باستمرار فرضيات علمية جديدة. فضل العلماء فرضيات البيولوجيا الجزيئية في حوالي 80% من الحالات في مقارنات عمياء.
أجرى Mythos 5 أيضًا أبحاثًا جديدة في علم الجينوم على مدار أسبوع من العمل المستقل إلى حد كبير. لقد قامت بتدريب نموذج مخصص على بيانات الخلية الواحدة التي تغطي 138 نوعًا من الحيوانات. تقول الأنثروبيك أن هذا النموذج تفوق في الأداء على النموذج الحديث الذي نُشر في عام 2013 علومبالرغم من كونها أصغر بـ 100 مرة.
كيفية عمل الضمانات
إن إطلاق نموذج بهذه القدرة ينطوي على مخاطر. بدون ضمانات، يمكن إساءة استخدام قدرات الأمن السيبراني في Fable 5 لإحداث أضرار جسيمة. ولذلك أطلقت أنثروبيك Fable 5 بمجموعة جديدة من المصنفات.
المصنفات هي أنظمة ذكاء اصطناعي منفصلة. يكتشفون سوء الاستخدام المحتمل، بما في ذلك محاولات كسر الحماية. إنها تمنع النموذج الرئيسي من الاستجابة للطلبات التي تم وضع علامة عليها.
عندما تشير مصنفات Fable 5 إلى طلب، تتم معالجة الاستجابة بواسطة Claude Opus 4.8 بدلاً من ذلك. المجالات المغطاة هي الأمن السيبراني، والبيولوجيا والكيمياء، والتقطير. يتم إعلام المستخدمين عند حدوث تراجع.
بالنسبة لعلم الأحياء والكيمياء، تعود Fable 5 إلى Opus 4.8 في معظم الطلبات في الوقت الحالي. تشير الأنثروبيك إلى القلق من أن نفس الاستعلامات ذات الاستخدام المزدوج يمكن أن تؤدي إلى تعزيز الجهات الفاعلة الخبيثة. وهي تخطط لبرنامج وصول موثوق به لعلم الأحياء، مما يمنح الباحثين المعتمدين Fable 5 دون تلك الضمانات.
ضبطت الأنثروبيك هذه الضمانات بشكل متحفظ. في بعض الأحيان سوف يلتقطون طلبات غير ضارة. في المتوسط، يتم تفعيلها في أقل من 5% من الجلسات. تقول Anthropic أن أكثر من 95% من جلسات Fable لا تتضمن أي تراجع على الإطلاق. بالنسبة لتلك الجلسات، يتطابق أداء Fable 5 بشكل فعال مع Mythos 5.
قام الأنثروبيون بتجميع المصنفات على نطاق واسع. لم تنتج مكافأة الأخطاء الخارجية أي عمليات كسر حماية شاملة خلال أكثر من 1000 ساعة. يتيح كسر الحماية الشامل للمستخدم التفاعل مع النموذج كما لو كانت ضماناته غائبة. تشير الأنثروبيك إلى أن AISI في المملكة المتحدة قد أحرزت تقدمًا نحو واحد في فترة اختبار قصيرة.
Mythos 5 هو نفس النموذج مع رفع الضمانات السيبرانية. تصفه أنثروبيك بأنه يتمتع بأقوى قدرات الأمن السيبراني مقارنة بأي نموذج حالي. ويتم نشره من خلال مشروع Glasswing بالتعاون مع حكومة الولايات المتحدة.
حالات الاستخدام
ترتبط هذه القدرات بالعديد من مسارات العمل الملموسة للفرق الفنية:
- ترحيل التعليمات البرمجية على نطاق واسع: الترميز طويل الأفق يناسب عمليات إعادة البناء الكبيرة وعمليات الترحيل عبر الريبو. يوضح مثال الشريط هذا بمقياس 50 مليون سطر.
- خطوط أنابيب الترميز الوكيل: تساعد الدورات الأقل وكفاءة الرمز المميز في تشغيل الوكيل متعدد الخطوات. أبلغ GitHub عن الاستقلالية والموثوقية في مهام البرمجة المعقدة وطويلة الأفق.
- العمل المالي والتحليلي: الاستدلال القوي للمستندات والرسوم البيانية يناسب التحليل المالي على مستوى رفيع. أشارت Hebbia وIMC إلى المكاسب التي تحققت في مهام التفكير وتحليل التداول.
- مهام الرؤية إلى الكود: إعادة بناء المصدر من لقطات الشاشة يناسب إعادة بناء الواجهة الأمامية واستخراج الأشكال. يعمل حزام الرؤية فقط على تقليل الحمل الزائد للأدوات.
- وكلاء البحوث طويلة الأمد: الذاكرة المستمرة عبر ملايين الرموز المميزة تناسب حلقات البحث المتعددة الأيام. أدار Mythos 5 أعمالًا جديدة في علم الجينوم على مدار أسبوع من العمل المستقل إلى حد كبير.
جدول المقارنة: Fable 5 vs. Mythos 5 vs. Opus 4.8
| يصف | كلود فابل 5 | كلود ميثوس 5 | كلود أوبوس 4.8 |
|---|---|---|---|
| الطبقة النموذجية | فئة الأساطير | فئة الأساطير | فئة التأليف |
| النموذج الأساسي | نفس ميثوس 5 | نفس الخرافة 5 | أوبوس 4.8 |
| التوفر | متاح بشكل عام | المحدودة (مشروع غلاسوينغ) | متاح بشكل عام |
| مصنفات السلامة | نشط (السايبر، الحيوي / الكيميائي، التقطير) | تم رفع الضمانات السيبرانية | الضمانات على مستوى التأليف |
| الهدف الاحتياطي | يعود إلى Opus 4.8 | لا ينطبق | لا ينطبق |
| معرف نموذج واجهة برمجة التطبيقات | claude-fable-5 |
claude-mythos-5 |
(معرف Opus الموجود) |
| نافذة السياق | 1 مليون رمز افتراضي | 1 مليون رمز افتراضي | لكل المواصفات Opus |
| ماكس الناتج | 128 ألف رمز/طلب | 128 ألف رمز/طلب | لكل المواصفات Opus |
| سعر الإدخال (لكل مليون) | 10 دولارات | 10 دولارات | (حسب أسعار Opus) |
| سعر الإخراج (لكل مليون) | 50 دولارًا | 50 دولارًا | (حسب أسعار Opus) |
| وضع التفكير | للتكيف فقط، دائمًا قيد التشغيل | للتكيف فقط، دائمًا قيد التشغيل | شكلي |
| الاحتفاظ بالبيانات | 30 يومًا (النموذج المغطى) | 30 يومًا (النموذج المغطى) | الخيارات القياسية |
ملحوظة: لم يتم تفصيل المواصفات والأسعار المحددة لـ Opus 4.8 في مصادر إطلاق Fable 5. ويحدد الجدول تلك الخلايا وفقًا لذلك.
الوجبات السريعة الرئيسية
- تشترك Fable 5 وMythos 5 في نموذج أساسي واحد؛ الضمانات هي الفرق الوحيد.
- التقارير الإنسانية Fable 5 هي أحدث ما توصلت إليه معايير القدرات التي تم اختبارها تقريبًا.
- تعود مصنفات Fable 5 إلى Opus 4.8 ويتم تشغيلها في أقل من 5% من الجلسات.
- يقدم كلا النموذجين نافذة سياق رمزية تبلغ مليون رمز عند إدخال 10 دولارات وإخراج 50 دولارًا لكل مليون رمز.
- يظل Mythos 5 مقتصرًا على مشروع Glasswing؛ الخرافة 5 متاحة بشكل عام عبر المنصات الرئيسية.
| سرك | المؤلف / المشاركة | سمة | يصل | المشاعر |
|---|
تحقق من التفاصيل الفنية، مستندات و تحليلات المشاعر من مجتمع الذكاء الاصطناعي. أيضا، لا تتردد في متابعتنا على تغريد ولا تنسى الانضمام إلينا 150 ألف+ مل من SubReddit والاشتراك في النشرة الإخبارية لدينا. انتظر! هل أنت على برقية؟ الآن يمكنك الانضمام إلينا على التليجرام أيضًا.
هل تحتاج إلى الشراكة معنا للترويج لصفحة GitHub Repo أو صفحة الوجه المعانقة أو إصدار المنتج أو الندوة عبر الويب وما إلى ذلك؟ تواصل معنا
