يتذكر وكيل هيرميس بالفعل عبر الجلسات. يأتي الوكيل مفتوح المصدر من Nous Research مع ملفات الذاكرة المنسقة والبحث عن النص الكامل للجلسة. لكن مشروعًا مجتمعيًا جديدًا يقول إن الذاكرة المدمجة ضحلة جدًا بحيث لا يمكن العمل الجاد عليها. تم إصدار مكتبة جديدة باسم “Memory OS” بموجب ترخيص MIT بواسطة المطور (ClaudioDrews). إنه يكدس ست طبقات من الذاكرة على هيرميس. فهو يضيف قاعدة بيانات متجهة وحقائق منظمة ويكي المعرفة المنسقة تلقائيًا. المشروع جديد ولكن يبدو أنه يتمتع بإمكانات جيدة وتُظهر هندسته المعمارية كيف يمكن وضع طبقات من ذاكرة الوكيل.
نظام تشغيل الذاكرة
نظام التشغيل Memory OS ليس مكونًا إضافيًا من Hermes يمكنك التبديل إليه. إنه نظام متعدد الطبقات يقع بجانب ذاكرة وكيل Hermes الخاصة. يوفر Hermes بالفعل ملفات مساحة العمل وقاعدة بيانات الجلسة. يحتفظ نظام تشغيل الذاكرة بهذه العناصر ويضيف أربع طبقات أخرى فوقها. يتم تشغيل المكدس الكامل محليًا باستخدام Docker وQdrant وRedis وPython 3.11+. وهو يعمل مع أي مزود LLM يدعمه Hermes، بما في ذلك OpenRouter وOpenAI وAnthropic وOllama. يقوم ملف README بتأطيره على أنه “نظام تشغيل ذاكرة”، وليس ميزة واحدة.
الطبقات الست، من الملفات إلى المتجهات
- الطبقة الأولى هي مساحة العمل. فهو يحمل MEMORY.md، وUSER.md، وCREATIVE.md، ويتم حقنه في موجه النظام في كل دورة.
- الطبقة الثانية هي الجلسات. ويستخدم State.db، وهي قاعدة بيانات SQLite مع البحث عن النص الكامل لـ FTS5 عبر سجل المحادثات.
- الطبقة الثالثة هي الحقائق المنظمة. يقوم بتخزين الحقائق الدائمة في Memory_store.db، باستخدام SQLite وHRR وFTS5 وسجل الثقة. وتقوم حلقة الملاحظات بضبط درجات الثقة هذه بمرور الوقت، جنبًا إلى جنب مع حل الكيان.
- الطبقة الرابعة هي القماش، وهي نسخة متشعبة بشدة من البرنامج الإضافي Icarus. تضيف هذه الشوكة استخلاص جلسة مدعومة من LLM عبر البرنامج الإضافي esaradev/icarus. وهو يتعامل مع الاستدعاء عبر الجلسات من خلال 16 أداة، بما في ذلك Fabric_recall و Fabric_write و Fabric_brief.
- الطبقة الخامسة هي قاعدة بيانات المتجهات، المبنية على Qdrant. يستخدم متجهات جيب التمام 4096d بالإضافة إلى البحث المتناثر BM25، وهي طريقة تصنيف على نمط الكلمات الرئيسية.
- Layer 6 عبارة عن LLM Wiki، وهو عبارة عن قبو منظم تلقائيًا للمفاهيم والكيانات والمقارنات. يتم استيعاب هذا الويكي بشكل مستمر مرة أخرى في Qdrant من خلال عملية تسمى wiki-Continue-ingest.
كيف يعمل تدفق الاسترجاع
يستمر التدفق عند قراءة الذاكرة وكتابتها. على pre_llm_callيقوم نظام تشغيل الذاكرة بتشغيل ما يطلق عليه الاستدعاء الجراحي. فهو يستمد من أربعة مصادر في وقت واحد: النسيج، والقدرات، والجلسات، والحقائق. يتم تحديد كل مصدر بواسطة عتبة الصلة قبل أن يصل أي شيء إلى النموذج. يؤدي إلغاء البيانات المكررة لكل جلسة إلى إيقاف ظهور السياق نفسه مرتين. يقوم مرشح التواصل الاجتماعي بتخطي الرسائل التافهة، مثل كلمة “شكرًا” البسيطة. على post_llm_call و on_session_end، يقوم النظام باستخراج الدروس الجديدة والتقاطها تلقائيًا. الهدف المعلن هو كفاءة الرمز، وليس حشو نافذة السياق.
سلسلة التراجع والتنظيف
يستخدم استرجاع الطبقة الخامسة احتياطيًا من أربعة مستويات. فهو يحاول البحث المختلط أولاً، ثم المتجهات الكثيفة، ثم المعجمية، ثم SQLite. إذا فشلت إحدى الطرق أو لم تُرجع أي شيء، فستتولى الطريقة التالية. يحافظ هذا التصميم على عمل الاستدعاء حتى عندما تواجه قاعدة بيانات المتجهات صعوبات. يقوم نظام تشغيل الذاكرة أيضًا بتشغيل ماسح ضوئي أسبوعي للتخلص من الإدخالات القديمة. يدمج الحذف الدلالي ذكريات شبه متطابقة عندما يتجاوز تشابه جيب التمام 0.92. تهدف خطوات التدبير المنزلي هذه إلى منع انتفاخ الذاكرة على مدار أشهر من الاستخدام.
محلي أولاً، وبشكل متعمد
يضع نظام تشغيل الذاكرة نفسه في مواجهة خدمات الذاكرة السحابية مثل mem0 وZep وLetta. هدفها هو أن البنية التحتية للذاكرة يجب أن تعمل على جهازك الخاص. تظل بيانات الذاكرة محلية، بدون اشتراك في الذاكرة. لا تزال مكالمات LLM تذهب إلى أي مزود تختاره. تدعم شركة Hermes نفسها بالفعل ثمانية موفري ذاكرة خارجية، بما في ذلك mem0 وHoncho. نظام تشغيل الذاكرة ليس أحد هؤلاء المزودين الرسميين. إنها عبارة عن مكدس منفصل تم إنشاؤه بواسطة المجتمع على هيرميس مباشرة. بالنسبة للفرق التي لديها قواعد إقامة البيانات، يمكن أن يكون مخزن الذاكرة المحلي مهمًا.
نقاط القوة والقيود
نقاط القوة:
- تصميم ذو طبقات واضحة يفصل بين الملفات والجلسات والحقائق والمتجهات والويكي
- بنية تحتية محلية بالكامل بدون اشتراك في الذاكرة السحابية
- لا يلتزم بمزود الخدمة، ويتوافق مع المرونة التي يتمتع بها وكيل Hermes
- استرجاع فعال للرموز حسب التصميم، عبر المصادر المسورة وإلغاء البيانات المكررة لكل جلسة
القيود:
- جديد تمامًا، مع عدد قليل من الالتزامات
- مكون Icarus الإضافي المتشعب الذي يقول المؤلف إنه غير متوافق مع المنبع
- إعداد أثقل: مطلوب كل من Docker وQdrant وRedis وARQ Worker
- لا توجد معايير منشورة بشأن جودة الاستدعاء أو زمن الوصول أو توفير الرمز المميز
الوجبات السريعة الرئيسية
- نظام تشغيل الذاكرة عبارة عن مكدس تم إنشاؤه بواسطة المجتمع ومرخص من معهد ماساتشوستس للتكنولوجيا (MIT) ويضيف ست طبقات ذاكرة أعلى وكيل Hermes.
- فهو يجمع بين ملفات مساحة العمل، والبحث في جلسة FTS5، والحقائق المسجلة بالثقة، ونسيج Icarus المتشعب، ومتجهات Qdrant، ويكي LLM المنسق تلقائيًا.
- يستمر الاسترجاع
pre_llm_callمع استدعاء مسور ومكرر من أربعة مصادر؛ يتم تشغيل الالتقاطpost_llm_callوon_session_end. - البنية التحتية للذاكرة محلية بالكامل ولا تعتمد على المزود، ولكن مكالمات LLM لا تزال تذهب إلى المزود الذي اخترته.
تحقق من الريبو. أيضا، لا تتردد في متابعتنا على تغريد ولا تنسى الانضمام إلينا 150 ألف+ مل من SubReddit والاشتراك في النشرة الإخبارية لدينا. انتظر! هل أنت على برقية؟ الآن يمكنك الانضمام إلينا على التليجرام أيضًا.
هل تحتاج إلى الشراكة معنا للترويج لصفحة GitHub Repo أو صفحة الوجه المعانقة أو إصدار المنتج أو الندوة عبر الويب وما إلى ذلك؟تواصل معنا
التدوينة تعرف على نظام تشغيل الذاكرة: مكدس ذاكرة مفتوح المصدر مكون من 6 طبقات مبني على أعلى وكيل Hermes ظهر لأول مرة على MarkTechPost.

6 طبقات محلية بالكامل: