صورة دراسات حالة ستراتويل

ما هي تقنية التوليد المعزز بالاسترجاع (RAG) وكيف تعمل؟

الاسترجاع المعزز بالتوليد (RAG): كيف تعلّم الذكاء الاصطناعي البحث عن المعلومات؟

للجميعRAG

المشكلة: مستشار عبقري يعتمد على كتاب قديم

تخيّل أنك وظّفت مستشارة شديدة الذكاء. قرأت ملايين الكتب، وتكتب باحترافية عالية، وقادرة على التفكير والتحليل في مختلف المجالات. لكن هناك مشكلة واحدة: توقفت عن التعلّم منذ عامين، وانقطعت تمامًا عن أي معلومات جديدة منذ ذلك الحين. لم تطّلع على مستندات شركتك الداخلية، أو أدلة منتجاتك، أو حتى أخبار الأمس.

هذا بالضبط ما تمثله النماذج اللغوية الكبيرة (LLMs) التي تقف وراء أدوات مثل ChatGPT وClaude. فرغم تدريبها على كميات هائلة من البيانات النصية، تبقى معرفتها محصورة في نقطة زمنية محددة انتهى عندها التدريب.

عندما تسأل هذه النماذج عن سياسة الإجازات في شركتك أو عن عقد تم توقيعه الشهر الماضي، فإنها تواجه خيارين: إما أن تعترف بعدم امتلاكها للمعلومة، أو أن تُنشئ إجابة تبدو مقنعة لكنها غير صحيحة. وتُعرف هذه الظاهرة باسم الهلوسة (Hallucination)، وهي من أبرز التحديات التي تعيق استخدام الذكاء الاصطناعي في البيئات المؤسسية الحساسة.

الحل: امنحها بطاقة دخول إلى المكتبة

يقدم مفهوم Retrieval-Augmented Generation (RAG) حلاً بسيطًا وفعالًا: قبل أن يجيب الذكاء الاصطناعي على السؤال، اسمح له بالبحث عن المعلومات المطلوبة.

بدلاً من الاعتماد على المعرفة المخزنة فقط، يعمل نظام RAG بطريقة تشبه الامتحان المفتوح الكتاب:

  1. يطرح المستخدم سؤالاً

    "كم عدد أيام الإجازة السنوية التي يحصل عليها الموظف الجديد؟"

  2. يقوم النظام بالبحث

    في الخلفية، يبحث النظام داخل مجموعة المستندات التي توفرها المؤسسة، مثل سياسات الموارد البشرية، والأدلة التشغيلية، والتقارير الداخلية، ثم يستخرج المقاطع الأكثر ارتباطًا بالسؤال.

  3. يقرأ الذكاء الاصطناعي المعلومات ثم يجيب

    تُرسل المقاطع المسترجعة مع السؤال إلى النموذج اللغوي، مع توجيه واضح للإجابة استنادًا إلى هذه المعلومات فقط.

  4. تحصل على إجابة مبنية على مصادر فعلية

    لم تعد الإجابة تعتمد على معرفة قديمة أو افتراضات، بل على مستندات المؤسسة نفسها وفي اللحظة التي تم فيها طرح السؤال.

لماذا يُعد RAG مهمًا؟

دقة أعلى

عندما يعتمد الذكاء الاصطناعي على مستندات حقيقية بدلًا من ذاكرة عامة قديمة، تنخفض احتمالية اختلاق المعلومات بشكل كبير. كما تتيح العديد من حلول RAG إرفاق المصادر المستخدمة، مما يسهل التحقق من صحة الإجابات.

معرفة محدثة باستمرار

لا يتطلب تحديث المعلومات إعادة تدريب النموذج بالكامل، وهي عملية مكلفة ومعقدة. يكفي تحديث المستندات في قاعدة المعرفة ليتمكن النظام من استخدامها فورًا.

الخصوصية والتخصص

تبقى مستندات المؤسسة الخاصة داخل بيئتها الآمنة، ولا تصبح جزءًا من بيانات تدريب النموذج. وبهذا يمكن تحويل نموذج عام إلى خبير متخصص في أعمال المؤسسة خلال وقت قصير.

خفض التكاليف

إضافة المعرفة الجديدة من خلال إعادة تدريب النماذج تتطلب موارد حوسبية ضخمة، بينما يحقق RAG النتيجة نفسها تقريبًا بتكلفة أقل بكثير عبر آليات البحث والاسترجاع.

مثال عملي

لنفترض وجود مساعد ذكي لخدمة العملاء في شركة طيران.

إذا لم يكن النظام يستخدم RAG، فقد يقدم معلومات مستندة إلى سياسة أمتعة قديمة لم تعد سارية. أما عند استخدام RAG، فعندما يسأل أحد العملاء:

"هل يمكنني اصطحاب عربة أطفال على متن الطائرة؟"

يقوم النظام أولًا باسترجاع أحدث نسخة من سياسة الأمتعة، ثم يمررها إلى النموذج اللغوي ليبني إجابته عليها مباشرة.

وإذا تغيرت السياسة غدًا، ستتغير الإجابات غدًا أيضًا، دون الحاجة إلى إعادة تدريب النموذج أو انتظار تحديثات جديدة.

باختصار، يمكن وصف RAG بأنه ترقية لذاكرة الذكاء الاصطناعي عبر تزويده بإمكانية الوصول إلى المعرفة عند الحاجة، بدلًا من محاولة إعادة بناء عقله بالكامل.

للمهندسين والمتخصصين التقنيين RAG

نظرة عامة على البنية المعمارية

يتكون مسار عمل RAG عادةً من مرحلتين رئيسيتين:

أولاً: مرحلة الفهرسة (Offline Indexing)

المستندات → تقسيم المحتوى (Chunking) → إنشاء التضمينات (Embeddings) → تخزين المتجهات (Vector Store)

ثانيًا: مرحلة الاسترجاع والتوليد (Online Retrieval & Generation)

استعلام المستخدم → إنشاء تضمين للاستعلام → البحث بالتشابه → اختيار أفضل المقاطع → بناء الـ Prompt → النموذج اللغوي → الإجابة المعتمدة على المصادر

1. إدخال البيانات وتقسيم المحتوى (Ingestion & Chunking)

يتم استخراج النصوص من مصادر متعددة مثل ملفات PDF وصفحات HTML ومستندات Markdown وقواعد البيانات، ثم تقسيمها إلى وحدات أصغر تُعرف باسم Chunks.

ويُعد اختيار استراتيجية التقسيم من أهم القرارات التصميمية في أي نظام RAG:

التقسيم الثابت (Fixed-Size Chunking)

يعتمد على حجم ثابت للمحتوى، مثل 512 رمزًا (Token)، مع نسبة تداخل محددة بين الأجزاء.

الميزة: البساطة وسهولة التطبيق.

التحدي: قد يؤدي إلى فصل الجمل أو الجداول في أماكن غير مناسبة.

التقسيم الدلالي أو الهيكلي (Semantic / Structural Chunking)

يعتمد على العناوين والفقرات والحدود المنطقية للمحتوى.

الميزة: الحفاظ على المعنى والسياق.

التحدي: زيادة التعقيد في التنفيذ.

كما يجب إرفاق بيانات وصفية (Metadata) بكل جزء، مثل المصدر، وتاريخ الإنشاء، والقسم، وصلاحيات الوصول، لدعم التصفية والأمان وإظهار الاستشهادات.

2. التضمينات (Embeddings)

يتم تمرير كل جزء من المحتوى إلى نموذج متخصص لإنشاء Embeddings، وهي تمثيلات رقمية عالية الأبعاد تعكس المعنى الدلالي للنص.

وبذلك تصبح العبارات المتشابهة معنويًا متقاربة رياضيًا داخل فضاء المتجهات، حتى لو اختلفت الكلمات المستخدمة.

فعلى سبيل المثال، سيكون السؤال:

"كيف أعيد تعيين كلمة المرور؟"

قريبًا جدًا من:

"خطوات استعادة كلمة المرور"

رغم اختلاف الصياغة.

3. تخزين المتجهات والبحث (Vector Storage & Search)

يتم تخزين المتجهات داخل قواعد بيانات متخصصة مثل:

  • pgvector

  • Pinecone

  • Weaviate

  • Qdrant

  • Milvus

  • FAISS

عند وصول استعلام جديد، يُنشأ له Embedding باستخدام النموذج نفسه، ثم تُجرى عملية بحث عن أقرب المتجهات دلاليًا باستخدام خوارزميات مثل HNSW.

ولأن البحث المتجهي وحده قد يفشل أحيانًا في العثور على الأكواد أو الأسماء الدقيقة، تعتمد الأنظمة الإنتاجية غالبًا على البحث الهجين (Hybrid Search) الذي يجمع بين البحث الدلالي والبحث النصي التقليدي مثل BM25.

4. إعادة ترتيب النتائج (Reranking)

بعد استرجاع مجموعة أولية من النتائج، يتم تمريرها إلى نموذج أكثر دقة لإعادة ترتيبها بحسب درجة الارتباط الفعلية بالسؤال.

يساعد ذلك في رفع جودة النتائج النهائية واختيار أكثر المقاطع صلة بالسياق المطلوب.

5. بناء الـ Prompt وتوليد الإجابة

تُدمج المقاطع المختارة داخل Prompt منظم يُرسل إلى النموذج اللغوي، على سبيل المثال:

  • أجب باستخدام المعلومات المتاحة فقط.

  • إذا لم تكن المعلومات كافية، صرّح بذلك.

  • أرفق المراجع المستخدمة.

بعد ذلك ينتج النموذج إجابة تستند مباشرة إلى المحتوى المسترجع، مع إمكانية إظهار المصادر للتحقق منها.

6. التقييم وقياس الجودة

تنقسم مؤشرات قياس جودة RAG إلى فئتين رئيسيتين:

مؤشرات الاسترجاع

  • Recall@K

  • Precision@K

  • Mean Reciprocal Rank (MRR)

وهي تقيس مدى نجاح النظام في العثور على المعلومات الصحيحة.

مؤشرات التوليد

  • Faithfulness (مدى التزام الإجابة بالمصادر)

  • Answer Relevance (مدى ارتباط الإجابة بالسؤال)

وتساعد أدوات مثل RAGAS وLangSmith وArize في أتمتة عمليات التقييم والتحليل.

ومن الملاحظ عمليًا أن معظم مشكلات RAG لا تنتج عن النموذج اللغوي نفسه، بل عن ضعف عملية الاسترجاع.

التحديات الشائعة وكيفية معالجتها



التحدي

السبب المحتمل

المعالجة

وجود الإجابة ولكن عدم استرجاعها

اختلاف المصطلحات بين السؤال والمستندات

استخدام البحث الهجين أو إعادة صياغة الاستعلام

نقص السياق في النتائج

تقسيم المحتوى إلى أجزاء صغيرة جدًا

زيادة حجم المقاطع أو استخدام Parent Retrieval

تجاهل النموذج للمحتوى المسترجع

ضعف التعليمات داخل الـ Prompt

تعزيز تعليمات الاستناد إلى المصادر

معلومات قديمة

عدم تحديث الفهرس

إعادة الفهرسة بشكل دوري أو تلقائي

تسرب البيانات بين المستخدمين

غياب التحكم بالصلاحيات

تطبيق تصفية مبنية على Metadata

ما بعد RAG التقليدي

شهد المجال تطورات كبيرة تجاوزت النموذج التقليدي القائم على "التضمين ثم البحث ثم التوليد"، ومن أبرزها:

تحويل الاستعلامات (Query Transformation)

إعادة صياغة الأسئلة أو تقسيمها إلى استفسارات فرعية لتحسين جودة الاسترجاع.

Agentic RAG

يمنح النموذج قدرة اتخاذ القرار بشأن متى يبحث، وما الذي يبحث عنه، وكيف يكرر عملية البحث للوصول إلى إجابة أفضل.

GraphRAG

يبني رسمًا بيانيًا معرفيًا يربط الكيانات والعلاقات داخل المستندات، مما يساعد في الإجابة عن الأسئلة المعقدة التي تمتد عبر مصادر متعددة.

النوافذ السياقية الضخمة (Long Context Models)

رغم توسع النماذج الحديثة لاستيعاب ملايين الرموز، لا يزال RAG أكثر كفاءة من حيث التكلفة والأداء والقدرة على التحقق من المصادر، كما أن الجمع بين التقنيتين يمنح نتائج أكثر قوة.

RAG أم Fine-Tuning

يمكن تبسيط القرار كالتالي:

  • Fine-Tuning يعلّم النموذج سلوكًا جديدًا أو أسلوبًا معينًا في الإجابة.

  • RAG يزوّد النموذج بمعرفة جديدة ومحدثة.

إذا كانت المشكلة في طريقة الإجابة فالحل غالبًا Fine-Tuning.

أما إذا كانت المشكلة في صحة المعلومات فالحل غالبًا RAG.

ولهذا تعتمد معظم الأنظمة المؤسسية المتقدمة على الدمج بين النهجين.

الخلاصة

يحوّل RAG الذكاء الاصطناعي من نظام يعتمد على الذاكرة فقط إلى نظام قادر على الوصول إلى المعرفة عند الحاجة. بالنسبة للمستخدمين، يعني ذلك إجابات أكثر دقة وحداثة وقابلية للتحقق. أما بالنسبة للفرق الهندسية، فيعني أن تحديث المعرفة أصبح مسألة إدارة بيانات ومحتوى، وليس إعادة تدريب نماذج ضخمة.

وهذا التحول يغيّر جذريًا سرعة تطوير حلول الذكاء الاصطناعي المؤسسية، وقدرة المؤسسات على الاستفادة من بياناتها ومعارفها بأقصى قدر من الكفاءة.

الكاتب: Mohamad Arnaout، متخصص في تطوير البرمجيات وتحليل الأعمال في Devista، ويهتم بتصميم حلول تقنية عملية تسهم في تحسين العمليات وتعزيز التعاون وتحقيق قيمة أعمال مستدامة.

هل تحتاج إلى مساعدة في تحويل الأفكار إلى حلول قابلة للتطوير؟

سواء كنت تستكشف منتجًا جديدًا، أو تعمل على تحسين منصة حالية، أو تواجه تعقيدات تقنية، فنحن هنا لمساعدتك.

هل تحتاج إلى مساعدة في تحويل الأفكار إلى حلول قابلة للتطوير؟

سواء كنت تستكشف منتجًا جديدًا، أو تعمل على تحسين منصة حالية، أو تواجه تعقيدات تقنية، فنحن هنا لمساعدتك.