RAG על קצה המזלג

אז מה זה בעצם RAG?

– ראשי תיבות של Retrieval-Augmented Generation – הוא גישה חשובה בתחום הבינה המלאכותית.
המשמעות: שילוב בין מודל שפה (LLM) שכבר עבר אימון על כמות עצומה של טקסטים, לבין מנוע אחזור מידע חי שמאפשר להביא תוכן עדכני או מותאם-אישית.

כך, ה-AI לא מסתמך רק על מה שנמצא בזיכרון מהאימון, אלא יכול גם “לשלוף” ידע ממקורות חיצוניים בזמן אמת – כמו מאמרים חדשים, דוחות חברה, או מסמכים פנימיים של ארגון.

שימושים עיקריים:

אקדמיה ומחקר – שילוב מאמרים עדכניים שלא הופיעו בזמן האימון.
עולם העסקי – שימוש בדוחות כספיים ומידע פנימי של חברה.
שירותי לקוחות – מענה מבוסס על מאגר מסמכים ייחודי של הארגון.
בריאות ורפואה – שילוב מאגרי מידע רפואיים עדכניים עם הסבר מותאם למטופל.

מאפיינים מרכזיים:

שילוב דינמי: המודל שואל מנוע אחזור, מקבל מסמכים רלוונטיים, ומשלב אותם בתשובה.
דיוק גבוה יותר: מפחית טעויות והלוצינציות בכך שהתשובה מתבססת על טקסט אמיתי.
התאמה אישית: ניתן “להאכיל” את המערכת במסמכים פנימיים או ספציפיים.
עדכניות: אפשרות להביא מידע שלא היה זמין בזמן אימון המודל.

דוגמאות לשאלות:

שאלה אקדמית פשוטה: “מהן השיטות החדשות ביותר לאבחון מוקדם של סרטן?”
→ המודל ישלוף מאמרים עדכניים מ-PubMed וישלב בתשובה.
שאלה עסקית מורכבת: “כיצד דוחות הרבעון האחרון של טסלה משפיעים על התחזיות לשוק הרכב החשמלי?”
→ המודל ישלב מידע מאתרי חדשות פיננסיים ומקורות פנימיים אם קיימים.

משימות לחזרה ותרגול

נסו לשאול את ה-AI שאלה אקדמית ולבדוק אם המקורות עדכניים.
העלו מסמך קצר (כמו תקציר מאמר) ובדקו איך המודל משתמש בו כדי לנסח תשובה.
השוו תשובה רגילה של LLM (ללא אחזור) מול תשובה בשיטת RAG – ונסו לזהות הבדלים.

חומרים נוספים

Hugging Face – “Better RAG 1: Advanced Basics”

פוסט שהוא חלק מסדרה על מימוש מערכות RAG בסביבות מורכבות, כולל מבוא מתקדם לרעיון והמלצות פרקטיות להתמודדות עם אתגרים בתכנון מערכות כאלה. arxiv.org+11huggingface.co+11huggingface.co+11

Hugging Face – “Advanced RAG” (Cookbook)
רשימת תרגולים (notebook) המראה איך לבנות RAG מתקדם המיועד למענה לשאלות על בסיס מאגר ידע מסוים, כולל קוד ודוגמאות להפעלה. community.openai.com+9huggingface.co+9huggingface.co+9
Hugging Face – “RAG vs Fine‑Tuning” (Blog)
הסבר מושקע שמדגיש את ההבדלים בין שתי גישות מרכזיות: RAG מול Fine‑Tuning. המאמר מספק תובנות על יתרונות, חסרונות, ומתי כדאי להשתמש בכל שיטה. medium.com+10huggingface.co+10tomsguide.com+10
פורום הקורס

השיעור הקודם

חזרה לקורס

השיעור הבא

הקובץ הבא הינו מדריך שיעזור לכם ללמוד ולהתנסות בעולם הRAG

how to learn RAG