# 7-Introduction To RAG(Retrieval-Augmented Generation?) In Hindi

## Метаданные

- **Канал:** Krish Naik Hindi
- **YouTube:** https://www.youtube.com/watch?v=DKg6XUnclm8
- **Дата:** 01.09.2025
- **Длительность:** 22:54
- **Просмотры:** 6,827
- **Источник:** https://ekstraktznaniy.ru/video/29529

## Описание

Retrieval-Augmented Generation (RAG) is the process of optimizing the output of a large language model, so it references an authoritative knowledge base outside of its training data sources before generating a response. Large Language Models (LLMs) are trained on vast volumes of data and use billions of parameters to generate original output for tasks like answering questions, translating languages, and completing sentences. RAG extends the already powerful capabilities of LLMs to specific domains or an organization's internal knowledge base, all without the need to retrain the model. It is a cost-effective approach to improving LLM output so it remains relevant, accurate, and useful in various contexts.
-------------------------------------------------------------------------------------------------------
Check out the entire Generative AI and Agentic AI Playlist
https://www.youtube.com/watch?v=-YTDdSByK6s&list=PLTDARY42LDV567lWN_5BtoVGjMFKbthGu

## Транскрипт

### Segment 1 (00:00 - 05:00) []

हेलो गाइस, माय नेम इज कृष्ण नायक एंड वेलकम टू कृष्णा नायक हिंदी YouTube चैनल। सो गाइस, हम लोग अपना जनरेटिव एआई और एजेंटिक एआई प्लेलिस्ट सीरीज को कंटिन्यू करेंगे। ऑलरेडी हमारा जो पिछला वीडियो था वो था विद रिस्पेक्ट टू टूल्स विद लैंग चेन इंटीग्रेट एलएलएम टूल्स। और ये सारे ट्यूटोरियल्स अगर आप फॉलो कर रहे हैं कृष्णाक हिंदी YouTube चैनल में जाके प्लेलिस्ट में आप देख सकते हैं। अब इस स्पेसिफिक वीडियो में हम लोग बात करने वाले हैं रैक के बारे में। ठीक है? और रैक क्या होता है? रिट्रीवल आर्गुममेंटेड जनरेशन। अब यह जो रैक का टॉपिक है, यह बहुत ही इंपॉर्टेंट टॉपिक है क्योंकि अभी के टाइम में सारे इंडस्ट्रीज में स्पेसिफिकली रैग यूज हुआ जा रहा है। कोई भी प्रोजेक्ट्स आप बात करिए जेनेटिव एआई हो, एजेंटिक एआई हो, एव्री कंपनीज़ कोई भी स्टार्टअप हो, वह लोग फोकस कर रहे हैं कि हम लोग रैग स्पेसिफिक एप्लीकेशन बनाएं। तो मेरा मेन एम यह होगा कि रैग को मैं बहुत ही अच्छी तरीके से पढ़ाऊं क्योंकि सारे इंटरव्यू्यूज में भी रैक के बारे में पूछा जाता है। ठीक है? तो और एक और चीज बहुत सारे लोग बोलेंगे क्रिश आप इतना लेट से क्यों वीडियोस डाल रहे हैं? आप यह समझिए गाइस मैं एक स्टार्टअप बना रहा हूं। ठीक है? और वो एक स्टार्टअप होगा स्पेसिफिकली वेरीेंट फॉर डेवलपर्स। काफी डेवलपर्स को हेल्पफुल होगा और मैं उसमें काफी ज्यादा बिजी हूं। इसीलिए मैं ज्यादा वीडियोस नहीं डाल पा रहा हूं उसके खातिर है ना बट ये नहीं है कि मैं आप लोगों को भूल गया हूं मैं डेफिनेटली और वीडियोस डालते रहूंगा और जैसे-जैसे मेरा स्टार्टअप का वो आईडिया इंप्लीमेंटेशन स्टेज में अभी जैसे इंप्लीमेंट हो जाएगा उसके बाद तो मेरे को फुल फ्लेज YouTube वीडियोस ही बनाना है। ठीक है ना? तो आप मेक श्योर करिएगा आप ये सीरीज फॉलो करिएगा और मैं मेक श्योर करूंगा कि आपको बहुत ही अच्छी तरीके से सारा चीज मैं पढ़ाऊं। ठीक है? तो चलिए शुरू करते हैं। अब यहां पर हम लोग बात करेंगे रिट्रीवल आर्गुमेंटेड जनरेशन। दैट इज नथिंग बट रैग। हमारा मेन एम इस स्पेसिफिक वीडियो में ये होगा कि रैग क्या होता है? क्यों यूज़ करते हैं हम लोग रैग? रैग कैसे काम करता है? वो सारी चीजों के बारे में मैं स्टेप बाय स्टेप बात करता हूं। तो पहले हम लोग रैग से जाने से पहले एक डेफिनेशन समझते हैं कि रिट्रीवल आर्गुमेंटेड जनरेशन या रैग एप्लीकेशन का मतलब क्या होता है? तो यहां पर आप क्लियरली देख सकते हैं। यहां पर मैं एक डेफिनेशन लिखा हूं। यह एडब्ल्यूएस में अवेलेबल था। एडब्ल्यूएस के डॉक्यूमेंटेशन में डेफिनेशन अवेलेबल था। मैं एलएलएम से नहीं जनरेट किया हूं। तो रिट्रिवल ऑर्गमेंटेड जनरेशन इज़ द प्रोसेस ऑफ ऑप्टिमाइजिंग द आउटपुट ऑफ अ लार्ज लैंग्वेज मॉडल। तो ये आप ये सेंटेंस को बहुत ही ध्यान से याद रखिएगा क्योंकि मैं इसके रिलेटेड ही आपको समझाऊंगा। इट इज अ प्रोसेस ऑफ ऑप्टिमाइजिंग द आउटपुट ऑफ अ लार्ज लैंग्वेज मॉडल सो दैट इट रेफरेंसेस एन ऑथरेटिव नॉलेज बेस आउटसाइड ऑफ इट्स ट्रेनिंग डेटा। ठीक है? तो ये दो पॉइंट आपको याद रखना है। एक है इट इज़ ऑप्टिमाइजिंग द आउटपुट ऑफ अ लार्ज लैंग्वेज मॉडल। सो इट रेफरेंसेस एन ऑथरेटिव नॉलेज बेस आउटसाइड्स ऑफिस ट्रेनिंग डेटा सोर्स। तो एक और नॉलेज बेस होगा जो ट्रेनिंग डेटा के अलावा होगा। बिफोर जनरेटिंग अ रिस्पांस राज लैंग्वेज मॉडल्स आर ट्रेंड ऑन वाश वॉल्यूम ऑफ डेटा एंड यूज़ बिलियंस ऑफ पैरामीटर टू जनरेट ओरिजिनल आउटपुट ऑफ टास्क लाइक आंसर क्वेश्चनिंग ट्रांसलेटिंग रैक आल्सो एक्सटेंड्स द ऑलरेडी पावर कैपेबिलिटीज़ ऑफ़ एलएलएम्स टू स्पेसिफिक डोमेन और ऑर्गेनाइजेशन इंटरनल नॉलेज। ठीक है? ऑल विदाउट द नीड टू रिस्ट्रेंड द मॉडल। तो चलिए हम लोग समझते हैं यह क्यों कॉस्ट इफेक्टिव सॉल्यूशन है और यह सारा चीजें। अभी जितना भी आप यह डेफिनेशन पढ़े हैं ना मैं इसको और आसानी से आपको पढ़ाने की कोशिश करूंगा। देखिए अभी तक हम लोग ने कितना भी एप्लीकेशन देखें हम लोग क्या कर रहे थे? हम लोग एक जनरेटिव एआई एप्लीकेशन बना रहे थे। अब इस स्पेसिफिक जनरेटिव एआई एप्लीकेशन में क्या होता है कि आपके पास एक एलएलएम मॉडल है। ठीक है? आपके पास एक एलएलम मॉडल है। तो क्या करता है यूजर? एक यूजर यहां पर है। ठीक है? लेट्स से मैंने यूजर बना दिया इसे। ये यूजर क्या करेगा? स्पेसिफिकली एक क्वेरी डालेगा। राइट? तो जनरेटिव एआई एप्लीकेशन में क्या होता है? यूजर क्या करता है कि एक क्वेरी लिखता है। लेट्स से ये स्पेसिफिक क्वेरी है। ये क्वेरी है समथिंग लाइक व्हाट इज़ एi? ठीक है? व्हाट इज़ एआई? अब इस स्पेसिफिक क्वेरी के हिसाब से हम लोग क्या करते हैं? जेनेटिव एआई एप्लीकेशन में इस क्वेरी को हम लोग कंबाइन करते हैं एक प्र्प्ट के साथ। राइट? अब ये प्र्प्ट क्या करेगा? ये प्र्प्ट स्पेसिफिकली एक इंस्ट्रक्शन है एलएलएम को कि ये एलएलएम कैसे बिहेव करेगा। राइट? मैं एलएलएम को बोल सकता हूं हे एक्ट एज अ डेटा साइंटिस्ट एंड ट्राई टू आंसर द अ ट्राई टू आउटपुट और ट्राई टू गिव एन आउटपुट बेस्ड ऑन द क्वेरी फ्रॉम द यूजर। ठीक है? तो ऐसे टाइप के प्र्प्ट्स होते

### Segment 2 (05:00 - 10:00) [5:00]

हैं। ये प्र्प्ट क्या है? ये प्र्प्ट एक इंस्ट्रक्शन है कि मेरा एलएलएम कैसे काम करने वाला है। बहुत ही सिंपल तरीके से। और जैसे ही ये क्वेरी और प्र्प्ट कंबाइन होगा और एलएलएम को जाएगा हमको फाइनली क्या होगा? हम लोगों को एक आउटपुट आ जाएगा। ठीक है? इतना सिंपल सा बात है। तो, यह एक बेसिक जनरेटिव एआई एप्लीकेशन है। जनरेटिव एआई एप्लीकेशनेशंस हैं। ठीक है? बहुत ही सिंपल सा ऐप है। अब इस एलएलएम को हम लोग एडिशनली और क्या कर सकते हैं? इंटीग्रेट कर सकते हैं या बाइंड कर सकते हैं टूल के साथ। राइट? तो यहां पे मैं इसको टूल्स के साथ भी बाइंड कर सकता हूं। ठीक है? और ये सारे एग्जांपल हम लोग ने देख लिया था। अब ये टूल का काम क्या है? कोई ऐसे ऑपरेशंस जो एलएलएम नहीं कर पाता है तो हम लोग ये टूल के ऊपर डिपेंडेंसी रहेंगे। अब यहां पे दो बहुत ही इंपॉर्टेंट सवाल है। ठीक है ना? कि डिसएडवांटेज क्या है स्पेसिफिक एप्लीकेशन का? कि मैं डायरेक्टली ऐसा जनरेटिव एआई एप्लीकेशन यूज़ कर रहा हूं। ठीक है? तो इसका मेन डिसएडवांटेज क्या है? तो डिसएडवांटेजेस के बारे में बात करते हैं या मेजर ड्रॉबैक हैं। मेजर ड्रॉबैक तो उससे आपको समझ में आएगा कि हम लोगों को रैक क्यों यूज करना है। लेट्स से कि यह मेरा एलएलएम मॉडल है और यह मॉडल है जीपीटी5। आपको आई होप आप लोगों को पता होगा। जीपीटी5 अगस्त के फर्स्ट वीक में आया हुआ था। ठीक है ना? अब ये जो भी एलएलएम मॉडल्स होते हैं इनका एक ट्रेनिंग कट ऑफ डेट होता है। ठीक है? तो लेट्स से कि आज है फर्स्ट सितंबर तो शायद यह जीपीटी5 का होगा फर्स्ट वीक ऑफ अगस्त। ठीक है? लेट्स से कि अगर मैं बोलूं ठीक है? इसका ट्रेनिंग कट ऑफ डेट है फर्स्ट अगस्त। मैंने चेक नहीं किया है। बट लेट्स कंसीडर कि मेरा इसका ट्रेनिंग डेट होगा फर्स्ट अगस्त 2025। मतलब इसका मतलब क्या है? इसका मतलब ये है कि जो भी इंटरनेट में अवेलेबल डेटा है बिफोर ऑफ़ अगस्त ऑफ़ फर्स्ट। है ना? वो सारे डेटा से इस मॉडल को हम लोग ने ट्रेन कर लिया। इन मॉडल को ओपन एआई लेट्स से बट आज आपको पता है कि आज है हमारा फर्स्ट सितंबर। ठीक है? तो इसका मतलब क्या है? कि अगर मैं अपने एलएलएम को इस स्पेसिफिक एलएलएम को इन दोनों डेट के बीच के बारे में कोई भी इवेंट्स पूछूं। एनी इवेंट्स अगर मैं समझूं में लेट्स से अभी यूएस ओपन चल रहा है। ठीक है? यूएस ओपन 2025 चल रहा है। अगर मैं बोलूं हे हु हैज़ कम अप टू द क्वार्टर फाइनल्स इन यूएस ओपन इन मेन सिंगल। ठीक है? तो ये एलएलएम ऑब्वियसली आंसर नहीं दे पाएगा क्योंकि ये इवेंट्स का उसको आईडिया ही नहीं है। ठीक है? ये इवेंट्स का ऑब्वियसली आईडिया नहीं है। क्या हो गया है फर्स्ट सप्टेंबर से फर्स्ट अगस्त से फर्स्ट सप्टेंबर तक उनको पता ही नहीं है एलएलएम को क्योंकि वो डेटा से ट्रेन ही नहीं है। ठीक है? तो यहां पर इस सिनेरियो में अगर मैं क्वेश्चन पूछूं कि हु वा हु हैज़ रीच द क्वार्टर फाइनल्स इन मेन सिग्नल्स ये एलएलएम है ना इसको आंसर भी नहीं पता रहेगा ना फिर भी ये कुछ जनरेट कर देगा ये इतना कॉन्फिडेंटली जनरेट कर देगा ना कि ये बोलेगा ठीक है ये आ गया होगा ठीक है ये जनरेट कर देगा आउटपुट अब देखिए जब ये इंफॉर्मेशन है ही नहीं एलएलएम के पास तो ये जनरेट कैसे कर रहा है तो इस सिनेरियो को हम लोग बोलते हैं कि एलएलएम हलसिनेट कर रहा है हलसिनेट कर रहा है। ठीक है? अब एलएलएम को पता नहीं है आंसर फिर भी वह आंसर कर रहा है और वह ऐसा कॉन्फिडेंटली कि भाई आप मान ही लो। ठीक है? तो इसको बोलते हैं हलसिनेशन। यहां पे एलएलएम डेफिनेटली हेलुसनेट कर रहा है। ठीक है? एलएलएम के पास कोई आईडिया ही नहीं है कि क्या है बट फिर भी वो आंसर दिया जा रहा है। ठीक है? ये बहुत ही सिंपल एग्जांपल है। और ये हेलुसिनेशन बहुत ही कॉमन प्रॉब्लम है एलएलएम में क्योंकि एलएलएम नीचे नहीं दिखना चाहता है। राइट? वो अपना पावर दिखाना चाहता है। मैं कुछ भी जनरेट कर सकता हूं। ठीक है? ऐसे-ऐसे स्टैटिस्टिकल इंफॉर्मेशन भी दे देगा ना कि आप सच मान जाएंगे। ठीक है? तो ये है सबसे मेजर ड्रॉबैक ऑफ यूजिंग द सिंपल एलएलएम एंड डायरेक्टली इंटू द जनरेट वीआई एप्लीकेशन। अब दूसरा प्रॉब्लम लेट्स से कि एलएलएम में जो भी ट्रेनिंग होता है ना या इंटरनेट के अवेलेबल डेटा जो पब्लिकली अवेलेबल है वो सारे डेटा पे ट्रेनिंग होता है। बट लेट्स से कि मैं एक कंपनी चलाता हूं। मैं मेरा एक स्टार्टअप है। ठीक है? अब मैं मेरे स्टार्टअप के रिलेटेड ठीक है? यह मेरा स्टार्टअप है। अब यहां पर मेरे स्टार्टअप के रिलेटेड मेरे को कुछ काम करना है। लेट्स से कि यहां मेरे स्टार्टअप में थोड़े ऐसे क्लोज्ड डेटा है। पब्लिक डेटा नहीं है। ठीक है? ऑब्वियसली। अब लेट्स से कि मेरे पास कुछ डाटा है जैसे हो गया एचआर पॉलिसीज़। लेट्स से फाइनेंस पॉलिसीज़। ओके? लेट्स से

### Segment 3 (10:00 - 15:00) [10:00]

रूल्स एंड रेगुलेशंस जो भी कंपनीज़ के पॉलिसीज ठीक है तो यह सारे डाटा है मेरे पास। अब आपको पता है कि ये डाटा पब्लिकली अवेलेबल नहीं होगा और एलएलएम में हम लोग को बेसिकली क्या होगा कि एलएलएम हम लोगों का ये डेटा पब्लिकली भी नहीं करना चाहिए क्योंकि पब्लिक ही कर दिया तो कंपनी का डेटा पब्लिक हो रहा है। राइट? तो एलएलएम को नहीं पता है कि ये क्या होता है। हां जनरिक इंफॉर्मेशन मेरे स्टार्टअप के बारे में पता रहेगा एलएलएम को जो अवेलेबल है इंटरनेट में बट ये जो डेटा है ये बहुत ही प्राइवेट है विद रिस्पेक्ट टू अ स्पेसिफिक कंपनी एंड इट कीप्स ऑन गेटिंग अपडेटेड ये डेटा अपडेटेड होते रहता है। ठीक है? टाइम टू टाइम और ऐसे हर एक कंपनीज़ का अपडेटेड होते रहता है। अब यहां पे मेरा एक प्रॉब्लम स्टेटमेंट है कि भाई आप एक बात बताइए। अगर मेरे को ये वाला डेटा मेरे को एक चैटबॉट एआई असिस्टेंट बनाना है मेरे कंपनी के लिए तो ये वाला डाटा अगर मेरे को यूज़ करना है तो मैं कैसे यूज़ कर पाऊंगा? ठीक है? मैं कैसे मेरे एलएलएम को बोल पाऊंगा कि भाई ये वाला डाटा आप यूज़ करिए और मेरे कंपनीज़ के एंप्लाइजज़ को ये इंफॉर्मेशन दे पाएं। तो यहां पे हम लोग सिंपल तरीके से क्या कर सकते हैं? ठीक है भाई? आप एलएलएम को फाइन ट्यूनिंग कर लीजिए। ठीक है? फाइन ट्यूनिंग मतलब आप ये वाला डेटा को लीजिए और आप एलएलएम को फाइन ट्यूनिंग कर लीजिए। ठीक है? फाइन ट्यूनिंग करके आप अपने हिसाब से एलएलएम को फाइन ट्यून करके आप वो चैटबॉट एआई असिस्टेंट में यूज़ कर लीजिए। अब यह सिनेरियो में यूजली क्या होता है कि कॉस्ट बहुत ही ज्यादा होता है। फाइन ट्यूनिंग इज एन एक्सपेंसिव प्रोसेस। क्यों? क्योंकि आप ये मान के चल लीजिए कि भाई एलएलएम में बिलियंस ऑफ़ पैरामीटर्स होता है। और आप हर एक पैरामीटर को ट्वीक कर रहे हैं। आपको जीपीयूस चाहिए होगा यहां पे। आपको डेटा प्री प्रोसेसिंग चाहिए होगा। आपको डेटा उस तरीके से बनाना पड़ेगा। और आप जब फाइन ट्यूनिंग कर रहे होंगे ना ये एलएलएम बहुत ही टाइम लेता है यूजली बेस्ड ऑन द जीपीओस और एक कॉस्ट इनवॉल्वड होता है। तो कॉस्ट भी है फाइन ट्यूनिंग एक एक्सपेंसिव टास्क भी है और आपको एक्यूरेसी भी उतना अच्छी तरीके से नहीं आता है तो बार-बार आपको फाइन ट्यूनिंग करना पड़ेगा। तो ये एक मेजर अ सबसे मेजर डिसएडवांटेज है विद रिस्पेक्ट टू फाइन ट्यूनिंग। मैं ये नहीं बोल रहा हूं कि फाइन ट्यूनिंग खराब है। फाइन ट्यूनिंग अच्छा चीज है। बट आप इस प्रॉब्लम स्टेटमेंट में सोचिए क्योंकि यहां पे आपका डेटा कंटीन्यूअसली अपडेट होते जा रहा है। राइट? दिस कीप्स ऑन चेंजिंग। ये चेंज होते जा रहा है डेटा। राइट? तो अगर डेटा कंटीन्यूअसली अपडेट हो रहा है तो मेरे को भी फाइन ट्यूनिंग अपडेट करते ही रहना पड़ेगा। राइट? तो ये एक प्रॉब्लम स्टेटमेंट है जहां पे हम लोग बोलते हैं कि भाई यहां पे कॉस्ट डेफिनेटली ज्यादा आएगा। तो इसका सॉल्यूशन क्या है? मैं क्या इसके बदले कुछ और चीज यूज़ कर सकता हूं? और वहीं पे आता है व्हिच इज़ कॉल्ड एज रैग। रैग रिट्रीवल आगुमेंटेड जनरेशन जो फुल फॉर्म मैंने ऊपर लिख दिया है। अब रैक कैसे प्रिवेंट कर रहा है इस चीज को? रैक के केस में क्या होता है ना? बहुत ही सिंपल सा चीज है। देखिए रैक कैसा काम करता है? इस पर्टिकुलर प्रॉब्लम को मैं कैसे सॉल्व करूंगा? लेट्स से कि मेरे पास एक एलएलएम है। ठीक है? ये एलएलएम है। यहां पे मेरा एलएलएम आ गया। यहां पर मेरा यूजर का क्वेरी आ गया। लेट्स से कि यूजर यहां है। अब यूजर क्या किया है? यूजर हमारा क्वेरी डाला है। ठीक है? क्वेरी डाला है। यहां से आउटपुट जनरेट हो रहा है। अब ये जो एलएलएम है ये डायरेक्टली यूजर के क्वेरी से आउटपुट नहीं जनरेट करेगा। दिस विल बी डिपेंडेंट ऑन समथिंग एल्स। राइट? यह किस पर डिपेंडेंट होगा? अब आप समझिएगा। अब आप डेफिनेशन में जाइए। ठीक है? यहां पर रैक इज अ प्रोसेस ऑफ़ ऑप्टिमाइजिंग द आउटपुट ऑफ अ लार्ज लैंग्वेज मॉडल। ये लार्ज लैंग्वेज मॉडल आउटपुट दे रहा है। बट इट रेफरेंसेस एन ऑथरेटिव नॉलेज बेस्ड आउटसाइड इट्स ट्रेनिंग डेटा। तो यहां पे हमारा एक सेपरेट नॉलेज बेस होगा। यहां पे सेपरेट एक नॉलेज बेस होगा। तो यहां पे एक सेपरेट नॉलेज बेस होगा। ठीक है? ये नॉलेज बेस यूजुअली क्या होता है? एक वेक्टर डेटाबेस होता है। लेट्स से कि मैं यहां पे लिख देता हूं वेक्टर डीबी। ठीक है? तो ये मैं नॉलेज बेस क्यों बोल रहा हूं? और ये वेक्टर डीबी कैसे तैयार होता है? लेट्स से कि मेरे पास यहां पे कंपनी का डेटा है। इस कंपनी के डेटा को मैं फर्स्ट स्टेप में रीड करूंगा। ठीक है? तो यहां से मैंने रीड कर दिया। रीड करके मैंने इसको डेटा प्रीपिंग कर दिया। ठीक है? डेटा प्रीपिंग में क्या होगा कि हम लोग ने डेटा को रीड किया, डेटा को चंकिंग किया। राइट? चंक मतलब छोटा-छोटा डॉक्यूमेंट स्ट्रक्चर में हम लोग इसको चंक्स बनाते हैं। इसके बाद हम लोग एक्चुअली अप्लाई करते हैं समथिंग कॉल्ड एज एंबेडिंग्स। ठीक है? तो यहां पे मैं लिख देता हूं एंबेडिंग। अब ये एंबेडिंग क्या है? एंबेडिंग इज अ प्रोसेस ऑफ कन्वर्टिंग टेक्स्ट टू वेक्टर्स। ठीक है? टेक्स्ट टू वेक्टर्स। अब फाइनली जब हम लोग टेक्स्ट टू वेक्टर्स कन्वर्ट

### Segment 4 (15:00 - 20:00) [15:00]

करते हैं, हम लोग ये वेक्टर डीबी में स्टोर कर देते हैं। तो जो भी हमारा कंपनी का डेटा था, अब इस बार हम लोग फाइन ट्यून नहीं कर रहे हैं। हम लोग ये एक डेटा इंजेशन पाइपलाइन यूज़ करके वेक्टर DB के अंदर डाल रहे हैं। राइट? अब ये वेक्टर DB के अंदर क्यों डाल रहे हैं? ठीक है? तो जो भी हम लोगों ने टेक्स्ट टू वेक्टर्स कन्वर्ट कर दिया ये सारे वेक्टर रिप्रेजेंटेशन फॉर्म हम लोग इसके अंदर डाल रहे हैं। द रीज़न वी पुट दिस इंटू द वेक्टर्स अ वेक्टर DB क्योंकि यहां पे हम लोग एल्गोरिदम्स अप्लाई कर सकते हैं। जैसे हो गया सिमिलरिटी सर्च। हम लोग अप्लाई कर सकते हैं समथिंग कॉल्ड एज हाइब्रिड सर्च। ठीक है? तो यह एल्गोरिदम्स हम लोग स्पेसिफिकली अप्लाई कर सकते हैं इन वेक्टर DB टू सर्च द सिमिलर वेक्टर्स। तो अब कैसा होगा ये पाइपलाइन? ये मेरा एक डेटा इंजेशन पाइपलाइन हो गया। ये बहुत ही सिंपल तरीके से एक जो है मेरा कॉमन डेटा इंजेशन पाइपलाइन हो गया। अब दूसरा पाइपलाइन जो होगा यूजर का जैसे क्वेरी आएगा ना ये क्वेरी को हम लोग एंबेडिंग करके द सेम एंबेडिंग जो हम लोग ने यहां पे यूज़ किया है एंबेडिंग करके इसको वेक्टर में कन्वर्ट करेंगे और इस स्पेसिफिक वेक्टर डीबी में क्वेरी करेंगे और जैसे हम लोग क्वेरी करते हैं जो सिमिलर रिजल्ट्स होगा इस क्वेरी और इस वेक्टर से मैच हो के वो रिस्पांस हम लोगों को यहां मिल जाएगा। और इस स्पेसिफिक रिस्पांस को हम लोग बोलते हैं कॉन्टेक्स्ट। ठीक है? तो यहां पर हम लोग को रिस्पांस मिलने वाला है। और ये कॉन्टेक्स्ट अलोंग विद द प्र्प ये एलएलएम लेगा और फाइनली आउटपुट जनरेट करेगा। अब आप इस फ्लो में बहुत ही ईजीली समझ सकते हैं कि एलएलएम डायरेक्टली आउटपुट नहीं जनरेट कर रहा है। एलएलएम एक कॉन्टेक्स्ट के बेसिस में आउटपुट जनरेट कर रहा है। तो जभी भी हमारे पास एक कॉन्टेक्स्ट के बेसिस में आउटपुट जनरेट होगा तो इसको हम लोग स्पेसिफिकली बोलेंगे दिस इज़ एन एक्सटर्नल नॉलेज बेस। यह बहुत ही सिंपल तरीके से अगर मेरे को आंसर करना है ना यह अगर एलएलएम कृष्णायक है ना एलएलएम आउटपुट दे रहा है बेस्ड ऑन सीइंग द बुक कि आपने मेरे को कुछ क्वेश्चन पूछा मैंने एक बुक पे देखा मेरे को आंसर मिला और मैंने वो आंसर को रिफॉर्मेट करके आपके लिए आंसर कर दिया ठीक है तो वो बुक जो है बुक इज़ जस्ट लाइक योर वेक्टर डीबी जहां पे आपने वो इंफॉर्मेशन स्टोर किया है जो कंपनी स्पेसिफिक रहेगा तो अब मैं कुछ भी क्वेरी पूछूं व्हाट इज द फाइनेंस पॉलिसी और व्हाट इज द एचआर पॉलिसीज इन माय कंपनी? पॉलिसी इन माय कंपनी। ठीक है? अब लेट्स से कि अगर हम लोग ने ये नहीं इंप्लीमेंट करता तो एलएलएम जो भी इंफॉर्मेशन है पब्लिकली मेरे कंपनी के बारे में वो भी दे देगा आंसर। बट वो एक्यूरेट ही नहीं होगा। एलएलएम हेलसिनेट करने लग जाएगा। ठीक है? अब उसको रेड्यूस करना है। मैं ये नहीं बोल रहा हूं कि हेलुसिनेशन कंप्लीटली ज़ीरो होगा। बट अब हम लोग ने एक ऐसा पाइप लाइन बनाया है कि हेलुसिनेशन नहीं करेगा। हेलुसिनेशन रेड्यूस होगा क्योंकि हर टाइम अगर वो आंसर वेक्टर डीबी में अवेलेबल है तो उसके रिलेटेड उनके पास कॉन्टेक्स्ट रहेगा और तभी एलएलएम आउटपुट जनरेट करेगा। और इसको कंप्लीटली हम लोग बोलते हैं रैग पाइप लाइन। तो रैक पाइपलाइन में दो इंपॉर्टेंट थिंग हैं। एक है आपका डेटा इंजेक्शन पाइप लाइन और इस पाइप लाइन को जो हम लोग ने ये वाला पाइप लाइन ड्रॉ किया है इसको हम लोग बोलते हैं रिट्रीवल पाइप लाइन। ठीक है? रिट्रीवल पाइपलाइन। अब आपको समझना पड़ेगा रैग जो हम लोग रैग बोलते हैं ना आर ए जी रिट्रीवल ऑर्गुममेंटेड जनरेशन। रिट्रीवल क्या है? रिट्रीवल ये एंटायर प्रोसेस है। देखिए ये पूरा क्वेरी डाला, एंबेडिंग किया और आपने वेक्टर डीबी से कॉन्टेक्स्ट निकाला। ठीक है? ऑर्गुमेंटेशन क्या है? ऑर्गुमेंटेशन मतलब आपने कॉन्टेक्स्ट ऑफ प्र्प को साथ में जोड़ा विद द क्वेरी और आपने एलएलएम को दिया। आपने इसको मॉडिफाई करके एलएलएम को दिया। और फाइनली आपका जो थर्ड स्टेप है जनरेशन जहां पे एलएलएम ने बेस्ड ऑन द कॉन्टेक्स्ट आउटपुट जनरेट किया। तो ये पूरा फंडा होता है रैग एप्लीकेशन का। अभी तो ये बस एक शुरुआत है रैक का। है ना? अभी हम लोग ये पाइप लाइन बहुत ही इन डेप्थ देखेंगे। एज वी गो अहेड। अब मैं बात करता हूं पूरा का पूरा पाइप लाइन के बारे में यहां पे कि क्योंकि ये सारा बहुत ही इंपॉर्टेंट होगा नेक्स्ट वीडियो में। ठीक है ना? तो रैक के बारे में अगर मैं बात करूं दो इंपॉर्टेंट पाइप लाइन है। जैसे मैंने बोला डेटा इंजेक्शन पाइपलाइन रिट्रीवल पाइपलाइन। डेटा इंजेशन पाइपलाइन में स्पेसिफिकली यहां पर आप देख पा रहे हैं कि डाटा इंजेशन है। उसके बाद डेटा पार्सिंग है। उसके बाद एंबेडिंग है। तो यहां पे डेटा इंजेक्शन में क्या होता है कि आपके कंपनी के पास

### Segment 5 (20:00 - 22:00) [20:00]

अलग-अलग टाइप के डेटा होता है। जैसे पीडीएफ, html, आपके पास हो सकता है एक्सेल फाइल, डीबी फाइल। तो अलग-अलग काइंड ऑफ़ फाइल्स हैं। राइट? तो यहां पे डेटा इंजेशन में हम लोग बेसिकली क्या करते हैं? हम लोग ये डेटा को रीड करते हैं। रीड करते हैं या इंजस्ट करते हैं। उसके बाद हम लोग यह डाटा को कैसे कन्वर्ट करते हैं? हम लोग एक डॉक्यूमेंट स्ट्रक्चर में कन्वर्ट करते हैं। ठीक है? डॉक्यूमेंट स्ट्रक्चर हम लोग ये स्ट्रक्चर के बारे में समझेंगे। बहुत ही कॉमन स्ट्रक्चर है क्योंकि कोई भी वेक्टर डीबी में हम लोग को स्टोर करना है ना ये डॉक्यूमेंट स्ट्रक्चर काफी ज्यादा अमेजिंग है क्योंकि इसमें हम लोग मेटाडेटा डाल सकते हैं। इसमें हम लोग एडिशनल इनेशन डाल सकते हैं अलोंग विद द कंटेंट। उसके बाद डेटा पार्सिंग में हम लोग क्या-क्या करेंगे? यहां पे हम लोग एक्चुअली अप्लाई करेंगे चंकिंग स्ट्रेटजीज़। अलग-अलग चंकिंग स्ट्रेटजीस हैं जो आप यूज कर सकते हैं। जैसे रिकर्सिव कैरेक्टर टेक्स स्प्लिटर, यू हैव सिमेंटिक चंकर। अलग-अलग चंकिंग स्ट्रेटजीस हैं। ठीक है? उसके बाद हम लोग आते हैं एंबेडिंग में। अब यहां एंबेडिंग काफी ज्यादा इंपॉर्टेंट है। देखिए एंबेडिंग में बेसिकली क्या कर रहे हैं हम लोग? यहां पे हम लोग कन्वर्ट करते हैं टेक्स्ट टू वेक्टर्स। टेक्स्ट टू वेक्टर्स। तो अगर हमको कोई टेक्स्ट को वेक्टर में कन्वर्ट करते हैं तो हम लोग बेसिकली एंबेडिंग यूज़ करते हैं। तो यहां पे आप अलग-अलग एंबेडिंग मॉडल्स यूज़ कर सकते हैं। अ पब्लिकली ओपन सोर्स भी अवेलेबल है, पेड भी अवेलेबल है, ओपन एआई का अवेलेबल है। तो अलग-अलग एंबेडिंग मॉडल्स यूज़ कर सकते हैं। और जैसे आप ये वेक्टर में कन्वर्ट करते हैं, आप ये सारा को स्टोर करते हैं वेक्टर स्टोर या वेक्टर स्टोर डीबी में। उसके बाद आप इसका एक रिट्रीवर बनाते हैं। ठीक है? रिट्रीवर मतलब एक इंटरफ़ेस है जो वेक्टर स्टोर को क्वेरी करके आउटपुट निकाल सकता है। तो यहां पे यूजर जबभी भी क्वेरी करेगा तो यहां पे आपका जो भी है क्वेरी आएगा। ये क्वेरी जाएगा आफ्टर अपाइंग एंबेडिंग टू द रिट्रीवर। उसका कॉन्टेक्स्ट निकलेगा। एलएलएम को जाएगा। एलएलएम फाइनली आउटपुट जनरेट करेगा। तो ये है स्पेसिफिक पाइपलाइन अबाउट रैग। ठीक है? और मैं ये इसलिए फोकस कर रहा हूं क्योंकि जो हमारा इंप्लीमेंटेशन होगा ना, हम लोग पहला इसमें ही फोकस करेंगे। डेटा इंजेक्शन पाइपलाइन में फोकस करेंगे। देन रिट्रीवल और अलग-अलग टेक्निक्स कैसे इसको ऑप्टिमाइज करते हैं, कैसे इसको परफॉर्मेंस बनाते हैं, परफॉर्मेंस बेटर करते हैं वो सारी चीजों के बारे में डिस्कशन करेंगे। सो आई होप आपको ये वीडियो काफी अच्छा लगा हो। मैंने अब मेरा मेन एम ये क्यों है? क्यों रैग एक बहुत ही इंपॉर्टेंट यूज़ केस है आपको समझाने का। ठीक है ना? हर एक इंडस्ट्रीज में इसकी जरूरत है। तो मैं उसको उस चीज को कवर करना चाहता हूं। सो दैट ये आपके इंटरव्यू के लिए काफी ज्यादा इजी हो जाएगा। सो आई होप यू लाइक दिस पर्टिकुलर वीडियो। दिस वाज़ इट फ्रॉम माय साइड। टारगेट रखते हैं 500 लाइक का टारगेट कर दीजिए और एटलीस्ट 100 कमेंट्स का टारगेट कर दीजिए। और मैं यह सेम एक बढ़िया सा रैग एप्लीकेशन अपने स्टार्टअप के लिए भी बना रहा हूं जो काफी ज्यादा इंपॉर्टेंट यूज़ के सॉल्व कर रहा है फॉर अ डेवलपर। जैसे वह आएगा वो भी मैं अनाउंस करूंगा। सो आई होप आपको यह वीडियो अच्छा लगा हो। दिस वाज़ इट फ्रॉम माय साइड। आई विल सी यू इन द नेक्स्ट वीडियो। थैंक
