Przejdź do zawartości

Retrieval-augmented generation

Z Wikipedii, wolnej encyklopedii

Generowanie wspomagane wyszukiwaniem[1], ang. retrieval-augmented generation[2][3] (RAG) – technika umożliwiająca modelom GenAI wyszukiwanie i włączanie nowych zewnętrznych informacji[4][5]. RAG modyfikuje zapytania do dużego modelu językowego tak aby odpowiadał on na zapytania użytkowników, wraz z referencją do dołączonych dodatkowych danych[6]. Umożliwia to LLM-om korzystanie z informacji specyficznych dla danej dziedziny i/lub zaktualizowanych[6] [7].

Oprócz zwiększenia jakości zwracanych danych, RAG pozwala również LLM-om na uwzględnianie w swoich odpowiedziach odniesień do źródeł, dzięki czemu użytkownicy mogą weryfikować informacje poprzez analizę cytowanych dokumentów lub oryginalnych źródeł. Dzięki temu możliwe jest uzyskanie większej przejrzystości, ponieważ użytkownicy mogą sprawdzać pobrane treści, aby zapewnić ich dokładność i trafność[8][9].

Termin RAG został po raz pierwszy wprowadzony w 2020 r. przez Meta[10][11]. Istnieją biblioteki umożliwiające wdrożenie technik RAG wraz z ich specyficznymi funkcjonalnościami[12].

Proces

[edytuj | edytuj kod]
Uproszczony schemat schematu wzbogacania danych z wykorzystaniem LLM

RAG składa się z czterech elementów[13]:

  1. Indeksowanie – dodatkowe dane dostarczane do systemu są osadzane i zapisywane w bazie danych[14].
  2. Retrieval (pol. pobieranie) – pobieranie najbardziej odpowiednich dokumentów dla danego zapytania
  3. Augmentation (pol. uzupełnianie) – przekazanie pobranych informacji do LLMa za pomocą inżynierii podpowiedzi
  4. Generation (pol. generowanie) – LLM zwraca odpowiedź w oparciu o wzbogacone dane i zapytanie użytkownika[15]. Niektóre modele mogą korzystać z innych technik wzbogacania odpowiedzi[13]

Przypisy

[edytuj | edytuj kod]
  1. Leandro von Werra, Lewis Tunstall, Thomas Wolf, Przetwarzanie języka naturalnego z wykorzystaniem transformerów: budowanie aplikacji językowych za pomocą bibliotek Hugging Face, Grzegorz Werner (tłum.), Gliwice: Helion, 2024, s. 206, ISBN 978-83-289-0711-9 [dostęp 2025-04-16].
  2. Krzysztof Klimczyk, Aplikacja wspomagająca tworzenie serwerów urządzeń w środowisku Tango Controls [online], 25 listopada 2024 [dostęp 2025-04-12].
  3. Adam Karolewski, Sztuczna inteligencja w poszukiwaniu wiedzy, „Biuletyn EBIB” (213), 22 maja 2024, ISSN 1507-7187 [dostęp 2025-04-12] (pol.).
  4. What is retrieval-augmented generation (RAG)? [online], IBM Research, 9 lutego 2021 [dostęp 2025-04-12] (ang.).
  5. Maciej Kaszkowiak, RAG, czyli jak rozmawiać z naszymi dokumentami? [online], kaszkowiak.org, 20 grudnia 2023 [dostęp 2025-04-12] (pol.).
  6. a b Why Google's AI Overviews gets things wrong. MIT Technology Review, 31 May 2024. [dostęp 7 March 2025].
  7. Rahul Singhal: The Power Of RAG: How Retrieval-Augmented Generation Enhances Generative AI. Forbes, Nov 30, 2023.
  8. Tianyu Gao i inni, Enabling Large Language Models to Generate Text with Citations, arXiv, 31 października 2023, DOI10.48550/arXiv.2305.14627 [dostęp 2025-04-12].
  9. Kevin Wu i inni, How well do LLMs cite relevant medical references? An evaluation framework and analyses, arXiv, 3 lutego 2024, DOI10.48550/arXiv.2402.02008 [dostęp 2025-04-12].
  10. Patrick Lewis i inni, Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, arXiv, 12 kwietnia 2021, DOI10.48550/arXiv.2005.11401 [dostęp 2025-04-12].
  11. Rahul Singhal, The Power Of RAG: How Retrieval-Augmented Generation Enhances Generative AI [online], Forbes [dostęp 2025-04-12] (ang.).
  12. Xiaohua Wang i inni, Searching for Best Practices in Retrieval-Augmented Generation, arXiv, 1 lipca 2024, DOI10.48550/arXiv.2407.01219 [dostęp 2025-04-13].
  13. a b Penghao Zhao i inni, Retrieval-Augmented Generation for AI-Generated Content: A Survey, arXiv, 21 czerwca 2024, DOI10.48550/arXiv.2402.19473 [dostęp 2025-04-12].
  14. Understanding Retrieval-Augmented Generation: Part 1 [online], www.bentoml.com [dostęp 2025-04-12] (ang.).
  15. Patrick Lewis i inni, Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, arXiv, 12 kwietnia 2021, DOI10.48550/arXiv.2005.11401 [dostęp 2025-04-13].