RAG 教學
# 架構
RAG(Retrieval-Augmented Generation; 檢索增強生成)
R - Retrieval (檢索)
資料端: 原始文件經過 Embedding Model 轉為向量,存入 Vector DB。
查詢端: 使用者問題同樣轉為向量,去資料庫進行相似度檢索(Similarity Search)。
A - Augmentation (增強)
組合: 將檢索出來的「外部知識(Context)」與「原始問題(Query)」放入一個 Prompt Template 中。
任務: 這個動作是為了讓 LLM 擁有它原本訓練數據中沒有的特定資訊。
G - Gen
more...