RAG for biological models
RAG for biological models
What is RAG?
Retrieval-Augmented Generation (RAG) 技术,中文名是检索增强生成,RAG通过检索获取相关的知识并将其融入Prompt,让大模型能够参考相应的知识从而给出合理回答。因此,可以将RAG的核心理解为“检索+生成”,前者主要是利用向量数据库的高效存储和检索能力,召回目标知识;后者则是利用大模型和Prompt工程,将召回的知识合理利用,生成目标答案。主要的优势是方便地将外部知识注入大模型。好处有:
- 扩展性强,外部数据直接更新到数据库而不用重新训练或者微调模型本身
- 结果可控,减少出现幻觉,因为检索到结果直接对应了最终生成的结果
- 可解释性强
- 定制能力,数据安全能力强
在使用中,主要分为两个阶段:
- 数据准备阶段:数据提取 » 文本分割 » 向量化(embedding)» 数据入库
- 应用阶段:用户提问 » 数据检索(召回) » 注入Prompt » LLM生成答案
How to use it in biological models?
TBD