Skip to content

RAG

介绍

是一个结合 信息检索 和 文本生成的技术, 通过实时检索相关文档和信息,并将其作为上下文输入到生成模型中去,从而增强生成内容的 时效性 和 准确性。

RAG存在的三个局限性问题

  1. 切片很粗暴
  2. 检索不精准
  3. 没有大局观

优化方法

检索不精准 --->1.引入重排序模型,按照问题的相关性重新排序 没有大局观 --->2.引入mcp server,这个例子比如一个成绩excle表... 更换上下文token比较大的模型,比如Gemini

AI知识库目前依旧是一个较为复杂的系统性工程,没有银弹式的通用解决方案,具体工程与项目落地,还需要多种工具共同解决,目前有一个公认效果较好的方案,是使用自适应RAG,通过查询类型,自动选择最合适的检索策略,这种方案结合了多种检索方式,提高了知识库的精度

什么叫做自适应RAG