传统与代理RAG,解释清楚! 未来是代理RAG,这是因为传统的RAG设置有一些

JavaEdge聊AIss 2024-12-23 02:12:34

传统与代理RAG,解释清楚! 未来是代理RAG,这是因为传统的RAG设置有一些重大限制......👇 1)检索一次,生成一次。 ↳这意味着,如果检索到的上下文不够或不正确,LLM将无法动态搜索更多信息。 2)无法通过复杂的查询进行推理。 ↳如果查询需要多个检索步骤或CoT(思想链),则传统的RAG是不够的。 3)适应性有限 ↳系统不能根据手头的问题来修改其策略。例如是进行矢量搜索、网络搜索还是调用API。 代理RAG解决了这些问题。 核心思想是在RAG的每个阶段引入代理行为。 代理商可以积极思考任务——计划、调整和迭代以找到最佳解决方案,而不仅仅是遵循一套指示,法学硕士可以实现这一点。 下图说明了代理RAG的工作流程。当您继续阅读时,请参考它...... 步骤1-2)用户输入查询,代理对其进行细化(更正拼写、简化嵌入等) 第3步)另一位代理决定是否需要更多细节。 ↳第4步)如果没有,精炼的查询将发送到LLM。 ↳步骤5-8)如果是,代理选择相关来源(矢量数据库、工具/API、互联网),检索上下文,并将其发送到LLM。 第9步)生成响应。 第10步)最终代理检查答案是否相关。 ↳第11步)如果是,请返回回复。 ↳第12步)如果没有,请从第1步重新开始。这个过程会重复,直到系统提供可接受的答案或承认它无法响应。 这使得RAG更具活力和坚固性。 然而,重要的是要注意,构建RAG系统通常归结为设计偏好和选择。 下图只是代理RAG系统可能拥有的众多蓝图之一。 您可以调整它以适应您的特定用例。 喜欢这个吗?你也应该做我的RAG系列!从构建和优化RAG应用程序到评估性能和制作代理和多模态系统——一切都在这里。 人工智能 软件开发 程序员 编程严选网

0 阅读:0
JavaEdge聊AIss

JavaEdge聊AIss

感谢大家的关注