Contextual Query Augmentation 整理
1378 words
7 minutes
Contextual Query Augmentation 整理
Contextual_Query_Augmentation
问题
Contextual_Query_Augmentation
标准回答
### 3?空上下文处理策略当检索不到相关文档时,系统需要优雅降级:- **保守策略**:指示模型不要回答(默认行为)- **自定义策略**:通过自定义模板引导模型给出友好提示,避免生成幻觉内容- **混合策略**:允许模型基于自身知识回答,但明确告知信息来源
---
## 面试官追问
### Q1:上下文查询增强和查询重写有什么区别?**A**:- **查询重写**:修改用户查询本身,使其更适合检索(如扩写、缩写、纠错)- **上下文查询增强**:将原始查询与检索到的文档拼接,形成完整的 prompt- **关系**:查询重写发生在检索前,上下文查询增强发生在检索后、生成前
### Q2:如何避免增强后的 prompt 超过 token 限制?**A**:- 对检索到的文档做截断或摘要(保留最相关的片段)- 使用动态窗口,根据可用 token 预算调整注入的文档数量- 采用滑动窗口或重排序,只保留 top-k 最相关的文档
### Q3:上下文查询增强和 RAG 是什么关系?**A**:上下文查询增强是 RAG 流程中的一环。完整 RAG 流程为:查询重写(预检索)向量检索**上下文查询增强**(将查询与检索结果结合)LLM 生成回答
Spring AI 的 `RetrievalAugmentationAdvisor` 封装了这一流程,`ContextualQueryAugmenter` 专门负责增强步骤。
### Q4:如果检索到的文档包含矛盾信息,怎么办?**A**:- 在增强 prompt 中明确要求模型基于"最可信"的信息回答- 使用重排序模型,将高置信度文档放在前面- 让模型在回答中标注信息来源,或明确指出信息冲突
---
## 总结
上下文查询增强是连接检索和生成的桥梁,通过将检索到的文档与用户查询智能结合,显著提升 RAG 系统的回答质量。Spring AI 通过 `ContextualQueryAugmenter` 和空上下文处理机制,提供了灵活的实现方式,可优雅处理检索失败等边界情况。
##
## 关键点
- ```
### 3. 空上下文处理策略当检索不到相关文档时,系统需要优雅降级:- **保守策略**:指示模型不要回答(默认行为)- **自定义策略**:通过自定义模板引导模型给出友好提示,避免生成幻觉内容- **混合策略**:允许模型基于自身知识回答,但明确告知信息来源
---
- **A**:- **查询重写**:修改用户查询本身,使其更适合检索(如扩写、缩写、纠错)- **上下文查询增强**:将原始查询与检索到的文档拼接,形成完整的 prompt- **关系**:查询重写发生在检索前,上下文查询增强发生在检索后、生成前
- **A**:- 对检索到的文档做截断或摘要(保留最相关的片段)- 使用动态窗口,根据可用 token 预算调整注入的文档数量- 采用滑动窗口或重排序,只保留 top-k 最相关的文档
- **A**:上下文查询增强是 RAG 流程中的一环。- 完整 RAG 流程为:查询重写(预检索)向量检索**上下文查询增强**(将查询与检索结果结合)LLM 生成回答
Spring AI 的 `RetrievalAugmentationAdvisor` 封装了这一流程,`ContextualQueryAugmenter` 专门负责增强步骤。
## 备注
- 本文已做格式统一与噪声清理,保留原始语义。- ## 问题
Contextual_Query_Augmentation当检索不到相关文档时,系统需要优雅降级:
- 保守策略:指示模型不要回答(默认行为)
- 自定义策略:通过自定义模板引导模型给出友好提示,避免生成幻觉内容
- 混合策略:允许模型基于自身知识回答,但明确告知信息来源
-
A:
-
查询重写:修改用户查询本身,使其更适合检索(如扩写、缩写、纠错)
-
上下文查询增强:将原始查询与检索到的文档拼接,形成完整的 prompt
-
关系:查询重写发生在检索前,上下文查询增强发生在检索后、生成前
-
A:
-
对检索到的文档做截断或摘要(保留最相关的片段)
-
使用动态窗口,根据可用 token 预算调整注入的文档数量
-
采用滑动窗口或重排序,只保留 top-k 最相关的文档
-
A:上下文查询增强是 RAG 流程中的一环。完整 RAG 流程为: 查询重写(预检索) 向量检索 上下文查询增强(将查询与检索结果结合) LLM 生成回答
Spring AI 的 RetrievalAugmentationAdvisor 封装了这一流程,ContextualQueryAugmenter 专门负责增强步骤。
Share Article
If this article helped you, please share it with others!
Contextual Query Augmentation 整理
https://estars-blog.pages.dev/posts/求职作战室-面经-agent面经-contextual_query_augmentation_整理/ Related Posts Smart
1
Compaction OpenClaw 策略 整理
求职作战室 # Compaction_OpenClaw_策略 ## 问题 Compaction_OpenClaw_策略 ## 标准回答 # 当对话历史太长、裁剪不够用时:Compaction(压缩)及 OpenClaw 策略 **Compaction(
2
Context Engine Abstraction 整理
求职作战室 # Context_Engine_Abstraction ## 问题 Context_Engine_Abstraction ## 标准回答 # OpenClaw 的可插拔 Context Engine:为什么需要抽象? 支持哪些策略? **
3
Embedding Model Selection 整理
求职作战室 # Embedding_Model_Selection ## 问题 Embedding_Model_Selection ## 标准回答 # 在 RAG 中如何选择 Embedding Model(嵌入模型)—— 考虑因素与选型指南 选择 E
4
Tool Calling SpringAI 整理
求职作战室 # Tool_Calling_SpringAI ## 问题 Tool_Calling_SpringAI ## 标准回答 # 什么是工具调用 Tool Calling? 如何利用 Spring AI 实现工具调用? **Tool Callin
5
Vector Search Metrics 整理
求职作战室 # Vector_Search_Metrics ## 问题 Vector_Search_Metrics ## 标准回答 # 向量搜索方法:余弦相似度、欧几里得距离、曼哈顿距离 向量搜索的核心是衡量两个向量的相似程度,三种常见方法各有侧重:
Random Posts Random