文章
37
标签
70
分类
12
主页
时间线
分类
AI
工具效率
Spring
JUC
数据库
网络安全
关于
关于我
备忘录
Supremes
vibe coding
返回首页
搜索
主页
时间线
分类
AI
工具效率
Spring
JUC
数据库
网络安全
关于
关于我
备忘录
vibe coding
发表于
2026-03-19 00:38
|
更新于
2026-03-19 00:39
|
浏览量:
模板页面:
https://variant.com/community
上一篇
dawn-ai
IssuesRAGRAG 召回率偏低 “xxx” 这种很短的人名 query,对 embedding 模型来说语义信息太少 当前 /rag/search 没有关键词精确匹配兜底 阈值 0.7 又偏高 结果就是:明明文本里有“xxx”,但向量相似度没过线,最终返回 0 如果你要这个搜索更符合直觉,最有效的是这三种改法: 把 similarity-threshold 从 0.7 下调到 0.4 到 0.55,先恢复基础召回。 给 /rag/search 增加关键词兜底:向量结果为 0 时,再做一次 content 的精确匹配或 LIKE 检索。 对短 query,尤其是 2 到 6 个字的人名、地名、术语,走混合检索而不是只走向量。 整改方案P0 实现 overlap-text-splitter:由于 springai 自带的 textsplitter 不支持设置 chunk overlap size,需要自实现。 [线程池定制]为 LLM API 调用和 Rerank 模型调用配置专属的“重度 I/O 密集型” Thr...
下一篇
AI-Interview
[!Interview] 项目架构怎么设计? Agent 系统怎么拆分? Planner/Tool/Memory 怎么分层? Memory 怎么搞?短期、长期和用户画像各自怎么处理? 延迟、成本、效果如何平衡?Token 成本、推理延迟、RAG 召回策略怎么权衡? RAG 效果怎么评估?召回率、准确率,线上怎么验证? 高频: Tool Calling Memory RAG LearningAgent & 系统架构 什么是 AI Agent? Agent 和普通 ChatBot 有什么区别? 如何实现多 Agent 协作系统? 什么是 ReAct Agent? AI Chat 系统的整体架构是什么? 如何设计一个 AI 问答系统架构? Agent 如何做任务规划(planning)? Agent workflow 和普通 workflow 有什么区别? Agent 为什么需要 memory? Agent 如何避免无限循环调用工具? RAG 什么是 RAG(R...
Supremes
文章
37
标签
70
分类
12
Follow Me
公告
This is my Blog
最新文章
RAG
2026-04-12 15:15
dawn-ai 企业级 Agent 整改方案
2026-04-03 16:00
dawn-ai 增强点记录
2026-04-03 15:00
dawn-ai
2026-04-01 22:57
vibe coding
2026-03-19 00:38
搜索
数据加载中