前端 RAG Pipeline 设计
将检索与生成链路映射为可感知的 UI/交互模型,提升可解释性与可运维性
设计原则
“所见即所得”的检索可解释性:每一步检索/重排/生成都能在前端可视化、可回放、可定位问题。
前端 RAG Pipeline 设计
一、UI ↔ Pipeline 映射
| UI 模块 | 对应节点 | 可观测元素 | 交互 |
|---|---|---|---|
| 数据视图 | parse → chunk → embed | 文档树、块预览、版本号 | 重新解析/回滚 |
| 检索面板 | recall → filter → rerank | 召回来源、过滤条件、重排分数 | 调整权重/策略 |
| 会话区 | synthesize → cite | 上下文片段、引用证据 | 展开/定位原文 |
| 运行监控 | DAG/任务流 | 节点耗时、错误栈、重试 | 回放/导出日志 |
二、交互与状态管理
- 全链路 Request-ID:同一查询跨组件追踪
- 本地缓存最近 N 次查询(便于回放与对比)
- 逐步揭示(Progressive Disclosure):先返回答案,再加载证据/重排细节
三、可视化建议
- 召回解释:展示“向量/关键词/图谱”等多路召回的贡献度(RRF 权重)
- 重排解释:展示 top-k 的重排分数变化曲线
- 证据展示:高亮引用段,支持跳转到原文页/行
四、参考实现
- kotaemon:多索引可视化与 Agent 调试视图
- SurfSense:检索→重排→答案生成的全链路 UI
- onyx:工作流驱动的企业 UI,适合与权限/审计联动
五、落地清单
- 每次查询生成唯一 request_id,并在日志/指标中串联
- 展示召回路径(向量/BM25/图谱),并暴露可调权重
- 为答案附加“引用证据”,点击可定位原文
- DAG 视图展示各节点耗时/重试/失败原因