Deeptoai RAG系列教程

前端 RAG Pipeline 设计

将检索与生成链路映射为可感知的 UI/交互模型,提升可解释性与可运维性

设计原则

“所见即所得”的检索可解释性:每一步检索/重排/生成都能在前端可视化、可回放、可定位问题。

前端 RAG Pipeline 设计

一、UI ↔ Pipeline 映射

UI 模块对应节点可观测元素交互
数据视图parse → chunk → embed文档树、块预览、版本号重新解析/回滚
检索面板recall → filter → rerank召回来源、过滤条件、重排分数调整权重/策略
会话区synthesize → cite上下文片段、引用证据展开/定位原文
运行监控DAG/任务流节点耗时、错误栈、重试回放/导出日志

二、交互与状态管理

  • 全链路 Request-ID:同一查询跨组件追踪
  • 本地缓存最近 N 次查询(便于回放与对比)
  • 逐步揭示(Progressive Disclosure):先返回答案,再加载证据/重排细节

三、可视化建议

  • 召回解释:展示“向量/关键词/图谱”等多路召回的贡献度(RRF 权重)
  • 重排解释:展示 top-k 的重排分数变化曲线
  • 证据展示:高亮引用段,支持跳转到原文页/行

四、参考实现

  • kotaemon:多索引可视化与 Agent 调试视图
  • SurfSense:检索→重排→答案生成的全链路 UI
  • onyx:工作流驱动的企业 UI,适合与权限/审计联动

五、落地清单

  • 每次查询生成唯一 request_id,并在日志/指标中串联
  • 展示召回路径(向量/BM25/图谱),并暴露可调权重
  • 为答案附加“引用证据”,点击可定位原文
  • DAG 视图展示各节点耗时/重试/失败原因