选型决策矩阵
按应用场景、非功能性指标与技术特性给出可落地的选型路径
如何用这份矩阵
先选场景,再看约束(成本/合规/时效),最后用技术特性做差异化补强。
选型决策矩阵
一、按场景选型
| 场景 | 首选 | 备选 | 备注 |
|---|---|---|---|
| 企业知识库 | onyx | LightRAG + 自研 RBAC | 多租户/审计/工作流是关键 |
| 多模态文档 | RAG-Anything | LightRAG + ColPali | 图表/表格/公式解析 + 融合检索 |
| 代码库问答 | LightRAG | SurfSense | AST 分块 + 混合检索 + 依赖图扩展 |
| 客服问答 | onyx + FAQ | kotaemon | 意图识别/多轮对话/FAQ 混检 |
| 个人知识库 | LightRAG(本地) | Verba | 本地模型 + 轻运维 |
二、按非功能性指标过滤
- 合规/安全(必须):优先 onyx;否则需补齐 RBAC、审计、加密
- 成本限制:优先开源本地模型;Embedding 缓存 + 模型分层
- 上线时效:kotaemon(平台化)、LightRAG(通用基座)
- 可维护性:文档/测试/配置分层更重要(LightRAG/onyx)
三、按技术特性打补丁
| 关注点 | 推荐项目/方案 | 备注 |
|---|---|---|
| Agent 编排 | onyx / kotaemon / LangGraph | 可视化/审计能力 |
| 多租户与安全 | onyx | RBAC、命名空间、审计 |
| 混合检索 | SurfSense / LightRAG | 向量+BM25+Rerank(RRF 融合) |
| 知识图谱 | LightRAG | Neo4j/NetworkX、子图检索 |
| 多后端 | Verba / LightRAG | 可切换存储/索引组件 |
决策流程(实践建议)
- 业务定性:确定场景 + 约束(合规/成本/时效)
- 候选集:从场景矩阵选 1-2 个候选
- 能力补强:用“技术特性”表补齐短板
- 快速试点:1 周内跑通小集群 + 监控
- 评估切换成本:数据格式、索引兼容、模型抽象
结论:如果没有强制合规且希望快速上线,LightRAG 是性价比最高的起点;企业场景建议上 onyx。