技术成熟度评估
参考统一评估矩阵,从功能完备度、工程质量与可运维性三大维度给出客观排名
评估方法
本评估以“能上线、可维护、可扩展”为原则,从功能完备度、工程质量、可运维性三大维度细分 12 个指标打分(0-5),并给出加权综合分与排名。
技术成熟度评估
评估维度与权重
| 大类 | 权重 | 子项 | 说明 |
|---|---|---|---|
| 功能完备度 | 45% | 解析/分块、Embedding、检索策略(ANN/Hybrid/Rerank)、生成增强(多查询/自纠正)、多模态 | 是否覆盖关键能力与可替换性 |
| 工程质量 | 35% | 代码结构、测试覆盖、类型/静态检查、配置分层、文档 | 是否易读、易改、易测 |
| 可运维性 | 20% | 部署脚本、监控日志、可观测性、权限/审计、扩展点 | 是否能在生产稳定运行 |
权重向“生产可用”倾斜:功能再强,如果缺乏监控与权限控制,难以进入企业环境。
评分矩阵(0-5 分)
| 项目 | 功能完备 | 工程质量 | 可运维性 | 加权总分 |
|---|---|---|---|---|
| onyx | 4.5 | 4.5 | 4.8 | 4.6 |
| RAG-Anything | 4.7 | 4.0 | 4.2 | 4.4 |
| LightRAG | 4.6 | 4.2 | 4.0 | 4.3 |
| kotaemon | 4.2 | 4.0 | 4.1 | 4.1 |
| SurfSense | 4.3 | 3.8 | 3.8 | 4.0 |
| Self-Corrective-Agentic-RAG | 4.1 | 3.7 | 3.6 | 3.9 |
| ragflow | 3.9 | 3.9 | 4.2 | 3.9 |
| Verba | 3.8 | 3.8 | 3.8 | 3.8 |
| UltraRAG | 3.6 | 3.6 | 3.5 | 3.6 |
说明:评分基于公开代码与文档可验证项,结合本项目组落地经验进行微调。
关键结论
- onyx:以企业级需求为中心,工作流、权限、审计最完整,适合作为企业知识库基座。
- RAG-Anything:多模态解析与检索能力领先,适合财报/技术手册等图表密集型场景。
- LightRAG:能力最全面,图谱/向量/多后端,适合通用与扩展型需求;工程质量优良。
- kotaemon:最易运营的 UI 平台,适合产品化与运营团队协作。
- SurfSense/CRAG:研究导向,适合探索混合检索、自纠正与代理链路。
典型短板与改进建议
- 文档解析:对复杂 PDF/表格/公式处理薄弱 → 引入 RAG-Anything 的解析链路或 ColPali。
- 监控与告警:多数项目仅有基本日志 → 接入 Prometheus + OpenTelemetry。
- 权限隔离:除 onyx 外实现不一 → 落地 RBAC + 命名空间策略。
选型提示
- 企业内网/合规优先 → onyx
- 多模态文档场景 → RAG-Anything
- 通用与二开友好 → LightRAG
- 快速上线 + 可视化运营 → kotaemon
更多实现细节请参考「Pipeline 节点深度剖析」。