RAG 效果差,问题常常不在模型
企业接入知识库后最常见的反馈是「AI 经常答错」。复盘下来,80% 的问题出在数据,而不是模型。
数据治理是真正的起点
- 文档清洗:去掉过期、重复、互相矛盾的资料
- 分类与权限:不同部门看到不同的知识范围
- 术语表:统一行业黑话与缩写,减少歧义
- 切分策略:按语义而非固定长度切分,召回更准
上线只是开始
知识库需要持续维护:新文档接入、错误反馈闭环、提示词优化。这也是我们提供长期陪跑服务的原因。
企业接入知识库后最常见的反馈是「AI 经常答错」。复盘下来,80% 的问题出在数据,而不是模型。
知识库需要持续维护:新文档接入、错误反馈闭环、提示词优化。这也是我们提供长期陪跑服务的原因。