📄️ 分块策略概述
分块策略是 KnowFlow 知识库系统的核心功能之一,它决定了如何将长文档切分成适合检索和理解的文本片段。合理的分块策略能够显著提升知识库的检索准确率和问答质量。
📄️ 智能分块 (Smart)
智能分块是 KnowFlow 的默认分块策略,它基于 Markdown 抽象语法树(AST)进行智能切分,在保持语义完整性的同时控制块的大小。适用于大多数文档场景。
📄️ 标题分块
标题分块是一种严格按照文档标题层级进行切分的分块策略。它完全遵循文档的逻辑结构,不考虑块大小限制,确保每个块都是语义完整的章节或段落。
📄️ 父子分块
父子分块是一种两级层次结构的分块策略,通过创建小的子块和大的父块,实现检索精度和上下文完整性的完美平衡。
📄️ 正则分块 (Regex)
正则分块是一种基于自定义正则表达式模式进行切分的灵活分块策略。它提供了最大的自由度,适合处理特殊格式的文档或需要自定义切分规则的场景。