知识库管理
KnowFlow 提供强大的知识库管理功能,超级管理员可以通过管理菜单对系统中的所有知识库进行统一管理,包括查看、创建、配置、删除知识库,以及管理知识库中的文档和解析状态。
概述
功能特点
- ✅ 知识库全景管理: 查看所有用户创建的知识库,统一管理
- ✅ 知识库创建: 快速创建新的知识库并配置基本参数
- ✅ 文档管理: 查看知识库中的文档列表和解析状态
- ✅ 解析监控: 实时监控文档解析进度和状态
- ✅ 批量操作: 支持批量解析文档和批量管理
- ✅ 权限设置: 配置知识库的访问权限和语言设置
访问权限
权限要求
知识库管理功能仅对超级管理员开放,提供全局知识库管理能力。
功能操作
访问知识库管理
- 使用超级管理员账户登录系统
- 点击主菜单中的"管理"选项
- 在管理菜单中选择"知识库管理"
知识库列表查看
知识库管理页面显示系统中所有知识库的详细信息:
| 字段 | 说明 |
|---|---|
| 知识库名称 | 知识库的显示名称 |
| 描述 | 知识库的详细描述信息 |
| 文档数量 | 知识库中包含的文档总数 |
| 分块数量 | 文档解析后产生的文本分块数量 |
| Token数量 | 所有分块包含的Token总数 |
| 语言 | 知识库的主要语言设置 |
| 权限 | 知识库的访问权限设置 |
| 创建日期 | 知识库的创建时间 |
搜索知识库
搜索功能
在页面顶部的搜索区域可以:
- 按名称搜索: 在搜索框中输入知识库名称关键词
- 实时搜索: 支持输入时实时过滤结果
- 清空搜索: 清空搜索条件显示所有知识库
📚 知识库操作
创建知识库
操作步骤
- 点击页面右上角的"创建知识库"按钮
- 在创建对话框中填写知识库信息:
- 知识库名称: 输入有意义的名称(必填)
- 描述: 详细描述知识库的用途和内容
- 语言: 选择知识库的主要语言
- 权限: 设置访问权限(私有/公开)
- 点击"确认创建"完成创建
配置说明
语言设置:
- Chinese: 中文知识库
- English: 英文知识库
- 其他语言根据需要选择
权限设置:
- 私有: 仅知识库创建者和被授权用户可访问
- 公开: 系统内所有用户均可访问
创建建议
- 使用清晰明确的知识库名称
- 详细填写描述信息便于管理
- 根据内容语言选择正确的语言设置
- 谨慎设置权限确保信息安全
查看知识库详情
基本信息查看
点击知识库名称可以查看详细信息:
- 知识库基本属性
- 统计数据概览
- 相关配置信息
- 创建和更新时间
知识库统计
系统提供丰富的统计信息:
| 统计项 | 说明 |
|---|---|
| 文档总数 | 知识库中的文档数量 |
| 分块数量 | 文档切分后的分块总数 |
| Token数量 | 用于向量化的Token总数 |
| 存储大小 | 知识库占用的存储空间 |
删除知识库
删除操作
- 在知识库列表中找到要删除的知识库
- 点击操作列的"删除"按钮
- 在确认对话框中确认删除操作
删除警告
- 知识库删除后无法恢复
- 删除会清空所有相关文档和分块数据
- 建议删除前先导出重要数据
- 删除操作会影响相关的API调用
📄 文档管理
查看知识库文档
文档列表
- 在知识库列表中点击"查看文档"按钮
- 在文档管理对话框中查看文档列表
文档信息包括:
- 文档名称: 文档的原始文件名
- 分块数量: 文档解析后的分块数量
- 解析进度: 文档处理的进度百分比
- 解析状态: 当前的处理状态
- 创建时间: 文档上传时间
文档解析状态
状态类型
| 状态 | 描述 | 操作 |
|---|---|---|
| 待解析 | 文档已上传,等待处理 | 可手动启动解析 |
| 解析中 | 文档正在进行解析处理 | 可查看实时进度 |
| 解析完成 | 文档解析成功,已加入知识库 | 可查看分块结果 |
| 解析失败 | 解析过程中出现错误 | 可查看错误日志并重试 |
| 部分成功 | 部分内容解析成功 | 可查看详细状态 |
解析进度监控
实时查看解析进度:
- 进度条显示: 直观显示解析完成百分比
- 状态更新: 自动刷新解析状态
- 时间预估: 显示预计完成时间
批量解析操作
批量处理
- 选择多个待解析的文档(使用复选框)
- 点击"批量解析"按钮
- 系统自动开始批量解析任务
- 可在解析状态卡片中查看总体进度
批量操作优势
- 提高效率: 同时处理多个文档
- 资源优化: 系统自动调度解析资源
- 进度统计: 统一显示批量任务进度
- 错误处理: 自动处理单个文档的解析错误
高级管理功能
解析配置管理
全局配置
管理员可以配置全局解析参数:
- 解析引擎: 选择文档解析引擎(MinerU等)
- 分块策略: 设置文档分块方式
- 向量化模型: 配置嵌入模型
- 解析并发: 设置同时解析的文档数量
知识库级配置
为特定知识库设置专门的解析配置:
- 语言优化: 针对特定语言优化解析效果
- 格式处理: 特殊格式文档的处理策略
- 质量控制: 设置解析质量阈值
解析日志管理
日志查看
查看详细的解析日志:
- 操作记录: 所有解析操作的详细记录
- 错误信息: 解析失败的具体错误原因
- 性能数据: 解析耗时和资源使用情况
- 用户操作: 用户对知识库的操作历史
日志分析
通过日志分析系统性能:
- 解析效率: 统计平均解析时间
- 成功率: 计算解析成功率
- 错误模式: 分析常见解析错误
- 资源使用: 监控系统资源消耗
监控和统计
系统级统计
整体数据
查看系统整体的知识库统计:
总知识库数量: 156个
总文档数量: 2,847个
总分块数量: 45,392个
总Token数量: 12,847,293个
使用趋势
- 创建趋势: 知识库创建的时间分布
- 解析趋势: 文档解析的数量和频率
- 用户活跃度: 各用户的使用情况
- 存储增长: 数据存储的增长趋势
性能监控
解析性能
监控解析引擎的性能指标:
- 平均解析时间: 单文档平均处理时间
- 并发处理能力: 同时处理文档的数量
- 成功率: 解析成功的比例
- 资源利用率: CPU、内存、GPU的使用率
系统健康度
检查系统各组件的健康状态:
- MinerU服务: 文档解析引擎状态
- 向量数据库: 向量存储服务状态
- 搜索引擎: Elasticsearch服务状态
- 文件存储: 文件存储服务状态
最佳实践
知识库组织策略
-
按业务分类:
技术文档知识库
├── API文档
├── 开发指南
└── 架构设计
业务知识库
├── 产品手册
├── 用户指南
└── FAQ -
按权限分级:
- 公开知识库: 公司通用知识
- 部门知识库: 部门内部知识
- 项目知识库: 特定项目知识
- 个人知识库: 个人工作知识
解析优化建议
-
文档预处理:
- 确保文档格式规范
- 清理无关内容
- 统一命名规范
-
批次处理:
- 按类型分批解析
- 避免高峰期大量解析
- 合理安排解析队列
-
质量控制:
- 定期检查解析质量
- 及时处理解析错误
- 优化解析参数配置
权限管理策略
-
分级授权:
- 管理员: 全部知识库管理权限
- 部门负责人: 部门知识库管理权限
- 普通用户: 个人知识库管理权限
-
安全控制:
- 敏感知识库设置严格权限
- 定期审查权限分配
- 监控知识库访问日志
注意事项
性能影响
- 大量解析: 同时解析大量文档可能影响系统性能
- 存储空间: 注意监控存储空间使用情况
- 并发限制: 合理设置解析并发数量
数据安全
- 备份策略: 定期备份重要知识库数据
- 删除确认: 删除知识库前务必确认无误
- 权限控制: 严格控制知识库管理权限
维护建议
- 定期清理: 清理不再使用的知识库
- 性能优化: 定期优化解析配置
- 监控报警: 设置关键指标的监控报警
如需了解更多知识库相关功能,请参考: