Skip to main content

知识库管理

KnowFlow 提供强大的知识库管理功能,超级管理员可以通过管理菜单对系统中的所有知识库进行统一管理,包括查看、创建、配置、删除知识库,以及管理知识库中的文档和解析状态。

概述

功能特点

  • 知识库全景管理: 查看所有用户创建的知识库,统一管理
  • 知识库创建: 快速创建新的知识库并配置基本参数
  • 文档管理: 查看知识库中的文档列表和解析状态
  • 解析监控: 实时监控文档解析进度和状态
  • 批量操作: 支持批量解析文档和批量管理
  • 权限设置: 配置知识库的访问权限和语言设置

访问权限

权限要求

知识库管理功能仅对超级管理员开放,提供全局知识库管理能力。

功能操作

访问知识库管理

  1. 使用超级管理员账户登录系统
  2. 点击主菜单中的"管理"选项
  3. 在管理菜单中选择"知识库管理"

知识库列表查看

知识库管理页面显示系统中所有知识库的详细信息:

字段说明
知识库名称知识库的显示名称
描述知识库的详细描述信息
文档数量知识库中包含的文档总数
分块数量文档解析后产生的文本分块数量
Token数量所有分块包含的Token总数
语言知识库的主要语言设置
权限知识库的访问权限设置
创建日期知识库的创建时间

搜索知识库

搜索功能

在页面顶部的搜索区域可以:

  1. 按名称搜索: 在搜索框中输入知识库名称关键词
  2. 实时搜索: 支持输入时实时过滤结果
  3. 清空搜索: 清空搜索条件显示所有知识库

📚 知识库操作

创建知识库

操作步骤

  1. 点击页面右上角的"创建知识库"按钮
  2. 在创建对话框中填写知识库信息:
    • 知识库名称: 输入有意义的名称(必填)
    • 描述: 详细描述知识库的用途和内容
    • 语言: 选择知识库的主要语言
    • 权限: 设置访问权限(私有/公开)
  3. 点击"确认创建"完成创建

配置说明

语言设置:

  • Chinese: 中文知识库
  • English: 英文知识库
  • 其他语言根据需要选择

权限设置:

  • 私有: 仅知识库创建者和被授权用户可访问
  • 公开: 系统内所有用户均可访问
创建建议
  • 使用清晰明确的知识库名称
  • 详细填写描述信息便于管理
  • 根据内容语言选择正确的语言设置
  • 谨慎设置权限确保信息安全

查看知识库详情

基本信息查看

点击知识库名称可以查看详细信息:

  • 知识库基本属性
  • 统计数据概览
  • 相关配置信息
  • 创建和更新时间

知识库统计

系统提供丰富的统计信息:

统计项说明
文档总数知识库中的文档数量
分块数量文档切分后的分块总数
Token数量用于向量化的Token总数
存储大小知识库占用的存储空间

删除知识库

删除操作

  1. 在知识库列表中找到要删除的知识库
  2. 点击操作列的"删除"按钮
  3. 在确认对话框中确认删除操作
删除警告
  • 知识库删除后无法恢复
  • 删除会清空所有相关文档和分块数据
  • 建议删除前先导出重要数据
  • 删除操作会影响相关的API调用

📄 文档管理

查看知识库文档

文档列表

  1. 在知识库列表中点击"查看文档"按钮
  2. 在文档管理对话框中查看文档列表

文档信息包括:

  • 文档名称: 文档的原始文件名
  • 分块数量: 文档解析后的分块数量
  • 解析进度: 文档处理的进度百分比
  • 解析状态: 当前的处理状态
  • 创建时间: 文档上传时间

文档解析状态

状态类型

状态描述操作
待解析文档已上传,等待处理可手动启动解析
解析中文档正在进行解析处理可查看实时进度
解析完成文档解析成功,已加入知识库可查看分块结果
解析失败解析过程中出现错误可查看错误日志并重试
部分成功部分内容解析成功可查看详细状态

解析进度监控

实时查看解析进度:

  • 进度条显示: 直观显示解析完成百分比
  • 状态更新: 自动刷新解析状态
  • 时间预估: 显示预计完成时间

批量解析操作

批量处理

  1. 选择多个待解析的文档(使用复选框)
  2. 点击"批量解析"按钮
  3. 系统自动开始批量解析任务
  4. 可在解析状态卡片中查看总体进度

批量操作优势

  • 提高效率: 同时处理多个文档
  • 资源优化: 系统自动调度解析资源
  • 进度统计: 统一显示批量任务进度
  • 错误处理: 自动处理单个文档的解析错误

高级管理功能

解析配置管理

全局配置

管理员可以配置全局解析参数:

  • 解析引擎: 选择文档解析引擎(MinerU等)
  • 分块策略: 设置文档分块方式
  • 向量化模型: 配置嵌入模型
  • 解析并发: 设置同时解析的文档数量

知识库级配置

为特定知识库设置专门的解析配置:

  • 语言优化: 针对特定语言优化解析效果
  • 格式处理: 特殊格式文档的处理策略
  • 质量控制: 设置解析质量阈值

解析日志管理

日志查看

查看详细的解析日志:

  • 操作记录: 所有解析操作的详细记录
  • 错误信息: 解析失败的具体错误原因
  • 性能数据: 解析耗时和资源使用情况
  • 用户操作: 用户对知识库的操作历史

日志分析

通过日志分析系统性能:

  • 解析效率: 统计平均解析时间
  • 成功率: 计算解析成功率
  • 错误模式: 分析常见解析错误
  • 资源使用: 监控系统资源消耗

监控和统计

系统级统计

整体数据

查看系统整体的知识库统计:

总知识库数量: 156个
总文档数量: 2,847个
总分块数量: 45,392个
总Token数量: 12,847,293个

使用趋势

  • 创建趋势: 知识库创建的时间分布
  • 解析趋势: 文档解析的数量和频率
  • 用户活跃度: 各用户的使用情况
  • 存储增长: 数据存储的增长趋势

性能监控

解析性能

监控解析引擎的性能指标:

  • 平均解析时间: 单文档平均处理时间
  • 并发处理能力: 同时处理文档的数量
  • 成功率: 解析成功的比例
  • 资源利用率: CPU、内存、GPU的使用率

系统健康度

检查系统各组件的健康状态:

  • MinerU服务: 文档解析引擎状态
  • 向量数据库: 向量存储服务状态
  • 搜索引擎: Elasticsearch服务状态
  • 文件存储: 文件存储服务状态

最佳实践

知识库组织策略

  1. 按业务分类:

    技术文档知识库
    ├── API文档
    ├── 开发指南
    └── 架构设计

    业务知识库
    ├── 产品手册
    ├── 用户指南
    └── FAQ
  2. 按权限分级:

    • 公开知识库: 公司通用知识
    • 部门知识库: 部门内部知识
    • 项目知识库: 特定项目知识
    • 个人知识库: 个人工作知识

解析优化建议

  1. 文档预处理:

    • 确保文档格式规范
    • 清理无关内容
    • 统一命名规范
  2. 批次处理:

    • 按类型分批解析
    • 避免高峰期大量解析
    • 合理安排解析队列
  3. 质量控制:

    • 定期检查解析质量
    • 及时处理解析错误
    • 优化解析参数配置

权限管理策略

  1. 分级授权:

    • 管理员: 全部知识库管理权限
    • 部门负责人: 部门知识库管理权限
    • 普通用户: 个人知识库管理权限
  2. 安全控制:

    • 敏感知识库设置严格权限
    • 定期审查权限分配
    • 监控知识库访问日志

注意事项

性能影响

  1. 大量解析: 同时解析大量文档可能影响系统性能
  2. 存储空间: 注意监控存储空间使用情况
  3. 并发限制: 合理设置解析并发数量

数据安全

  1. 备份策略: 定期备份重要知识库数据
  2. 删除确认: 删除知识库前务必确认无误
  3. 权限控制: 严格控制知识库管理权限

维护建议

  1. 定期清理: 清理不再使用的知识库
  2. 性能优化: 定期优化解析配置
  3. 监控报警: 设置关键指标的监控报警

如需了解更多知识库相关功能,请参考: