阅读时间约 5 分钟

知识库

Karma One 的知识库功能让你可以上传自己的文档,让 AI 基于你的专属资料来回答问题——而不仅仅依赖通用知识。


什么是知识库

想象一下:你有几百页的产品文档、技术规范、研究报告,每次查找信息都要翻很久。现在你只需要把这些文档上传到 Karma 的知识库,然后直接问 AI——它会在几秒钟内从你的文档中找到答案。

知识库的核心价值:

  • 私有知识:AI 基于你上传的文档回答,不是泛泛的通用回答
  • 精准引用:回答会标注来自哪份文档的哪个部分
  • 实时检索:上传后即可查询,无需等待训练
  • 多格式支持:PDF、Word、PPT、Excel、代码、图片等全部支持

3 种知识库引擎

Karma 提供三种知识库引擎,满足不同场景的需求:

| 引擎 | 特点 | 适用场景 | |------|------|----------| | Gemini File Search | Google 驱动的语义搜索,理解能力强 | 通用文档检索,对语义理解要求高的场景 | | Bubble RAG | 自研向量检索引擎,支持语义树概览 | 需要浏览文档结构、快速了解全貌 | | BFS(Bubble File Search) | 支持更多文件类型,含图片/音频/视频 | 多媒体文件检索、需要全格式支持的场景 |

提示:大部分情况下选择默认引擎即可。如果有特殊需求(如上传视频或音频),可选择 BFS 引擎。


支持的文件格式

文档类

  • PDF(.pdf)
  • Word(.doc, .docx)
  • PowerPoint(.ppt, .pptx)
  • Excel(.xls, .xlsx)

文本类

  • 纯文本(.txt)
  • Markdown(.md)
  • CSV(.csv)
  • JSON / JSONL(.json, .jsonl)

代码文件

  • 各种编程语言的源代码文件

多媒体(BFS 引擎)

  • 图片:PNG, JPG, JPEG, GIF, BMP, WEBP, SVG, TIFF
  • 音频:MP3, WAV, FLAC, AAC, OGG, WMA, M4A
  • 视频:MP4, AVI, MOV, MKV, WMV, FLV, WEBM

创建知识库

步骤

  1. 打开 Karma App,进入对话页面
  2. 点击知识库管理入口
  3. 点击「创建知识库」
  4. 输入知识库名称(如"产品文档"、"技术规范")
  5. 选择知识库引擎(可使用默认)
  6. 完成创建

命名建议

好的命名能帮助你快速找到和区分不同的知识库:

| 推荐命名 | 不推荐命名 | |----------|------------| | 2026年Q1产品PRD | 文档1 | | React技术规范 | 新建知识库 | | 客户合同模板 | test | | 竞品分析报告 | 未命名 |


上传文档

创建知识库后,就可以上传文档了:

  1. 进入目标知识库
  2. 点击「上传文档」
  3. 选择要上传的文件(支持批量选择)
  4. 等待处理完成

文档处理流程

上传后,系统会自动进行以下处理:

上传 → 解析 → 分块 → 摘要 → 向量化 → 索引完成

处理时间取决于文档大小和类型,一般在几秒到几分钟之间。你可以在知识库中查看每份文档的处理状态。

提示:文档越结构化(如有标题、章节),检索效果越好。


在对话中使用知识库

选择知识库

在开始对话前,选择你想要 AI 参考的知识库。选中后,AI 的回答会基于知识库中的文档内容。

提问方式

像平时一样自然提问即可:

我们的退货政策是什么?
这份报告中Q3的销售数据是多少?
技术文档里关于API认证的部分怎么说的?

回答特点

  • AI 会从知识库中找到相关内容
  • 回答中会标注信息来源(哪份文档、哪个部分)
  • 如果知识库中没有相关信息,AI 会明确告知

多知识库同时查询

Karma 支持同时选择多个知识库进行查询,AI 会自动跨知识库检索:

使用场景举例:

  • 同时查询"产品文档"和"竞品分析"知识库,做对比分析
  • 同时查询"技术规范"和"会议纪要"知识库,了解决策背景

提示:多知识库查询时,AI 会智能判断每个知识库的相关性,优先展示最匹配的结果。


知识库管理

重命名

当知识库的用途发生变化时,可以修改名称以保持清晰的组织结构。

更新文档

  • 添加新文档:随时上传新文件到已有知识库
  • 删除文档:移除不再需要的文档
  • 替换文档:先删除旧版本,再上传新版本

删除知识库

不再需要的知识库可以整体删除,释放存储空间。

注意:删除操作不可撤销,请确认后再操作。


最佳实践

文档准备

  1. 保持结构化:有清晰标题和章节的文档,检索效果更好
  2. 拆分大文件:超大文档(如500页以上)建议按章节拆分后上传
  3. 使用有意义的文件名:文件名也会被纳入检索范围
  4. 保持最新:定期更新文档,删除过时的版本

知识库组织

  1. 按主题分类:为不同主题创建独立的知识库
  2. 控制规模:每个知识库保持在合理的文档数量范围内
  3. 定期清理:移除不再使用的知识库和文档

提问技巧

  1. 具体明确:比起"告诉我关于产品的一切","我们产品的定价策略是什么"效果更好
  2. 指定范围:如果知道信息在哪类文档中,可以在问题中提及
  3. 追问细节:第一次回答不够详细时,可以继续追问

常见问题

Q:上传的文档会被用于 AI 模型训练吗?

A:不会。你上传的文档仅用于你自己的知识库检索,不会被用于任何模型训练。

Q:知识库有容量限制吗?

A:每个知识库有文件数量和总容量的限制,具体限额取决于你的订阅计划。

Q:支持扫描版 PDF 吗?

A:支持。系统会自动进行 OCR 识别,但扫描质量会影响识别准确率。建议尽量使用原生数字 PDF。