知识库
Karma One 的知识库功能让你可以上传自己的文档,让 AI 基于你的专属资料来回答问题——而不仅仅依赖通用知识。
什么是知识库
想象一下:你有几百页的产品文档、技术规范、研究报告,每次查找信息都要翻很久。现在你只需要把这些文档上传到 Karma 的知识库,然后直接问 AI——它会在几秒钟内从你的文档中找到答案。
知识库的核心价值:
- 私有知识:AI 基于你上传的文档回答,不是泛泛的通用回答
- 精准引用:回答会标注来自哪份文档的哪个部分
- 实时检索:上传后即可查询,无需等待训练
- 多格式支持:PDF、Word、PPT、Excel、代码、图片等全部支持
3 种知识库引擎
Karma 提供三种知识库引擎,满足不同场景的需求:
| 引擎 | 特点 | 适用场景 | |------|------|----------| | Gemini File Search | Google 驱动的语义搜索,理解能力强 | 通用文档检索,对语义理解要求高的场景 | | Bubble RAG | 自研向量检索引擎,支持语义树概览 | 需要浏览文档结构、快速了解全貌 | | BFS(Bubble File Search) | 支持更多文件类型,含图片/音频/视频 | 多媒体文件检索、需要全格式支持的场景 |
提示:大部分情况下选择默认引擎即可。如果有特殊需求(如上传视频或音频),可选择 BFS 引擎。
支持的文件格式
文档类
- PDF(.pdf)
- Word(.doc, .docx)
- PowerPoint(.ppt, .pptx)
- Excel(.xls, .xlsx)
文本类
- 纯文本(.txt)
- Markdown(.md)
- CSV(.csv)
- JSON / JSONL(.json, .jsonl)
代码文件
- 各种编程语言的源代码文件
多媒体(BFS 引擎)
- 图片:PNG, JPG, JPEG, GIF, BMP, WEBP, SVG, TIFF
- 音频:MP3, WAV, FLAC, AAC, OGG, WMA, M4A
- 视频:MP4, AVI, MOV, MKV, WMV, FLV, WEBM
创建知识库
步骤
- 打开 Karma App,进入对话页面
- 点击知识库管理入口
- 点击「创建知识库」
- 输入知识库名称(如"产品文档"、"技术规范")
- 选择知识库引擎(可使用默认)
- 完成创建
命名建议
好的命名能帮助你快速找到和区分不同的知识库:
| 推荐命名 | 不推荐命名 | |----------|------------| | 2026年Q1产品PRD | 文档1 | | React技术规范 | 新建知识库 | | 客户合同模板 | test | | 竞品分析报告 | 未命名 |
上传文档
创建知识库后,就可以上传文档了:
- 进入目标知识库
- 点击「上传文档」
- 选择要上传的文件(支持批量选择)
- 等待处理完成
文档处理流程
上传后,系统会自动进行以下处理:
上传 → 解析 → 分块 → 摘要 → 向量化 → 索引完成
处理时间取决于文档大小和类型,一般在几秒到几分钟之间。你可以在知识库中查看每份文档的处理状态。
提示:文档越结构化(如有标题、章节),检索效果越好。
在对话中使用知识库
选择知识库
在开始对话前,选择你想要 AI 参考的知识库。选中后,AI 的回答会基于知识库中的文档内容。
提问方式
像平时一样自然提问即可:
我们的退货政策是什么?
这份报告中Q3的销售数据是多少?
技术文档里关于API认证的部分怎么说的?
回答特点
- AI 会从知识库中找到相关内容
- 回答中会标注信息来源(哪份文档、哪个部分)
- 如果知识库中没有相关信息,AI 会明确告知
多知识库同时查询
Karma 支持同时选择多个知识库进行查询,AI 会自动跨知识库检索:
使用场景举例:
- 同时查询"产品文档"和"竞品分析"知识库,做对比分析
- 同时查询"技术规范"和"会议纪要"知识库,了解决策背景
提示:多知识库查询时,AI 会智能判断每个知识库的相关性,优先展示最匹配的结果。
知识库管理
重命名
当知识库的用途发生变化时,可以修改名称以保持清晰的组织结构。
更新文档
- 添加新文档:随时上传新文件到已有知识库
- 删除文档:移除不再需要的文档
- 替换文档:先删除旧版本,再上传新版本
删除知识库
不再需要的知识库可以整体删除,释放存储空间。
注意:删除操作不可撤销,请确认后再操作。
最佳实践
文档准备
- 保持结构化:有清晰标题和章节的文档,检索效果更好
- 拆分大文件:超大文档(如500页以上)建议按章节拆分后上传
- 使用有意义的文件名:文件名也会被纳入检索范围
- 保持最新:定期更新文档,删除过时的版本
知识库组织
- 按主题分类:为不同主题创建独立的知识库
- 控制规模:每个知识库保持在合理的文档数量范围内
- 定期清理:移除不再使用的知识库和文档
提问技巧
- 具体明确:比起"告诉我关于产品的一切","我们产品的定价策略是什么"效果更好
- 指定范围:如果知道信息在哪类文档中,可以在问题中提及
- 追问细节:第一次回答不够详细时,可以继续追问
常见问题
Q:上传的文档会被用于 AI 模型训练吗?
A:不会。你上传的文档仅用于你自己的知识库检索,不会被用于任何模型训练。
Q:知识库有容量限制吗?
A:每个知识库有文件数量和总容量的限制,具体限额取决于你的订阅计划。
Q:支持扫描版 PDF 吗?
A:支持。系统会自动进行 OCR 识别,但扫描质量会影响识别准确率。建议尽量使用原生数字 PDF。