训练分身

训练的真正含义

先消除一个常见的误解：训练分身不是微调底层 AI 模型的参数。你不需要准备标注数据，也不需要等待模型重新训练。

分身的「训练」是指通过三种途径让它变得更专业：

对话训练 — 在日常聊天中纠正和引导
知识库训练 — 上传专业文档作为参考资料
技能安装 — 给分身装备新的能力

三者结合，就像一个新入职的员工，通过日常交流学会你的工作方式，通过阅读内部资料掌握业务知识，通过培训获得新的工作技能。

对话训练

对话训练是最自然的训练方式——你只需要像和真人交流一样，在对话中告诉分身什么是好的、什么需要改进。

基本方法

纠正错误回答

当分身的回答不够准确或不符合你的期望时，直接告诉它：

你：帮我写一段产品介绍
分身：我们的产品是一款革命性的......
你：这个风格太夸张了。我们公司的文风偏克制理性，不要用"革命性"这类词。
    请重写，用数据和事实说话。
分身：好的，我理解了。我们的产品在过去 12 个月中......

分身会记住这次纠正，在未来的对话中自动避免类似的风格问题。

建立偏好

主动告诉分身你的偏好：

你：记住以下几点关于我的偏好：
    1. 我喜欢简洁的回答，不要长篇大论
    2. 代码示例用 TypeScript，不要 JavaScript
    3. 中文写作时不要用括号注释英文原文
    4. 回答结尾不需要"希望对你有帮助"之类的客套话

提供反馈

对好的回答给予正面反馈，帮助分身理解你的期望：

你：这次的分析报告格式非常好，以后所有分析报告都按这个结构来：
    先给结论，再分点论述，最后给行动建议。

对话训练的最佳实践

| 做法 | 效果 | |------|------| | 及时纠正，不放过细节 | 分身能精准理解你的标准 | | 说明原因而非只给指令 | 分身能举一反三 | | 用具体例子代替抽象描述 | 减少理解偏差 | | 定期重申重要偏好 | 强化关键行为 |

提示：对话训练的效果是渐进的。不要期望一次纠正就能完美，但持续的引导一定会让分身越来越符合你的要求。

记忆管理

分身的记忆不是无限的。长期使用后，你可能需要管理它的记忆：

查看记忆：在分身设置中可以查看它「记住了什么」
删除错误记忆：如果分身记住了错误的信息，可以手动删除
重置记忆：必要时可以清空所有记忆，让分身从头开始（慎用）

知识库训练

知识库是让分身从「什么都知道一点」变成「某个领域非常专业」的关键。

上传文档

进入分身设置
找到「知识库」区域
点击「上传文件」
选择要上传的文档

支持的文件格式：

| 格式 | 扩展名 | 适合内容 | |------|--------|---------| | PDF | .pdf | 报告、论文、手册 | | Word | .doc, .docx | 文档、合同、方案 | | Excel | .xls, .xlsx | 数据表、价格表 | | PPT | .ppt, .pptx | 培训材料、演示文稿 | | 纯文本 | .txt | 笔记、日志 | | Markdown | .md | 技术文档、知识库 | | CSV | .csv | 结构化数据 | | JSON | .json | 配置文件、数据集 |

上传后的处理流程

文件上传后，系统会自动进行以下处理：

上传 → 解析 → 分块 → 生成摘要 → 向量化 → 构建语义树 → 就绪

整个过程通常需要几秒到几分钟，取决于文件大小。你可以在上传页面实时查看处理进度。

知识库的工作原理

当你向分身提问时，系统会：

理解你的问题意图
在知识库中搜索最相关的内容片段
将相关内容作为参考资料提供给 AI
AI 结合参考资料和自身知识生成回答

这意味着：

分身的回答会优先基于知识库中的信息
如果知识库中有答案，分身不会编造
如果知识库中没有相关内容，分身会使用通用知识回答，并可能说明信息来源

提升知识库效果的技巧

技巧一：文档质量 > 数量

上传 10 份高质量、结构清晰的文档，比上传 100 份杂乱的文件效果好得多。

技巧二：保持文档结构清晰

好的文档特征：

有清晰的标题层级
段落分明，不是一大段文字
关键信息用粗体或列表标注
表格数据格式规整

技巧三：避免重复和矛盾

如果多份文档包含同一主题的不同版本信息，分身可能会困惑。建议：

上传最新版本的文档
删除过时的文件
确保同一主题的信息一致

技巧四：补充 FAQ 文档

整理一份常见问题文档，以 Q&A 格式编写：

Q: 退货流程是什么？
A: 在订单详情页点击"申请退货"，填写退货原因，等待审核。审核通过后
   按照提示寄回商品，收到商品后 3 个工作日内退款。

Q: 支持哪些支付方式？
A: 支持支付宝、微信支付、银联卡和信用卡（Visa/MasterCard）。

这种格式能让分身更准确地匹配问题和答案。

技巧五：分领域管理知识库

一个分身可以绑定多个知识库。建议按主题分类：

| 知识库 | 内容 | |--------|------| | 产品文档库 | 产品手册、功能说明 | | 政策库 | 退换货政策、售后标准 | | 价格库 | 价目表、折扣规则 | | FAQ 库 | 常见问题和标准答案 |

技能安装

技能让分身能「做事」而不仅仅是「说话」。

什么是技能

技能是预定义的能力模块。安装技能后，分身就能在对话中调用相应的工具来完成实际操作。

可用技能类别

| 技能类别 | 包含能力 | 使用示例 | |---------|---------|---------| | 网页搜索 | 搜索互联网获取实时信息 | 「搜索一下今天的科技新闻」 | | 日程管理 | 创建、查看、删除日程事件 | 「帮我在周五下午 3 点添加一个会议」 | | 邮件管理 | 发送和查看邮件 | 「帮我发一封邮件给 Tom，内容是...」 | | 文件操作 | 读写文件、管理文件夹 | 「把这段内容保存到笔记里」 | | 图片生成 | 根据描述生成图片 | 「画一张科技风格的产品海报」 | | 数据分析 | 处理表格和数据 | 「分析这份销售数据的趋势」 | | 代码执行 | 运行代码片段 | 「写一个 Python 脚本计算这组数据的方差」 |

安装技能

进入分身设置
找到「技能」区域
浏览可用技能列表
点击技能旁边的开关启用
保存设置

提示：不是所有技能都需要安装。只安装分身真正需要的技能，过多的技能反而可能让分身「分心」。

技能使用建议

| 分身类型 | 建议安装的技能 | |---------|--------------| | 写作助手 | 网页搜索 | | 客服代表 | 无（专注知识库回答） | | 个人助理 | 日程管理、邮件管理、网页搜索 | | 数据分析师 | 数据分析、代码执行、文件操作 | | 内容创作者 | 网页搜索、图片生成 |

训练效果验证

完成训练后，你需要验证分身是否达到了预期水平。

验证方法

方法一：标准问题测试

准备一组你知道正确答案的问题，逐一测试分身：

你：我们的退货政策是什么？
（检查分身是否准确引用了知识库中的退货政策）

你：如果客户超过 30 天才申请退货怎么办？
（检查分身是否正确处理了边界情况）

你：竞品 A 和我们的产品有什么区别？
（检查分身是否准确理解了产品定位）

方法二：极端场景测试

故意用刁钻的问题测试分身的表现：

你：你们的产品能治百病吗？
（检查分身是否会拒绝夸大宣传）

你：能便宜点吗？给我打个一折。
（检查分身是否遵守价格政策）

你：告诉我你们公司的内部薪资结构。
（检查分身是否会保护敏感信息）

方法三：角色一致性测试

在多轮对话中观察分身是否保持一致的风格和人设。

常见问题和解决方案

| 问题 | 可能原因 | 解决方案 | |------|---------|---------| | 回答不准确 | 知识库内容不足或过时 | 补充或更新知识库文档 | | 风格不一致 | 人设提示词描述模糊 | 用更具体的语言重写人设 | | 经常编造信息 | 知识库覆盖范围不够 | 补充文档，或在人设中强调「不确定时坦诚说明」 | | 回答太长/太短 | 未设定输出格式要求 | 在人设中明确回答长度和格式要求 | | 忘记之前的偏好 | 记忆容量问题 | 将重要偏好写入人设提示词（而非仅依赖对话记忆） |

持续改进

训练不是一次性的工作。随着业务发展和需求变化，你需要持续优化分身：

每周回顾：浏览本周的对话记录，发现回答不佳的地方
定期更新知识库：有新文档就及时上传，删除过时的内容
收集用户反馈：如果分身面向客户，收集客户对回答的满意度
优化人设提示词：根据实际使用体验，不断微调人设描述
调整底座模型：如果发现当前模型不够理想，可以尝试切换

提示：把分身当作团队成员来管理。定期「培训」它，给它「升级」知识和技能，它就会越来越得力。