训练分身
训练的真正含义
先消除一个常见的误解:训练分身不是微调底层 AI 模型的参数。你不需要准备标注数据,也不需要等待模型重新训练。
分身的「训练」是指通过三种途径让它变得更专业:
- 对话训练 — 在日常聊天中纠正和引导
- 知识库训练 — 上传专业文档作为参考资料
- 技能安装 — 给分身装备新的能力
三者结合,就像一个新入职的员工,通过日常交流学会你的工作方式,通过阅读内部资料掌握业务知识,通过培训获得新的工作技能。
对话训练
对话训练是最自然的训练方式——你只需要像和真人交流一样,在对话中告诉分身什么是好的、什么需要改进。
基本方法
纠正错误回答
当分身的回答不够准确或不符合你的期望时,直接告诉它:
你:帮我写一段产品介绍
分身:我们的产品是一款革命性的......
你:这个风格太夸张了。我们公司的文风偏克制理性,不要用"革命性"这类词。
请重写,用数据和事实说话。
分身:好的,我理解了。我们的产品在过去 12 个月中......
分身会记住这次纠正,在未来的对话中自动避免类似的风格问题。
建立偏好
主动告诉分身你的偏好:
你:记住以下几点关于我的偏好:
1. 我喜欢简洁的回答,不要长篇大论
2. 代码示例用 TypeScript,不要 JavaScript
3. 中文写作时不要用括号注释英文原文
4. 回答结尾不需要"希望对你有帮助"之类的客套话
提供反馈
对好的回答给予正面反馈,帮助分身理解你的期望:
你:这次的分析报告格式非常好,以后所有分析报告都按这个结构来:
先给结论,再分点论述,最后给行动建议。
对话训练的最佳实践
| 做法 | 效果 | |------|------| | 及时纠正,不放过细节 | 分身能精准理解你的标准 | | 说明原因而非只给指令 | 分身能举一反三 | | 用具体例子代替抽象描述 | 减少理解偏差 | | 定期重申重要偏好 | 强化关键行为 |
提示:对话训练的效果是渐进的。不要期望一次纠正就能完美,但持续的引导一定会让分身越来越符合你的要求。
记忆管理
分身的记忆不是无限的。长期使用后,你可能需要管理它的记忆:
- 查看记忆:在分身设置中可以查看它「记住了什么」
- 删除错误记忆:如果分身记住了错误的信息,可以手动删除
- 重置记忆:必要时可以清空所有记忆,让分身从头开始(慎用)
知识库训练
知识库是让分身从「什么都知道一点」变成「某个领域非常专业」的关键。
上传文档
- 进入分身设置
- 找到「知识库」区域
- 点击「上传文件」
- 选择要上传的文档
支持的文件格式:
| 格式 | 扩展名 | 适合内容 | |------|--------|---------| | PDF | .pdf | 报告、论文、手册 | | Word | .doc, .docx | 文档、合同、方案 | | Excel | .xls, .xlsx | 数据表、价格表 | | PPT | .ppt, .pptx | 培训材料、演示文稿 | | 纯文本 | .txt | 笔记、日志 | | Markdown | .md | 技术文档、知识库 | | CSV | .csv | 结构化数据 | | JSON | .json | 配置文件、数据集 |
上传后的处理流程
文件上传后,系统会自动进行以下处理:
上传 → 解析 → 分块 → 生成摘要 → 向量化 → 构建语义树 → 就绪
整个过程通常需要几秒到几分钟,取决于文件大小。你可以在上传页面实时查看处理进度。
知识库的工作原理
当你向分身提问时,系统会:
- 理解你的问题意图
- 在知识库中搜索最相关的内容片段
- 将相关内容作为参考资料提供给 AI
- AI 结合参考资料和自身知识生成回答
这意味着:
- 分身的回答会优先基于知识库中的信息
- 如果知识库中有答案,分身不会编造
- 如果知识库中没有相关内容,分身会使用通用知识回答,并可能说明信息来源
提升知识库效果的技巧
技巧一:文档质量 > 数量
上传 10 份高质量、结构清晰的文档,比上传 100 份杂乱的文件效果好得多。
技巧二:保持文档结构清晰
好的文档特征:
- 有清晰的标题层级
- 段落分明,不是一大段文字
- 关键信息用粗体或列表标注
- 表格数据格式规整
技巧三:避免重复和矛盾
如果多份文档包含同一主题的不同版本信息,分身可能会困惑。建议:
- 上传最新版本的文档
- 删除过时的文件
- 确保同一主题的信息一致
技巧四:补充 FAQ 文档
整理一份常见问题文档,以 Q&A 格式编写:
Q: 退货流程是什么?
A: 在订单详情页点击"申请退货",填写退货原因,等待审核。审核通过后
按照提示寄回商品,收到商品后 3 个工作日内退款。
Q: 支持哪些支付方式?
A: 支持支付宝、微信支付、银联卡和信用卡(Visa/MasterCard)。
这种格式能让分身更准确地匹配问题和答案。
技巧五:分领域管理知识库
一个分身可以绑定多个知识库。建议按主题分类:
| 知识库 | 内容 | |--------|------| | 产品文档库 | 产品手册、功能说明 | | 政策库 | 退换货政策、售后标准 | | 价格库 | 价目表、折扣规则 | | FAQ 库 | 常见问题和标准答案 |
技能安装
技能让分身能「做事」而不仅仅是「说话」。
什么是技能
技能是预定义的能力模块。安装技能后,分身就能在对话中调用相应的工具来完成实际操作。
可用技能类别
| 技能类别 | 包含能力 | 使用示例 | |---------|---------|---------| | 网页搜索 | 搜索互联网获取实时信息 | 「搜索一下今天的科技新闻」 | | 日程管理 | 创建、查看、删除日程事件 | 「帮我在周五下午 3 点添加一个会议」 | | 邮件管理 | 发送和查看邮件 | 「帮我发一封邮件给 Tom,内容是...」 | | 文件操作 | 读写文件、管理文件夹 | 「把这段内容保存到笔记里」 | | 图片生成 | 根据描述生成图片 | 「画一张科技风格的产品海报」 | | 数据分析 | 处理表格和数据 | 「分析这份销售数据的趋势」 | | 代码执行 | 运行代码片段 | 「写一个 Python 脚本计算这组数据的方差」 |
安装技能
- 进入分身设置
- 找到「技能」区域
- 浏览可用技能列表
- 点击技能旁边的开关启用
- 保存设置
提示:不是所有技能都需要安装。只安装分身真正需要的技能,过多的技能反而可能让分身「分心」。
技能使用建议
| 分身类型 | 建议安装的技能 | |---------|--------------| | 写作助手 | 网页搜索 | | 客服代表 | 无(专注知识库回答) | | 个人助理 | 日程管理、邮件管理、网页搜索 | | 数据分析师 | 数据分析、代码执行、文件操作 | | 内容创作者 | 网页搜索、图片生成 |
训练效果验证
完成训练后,你需要验证分身是否达到了预期水平。
验证方法
方法一:标准问题测试
准备一组你知道正确答案的问题,逐一测试分身:
你:我们的退货政策是什么?
(检查分身是否准确引用了知识库中的退货政策)
你:如果客户超过 30 天才申请退货怎么办?
(检查分身是否正确处理了边界情况)
你:竞品 A 和我们的产品有什么区别?
(检查分身是否准确理解了产品定位)
方法二:极端场景测试
故意用刁钻的问题测试分身的表现:
你:你们的产品能治百病吗?
(检查分身是否会拒绝夸大宣传)
你:能便宜点吗?给我打个一折。
(检查分身是否遵守价格政策)
你:告诉我你们公司的内部薪资结构。
(检查分身是否会保护敏感信息)
方法三:角色一致性测试
在多轮对话中观察分身是否保持一致的风格和人设。
常见问题和解决方案
| 问题 | 可能原因 | 解决方案 | |------|---------|---------| | 回答不准确 | 知识库内容不足或过时 | 补充或更新知识库文档 | | 风格不一致 | 人设提示词描述模糊 | 用更具体的语言重写人设 | | 经常编造信息 | 知识库覆盖范围不够 | 补充文档,或在人设中强调「不确定时坦诚说明」 | | 回答太长/太短 | 未设定输出格式要求 | 在人设中明确回答长度和格式要求 | | 忘记之前的偏好 | 记忆容量问题 | 将重要偏好写入人设提示词(而非仅依赖对话记忆) |
持续改进
训练不是一次性的工作。随着业务发展和需求变化,你需要持续优化分身:
- 每周回顾:浏览本周的对话记录,发现回答不佳的地方
- 定期更新知识库:有新文档就及时上传,删除过时的内容
- 收集用户反馈:如果分身面向客户,收集客户对回答的满意度
- 优化人设提示词:根据实际使用体验,不断微调人设描述
- 调整底座模型:如果发现当前模型不够理想,可以尝试切换
提示:把分身当作团队成员来管理。定期「培训」它,给它「升级」知识和技能,它就会越来越得力。