Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
我们准备用模型把历史消息压缩成摘要,但担心摘要错。错了后面所有回答都跟着错,有解吗?
摘要分两种:事实状态和叙述摘要。生产里关键事实尽量结构化,叙述摘要只辅助语境。
给摘要加来源 turn id。比如“用户已确认地址,来自第 4 轮”。出错时能回原文。
摘要要不要每轮都覆盖?
状态字段覆盖,事件日志追加。比如当前地址只能有一个,历史争议可以保留。
可以让另一个轻量校验器检查摘要是否引入新事实。摘要里出现原文没有的字段,直接拒绝。
我们踩过“用户没说发票抬头,摘要写成已确认抬头”。后面模型就不问了。
那是不是别用模型摘要,程序规则抽取更安全?
规则适合固定槽位,模型适合开放语义。两者组合。别把全部压缩都交给一个自然语言段落。
情绪和偏好也要压缩,比如“不接受电话联系,只要邮件”。这类不是传统槽位,但很重要。
摘要更新要有 diff 吗?
内部最好有。能看到本轮新增、修改、删除哪些状态。调事故时很救命。
用户能看到摘要吗?
不建议直接暴露内部摘要。可以在需要确认时用面向用户的话:“我理解你要修改收件地址,对吗?”
我会把摘要拆成结构化状态、情绪偏好、开放备注,并保留来源轮次和校验。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗