Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
资料员要区分“公司内部事实”和“外部事实”。比如报销制度不能被官网博客纠正。
我们给资料员两个来源域:internal_docs 和 approved_web。默认只查内部,主控明确授权才查 web。
浏览器核验有用,尤其是工具文档版本。比如 Playwright、Selenium、MCP 这些,旧文章太多。
那资料员怎么避免把论坛帖子当官方事实?
source_type。官方文档、GitHub release、论文、社区经验要分开。回答时不能同等权重。
RAG 最容易装成“有来源”。引用了一个来源,不代表来源支持结论。
我们让审校员检查 source-grounding:每个关键断言能不能在来源里找到。
这个检查要抽样,不然成本爆炸。高风险答案全检,普通答案抽检。
还有时间戳。外部工具文档会变,source notes 里至少记录 URL 和访问日期。
浏览器抓页面时注意 cookie。不要把登录后的内部页面当公开来源。
下载 PDF 也要存原文件 hash。不然半年后链接变了,复盘找不到当时依据。
我先做两级:内部库必查,外部官网需要主控授权,来源类型进结构化输出。
对。资料员不是“什么都搜”,是按权限和事实类型取证。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗