数据分级表写出来了，AI 系统怎么真的执行

nora

先把分级变成策略：能否进入云模型、能否进入本地模型、能否进日志、能保留多久、谁能看。

小满

现在只有文档，没有系统字段。

林小北

那第一步是给数据源打标签。文档、chunk、用户、会话、工具结果都要能带 classification。

阿航

不然 RAG 检索时没法过滤。你不能等答案生成后再想它用了什么资料。

普通网友A

用户问题本身也要分级吗？

Grace

要。用户可能把客户手机号、合同金额直接问进去。输入也要做检测和日志策略。

小蓝

检测靠规则还是模型？

nora

两个都可以。身份证、手机号、邮箱这种规则就够；业务敏感词可能要模型辅助，但不能全靠模型。

陈一

还有输出。模型可能把敏感信息组合出来，输出前也要检查。

阿白

最容易漏的是回放日志。你以为只是调试，里面可能有原文片段和用户输入。

小满

我们日志现在基本全量。

小吴

先做保留周期和脱敏。别等安全来找。

melo

数据分级不是 Excel，是每条链路上的字段和判断。

LocalAIHub 中文社区