← 返回博客
× 后量子安全 × 硬件 × 物理世界护理

目击者问题:当AI智能体是唯一观察者时的问责

完整性与准确性是不同的属性。后量子签名和硬件证明保证智能体记录在生成后未被更改。当智能体是唯一观察者时,没有任何机制能保证记录在生成时是正确的。

Asaptic Labs 2026-06-14 5 分钟阅读

大多数AI智能体问责架构依赖一个隐含假设:智能体的记录可以与某些外部内容进行核对。人类监督者可能会将日志与自己的记忆进行比对。第二个系统可能已从不同角度捕获了同一事件。物理证据可能可以印证记录所声称的内容。在这种模型下,问责是一个关联问题——智能体的陈述是否与其他观察者所见相符?

当智能体是唯一目击者时,这一假设便会失效。在智能体独自运行的部署中——在没有人类在场时通宵监控设施、在没有第二系统独立访问的情况下管理密码过程、在没有临床医师看守时为患者提供床旁观察——问责记录是智能体关于其作为唯一能够描述这些事件的实体所发生事情的报告。没有外部内容可以与之关联。日志、证明和审计都依赖于智能体选择记录的只有智能体观察到的事件。

在后量子安全交叉点

应用于智能体问责记录的后量子签名提供了一个具有精确和有限范围的保证:它们确认签署内容在生成后未被修改。如果私钥管理良好且算法健全,有效签名证明了完整性。但完整性——记录在生成后未被更改的保证——与准确性截然不同:记录在生成时是正确的保证。

当智能体是唯一目击者时,无论密码强度如何,记录的准确性都无法通过任何下游验证机制确立。来自唯一目击者部署的后量子签名问责记录携带完整的完整性保证,以及对任何外部准确性检查的完全缺失。后量子迁移将产生在密码上抵御攻击数十年的签名。但一条记录可以被完美签署却在实质上是错误的。当观察事件的唯一实体也是生成记录的实体时,签名强度的任何进步都无法弥合完整性与准确性之间的差距。

在硬件交叉点

硬件证明向下进一步扩展了完整性保证:经过证明的记录不仅可以证明内容在生成后未被修改,还可以证明它是由特定验证系统在特定验证硬件状态下生成的。证明为完整性添加了来源。但来源——确认哪个系统生成了记录——不扩展到该系统观察的准确性。

由于校准漂移、环境干扰或软件故障而错误读取传感器的设备智能体,会生成硬件证明的、密码签名的不对应于物理世界的观察记录。证明是完整的,记录是错误的。没有任何硬件机制在经过证明的系统状态与该系统感知输出的准确性之间建立经过验证的对应关系。硬件交叉点恰恰是这一点最重要的地方:嵌入物理基础设施的智能体通常是与其报告的环境接触的唯一系统,其硬件身份的证明对于验证其环境读数的准确性没有任何作用。

在物理世界照护交叉点

在照护环境中,唯一目击者条件是结构性的且预期的。在大多数设施配置中,通宵监控患者的监控智能体是该时段大部分时间的唯一在场实体。它记录的生命体征读数、它升级或抑制的警报、它在不上报的情况下响应的患者互动——这些事件构成了照护记录。对于例行的夜间观察,没有人类共同目击者。没有独立传感器系统从单独视角捕获相同的生理测量值。

这是设计,不是设计失败。智能体在照护环境中部署,正是因为所需分辨率和持续时间的持续人类存在不可用或不可持续。但适用于人类照护文档的问责实践——临床医师的记录可以与另一名临床医师的独立检查进行比较,患者可以证实或反驳其经历的事件——不适用于唯一目击者智能体部署。智能体的记录就是发生事情的记录。如果它不完整、不准确,或因未被检测到的校准问题而系统性偏差,可能没有纠正来源。

设计回应

目击者问题没有密码学解决方案。更强的签名无法解决它,更好的证明也无法解决它。在唯一目击者部署中,完整性与准确性之间的差距是结构性的。弥合它需要架构干预:智能体无法生成的独立防篡改物理环境日志;即使单个传感器在操作上已足够,也需要冗余观察路径;使用智能体不控制的信号对智能体自身报告进行异常检测;以及当智能体作为重要事件的唯一观察者运行时,向监督主体明确披露。这些措施不能恢复独立目击者验证——它们使唯一目击者条件可见且受约束,从而可以在准确了解哪些内容可以被验证、哪些不能的情况下应用监督。

核心观点

当AI智能体是唯一观察者时,问责记录携带完整的完整性保证,以及外部准确性验证的完全缺失。后量子签名和硬件证明证明智能体自身的陈述未被更改——而非其在生成时是正确的。在所有三个交叉点,唯一目击者条件需要明确的架构认可:智能体无法生成的防篡改环境日志、冗余观察路径、对智能体生成记录的异常检测,以及在独立验证结构上不可用时向主体明确披露。