當智能體行動時,誰簽署了收據?
在公司信用卡上预订机票的员工是可追溯的。预订記錄可歸因,權限已存档,一旦出現问題,有清晰記錄说明谁將何种權限委託给了谁。這不是為繁琐而繁琐的程序——它是機構問責的基礎基礎設施。在受治理的系統中,每一項有實質性影響的行動都留下一份收據。
AI 智能體現在也在预订机票。它們同样在路由付款、注册患者、拒绝索赔,并代表那些未曾認真思考在這一语境下「簽名「究竟意味着什么的機構行事。這些收據——在存在的情况下——只是日誌,而非簽名。這一差别比表面看來更為重要。
日誌条目说的是「此事在此時發生了「。簽名收據说的是「该實体、凭此授權、使此事發生,并對该聲明具有密碼学绑定的責任「。前者是記錄;後者是問責。受监管環境、對手方機構和未來的稽核者需要的是後者,而他們大多數時候得到的是前者。
委託链问題
当人類將權限委託给智能體時,一条授權链随之建立。人類委託方授權智能體在特定範圍内行事;智能體採取行動;下游系統、人员或機構受到影響。要使這条链可稽核,每個环节都需要可歸因:谁授權了谁、做了什么、在什么約束下、在什么時間。
今天,這条链通常在智能體邊界处断裂。系統可能記錄「AI 建议了此行動「或「自动化完成了這一步骤「,但该記錄很少携带正式的委託結構——谁划定了權限範圍、限制是什么、智能體是否在此範圍内行動。当出現问題時,「谁簽署了收據「這個问題在結構上没有答案。
這不是新類型的问題。這是代理的经典问題,如今以软件的速度和规模運行。新的是,這一失败模式——智能體在其授權範圍之外行事且没有可歸因的轨迹——快速、廉价,且很可能變得普遍。
身份是缺失的基礎原語
關于智能體安全的讨论,大多聚焦于對齐:让智能體做人類打算让它做的事。這是必要的,但还不够。對齐解决的是智能體会做什么的问題;歸因解决的是当它行動時谁承担責任的问題。
為使歸因在技术層面可行,智能體需要持久的、有範圍的身份。不只是帳戶,不只是 API 金鑰,而是携带委託溯源的身份——可追溯至建立它的人類或機構委託方,且權限範圍與約束内嵌于憑證之中。智能體應呈現一個簽名聲明,其效力是:我被授權代表實体 X 行事,在範圍 Y 内,直至条件 Z,且该聲明由 X 簽署,X 事後無法否認。
這是一种加密結構。它意味着大多數当前智能體部署所不具備的金鑰管理和簽名架构——因為大多數智能體部署的設计目標是產出结果,而不是產出機構級收據。
规模使這一问題變得紧迫
對智能體行動進行稽核的压力,随這些行動的规模和影響而增长。一個智能體预订一张机票,人工审核尚可應對。一千個智能體在受监管领域——支付、医疗、法律执行——持續行動,则需要機構級收據基礎設施,而非人工审核。
現在構建智能體部署的機構,將决定在该规模下運行的架构。如果该架构不包含身份、委託链和簽名收據,日後將不得不進行改造——在监管压力下、在事故發生後,其代价远高于从一開始就内置它。簽名層不是智能體能力的瓶颈,而是智能體能力赢得在後果性领域運行资格的前提条件。
收據層即信任層
智能體經濟將建立在智能體在無人观察每一步骤的情况下可被信任去做的事之上。這种信任不由能力基準來授予,而由記錄來赢得——一系列可簽名、可歸因、可稽核的行動积累,機構、监管者和對手方可以檢查。
構建這一記錄,需要任何负責任的機構用來證明自身在授權範圍内行事的同等基礎設施:身份、委託、簽名和稽核。不只是因為监管者最终將会要求它——尽管他們將会——而是因為替代方案是建立在不可問責行動之上的智能體經濟。而不可問責的行動,在规模上,不是進步,而是伪装成能力的責任。
收據層,是智能體經濟為其在世界中行動的權利所支付的代价。