第三方問責缺口:AI智能體對授權鏈之外的人造成傷害時的問責
委託人層級是AI問責的正確起點。當物理世界部署影響到超出授權架構所能容納的群體時,它不是充分的終點。
AI智能體的問責架構圍繞委託人層級構建:部署者授權智能體,智能體在該授權範圍內行動,當出現問題時,問責沿鏈條向上回溯。這一架構內嵌著一個基礎假設——問責所關注的各方,就是參與授權的各方。在物理世界的部署場景中,這一假設經常失效。
由護理機構授權的AI照護智能體,會影響臨床人員、探訪家屬以及共享環境的其他居民。由建築所有方授權的樓宇管理AI,塑造著場地內每位租戶和承包商的日常體驗。由機構安全團隊授權的後量子金鑰管理基礎設施,為從未參與授權流程的人員的資料創建或破壞安全屬性。在每種情形中,實質性傷害都可能觸達完全處於授權鏈之外的人——而現有的問責機制中,沒有任何一種是為觸達這些人而設計的。
以委託人為中心的缺口
委託人層級模型將問責視為一個閉環:委託人授權,智能體行動,委託人擔責。第三方傷害在這個閉環中沒有結構性位置。受影響方未曾同意部署;無法指出被違反的同意記錄;無法訪問記錄智能體行為的審計追蹤。其問責主張即便得到認可,也必須經由一套並非為智能體物理世界部署而設計的法律框架來傳遞。
這並非罕見的邊緣情形。在任何規模化的物理世界部署中,受影響群體在設計上就大於被授權群體。要求可能在共享物理空間中遇到AI智能體的每位人員事先同意,在實踐上幾乎不可能實現。部署者圍繞委託方構建授權,後果卻落在更廣泛的群體上。
後量子安全交叉點
後量子密碼基礎設施由機構部署——醫療系統、金融機構、公共機構——依據其自身安全與合規團隊授予的授權。向量子抗性演算法的遷移,改變了這些機構持有的關於非遷移決策參與方人員資料的安全屬性。如果過渡期引入漏洞窗口,或遺留資料的重新保護不完整,處於風險中的人員並非授權遷移的決策者。他們既未收到遷移發生的通知,若遷移出現問題,也無法訪問問責流程。
這種不對稱性是結構性的。決定如何及何時遷移的機構持有遷移計劃、風險評估和審計記錄。安全屬性受決策影響的資料主體則一無所有,對管轄該決策的問責流程也沒有正式主張權。遷移成功對他們而言是無感的;遷移失敗則是他們的問題。
硬體交叉點
嵌入樓宇基礎設施的AI智能體,依據控制該建築的實體授權運行。住戶——租戶、訪客、承包商、配送人員——並非該授權的當事方。若智能體記錄他們的行動軌跡、基於行為推斷調整環境條件、或依據模式識別修改訪問權限,這些行動針對的是可能根本不知道該智能體存在、更不用說其授權範圍的人員。
硬體證明驗證智能體相對於其委託人授權的完整性,不驗證該授權範圍是否適合於智能體行動所涉及的每個人的利益。一個完整經過證明的部署,若系統性地影響了一群未曾同意的住戶,仍然構成傷害。證明機制未提供任何供這些住戶表達的途徑。
物理世界照護交叉點
由照護機構授權的AI照護智能體,每天與從未授權它的人員接觸。臨床人員在未參與部署決策的情況下,與智能體的建議並肩工作。探訪照護對象的家屬,其與親人的關係經由智能體的行為輸出來調節。共享空間中的其他居民,其隱私因照護智能體為服務他人而使用的感測器而受到附帶牽連。
這些人員沒有任何正式渠道來提出智能體如何影響了他們的問責關切。若智能體造成傷害——強化臨床錯誤、生成關於訪客影響其訪問權限的推斷、記錄從未同意錄製的居民互動——錨定於委託人層級的問責流程,在結構上沒有容納這一主張的空間。照護機構向其委託方負責,並通過監管向主要照護對象負責。環境中的其他所有人,都處於這一架構之外。
彌合第三方問責缺口的要求
第三方問責不能透過增加委託人來解決。解決方案不是要求可能出現在共享空間的每位人員事先同意——這一要求在大多數物理世界部署場景中不具可操作性,且會使最需要部署的地方反而無法部署。
最低限度的回應,是在部署設計階段進行明確的第三方影響範圍界定。部署前,部署者識別將在委託人層級之外受到影響的人群類別。針對每類人群,部署設計說明智能體可收集其哪些資料、可對其採取哪些行動,以及若其遭受傷害,存在何種問責機制。該說明是部署記錄的一部分,而非事後補充。
部署設計還需要可訪問的申訴路徑:正式機制,使非委託方受影響人員能夠提出問責關切、訪問與針對其所採取行動相關的記錄、並尋求救濟。這不要求事先授權——只要該方受到了智能體運行的影響。
在Asaptic Labs,第三方問責缺口被視為每個交叉點的一級部署設計問題。授權鏈是問責的必要起點,不是充分終點——在物理世界AI部署中,部署後果超出啟動者範圍幾乎是常態。
AI問責沿委託人層級流動,但物理世界部署經常對完全處於該層級之外的人造成傷害——樓宇住戶、臨床人員、家屬成員、受安全遷移影響的資料主體。這些人在錨定授權的問責流程中沒有正式地位,無法訪問審計追蹤,也沒有申訴路徑。最低限度的修復,是在部署設計階段進行明確的第三方影響範圍界定:識別委託鏈之外誰將受到影響,說明智能體相對於他們可採取的行動,並為其主張創建可訪問的問責路徑。授權鏈是問責開始的地方,而非結束的地方。