← Notes from the Crossings
× QUANTUM SECURITY × HARDWARE × HUMAN CARE

The forensic gap: why reconstructing what an AI agent decided — and why — is harder than it looks

2026-05-23 5 min read

When a human makes a consequential decision, forensic reconstruction is imperfect but possible. Emails, recorded calls, written notes, and the testimony of participants create a partial record. Legal systems have developed centuries of procedure around this kind of incomplete evidence.

When an AI agent makes a consequential decision, the forensic problem is structurally different. The record that exists is not an incomplete version of what happened. It is, in most deployed systems, the only layer that was ever designed to be preserved — and it typically contains what the agent did, not why.

What gets logged versus what decides

Most agent deployments log actions and outputs: API calls made, documents retrieved, messages sent, decisions communicated. These records are essential for accountability, but they are logs of effects, not logs of reasoning. The inference step — the path from input to decision — is not written anywhere in the standard deployment stack. It happens inside the model's forward pass and is discarded before the output is emitted.

This is not an oversight. Logging the full intermediate state of a large model's inference is impractical in production at scale: it generates volumes of data per agent per day that no storage budget anticipates. But the consequence is a forensic gap between the log record and the actual decision-making process. An investigator reviewing what an agent did can observe the output and the inputs that were in context at the time. The reasoning path that connected them is unrecoverable.

The gap widens in multi-step agentic workflows. When an agent calls a tool, retrieves information, summarizes it, and then acts on the summary, the intermediate summary is ephemeral — present in one context window, absent from the next. If the action proves problematic, the summary that shaped it may already be gone. The audit trail records that a tool was called and an action was taken. It does not record the intermediate representation that bridged them.

The hardware crossing

For agents deployed in hardware-adjacent settings — security infrastructure, industrial control, medical devices — the forensic gap intersects with regulatory requirements for root cause analysis. When a certified system fails, the certification framework generally requires that failure modes be reproducible and analyzable. Firmware updates are versioned; configuration changes are logged with rollback capability.

AI agents embedded in these stacks introduce a layer whose internal state is neither versioned in the same sense nor reproducible in the same sense. A model with identical weights may produce different outputs on the same input if sampling parameters differ. The hardware may attest to the model version and the firmware configuration, but attestation is not forensic reconstruction. Knowing what version was running does not tell you what the inference path was when the adverse event occurred.

For safety-critical hardware deployments, this is a material gap. It means that for a category of decisions — those where the model's reasoning chain mattered — the audit record cannot support the kind of root cause analysis that the certification framework assumes. Deployers who treat this as an acceptable residual are making a compliance bet they may not be able to hedge later.

The care crossing

In care settings, the forensic gap has a distinct character. When an AI agent assists in a care decision — a medication prompt, a fall-risk assessment, a care plan adjustment — and the outcome is disputed, regulators and legal processes will ask: on what basis did the agent make that recommendation? If the answer is "we have the input data and the output recommendation, but the reasoning path is not recoverable," the care provider is in a difficult position.

Care-domain accountability frameworks assume that decisions can be reconstructed after the fact. For human clinicians, the medical record, the documented rationale, and professional testimony create a reconstructable record. For AI agents, the absence of an intermediate reasoning record is not a documentation failure — it is a structural property of how the system was built. Courts and regulators will not be satisfied by the explanation that the architecture made logging impractical.

Deployers who treat the forensic gap as a future problem are misjudging the timeline. The care decisions that will face legal scrutiny in two years are being made by agents deployed today. The forensic record that will be available is the one being generated now.

What this requires

The forensic gap cannot be closed by logging more outputs. It requires deliberate design at three levels.

First, structured rationale capture: agents should emit a structured summary of the factors that drove a consequential decision, in a form that can be logged and preserved alongside the output. This is not a full replay of the inference — it is a human-readable account of the reasoning path, generated at output time and treated as a mandatory artifact alongside the decision itself.

Second, context window preservation for flagged decisions: in domains where retrospective analysis is foreseeable — care, financial authorization, security enforcement — the full input context for high-stakes decisions should be logged and retained under access controls for the regulatory retention period applicable to the domain. Context is the only recoverable proxy for the reasoning that consumed it.

Third, forensic-aware architecture from the start: the gap between what gets logged and what decides should be treated as an architectural constraint, not a post-deployment concern. Systems designed for consequential domains should treat forensic reconstructability as a first-class design requirement alongside availability and correctness.

For agents operating where outcomes are contested — in care, in hardware, in security — the absence of a recoverable reasoning record is not just an engineering limitation. It is a liability posture. The forensic gap is where accountability claims go to die.

摘要 — 简体

当AI智能体导致争议性结果时,事后还原其决策路径在结构上比传统软件系统困难得多。审计日志记录了行为和输出,但推断步骤——从输入到决策的路径——发生在模型内部并在输出前被丢弃。在多步骤工作流中,中间摘要是短暂的,形成最终行动的中间表示可能已经消失。在硬件邻近的安全关键部署中,这一差距与根本原因分析的监管要求相交叉——硬件证明只能告诉你运行了哪个版本,而无法告诉你推断路径是什么。在照护场景中,监管机构和法律程序将要求知道建议的依据是什么;"推理路径不可恢复"不是令人满意的答案。三个层面的应对措施:结构化推理捕获(在输出时记录推理摘要)、为高风险决策保存完整上下文窗口、以及将取证可重建性作为架构约束而非事后关切。

摘要 — 繁體

當AI智能體導致爭議性結果時,事後還原其決策路徑在結構上比傳統軟件系統困難得多。審計日誌記錄了行為和輸出,但推斷步驟——從輸入到決策的路徑——發生在模型內部並在輸出前被丟棄。在多步驟工作流中,中間摘要是短暫的,形成最終行動的中間表示可能已經消失。在硬件鄰近的安全關鍵部署中,這一差距與根本原因分析的監管要求相交叉——硬件證明只能告訴你運行了哪個版本,而無法告訴你推斷路徑是什麼。在照護場景中,監管機構和法律程序將要求知道建議的依據是什麼;「推理路徑不可恢復」不是令人滿意的答案。三個層面的應對措施:結構化推理捕獲(在輸出時記錄推理摘要)、為高風險決策保存完整上下文視窗、以及將取證可重建性作為架構約束而非事後關切。

× 量子安全 × 硬件 × 人类照护

取证差距:为何事后还原AI智能体的决策及其原因,比看起来难得多

2026-05-23 5 分钟阅读

当一个人做出重要决定时,事后取证是不完整的,但可能的。电子邮件、录音、书面笔记和参与者的证词,构成了一种部分记录。法律体系围绕这类不完整证据建立了几百年的程序。

当AI智能体做出重要决定时,取证问题在结构上是不同的。现有记录并不是对所发生事情的不完整描述。在大多数已部署系统中,它是唯一被设计为留存的层面——而且通常只包含智能体做了什么,而不是为什么。

什么被记录,什么在决策

大多数智能体部署记录行为和输出:发起的API调用、检索的文档、发送的消息、传达的决策。这些记录对问责至关重要,但它们是效果的日志,而非推理的日志。推断步骤——从输入到决策的路径——不会写入标准部署栈的任何地方。它发生在模型的前向传播过程中,在输出发出之前就被丢弃了。

这不是疏漏。在生产系统中记录大型模型推断的完整中间状态是不切实际的:在规模化时,每个智能体每天会产生任何存储预算都无法预期的数据量。但其后果是:日志记录与实际决策过程之间存在取证差距。审查智能体行为的调查者可以观察输出以及当时上下文中的输入。连接两者的推理路径是不可恢复的。

这一差距在多步骤智能体工作流中会进一步扩大。当一个智能体调用工具、检索信息、将其汇总,然后基于汇总采取行动时,中间汇总是短暂的——存在于一个上下文窗口中,在下一个中消失。如果该行动被证明存在问题,形成该行动的汇总可能已经消失。审计轨迹记录了工具被调用和行动被采取,但不记录联结两者的中间表示。

硬件节点

对于部署在硬件邻近场景中的智能体——安全基础设施、工业控制、医疗设备——取证差距与根本原因分析的监管要求相交叉。当一个认证系统发生故障时,认证框架通常要求故障模式可重现且可分析。固件更新有版本控制;配置更改有可回滚的日志记录。

嵌入这些堆栈的AI智能体引入了一个层次,其内部状态既无法以相同意义进行版本化,也无法以相同意义进行重现。具有相同权重的模型,在相同输入下,如果采样参数不同,可能产生不同输出。硬件可以证明模型版本和固件配置,但证明不是取证重建。知道运行的是哪个版本,并不能告诉你不良事件发生时的推断路径是什么。

对于安全关键硬件部署,这是一个实质性差距。这意味着对于某类决策——那些模型的推理链至关重要的决策——审计记录无法支持认证框架所假设的那种根本原因分析。将此视为可接受剩余风险的部署方,正在押注一个可能无法对冲的合规赌注。

照护节点

在照护场景中,取证差距具有独特的性质。当AI智能体协助做出照护决策——用药提醒、跌倒风险评估、护理计划调整——且结果有争议时,监管机构和法律程序会问:智能体做出该建议的依据是什么?如果答案是"我们有输入数据和输出建议,但推理路径不可恢复",照护提供者将处于困境之中。

照护领域的问责框架假设决策可以事后重建。对于人类临床医生,病历、记录在案的理由和专业证词构成可重建记录。对于AI智能体,缺乏中间推理记录不是文档失误——而是系统构建方式的结构性属性。法院和监管机构不会因为"架构使日志记录不切实际"而感到满意。

将取证差距视为未来问题的部署方,误判了时间线。两年后将面临法律审查的照护决策,正在由今天部署的智能体做出。届时可用的取证记录,就是现在正在生成的记录。

这需要什么

取证差距无法通过记录更多输出来弥合。它需要在三个层面进行有意识的设计。

第一,结构化推理捕获:应要求智能体就驱动重要决策的因素发出结构化摘要,以可与输出一同记录和保存的形式呈现。这不是完整推断的重放,而是在输出时生成的人类可读推理路径说明,并被视为与决策本身并列的强制性产物。

第二,为标记决策保存上下文窗口:在可预见事后分析的领域——照护、金融授权、安全执行——高风险决策的完整输入上下文应在访问控制下记录并保留,直至适用该领域的监管保留期届满。上下文是消费它的推理过程唯一可恢复的代理。

第三,从一开始就采用具备取证意识的架构:日志记录与决策之间的差距,应被视为架构约束,而非部署后的关切。为高后果领域设计的系统,应将取证可重建性与可用性和正确性并列为一级设计要求。

对于在结果存在争议的环境中运作的智能体——照护、硬件、安全——缺乏可恢复的推理记录,不只是工程限制,而是一种法律责任姿态。取证差距,是问责主张走向终结的地方。

× 量子安全 × 硬件 × 人類照護

取證差距:為何事後還原AI智能體的決策及其原因,比看起來難得多

2026-05-23 5 分鐘閱讀

當一個人做出重要決定時,事後取證是不完整的,但可能的。電子郵件、錄音、書面筆記和參與者的證詞,構成了一種部分記錄。法律體系圍繞這類不完整證據建立了幾百年的程序。

當AI智能體做出重要決定時,取證問題在結構上是不同的。現有記錄並不是對所發生事情的不完整描述。在大多數已部署系統中,它是唯一被設計為留存的層面——而且通常只包含智能體做了什麼,而不是為什麼。

什麼被記錄,什麼在決策

大多數智能體部署記錄行為和輸出:發起的API呼叫、檢索的文件、發送的消息、傳達的決策。這些記錄對問責至關重要,但它們是效果的日誌,而非推理的日誌。推斷步驟——從輸入到決策的路徑——不會寫入標準部署棧的任何地方。它發生在模型的前向傳播過程中,在輸出發出之前就被丟棄了。

這不是疏漏。在生產系統中記錄大型模型推斷的完整中間狀態是不切實際的:在規模化時,每個智能體每天會產生任何儲存預算都無法預期的數據量。但其後果是:日誌記錄與實際決策過程之間存在取證差距。審查智能體行為的調查者可以觀察輸出以及當時脈絡中的輸入。連接兩者的推理路徑是不可恢復的。

這一差距在多步驟智能體工作流中會進一步擴大。當一個智能體呼叫工具、檢索資訊、將其彙總,然後基於彙總採取行動時,中間彙總是短暫的——存在於一個脈絡視窗中,在下一個中消失。如果該行動被證明存在問題,形成該行動的彙總可能已經消失。審計軌跡記錄了工具被呼叫和行動被採取,但不記錄聯結兩者的中間表示。

硬件節點

對於部署在硬件鄰近場景中的智能體——安全基礎設施、工業控制、醫療設備——取證差距與根本原因分析的監管要求相交叉。當一個認證系統發生故障時,認證框架通常要求故障模式可重現且可分析。韌體更新有版本控制;配置更改有可回滾的日誌記錄。

嵌入這些堆疊的AI智能體引入了一個層次,其內部狀態既無法以相同意義進行版本化,也無法以相同意義進行重現。具有相同權重的模型,在相同輸入下,如果採樣參數不同,可能產生不同輸出。硬件可以證明模型版本和韌體配置,但證明不是取證重建。知道運行的是哪個版本,並不能告訴你不良事件發生時的推斷路徑是什麼。

對於安全關鍵硬件部署,這是一個實質性差距。這意味著對於某類決策——那些模型的推理鏈至關重要的決策——審計記錄無法支持認證框架所假設的那種根本原因分析。將此視為可接受剩餘風險的部署方,正在押注一個可能無法對沖的合規賭注。

照護節點

在照護場景中,取證差距具有獨特的性質。當AI智能體協助做出照護決策——用藥提醒、跌倒風險評估、護理計劃調整——且結果有爭議時,監管機構和法律程序會問:智能體做出該建議的依據是什麼?如果答案是「我們有輸入數據和輸出建議,但推理路徑不可恢復」,照護提供者將處於困境之中。

照護領域的問責框架假設決策可以事後重建。對於人類臨床醫生,病歷、記錄在案的理由和專業證詞構成可重建記錄。對於AI智能體,缺乏中間推理記錄不是文件失誤——而是系統構建方式的結構性屬性。法院和監管機構不會因為「架構使日誌記錄不切實際」而感到滿意。

將取證差距視為未來問題的部署方,誤判了時間線。兩年後將面臨法律審查的照護決策,正在由今天部署的智能體做出。屆時可用的取證記錄,就是現在正在生成的記錄。

這需要什麼

取證差距無法通過記錄更多輸出來彌合。它需要在三個層面進行有意識的設計。

第一,結構化推理捕獲:應要求智能體就驅動重要決策的因素發出結構化摘要,以可與輸出一同記錄和保存的形式呈現。這不是完整推斷的重放,而是在輸出時生成的人類可讀推理路徑說明,並被視為與決策本身並列的強制性產物。

第二,為標記決策保存脈絡視窗:在可預見事後分析的領域——照護、金融授權、安全執行——高風險決策的完整輸入脈絡應在存取控制下記錄並保留,直至適用該領域的監管保留期屆滿。脈絡是消費它的推理過程唯一可恢復的代理。

第三,從一開始就採用具備取證意識的架構:日誌記錄與決策之間的差距,應被視為架構約束,而非部署後的關切。為高後果領域設計的系統,應將取證可重建性與可用性和正確性並列為一級設計要求。

對於在結果存在爭議的環境中運作的智能體——照護、硬件、安全——缺乏可恢復的推理記錄,不只是工程限制,而是一種法律責任姿態。取證差距,是問責主張走向終結的地方。