O problema da evidência sintética: responsabilização quando agentes de IA treinam com dados gerados por IA
Cada geração herda não só capacidade, mas também lacunas de responsabilização dos predecessores, compostas, obscurecidas e embutidas nos pesos.
O modelo padrão de desenvolvimento assume que dados de treino representam alguma forma de verdade. Podem ser ruidosos, enviesados ou incompletos, mas presume-se que foram gerados por processos independentes do agente treinado. Essa premissa já não é fiável.
À medida que sistemas de IA se tornam comuns, uma parte crescente da produção digital do mundo é gerada por eles. Recomendações de segurança são resumidas por IA, diagnósticos de hardware são interpretados por IA, notas de cuidado são redigidas por IA. Os pipelines da próxima geração passam a conter saídas da geração anterior.
Esse é o problema da evidência sintética: quando um agente treina com dados gerados por outros agentes, herda vieses, erros e lacunas de responsabilização em forma difícil de rastrear, mais difícil de auditar e embutida nos pesos do modelo.
Na travessia de segurança pós-quântica
Agentes de gestão de chaves treinados com recomendações históricas, sumários de aconselhamento ou narrativas de auditoria que foram redigidos com ferramentas de IA podem carregar vieses originados vários passos antes. Se um processo anterior sobre-representou certas famílias de algoritmos, o agente posterior herda essa sobre-representação sem registo da origem.
A lacuna é estrutural. Os dados podem vir de fontes credenciadas e as saídas ficar dentro dos parâmetros. O erro vive entre o autor do documento e a alegação evidenciária no documento, que pode refletir a distribuição de um modelo anterior, não julgamento independente.
Na travessia de hardware
Agentes de hardware treinam com leituras de sensores, resultados de teste e relatórios de falha. Como IA auxilia cada vez mais testes e relatórios, esses corpora incluem componentes sintéticos: sumários de teste, narrativas de falha e relatórios de atestação processados por intermediários de IA.
Quando um agente de saúde de hardware encontra um padrão parecido com uma síntese diagnóstica gerada por IA, não raciocina necessariamente a partir do estado físico do dispositivo. Faz correspondência contra texto produzido por agentes anteriores. Se esses agentes subnotificaram uma classe de falha, o agente posterior pode aprender a subnotificação como estilo normal de diagnóstico.
Na travessia do cuidado
O problema é mais agudo em cuidado, porque a verdade evidenciária sobre qualidade de cuidado já é contestada quando humanos a produzem. Ferramentas de documentação, avaliação e planeamento assistidas por IA povoam os dados de treino de agentes seguintes.
Um agente treinado com notas de cuidado geradas por IA herda os padrões dessas notas. Se ferramentas anteriores enfatizaram atividades mensuráveis sobre bem-estar subjetivo, o agente posterior aprende que atividades mensuráveis são o principal sinal de bom cuidado.
A fronteira de proveniência
A resposta estrutural é uma fronteira de proveniência: pipelines de treino devem documentar o processo de geração de cada alegação substantiva, distinguir fontes validadas por humanos de fontes geradas por IA e aplicar escrutínio maior a material sintético, incluindo validação contra verdade não-IA quando possível.
Isso é difícil. A fronteira entre evidência humana e gerada por IA já está borrada. A fronteira deve ser desenhada ao nível da alegação evidenciária, não do autor do documento. Sem isso, a arquitetura de responsabilização não distingue lacunas herdadas de erros originais.
Agentes treinados com dados gerados por IA herdam lacunas dos predecessores de forma invisível a auditorias comuns. A resposta é proveniência ao nível da alegação e validação independente de evidência sintética.