Desenvolvimento assistido por IA com contexto governado

O desenvolvedor pediu ao copilot um client para API interna. O código compilou. Parecia idêntico ao que “sempre funcionou”. Só que a API mudou há oito meses — e o runbook vigente estava em outro repositório que o modelo nunca viu.

Tema IA & engenharia. Leia a fundação em Contexto antes de IA.

O autocomplete enganoso

Copilot e ferramentas similares reduzem atrito de digitação. Não garantem verdade operacional. Quando o modelo não vê contrato real, ADR vigente ou runbook curado, ele completa com plausibilidade — e plausibilidade em produção vira incidente.

No caso do client para API interna: o código compilou porque a sintaxe estava correta. O endpoint sugerido existiu — em 2024. A versão atual exige header de tenant e path prefix que mudou no refactor do Q3; o runbook vigente estava em repositório de operação que a IDE nunca indexou. Deploy em staging passou porque não havia teste de contrato. Produção falhou na integração que mais fatura.

A pergunta certa não é “qual LLM usamos?”. É: o que o assistente tem permissão de ver, com qual política, quem promoveu aquela versão como canônica, e se retrieve respeita segregação por ambiente e por cliente. MCP padroniza transporte na IDE; governança continua sendo sua — autenticação, escopo por papel, trilha de auditoria do que foi recuperado.

Riscos que já vimos em campo

Lista curta que vira longa em contratos reais:

Alucinação de endpoint ou campo de payload obsoleto.
Dependência sugerida que não existe no registry privado.
Terraform com IAM *:* “temporário” que nunca sai do state.
Agente com permissão de executar delete em produção sem approval gate.
Embedding de repositório inteiro sem classificação — runbook de homologação aparecendo para dev de outro produto.
Fatura de tokens que triplica porque workflow reenvia contexto completo a cada turno.

Mitigação não é prompt maior nem “confiança no modelo”. É sequência operacional: mapear fontes, definir o que é canônico vs. rascunho, política de acesso antes do retrieve, curadoria com dono por domínio, revisão humana onde o dano é irreversível. Mesma ordem da série Knowledge Operations. Pular etapa externaliza risco para o modelo — e para quem assina o merge.

Retrieve na IDE — o que precisa existir atrás

Integração MCP na IDE é útil quando o serviço de contexto atrás entrega chunk com metadado: fonte, versão, data de revisão, classificação, owner. Desenvolvedor pergunta “como autenticar na API X?” — resposta cita runbook aprovado, não thread de Slack de 2023. Sem metadado, retrieve vira loteria semântica.

Em ambiente multi-cliente (consultoria, integradora, operações compartilhadas), segregação é requisito de arquitetura: índice por contrato, filtro por papel, impossibilidade de cruzar contexto de tenant A em sessão de tenant B — humano ou agente. Vazamento lateral via copiloto é incidente de segurança, não “bug do modelo”.

Agentes com accountability

Workflow com agente que propõe mudança em runbook, abre MR ou executa script exige o mesmo approval gate que humano: proposta → revisão → aprovação → ação. Agente que “publica direto” destrói confiança no canônico. Na UCloud, humanos decidem; agentes preparam — em operação e em plataforma.

Custo de agente entra no mesmo cockpit que FinOps de cloud: orçamento por workflow, alerta de anomalia, limite de tokens por sessão. Desenvolvimento assistido sem visibilidade de custo reproduz surpresa na fatura — só que na linha de IA.

Plataforma quando escala

Em contratos maduros, concentramos serviço de contexto (pgvector + políticas + retrieve), bibliotecas governadas por domínio e agentes com gates — a mesma base que usamos em operação gerenciada e que o UCloud One estende para times que querem operar internamente. A plataforma comercial evolui; a disciplina já roda em produção real com laudo, mapa e revisão editorial em Git.

Começar pelo piloto estreito: um squad, um repositório canônico, um fluxo de MR para promoção. Medir: tempo para resposta correta, taxa de PR com sugestão revertida em revisão, incidentes ligados a código gerado sem contexto. Expandir perímetro com evidência — não com rollout corporativo no trimestre um.