RegenerAI · Roteamento ontológico
Como a ontologia da ATR opera em três funções articuladas: estrutura de dados, estrutura de busca e estrutura de raciocínio (Chain of Thought). Skills definem perfil, padrões definem intenção, metadados definem escopo e templates de CoT orquestram a sequência de pensamento do agente, mantendo o prompt do sistema enxuto e a profundidade técnica auditável.
A tese em uma frase
A ontologia da ATR opera em três funções articuladas: estrutura de dados (classes e relações), estrutura de busca (multi-hop sobre o grafo) e, hierarquicamente superior, estrutura de raciocínio do agente (Chain of Thought). A cadeia Sintoma → Causa → Processo → Estrutura → Intervenção → Prática → Monitoramento não é só taxonomia, é a forma como o agrônomo regenerativo pensa. Materializar essa cadeia como CoT no sistema é o que diferencia o RegenerAI de um simples mecanismo de recuperação aumentada.
A regra-mãe da ontologia afirma que nenhuma recomendação deve ser baseada apenas na escolha de um insumo, e que toda recomendação precisa explicitar sintoma, causas, processos, estruturas, intervenções e indicadores. Isso não é instrução sobre como buscar conhecimento. É instrução sobre como raciocinar. O CoT ontológico transforma essa regra em comportamento estrutural do agente, não em texto inflado dentro do prompt do sistema.
As três funções da ontologia no sistema
Estrutura de dados
Classes, subclasses, atributos e relações. Materializada como schema de metadados em cada chunk indexado. É o vocabulário formal do sistema.
Estrutura de busca
Grafo navegável de relações ontológicas. Materializada como multi-hop retrieval guiado. É como o sistema encontra evidência relevante.
Estrutura de raciocínio
Cadeia de pensamento do agente: Sintoma → Causa → Processo → Estrutura → Intervenção → Monitoramento. Materializada como CoT templates que orquestram quando e como as outras duas funções são acionadas.
O que muda com essa releitura
Ontologia só como dados e busca
- Sistema pula da pergunta para a recomendação
- Multi-hop fica como decomposição livre da LLM
- Regra-mãe vira instrução solta no prompt
- Sem rastreabilidade do raciocínio
- Resposta correta sem método
Ontologia como CoT + busca + dados
- Agente percorre cadeia diagnóstica antes da recomendação
- Multi-hop guiado pelos passos do CoT
- Regra-mãe estruturada no comportamento
- Cada passo do raciocínio é artefato inspecionável
- Resposta correta com método regenerativo embutido
Três sinais combinados no roteador
A política do agente roteador decide a profundidade do CoT e a estratégia RAG combinando três sinais independentes, sem misturar suas responsabilidades:
Skills do perfil
Bioma, cultura principal, estágio de transição, perfil profissional, maturidade ATR. Vêm da anamnese, da declaração explícita ou de inferência.
Padrão ontológico de consulta
Diagnóstico, planejamento, autonomia, qualidade, monitoramento ou conceitual. Classificador leve mapeia a pergunta ao padrão antes do raciocínio.
Metadados da indexação
Cada chunk carrega a classe ontológica, o subdomínio da Árvore do Conhecimento, contexto territorial e tipo de evidência. Filtros antes do semântico.
O padrão detectado determina o template de CoT a ser executado. O CoT define a sequência de passos de raciocínio. Cada passo do CoT dispara um retrieval específico, filtrado pelas Skills do perfil e pelos metadados da indexação. As três camadas atuam em conjunto, mas o CoT é quem orquestra. Ele é a função epistemicamente superior da ontologia no sistema.
O que sai do prompt do sistema
- Vocabulário técnico especializado (vai para chunks e metadados)
- Regras de raciocínio diagnóstico (viram templates de CoT ontológico)
- Mapeamentos sintoma → causa → processo (viram passos canônicos do CoT)
- Adequação ao perfil (vira prior do roteador, via Skills)
- Critérios de escalonamento técnico (regras do Agente Guardião)
O que fica no prompt do sistema
- Persona e tom (conversa de campo, linguagem simples)
- Regras de formato (prosa por padrão, listas só quando pedidas)
- Política de segurança e escopo
- Política de fechamento (continuação proativa)
- Regra de fallback para conhecimento geral quando o contexto vier vazio
As cinco camadas da arquitetura
Cada camada tem uma responsabilidade única e versionável de forma independente. O prompt do sistema é a camada mais leve e estável. A camada de templates de raciocínio ontológico (CoT) é a hierarquicamente superior: é quem decide quando e como as outras três camadas técnicas são acionadas.
Clique em cada camada para abrir o detalhe.
O CoT decide "o que pensar e em que ordem". O roteador decide "qual estratégia de busca para cada passo". As Skills decidem "com qual viés de perfil". Os metadados decidem "sobre qual escopo de conhecimento". O prompt do sistema decide "como falar". Essa separação é o que mantém o sistema escalável: novas culturas, novos biomas, novas práticas e novas classes ontológicas entram nas camadas técnicas sem tocar no prompt nem no CoT.
Quem é dono de cada camada
| Camada | Versionamento | Curadoria | Frequência de mudança |
|---|---|---|---|
| Templates de CoT | Git interno + revisão GAAS | Syntropy Labs + comitê GAAS | Bimestral |
| Prompt do sistema | Git interno | Syntropy Labs | Trimestral |
| Catálogo de Skills | Tabela versionada | Comitê GAAS | Mensal |
| Roteador de padrões | Modelo + heurísticas | Syntropy Labs | Contínuo (RL) |
| Indexação ontológica | Schema versionado | GAAS técnico | A cada ingestão |
CoT ontológico · a ontologia como estrutura de raciocínio
A cadeia que aparece logo no início do documento da ontologia não é só uma classificação. É um Chain of Thought. É exatamente como o agrônomo regenerativo pensa quando enfrenta um problema no campo. O método da Agricultura de Processo materializado em sequência de raciocínio.
Contexto → Sintoma → Causa provável → Processos comprometidos → Estrutura fragilizada → Intervenções → Prática / Serviço / Insumo → Monitoramento → Resultado funcional → Aprendizado → Compartilhamento com pares
Por que tratar isso como CoT muda tudo
Sem CoT explícito, o agente pula da pergunta para a recomendação. Pode até acertar, mas perde o método. Com CoT ontológico, o agente percorre a cadeia diagnóstica antes de sugerir intervenção. A resposta final continua sendo prosa de campo, mas a forma da resposta carrega o método regenerativo embutido.
Qualidade técnica
O agente atende a regra-mãe da ontologia de forma estrutural, não como instrução solta no prompt. Toda recomendação explicita sintoma, causas, processos, estruturas, intervenções e indicadores.
Pedagogia implícita
Mesmo quando a resposta final sai em prosa fluida, a forma da resposta ensina o produtor a pensar como agrônomo regenerativo. O RegenerAI não responde só perguntas, ensina o método da Agricultura de Processo.
Auditabilidade
Cada passo do CoT é artefato inspecionável. O comitê GAAS revisa amostras passo a passo: qual sintoma o agente identificou, quais causas considerou, por que escolheu essa intervenção e não outra. Calibração fina sem mexer no prompt nem no modelo.
Profundidade do CoT por padrão de consulta
Nem toda pergunta justifica percorrer a cadeia inteira. Forçar isso engessaria respostas simples e geraria verbosidade desnecessária. O classificador de padrões decide a profundidade do raciocínio em cada caso.
| Padrão | Passos do CoT | Profundidade |
|---|---|---|
| Diagnóstico | Sintoma → Causa → Processo → Estrutura → Intervenção → Prática → Indicador |
Cadeia inteira (7 passos) |
| Planejamento | Objetivo → Intervenções compatíveis → Práticas → Insumos → Sequência → Custo |
6 passos |
| Qualidade funcional | Atributo desejado → Genética + Ambiente + Manejo → Práticas convergentes → Indicador |
4 passos (sintetizadores) |
| Autonomia | Função desejada → Alternativas por origem → Risco de dependência → Recomendação |
4 passos |
| Monitoramento | Intervenção implantada → Indicadores → Janela temporal → Resultado esperado |
4 passos |
| Conceitual | Definição → Contexto → Aplicação |
3 passos |
| Conversacional | (direto ao prompt do sistema) |
Sem CoT |
Como CoT e retrieval interagem
O CoT define a espinha do raciocínio. O retrieval alimenta cada passo do raciocínio com evidência específica. A interação é iterativa, não paralela.
// Loop interno do CoT diagnóstico para cada passo da cadeia (sintoma, causa, processo, estrutura, intervenção, prática, indicador): 1. Agente formula intenção do passo // "Quais causas prováveis explicam baixa nodulação em soja no Cerrado?" 2. Roteador dispara retrieval com filtros // classe_ontologica=causa_provavel // bioma=cerrado, cultura=soja // sintomas_aplicaveis inclui "baixa_nodulacao" 3. Retrieval devolve chunks relevantes 4. Agente sintetiza o passo // "Considerando o contexto, as causas mais prováveis são X, Y, Z" 5. Síntese do passo alimenta o próximo passo do CoT // X, Y, Z viram input do retrieval do próximo hop ao final da cadeia: 6. Contexto estruturado vai para o LLM // junto com o prompt do sistema, que renderiza em prosa natural
Diferença em relação ao multi-hop livre
Multi-hop livre (sem CoT ontológico)
- LLM decompõe a pergunta em sub-perguntas semânticas
- Cada sub-pergunta é uma busca vetorial independente
- Caminho varia a cada execução
- Síntese final pode pular passos relevantes
- Difícil auditar por que chegou a esta recomendação
CoT ontológico (multi-hop guiado)
- Cadeia de raciocínio é definida pelo padrão detectado
- Cada passo é uma relação ontológica explícita
- Caminho determinístico e versionado
- Síntese final segue a sequência completa do padrão
- Cada passo é artefato inspecionável pelo comitê GAAS
A ontologia afirma: "nenhuma recomendação deve ser baseada apenas na escolha de um insumo. Toda recomendação deve explicitar o sintoma observado, as causas prováveis, os processos comprometidos, as estruturas funcionais envolvidas, as intervenções possíveis, os critérios de escolha e os indicadores de monitoramento." O CoT ontológico é o que transforma essa regra em comportamento do sistema, e não em texto inflado dentro do prompt. Quando o produtor pergunta "o que aplico?", o sistema não responde com um insumo. Responde percorrendo a cadeia, e o insumo, se aparece, aparece no final, justificado por tudo que veio antes.
Mapeamento da ontologia para Skills
As 16 classes da ontologia não viram todas Skills. As classes de contexto e perfil viram Skills, porque descrevem quem está perguntando e em que situação produtiva está. As classes de raciocínio diagnóstico e operacional não viram Skills: viram padrões de consulta detectados pelo roteador. As classes de conhecimento e evidência viram metadados da indexação.
Skills representam atributos persistentes do usuário e da propriedade. Padrões de consulta representam a intenção pontual de uma pergunta. Metadados representam atributos do conhecimento indexado. Misturar essas três funções é a principal armadilha que esta arquitetura evita.
Classes de contexto e perfil · viram Skills
| Classe ontológica | Skills derivadas | Origem da Skill |
|---|---|---|
| Agroecossistema | Bioma Cerrado, Bioma Amazônia, Bioma Mata Atlântica, Bioma Caatinga, Bioma Pampa, Bioma Pantanal, Talhão Pequeno, Talhão Grande, Microbacia | Anamnese · Diagnóstico Territorial |
| Contexto Territorial | Agroecorregião, Acesso a Biomassa, Acesso a Minerais Regionais, Organização Coletiva, Cadeia de Valor Curta | Anamnese + cruzamento ZARC/INMET |
| Genética | Cafeicultura, Pecuária / ILPF, Hortifruti, Grãos (Soja/Milho), Cana, Citricultura, Cacau, Sistemas Agroflorestais | Anamnese · cultivos atuais |
| Desempenho Funcional | Iniciante ATR, Transição em Curso, ATR Avançado, Certificação Orgânica, Foco em Densidade Nutricional | Agente de Maturidade Regenerativa |
| Perfil profissional | Produtor Rural, Técnico de Campo, Consultor Agrônomo, Pesquisador, Estudante | Cadastro explícito |
Classes de processo e estrutura · podem virar Skills situacionais
Algumas subclasses de Sintomas e Processos são duradouras o suficiente para virar Skills situacionais, ativadas durante a transição e desativadas quando o problema é resolvido. Funcionam como diagnósticos persistentes no perfil.
| Classe ontológica | Skills situacionais | Disparo |
|---|---|---|
| Sintomas crônicos | Solo Compactado, Erosão Avançada, Baixa Nodulação Recorrente, Estresse Hídrico Sazonal, Mato Competição | Anamnese ou conversa repetida |
| Processos comprometidos | Ciclagem Comprometida, Supressividade Baixa, Microbioma Frágil, FBN Ineficiente | Análise de solo + diagnóstico do agente |
| Estruturas fragilizadas | Cobertura Vegetal Baixa, Carbono Funcional Baixo, Mineralogia Pobre | Análise de solo + observação de campo |
Classes que NÃO viram Skills
Sintomas (uso pontual)
Quando o produtor descreve um sintoma novo na pergunta, o roteador detecta padrão diagnóstico. Não vira Skill, é intenção pontual.
Causas Prováveis
Hipóteses causais são saída do raciocínio do agente, não atributo do usuário. Ficam no template de contexto diagnóstico.
Intervenções e Práticas
Quando o produtor pergunta "o que fazer", o roteador detecta padrão operacional. Práticas viram metadados de chunks, não Skills.
Insumos, Serviços e Tecnologias
Vão para metadados dos chunks (tipo, função, origem funcional, evidências requeridas).
Indicadores
Tags nos chunks. Quando relevante, viram parte do template de monitoramento.
Evidências
Atributos de cada chunk: fonte, confiabilidade, contexto, ano, validação. Filtros de qualidade no retrieval.
Estrutura de uma Skill
// Exemplo · Skill derivada da classe Agroecossistema { "id": "bioma_cerrado", "categoria": "contexto_territorial", "classe_ontologica": "Agroecossistema", "rag_bias": { "graphrag": 0.45, "casos_semelhantes": 0.30, "hibrida": 0.15, "raptor": 0.10 }, "filtros_indexacao": { "bioma": "cerrado", "agroecorregiao": "*" }, "tier_minimo": "semente", "agente_inferencia": "diagnostico_territorial", "versao": "2026.05.01" }
Os seis padrões de consulta ontológicos
A seção H da ontologia define seis grupos de perguntas que o sistema precisa responder. Cada grupo é um padrão de consulta com estrutura previsível, classes ontológicas envolvidas e estratégia RAG canônica. O roteador classifica cada consulta em um padrão antes de decidir a estratégia.
Na fase 1 é um classificador leve baseado em palavras-chave e estrutura sintática da pergunta. Na fase 2 vira um classificador multinominal pequeno treinado com exemplos do próprio sistema. Na fase 3 vira parte da política RL como variável latente. Em qualquer fase, o padrão detectado é registrado e auditável.
Padrão 1 · Diagnóstico Multi-hop guiado por ontologia
Gatilhos típicos: "meu solo está...", "estou com problema de...", "as plantas estão...", "por que aparece...". Classes envolvidas: Sintoma, Causa Provável, Processo, Estrutura, Intervenção.
Sintoma → Causas → Processos → Estruturas → Intervenções → Práticas
Cada hop é uma relação explícita da ontologia. O multi-hop não é decomposição livre da LLM, é navegação no grafo ontológico.
Padrão 2 · Planejamento operacional GraphRAG do subgrafo operacional
Gatilhos típicos: "como faço para...", "qual a melhor prática para...", "quero implantar...", "qual o protocolo de...". Classes envolvidas: Intervenção, Prática, Insumo, Tecnologia.
Intervenção → Práticas compatíveis → Insumos → Sequência operacional → Custos
Recuperação sobre o subgrafo operacional, filtrada pelas Skills do perfil (bioma, cultura, estágio).
Padrão 3 · Autonomia e origem funcional Busca híbrida com filtro de origem
Gatilhos típicos: "tem alternativa local para...", "consigo produzir na fazenda...", "tem opção mais barata...", "depende de importado?". Classes envolvidas: Origem Funcional, Insumo, Contexto Territorial, Risco.
Função desejada → Insumos com mesma função → Filtro por origem → Análise de risco de dependência
Filtro estruturado sobre o campo origem_funcional dos chunks antes da busca semântica.
Padrão 4 · Qualidade funcional da produção Multi-hop sintetizador
Gatilhos típicos: "como melhorar a densidade nutricional...", "aumentar teor de proteína...", "qualidade da fibra...", "sabor do...". Classes envolvidas: Qualidade Funcional, Genética, Ambiente Produtivo, Manejo, Indicadores de qualidade.
Atributo de qualidade → Genética + Ambiente + Manejo → Práticas convergentes → Indicadores
Sintetiza três vetores simultâneos. Sem multi-hop, qualquer resposta vira simplificação enganosa.
Padrão 5 · Monitoramento e aprendizagem RAG simples + casos semelhantes
Gatilhos típicos: "que indicador devo medir...", "como saber se está melhorando...", "quanto tempo leva para ver resultado...". Classes envolvidas: Indicadores, Desempenho Funcional, Evidências.
Intervenção implantada → Indicadores aplicáveis → Métricas + janela temporal → Casos comparáveis
Indicadores e casos GAAS têm baixa ambiguidade. RAG leve resolve com fontes claras.
Padrão 6 · Conceitual e fundamentos RAG simples sobre Árvore do Conhecimento
Gatilhos típicos: "o que é...", "por que...", "qual a diferença entre...", "explica o princípio de...". Classes envolvidas: Fundamentos da ATR, Princípios, Conceitos, Diretrizes.
Conceito → Definição da Árvore do Conhecimento → Contexto histórico → Aplicação
Definições estáveis e bem cobertas pela curadoria. Busca vetorial simples sobre o ramo de Fundamentos resolve com baixa latência.
Sinalizações que disparam fallbacks
| Sinalização detectada | Ação do roteador |
|---|---|
| Pergunta vaga, sem contexto mínimo para classificar padrão | Pergunta de esclarecimento |
Skill erosao_avancada ativa ou Skills críticas em alerta | Escalonamento para consultor (Agente Guardião) |
| Pergunta recorrente já respondida pelo mesmo usuário | Cache semântico |
| Pergunta de benchmarking ("como outros estão fazendo...") | Casos semelhantes (rede GAAS) |
| Pergunta fora de escopo (política, religião, sensível) | Resposta breve do prompt do sistema, sem retrieval |
Matriz de estratégias RAG por padrão ontológico
Cada padrão tem uma estratégia canônica e duas alternativas. A política aprendida por reforço pode ajustar pesos com o tempo, mas o estado inicial é determinístico e auditável.
| Padrão | Estratégia canônica | Alternativas | Skills que reforçam |
|---|---|---|---|
| Diagnóstico | Multi-hop guiado pelo grafo ontológico | RAPTOR · Casos semelhantes | Solo Compactado, Baixa Nodulação, Bioma específico |
| Planejamento operacional | GraphRAG do subgrafo operacional | RAPTOR · Casos semelhantes | Cultura específica, Estágio de Transição |
| Autonomia · origem funcional | Busca híbrida com filtro de origem | Casos semelhantes regionais · GraphRAG | Acesso a Biomassa Regional, Organização Coletiva |
| Qualidade funcional | Multi-hop sintetizador | GraphRAG · RAPTOR | Foco em Densidade Nutricional, Certificação Orgânica |
| Monitoramento | RAG simples + casos semelhantes | Busca híbrida · GraphRAG | Transição em Curso, ATR Avançado |
| Conceitual | RAG simples sobre Árvore do Conhecimento | Busca híbrida | Iniciante ATR, Estudante |
Como as Skills entram como prior · exemplo prático
Suponha que a pergunta seja "meu solo está com baixa nodulação no segundo ano de soja". O roteador detecta padrão Diagnóstico, cuja estratégia canônica é multi-hop guiado. Antes de executar, lê as Skills ativas do perfil:
// Perfil ativo { "skills": [ "bioma_cerrado", "graos_soja_milho", "transicao_em_curso", "produtor_rural" ] } // Distribuição inicial sobre estratégias RAG { "multi_hop_guiado": 0.60, // canônica do padrão diagnóstico "casos_semelhantes": 0.25, // reforçada por "transicao_em_curso" "hibrida": 0.10, // reforçada por "graos_soja_milho" "raptor": 0.05 } // Filtros automáticos aplicados na recuperação { "bioma": ["cerrado"], "cultura": ["soja"], "classe_ontologica": ["sintoma", "causa_provavel", "processo", "intervencao"] }
Composição entre estratégias
Estratégias podem ser combinadas. O multi-hop guiado, por exemplo, pode usar busca híbrida em cada hop individual. Casos semelhantes podem complementar qualquer estratégia como contexto adicional. A política aprende quando vale a pena compor.
Multi-hop + Casos semelhantes
Diagnóstico ganha profundidade técnica do grafo e prova social dos casos da rede.
GraphRAG + Indexação hierárquica recursiva
Planejamento ganha estrutura operacional do grafo e profundidade textual da indexação hierárquica.
Híbrida + filtros de origem funcional
Autonomia usa busca híbrida sobre subconjunto pré-filtrado por origem própria ou regional.
Indexação ontológica · metadados de cada chunk
Cada nugget de conhecimento ingerido recebe uma ficha estruturada de metadados derivada da ontologia. Esses metadados são filtrados antes da busca semântica e reduzem o espaço de busca de centenas de milhares de chunks para algumas dezenas relevantes.
Busca puramente vetorial sobre todo o corpus traz muitos falsos positivos semanticamente próximos mas contextualmente inadequados. Um chunk sobre cafeicultura no Sul de Minas pode ser semanticamente vizinho de um chunk sobre cacau no Pará, mas raramente é útil cruzar os dois. Filtros estruturados resolvem isso.
Schema de metadados por chunk
// Metadados de um chunk · exemplo de prática regenerativa { "chunk_id": "gaas_2025_0473_p12", "texto": "...", // Eixo ontologia "classe_ontologica": "intervencao", "subclasse": "estrutural", "praticas_associadas": ["plantio_direto", "plantas_cobertura"], "processos_afetados": ["agregacao", "infiltracao", "ciclagem"], "estruturas_fortalecidas": ["porosidade_funcional", "cobertura_viva"], "sintomas_aplicaveis": ["compactacao", "baixa_infiltracao", "erosao"], // Eixo Árvore do Conhecimento "ramo_taxonomia": "estruturas_fundamentais/estrutura_solo/estrutura_fisica", // Eixo contexto "bioma": ["cerrado"], "cultura": ["soja", "milho"], "escala": "talhao", "estagio_transicao": ["transicao_inicial", "transicao_intermediaria"], // Eixo evidência "tipo_evidencia": "caso_validado_gaas", "confiabilidade": 0.87, "fonte": "GAAS_relato_produtor_MG_2024", "validacao": "comite_curadoria_gaas_2025q1", "ano": 2024, // Eixo autonomia "origem_funcional": "propria", // Embedding "embedding_model": "openai-text-embedding-3-large", "versao_schema": "ontologia_v2_2026.05" }
Como o roteador usa esses metadados
Dado o padrão de consulta detectado e as Skills ativas do perfil, o roteador monta um filtro estruturado e passa para o retriever:
| Padrão da consulta | Filtros aplicados antes do semântico |
|---|---|
| Diagnóstico | classe_ontologica em [sintoma, causa, processo, estrutura, intervencao]; bioma e cultura do perfil |
| Planejamento | classe_ontologica em [intervencao, pratica, insumo]; filtros de bioma, cultura, estágio |
| Autonomia | origem_funcional em [propria, coletiva_regional, regional]; demais filtros de contexto |
| Qualidade | classe_ontologica em [qualidade_funcional, genetica, indicador_qualidade]; cultura |
| Monitoramento | classe_ontologica em [indicador, desempenho, evidencia]; bioma, cultura |
| Conceitual | ramo_taxonomia com prefixo fundamentos_atr/ |
Pipeline de ingestão · responsabilidade da curadoria
- Captura: nugget vem de WhatsApp curado, artigo científico, relato de produtor, protocolo GAAS.
- Classificação ontológica: agente classificador atribui classe, subclasse e relações.
- Tagueamento contextual: bioma, cultura, escala, estágio são inferidos ou marcados na curadoria.
- Validação humana: comitê GAAS aprova classes de alta criticidade (intervenções, dosagens, contraindicações).
- Embedding e indexação: chunk vai para o índice vetorial com todos os metadados anexados.
- Versionamento: cada chunk carrega versão do schema, permitindo reindexar quando a ontologia evolui.
Fluxo de execução · pipeline completo
O pipeline integra as cinco camadas em um ciclo de execução. Skills do perfil entram como prior que orienta o roteador antes do aprendizado por reforço atuar. O roteador classifica o padrão da consulta e ativa o template de CoT ontológico correspondente, que é a camada orquestradora, quem decide a sequência de raciocínio e dispara o retrieval a cada passo. A resposta volta como prosa natural, com fontes, e o feedback alimenta a evolução da política e dos próprios templates de CoT.
Usuário · Produtor · Técnico · Consultor
Pergunta + Perfil Agrícola + Skills + Histórico + Tier
Agente Roteador
Classificador de padrão ontológico
Skills ativas → prior + filtros de retrieval
Política aprendida (RL · Bandit · Feedback)
Template de CoT ontológico ativado: define profundidade e sequência do raciocínio
Passo CoT → Retrieval específico → Síntese → Próximo passo
Estratégia RAG selecionada por passo do CoT
Contexto estruturado pelo CoT + Prompt do sistema → LLM
Resposta em prosa natural · fontes · neutralidade comercial
Feedback do usuário + avaliação técnica + métricas
Atualização da política + evolução dos templates de CoT
O que muda em relação à versão anterior do fluxo
Fluxo anterior (sem CoT)
- Roteador escolhe uma estratégia RAG única
- Estratégia executa, devolve chunks, LLM responde
- Sequência de raciocínio fica a cargo da LLM
- Feedback ajusta política sobre estratégias
Fluxo atualizado (com CoT ontológico)
- Roteador classifica padrão e ativa template de CoT
- CoT orquestra múltiplos passos com retrieval específico em cada um
- Sequência de raciocínio é definida pela ontologia
- Feedback ajusta política sobre estratégias E templates de CoT
O fluxo tem três loops de aprendizado convivendo: o loop interno do CoT (passos sequenciais dentro de uma única resposta), o loop da política RL (melhora a escolha de estratégia entre interações) e o loop epistemológico do GAAS (evolução dos próprios templates de CoT e da ontologia a partir das amostras revisadas pelo comitê). A camada de CoT é o ponto onde os três se articulam.
Diagnóstico passo a passo · CoT ontológico em execução
Aplicação concreta do pipeline geral para o padrão mais complexo: o diagnóstico. Cada passo do CoT é uma relação explícita da ontologia, e cada passo dispara um retrieval específico antes do próximo. Para o fluxo geral em todas as suas etapas, ver a aba Fluxo.
"Estou notando baixa nodulação na minha soja no segundo ano. O que pode estar acontecendo e o que faço?"
Skills ativas do perfil: bioma_cerrado, graos_soja_milho, transicao_em_curso, produtor_rural.
Padrão detectado pelo roteador: Diagnóstico. Template de CoT ativado: cadeia diagnóstica completa (7 passos).
Execução passo a passo · CoT + retrieval
Clique em cada passo para abrir o detalhe do retrieval.
classe_ontologica=sintoma, busca semântica por "baixa nodulação". Síntese do passo: sintoma classificado como baixa_nodulacao, ligado às relações ontológicas que conduzirão os próximos passos.classe_ontologica=causa_provavel, sintomas_aplicaveis inclui baixa_nodulacao, bioma=cerrado, cultura=soja. Síntese do passo: baixa atividade microbiológica, acidez subsuperficial, inoculante de baixa viabilidade, excesso de nitrogênio mineral, compactação.classe_ontologica=processo, processos_afetados ligados às causas do passo anterior. Síntese do passo: fixação biológica de nitrogênio (FBN), micorrização, biodisponibilização de nutrientes.classe_ontologica=estrutura, cruzando com os processos do passo anterior. Síntese: microbioma funcional, ambiente rizosférico, cobertura viva, agregados estáveis.classe_ontologica=intervencao, cruzando processos_afetados e estruturas_fortalecidas dos passos 3 e 4. Síntese: reinoculação de qualidade, correção em profundidade quando necessária, plantas de cobertura específicas, redução de nitrogênio mineral, bioestimulação.classe_ontologica=pratica, praticas_associadas às intervenções do passo 5, bioma=cerrado, cultura=soja. Casos semelhantes da rede GAAS são puxados em paralelo, reforçando a relevância contextual.classe_ontologica=indicador, ligados aos processos e estruturas dos passos anteriores. Síntese: contagem de nódulos, análise foliar de nitrogênio, vigor da planta, evolução em ciclos seguintes.Síntese e prompt final do LLM
Os sete passos do CoT montam um contexto estruturado segundo o template diagnóstico. O LLM recebe esse contexto e o prompt do sistema conversacional, e gera uma resposta em prosa natural, com a continuação proativa exigida pelo prompt. O usuário não percebe os passos individualmente: vê uma explicação coerente que começa pelo sintoma, percorre as causas e os processos, e culmina na intervenção com os indicadores de acompanhamento. A regra-mãe da ontologia se cumpre estruturalmente, sem precisar estar escrita no prompt.
No multi-hop livre, a LLM decompõe a pergunta em sub-perguntas semânticas e cada sub-pergunta é uma busca vetorial. Isso introduz variância e perde a estrutura causal. No CoT ontológico, cada passo é uma relação ontológica explícita, auditável e versionada. A LLM não decide o caminho, ela apenas sintetiza o contexto recuperado em prosa. A profundidade técnica vem da ontologia, a sequência vem do CoT, a linguagem vem do prompt do sistema.
Quando o fluxo é interrompido
- Passo 1 inconclusivo: sintoma não identificado com clareza. Roteador devolve para pergunta de esclarecimento.
- Passo 2 muito amplo: causas prováveis sem convergência. Sistema solicita ao usuário 1 ou 2 perguntas de desambiguação (cor das folhas, idade do problema, histórico recente).
- Skill crítica ativa: se durante o diagnóstico aparece Skill como
erosao_avancadaou produção em larga escala sem assistência técnica, Agente Guardião interrompe e escala. - Risco de recomendação irreversível: dosagens, defensivos específicos, decisões de plantio. Resposta inclui ressalva e oferece escalonamento.
Roadmap de implementação em quatro fases
Cada fase entrega valor isolado e prepara terreno para a próxima. A ordem prioriza frugalidade. A Fase 0 demonstra o conceito de CoT ontológico imediatamente, com Skills fixas e um CoT primário engessado, antes de qualquer investimento em classificadores, bandit ou RL. É a prova de método antes da prova de escala.
Skills fixas + CoT primário engessado
Demonstrar o método antes da escala. Mesmo com tudo hardcoded e sem aprendizado, o sistema já entrega um raciocínio que segue a cadeia ontológica. A entrega é a estrutura do pensamento, não a sofisticação técnica.
- Skills fixas hardcoded: conjunto inicial pré-definido por anamnese simples ou cadastro (bioma, cultura principal, estágio de transição, perfil profissional). Sem inferência automática, sem catálogo versionado dinâmico.
- CoT primário engessado: implementação do template diagnóstico canônico como sequência fixa de passos (Sintoma → Causa → Processo → Estrutura → Intervenção → Prática → Indicador). Disparado por palavras-chave simples na pergunta.
- Retrieval por passo: cada passo do CoT dispara uma busca filtrada pela Skill ativa. Sem multi-hop sofisticado, sem GraphRAG, sem casos semelhantes ainda. Busca vetorial direta com filtros estruturados.
- Tagueamento mínimo: apenas as classes ontológicas essenciais (sintoma, causa, processo, intervenção, prática, indicador) marcadas nos chunks. Cobertura parcial é aceitável.
- Padrões fixos: três padrões iniciais com CoT engessado: diagnóstico, conceitual, conversacional. Outros padrões caem em fallback genérico até a F1.
- Prompt do sistema inalterado. O CoT entra como template injetado no contexto antes do prompt, sem alterar persona ou tom.
Entrega: respostas diagnósticas que visivelmente seguem a cadeia ontológica. O produtor percebe que o sistema "pensa antes de responder". O GAAS valida que o método regenerativo está embutido na resposta, mesmo que mecanicamente. Demonstra viabilidade do CoT antes de investir nas camadas posteriores.
O que aceitamos como limitação nesta fase: respostas podem ser repetitivas, o sistema não adapta o CoT ao contexto, perguntas fora dos três padrões caem em fallback simples. Tudo isso melhora nas fases seguintes.
Indexação ontológica completa + classificador de padrões heurístico
- Schema de metadados ontológicos completo aplicado aos chunks já indexados (reindexação incremental)
- Pipeline de ingestão atualizado para taguear novos chunks automaticamente, com revisão humana para classes críticas
- Classificador de padrões baseado em palavras-chave e estrutura sintática (regras explícitas, auditáveis), substitui o gatilho por palavras-chave da F0
- Templates de CoT ampliados para os seis padrões (não mais só três)
- Skills do perfil passam a ser inferidas pela anamnese conversacional, não mais hardcoded
- Catálogo versionado de Skills sob curadoria GAAS
- Prompt do sistema permanece como hoje (já é enxuto)
Entrega: redução mensurável de falsos positivos no retrieval, CoT funcional para os seis padrões, auditoria completa de cada resposta (qual padrão, qual CoT, quais filtros, quais chunks).
Multi-hop sofisticado + bandit contextual no roteador
- Multi-hop guiado pelo grafo ontológico ganha sofisticação (síntese explícita entre passos, retrieval composto)
- Templates de CoT evoluem para incluir relações entre passos e ramificações condicionais
- Classificador de padrões ganha modelo treinado a partir das classificações da fase 1
- Bandit contextual escolhe entre estratégias canônicas e alternativas usando feedback do usuário e avaliações dos consultores
- Skills viram features do estado do bandit
- GraphRAG implementado para padrões de planejamento operacional
- Casos semelhantes integrados em paralelo ao multi-hop
Entrega: respostas diagnósticas com profundidade técnica auditável e melhoria contínua da política a cada interação avaliada.
RL completo + ontologia evolutiva + inferência ativa de Skills
- Política RL completa, com Skills, padrões e metadados como vetor de estado
- Roteador detecta lacunas de Skills no perfil e pede confirmação ao usuário quando ambíguo
- Mineração contínua de novos sintomas, causas e relações a partir dos casos da rede GAAS
- Curadoria GAAS revisa propostas de evolução ontológica geradas pelo sistema
- Composição automática de estratégias (multi-hop + casos, graph + indexação hierárquica recursiva) com base em recompensa observada
- Templates de CoT evoluem com base em recompensa por padrão e por Skill
- Auditoria humana periódica de amostras estratificadas por padrão e Skill
Entrega: infraestrutura de inteligência coletiva auto-otimizante, com a ontologia da ATR evoluindo a partir do uso real e a curadoria GAAS atuando como guardiã epistêmica.
Critérios de avaliação por fase
| Fase | Métricas técnicas | Métricas de produto |
|---|---|---|
| F0 | Aderência da resposta à cadeia ontológica (revisão GAAS), latência aceitável, cobertura dos três padrões iniciais | Percepção do produtor de que o sistema "pensa antes de responder", validação do método pelo comitê GAAS |
| F1 | Precisão do classificador de padrões, redução de chunks irrelevantes, cobertura de tagueamento ontológico | Aprovação da resposta pelo produtor, redução de pedidos de esclarecimento |
| F2 | Coerência do multi-hop, taxa de hops válidos, melhoria do bandit ao longo do tempo | NPS por padrão de consulta, tempo até resposta útil, retenção |
| F3 | Recompensa média da política RL, novidade detectada na ontologia, qualidade da inferência de Skills | Engajamento longitudinal, casos resolvidos sem escalação, contribuição da rede |
F0 valida o conceito de CoT ontológico antes de qualquer investimento estrutural, é a prova de método. F1 substitui Skills fixas por inferência e amplia a indexação. F2 sofistica o multi-hop e introduz aprendizado. F3 fecha o ciclo com RL completo e ontologia evolutiva. Nenhuma fase exige reescrita do prompt do sistema. Todas as quatro fases preservam a regra-mãe da ontologia: nenhuma recomendação é feita sem explicitar sintoma, causas, processos, estruturas, intervenções e indicadores.