RegenerAI · Roteamento ontológico

Como a ontologia da ATR opera em três funções articuladas: estrutura de dados, estrutura de busca e estrutura de raciocínio (Chain of Thought). Skills definem perfil, padrões definem intenção, metadados definem escopo e templates de CoT orquestram a sequência de pensamento do agente, mantendo o prompt do sistema enxuto e a profundidade técnica auditável.

Versão: v2 · com CoT ontológico Plataforma: RegenerAI · ATR / GAAS Confidencialidade: Uso interno Stack: OpenAI · indexação hierárquica recursiva

A tese em uma frase

A ontologia da ATR opera em três funções articuladas: estrutura de dados (classes e relações), estrutura de busca (multi-hop sobre o grafo) e, hierarquicamente superior, estrutura de raciocínio do agente (Chain of Thought). A cadeia Sintoma → Causa → Processo → Estrutura → Intervenção → Prática → Monitoramento não é só taxonomia, é a forma como o agrônomo regenerativo pensa. Materializar essa cadeia como CoT no sistema é o que diferencia o RegenerAI de um simples mecanismo de recuperação aumentada.

A premissa epistemológica

A regra-mãe da ontologia afirma que nenhuma recomendação deve ser baseada apenas na escolha de um insumo, e que toda recomendação precisa explicitar sintoma, causas, processos, estruturas, intervenções e indicadores. Isso não é instrução sobre como buscar conhecimento. É instrução sobre como raciocinar. O CoT ontológico transforma essa regra em comportamento estrutural do agente, não em texto inflado dentro do prompt do sistema.

As três funções da ontologia no sistema

Função 1

Estrutura de dados

Classes, subclasses, atributos e relações. Materializada como schema de metadados em cada chunk indexado. É o vocabulário formal do sistema.

Função 2

Estrutura de busca

Grafo navegável de relações ontológicas. Materializada como multi-hop retrieval guiado. É como o sistema encontra evidência relevante.

Função 3 · superior

Estrutura de raciocínio

Cadeia de pensamento do agente: Sintoma → Causa → Processo → Estrutura → Intervenção → Monitoramento. Materializada como CoT templates que orquestram quando e como as outras duas funções são acionadas.

O que muda com essa releitura

Ontologia só como dados e busca

Sistema pula da pergunta para a recomendação
Multi-hop fica como decomposição livre da LLM
Regra-mãe vira instrução solta no prompt
Sem rastreabilidade do raciocínio
Resposta correta sem método

Ontologia como CoT + busca + dados

Agente percorre cadeia diagnóstica antes da recomendação
Multi-hop guiado pelos passos do CoT
Regra-mãe estruturada no comportamento
Cada passo do raciocínio é artefato inspecionável
Resposta correta com método regenerativo embutido

Três sinais combinados no roteador

A política do agente roteador decide a profundidade do CoT e a estratégia RAG combinando três sinais independentes, sem misturar suas responsabilidades:

Quem

Skills do perfil

Bioma, cultura principal, estágio de transição, perfil profissional, maturidade ATR. Vêm da anamnese, da declaração explícita ou de inferência.

O quê

Padrão ontológico de consulta

Diagnóstico, planejamento, autonomia, qualidade, monitoramento ou conceitual. Classificador leve mapeia a pergunta ao padrão antes do raciocínio.

Onde

Metadados da indexação

Cada chunk carrega a classe ontológica, o subdomínio da Árvore do Conhecimento, contexto territorial e tipo de evidência. Filtros antes do semântico.

Por que esta articulação

O padrão detectado determina o template de CoT a ser executado. O CoT define a sequência de passos de raciocínio. Cada passo do CoT dispara um retrieval específico, filtrado pelas Skills do perfil e pelos metadados da indexação. As três camadas atuam em conjunto, mas o CoT é quem orquestra. Ele é a função epistemicamente superior da ontologia no sistema.

O que sai do prompt do sistema

Vocabulário técnico especializado (vai para chunks e metadados)
Regras de raciocínio diagnóstico (viram templates de CoT ontológico)
Mapeamentos sintoma → causa → processo (viram passos canônicos do CoT)
Adequação ao perfil (vira prior do roteador, via Skills)
Critérios de escalonamento técnico (regras do Agente Guardião)

O que fica no prompt do sistema

Persona e tom (conversa de campo, linguagem simples)
Regras de formato (prosa por padrão, listas só quando pedidas)
Política de segurança e escopo
Política de fechamento (continuação proativa)
Regra de fallback para conhecimento geral quando o contexto vier vazio

As cinco camadas da arquitetura

Cada camada tem uma responsabilidade única e versionável de forma independente. O prompt do sistema é a camada mais leve e estável. A camada de templates de raciocínio ontológico (CoT) é a hierarquicamente superior: é quem decide quando e como as outras três camadas técnicas são acionadas.

Clique em cada camada para abrir o detalhe.

01

Templates de raciocínio ontológico (CoT) orquestradora

Camada 1 · orquestradora

Cadeia de pensamento do agente: Sintoma → Causa → Processo → Estrutura → Intervenção → Prática → Monitoramento → Resultado → Aprendizado. Cada padrão de consulta tem um template de CoT que define quais passos da cadeia são percorridos e em que ordem. É a camada que materializa a regra-mãe da ontologia como comportamento estrutural do agente, não como texto no prompt. Hierarquicamente superior: decide quando acionar Skills, busca e metadados.

›

02

Prompt do sistema

Camada 2

Persona, tom de campo, regras de formato, política de segurança e escopo, fechamento proativo. Estável por meses. Não contém ontologia, taxonomia, regras diagnósticas ou viéses de perfil. Recebe o contexto já estruturado pelo CoT e renderiza em prosa natural.

›

03

Catálogo de Skills

Camada 3

Taxonomia versionada pelo GAAS. Cada Skill: identificador, categoria, RAG bias padrão, tier mínimo, agente responsável pela inferência. Skills vêm das classes de contexto da ontologia (Agroecossistema, Contexto Territorial, Genética, Estágio de Transição) e do perfil profissional. Funcionam como prior do raciocínio.

›

04

Roteador de padrões

Camada 4

Classificador leve detecta o padrão ontológico da consulta (diagnóstico, planejamento, autonomia, qualidade, monitoramento, conceitual). Cada padrão ativa um template de CoT específico, que por sua vez decide a profundidade do raciocínio e a estratégia RAG canônica. Política aprendida por reforço refina a escolha ao longo do tempo.

›

05

Indexação ontológica

Camada 5

Cada chunk carrega metadados: classe ontológica, subclasse, ramo da Árvore do Conhecimento, bioma, cultura, escala, tipo de evidência, origem funcional, ano. Filtros estruturados antes da busca semântica, disparados a cada passo do CoT, reduzem o espaço de busca em uma ordem de grandeza.

›

Princípio de separação

O CoT decide "o que pensar e em que ordem". O roteador decide "qual estratégia de busca para cada passo". As Skills decidem "com qual viés de perfil". Os metadados decidem "sobre qual escopo de conhecimento". O prompt do sistema decide "como falar". Essa separação é o que mantém o sistema escalável: novas culturas, novos biomas, novas práticas e novas classes ontológicas entram nas camadas técnicas sem tocar no prompt nem no CoT.

Quem é dono de cada camada

Camada	Versionamento	Curadoria	Frequência de mudança
Templates de CoT	Git interno + revisão GAAS	Syntropy Labs + comitê GAAS	Bimestral
Prompt do sistema	Git interno	Syntropy Labs	Trimestral
Catálogo de Skills	Tabela versionada	Comitê GAAS	Mensal
Roteador de padrões	Modelo + heurísticas	Syntropy Labs	Contínuo (RL)
Indexação ontológica	Schema versionado	GAAS técnico	A cada ingestão

CoT ontológico · a ontologia como estrutura de raciocínio

A cadeia que aparece logo no início do documento da ontologia não é só uma classificação. É um Chain of Thought. É exatamente como o agrônomo regenerativo pensa quando enfrenta um problema no campo. O método da Agricultura de Processo materializado em sequência de raciocínio.

A cadeia canônica da ontologia ATR

Contexto → Sintoma → Causa provável → Processos comprometidos → Estrutura fragilizada → Intervenções → Prática / Serviço / Insumo → Monitoramento → Resultado funcional → Aprendizado → Compartilhamento com pares

Por que tratar isso como CoT muda tudo

Sem CoT explícito, o agente pula da pergunta para a recomendação. Pode até acertar, mas perde o método. Com CoT ontológico, o agente percorre a cadeia diagnóstica antes de sugerir intervenção. A resposta final continua sendo prosa de campo, mas a forma da resposta carrega o método regenerativo embutido.

Ganho 1

Qualidade técnica

O agente atende a regra-mãe da ontologia de forma estrutural, não como instrução solta no prompt. Toda recomendação explicita sintoma, causas, processos, estruturas, intervenções e indicadores.

Ganho 2

Pedagogia implícita

Mesmo quando a resposta final sai em prosa fluida, a forma da resposta ensina o produtor a pensar como agrônomo regenerativo. O RegenerAI não responde só perguntas, ensina o método da Agricultura de Processo.

Ganho 3

Auditabilidade

Cada passo do CoT é artefato inspecionável. O comitê GAAS revisa amostras passo a passo: qual sintoma o agente identificou, quais causas considerou, por que escolheu essa intervenção e não outra. Calibração fina sem mexer no prompt nem no modelo.

Profundidade do CoT por padrão de consulta

Nem toda pergunta justifica percorrer a cadeia inteira. Forçar isso engessaria respostas simples e geraria verbosidade desnecessária. O classificador de padrões decide a profundidade do raciocínio em cada caso.

Padrão	Passos do CoT	Profundidade
Diagnóstico	`Sintoma → Causa → Processo → Estrutura → Intervenção → Prática → Indicador`	Cadeia inteira (7 passos)
Planejamento	`Objetivo → Intervenções compatíveis → Práticas → Insumos → Sequência → Custo`	6 passos
Qualidade funcional	`Atributo desejado → Genética + Ambiente + Manejo → Práticas convergentes → Indicador`	4 passos (sintetizadores)
Autonomia	`Função desejada → Alternativas por origem → Risco de dependência → Recomendação`	4 passos
Monitoramento	`Intervenção implantada → Indicadores → Janela temporal → Resultado esperado`	4 passos
Conceitual	`Definição → Contexto → Aplicação`	3 passos
Conversacional	`(direto ao prompt do sistema)`	Sem CoT

Como CoT e retrieval interagem

O CoT define a espinha do raciocínio. O retrieval alimenta cada passo do raciocínio com evidência específica. A interação é iterativa, não paralela.

// Loop interno do CoT diagnóstico

para cada passo da cadeia (sintoma, causa, processo, estrutura, intervenção, prática, indicador):

  1. Agente formula intenção do passo
     // "Quais causas prováveis explicam baixa nodulação em soja no Cerrado?"

  2. Roteador dispara retrieval com filtros
     // classe_ontologica=causa_provavel
     // bioma=cerrado, cultura=soja
     // sintomas_aplicaveis inclui "baixa_nodulacao"

  3. Retrieval devolve chunks relevantes

  4. Agente sintetiza o passo
     // "Considerando o contexto, as causas mais prováveis são X, Y, Z"

  5. Síntese do passo alimenta o próximo passo do CoT
     // X, Y, Z viram input do retrieval do próximo hop

ao final da cadeia:

  6. Contexto estruturado vai para o LLM
     // junto com o prompt do sistema, que renderiza em prosa natural

Diferença em relação ao multi-hop livre

Multi-hop livre (sem CoT ontológico)

LLM decompõe a pergunta em sub-perguntas semânticas
Cada sub-pergunta é uma busca vetorial independente
Caminho varia a cada execução
Síntese final pode pular passos relevantes
Difícil auditar por que chegou a esta recomendação

CoT ontológico (multi-hop guiado)

Cadeia de raciocínio é definida pelo padrão detectado
Cada passo é uma relação ontológica explícita
Caminho determinístico e versionado
Síntese final segue a sequência completa do padrão
Cada passo é artefato inspecionável pelo comitê GAAS

A regra-mãe operacionalizada

A ontologia afirma: "nenhuma recomendação deve ser baseada apenas na escolha de um insumo. Toda recomendação deve explicitar o sintoma observado, as causas prováveis, os processos comprometidos, as estruturas funcionais envolvidas, as intervenções possíveis, os critérios de escolha e os indicadores de monitoramento." O CoT ontológico é o que transforma essa regra em comportamento do sistema, e não em texto inflado dentro do prompt. Quando o produtor pergunta "o que aplico?", o sistema não responde com um insumo. Responde percorrendo a cadeia, e o insumo, se aparece, aparece no final, justificado por tudo que veio antes.

Mapeamento da ontologia para Skills

As 16 classes da ontologia não viram todas Skills. As classes de contexto e perfil viram Skills, porque descrevem quem está perguntando e em que situação produtiva está. As classes de raciocínio diagnóstico e operacional não viram Skills: viram padrões de consulta detectados pelo roteador. As classes de conhecimento e evidência viram metadados da indexação.

Regra de mapeamento

Skills representam atributos persistentes do usuário e da propriedade. Padrões de consulta representam a intenção pontual de uma pergunta. Metadados representam atributos do conhecimento indexado. Misturar essas três funções é a principal armadilha que esta arquitetura evita.

Classes de contexto e perfil · viram Skills

Classe ontológica	Skills derivadas	Origem da Skill
Agroecossistema	Bioma Cerrado, Bioma Amazônia, Bioma Mata Atlântica, Bioma Caatinga, Bioma Pampa, Bioma Pantanal, Talhão Pequeno, Talhão Grande, Microbacia	Anamnese · Diagnóstico Territorial
Contexto Territorial	Agroecorregião, Acesso a Biomassa, Acesso a Minerais Regionais, Organização Coletiva, Cadeia de Valor Curta	Anamnese + cruzamento ZARC/INMET
Genética	Cafeicultura, Pecuária / ILPF, Hortifruti, Grãos (Soja/Milho), Cana, Citricultura, Cacau, Sistemas Agroflorestais	Anamnese · cultivos atuais
Desempenho Funcional	Iniciante ATR, Transição em Curso, ATR Avançado, Certificação Orgânica, Foco em Densidade Nutricional	Agente de Maturidade Regenerativa
Perfil profissional	Produtor Rural, Técnico de Campo, Consultor Agrônomo, Pesquisador, Estudante	Cadastro explícito

Classes de processo e estrutura · podem virar Skills situacionais

Algumas subclasses de Sintomas e Processos são duradouras o suficiente para virar Skills situacionais, ativadas durante a transição e desativadas quando o problema é resolvido. Funcionam como diagnósticos persistentes no perfil.

Classe ontológica	Skills situacionais	Disparo
Sintomas crônicos	Solo Compactado, Erosão Avançada, Baixa Nodulação Recorrente, Estresse Hídrico Sazonal, Mato Competição	Anamnese ou conversa repetida
Processos comprometidos	Ciclagem Comprometida, Supressividade Baixa, Microbioma Frágil, FBN Ineficiente	Análise de solo + diagnóstico do agente
Estruturas fragilizadas	Cobertura Vegetal Baixa, Carbono Funcional Baixo, Mineralogia Pobre	Análise de solo + observação de campo

Classes que NÃO viram Skills

Padrão de consulta

Sintomas (uso pontual)

Quando o produtor descreve um sintoma novo na pergunta, o roteador detecta padrão diagnóstico. Não vira Skill, é intenção pontual.

Padrão de consulta

Causas Prováveis

Hipóteses causais são saída do raciocínio do agente, não atributo do usuário. Ficam no template de contexto diagnóstico.

Padrão de consulta

Intervenções e Práticas

Quando o produtor pergunta "o que fazer", o roteador detecta padrão operacional. Práticas viram metadados de chunks, não Skills.

Metadado

Insumos, Serviços e Tecnologias

Vão para metadados dos chunks (tipo, função, origem funcional, evidências requeridas).

Metadado

Indicadores

Tags nos chunks. Quando relevante, viram parte do template de monitoramento.

Metadado

Evidências

Atributos de cada chunk: fonte, confiabilidade, contexto, ano, validação. Filtros de qualidade no retrieval.

Estrutura de uma Skill

// Exemplo · Skill derivada da classe Agroecossistema
{
  "id": "bioma_cerrado",
  "categoria": "contexto_territorial",
  "classe_ontologica": "Agroecossistema",
  "rag_bias": {
    "graphrag": 0.45,
    "casos_semelhantes": 0.30,
    "hibrida": 0.15,
    "raptor": 0.10
  },
  "filtros_indexacao": {
    "bioma": "cerrado",
    "agroecorregiao": "*"
  },
  "tier_minimo": "semente",
  "agente_inferencia": "diagnostico_territorial",
  "versao": "2026.05.01"
}

Os seis padrões de consulta ontológicos

A seção H da ontologia define seis grupos de perguntas que o sistema precisa responder. Cada grupo é um padrão de consulta com estrutura previsível, classes ontológicas envolvidas e estratégia RAG canônica. O roteador classifica cada consulta em um padrão antes de decidir a estratégia.

Como funciona o classificador de padrões

Na fase 1 é um classificador leve baseado em palavras-chave e estrutura sintática da pergunta. Na fase 2 vira um classificador multinominal pequeno treinado com exemplos do próprio sistema. Na fase 3 vira parte da política RL como variável latente. Em qualquer fase, o padrão detectado é registrado e auditável.

Padrão 1 · Diagnóstico Multi-hop guiado por ontologia

Gatilhos típicos: "meu solo está...", "estou com problema de...", "as plantas estão...", "por que aparece...". Classes envolvidas: Sintoma, Causa Provável, Processo, Estrutura, Intervenção.

Sintoma → Causas → Processos → Estruturas → Intervenções → Práticas

Cada hop é uma relação explícita da ontologia. O multi-hop não é decomposição livre da LLM, é navegação no grafo ontológico.

Padrão 2 · Planejamento operacional GraphRAG do subgrafo operacional

Gatilhos típicos: "como faço para...", "qual a melhor prática para...", "quero implantar...", "qual o protocolo de...". Classes envolvidas: Intervenção, Prática, Insumo, Tecnologia.

Intervenção → Práticas compatíveis → Insumos → Sequência operacional → Custos

Recuperação sobre o subgrafo operacional, filtrada pelas Skills do perfil (bioma, cultura, estágio).

Padrão 3 · Autonomia e origem funcional Busca híbrida com filtro de origem

Gatilhos típicos: "tem alternativa local para...", "consigo produzir na fazenda...", "tem opção mais barata...", "depende de importado?". Classes envolvidas: Origem Funcional, Insumo, Contexto Territorial, Risco.

Função desejada → Insumos com mesma função → Filtro por origem → Análise de risco de dependência

Filtro estruturado sobre o campo origem_funcional dos chunks antes da busca semântica.

Padrão 4 · Qualidade funcional da produção Multi-hop sintetizador

Gatilhos típicos: "como melhorar a densidade nutricional...", "aumentar teor de proteína...", "qualidade da fibra...", "sabor do...". Classes envolvidas: Qualidade Funcional, Genética, Ambiente Produtivo, Manejo, Indicadores de qualidade.

Atributo de qualidade → Genética + Ambiente + Manejo → Práticas convergentes → Indicadores

Sintetiza três vetores simultâneos. Sem multi-hop, qualquer resposta vira simplificação enganosa.

Padrão 5 · Monitoramento e aprendizagem RAG simples + casos semelhantes

Gatilhos típicos: "que indicador devo medir...", "como saber se está melhorando...", "quanto tempo leva para ver resultado...". Classes envolvidas: Indicadores, Desempenho Funcional, Evidências.

Intervenção implantada → Indicadores aplicáveis → Métricas + janela temporal → Casos comparáveis

Indicadores e casos GAAS têm baixa ambiguidade. RAG leve resolve com fontes claras.

Padrão 6 · Conceitual e fundamentos RAG simples sobre Árvore do Conhecimento

Gatilhos típicos: "o que é...", "por que...", "qual a diferença entre...", "explica o princípio de...". Classes envolvidas: Fundamentos da ATR, Princípios, Conceitos, Diretrizes.

Conceito → Definição da Árvore do Conhecimento → Contexto histórico → Aplicação

Definições estáveis e bem cobertas pela curadoria. Busca vetorial simples sobre o ramo de Fundamentos resolve com baixa latência.

Sinalizações que disparam fallbacks

Sinalização detectada	Ação do roteador
Pergunta vaga, sem contexto mínimo para classificar padrão	Pergunta de esclarecimento
Skill `erosao_avancada` ativa ou Skills críticas em alerta	Escalonamento para consultor (Agente Guardião)
Pergunta recorrente já respondida pelo mesmo usuário	Cache semântico
Pergunta de benchmarking ("como outros estão fazendo...")	Casos semelhantes (rede GAAS)
Pergunta fora de escopo (política, religião, sensível)	Resposta breve do prompt do sistema, sem retrieval

Matriz de estratégias RAG por padrão ontológico

Cada padrão tem uma estratégia canônica e duas alternativas. A política aprendida por reforço pode ajustar pesos com o tempo, mas o estado inicial é determinístico e auditável.

Padrão	Estratégia canônica	Alternativas	Skills que reforçam
Diagnóstico	Multi-hop guiado pelo grafo ontológico	RAPTOR · Casos semelhantes	Solo Compactado, Baixa Nodulação, Bioma específico
Planejamento operacional	GraphRAG do subgrafo operacional	RAPTOR · Casos semelhantes	Cultura específica, Estágio de Transição
Autonomia · origem funcional	Busca híbrida com filtro de origem	Casos semelhantes regionais · GraphRAG	Acesso a Biomassa Regional, Organização Coletiva
Qualidade funcional	Multi-hop sintetizador	GraphRAG · RAPTOR	Foco em Densidade Nutricional, Certificação Orgânica
Monitoramento	RAG simples + casos semelhantes	Busca híbrida · GraphRAG	Transição em Curso, ATR Avançado
Conceitual	RAG simples sobre Árvore do Conhecimento	Busca híbrida	Iniciante ATR, Estudante

Como as Skills entram como prior · exemplo prático

Suponha que a pergunta seja "meu solo está com baixa nodulação no segundo ano de soja". O roteador detecta padrão Diagnóstico, cuja estratégia canônica é multi-hop guiado. Antes de executar, lê as Skills ativas do perfil:

// Perfil ativo
{
  "skills": [
    "bioma_cerrado",
    "graos_soja_milho",
    "transicao_em_curso",
    "produtor_rural"
  ]
}

// Distribuição inicial sobre estratégias RAG
{
  "multi_hop_guiado":    0.60,  // canônica do padrão diagnóstico
  "casos_semelhantes":   0.25,  // reforçada por "transicao_em_curso"
  "hibrida":             0.10,  // reforçada por "graos_soja_milho"
  "raptor":              0.05
}

// Filtros automáticos aplicados na recuperação
{
  "bioma": ["cerrado"],
  "cultura": ["soja"],
  "classe_ontologica": ["sintoma", "causa_provavel", "processo", "intervencao"]
}

Composição entre estratégias

Estratégias podem ser combinadas. O multi-hop guiado, por exemplo, pode usar busca híbrida em cada hop individual. Casos semelhantes podem complementar qualquer estratégia como contexto adicional. A política aprende quando vale a pena compor.

Composição comum

Multi-hop + Casos semelhantes

Diagnóstico ganha profundidade técnica do grafo e prova social dos casos da rede.

Composição comum

GraphRAG + Indexação hierárquica recursiva

Planejamento ganha estrutura operacional do grafo e profundidade textual da indexação hierárquica.

Composição comum

Híbrida + filtros de origem funcional

Autonomia usa busca híbrida sobre subconjunto pré-filtrado por origem própria ou regional.

Indexação ontológica · metadados de cada chunk

Cada nugget de conhecimento ingerido recebe uma ficha estruturada de metadados derivada da ontologia. Esses metadados são filtrados antes da busca semântica e reduzem o espaço de busca de centenas de milhares de chunks para algumas dezenas relevantes.

Por que isso importa

Busca puramente vetorial sobre todo o corpus traz muitos falsos positivos semanticamente próximos mas contextualmente inadequados. Um chunk sobre cafeicultura no Sul de Minas pode ser semanticamente vizinho de um chunk sobre cacau no Pará, mas raramente é útil cruzar os dois. Filtros estruturados resolvem isso.

Schema de metadados por chunk

// Metadados de um chunk · exemplo de prática regenerativa
{
  "chunk_id": "gaas_2025_0473_p12",
  "texto": "...",

  // Eixo ontologia
  "classe_ontologica": "intervencao",
  "subclasse": "estrutural",
  "praticas_associadas": ["plantio_direto", "plantas_cobertura"],
  "processos_afetados": ["agregacao", "infiltracao", "ciclagem"],
  "estruturas_fortalecidas": ["porosidade_funcional", "cobertura_viva"],
  "sintomas_aplicaveis": ["compactacao", "baixa_infiltracao", "erosao"],

  // Eixo Árvore do Conhecimento
  "ramo_taxonomia": "estruturas_fundamentais/estrutura_solo/estrutura_fisica",

  // Eixo contexto
  "bioma": ["cerrado"],
  "cultura": ["soja", "milho"],
  "escala": "talhao",
  "estagio_transicao": ["transicao_inicial", "transicao_intermediaria"],

  // Eixo evidência
  "tipo_evidencia": "caso_validado_gaas",
  "confiabilidade": 0.87,
  "fonte": "GAAS_relato_produtor_MG_2024",
  "validacao": "comite_curadoria_gaas_2025q1",
  "ano": 2024,

  // Eixo autonomia
  "origem_funcional": "propria",

  // Embedding
  "embedding_model": "openai-text-embedding-3-large",
  "versao_schema": "ontologia_v2_2026.05"
}

Como o roteador usa esses metadados

Dado o padrão de consulta detectado e as Skills ativas do perfil, o roteador monta um filtro estruturado e passa para o retriever:

Padrão da consulta	Filtros aplicados antes do semântico
Diagnóstico	`classe_ontologica` em [sintoma, causa, processo, estrutura, intervencao]; `bioma` e `cultura` do perfil
Planejamento	`classe_ontologica` em [intervencao, pratica, insumo]; filtros de bioma, cultura, estágio
Autonomia	`origem_funcional` em [propria, coletiva_regional, regional]; demais filtros de contexto
Qualidade	`classe_ontologica` em [qualidade_funcional, genetica, indicador_qualidade]; cultura
Monitoramento	`classe_ontologica` em [indicador, desempenho, evidencia]; bioma, cultura
Conceitual	`ramo_taxonomia` com prefixo `fundamentos_atr/`

Pipeline de ingestão · responsabilidade da curadoria

Captura: nugget vem de WhatsApp curado, artigo científico, relato de produtor, protocolo GAAS.
Classificação ontológica: agente classificador atribui classe, subclasse e relações.
Tagueamento contextual: bioma, cultura, escala, estágio são inferidos ou marcados na curadoria.
Validação humana: comitê GAAS aprova classes de alta criticidade (intervenções, dosagens, contraindicações).
Embedding e indexação: chunk vai para o índice vetorial com todos os metadados anexados.
Versionamento: cada chunk carrega versão do schema, permitindo reindexar quando a ontologia evolui.

Fluxo de execução · pipeline completo

O pipeline integra as cinco camadas em um ciclo de execução. Skills do perfil entram como prior que orienta o roteador antes do aprendizado por reforço atuar. O roteador classifica o padrão da consulta e ativa o template de CoT ontológico correspondente, que é a camada orquestradora, quem decide a sequência de raciocínio e dispara o retrieval a cada passo. A resposta volta como prosa natural, com fontes, e o feedback alimenta a evolução da política e dos próprios templates de CoT.

Entrada Skills (prior) Roteador CoT (orquestrador) Política RL Saída Feedback

Entrada

Usuário · Produtor · Técnico · Consultor

→

Contexto

Pergunta + Perfil Agrícola + Skills + Histórico + Tier

→

Roteador

Agente Roteador

Classificador de padrão ontológico

Diagnóstico

Planejamento

Qualidade

Autonomia

Monitoramento

Conceitual

Conversacional → direto ao prompt

Skills

Skills ativas → prior + filtros de retrieval

→

Política RL

Política aprendida (RL · Bandit · Feedback)

→

CoT · orquestrador

Template de CoT ontológico ativado: define profundidade e sequência do raciocínio

Loop interno do CoT

Passo CoT → Retrieval específico → Síntese → Próximo passo

Estratégia RAG selecionada por passo do CoT

RAG simples

Busca híbrida BM25 + vetorial

Indexação hierárquica recursiva

GraphRAG

Multi-hop guiado

Casos semelhantes

Pergunta de esclarecimento

Escalonamento p/ especialista

LLM

Contexto estruturado pelo CoT + Prompt do sistema → LLM

→

Saída

Resposta em prosa natural · fontes · neutralidade comercial

→

Feedback

Feedback do usuário + avaliação técnica + métricas

→

Atualização

Atualização da política + evolução dos templates de CoT

O que muda em relação à versão anterior do fluxo

Fluxo anterior (sem CoT)

Roteador escolhe uma estratégia RAG única
Estratégia executa, devolve chunks, LLM responde
Sequência de raciocínio fica a cargo da LLM
Feedback ajusta política sobre estratégias

Fluxo atualizado (com CoT ontológico)

Roteador classifica padrão e ativa template de CoT
CoT orquestra múltiplos passos com retrieval específico em cada um
Sequência de raciocínio é definida pela ontologia
Feedback ajusta política sobre estratégias E templates de CoT

Três loops no mesmo pipeline

O fluxo tem três loops de aprendizado convivendo: o loop interno do CoT (passos sequenciais dentro de uma única resposta), o loop da política RL (melhora a escolha de estratégia entre interações) e o loop epistemológico do GAAS (evolução dos próprios templates de CoT e da ontologia a partir das amostras revisadas pelo comitê). A camada de CoT é o ponto onde os três se articulam.

Diagnóstico passo a passo · CoT ontológico em execução

Aplicação concreta do pipeline geral para o padrão mais complexo: o diagnóstico. Cada passo do CoT é uma relação explícita da ontologia, e cada passo dispara um retrieval específico antes do próximo. Para o fluxo geral em todas as suas etapas, ver a aba Fluxo.

Pergunta de exemplo

"Estou notando baixa nodulação na minha soja no segundo ano. O que pode estar acontecendo e o que faço?"

Skills ativas do perfil: bioma_cerrado, graos_soja_milho, transicao_em_curso, produtor_rural. Padrão detectado pelo roteador: Diagnóstico. Template de CoT ativado: cadeia diagnóstica completa (7 passos).

Execução passo a passo · CoT + retrieval

Clique em cada passo para abrir o detalhe do retrieval.

01

Passo CoT 1 · Identificar Sintoma

Pensamento: "Qual sintoma o produtor está descrevendo?"

Retrieval com filtro classe_ontologica=sintoma, busca semântica por "baixa nodulação". Síntese do passo: sintoma classificado como baixa_nodulacao, ligado às relações ontológicas que conduzirão os próximos passos.

›

02

Passo CoT 2 · Levantar Causas Prováveis

Pensamento: "Que causas costumam gerar esse sintoma neste contexto?"

Retrieval com filtros classe_ontologica=causa_provavel, sintomas_aplicaveis inclui baixa_nodulacao, bioma=cerrado, cultura=soja. Síntese do passo: baixa atividade microbiológica, acidez subsuperficial, inoculante de baixa viabilidade, excesso de nitrogênio mineral, compactação.

›

03

Passo CoT 3 · Mapear Processos Comprometidos

Pensamento: "Quais processos do sistema essas causas comprometem?"

Retrieval com filtros classe_ontologica=processo, processos_afetados ligados às causas do passo anterior. Síntese do passo: fixação biológica de nitrogênio (FBN), micorrização, biodisponibilização de nutrientes.

›

04

Passo CoT 4 · Identificar Estruturas Fragilizadas

Pensamento: "Que estruturas estão por trás desses processos comprometidos?"

Retrieval com filtro classe_ontologica=estrutura, cruzando com os processos do passo anterior. Síntese: microbioma funcional, ambiente rizosférico, cobertura viva, agregados estáveis.

›

05

Passo CoT 5 · Selecionar Intervenções

Pensamento: "Que intervenções restauram esses processos e fortalecem essas estruturas?"

Retrieval com filtros classe_ontologica=intervencao, cruzando processos_afetados e estruturas_fortalecidas dos passos 3 e 4. Síntese: reinoculação de qualidade, correção em profundidade quando necessária, plantas de cobertura específicas, redução de nitrogênio mineral, bioestimulação.

›

06

Passo CoT 6 · Aterrissar em Práticas Operacionais

Pensamento: "Como cada intervenção se traduz em prática viável no contexto do produtor?"

Retrieval com filtros classe_ontologica=pratica, praticas_associadas às intervenções do passo 5, bioma=cerrado, cultura=soja. Casos semelhantes da rede GAAS são puxados em paralelo, reforçando a relevância contextual.

›

07

Passo CoT 7 · Definir Indicadores de Monitoramento

Pensamento: "Como saberemos se a intervenção está funcionando?"

Retrieval com filtro classe_ontologica=indicador, ligados aos processos e estruturas dos passos anteriores. Síntese: contagem de nódulos, análise foliar de nitrogênio, vigor da planta, evolução em ciclos seguintes.

›

Síntese e prompt final do LLM

Os sete passos do CoT montam um contexto estruturado segundo o template diagnóstico. O LLM recebe esse contexto e o prompt do sistema conversacional, e gera uma resposta em prosa natural, com a continuação proativa exigida pelo prompt. O usuário não percebe os passos individualmente: vê uma explicação coerente que começa pelo sintoma, percorre as causas e os processos, e culmina na intervenção com os indicadores de acompanhamento. A regra-mãe da ontologia se cumpre estruturalmente, sem precisar estar escrita no prompt.

Por que esta abordagem supera o multi-hop livre

No multi-hop livre, a LLM decompõe a pergunta em sub-perguntas semânticas e cada sub-pergunta é uma busca vetorial. Isso introduz variância e perde a estrutura causal. No CoT ontológico, cada passo é uma relação ontológica explícita, auditável e versionada. A LLM não decide o caminho, ela apenas sintetiza o contexto recuperado em prosa. A profundidade técnica vem da ontologia, a sequência vem do CoT, a linguagem vem do prompt do sistema.

Quando o fluxo é interrompido

Passo 1 inconclusivo: sintoma não identificado com clareza. Roteador devolve para pergunta de esclarecimento.
Passo 2 muito amplo: causas prováveis sem convergência. Sistema solicita ao usuário 1 ou 2 perguntas de desambiguação (cor das folhas, idade do problema, histórico recente).
Skill crítica ativa: se durante o diagnóstico aparece Skill como erosao_avancada ou produção em larga escala sem assistência técnica, Agente Guardião interrompe e escala.
Risco de recomendação irreversível: dosagens, defensivos específicos, decisões de plantio. Resposta inclui ressalva e oferece escalonamento.

Roadmap de implementação em quatro fases

Cada fase entrega valor isolado e prepara terreno para a próxima. A ordem prioriza frugalidade. A Fase 0 demonstra o conceito de CoT ontológico imediatamente, com Skills fixas e um CoT primário engessado, antes de qualquer investimento em classificadores, bandit ou RL. É a prova de método antes da prova de escala.

F0 · Curto prazo · 2 a 4 semanas

Skills fixas + CoT primário engessado

Demonstrar o método antes da escala. Mesmo com tudo hardcoded e sem aprendizado, o sistema já entrega um raciocínio que segue a cadeia ontológica. A entrega é a estrutura do pensamento, não a sofisticação técnica.

Skills fixas hardcoded: conjunto inicial pré-definido por anamnese simples ou cadastro (bioma, cultura principal, estágio de transição, perfil profissional). Sem inferência automática, sem catálogo versionado dinâmico.
CoT primário engessado: implementação do template diagnóstico canônico como sequência fixa de passos (Sintoma → Causa → Processo → Estrutura → Intervenção → Prática → Indicador). Disparado por palavras-chave simples na pergunta.
Retrieval por passo: cada passo do CoT dispara uma busca filtrada pela Skill ativa. Sem multi-hop sofisticado, sem GraphRAG, sem casos semelhantes ainda. Busca vetorial direta com filtros estruturados.
Tagueamento mínimo: apenas as classes ontológicas essenciais (sintoma, causa, processo, intervenção, prática, indicador) marcadas nos chunks. Cobertura parcial é aceitável.
Padrões fixos: três padrões iniciais com CoT engessado: diagnóstico, conceitual, conversacional. Outros padrões caem em fallback genérico até a F1.
Prompt do sistema inalterado. O CoT entra como template injetado no contexto antes do prompt, sem alterar persona ou tom.

Entrega: respostas diagnósticas que visivelmente seguem a cadeia ontológica. O produtor percebe que o sistema "pensa antes de responder". O GAAS valida que o método regenerativo está embutido na resposta, mesmo que mecanicamente. Demonstra viabilidade do CoT antes de investir nas camadas posteriores.

O que aceitamos como limitação nesta fase: respostas podem ser repetitivas, o sistema não adapta o CoT ao contexto, perguntas fora dos três padrões caem em fallback simples. Tudo isso melhora nas fases seguintes.

F1 · Curto-médio prazo · 30 a 60 dias

Indexação ontológica completa + classificador de padrões heurístico

Schema de metadados ontológicos completo aplicado aos chunks já indexados (reindexação incremental)
Pipeline de ingestão atualizado para taguear novos chunks automaticamente, com revisão humana para classes críticas
Classificador de padrões baseado em palavras-chave e estrutura sintática (regras explícitas, auditáveis), substitui o gatilho por palavras-chave da F0
Templates de CoT ampliados para os seis padrões (não mais só três)
Skills do perfil passam a ser inferidas pela anamnese conversacional, não mais hardcoded
Catálogo versionado de Skills sob curadoria GAAS
Prompt do sistema permanece como hoje (já é enxuto)

Entrega: redução mensurável de falsos positivos no retrieval, CoT funcional para os seis padrões, auditoria completa de cada resposta (qual padrão, qual CoT, quais filtros, quais chunks).

F2 · Médio prazo · 60 a 120 dias

Multi-hop sofisticado + bandit contextual no roteador

Multi-hop guiado pelo grafo ontológico ganha sofisticação (síntese explícita entre passos, retrieval composto)
Templates de CoT evoluem para incluir relações entre passos e ramificações condicionais
Classificador de padrões ganha modelo treinado a partir das classificações da fase 1
Bandit contextual escolhe entre estratégias canônicas e alternativas usando feedback do usuário e avaliações dos consultores
Skills viram features do estado do bandit
GraphRAG implementado para padrões de planejamento operacional
Casos semelhantes integrados em paralelo ao multi-hop

Entrega: respostas diagnósticas com profundidade técnica auditável e melhoria contínua da política a cada interação avaliada.

F3 · Longo prazo · 4 a 8 meses

RL completo + ontologia evolutiva + inferência ativa de Skills

Política RL completa, com Skills, padrões e metadados como vetor de estado
Roteador detecta lacunas de Skills no perfil e pede confirmação ao usuário quando ambíguo
Mineração contínua de novos sintomas, causas e relações a partir dos casos da rede GAAS
Curadoria GAAS revisa propostas de evolução ontológica geradas pelo sistema
Composição automática de estratégias (multi-hop + casos, graph + indexação hierárquica recursiva) com base em recompensa observada
Templates de CoT evoluem com base em recompensa por padrão e por Skill
Auditoria humana periódica de amostras estratificadas por padrão e Skill

Entrega: infraestrutura de inteligência coletiva auto-otimizante, com a ontologia da ATR evoluindo a partir do uso real e a curadoria GAAS atuando como guardiã epistêmica.

Critérios de avaliação por fase

Fase	Métricas técnicas	Métricas de produto
F0	Aderência da resposta à cadeia ontológica (revisão GAAS), latência aceitável, cobertura dos três padrões iniciais	Percepção do produtor de que o sistema "pensa antes de responder", validação do método pelo comitê GAAS
F1	Precisão do classificador de padrões, redução de chunks irrelevantes, cobertura de tagueamento ontológico	Aprovação da resposta pelo produtor, redução de pedidos de esclarecimento
F2	Coerência do multi-hop, taxa de hops válidos, melhoria do bandit ao longo do tempo	NPS por padrão de consulta, tempo até resposta útil, retenção
F3	Recompensa média da política RL, novidade detectada na ontologia, qualidade da inferência de Skills	Engajamento longitudinal, casos resolvidos sem escalação, contribuição da rede

Dependências entre fases

F0 valida o conceito de CoT ontológico antes de qualquer investimento estrutural, é a prova de método. F1 substitui Skills fixas por inferência e amplia a indexação. F2 sofistica o multi-hop e introduz aprendizado. F3 fecha o ciclo com RL completo e ontologia evolutiva. Nenhuma fase exige reescrita do prompt do sistema. Todas as quatro fases preservam a regra-mãe da ontologia: nenhuma recomendação é feita sem explicitar sintoma, causas, processos, estruturas, intervenções e indicadores.