RegenerAI · Camada Técnica · Roteamento ontológico

RegenerAI · Roteamento ontológico

Como a ontologia da ATR opera em três funções articuladas: estrutura de dados, estrutura de busca e estrutura de raciocínio (Chain of Thought). Skills definem perfil, padrões definem intenção, metadados definem escopo e templates de CoT orquestram a sequência de pensamento do agente, mantendo o prompt do sistema enxuto e a profundidade técnica auditável.

Versão: v2 · com CoT ontológico Plataforma: RegenerAI · ATR / GAAS Confidencialidade: Uso interno Stack: OpenAI · indexação hierárquica recursiva

A tese em uma frase

A ontologia da ATR opera em três funções articuladas: estrutura de dados (classes e relações), estrutura de busca (multi-hop sobre o grafo) e, hierarquicamente superior, estrutura de raciocínio do agente (Chain of Thought). A cadeia Sintoma → Causa → Processo → Estrutura → Intervenção → Prática → Monitoramento não é só taxonomia, é a forma como o agrônomo regenerativo pensa. Materializar essa cadeia como CoT no sistema é o que diferencia o RegenerAI de um simples mecanismo de recuperação aumentada.

A premissa epistemológica

A regra-mãe da ontologia afirma que nenhuma recomendação deve ser baseada apenas na escolha de um insumo, e que toda recomendação precisa explicitar sintoma, causas, processos, estruturas, intervenções e indicadores. Isso não é instrução sobre como buscar conhecimento. É instrução sobre como raciocinar. O CoT ontológico transforma essa regra em comportamento estrutural do agente, não em texto inflado dentro do prompt do sistema.

As três funções da ontologia no sistema

Função 1

Estrutura de dados

Classes, subclasses, atributos e relações. Materializada como schema de metadados em cada chunk indexado. É o vocabulário formal do sistema.

Função 2

Estrutura de busca

Grafo navegável de relações ontológicas. Materializada como multi-hop retrieval guiado. É como o sistema encontra evidência relevante.

Função 3 · superior

Estrutura de raciocínio

Cadeia de pensamento do agente: Sintoma → Causa → Processo → Estrutura → Intervenção → Monitoramento. Materializada como CoT templates que orquestram quando e como as outras duas funções são acionadas.

O que muda com essa releitura

Ontologia só como dados e busca

  • Sistema pula da pergunta para a recomendação
  • Multi-hop fica como decomposição livre da LLM
  • Regra-mãe vira instrução solta no prompt
  • Sem rastreabilidade do raciocínio
  • Resposta correta sem método

Ontologia como CoT + busca + dados

  • Agente percorre cadeia diagnóstica antes da recomendação
  • Multi-hop guiado pelos passos do CoT
  • Regra-mãe estruturada no comportamento
  • Cada passo do raciocínio é artefato inspecionável
  • Resposta correta com método regenerativo embutido

Três sinais combinados no roteador

A política do agente roteador decide a profundidade do CoT e a estratégia RAG combinando três sinais independentes, sem misturar suas responsabilidades:

Quem

Skills do perfil

Bioma, cultura principal, estágio de transição, perfil profissional, maturidade ATR. Vêm da anamnese, da declaração explícita ou de inferência.

O quê

Padrão ontológico de consulta

Diagnóstico, planejamento, autonomia, qualidade, monitoramento ou conceitual. Classificador leve mapeia a pergunta ao padrão antes do raciocínio.

Onde

Metadados da indexação

Cada chunk carrega a classe ontológica, o subdomínio da Árvore do Conhecimento, contexto territorial e tipo de evidência. Filtros antes do semântico.

Por que esta articulação

O padrão detectado determina o template de CoT a ser executado. O CoT define a sequência de passos de raciocínio. Cada passo do CoT dispara um retrieval específico, filtrado pelas Skills do perfil e pelos metadados da indexação. As três camadas atuam em conjunto, mas o CoT é quem orquestra. Ele é a função epistemicamente superior da ontologia no sistema.

O que sai do prompt do sistema

O que fica no prompt do sistema

As cinco camadas da arquitetura

Cada camada tem uma responsabilidade única e versionável de forma independente. O prompt do sistema é a camada mais leve e estável. A camada de templates de raciocínio ontológico (CoT) é a hierarquicamente superior: é quem decide quando e como as outras três camadas técnicas são acionadas.

Clique em cada camada para abrir o detalhe.

01
Templates de raciocínio ontológico (CoT) orquestradora
Camada 1 · orquestradora
Cadeia de pensamento do agente: Sintoma → Causa → Processo → Estrutura → Intervenção → Prática → Monitoramento → Resultado → Aprendizado. Cada padrão de consulta tem um template de CoT que define quais passos da cadeia são percorridos e em que ordem. É a camada que materializa a regra-mãe da ontologia como comportamento estrutural do agente, não como texto no prompt. Hierarquicamente superior: decide quando acionar Skills, busca e metadados.
02
Prompt do sistema
Camada 2
Persona, tom de campo, regras de formato, política de segurança e escopo, fechamento proativo. Estável por meses. Não contém ontologia, taxonomia, regras diagnósticas ou viéses de perfil. Recebe o contexto já estruturado pelo CoT e renderiza em prosa natural.
03
Catálogo de Skills
Camada 3
Taxonomia versionada pelo GAAS. Cada Skill: identificador, categoria, RAG bias padrão, tier mínimo, agente responsável pela inferência. Skills vêm das classes de contexto da ontologia (Agroecossistema, Contexto Territorial, Genética, Estágio de Transição) e do perfil profissional. Funcionam como prior do raciocínio.
04
Roteador de padrões
Camada 4
Classificador leve detecta o padrão ontológico da consulta (diagnóstico, planejamento, autonomia, qualidade, monitoramento, conceitual). Cada padrão ativa um template de CoT específico, que por sua vez decide a profundidade do raciocínio e a estratégia RAG canônica. Política aprendida por reforço refina a escolha ao longo do tempo.
05
Indexação ontológica
Camada 5
Cada chunk carrega metadados: classe ontológica, subclasse, ramo da Árvore do Conhecimento, bioma, cultura, escala, tipo de evidência, origem funcional, ano. Filtros estruturados antes da busca semântica, disparados a cada passo do CoT, reduzem o espaço de busca em uma ordem de grandeza.
Princípio de separação

O CoT decide "o que pensar e em que ordem". O roteador decide "qual estratégia de busca para cada passo". As Skills decidem "com qual viés de perfil". Os metadados decidem "sobre qual escopo de conhecimento". O prompt do sistema decide "como falar". Essa separação é o que mantém o sistema escalável: novas culturas, novos biomas, novas práticas e novas classes ontológicas entram nas camadas técnicas sem tocar no prompt nem no CoT.

Quem é dono de cada camada

CamadaVersionamentoCuradoriaFrequência de mudança
Templates de CoTGit interno + revisão GAASSyntropy Labs + comitê GAASBimestral
Prompt do sistemaGit internoSyntropy LabsTrimestral
Catálogo de SkillsTabela versionadaComitê GAASMensal
Roteador de padrõesModelo + heurísticasSyntropy LabsContínuo (RL)
Indexação ontológicaSchema versionadoGAAS técnicoA cada ingestão

CoT ontológico · a ontologia como estrutura de raciocínio

A cadeia que aparece logo no início do documento da ontologia não é só uma classificação. É um Chain of Thought. É exatamente como o agrônomo regenerativo pensa quando enfrenta um problema no campo. O método da Agricultura de Processo materializado em sequência de raciocínio.

A cadeia canônica da ontologia ATR

Contexto → Sintoma → Causa provável → Processos comprometidos → Estrutura fragilizada → Intervenções → Prática / Serviço / Insumo → Monitoramento → Resultado funcional → Aprendizado → Compartilhamento com pares

Por que tratar isso como CoT muda tudo

Sem CoT explícito, o agente pula da pergunta para a recomendação. Pode até acertar, mas perde o método. Com CoT ontológico, o agente percorre a cadeia diagnóstica antes de sugerir intervenção. A resposta final continua sendo prosa de campo, mas a forma da resposta carrega o método regenerativo embutido.

Ganho 1

Qualidade técnica

O agente atende a regra-mãe da ontologia de forma estrutural, não como instrução solta no prompt. Toda recomendação explicita sintoma, causas, processos, estruturas, intervenções e indicadores.

Ganho 2

Pedagogia implícita

Mesmo quando a resposta final sai em prosa fluida, a forma da resposta ensina o produtor a pensar como agrônomo regenerativo. O RegenerAI não responde só perguntas, ensina o método da Agricultura de Processo.

Ganho 3

Auditabilidade

Cada passo do CoT é artefato inspecionável. O comitê GAAS revisa amostras passo a passo: qual sintoma o agente identificou, quais causas considerou, por que escolheu essa intervenção e não outra. Calibração fina sem mexer no prompt nem no modelo.

Profundidade do CoT por padrão de consulta

Nem toda pergunta justifica percorrer a cadeia inteira. Forçar isso engessaria respostas simples e geraria verbosidade desnecessária. O classificador de padrões decide a profundidade do raciocínio em cada caso.

PadrãoPassos do CoTProfundidade
Diagnóstico Sintoma → Causa → Processo → Estrutura → Intervenção → Prática → Indicador Cadeia inteira (7 passos)
Planejamento Objetivo → Intervenções compatíveis → Práticas → Insumos → Sequência → Custo 6 passos
Qualidade funcional Atributo desejado → Genética + Ambiente + Manejo → Práticas convergentes → Indicador 4 passos (sintetizadores)
Autonomia Função desejada → Alternativas por origem → Risco de dependência → Recomendação 4 passos
Monitoramento Intervenção implantada → Indicadores → Janela temporal → Resultado esperado 4 passos
Conceitual Definição → Contexto → Aplicação 3 passos
Conversacional (direto ao prompt do sistema) Sem CoT

Como CoT e retrieval interagem

O CoT define a espinha do raciocínio. O retrieval alimenta cada passo do raciocínio com evidência específica. A interação é iterativa, não paralela.

// Loop interno do CoT diagnóstico

para cada passo da cadeia (sintoma, causa, processo, estrutura, intervenção, prática, indicador):

  1. Agente formula intenção do passo
     // "Quais causas prováveis explicam baixa nodulação em soja no Cerrado?"

  2. Roteador dispara retrieval com filtros
     // classe_ontologica=causa_provavel
     // bioma=cerrado, cultura=soja
     // sintomas_aplicaveis inclui "baixa_nodulacao"

  3. Retrieval devolve chunks relevantes

  4. Agente sintetiza o passo
     // "Considerando o contexto, as causas mais prováveis são X, Y, Z"

  5. Síntese do passo alimenta o próximo passo do CoT
     // X, Y, Z viram input do retrieval do próximo hop

ao final da cadeia:

  6. Contexto estruturado vai para o LLM
     // junto com o prompt do sistema, que renderiza em prosa natural

Diferença em relação ao multi-hop livre

Multi-hop livre (sem CoT ontológico)

  • LLM decompõe a pergunta em sub-perguntas semânticas
  • Cada sub-pergunta é uma busca vetorial independente
  • Caminho varia a cada execução
  • Síntese final pode pular passos relevantes
  • Difícil auditar por que chegou a esta recomendação

CoT ontológico (multi-hop guiado)

  • Cadeia de raciocínio é definida pelo padrão detectado
  • Cada passo é uma relação ontológica explícita
  • Caminho determinístico e versionado
  • Síntese final segue a sequência completa do padrão
  • Cada passo é artefato inspecionável pelo comitê GAAS
A regra-mãe operacionalizada

A ontologia afirma: "nenhuma recomendação deve ser baseada apenas na escolha de um insumo. Toda recomendação deve explicitar o sintoma observado, as causas prováveis, os processos comprometidos, as estruturas funcionais envolvidas, as intervenções possíveis, os critérios de escolha e os indicadores de monitoramento." O CoT ontológico é o que transforma essa regra em comportamento do sistema, e não em texto inflado dentro do prompt. Quando o produtor pergunta "o que aplico?", o sistema não responde com um insumo. Responde percorrendo a cadeia, e o insumo, se aparece, aparece no final, justificado por tudo que veio antes.

Mapeamento da ontologia para Skills

As 16 classes da ontologia não viram todas Skills. As classes de contexto e perfil viram Skills, porque descrevem quem está perguntando e em que situação produtiva está. As classes de raciocínio diagnóstico e operacional não viram Skills: viram padrões de consulta detectados pelo roteador. As classes de conhecimento e evidência viram metadados da indexação.

Regra de mapeamento

Skills representam atributos persistentes do usuário e da propriedade. Padrões de consulta representam a intenção pontual de uma pergunta. Metadados representam atributos do conhecimento indexado. Misturar essas três funções é a principal armadilha que esta arquitetura evita.

Classes de contexto e perfil · viram Skills

Classe ontológicaSkills derivadasOrigem da Skill
Agroecossistema Bioma Cerrado, Bioma Amazônia, Bioma Mata Atlântica, Bioma Caatinga, Bioma Pampa, Bioma Pantanal, Talhão Pequeno, Talhão Grande, Microbacia Anamnese · Diagnóstico Territorial
Contexto Territorial Agroecorregião, Acesso a Biomassa, Acesso a Minerais Regionais, Organização Coletiva, Cadeia de Valor Curta Anamnese + cruzamento ZARC/INMET
Genética Cafeicultura, Pecuária / ILPF, Hortifruti, Grãos (Soja/Milho), Cana, Citricultura, Cacau, Sistemas Agroflorestais Anamnese · cultivos atuais
Desempenho Funcional Iniciante ATR, Transição em Curso, ATR Avançado, Certificação Orgânica, Foco em Densidade Nutricional Agente de Maturidade Regenerativa
Perfil profissional Produtor Rural, Técnico de Campo, Consultor Agrônomo, Pesquisador, Estudante Cadastro explícito

Classes de processo e estrutura · podem virar Skills situacionais

Algumas subclasses de Sintomas e Processos são duradouras o suficiente para virar Skills situacionais, ativadas durante a transição e desativadas quando o problema é resolvido. Funcionam como diagnósticos persistentes no perfil.

Classe ontológicaSkills situacionaisDisparo
Sintomas crônicos Solo Compactado, Erosão Avançada, Baixa Nodulação Recorrente, Estresse Hídrico Sazonal, Mato Competição Anamnese ou conversa repetida
Processos comprometidos Ciclagem Comprometida, Supressividade Baixa, Microbioma Frágil, FBN Ineficiente Análise de solo + diagnóstico do agente
Estruturas fragilizadas Cobertura Vegetal Baixa, Carbono Funcional Baixo, Mineralogia Pobre Análise de solo + observação de campo

Classes que NÃO viram Skills

Padrão de consulta

Sintomas (uso pontual)

Quando o produtor descreve um sintoma novo na pergunta, o roteador detecta padrão diagnóstico. Não vira Skill, é intenção pontual.

Padrão de consulta

Causas Prováveis

Hipóteses causais são saída do raciocínio do agente, não atributo do usuário. Ficam no template de contexto diagnóstico.

Padrão de consulta

Intervenções e Práticas

Quando o produtor pergunta "o que fazer", o roteador detecta padrão operacional. Práticas viram metadados de chunks, não Skills.

Metadado

Insumos, Serviços e Tecnologias

Vão para metadados dos chunks (tipo, função, origem funcional, evidências requeridas).

Metadado

Indicadores

Tags nos chunks. Quando relevante, viram parte do template de monitoramento.

Metadado

Evidências

Atributos de cada chunk: fonte, confiabilidade, contexto, ano, validação. Filtros de qualidade no retrieval.

Estrutura de uma Skill

// Exemplo · Skill derivada da classe Agroecossistema
{
  "id": "bioma_cerrado",
  "categoria": "contexto_territorial",
  "classe_ontologica": "Agroecossistema",
  "rag_bias": {
    "graphrag": 0.45,
    "casos_semelhantes": 0.30,
    "hibrida": 0.15,
    "raptor": 0.10
  },
  "filtros_indexacao": {
    "bioma": "cerrado",
    "agroecorregiao": "*"
  },
  "tier_minimo": "semente",
  "agente_inferencia": "diagnostico_territorial",
  "versao": "2026.05.01"
}

Os seis padrões de consulta ontológicos

A seção H da ontologia define seis grupos de perguntas que o sistema precisa responder. Cada grupo é um padrão de consulta com estrutura previsível, classes ontológicas envolvidas e estratégia RAG canônica. O roteador classifica cada consulta em um padrão antes de decidir a estratégia.

Como funciona o classificador de padrões

Na fase 1 é um classificador leve baseado em palavras-chave e estrutura sintática da pergunta. Na fase 2 vira um classificador multinominal pequeno treinado com exemplos do próprio sistema. Na fase 3 vira parte da política RL como variável latente. Em qualquer fase, o padrão detectado é registrado e auditável.

Padrão 1 · Diagnóstico Multi-hop guiado por ontologia

Gatilhos típicos: "meu solo está...", "estou com problema de...", "as plantas estão...", "por que aparece...". Classes envolvidas: Sintoma, Causa Provável, Processo, Estrutura, Intervenção.

Sintoma → Causas → Processos → Estruturas → Intervenções → Práticas

Cada hop é uma relação explícita da ontologia. O multi-hop não é decomposição livre da LLM, é navegação no grafo ontológico.

Padrão 2 · Planejamento operacional GraphRAG do subgrafo operacional

Gatilhos típicos: "como faço para...", "qual a melhor prática para...", "quero implantar...", "qual o protocolo de...". Classes envolvidas: Intervenção, Prática, Insumo, Tecnologia.

Intervenção → Práticas compatíveis → Insumos → Sequência operacional → Custos

Recuperação sobre o subgrafo operacional, filtrada pelas Skills do perfil (bioma, cultura, estágio).

Padrão 3 · Autonomia e origem funcional Busca híbrida com filtro de origem

Gatilhos típicos: "tem alternativa local para...", "consigo produzir na fazenda...", "tem opção mais barata...", "depende de importado?". Classes envolvidas: Origem Funcional, Insumo, Contexto Territorial, Risco.

Função desejada → Insumos com mesma função → Filtro por origem → Análise de risco de dependência

Filtro estruturado sobre o campo origem_funcional dos chunks antes da busca semântica.

Padrão 4 · Qualidade funcional da produção Multi-hop sintetizador

Gatilhos típicos: "como melhorar a densidade nutricional...", "aumentar teor de proteína...", "qualidade da fibra...", "sabor do...". Classes envolvidas: Qualidade Funcional, Genética, Ambiente Produtivo, Manejo, Indicadores de qualidade.

Atributo de qualidade → Genética + Ambiente + Manejo → Práticas convergentes → Indicadores

Sintetiza três vetores simultâneos. Sem multi-hop, qualquer resposta vira simplificação enganosa.

Padrão 5 · Monitoramento e aprendizagem RAG simples + casos semelhantes

Gatilhos típicos: "que indicador devo medir...", "como saber se está melhorando...", "quanto tempo leva para ver resultado...". Classes envolvidas: Indicadores, Desempenho Funcional, Evidências.

Intervenção implantada → Indicadores aplicáveis → Métricas + janela temporal → Casos comparáveis

Indicadores e casos GAAS têm baixa ambiguidade. RAG leve resolve com fontes claras.

Padrão 6 · Conceitual e fundamentos RAG simples sobre Árvore do Conhecimento

Gatilhos típicos: "o que é...", "por que...", "qual a diferença entre...", "explica o princípio de...". Classes envolvidas: Fundamentos da ATR, Princípios, Conceitos, Diretrizes.

Conceito → Definição da Árvore do Conhecimento → Contexto histórico → Aplicação

Definições estáveis e bem cobertas pela curadoria. Busca vetorial simples sobre o ramo de Fundamentos resolve com baixa latência.

Sinalizações que disparam fallbacks

Sinalização detectadaAção do roteador
Pergunta vaga, sem contexto mínimo para classificar padrãoPergunta de esclarecimento
Skill erosao_avancada ativa ou Skills críticas em alertaEscalonamento para consultor (Agente Guardião)
Pergunta recorrente já respondida pelo mesmo usuárioCache semântico
Pergunta de benchmarking ("como outros estão fazendo...")Casos semelhantes (rede GAAS)
Pergunta fora de escopo (política, religião, sensível)Resposta breve do prompt do sistema, sem retrieval

Matriz de estratégias RAG por padrão ontológico

Cada padrão tem uma estratégia canônica e duas alternativas. A política aprendida por reforço pode ajustar pesos com o tempo, mas o estado inicial é determinístico e auditável.

Padrão Estratégia canônica Alternativas Skills que reforçam
Diagnóstico Multi-hop guiado pelo grafo ontológico RAPTOR · Casos semelhantes Solo Compactado, Baixa Nodulação, Bioma específico
Planejamento operacional GraphRAG do subgrafo operacional RAPTOR · Casos semelhantes Cultura específica, Estágio de Transição
Autonomia · origem funcional Busca híbrida com filtro de origem Casos semelhantes regionais · GraphRAG Acesso a Biomassa Regional, Organização Coletiva
Qualidade funcional Multi-hop sintetizador GraphRAG · RAPTOR Foco em Densidade Nutricional, Certificação Orgânica
Monitoramento RAG simples + casos semelhantes Busca híbrida · GraphRAG Transição em Curso, ATR Avançado
Conceitual RAG simples sobre Árvore do Conhecimento Busca híbrida Iniciante ATR, Estudante

Como as Skills entram como prior · exemplo prático

Suponha que a pergunta seja "meu solo está com baixa nodulação no segundo ano de soja". O roteador detecta padrão Diagnóstico, cuja estratégia canônica é multi-hop guiado. Antes de executar, lê as Skills ativas do perfil:

// Perfil ativo
{
  "skills": [
    "bioma_cerrado",
    "graos_soja_milho",
    "transicao_em_curso",
    "produtor_rural"
  ]
}

// Distribuição inicial sobre estratégias RAG
{
  "multi_hop_guiado":    0.60,  // canônica do padrão diagnóstico
  "casos_semelhantes":   0.25,  // reforçada por "transicao_em_curso"
  "hibrida":             0.10,  // reforçada por "graos_soja_milho"
  "raptor":              0.05
}

// Filtros automáticos aplicados na recuperação
{
  "bioma": ["cerrado"],
  "cultura": ["soja"],
  "classe_ontologica": ["sintoma", "causa_provavel", "processo", "intervencao"]
}

Composição entre estratégias

Estratégias podem ser combinadas. O multi-hop guiado, por exemplo, pode usar busca híbrida em cada hop individual. Casos semelhantes podem complementar qualquer estratégia como contexto adicional. A política aprende quando vale a pena compor.

Composição comum

Multi-hop + Casos semelhantes

Diagnóstico ganha profundidade técnica do grafo e prova social dos casos da rede.

Composição comum

GraphRAG + Indexação hierárquica recursiva

Planejamento ganha estrutura operacional do grafo e profundidade textual da indexação hierárquica.

Composição comum

Híbrida + filtros de origem funcional

Autonomia usa busca híbrida sobre subconjunto pré-filtrado por origem própria ou regional.

Indexação ontológica · metadados de cada chunk

Cada nugget de conhecimento ingerido recebe uma ficha estruturada de metadados derivada da ontologia. Esses metadados são filtrados antes da busca semântica e reduzem o espaço de busca de centenas de milhares de chunks para algumas dezenas relevantes.

Por que isso importa

Busca puramente vetorial sobre todo o corpus traz muitos falsos positivos semanticamente próximos mas contextualmente inadequados. Um chunk sobre cafeicultura no Sul de Minas pode ser semanticamente vizinho de um chunk sobre cacau no Pará, mas raramente é útil cruzar os dois. Filtros estruturados resolvem isso.

Schema de metadados por chunk

// Metadados de um chunk · exemplo de prática regenerativa
{
  "chunk_id": "gaas_2025_0473_p12",
  "texto": "...",

  // Eixo ontologia
  "classe_ontologica": "intervencao",
  "subclasse": "estrutural",
  "praticas_associadas": ["plantio_direto", "plantas_cobertura"],
  "processos_afetados": ["agregacao", "infiltracao", "ciclagem"],
  "estruturas_fortalecidas": ["porosidade_funcional", "cobertura_viva"],
  "sintomas_aplicaveis": ["compactacao", "baixa_infiltracao", "erosao"],

  // Eixo Árvore do Conhecimento
  "ramo_taxonomia": "estruturas_fundamentais/estrutura_solo/estrutura_fisica",

  // Eixo contexto
  "bioma": ["cerrado"],
  "cultura": ["soja", "milho"],
  "escala": "talhao",
  "estagio_transicao": ["transicao_inicial", "transicao_intermediaria"],

  // Eixo evidência
  "tipo_evidencia": "caso_validado_gaas",
  "confiabilidade": 0.87,
  "fonte": "GAAS_relato_produtor_MG_2024",
  "validacao": "comite_curadoria_gaas_2025q1",
  "ano": 2024,

  // Eixo autonomia
  "origem_funcional": "propria",

  // Embedding
  "embedding_model": "openai-text-embedding-3-large",
  "versao_schema": "ontologia_v2_2026.05"
}

Como o roteador usa esses metadados

Dado o padrão de consulta detectado e as Skills ativas do perfil, o roteador monta um filtro estruturado e passa para o retriever:

Padrão da consultaFiltros aplicados antes do semântico
Diagnóstico classe_ontologica em [sintoma, causa, processo, estrutura, intervencao]; bioma e cultura do perfil
Planejamento classe_ontologica em [intervencao, pratica, insumo]; filtros de bioma, cultura, estágio
Autonomia origem_funcional em [propria, coletiva_regional, regional]; demais filtros de contexto
Qualidade classe_ontologica em [qualidade_funcional, genetica, indicador_qualidade]; cultura
Monitoramento classe_ontologica em [indicador, desempenho, evidencia]; bioma, cultura
Conceitual ramo_taxonomia com prefixo fundamentos_atr/

Pipeline de ingestão · responsabilidade da curadoria

  1. Captura: nugget vem de WhatsApp curado, artigo científico, relato de produtor, protocolo GAAS.
  2. Classificação ontológica: agente classificador atribui classe, subclasse e relações.
  3. Tagueamento contextual: bioma, cultura, escala, estágio são inferidos ou marcados na curadoria.
  4. Validação humana: comitê GAAS aprova classes de alta criticidade (intervenções, dosagens, contraindicações).
  5. Embedding e indexação: chunk vai para o índice vetorial com todos os metadados anexados.
  6. Versionamento: cada chunk carrega versão do schema, permitindo reindexar quando a ontologia evolui.

Fluxo de execução · pipeline completo

O pipeline integra as cinco camadas em um ciclo de execução. Skills do perfil entram como prior que orienta o roteador antes do aprendizado por reforço atuar. O roteador classifica o padrão da consulta e ativa o template de CoT ontológico correspondente, que é a camada orquestradora, quem decide a sequência de raciocínio e dispara o retrieval a cada passo. A resposta volta como prosa natural, com fontes, e o feedback alimenta a evolução da política e dos próprios templates de CoT.

Entrada Skills (prior) Roteador CoT (orquestrador) Política RL Saída Feedback
Entrada

Usuário · Produtor · Técnico · Consultor

Contexto

Pergunta + Perfil Agrícola + Skills + Histórico + Tier

Roteador

Agente Roteador

Classificador de padrão ontológico

Diagnóstico
Planejamento
Qualidade
Autonomia
Monitoramento
Conceitual
Conversacional → direto ao prompt
Skills

Skills ativas → prior + filtros de retrieval

Política RL

Política aprendida (RL · Bandit · Feedback)

CoT · orquestrador

Template de CoT ontológico ativado: define profundidade e sequência do raciocínio

Loop interno do CoT

Passo CoT → Retrieval específico → Síntese → Próximo passo

Estratégia RAG selecionada por passo do CoT

RAG simples
Busca híbrida BM25 + vetorial
Indexação hierárquica recursiva
GraphRAG
Multi-hop guiado
Casos semelhantes
Pergunta de esclarecimento
Escalonamento p/ especialista
LLM

Contexto estruturado pelo CoT + Prompt do sistema → LLM

Saída

Resposta em prosa natural · fontes · neutralidade comercial

Feedback

Feedback do usuário + avaliação técnica + métricas

Atualização

Atualização da política + evolução dos templates de CoT

O que muda em relação à versão anterior do fluxo

Fluxo anterior (sem CoT)

  • Roteador escolhe uma estratégia RAG única
  • Estratégia executa, devolve chunks, LLM responde
  • Sequência de raciocínio fica a cargo da LLM
  • Feedback ajusta política sobre estratégias

Fluxo atualizado (com CoT ontológico)

  • Roteador classifica padrão e ativa template de CoT
  • CoT orquestra múltiplos passos com retrieval específico em cada um
  • Sequência de raciocínio é definida pela ontologia
  • Feedback ajusta política sobre estratégias E templates de CoT
Três loops no mesmo pipeline

O fluxo tem três loops de aprendizado convivendo: o loop interno do CoT (passos sequenciais dentro de uma única resposta), o loop da política RL (melhora a escolha de estratégia entre interações) e o loop epistemológico do GAAS (evolução dos próprios templates de CoT e da ontologia a partir das amostras revisadas pelo comitê). A camada de CoT é o ponto onde os três se articulam.

Diagnóstico passo a passo · CoT ontológico em execução

Aplicação concreta do pipeline geral para o padrão mais complexo: o diagnóstico. Cada passo do CoT é uma relação explícita da ontologia, e cada passo dispara um retrieval específico antes do próximo. Para o fluxo geral em todas as suas etapas, ver a aba Fluxo.

Pergunta de exemplo

"Estou notando baixa nodulação na minha soja no segundo ano. O que pode estar acontecendo e o que faço?"

Skills ativas do perfil: bioma_cerrado, graos_soja_milho, transicao_em_curso, produtor_rural. Padrão detectado pelo roteador: Diagnóstico. Template de CoT ativado: cadeia diagnóstica completa (7 passos).

Execução passo a passo · CoT + retrieval

Clique em cada passo para abrir o detalhe do retrieval.

01
Passo CoT 1 · Identificar Sintoma
Pensamento: "Qual sintoma o produtor está descrevendo?"
Retrieval com filtro classe_ontologica=sintoma, busca semântica por "baixa nodulação". Síntese do passo: sintoma classificado como baixa_nodulacao, ligado às relações ontológicas que conduzirão os próximos passos.
02
Passo CoT 2 · Levantar Causas Prováveis
Pensamento: "Que causas costumam gerar esse sintoma neste contexto?"
Retrieval com filtros classe_ontologica=causa_provavel, sintomas_aplicaveis inclui baixa_nodulacao, bioma=cerrado, cultura=soja. Síntese do passo: baixa atividade microbiológica, acidez subsuperficial, inoculante de baixa viabilidade, excesso de nitrogênio mineral, compactação.
03
Passo CoT 3 · Mapear Processos Comprometidos
Pensamento: "Quais processos do sistema essas causas comprometem?"
Retrieval com filtros classe_ontologica=processo, processos_afetados ligados às causas do passo anterior. Síntese do passo: fixação biológica de nitrogênio (FBN), micorrização, biodisponibilização de nutrientes.
04
Passo CoT 4 · Identificar Estruturas Fragilizadas
Pensamento: "Que estruturas estão por trás desses processos comprometidos?"
Retrieval com filtro classe_ontologica=estrutura, cruzando com os processos do passo anterior. Síntese: microbioma funcional, ambiente rizosférico, cobertura viva, agregados estáveis.
05
Passo CoT 5 · Selecionar Intervenções
Pensamento: "Que intervenções restauram esses processos e fortalecem essas estruturas?"
Retrieval com filtros classe_ontologica=intervencao, cruzando processos_afetados e estruturas_fortalecidas dos passos 3 e 4. Síntese: reinoculação de qualidade, correção em profundidade quando necessária, plantas de cobertura específicas, redução de nitrogênio mineral, bioestimulação.
06
Passo CoT 6 · Aterrissar em Práticas Operacionais
Pensamento: "Como cada intervenção se traduz em prática viável no contexto do produtor?"
Retrieval com filtros classe_ontologica=pratica, praticas_associadas às intervenções do passo 5, bioma=cerrado, cultura=soja. Casos semelhantes da rede GAAS são puxados em paralelo, reforçando a relevância contextual.
07
Passo CoT 7 · Definir Indicadores de Monitoramento
Pensamento: "Como saberemos se a intervenção está funcionando?"
Retrieval com filtro classe_ontologica=indicador, ligados aos processos e estruturas dos passos anteriores. Síntese: contagem de nódulos, análise foliar de nitrogênio, vigor da planta, evolução em ciclos seguintes.

Síntese e prompt final do LLM

Os sete passos do CoT montam um contexto estruturado segundo o template diagnóstico. O LLM recebe esse contexto e o prompt do sistema conversacional, e gera uma resposta em prosa natural, com a continuação proativa exigida pelo prompt. O usuário não percebe os passos individualmente: vê uma explicação coerente que começa pelo sintoma, percorre as causas e os processos, e culmina na intervenção com os indicadores de acompanhamento. A regra-mãe da ontologia se cumpre estruturalmente, sem precisar estar escrita no prompt.

Por que esta abordagem supera o multi-hop livre

No multi-hop livre, a LLM decompõe a pergunta em sub-perguntas semânticas e cada sub-pergunta é uma busca vetorial. Isso introduz variância e perde a estrutura causal. No CoT ontológico, cada passo é uma relação ontológica explícita, auditável e versionada. A LLM não decide o caminho, ela apenas sintetiza o contexto recuperado em prosa. A profundidade técnica vem da ontologia, a sequência vem do CoT, a linguagem vem do prompt do sistema.

Quando o fluxo é interrompido

Roadmap de implementação em quatro fases

Cada fase entrega valor isolado e prepara terreno para a próxima. A ordem prioriza frugalidade. A Fase 0 demonstra o conceito de CoT ontológico imediatamente, com Skills fixas e um CoT primário engessado, antes de qualquer investimento em classificadores, bandit ou RL. É a prova de método antes da prova de escala.

F0 · Curto prazo · 2 a 4 semanas

Skills fixas + CoT primário engessado

Demonstrar o método antes da escala. Mesmo com tudo hardcoded e sem aprendizado, o sistema já entrega um raciocínio que segue a cadeia ontológica. A entrega é a estrutura do pensamento, não a sofisticação técnica.

  • Skills fixas hardcoded: conjunto inicial pré-definido por anamnese simples ou cadastro (bioma, cultura principal, estágio de transição, perfil profissional). Sem inferência automática, sem catálogo versionado dinâmico.
  • CoT primário engessado: implementação do template diagnóstico canônico como sequência fixa de passos (Sintoma → Causa → Processo → Estrutura → Intervenção → Prática → Indicador). Disparado por palavras-chave simples na pergunta.
  • Retrieval por passo: cada passo do CoT dispara uma busca filtrada pela Skill ativa. Sem multi-hop sofisticado, sem GraphRAG, sem casos semelhantes ainda. Busca vetorial direta com filtros estruturados.
  • Tagueamento mínimo: apenas as classes ontológicas essenciais (sintoma, causa, processo, intervenção, prática, indicador) marcadas nos chunks. Cobertura parcial é aceitável.
  • Padrões fixos: três padrões iniciais com CoT engessado: diagnóstico, conceitual, conversacional. Outros padrões caem em fallback genérico até a F1.
  • Prompt do sistema inalterado. O CoT entra como template injetado no contexto antes do prompt, sem alterar persona ou tom.

Entrega: respostas diagnósticas que visivelmente seguem a cadeia ontológica. O produtor percebe que o sistema "pensa antes de responder". O GAAS valida que o método regenerativo está embutido na resposta, mesmo que mecanicamente. Demonstra viabilidade do CoT antes de investir nas camadas posteriores.

O que aceitamos como limitação nesta fase: respostas podem ser repetitivas, o sistema não adapta o CoT ao contexto, perguntas fora dos três padrões caem em fallback simples. Tudo isso melhora nas fases seguintes.

F1 · Curto-médio prazo · 30 a 60 dias

Indexação ontológica completa + classificador de padrões heurístico

  • Schema de metadados ontológicos completo aplicado aos chunks já indexados (reindexação incremental)
  • Pipeline de ingestão atualizado para taguear novos chunks automaticamente, com revisão humana para classes críticas
  • Classificador de padrões baseado em palavras-chave e estrutura sintática (regras explícitas, auditáveis), substitui o gatilho por palavras-chave da F0
  • Templates de CoT ampliados para os seis padrões (não mais só três)
  • Skills do perfil passam a ser inferidas pela anamnese conversacional, não mais hardcoded
  • Catálogo versionado de Skills sob curadoria GAAS
  • Prompt do sistema permanece como hoje (já é enxuto)

Entrega: redução mensurável de falsos positivos no retrieval, CoT funcional para os seis padrões, auditoria completa de cada resposta (qual padrão, qual CoT, quais filtros, quais chunks).

F2 · Médio prazo · 60 a 120 dias

Multi-hop sofisticado + bandit contextual no roteador

  • Multi-hop guiado pelo grafo ontológico ganha sofisticação (síntese explícita entre passos, retrieval composto)
  • Templates de CoT evoluem para incluir relações entre passos e ramificações condicionais
  • Classificador de padrões ganha modelo treinado a partir das classificações da fase 1
  • Bandit contextual escolhe entre estratégias canônicas e alternativas usando feedback do usuário e avaliações dos consultores
  • Skills viram features do estado do bandit
  • GraphRAG implementado para padrões de planejamento operacional
  • Casos semelhantes integrados em paralelo ao multi-hop

Entrega: respostas diagnósticas com profundidade técnica auditável e melhoria contínua da política a cada interação avaliada.

F3 · Longo prazo · 4 a 8 meses

RL completo + ontologia evolutiva + inferência ativa de Skills

  • Política RL completa, com Skills, padrões e metadados como vetor de estado
  • Roteador detecta lacunas de Skills no perfil e pede confirmação ao usuário quando ambíguo
  • Mineração contínua de novos sintomas, causas e relações a partir dos casos da rede GAAS
  • Curadoria GAAS revisa propostas de evolução ontológica geradas pelo sistema
  • Composição automática de estratégias (multi-hop + casos, graph + indexação hierárquica recursiva) com base em recompensa observada
  • Templates de CoT evoluem com base em recompensa por padrão e por Skill
  • Auditoria humana periódica de amostras estratificadas por padrão e Skill

Entrega: infraestrutura de inteligência coletiva auto-otimizante, com a ontologia da ATR evoluindo a partir do uso real e a curadoria GAAS atuando como guardiã epistêmica.

Critérios de avaliação por fase

FaseMétricas técnicasMétricas de produto
F0 Aderência da resposta à cadeia ontológica (revisão GAAS), latência aceitável, cobertura dos três padrões iniciais Percepção do produtor de que o sistema "pensa antes de responder", validação do método pelo comitê GAAS
F1 Precisão do classificador de padrões, redução de chunks irrelevantes, cobertura de tagueamento ontológico Aprovação da resposta pelo produtor, redução de pedidos de esclarecimento
F2 Coerência do multi-hop, taxa de hops válidos, melhoria do bandit ao longo do tempo NPS por padrão de consulta, tempo até resposta útil, retenção
F3 Recompensa média da política RL, novidade detectada na ontologia, qualidade da inferência de Skills Engajamento longitudinal, casos resolvidos sem escalação, contribuição da rede
Dependências entre fases

F0 valida o conceito de CoT ontológico antes de qualquer investimento estrutural, é a prova de método. F1 substitui Skills fixas por inferência e amplia a indexação. F2 sofistica o multi-hop e introduz aprendizado. F3 fecha o ciclo com RL completo e ontologia evolutiva. Nenhuma fase exige reescrita do prompt do sistema. Todas as quatro fases preservam a regra-mãe da ontologia: nenhuma recomendação é feita sem explicitar sintoma, causas, processos, estruturas, intervenções e indicadores.