RegenerAI ·
Arquitetura adaptativa

Agente roteador com política aprendida por reforço, enriquecida por Skills de perfil que influenciam dinamicamente a seleção de estratégias de recuperação, do simples ao hierárquico, do grafo ao escalonamento humano.

Versão: v2 · com Skills Plataforma: RegenerAI · ATR / GAAS Confidencialidade: Uso interno Origem: Documento técnico · Syntropy Labs

As Skills do perfil entram no pipeline entre o contexto da pergunta e a política aprendida, criando um prior que orienta o roteador antes do aprendizado por reforço atuar.

Conceito · Skills

Cada usuário carrega um conjunto de Skills, capacidades e contextos declarados ou inferidos pelo sistema (bioma, cultura, nível de maturidade ATR, perfil profissional). O Agente Roteador usa as Skills ativas como prior na distribuição de probabilidade sobre estratégias de recuperação, tornando o roteamento sensível ao perfil antes mesmo da política de RL atuar.

Capítulos deste documento

01 · Fluxo de execução

Pipeline completo: do input do usuário até a atualização da política. Skills do perfil entram como sinal adicional no agente roteador.

02 · Skills e roteamento RAG

Cada Skill declarada no perfil do usuário (produtor/técnico/consultor) influencia a política de seleção de estratégia RAG. Skills podem forçar ou elevar o peso de estratégias específicas.

03 · Estratégias RAG do roteador

8 estratégias de recuperação disponíveis: RAG simples, busca híbrida, RAPTOR, GraphRAG, multi-hop, casos semelhantes, esclarecimento e escalonamento.

04 · Matriz de decisão

Mapeamento heurístico entre situações, Skills ativas e estratégias prováveis. Ponto de partida refinado pelo aprendizado por reforço.

05 · Loop de aprendizado

Ciclo contínuo de 6 etapas: Skills integradas ao vetor de estado. Skills bem-sucedidas têm seu bias reforçado na política.

06 · Considerações de implementação

Roadmap em 3 fases (heurístico, bandit, RL), catálogo versionado de Skills, mecanismo de inferência e persistência no perfil RegenerAI.

Fluxo de execução

Do input do usuário à atualização da política. As Skills do perfil entram entre o contexto da pergunta e a política aprendida.

Entrada

Usuário · Produtor · Técnico · Consultor

→

Contexto

Pergunta + Perfil Agrícola + Skills + Histórico + Tier

→

Roteador

Agente Roteador, núcleo da decisão

Sinal de Skills

Skills ativas viram prior sobre as estratégias de recuperação

→

Política

Política aprendida (RL · Bandit · Feedback)

→

Estratégias

Estratégia de recuperação selecionada dinamicamente

Saída

Resposta com fontes · transparência · neutralidade comercial

→

Feedback

Feedback do usuário + avaliação técnica + métricas

→

Atualização

Atualização da política + bias de Skills reforçado

Estratégias de recuperação selecionadas dinamicamente

RAG simples Busca híbrida BM25 + vetorial RAPTOR GraphRAG Multi-hop retrieval Casos semelhantes Pergunta de esclarecimento Escalonamento p/ especialista

Entrada Skills (prior) Política RL Saída Feedback

Skills e roteamento RAG

Uma Skill é uma capacidade ou contexto registrado no perfil do usuário, declarada explicitamente, inferida pelo Agente de Maturidade Regenerativa, ou detectada durante a Anamnese. Cada Skill carrega um RAG bias: a estratégia de recuperação que ela tende a favorecer. O Roteador usa as Skills ativas como prior na distribuição de probabilidade sobre estratégias.

Como as Skills entram no roteamento

1 · Leitura do perfil. Roteador lê as Skills ativas do usuário no momento da consulta.

2 · Prior de estratégia. Cada Skill ajusta a probabilidade inicial de cada estratégia RAG.

3 · Política RL refina. A política aprendida combina o prior com histórico de recompensa.

4 · Reforço adaptativo. Skills bem-sucedidas têm bias reforçado. Bias fracos são atenuados.

Clique em qualquer Skill para abrir o detalhe do seu bias.

Solo e Território

01

Solo Degradado RAPTOR

RAG bias: RAPTOR

Manuais técnicos de recuperação de solo são extensos e densos. A indexação hierárquica permite navegar do problema à solução.

›

02

Análise de Solo Busca híbrida

RAG bias: Busca híbrida

Termos técnicos exatos (pH, CTC, granulometria) requerem relevância lexical combinada com similaridade semântica.

›

03

Bioma Cerrado GraphRAG

RAG bias: GraphRAG

Síntese transversal de casos regionais, espécies nativas e práticas adaptadas ao bioma exige grafo de entidades.

›

04

Bioma Amazônia GraphRAG

RAG bias: GraphRAG

Relações complexas entre regulação ambiental, espécies e práticas regenerativas exigem grafo de conhecimento.

›

05

Erosão Avançada crítico Escalonamento

RAG bias: Escalonamento

Risco técnico alto. Flag vermelho automático para consultor agrônomo via Agente Guardião.

›

Culturas e Manejo

06

Cafeicultura Casos semelhantes

RAG bias: Casos semelhantes

Alta densidade de casos GAAS para café. A memória de campo supera literatura genérica para produtores da rede.

›

07

Pecuária / ILPF Multi-hop

RAG bias: Multi-hop

ILPF exige combinar dados de solo + pastagem + floresta + regulação em múltiplas buscas encadeadas.

›

08

Hortifruti RAG simples

RAG bias: RAG simples

Perguntas pontuais e conceituais predominantes. Corpus curado resolve com busca vetorial direta.

›

09

Grãos (Soja/Milho) Busca híbrida

RAG bias: Busca híbrida

Nomes técnicos de cultivares e defensivos exigem correspondência lexical exata além da semântica.

›

10

MIP / Pragas RAPTOR

RAG bias: RAPTOR

Manuais de MIP são extensos. A indexação hierárquica permite navegar do sintoma ao manejo recomendado.

›

Maturidade Regenerativa

11

Iniciante ATR Esclarecimento

RAG bias: Esclarecimento

Contexto insuficiente para recomendar sem risco. O roteador prioriza perguntas de diagnóstico antes de recuperar conteúdo.

›

12

Transição em curso Casos semelhantes

RAG bias: Casos semelhantes

Benchmarking com produtores em estágio similar na rede GAAS é mais útil do que literatura acadêmica genérica.

›

13

ATR Avançado GraphRAG

RAG bias: GraphRAG

Sínteses transversais e padrões emergentes de sistemas maduros requerem grafo de conhecimento relacional.

›

14

Certificação Orgânica RAPTOR

RAG bias: RAPTOR

Normas e protocolos de certificação são documentos longos com estrutura hierárquica. O RAPTOR navega do resumo ao detalhe.

›

Perfil Profissional

15

Produtor Rural RAG simples

RAG bias: RAG simples

Linguagem acessível, perguntas conceituais. Estratégia leve com resposta direta e fontes explícitas.

›

16

Técnico de Campo Busca híbrida

RAG bias: Busca híbrida

Combinação de termos técnicos de campo com consultas contextuais de situação real.

›

17

Consultor Agrônomo Multi-hop

RAG bias: Multi-hop

Consultas complexas que exigem raciocínio encadeado entre múltiplas fontes especializadas e casos GAAS.

›

18

Pesquisador RAPTOR + GraphRAG

RAG bias: RAPTOR + GraphRAG

Profundidade máxima: documentos longos + síntese transversal entre pesquisas científicas e casos de campo.

›

Legenda · RAG bias

RAG simples Busca híbrida RAPTOR GraphRAG Multi-hop Casos semelhantes Esclarecimento Escalonamento RAPTOR + GraphRAG

Estratégias de recuperação disponíveis

Cada estratégia exibe as Skills que a ativam preferencialmente. O roteador pode selecionar qualquer estratégia independentemente de Skills, mas elas elevam o prior de estratégias específicas na política.

01

RAG simples

Recuperação leve

Busca vetorial direta sobre o índice. Baixo custo e baixa latência.Skills ativadoras: Produtor Rural, Hortifruti

›

02

Busca híbrida BM25 + vetorial

Recuperação balanceada

Relevância lexical + similaridade semântica.Skills ativadoras: Análise de Solo, Grãos, Técnico de Campo

›

03

RAPTOR

Indexação hierárquica

Indexação recursiva para documentos extensos.Skills ativadoras: Solo Degradado, MIP/Pragas, Certificação Orgânica, Pesquisador

›

04

GraphRAG

Síntese transversal

Recuperação sobre grafo de entidades e relações.Skills ativadoras: Bioma Cerrado, Bioma Amazônia, ATR Avançado, Pesquisador

›

05

Multi-hop retrieval

Raciocínio composto

Sub-perguntas encadeadas em múltiplas buscas.Skills ativadoras: Pecuária/ILPF, Consultor Agrônomo

›

06

Consulta a casos semelhantes

Memória de casos

Situações análogas na rede GAAS.Skills ativadoras: Cafeicultura, Transição em Curso

›

07

Pergunta de esclarecimento

Diálogo

Contexto insuficiente para recomendar com segurança.Skills ativadoras: Iniciante ATR, ausência de perfil agrícola

›

08

Escalonamento p/ especialista salvaguarda

Salvaguarda

Risco técnico alto, encaminha a humano qualificado.Skills ativadoras: Erosão Avançada, qualquer flag vermelho do Agente Guardião

›

Matriz de decisão

A matriz inclui a coluna Skill associada: o sinal de perfil que, combinado com a situação detectada, determina a estratégia provável no estado inicial da política. É o ponto de partida heurístico, refinado pelo aprendizado por reforço.

Situação	Skill associada	Estratégia de recuperação
Pergunta conceitual simples	Produtor Rural	RAG híbrido leve
Documento longo / manual técnico	MIP/Pragas · Certificação	RAPTOR
Síntese transversal de casos	Bioma · ATR Avançado	GraphRAG
Pergunta multi-etapa	Pecuária/ILPF · Consultor	Multi-hop RAG
Pergunta sem contexto suficiente	Iniciante ATR	Pedir esclarecimento
Risco técnico alto	Erosão Avançada	Escalonar (flag vermelho)
Pergunta recorrente	qualquer	Cache semântico
Benchmarking com pares	Transição em Curso · Café	Casos semelhantes

Loop de aprendizado da política

Skills integram o vetor de estado da política. O aprendizado não apenas melhora a seleção de estratégia, ele reforça ou atenua os biases de Skills específicas com base na recompensa observada. Ciclo contínuo de melhoria em 6 etapas.

01

Observação do estado

Vetorização da pergunta + Skills ativas

Vetorização da pergunta + Skills ativas do perfil + histórico recente + tier de assinatura.

›

02

Seleção da ação

Política pondera Skills como prior

A política pondera Skills do perfil como prior na distribuição sobre estratégias de recuperação, combinando com histórico de recompensa.

›

03

Geração da resposta

Pipeline executa a estratégia

O pipeline executa a estratégia selecionada e produz resposta com fontes, mantendo neutralidade comercial.

›

04

Coleta de recompensa

Sinais explícitos e implícitos

Sinais explícitos (positivo/negativo, avaliação do consultor) e implícitos (tempo de leitura, retorno à pergunta, abandono).

›

05

Atualização da política

Reforço e atenuação de bias

Skills bem-sucedidas reforçam o bias para determinadas estratégias de recuperação. Skills com baixa recompensa têm seu prior atenuado.

›

06

Auditoria humana

Comitê técnico do GAAS

O comitê técnico do GAAS revisa amostras e pode adicionar, remover ou reclassificar Skills no catálogo versionado.

›

Considerações de implementação

A introdução de Skills exige novas camadas: catálogo versionado pelo GAAS, mecanismo de inferência automática e persistência na camada de Perfil Agrícola. O roteamento evolui em 3 fases.

Roadmap em 3 fases

Fase 1 · MVP

Roteamento heurístico

Regras explícitas + Skills do perfil como filtros determinísticos
Ex: skill:erosao_avancada sempre escalona

Fase 2 · pós-lançamento

Bandit contextual

Skills viram features do estado
A política aprende quais Skills realmente predizem alta recompensa para cada estratégia de recuperação

Fase 3 · maturidade

RL completo

Skills como sinal permanente no vetor de estado
A política pode solicitar novas Skills ao usuário quando detecta ambiguidade de perfil

Camadas transversais

Catálogo de Skills

Skills gerenciadas como taxonomia versionada pelo GAAS: ID, categoria, RAG bias padrão, tier mínimo, agente responsável pela inferência.

Inferência de Skills

Skills podem ser declaradas pelo usuário, inferidas pelo Agente de Maturidade Regenerativa (score por dimensão) ou detectadas pela Anamnese.

Soberania de dados

Skills persistidas na camada de Perfil Agrícola RegenerAI. Nunca expostas a terceiros. Anonimizadas nas métricas de aprendizado da política.

RegenerAI ·Arquitetura adaptativa

Capítulos deste documento

Fluxo de execução

Estratégias de recuperação selecionadas dinamicamente

Skills e roteamento RAG

Solo e Território

Culturas e Manejo

Maturidade Regenerativa

Perfil Profissional

Legenda · RAG bias

Estratégias de recuperação disponíveis

Matriz de decisão

Loop de aprendizado da política

Considerações de implementação

Roadmap em 3 fases

Roteamento heurístico

Bandit contextual

RL completo

Camadas transversais

RegenerAI ·
Arquitetura adaptativa