RegenerAI ·
Arquitetura adaptativa
Agente roteador com política aprendida por reforço, enriquecida por Skills de perfil que influenciam dinamicamente a seleção de estratégias de recuperação, do simples ao hierárquico, do grafo ao escalonamento humano.
As Skills do perfil entram no pipeline entre o contexto da pergunta e a política aprendida, criando um prior que orienta o roteador antes do aprendizado por reforço atuar.
Cada usuário carrega um conjunto de Skills, capacidades e contextos declarados ou inferidos pelo sistema (bioma, cultura, nível de maturidade ATR, perfil profissional). O Agente Roteador usa as Skills ativas como prior na distribuição de probabilidade sobre estratégias de recuperação, tornando o roteamento sensível ao perfil antes mesmo da política de RL atuar.
Capítulos deste documento
Pipeline completo: do input do usuário até a atualização da política. Skills do perfil entram como sinal adicional no agente roteador.
Cada Skill declarada no perfil do usuário (produtor/técnico/consultor) influencia a política de seleção de estratégia RAG. Skills podem forçar ou elevar o peso de estratégias específicas.
8 estratégias de recuperação disponíveis: RAG simples, busca híbrida, RAPTOR, GraphRAG, multi-hop, casos semelhantes, esclarecimento e escalonamento.
Mapeamento heurístico entre situações, Skills ativas e estratégias prováveis. Ponto de partida refinado pelo aprendizado por reforço.
Ciclo contínuo de 6 etapas: Skills integradas ao vetor de estado. Skills bem-sucedidas têm seu bias reforçado na política.
Roadmap em 3 fases (heurístico, bandit, RL), catálogo versionado de Skills, mecanismo de inferência e persistência no perfil RegenerAI.
Fluxo de execução
Do input do usuário à atualização da política. As Skills do perfil entram entre o contexto da pergunta e a política aprendida.
Usuário · Produtor · Técnico · Consultor
Pergunta + Perfil Agrícola + Skills + Histórico + Tier
Agente Roteador, núcleo da decisão
Skills ativas viram prior sobre as estratégias de recuperação
Política aprendida (RL · Bandit · Feedback)
Estratégia de recuperação selecionada dinamicamente
Resposta com fontes · transparência · neutralidade comercial
Feedback do usuário + avaliação técnica + métricas
Atualização da política + bias de Skills reforçado
Estratégias de recuperação selecionadas dinamicamente
RAG simples Busca híbrida BM25 + vetorial RAPTOR GraphRAG Multi-hop retrieval Casos semelhantes Pergunta de esclarecimento Escalonamento p/ especialista
Skills e roteamento RAG
Uma Skill é uma capacidade ou contexto registrado no perfil do usuário, declarada explicitamente, inferida pelo Agente de Maturidade Regenerativa, ou detectada durante a Anamnese. Cada Skill carrega um RAG bias: a estratégia de recuperação que ela tende a favorecer. O Roteador usa as Skills ativas como prior na distribuição de probabilidade sobre estratégias.
1 · Leitura do perfil. Roteador lê as Skills ativas do usuário no momento da consulta.
2 · Prior de estratégia. Cada Skill ajusta a probabilidade inicial de cada estratégia RAG.
3 · Política RL refina. A política aprendida combina o prior com histórico de recompensa.
4 · Reforço adaptativo. Skills bem-sucedidas têm bias reforçado. Bias fracos são atenuados.
Clique em qualquer Skill para abrir o detalhe do seu bias.
Solo e Território
Culturas e Manejo
Maturidade Regenerativa
Perfil Profissional
Legenda · RAG bias
RAG simples Busca híbrida RAPTOR GraphRAG Multi-hop Casos semelhantes Esclarecimento Escalonamento RAPTOR + GraphRAG
Estratégias de recuperação disponíveis
Cada estratégia exibe as Skills que a ativam preferencialmente. O roteador pode selecionar qualquer estratégia independentemente de Skills, mas elas elevam o prior de estratégias específicas na política.
Matriz de decisão
A matriz inclui a coluna Skill associada: o sinal de perfil que, combinado com a situação detectada, determina a estratégia provável no estado inicial da política. É o ponto de partida heurístico, refinado pelo aprendizado por reforço.
| Situação | Skill associada | Estratégia de recuperação |
|---|---|---|
| Pergunta conceitual simples | Produtor Rural | RAG híbrido leve |
| Documento longo / manual técnico | MIP/Pragas · Certificação | RAPTOR |
| Síntese transversal de casos | Bioma · ATR Avançado | GraphRAG |
| Pergunta multi-etapa | Pecuária/ILPF · Consultor | Multi-hop RAG |
| Pergunta sem contexto suficiente | Iniciante ATR | Pedir esclarecimento |
| Risco técnico alto | Erosão Avançada | Escalonar (flag vermelho) |
| Pergunta recorrente | qualquer | Cache semântico |
| Benchmarking com pares | Transição em Curso · Café | Casos semelhantes |
Loop de aprendizado da política
Skills integram o vetor de estado da política. O aprendizado não apenas melhora a seleção de estratégia, ele reforça ou atenua os biases de Skills específicas com base na recompensa observada. Ciclo contínuo de melhoria em 6 etapas.
Considerações de implementação
A introdução de Skills exige novas camadas: catálogo versionado pelo GAAS, mecanismo de inferência automática e persistência na camada de Perfil Agrícola. O roteamento evolui em 3 fases.
Roadmap em 3 fases
Roteamento heurístico
- Regras explícitas + Skills do perfil como filtros determinísticos
- Ex: skill:erosao_avancada sempre escalona
Bandit contextual
- Skills viram features do estado
- A política aprende quais Skills realmente predizem alta recompensa para cada estratégia de recuperação
RL completo
- Skills como sinal permanente no vetor de estado
- A política pode solicitar novas Skills ao usuário quando detecta ambiguidade de perfil
Camadas transversais
Skills gerenciadas como taxonomia versionada pelo GAAS: ID, categoria, RAG bias padrão, tier mínimo, agente responsável pela inferência.
Skills podem ser declaradas pelo usuário, inferidas pelo Agente de Maturidade Regenerativa (score por dimensão) ou detectadas pela Anamnese.
Skills persistidas na camada de Perfil Agrícola RegenerAI. Nunca expostas a terceiros. Anonimizadas nas métricas de aprendizado da política.