Galeria de Diagramas

RAG Pipeline — do documento à resposta

🔄 Fluxo RAG Estático

Indexação roda offline (uma vez); query é online (milissegundos). Vector store armazena embeddings para busca por similaridade.

Loop Agêntico — ReAct Pattern

🔁 Gather → Act → Verify → Repeat

O loop se repete até o agente decidir que terminou — limitado por max_iterations, budget de tokens e detecção de repetição.

MCP — Arquitetura Cliente-Servidor

🔗 Model Context Protocol

Cliente MCP abstrai a integração. O mesmo servidor funciona com Claude Desktop, Cursor, IDE customizada — sem mudança de código.

A2A — Agent-to-Agent Protocol

🤝 Comunicação entre agentes de diferentes frameworks

A2A é agnóstico de framework: um agente em LangGraph fala com outro em CrewAI sem código específico.

C4 Model — Arquitetura em 4 zooms

🏗️ Context → Containers → Components → Code

Zoom progressivo: cada nível é subconjunto do anterior. Escolha o nível certo pelo público-alvo do documento.

Tokenização — como o modelo "vê" texto

🔤 Palavra ≠ Token

Acentos e palavras mais longas em português quebram em mais sub-tokens. Considere isso ao estimar custos de LLM.

Embeddings — semântica em espaço vetorial

📐 Proximidade no espaço = proximidade semântica

Cada texto vira vetor de ~1536 dimensões. Textos semanticamente próximos têm menor distância no espaço. Base de RAG, busca, clustering.

RAG vs Fine-tuning — quando usar cada

⚖️ Árvore de decisão

Em 2026, o consenso: RAG para conhecimento, Fine-tuning para comportamento. Frequentemente usados juntos em produção.

💡

Como usar estes diagramas

Todos os diagramas são SVG inline: podem ser salvos, impressos (experimente Ctrl+P), ou reusados em apresentações (inspecione o elemento → copie o SVG). Zoom funciona sem perder qualidade. Para citar o MBA em apresentações, link para esta página.