Reference Architectures GenAI
8 reference architecture diagrams for GenAI systems. Each pattern includes visual diagram, components, use cases, and metrics.
Select an Architecture
Basic RAG
Simple Retrieval-Augmented Generation pipeline for initial projects.
Complexity: LowFAQ / ChatbotBusca semântica
Renderizando diagrama...
Components
- -Embedding Model (text-embedding-3-small)
- -Vector Store (pgvector, Chroma)
- -LLM (GPT-4o-mini, Claude Haiku)
- -Prompt Template
When to Use
- FAQ e base de conhecimento simples
- Documentação até 10K docs
- Queries diretas sem ambiguidade
- MVP e prototipagem rápida
Limitations
- Perde keywords exatos (nomes, códigos)
- Sem refinamento de relevancia
- Chunks isolados perdem contexto
- Não escala bem para milhoes de docs
Typical Metrics
Latência: ~500ms - 1.5s
Precision@5: 70-80%
Custo: ~$0.001/query
Setup: 1-2 dias
Tech Stack
LangChainOpenAIpgvectorFastAPI
Mermaid Code
graph TD
subgraph "Input"
U[Usuário] -->|Query| E[Embedding Model]
end
subgraph "Retrieval"
E -->|Vector| VDB[(Vector DB)]
VDB -->|Top-K Docs| R[Reranker]
end
subgraph "Generation"
R -->|Context| P[Prompt Builder]
P -->|Prompt| LLM[LLM]
LLM -->|Response| U
end