Reference Architectures GenAI

    8 reference architecture diagrams for GenAI systems. Each pattern includes visual diagram, components, use cases, and metrics.

    Select an Architecture

    Basic RAG

    Simple Retrieval-Augmented Generation pipeline for initial projects.

    Complexity: LowFAQ / ChatbotBusca semântica
    Renderizando diagrama...

    Components

    • -Embedding Model (text-embedding-3-small)
    • -Vector Store (pgvector, Chroma)
    • -LLM (GPT-4o-mini, Claude Haiku)
    • -Prompt Template

    When to Use

    • FAQ e base de conhecimento simples
    • Documentação até 10K docs
    • Queries diretas sem ambiguidade
    • MVP e prototipagem rápida

    Limitations

    • Perde keywords exatos (nomes, códigos)
    • Sem refinamento de relevancia
    • Chunks isolados perdem contexto
    • Não escala bem para milhoes de docs

    Typical Metrics

    Latência: ~500ms - 1.5s
    Precision@5: 70-80%
    Custo: ~$0.001/query
    Setup: 1-2 dias

    Tech Stack

    LangChainOpenAIpgvectorFastAPI

    Mermaid Code

    graph TD
        subgraph "Input"
            U[Usuário] -->|Query| E[Embedding Model]
        end
    
        subgraph "Retrieval"
            E -->|Vector| VDB[(Vector DB)]
            VDB -->|Top-K Docs| R[Reranker]
        end
    
        subgraph "Generation"
            R -->|Context| P[Prompt Builder]
            P -->|Prompt| LLM[LLM]
            LLM -->|Response| U
        end

    GenAI Documentação

    Alexsander Valente - 2025