Build Your First RAG Application

This tutorial walks you through building a complete Retrieval Augmented Generation (RAG) application using FLTR for semantic search and OpenAI for generation.

What You’ll Build

A document Q&A system that:

Indexes a knowledge base using FLTR
Retrieves relevant context for user questions
Generates answers using GPT-4 with the retrieved context

Prerequisites

FLTR API key (get one here)
OpenAI API key (get one here)
Python 3.8+ or Node.js 16+

Architecture Overview

User Question → FLTR Semantic Search → Retrieved Context → GPT-4 → Answer

The flow:

User asks a question
FLTR finds relevant chunks from your documents
Chunks are passed as context to GPT-4
GPT-4 generates an answer based on the context

Implementation

import os
import requests
from openai import OpenAI

# Configuration
FLTR_API_KEY = os.getenv("FLTR_API_KEY")
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
FLTR_BASE_URL = "https://api.fltr.com/v1"

fltr_headers = {
    "Authorization": f"Bearer {FLTR_API_KEY}",
    "Content-Type": "application/json"
}

openai_client = OpenAI(api_key=OPENAI_API_KEY)

# Step 1: Create a dataset
def create_dataset(name: str, description: str):
    response = requests.post(
        f"{FLTR_BASE_URL}/datasets",
        headers=fltr_headers,
        json={
            "name": name,
            "description": description,
            "is_public": False
        }
    )
    response.raise_for_status()
    return response.json()["id"]

# Step 2: Upload documents
def upload_document(dataset_id: str, content: str, metadata: dict):
    response = requests.post(
        f"{FLTR_BASE_URL}/datasets/{dataset_id}/documents",
        headers=fltr_headers,
        json={
            "content": content,
            "metadata": metadata
        }
    )
    response.raise_for_status()
    return response.json()

# Step 3: Query FLTR for relevant context
def search_knowledge_base(dataset_id: str, query: str, limit: int = 3):
    response = requests.post(
        f"{FLTR_BASE_URL}/mcp/query",
        headers=fltr_headers,
        json={
            "query": query,
            "dataset_id": dataset_id,
            "limit": limit
        }
    )
    response.raise_for_status()
    return response.json()["results"]

# Step 4: Generate answer with GPT-4
def generate_answer(question: str, context_chunks: list):
    # Format context from retrieved chunks
    context = "\n\n".join([
        f"[Source: {chunk['metadata'].get('title', 'Unknown')}]\n{chunk['content']}"
        for chunk in context_chunks
    ])

    # Create prompt with context
    messages = [
        {
            "role": "system",
            "content": "You are a helpful assistant. Answer questions based on the provided context. If the context doesn't contain enough information, say so."
        },
        {
            "role": "user",
            "content": f"Context:\n{context}\n\nQuestion: {question}"
        }
    ]

    # Call GPT-4
    response = openai_client.chat.completions.create(
        model="gpt-4",
        messages=messages,
        temperature=0.7,
        max_tokens=500
    )

    return response.choices[0].message.content

# Step 5: Main RAG function
def answer_question(dataset_id: str, question: str):
    print(f"Question: {question}\n")

    # Retrieve relevant context
    print("Searching knowledge base...")
    chunks = search_knowledge_base(dataset_id, question, limit=3)

    print(f"Found {len(chunks)} relevant chunks\n")

    # Generate answer
    print("Generating answer...")
    answer = generate_answer(question, chunks)

    print(f"\nAnswer: {answer}\n")

    # Show sources
    print("Sources:")
    for i, chunk in enumerate(chunks, 1):
        title = chunk['metadata'].get('title', 'Unknown')
        score = chunk['score']
        print(f"{i}. {title} (relevance: {score:.2f})")

    return answer

# Example usage
if __name__ == "__main__":
    # Create dataset
    dataset_id = create_dataset(
        name="Product Documentation",
        description="FLTR product docs for RAG demo"
    )

    print(f"Created dataset: {dataset_id}\n")

    # Upload sample documents
    docs = [
        {
            "content": "FLTR supports three authentication methods: API keys for services, OAuth 2.1 for MCP clients, and session tokens for web apps. API keys provide 1,000 requests per hour.",
            "metadata": {"title": "Authentication Guide", "category": "security"}
        },
        {
            "content": "FLTR uses hybrid search combining vector embeddings with keyword matching. You can enable Cohere reranking for even better results. The default embedding model is text-embedding-3-small.",
            "metadata": {"title": "Search Guide", "category": "features"}
        },
        {
            "content": "To integrate FLTR with Zapier, use the Webhooks by Zapier action. Set the URL to https://api.fltr.com/v1/mcp/query and include your API key in the Authorization header.",
            "metadata": {"title": "Zapier Integration", "category": "integrations"}
        }
    ]

    for doc in docs:
        upload_document(dataset_id, doc["content"], doc["metadata"])
        print(f"Uploaded: {doc['metadata']['title']}")

    print("\nWaiting for indexing to complete...\n")
    import time
    time.sleep(3)  # Give FLTR time to process

    # Ask questions
    questions = [
        "How do I authenticate with FLTR?",
        "What search methods does FLTR support?",
        "How can I use FLTR with Zapier?"
    ]

    for question in questions:
        print("=" * 60)
        answer_question(dataset_id, question)
        print()

Running the Example

Install Dependencies

pip install requests openai

Set Environment Variables

export FLTR_API_KEY="your_fltr_api_key"
export OPENAI_API_KEY="your_openai_api_key"

Run the Script

python rag_demo.py

Expected Output

Created dataset: ds_abc123

Uploaded: Authentication Guide
Uploaded: Search Guide
Uploaded: Zapier Integration

Waiting for indexing to complete...

============================================================
Question: How do I authenticate with FLTR?

Searching knowledge base...
Found 3 relevant chunks

Generating answer...

Answer: FLTR supports three authentication methods:

1. **API Keys** - Best for services and scripts, providing 1,000 requests per hour
2. **OAuth 2.1** - Designed for MCP clients with higher rate limits
3. **Session Tokens** - For web applications

For most integrations, API keys are the recommended approach. You can generate them in your FLTR dashboard under Settings → API Keys.

Sources:
1. Authentication Guide (relevance: 0.92)
2. Zapier Integration (relevance: 0.45)
3. Search Guide (relevance: 0.31)

Advanced Features

Enable Reranking

For better result quality, enable Cohere reranking:

def search_knowledge_base(dataset_id: str, query: str, limit: int = 3):
    response = requests.post(
        f"{FLTR_BASE_URL}/mcp/query",
        headers=fltr_headers,
        json={
            "query": query,
            "dataset_id": dataset_id,
            "limit": limit,
            "rerank": True  # Enable Cohere reranking
        }
    )
    response.raise_for_status()
    return response.json()["results"]

Batch Queries

Process multiple questions efficiently:

def batch_search(dataset_id: str, queries: list):
    response = requests.post(
        f"{FLTR_BASE_URL}/mcp/batch-query",
        headers=fltr_headers,
        json={
            "queries": queries,
            "dataset_id": dataset_id,
            "limit": 3
        }
    )
    response.raise_for_status()
    return response.json()["results"]

Add Citations

Include source references in generated answers:

def generate_answer_with_citations(question: str, context_chunks: list):
    # Add numbered citations to context
    context_parts = []
    for i, chunk in enumerate(context_chunks, 1):
        title = chunk['metadata'].get('title', 'Unknown')
        context_parts.append(f"[{i}] {title}:\n{chunk['content']}")

    context = "\n\n".join(context_parts)

    messages = [
        {
            "role": "system",
            "content": "Answer questions using the provided context. Include citation numbers [1], [2], etc. when referencing sources."
        },
        {
            "role": "user",
            "content": f"Context:\n{context}\n\nQuestion: {question}"
        }
    ]

    response = openai_client.chat.completions.create(
        model="gpt-4",
        messages=messages,
        temperature=0.7
    )

    return response.choices[0].message.content

Production Considerations

Error Handling

from tenacity import retry, stop_after_attempt, wait_exponential

@retry(
    stop=stop_after_attempt(3),
    wait=wait_exponential(multiplier=1, min=2, max=10)
)
def search_with_retry(dataset_id: str, query: str):
    try:
        return search_knowledge_base(dataset_id, query)
    except requests.exceptions.RequestException as e:
        print(f"Search failed: {e}")
        raise

Monitoring

Track performance and costs:

import time
from datetime import datetime

def answer_question_with_metrics(dataset_id: str, question: str):
    start_time = time.time()

    # Track costs (approximate)
    fltr_cost = 0.0001  # Per query
    gpt4_cost = 0.03    # Per 1K tokens (approximate)

    chunks = search_knowledge_base(dataset_id, question)
    search_time = time.time() - start_time

    answer = generate_answer(question, chunks)
    total_time = time.time() - start_time

    # Log metrics
    print(f"""
    Metrics:
    - Search time: {search_time:.2f}s
    - Total time: {total_time:.2f}s
    - Chunks retrieved: {len(chunks)}
    - Estimated cost: ${fltr_cost + gpt4_cost:.4f}
    - Timestamp: {datetime.now().isoformat()}
    """)

    return answer

Next Steps

API Reference

Explore advanced query options

Zapier Integration

Build no-code RAG workflows

OAuth Setup

Integrate with Claude Desktop

Webhooks

Get notified of document updates

Troubleshooting

No Results Returned

If queries return zero results:

Wait 5-10 seconds after uploading for indexing to complete
Try broader search terms
Check that documents were uploaded successfully
Verify the dataset ID is correct

Low Relevance Scores

To improve search quality:

Enable reranking with "rerank": true
Add descriptive metadata to documents
Break large documents into smaller chunks
Use more specific queries

Rate Limit Issues

If you hit rate limits:

Implement exponential backoff and retry logic
Cache frequent queries
Use batch queries for multiple questions
Upgrade to OAuth for 15,000 req/hour

Getting Started

Authentication

Integrations

Support

Your First Integration

Build Your First RAG Application

What You’ll Build

Prerequisites

Architecture Overview

Implementation

Running the Example

Expected Output

Advanced Features

Enable Reranking

Batch Queries

Add Citations

Production Considerations

Error Handling

Monitoring

Next Steps

API Reference

Zapier Integration

OAuth Setup

Webhooks

Troubleshooting

No Results Returned

Low Relevance Scores

Rate Limit Issues

Resources

Getting Started

Authentication

Integrations

Support

​Build Your First RAG Application

​What You’ll Build

​Prerequisites

​Architecture Overview

​Implementation

​Running the Example

​Expected Output

​Advanced Features

​Enable Reranking

​Batch Queries

​Add Citations

​Production Considerations

​Error Handling

​Monitoring

​Next Steps

API Reference

Zapier Integration

OAuth Setup

Webhooks

​Troubleshooting

​No Results Returned

​Low Relevance Scores

​Rate Limit Issues

​Resources

Build Your First RAG Application

What You’ll Build

Prerequisites

Architecture Overview

Implementation

Running the Example

Expected Output

Advanced Features

Enable Reranking

Batch Queries

Add Citations

Production Considerations

Error Handling

Monitoring

Next Steps

Troubleshooting

No Results Returned

Low Relevance Scores

Rate Limit Issues

Resources