构建基于静态站点生成的前端与Vault赋能的后端服务以实现安全的Qdrant向量检索

后端架构

文章字数: 3.8k

阅读时长: 15 分

一个看似矛盾的架构需求摆在了面前：我们需要为一个AI驱动的知识库构建前端，它必须拥有静态站点（SSG）的极致加载速度、CDN友好性和低廉的运维成本。同时，这个应用的核心是基于Qdrant的向量检索，数据具有商业敏感性，必须实现精细化的、基于用户身份的访问控制。

将一个完全静态的、运行在客户端浏览器的应用，与一个需要严格安全控制的后端数据存储直接对接，这本身就是一个架构上的难题。任何将长期有效的数据库凭证直接暴露在客户端代码中的方案，在真实项目中都是完全不可接受的。

方案权衡：在安全与性能间寻找平衡点

在探讨最终方案之前，有必要审视几个被否决的备选路径，这能更清晰地揭示我们所面临的权衡。

方案A：纯后端渲染（SSR）

最直接、最传统的安全方案是放弃SSG，转而使用纯服务器端渲染。用户请求到达服务器，服务器验证用户身份，然后用自己的高权限凭证查询Qdrant，将结果渲染到HTML中再返回给客户端。

优势: 安全模型简单清晰。所有敏感凭证，包括Qdrant的API Key，都安全地保留在后端，绝不外泄。
劣势: 这完全违背了我们的初衷。我们失去了SSG带来的所有好处：无法利用CDN进行全球分发，服务器需要为每次页面访问执行计算和数据获取，TTFB（Time To First Byte）显著增加，且服务器成本和运维复杂度远高于静态文件托管。

对于一个面向公众的、可能面临流量洪峰的知识库产品，SSR模式下的资源消耗和响应延迟是我们希望极力避免的。

方案B：API网关代理所有请求

另一个看似可行的方案是，SSG前端的所有对Qdrant的请求都通过一个我们自己构建的API网关进行代理。客户端JS代码调用我们的网关，网关验证用户身份后，再将请求转发给Qdrant，最后将结果返回。

优势: 同样实现了安全隔离，Qdrant凭证不暴露给客户端。
劣势:
1. 性能瓶颈: 所有的数据查询流量都必须经过我们的网关中转，这引入了额外的网络跳数和处理延迟。Qdrant本身是高性能的，但这个网关很容易成为瓶颈。
2. 实现复杂性: 为了不损失Qdrant丰富的功能，我们需要在网关层实现对Qdrant API的完整映射，包括各种复杂的过滤、排序和向量搜索参数。这几乎等于重写了一个Qdrant的客户端，维护成本极高。
3. 成本: 网关本身需要部署、扩容和维护，这又增加了基础设施成本。

这个方案虽然安全，但在性能和维护性上付出的代价太大。它将简单的数据查询操作复杂化了。

最终架构：动态凭证下发的“令牌售卖机”模式

我们最终选择了一种混合架构，它既保留了SSG的优势，又通过引入HashiCorp Vault实现了动态、安全的数据访问。其核心思想是构建一个轻量级的后端服务，我们称之为“令牌售卖机”（Token Vending Machine, TVM）。

这个架构的流程如下：

用户浏览器加载从CDN获取的静态HTML、CSS和JavaScript文件。
客户端应用通过某种方式（如JWT）完成用户身份认证。
客户端携带有效的身份凭证，向我们的TVM服务发起一个请求，申请一个用于访问Qdrant的临时API Key。
TVM服务验证用户身份，然后向HashiCorp Vault请求一个与该用户权限绑定的、具有短暂生命周期（例如5分钟）的Qdrant API Key。
Vault动态生成这个Key，并返回给TVM。
TVM将这个临时的Key下发给客户端。
客户端在接下来5分钟内，使用这个临时的Key直接与Qdrant进行交互，执行向量检索。Key过期后，客户端需要重新向TVM申请。
对于需要调用大语言模型（LLM）进行内容生成的步骤，则通过另一个专用的、受保护的后端代理进行，以保护LLM的API Key。

sequenceDiagram
    participant User as 用户浏览器
    participant CDN
    participant TVM as 令牌售卖机 (API)
    participant Vault as HashiCorp Vault
    participant Qdrant
    participant LLMProxy as LLM生成代理 (API)

    User->>CDN: 请求静态页面 (SSG)
    CDN-->>User: 返回HTML/JS/CSS
    User->>TVM: 携带用户凭证(JWT), 请求Qdrant临时Key
    TVM->>Vault: 验证用户身份后, 为用户角色请求动态密钥
    Vault-->>TVM: 生成并返回一个有时效的Qdrant API Key
    TVM-->>User: 返回临时的Qdrant API Key
    User->>Qdrant: 使用临时Key直接进行向量检索
    Qdrant-->>User: 返回检索结果
    User->>LLMProxy: 携带检索结果, 请求内容生成
    LLMProxy-->>User: 返回LLM生成的内容

这种模式的精妙之处在于，它将控制平面（凭证的分发）和数据平面（实际的向量检索）分离。TVM和Vault是安全的核心，处理低频但高敏感的凭证请求。而客户端和Qdrant之间则进行高频的数据交互，且因为是直接通信，延迟最低。

核心实现：Vault与令牌售卖机

1. 配置HashiCorp Vault

在真实项目中，第一步是配置Vault以使其能够按需生成Qdrant的API Key。这里我们假设Qdrant开启了API Key认证。Vault需要一个高权限的Master Key来创建和撤销其他的Key。

首先，我们需要为Vault配置一个通用的kv（Key-Value）引擎来存储Qdrant的Master Key。

# 启用kv-v2引擎
vault secrets enable -path=secret kv-v2

# 存储Qdrant的Master API Key
# 在生产环境中，这个值应该通过安全的方式注入，而不是直接写在命令行
vault kv put secret/qdrant api_key="YOUR_QDRANT_MASTER_KEY"

接下来，我们需要配置Vault的Database Secrets Engine。虽然Qdrant不是传统数据库，但我们可以利用这个引擎的生命周期管理能力。不过，更简单直接的方式是编写一个自定义的Vault插件，或者使用Vault的Transit引擎来生成签名的、有时效的JWT（如果Qdrant支持JWT认证）。

为了简化示例，我们这里采用一个更通用的模式：利用Vault Agent模板功能，结合一个脚本来模拟动态密钥生成。在更复杂的场景中，一个专门的Qdrant Secrets Engine插件会是更优雅的方案。

我们定义一个策略（policy），允许TVM服务读取这个Master Key。

qdrant-tvm-policy.hcl:

# 允许读取存储在'secret/qdrant'中的Master Key
path "secret/data/qdrant" {
  capabilities = ["read"]
}

# 创建策略
vault policy write qdrant-tvm-policy qdrant-tvm-policy.hcl

# 为TVM服务创建一个AppRole，这是推荐的机器间认证方式
vault auth enable approle
vault write auth/approle/role/qdrant-tvm \
    secret_id_ttl=10m \
    token_num_uses=10 \
    token_ttl=20m \
    token_max_ttl=30m \
    secret_id_num_uses=40 \
    policies="qdrant-tvm-policy"

# 获取RoleID和SecretID，这些将用于TVM服务的认证
# 在生产中，这些值会通过安全注入的方式给到TVM的运行环境
vault read auth/approle/role/qdrant-tvm/role-id
vault write -f auth/approle/role/qdrant-tvm/secret-id

2. “令牌售卖机” (TVM) Go语言实现

TVM服务是整个架构的核心枢纽。它需要足够健壮，并处理好与Vault的交互。以下是一个使用Go语言实现的示例，它使用了官方的Vault Go客户端。

main.go:

package main

import (
	"context"
	"encoding/json"
	"log"
	"net/http"
	"os"
	"time"

	"github.com/golang-jwt/jwt/v4"
	"github.com/hashicorp/vault/api"
)

// QdrantClient 是一个模拟的Qdrant管理客户端
// 在真实世界中，它会调用Qdrant的API来创建一个有时效的API Key
type QdrantClient struct {
	MasterKey string
	Host      string
}

// CreateTemporaryAPIKey 模拟创建一个临时的、可能带有特定权限的API Key
// 真实的Qdrant可能需要更复杂的操作，比如创建带有scope的key
func (c *QdrantClient) CreateTemporaryAPIKey(userID string) (string, error) {
	// 在真实的实现中，这里会发起一个HTTP请求到Qdrant的API
	// /collections/{collection_name}/keys
	// 使用MasterKey作为认证
	// 这里我们为了演示，简单地生成一个带有时效的JWT作为临时Key
	// 假设Qdrant可以配置为接受这种JWT
	claims := jwt.MapClaims{
		"sub":   userID,
		"scope": "read-only",
		"exp":   time.Now().Add(5 * time.Minute).Unix(),
		"nbf":   time.Now().Unix(),
		"iat":   time.Now().Unix(),
	}

	// 使用MasterKey的一部分作为签名密钥 (仅为演示)
	// 生产环境中应使用更安全的签名方法，如HS256
	token := jwt.NewWithClaims(jwt.SigningMethodHS256, claims)
	signedToken, err := token.SignedString([]byte(c.MasterKey[:16]))
	if err != nil {
		return "", err
	}
	return signedToken, nil
}

// TVMServer holds the dependencies for our server
type TVMServer struct {
	VaultClient  *api.Client
	QdrantClient *QdrantClient
}

// getQdrantTokenHandler 是处理凭证请求的HTTP Handler
func (s *TVMServer) getQdrantTokenHandler(w http.ResponseWriter, r *http.Request) {
	// 步骤1: 验证用户的身份
	// 在真实应用中，这里会解析Authorization头中的JWT，并验证其有效性
	// 为了简化，我们假设请求头中直接包含了UserID
	userID := r.Header.Get("X-User-ID")
	if userID == "" {
		http.Error(w, "Unauthorized: Missing X-User-ID header", http.StatusUnauthorized)
		return
	}
	log.Printf("Token request received for user: %s", userID)

	// 步骤2: (已在main函数中完成) TVM向Vault认证自己
	// 步骤3: TVM从Vault获取Qdrant的Master Key
	// 在启动时已经获取并缓存了QdrantClient

	// 步骤4: 使用Master Key为用户生成一个临时Key
	tempKey, err := s.QdrantClient.CreateTemporaryAPIKey(userID)
	if err != nil {
		log.Printf("ERROR: Failed to create temporary key for user %s: %v", userID, err)
		http.Error(w, "Internal Server Error", http.StatusInternalServerError)
		return
	}

	// 步骤5: 将临时Key返回给客户端
	w.Header().Set("Content-Type", "application/json")
	json.NewEncoder(w).Encode(map[string]string{
		"api_key": tempKey,
		"expires_in": "300s",
	})
	log.Printf("Successfully issued temporary key for user: %s", userID)
}

func main() {
	// --- 初始化Vault客户端 ---
	config := api.DefaultConfig() // Reads from VAULT_ADDR, VAULT_TOKEN env vars
	vaultClient, err := api.NewClient(config)
	if err != nil {
		log.Fatalf("FATAL: Unable to initialize Vault client: %v", err)
	}

	// 使用AppRole进行登录，获取一个短期的Vault Token
	roleID := os.Getenv("VAULT_ROLE_ID")
	secretID := os.Getenv("VAULT_SECRET_ID")
	if roleID == "" || secretID == "" {
		log.Fatalf("FATAL: VAULT_ROLE_ID and VAULT_SECRET_ID must be set")
	}

	approleAuth, err := api.NewAppRoleAuth(roleID, &api.Secret{Data: map[string]interface{}{"secret_id": secretID}})
	if err != nil {
		log.Fatalf("FATAL: Unable to create approle auth: %v", err)
	}
	
	authInfo, err := vaultClient.Auth().Login(context.Background(), approleAuth)
	if err != nil {
		log.Fatalf("FATAL: Unable to login with approle: %v", err)
	}
	if authInfo == nil {
		log.Fatalf("FATAL: No auth info was returned after login")
	}
	log.Println("Successfully authenticated with Vault using AppRole")


	// --- 从Vault获取Qdrant Master Key ---
	secret, err := vaultClient.KVv2("secret").Get(context.Background(), "qdrant")
	if err != nil {
		log.Fatalf("FATAL: Unable to read secret from Vault: %v", err)
	}

	masterKey, ok := secret.Data["api_key"].(string)
	if !ok || masterKey == "" {
		log.Fatalf("FATAL: 'api_key' not found or is not a string in secret 'secret/qdrant'")
	}
	log.Println("Successfully retrieved Qdrant master key from Vault")

	qdrantClient := &QdrantClient{
		MasterKey: masterKey,
		Host:      "http://qdrant:6333",
	}

	server := &TVMServer{
		VaultClient:  vaultClient,
		QdrantClient: qdrantClient,
	}

	http.HandleFunc("/api/qdrant-token", server.getQdrantTokenHandler)
	log.Println("Starting TVM server on :8080")
	if err := http.ListenAndServe(":8080", nil); err != nil {
		log.Fatalf("FATAL: Server failed to start: %v", err)
	}
}

这个服务启动时会通过AppRole向Vault进行认证，然后一次性读取Qdrant的Master Key并缓存在内存中。当客户端请求时，它会模拟生成一个临时的、与用户绑定的凭证并返回。

3. 客户端（SSG）实现

在静态站点的前端代码中（例如使用React或Vue构建），我们需要实现获取并使用这个临时Key的逻辑。

apiClient.ts (TypeScript示例):

import { QdrantClient } from '@qdrant/js-client-rest';

// 定义一个单例来管理Qdrant客户端和临时API Key
class SecureQdrantClient {
    private client: QdrantClient | null = null;
    private apiKey: string | null = null;
    private expiry: Date | null = null;

    private async refreshToken(): Promise<void> {
        console.log("Qdrant API key is missing or expired. Fetching a new one...");
        try {
            // 这是一个获取用户身份凭证的函数，具体实现取决于你的认证系统
            const userAuthToken = this.getUserAuthToken(); 
            
            const response = await fetch('/api/qdrant-token', {
                method: 'GET',
                headers: {
                    // 假设TVM通过这个头来识别用户
                    'X-User-ID': userAuthToken.userId, 
                    'Authorization': `Bearer ${userAuthToken.jwt}`
                },
            });

            if (!response.ok) {
                throw new Error(`Failed to fetch Qdrant token: ${response.statusText}`);
            }

            const data = await response.json();
            this.apiKey = data.api_key;
            // 设置一个比实际过期时间稍早的本地过期时间，以避免边缘情况
            this.expiry = new Date(new Date().getTime() + (parseInt(data.expires_in) - 30) * 1000);
            
            this.client = new QdrantClient({
                url: 'https://your-qdrant-instance.cloud',
                apiKey: this.apiKey,
            });

            console.log("Successfully refreshed Qdrant API key.");

        } catch (error) {
            console.error("Error refreshing Qdrant token:", error);
            this.apiKey = null;
            this.client = null;
            this.expiry = null;
            throw error; // Propagate error to caller
        }
    }

    private isTokenExpired(): boolean {
        return !this.expiry || new Date() >= this.expiry;
    }

    public async getClient(): Promise<QdrantClient> {
        if (!this.client || this.isTokenExpired()) {
            await this.refreshToken();
        }
        
        if (!this.client) {
            throw new Error("Failed to initialize Qdrant client.");
        }
        
        return this.client;
    }

    // 伪代码: 获取当前用户的身份凭证
    private getUserAuthToken(): { userId: string, jwt: string } {
        // 在真实应用中，这会从localStorage, cookie或内存中读取
        return { userId: 'user-123', jwt: '...your.user.jwt...' };
    }
}

// 导出单例实例
export const secureQdrantClient = new SecureQdrantClient();

// --- 使用示例 ---
async function performSearch(vector: number[]) {
    try {
        const client = await secureQdrantClient.getClient();
        const searchResult = await client.search('my_collection', {
            vector: vector,
            limit: 5,
            with_payload: true,
        });
        console.log("Search results:", searchResult);
        return searchResult;
    } catch (error) {
        console.error("Qdrant search failed:", error);
        // 这里可以实现重试逻辑
    }
}

这段客户端代码封装了令牌管理的复杂性。业务逻辑代码只需要调用secureQdrantClient.getClient()，它会自动处理令牌的获取和刷新。这种设计对业务代码是透明的。

架构的局限性与未来展望

这个架构虽然优雅地解决了SSG与安全后端数据交互的问题，但并非没有代价和需要注意的边界。

首先，系统的整体安全性高度依赖于TVM服务自身的安全性和用户身份认证机制的强度。TVM一旦被攻破，攻击者就能以任意用户身份获取Qdrant的访问权限。因此，对TVM的部署环境、网络策略和代码审计必须有极高的标准。

其次，每次客户端冷启动或临时Key过期时，都会有一次额外的到TVM的网络请求开销，这会轻微增加首次数据查询的延迟。可以通过在客户端更智能地预取（prefetch）新Key来缓解，比如在Key过期前30秒就发起刷新请求。

最后，此模式主要适用于读多写少的场景。如果需要频繁写入Qdrant，直接从客户端写入可能会带来安全风险和管理难题。对于写操作，更稳妥的方式是通过一个专门的、权限控制更严格的后端API来代理，而不是下发带有写权限的临时Key给客户端。

未来的一个演进方向是，如果Qdrant原生支持更细粒度的、基于JWT Claim的访问控制，我们就可以在TVM中生成签名的JWT，而不是依赖于Qdrant自身的API Key体系。这将使得权限控制更加灵活和无状态，也更符合云原生的设计哲学。

安全模型部署 Qdrant SSG HashiCorp Vault 架构

基于CDC和OpenSearch构建DDD聚合根的近实时读取模型

2023-10-27 架构与设计

CDC CQRS Domain-Driven Design (DDD) ORM OpenSearch

基于服务发现事件流与ClickHouse构建动态服务拓扑的可观测性实践

2023-10-27 可观测性

Go 可观测性服务发现 ClickHouse 分布式系统