使用 Spring AI 構建高效代理 (第 1 部分)

工程 | Christian Tzolov | 2025 年 1 月 21 日 | ...

在最近的一篇研究論文《構建高效代理》中，Anthropic 分享了關於構建高效大型語言模型 (LLM) 代理的寶貴見解。這項研究特別有趣的是，它強調了簡單性和可組合性，而非複雜的框架。讓我們探討一下這些原則如何使用 Spring AI 轉化為實際實現。

雖然模式描述和圖表來源於 Anthropic 的原始出版物，但我們將重點介紹如何使用 Spring AI 的特性來實現這些模式，以實現模型可移植性和結構化輸出。我們建議首先閱讀原始論文。

agentic-patterns 專案實現了下面討論的模式。

代理系統

這項研究出版物在兩種型別的代理系統之間做出了重要的架構區分：

工作流：LLM 和工具透過預定義程式碼路徑（例如，規範系統）進行協調的系統
代理：LLM 動態指導自身流程和工具使用的系統

關鍵的見解是，雖然完全自主的代理可能看起來很有吸引力，但工作流通常為明確定義的任務提供更好的可預測性和一致性。這與對可靠性和可維護性至關重要的企業要求完美契合。

讓我們透過五種基本模式來研究 Spring AI 如何實現這些概念，每種模式都服務於特定的用例：

1. 鏈式工作流

鏈式工作流模式是分解複雜任務為更簡單、更易管理步驟的原則的典範。

Prompt Chaining Workflow

何時使用

具有清晰順序步驟的任務
當您希望以延遲換取更高的準確性時
當每個步驟都基於上一步的輸出時

以下是 Spring AI 實現中的一個實際示例：

public class ChainWorkflow {
    private final ChatClient chatClient;
    private final String[] systemPrompts;

    // Processes input through a series of prompts, where each step's output
    // becomes input for the next step in the chain.     
    public String chain(String userInput) {
        String response = userInput;
        for (String prompt : systemPrompts) {
            // Combine the system prompt with previous response
            String input = String.format("{%s}\n {%s}", prompt, response);
            // Process through the LLM and capture output
            response = chatClient.prompt(input).call().content();
        }
        return response;
    }
}

此實現演示了幾個關鍵原則：

每個步驟都有一個集中的責任
一個步驟的輸出成為下一個步驟的輸入
該鏈易於擴充套件和維護

2. 並行化工作流

LLM 可以同時處理任務，並以程式設計方式聚合其輸出。並行化工作流以兩種主要變體體現：

分段：將任務分解為獨立的子任務以進行並行處理
投票：運行同一任務的多個例項以達成共識

Parallelization Workflow

何時使用

處理大量相似但獨立的項
需要多個獨立視角的任務
當處理時間至關重要且任務可並行化時

並行化工作流模式演示了多個大型語言模型（LLM）操作的高效併發處理。此模式特別適用於需要並行執行 LLM 呼叫並自動聚合輸出的場景。

以下是使用並行化工作流的基本示例：

List<String> parallelResponse = new ParallelizationWorkflow(chatClient)
    .parallel(
        "Analyze how market changes will impact this stakeholder group.",
        List.of(
            "Customers: ...",
            "Employees: ...",
            "Investors: ...",
            "Suppliers: ..."
        ),
        4
    );

此示例演示了利益相關者分析的並行處理，其中每個利益相關者組都同時進行分析。

3. 路由工作流

路由模式實現智慧任務分發，為不同型別的輸入提供專門的處理。

Routing Workflow

此模式專為複雜任務而設計，其中不同型別的輸入透過專門的流程進行更好地處理。它使用 LLM 分析輸入內容並將其路由到最合適的專門提示或處理程式。

何時使用

具有不同輸入類別的複雜任務
當不同輸入需要專門處理時
當分類可以準確處理時

以下是使用路由工作流的基本示例：

@Autowired
private ChatClient chatClient;

// Create the workflow
RoutingWorkflow workflow = new RoutingWorkflow(chatClient);

// Define specialized prompts for different types of input
Map<String, String> routes = Map.of(
    "billing", "You are a billing specialist. Help resolve billing issues...",
    "technical", "You are a technical support engineer. Help solve technical problems...",
    "general", "You are a customer service representative. Help with general inquiries..."
);

// Process input
String input = "My account was charged twice last week";
String response = workflow.route(input, routes);

4. 編排器-工作者

此模式演示瞭如何在保持控制的同時實現更復雜的代理類行為

中央 LLM 編排任務分解
專業工作者處理特定子任務
清晰的邊界維護系統可靠性

Orchestration Workflow

何時使用

無法提前預測子任務的複雜任務
需要不同方法或視角的任務
需要自適應問題解決的情況

該實現使用 Spring AI 的 ChatClient 進行 LLM 互動，幷包括

public class OrchestratorWorkersWorkflow {
    public WorkerResponse process(String taskDescription) {
        // 1. Orchestrator analyzes task and determines subtasks
        OrchestratorResponse orchestratorResponse = // ...

        // 2. Workers process subtasks in parallel
        List<String> workerResponses = // ...

        // 3. Results are combined into final response
        return new WorkerResponse(/*...*/);
    }
}

使用示例

ChatClient chatClient = // ... initialize chat client
OrchestratorWorkersWorkflow workflow = new OrchestratorWorkersWorkflow(chatClient);

// Process a task
WorkerResponse response = workflow.process(
    "Generate both technical and user-friendly documentation for a REST API endpoint"
);

// Access results
System.out.println("Analysis: " + response.analysis());
System.out.println("Worker Outputs: " + response.workerResponses());

5. 評估器-最佳化器

評估器-最佳化器模式實現了一個雙 LLM 過程，其中一個模型生成響應，而另一個模型在迭代迴圈中提供評估和反饋，類似於人類作者的精煉過程。該模式由兩個主要元件組成：

生成器 LLM：生成初始響應並根據反饋進行精煉
評估器 LLM：分析響應並提供詳細的改進反饋

Evaluator-Optimizer Workflow

何時使用

存在明確的評估標準
迭代式精煉提供可衡量的價值
任務受益於多輪批評

該實現使用 Spring AI 的 ChatClient 進行 LLM 互動，幷包括

public class EvaluatorOptimizerWorkflow {
    public RefinedResponse loop(String task) {
        // 1. Generate initial solution
        Generation generation = generate(task, context);
        
        // 2. Evaluate the solution
        EvaluationResponse evaluation = evaluate(generation.response(), task);
        
        // 3. If PASS, return solution
        // 4. If NEEDS_IMPROVEMENT, incorporate feedback and generate new solution
        // 5. Repeat until satisfactory
        return new RefinedResponse(finalSolution, chainOfThought);
    }
}

使用示例

ChatClient chatClient = // ... initialize chat client
EvaluatorOptimizerWorkflow workflow = new EvaluatorOptimizerWorkflow(chatClient);

// Process a task
RefinedResponse response = workflow.loop(
    "Create a Java class implementing a thread-safe counter"
);

// Access results
System.out.println("Final Solution: " + response.solution());
System.out.println("Evolution: " + response.chainOfThought());

Spring AI 的實現優勢

Spring AI 對這些模式的實現提供了與 Anthropic 建議相符的幾項優勢：

模型可移植性

<!-- Easy model switching through dependencies -->
<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-openai-spring-boot-starter</artifactId>
</dependency>

結構化輸出

// Type-safe handling of LLM responses
EvaluationResponse response = chatClient.prompt(prompt)
    .call()
    .entity(EvaluationResponse.class);

一致的 API

跨不同 LLM 提供商的統一介面
內建錯誤處理和重試
靈活的提示管理

最佳實踐和建議

基於 Anthropic 的研究和 Spring AI 的實現，以下是構建基於 LLM 的有效系統的關鍵建議：

從簡單開始
- 在增加複雜性之前，從基本工作流開始
- 使用滿足您要求的最簡單模式
- 僅在需要時增加複雜性
設計可靠性
- 實施明確的錯誤處理
- 儘可能使用型別安全的響應
- 在每個步驟中內建驗證
考慮權衡
- 平衡延遲與準確性
- 評估何時使用並行處理
- 在固定工作流和動態代理之間選擇

未來工作

在本系列的第 2 部分中，我們將探討如何構建更高階的代理，將這些基礎模式與複雜功能結合起來：

模式組合

組合多種模式以建立更強大的工作流
構建混合系統，利用每種模式的優勢
建立靈活的架構，以適應不斷變化的需求

高階代理記憶體管理

在對話中實現持久記憶體
高效管理上下文視窗
開發長期知識保留策略

工具和模型上下文協議 (MCP) 整合

透過標準化介面利用外部工具
實施 MCP 以增強模型互動
構建可擴充套件的代理架構

敬請關注這些高階功能的詳細實現和最佳實踐。

Tanzu Gen AI 解決方案

VMware Tanzu Platform 10 Tanzu AI Server，由 Spring AI 提供支援，提供：

企業級 AI 部署：在您的 VMware Tanzu 環境中部署 AI 應用程式的生產就緒解決方案
簡化模型訪問：透過統一介面簡化對 Amazon Bedrock Nova 模型的訪問
安全和治理：企業級安全控制和治理功能
可擴充套件基礎設施：基於 Spring AI 構建，該整合支援 AI 應用程式的可擴充套件部署，同時保持高效能

有關使用 Tanzu AI Server 部署 AI 應用程式的更多資訊，請訪問 VMware Tanzu AI 文件。

結論

Anthropic 的研究洞察與 Spring AI 的實際實現相結合，為構建基於 LLM 的有效系統提供了強大的框架。透過遵循這些模式和原則，開發人員可以建立健壯、可維護和有效的 AI 應用程式，在避免不必要的複雜性的同時提供真正的價值。

關鍵是記住，有時最簡單的解決方案最有效。從基本模式開始，徹底理解您的用例，並且僅在可證明地提高系統性能或功能時才增加複雜性。

Spring 部落格

使用 Spring AI 構建高效代理 (第 1 部分)

代理系統

1. 鏈式工作流

2. 並行化工作流

3. 路由工作流

4. 編排器-工作者

使用示例

5. 評估器-最佳化器

使用示例

Spring AI 的實現優勢

最佳實踐和建議

未來工作

Tanzu Gen AI 解決方案

結論

獲取 Spring 新聞通訊

領先一步

獲得支援

即將舉行的活動