推出 Spring AI Amazon Bedrock Nova 整合，透過 Converse API

工程 | Christian Tzolov | 2024年12月10日 | ...

Amazon Bedrock Nova 模型代表了新一代的基礎模型，支援從文字和影像理解到影片到文字分析的廣泛用例。

透過Spring AI Bedrock Converse API 整合，開發人員可以無縫連線到這些先進的 Nova 模型，並以最少的精力構建複雜的對話式應用程式。

這篇博文介紹了 Amazon Nova 模型的主要功能，演示了它們與 Spring AI 的 Bedrock Converse API 的整合，並提供了文字、影像、影片、文件處理和函式呼叫的實際示例。

什麼是 Amazon Nova 模型？

Amazon Nova 提供三個級別的模型——Nova Pro、Nova Lite 和 Nova Micro——以滿足不同的效能和成本要求。

規格	Nova Pro	Nova Lite	Nova Micro
模態	文字、影像、影片轉文字	文字、影像、影片轉文字	文字
模型 ID	amazon.nova-pro-v1:0	amazon.nova-lite-v1:0	amazon.nova-micro-v1:0
最大令牌	300K	300K	128K

Nova Pro 和 Lite 支援多模態功能，包括文字、影像和影片輸入，而 Nova Micro 則針對文字互動進行了最佳化，成本更低。

設定整合

先決條件

AWS 配置：您需要
- 具有 Amazon Bedrock 訪問許可權的 AWS 憑證
- 使用 Nova 模型所需的許可權
- 在 Amazon Bedrock 控制檯中啟用的模型

Spring AI 依賴項：將 Spring AI Bedrock Converse starter 新增到您的 Spring Boot 專案中

Maven:

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-bedrock-converse-spring-boot-starter</artifactId>
</dependency>

Gradle:

dependencies {
    implementation 'org.springframework.ai:spring-ai-bedrock-converse-spring-boot-starter'
}

應用程式配置：為 Amazon Bedrock 配置 application.properties

spring.ai.bedrock.aws.region=us-east-1
spring.ai.bedrock.aws.access-key=${AWS_ACCESS_KEY_ID}
spring.ai.bedrock.aws.secret-key=${AWS_SECRET_ACCESS_KEY}
spring.ai.bedrock.aws.session-token=${AWS_SESSION_TOKEN}

spring.ai.bedrock.converse.chat.options.model=amazon.nova-pro-v1:0

spring.ai.bedrock.converse.chat.options.temperature=0.8
spring.ai.bedrock.converse.chat.options.max-tokens=1000

有關更多詳細資訊，請參閱 Chat Properties 文件。

Bedrock Nova 整合的關鍵功能

1. 文字補全

基於文字的聊天補全非常簡單。

String response = ChatClient.create(chatModel)
    .prompt("Tell me a joke about AI.")
    .call()
    .content();

2. 多模態輸入

Nova Pro 和 Lite 支援多模態輸入，可處理文字和視覺資料。Spring AI 提供了一個可移植的 Multimodal API，支援 Bedrock Nova 模型。

文字 + 影像

Nova Pro 和 Lite 支援多種影像模態。這些模型可以分析影像，回答有關影像的問題，對影像進行分類，並根據提供的指令生成摘要。它們支援 image/jpeg、image/png、image/gif 和 image/webp 格式的 base64 編碼影像。

將使用者文字與影像結合的示例

String response = ChatClient.create(chatModel)
    .prompt()
    .user(u -> u.text("Explain what do you see on this picture?")
        .media(Media.Format.IMAGE_PNG, new ClassPathResource("/test.png")))
    .call()
    .content();

此程式碼處理 test.png 影像：以及文字訊息 “請解釋一下你在這張圖片上看到了什麼？”，並生成類似以下的響應：

圖片顯示了一個裝有幾種水果的線筐的特寫檢視……

文字 + 影片

Amazon Nova Pro/Lite 模型支援在負載中處理單個影片模態，可以是以 base64 格式提供，也可以是透過 Amazon S3 URI 提供。

支援的影片格式包括 video/x-matros、video/quicktime、video/mp4、video/webm、video/x-flv、video/mpeg、video/x-ms-wmv 和 image/3gpp。

將使用者文字與影片結合的示例

String response = ChatClient.create(chatModel)
    .prompt()
    .user(u -> u.text("Explain what do you see in this video?")
        .media(Media.Format.VIDEO_MP4, new ClassPathResource("/test.video.mp4")))
    .call()
    .content();

此程式碼處理 test.video.mp4 影片以及文字訊息 “請解釋一下你在這段影片中看到了什麼？”，並生成類似以下的響應：

影片顯示一群小雞擠在一起……

文字 + 文件

Nova Pro/Lite 支援兩種文件模態。

文字文件型別（txt、csv、html、md 等），用於文字理解和基於文字元素的問答。
媒體文件型別（pdf、docx、xlsx），用於基於視覺的理解，例如分析圖表。

將使用者文字與媒體文件結合的示例

String response = ChatClient.create(chatModel)
    .prompt()
    .user(u -> u.text(
            "You are a very professional document summarization specialist. Please summarize the given document.")
        .media(Media.Format.DOC_PDF, new ClassPathResource("/spring-ai-reference-overview.pdf")))
    .call()
    .content();

此程式碼處理 spring-ai-reference-overview.pdf 文件：以及文字訊息，並生成類似以下的響應：

介紹

Spring AI 旨在簡化具有人工智慧 (AI) 功能的應用程式的開發，目標是避免不必要的複雜性……

3. 函式呼叫

Nova 模型支援工具/函式呼叫，用於與外部工具整合。

定義一個函式

@Bean
@Description("Get the weather in a location. Return temperature in Celsius or Fahrenheit.")
public Function<WeatherRequest, WeatherResponse> weatherFunction() {
    return new MockWeatherService();
}

在聊天提示中使用函式

String response = ChatClient.create(this.chatModel)
        .prompt("What's the weather like in Boston?")
        .function("weatherFunction") // bean name
        .inputType(WeatherRequest.class)
        .call()
        .content();

資源

入門

Spring AI 文件 - Spring AI 全面指南
Spring AI Bedrock Converse API 指南 - 詳細的 API 文件

Amazon Bedrock 資源

Amazon Bedrock Nova 文件 - 官方 Nova 模型文件
Amazon Bedrock 控制檯 - 管理和監控您的 Bedrock 資源
Nova 模型功能 - 關於 Nova 模型引數和功能的詳細資訊

程式碼示例

Spring AI Bedrock Nova Demo - 展示整合功能的完整示例專案
BedrockNovaChatClientIT.java - 整合測試示例
Spring AI Samples Repository - 其他程式碼樣本和用例

Tanzu AI Server

VMware Tanzu Platform 10 透過 VMware Tanzu AI Server 集成了 Amazon Bedrock Nova 模型，該伺服器由 Spring AI 提供支援。此整合提供了：

企業級 AI 部署：用於在您的 VMware Tanzu 環境中部署 AI 應用程式的生產就緒解決方案
簡化的模型訪問：透過統一的介面簡化對 Amazon Bedrock Nova 模型的訪問
安全和治理：企業級安全控制和治理功能
可擴充套件的基礎設施：該整合基於 Spring AI 構建，支援 AI 應用程式的可擴充套件部署，同時保持高效能

有關使用 Tanzu AI Server 部署 AI 應用程式的更多資訊，請訪問 VMware Tanzu AI 文件。

結論

Spring AI 透過 Converse API 與 Amazon Bedrock Nova 模型整合，為構建高階會話應用程式提供了強大的功能。Nova Pro 和 Lite 為跨文字、影像、影片和文件開發多模態體驗提供了全面的工具。函式呼叫透過啟用與外部工具和服務的互動，進一步擴充套件了這些功能。

立即開始使用 Nova 模型和 Spring AI 構建高階 AI 應用程式！

Spring 部落格