介紹 Spring XD

工程 | Mark Fisher | 2013 年 4 月 23 日 | ...

今天我們正式啟動了一項名為 Spring XD 的新計劃，其主題是“應對大資料複雜性”¹。

Spring Data 團隊在過去幾年中一直非常忙碌，不僅為 NoSQL 資料儲存提供支援，還簡化了 Hadoop 的開發體驗。透過建立 Spring for Apache Hadoop 專案，我們透過提供豐富的配置模型和 Hadoop 生態系統專案（如 Hive 和 Pig）的一致程式設計模型，使開發 Hadoop 應用程式變得更容易。正如 Spring 使用者所期望的那樣，人們可以

將 MapReduce 作業配置並作為容器管理物件執行。
使用 HDFS、HBase、Pig 和 Hive 的模板輔助類，從應用程式中刪除樣板程式碼。

Spring for Apache Hadoop 為構建 Hadoop 應用程式提供了堅實的基礎。Spring XD 在這些基礎資產之上構建，進一步簡化了建立真實世界大資料解決方案的過程。具體來說，Spring XD 解決了常見的大資料用例，例如：

從各種輸入源向 HDFS 進行高吞吐量的分散式資料攝取。
攝取時的即時分析，例如收集指標和計數。
透過批處理作業管理 Hadoop 工作流，這些作業結合了與標準企業系統（例如關係型資料庫）的互動以及 Hadoop 操作（例如 MapReduce、HDFS、Pig、Hive 或 Cascading）。
高吞吐量資料匯出，例如從 HDFS 匯出到關係型資料庫或 NoSQL 資料庫。

Spring Data 一書涵蓋了其中幾個用例，該書的示例程式碼可在我們的 GitHub 倉庫中獲取。這些示例除了 Spring for Apache Hadoop 專案外，還基於 Spring Batch 和 Spring Integration 構建。

在管理事件驅動的資料攝取流時，Spring Integration 提供了一個成熟的模型，其靈感來自公認的企業整合模式。同樣，Spring Batch 是一個用於管理工作流的強大解決方案，對最重要的要求（如作業狀態管理和重試/重啟功能）提供了強大的支援，並且是 JSR-352 的基礎。

將框架擴充套件以支援大資料用例始於書中的示例，但透過 Spring XD，我們的目標是將這種支援提升到另一個層次。首先，我們將提供一個涵蓋上述四個用例類別的一致模型。對於具有 Spring 經驗的人來說，這個模型將非常熟悉。其次，隨著 Spring XD 的發展，我們將遠遠超越 API 層，提供一個開箱即用的可執行伺服器、一個可插拔的模組系統、一個用於在 Hadoop 叢集內部或外部分發資料收集例項的簡單模型等等。

如果您覺得這很有趣，請參與進來！您可以 fork 倉庫和/或監控 JIRA。現在它幾乎是一個全新的專案，但我們希望確保我們的社群成員有機會從一開始就參與進來。一如既往，我們認為我們廣泛而充滿熱情的社群的反饋是我們最大的財富。在過去一年中，我們做了大量的原型設計，所以您很快就會看到一些程式碼釋出。此外，我們計劃在每次衝刺後釋出部落格，以便您可以跟蹤進展。而且，如果您還沒有註冊 SpringOne，請務必註冊；Spring XD 將在其中佔據突出地位。

最後，請務必報名參加我們明天（4 月 24 日）的直播活動：Pivotal：一個新時代的全新平臺。

¹XD = eXtreme Data 或 'x'，如 y = mx + b ;-)

Spring 部落格

介紹 Spring XD

獲取 Spring 新聞通訊

領先一步

獲得支援

即將舉行的活動