SpringOne2GX 2015 回放：Apache Spark 用於大資料處理

新聞 | Pieter Humphrey | 2016 年 2 月 23 日 | ...

錄製於 SpringOne2GX 2015 演講者：Ludwine Probst & Ilayaperumal Gopinathan Big Data Track 幻燈片：http://www.slideshare.net/SpringCentral/apache-spark-for-big-data-processing

今天，我們生活在大資料的世界。Hadoop 和 MapReduce 在大規模資料處理領域佔據主導地位。然而，MapReduce 模型在各種處理型別中顯示出其侷限性，尤其是在機器學習領域頻繁遇到的高度迭代演算法中。

Spark 是一個記憶體資料處理框架，與 Hadoop 不同，它提供了對大資料集進行互動式和即時分析的能力。此外，Spark 擁有更靈活的程式設計模型，並且比 Hadoop 效能更好。

本次演講旨在描繪 Spark 的全貌，並瀏覽其生態系統，特別是 Spark Streaming 和 MLlib，並提供具體示例。我們還將展示如何將 Spark 與 Spring XD 結合使用，從而利用各自平臺的優勢。

Spring 部落格