搶先一步
VMware 提供培訓和認證,以加速您的進步。
瞭解更多在 SpringOne2GX 2015 上錄製。演講者:Ludwine Probst & Ilayaperumal Gopinathan 大資料主題幻燈片:http://www.slideshare.net/SpringCentral/apache-spark-for-big-data-processing
今天,我們生活在大資料的世界。 Hadoop 和 MapReduce 在大規模資料處理領域佔據主導地位。但是,MapReduce 模型在各種型別的處理中都顯示出其侷限性,尤其是在機器學習領域中經常遇到的高度迭代演算法方面。
Spark 是一個記憶體資料處理框架,與 Hadoop 不同,它提供對大型資料集的互動式和即時分析。此外,Spark 具有更靈活的程式設計模型,並且比 Hadoop 具有更好的效能。
在本次演講中,我們的目標是介紹 Spark 並瀏覽其生態系統,特別是 Spark Streaming 和 MLlib,並提供一個具體的示例。我們還將展示如何將 Spark 與 Spring XD 結合使用,使您可以利用每個平臺的優勢。