課程目錄

           不需任何基礎,帶您無痛入門Spark,內容包括Spark集群的構建、Spark架構設計、RDD、Shark/SparkSQL、機器學習、圖計算、實時流處理、Spark on Yarn、JobServer、Spark測試、Spark優(yōu)化等。Spark是第一個脫胎于該轉變的快速、通用分布式計算范式,并且很快流行起來。Spark使用函數式編程范式擴展了MapReduce模型以支持更多計算類型,可以涵蓋廣泛的工作流,這些工作流之前被實現為Hadoop之上的特殊系統(tǒng)。Spark使用內存緩存來提升性能,因此進行交互式分析也足夠快速(就如同使用Python解釋器,與集群進行交互一樣)。緩存同時提升了迭代算法的性能,這使得Spark非常適合數據理論任務,特別是機器學習。        

郵箱
huangbenjincv@163.com

博客| 萨嘎县| 云霄县| 大荔县| 十堰市| 沧州市| 抚远县| 高要市| 宁河县| 元江| 武宣县| 晴隆县| 南木林县| 郴州市| 仙游县| 长丰县| 崇明县| 闻喜县| 嘉义市| 黔西县| 凌云县| 莱芜市| 抚松县| 手游| 永德县| 澄迈县| 将乐县| 木里| 灵川县| 上杭县| 酒泉市| 湘阴县| 柘荣县| 汶川县| 东台市| 揭阳市| 绿春县| 常山县| 祁连县| 将乐县| 云浮市|