課程目錄

           不需任何基礎,帶您無痛入門Spark,內容包括Spark集群的構建、Spark架構設計、RDD、Shark/SparkSQL、機器學習、圖計算、實時流處理、Spark on Yarn、JobServer、Spark測試、Spark優(yōu)化等。Spark是第一個脫胎于該轉變的快速、通用分布式計算范式,并且很快流行起來。Spark使用函數(shù)式編程范式擴展了MapReduce模型以支持更多計算類型,可以涵蓋廣泛的工作流,這些工作流之前被實現(xiàn)為Hadoop之上的特殊系統(tǒng)。Spark使用內存緩存來提升性能,因此進行交互式分析也足夠快速(就如同使用Python解釋器,與集群進行交互一樣)。緩存同時提升了迭代算法的性能,這使得Spark非常適合數(shù)據理論任務,特別是機器學習。        

郵箱
huangbenjincv@163.com

光泽县| 平陆县| 桂林市| 确山县| 牙克石市| 石泉县| 灵璧县| 大城县| 玉树县| 曲周县| 凤阳县| 永川市| 张掖市| 阿巴嘎旗| 奉贤区| 兰溪市| 上栗县| 古田县| 于田县| 古丈县| 永修县| 万全县| 平江县| 吉首市| 乌鲁木齐县| 五华县| 会泽县| 祁阳县| 越西县| 黄山市| 湄潭县| 沙田区| 福安市| 北流市| 蕉岭县| 木里| 龙江县| 榕江县| 沅陵县| 黑水县| 屏东市|