課程目錄

           不需任何基礎(chǔ),帶您無痛入門Spark,內(nèi)容包括Spark集群的構(gòu)建、Spark架構(gòu)設(shè)計、RDD、Shark/SparkSQL、機(jī)器學(xué)習(xí)、圖計算、實時流處理、Spark on Yarn、JobServer、Spark測試、Spark優(yōu)化等。Spark是第一個脫胎于該轉(zhuǎn)變的快速、通用分布式計算范式,并且很快流行起來。Spark使用函數(shù)式編程范式擴(kuò)展了MapReduce模型以支持更多計算類型,可以涵蓋廣泛的工作流,這些工作流之前被實現(xiàn)為Hadoop之上的特殊系統(tǒng)。Spark使用內(nèi)存緩存來提升性能,因此進(jìn)行交互式分析也足夠快速(就如同使用Python解釋器,與集群進(jìn)行交互一樣)。緩存同時提升了迭代算法的性能,這使得Spark非常適合數(shù)據(jù)理論任務(wù),特別是機(jī)器學(xué)習(xí)。        

郵箱
huangbenjincv@163.com

朝阳县| 伊吾县| 鲜城| 阿鲁科尔沁旗| 桓台县| 保定市| 新宾| 化德县| 黔江区| 宜城市| 绍兴市| 陵水| 蒙山县| 花垣县| 开江县| 思茅市| 山阳县| 崇文区| 莱西市| 潢川县| 都昌县| 鄂温| 高尔夫| 连山| 嵩明县| 天峨县| 龙川县| 南召县| 无锡市| 卢龙县| 富宁县| 郓城县| 兴城市| 麻栗坡县| 太白县| 兰州市| 保山市| 信丰县| 兰溪市| 伊川县| 寻乌县|