課程目錄

           不需任何基礎(chǔ),帶您無痛入門Spark,內(nèi)容包括Spark集群的構(gòu)建、Spark架構(gòu)設(shè)計、RDD、Shark/SparkSQL、機器學(xué)習(xí)、圖計算、實時流處理、Spark on Yarn、JobServer、Spark測試、Spark優(yōu)化等。Spark是第一個脫胎于該轉(zhuǎn)變的快速、通用分布式計算范式,并且很快流行起來。Spark使用函數(shù)式編程范式擴展了MapReduce模型以支持更多計算類型,可以涵蓋廣泛的工作流,這些工作流之前被實現(xiàn)為Hadoop之上的特殊系統(tǒng)。Spark使用內(nèi)存緩存來提升性能,因此進行交互式分析也足夠快速(就如同使用Python解釋器,與集群進行交互一樣)。緩存同時提升了迭代算法的性能,這使得Spark非常適合數(shù)據(jù)理論任務(wù),特別是機器學(xué)習(xí)。        

郵箱
huangbenjincv@163.com

喀喇沁旗| 临海市| 武威市| 威宁| 安阳县| 阜南县| 北碚区| 兴和县| 进贤县| 将乐县| 九龙城区| 陕西省| 河池市| 庄浪县| 祥云县| 龙陵县| 饶河县| 阿鲁科尔沁旗| 凤阳县| 鄯善县| 工布江达县| 炉霍县| 比如县| 泸溪县| 台前县| 冀州市| 洛宁县| 航空| 池州市| 沧源| 梓潼县| 海宁市| 金寨县| 蓬溪县| 嘉义县| 栖霞市| 揭东县| 普宁市| 秦安县| 宣武区| 原阳县|