課程目錄

           不需任何基礎(chǔ),帶您無痛入門Spark,內(nèi)容包括Spark集群的構(gòu)建、Spark架構(gòu)設(shè)計、RDD、Shark/SparkSQL、機器學習、圖計算、實時流處理、Spark on Yarn、JobServer、Spark測試、Spark優(yōu)化等。Spark是第一個脫胎于該轉(zhuǎn)變的快速、通用分布式計算范式,并且很快流行起來。Spark使用函數(shù)式編程范式擴展了MapReduce模型以支持更多計算類型,可以涵蓋廣泛的工作流,這些工作流之前被實現(xiàn)為Hadoop之上的特殊系統(tǒng)。Spark使用內(nèi)存緩存來提升性能,因此進行交互式分析也足夠快速(就如同使用Python解釋器,與集群進行交互一樣)。緩存同時提升了迭代算法的性能,這使得Spark非常適合數(shù)據(jù)理論任務,特別是機器學習。        

郵箱
huangbenjincv@163.com

新安县| 刚察县| 青田县| 麦盖提县| 饶平县| 通许县| 兴化市| 蒙城县| 曲靖市| 乐至县| 米易县| 潜山县| 德安县| 南昌县| 上栗县| 长岭县| 瑞丽市| 昭平县| 邵武市| 凌源市| 景东| 开江县| 登封市| 中阳县| 山丹县| 德庆县| 延寿县| 平安县| 安丘市| 岳普湖县| 灵武市| 柳州市| 宿州市| 潼关县| 乐陵市| 深州市| 内江市| 孟连| 五大连池市| 六安市| 桂阳县|