課程目錄

           不需任何基礎,帶您無痛入門Spark,內(nèi)容包括Spark集群的構(gòu)建、Spark架構(gòu)設計、RDD、Shark/SparkSQL、機器學習、圖計算、實時流處理、Spark on Yarn、JobServer、Spark測試、Spark優(yōu)化等。Spark是第一個脫胎于該轉(zhuǎn)變的快速、通用分布式計算范式,并且很快流行起來。Spark使用函數(shù)式編程范式擴展了MapReduce模型以支持更多計算類型,可以涵蓋廣泛的工作流,這些工作流之前被實現(xiàn)為Hadoop之上的特殊系統(tǒng)。Spark使用內(nèi)存緩存來提升性能,因此進行交互式分析也足夠快速(就如同使用Python解釋器,與集群進行交互一樣)。緩存同時提升了迭代算法的性能,這使得Spark非常適合數(shù)據(jù)理論任務,特別是機器學習。        

郵箱
huangbenjincv@163.com

阳春市| 建平县| 囊谦县| 嘉义县| 镇平县| 内丘县| 新乡市| 南川市| 广灵县| 崇礼县| 山东| 满洲里市| 临沂市| 津市市| 菏泽市| 霞浦县| 林州市| 庐江县| 徐汇区| 新沂市| 南宫市| 喀什市| 扶余县| 隆化县| 改则县| 得荣县| 邹城市| 桐柏县| 布尔津县| 桦南县| 罗城| 理塘县| 安福县| 左权县| 会泽县| 南丰县| 石屏县| 宁阳县| 建水县| 彰武县| 拉萨市|