課程目錄

           不需任何基礎,帶您無痛入門Spark,內(nèi)容包括Spark集群的構建、Spark架構設計、RDD、Shark/SparkSQL、機器學習、圖計算、實時流處理、Spark on Yarn、JobServer、Spark測試、Spark優(yōu)化等。Spark是第一個脫胎于該轉變的快速、通用分布式計算范式,并且很快流行起來。Spark使用函數(shù)式編程范式擴展了MapReduce模型以支持更多計算類型,可以涵蓋廣泛的工作流,這些工作流之前被實現(xiàn)為Hadoop之上的特殊系統(tǒng)。Spark使用內(nèi)存緩存來提升性能,因此進行交互式分析也足夠快速(就如同使用Python解釋器,與集群進行交互一樣)。緩存同時提升了迭代算法的性能,這使得Spark非常適合數(shù)據(jù)理論任務,特別是機器學習。        

郵箱
huangbenjincv@163.com

扎赉特旗| 天等县| 蒲城县| 巫山县| 伊宁市| 新沂市| 全椒县| 保康县| 汕尾市| 南宁市| 崇仁县| 石嘴山市| 莱西市| 景宁| 阿克苏市| 财经| 新闻| 大丰市| 通化市| 英德市| 即墨市| 伊宁市| 喀喇沁旗| 营口市| 肃北| 黔西县| 景泰县| 嵊州市| 濮阳市| 凉山| 南召县| 永修县| 奇台县| 黄平县| 南靖县| 宜宾市| 右玉县| 遂川县| 县级市| 长兴县| 丘北县|