課程簡介:
當前全球的數(shù)據(jù)量每年正在以60%的速度遞增,而據(jù)IDC統(tǒng)計,在2020年數(shù)據(jù)的總量將達到40個ZB,很快我們也將跨入YB的時代。
當前人,機,物三元世紀的高度融合引發(fā)了數(shù)據(jù)規(guī)模的爆炸式增長和數(shù)據(jù)模式的高度復(fù)雜化,世界已經(jīng)進入網(wǎng)絡(luò)化的大數(shù)據(jù)時代,也就是Big Data時代,我們注意到在這個大背景下從公司戰(zhàn)略到產(chǎn)業(yè)生態(tài),從學(xué)術(shù)研究到生產(chǎn)實踐,從城鎮(zhèn)管理到國家治理,都因為大數(shù)據(jù)而發(fā)生著本質(zhì)的變化,而采集到的原始數(shù)據(jù)往往是一些零金碎玉,缺乏邏輯,需要通過不同的邏輯方式進行集成融合,從不同的角度解釋和挖掘才能得出前人所未知的大價值。該課程也是清華大學(xué)首門校內(nèi)教授和業(yè)界專家合作授課的課程,有清華大學(xué)計算機系副主任武永衛(wèi)教授和阿里云公司技術(shù)專家聯(lián)合主講。課程內(nèi)容包括:
第一講 大數(shù)據(jù)和ODPS
第二講 分布式存儲
第三講 資源管理與任務(wù)調(diào)度
第四講 分布式編程模型的設(shè)計與演化
第五講 離線分布式關(guān)系型計算
第六講 全局數(shù)據(jù)管理與調(diào)度
第七講 流式計算的系統(tǒng)設(shè)計與實現(xiàn)
第八講 內(nèi)存計算
第九講 大規(guī)模數(shù)據(jù)的分布式機器學(xué)習平臺
此外課程還設(shè)計了三個實驗環(huán)節(jié),依托學(xué)堂在線平臺、阿里云服務(wù)器,學(xué)習者通過網(wǎng)絡(luò)即可在線實驗。