課程簡介:
當(dāng)前全球的數(shù)據(jù)量每年正在以60%的速度遞增,而據(jù)IDC統(tǒng)計(jì),在2020年數(shù)據(jù)的總量將達(dá)到40個ZB,很快我們也將跨入YB的時代。
當(dāng)前人,機(jī),物三元世紀(jì)的高度融合引發(fā)了數(shù)據(jù)規(guī)模的爆炸式增長和數(shù)據(jù)模式的高度復(fù)雜化,世界已經(jīng)進(jìn)入網(wǎng)絡(luò)化的大數(shù)據(jù)時代,也就是Big Data時代,我們注意到在這個大背景下從公司戰(zhàn)略到產(chǎn)業(yè)生態(tài),從學(xué)術(shù)研究到生產(chǎn)實(shí)踐,從城鎮(zhèn)管理到國家治理,都因?yàn)榇髷?shù)據(jù)而發(fā)生著本質(zhì)的變化,而采集到的原始數(shù)據(jù)往往是一些零金碎玉,缺乏邏輯,需要通過不同的邏輯方式進(jìn)行集成融合,從不同的角度解釋和挖掘才能得出前人所未知的大價值。該課程也是清華大學(xué)首門校內(nèi)教授和業(yè)界專家合作授課的課程,有清華大學(xué)計(jì)算機(jī)系副主任武永衛(wèi)教授和阿里云公司技術(shù)專家聯(lián)合主講。課程內(nèi)容包括:
第一講 大數(shù)據(jù)和ODPS
第二講 分布式存儲
第三講 資源管理與任務(wù)調(diào)度
第四講 分布式編程模型的設(shè)計(jì)與演化
第五講 離線分布式關(guān)系型計(jì)算
第六講 全局?jǐn)?shù)據(jù)管理與調(diào)度
第七講 流式計(jì)算的系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
第八講 內(nèi)存計(jì)算
第九講 大規(guī)模數(shù)據(jù)的分布式機(jī)器學(xué)習(xí)平臺
此外課程還設(shè)計(jì)了三個實(shí)驗(yàn)環(huán)節(jié),依托學(xué)堂在線平臺、阿里云服務(wù)器,學(xué)習(xí)者通過網(wǎng)絡(luò)即可在線實(shí)驗(yàn)。