大數(shù)據(jù)不論在研究還是工程領域都是熱點之一,算法是大數(shù)據(jù)管理與計算的核心主題,因此將大數(shù)據(jù)算法作為信息與計算科學專業(yè)的一門選修課程。通過本課程的學習,使學生能掌握一些大數(shù)據(jù)算法設計的基本思想,較好的理解和傳統(tǒng)算法課程不一樣的算法設計與分析思路,通過實踐練習初步掌握大數(shù)據(jù)算法設計與分析的技術,并能夠?qū)⑵渲械乃枷霊糜趯嶋H的研究和開發(fā)。從而提高學生的創(chuàng)新實踐能力,加強學生開展科研工作能力。為今后進行更深入的研究奠定良好的理論基礎。

通過本課程的學習,學生將達到以下要求:

1.掌握大數(shù)據(jù)算法設計的基本思想,較好的理解大數(shù)據(jù)算法設計與分析的基本思路;

2.初步掌握大數(shù)據(jù)算法設計與分析的基本方法和技術;

3.初步具備將大數(shù)據(jù)算法應用于實際開發(fā)的能力,并能夠分析算法效率。

(二)知識、能力及技能方面的基本要求

1.基本知識:掌握大數(shù)據(jù)算法設計和分析的基本思想,掌握概率算法、I/0有效算法、并行算法等大數(shù)據(jù)算法的基本思想。

2.基本理論和方法:掌握大數(shù)據(jù)算法設計的一般原理和步驟。要求學生能夠掌握亞線性算法、外存算法、并行算法等算法的設計方法和分析技術。

3.基本技能:具備運用亞線性算法、外存算法、并行算法等算法綜合解決實際問題的能力,初步具備將大數(shù)據(jù)算法應用于實際開發(fā)的技能。

大數(shù)據(jù)給數(shù)據(jù)分析和處理帶來了前所未有的機遇和挑戰(zhàn)。本課程介紹大數(shù)據(jù)分析中一些算法 :數(shù)據(jù)的稀疏和低秩表達,稀疏和低秩矩陣優(yōu)化,社交網(wǎng)絡計算中的圖與網(wǎng)絡流問題,機器 學習和數(shù)據(jù)挖掘的最優(yōu)化算法,隨機優(yōu)化算法,并行計算等等 Big data has brought unprecedented opportunities and challenges to data analysis and processing. This course introduces some basic concepts of algorithms for big data analysis: sparse and low-rank data representation, sparse and low-rank matrix optimization, graph and network flow problems in social network computation, optimization algorithms for machine learning and data mining, stochastic optimization algorithms, parallel computing, etc.  課程對象: 高年級本科生和研究生。  參考書: (1) Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, Clifford Stein, Introduction to Algorithms, The MIT Press, http://mitpress.mit.edu/books/introduction-algorithms (2) Jure Leskovec, Anand Rajaraman, Jeff Ullman, Mining of Massive Datasets, Cambridge University Press, http://www.mmds.org/ (3) Stephen Boyd and Lieven Vandenberghe, Convex optimization, Cambridge University Press, 2004, http://stanford.edu/~boyd/cvxbook/ (4) Jorge Nocedal and Stephen Wright, Numerical Optimization, Springer, 2006, http://www.ece.northwestern.edu/~nocedal/book/ (5) 袁亞湘,孫文瑜,最優(yōu)化理論與方法,科學出版社,2003  內(nèi)容提要和學時分配: 1. 課程簡介, 3學時 課程簡介,大數(shù)據(jù)分析中的最優(yōu)化理論與算法介紹 2. 線性規(guī)劃,半定規(guī)劃, 6學時 線性規(guī)劃,單純形方法,半定規(guī)劃,對偶理論 4.稀疏優(yōu)化與低秩矩陣恢復, 9學時 壓縮感知和稀疏優(yōu)化基本理論和算法 低秩矩陣恢復的基本理論和算法 PCA,robust PCA (matrix separation), sparse PCA 5. 社交網(wǎng)絡計算中的圖和網(wǎng)絡流問題,9學時 the network simplex problem the shorted path problem the maximum flow problem the minimum spanning tree problem 6. 機器學習和數(shù)據(jù)挖掘,9學時 聚類分析: clustering 高維數(shù)據(jù)降維: eigenvalue, SVD 鏈接分析: page rank 推薦系統(tǒng): matrix completion, 大規(guī)模機器學習: support vector machine 7.現(xiàn)代醫(yī)學成像與高維圖像分析,3學時 相位恢復以及低溫電子顯微鏡和三維重構(gòu)中的若干反問題 8.大數(shù)據(jù)分析的隨機優(yōu)化算法,3學時 9.大數(shù)據(jù)分析的并行計算、分布式計算、分散式計算,6學時 OpenMP, MPI, 稀疏優(yōu)化的并行計算,分散式計算

郵箱
huangbenjincv@163.com

宜宾市| 铜梁县| 大厂| 清流县| 花莲县| 昌平区| 含山县| 兴城市| 怀柔区| 渑池县| 环江| 韩城市| 周口市| 汨罗市| 凉城县| 依兰县| 西吉县| 望奎县| 杭州市| 平利县| 浑源县| 南郑县| 佳木斯市| 郧西县| 九江市| 当雄县| 安丘市| 榕江县| 潢川县| 麟游县| 龙海市| 武冈市| 新蔡县| 大冶市| 洛宁县| 江安县| 太谷县| 资阳市| 漳平市| 临泉县| 边坝县|