大數(shù)據(jù)不論在研究還是工程領域都是熱點之一,算法是大數(shù)據(jù)管理與計算的核心主題,因此將大數(shù)據(jù)算法作為信息與計算科學專業(yè)的一門選修課程。通過本課程的學習,使學生能掌握一些大數(shù)據(jù)算法設計的基本思想,較好的理解和傳統(tǒng)算法課程不一樣的算法設計與分析思路,通過實踐練習初步掌握大數(shù)據(jù)算法設計與分析的技術,并能夠將其中的思想應用于實際的研究和開發(fā)。從而提高學生的創(chuàng)新實踐能力,加強學生開展科研工作能力。為今后進行更深入的研究奠定良好的理論基礎。

通過本課程的學習,學生將達到以下要求:

1.掌握大數(shù)據(jù)算法設計的基本思想,較好的理解大數(shù)據(jù)算法設計與分析的基本思路;

2.初步掌握大數(shù)據(jù)算法設計與分析的基本方法和技術;

3.初步具備將大數(shù)據(jù)算法應用于實際開發(fā)的能力,并能夠分析算法效率。

(二)知識、能力及技能方面的基本要求

1.基本知識:掌握大數(shù)據(jù)算法設計和分析的基本思想,掌握概率算法、I/0有效算法、并行算法等大數(shù)據(jù)算法的基本思想。

2.基本理論和方法:掌握大數(shù)據(jù)算法設計的一般原理和步驟。要求學生能夠掌握亞線性算法、外存算法、并行算法等算法的設計方法和分析技術。

3.基本技能:具備運用亞線性算法、外存算法、并行算法等算法綜合解決實際問題的能力,初步具備將大數(shù)據(jù)算法應用于實際開發(fā)的技能。

大數(shù)據(jù)給數(shù)據(jù)分析和處理帶來了前所未有的機遇和挑戰(zhàn)。本課程介紹大數(shù)據(jù)分析中一些算法 :數(shù)據(jù)的稀疏和低秩表達,稀疏和低秩矩陣優(yōu)化,社交網(wǎng)絡計算中的圖與網(wǎng)絡流問題,機器 學習和數(shù)據(jù)挖掘的最優(yōu)化算法,隨機優(yōu)化算法,并行計算等等 Big data has brought unprecedented opportunities and challenges to data analysis and processing. This course introduces some basic concepts of algorithms for big data analysis: sparse and low-rank data representation, sparse and low-rank matrix optimization, graph and network flow problems in social network computation, optimization algorithms for machine learning and data mining, stochastic optimization algorithms, parallel computing, etc.  課程對象: 高年級本科生和研究生。  參考書: (1) Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, Clifford Stein, Introduction to Algorithms, The MIT Press, http://mitpress.mit.edu/books/introduction-algorithms (2) Jure Leskovec, Anand Rajaraman, Jeff Ullman, Mining of Massive Datasets, Cambridge University Press, http://www.mmds.org/ (3) Stephen Boyd and Lieven Vandenberghe, Convex optimization, Cambridge University Press, 2004, http://stanford.edu/~boyd/cvxbook/ (4) Jorge Nocedal and Stephen Wright, Numerical Optimization, Springer, 2006, http://www.ece.northwestern.edu/~nocedal/book/ (5) 袁亞湘,孫文瑜,最優(yōu)化理論與方法,科學出版社,2003  內容提要和學時分配: 1. 課程簡介, 3學時 課程簡介,大數(shù)據(jù)分析中的最優(yōu)化理論與算法介紹 2. 線性規(guī)劃,半定規(guī)劃, 6學時 線性規(guī)劃,單純形方法,半定規(guī)劃,對偶理論 4.稀疏優(yōu)化與低秩矩陣恢復, 9學時 壓縮感知和稀疏優(yōu)化基本理論和算法 低秩矩陣恢復的基本理論和算法 PCA,robust PCA (matrix separation), sparse PCA 5. 社交網(wǎng)絡計算中的圖和網(wǎng)絡流問題,9學時 the network simplex problem the shorted path problem the maximum flow problem the minimum spanning tree problem 6. 機器學習和數(shù)據(jù)挖掘,9學時 聚類分析: clustering 高維數(shù)據(jù)降維: eigenvalue, SVD 鏈接分析: page rank 推薦系統(tǒng): matrix completion, 大規(guī)模機器學習: support vector machine 7.現(xiàn)代醫(yī)學成像與高維圖像分析,3學時 相位恢復以及低溫電子顯微鏡和三維重構中的若干反問題 8.大數(shù)據(jù)分析的隨機優(yōu)化算法,3學時 9.大數(shù)據(jù)分析的并行計算、分布式計算、分散式計算,6學時 OpenMP, MPI, 稀疏優(yōu)化的并行計算,分散式計算

郵箱
huangbenjincv@163.com

吉林市| 博罗县| 邵阳县| 海南省| 苗栗市| 海丰县| 汉源县| 沁阳市| 韩城市| 浦县| 托克逊县| 宁夏| 江山市| 临高县| 西平县| 依安县| 东辽县| 江阴市| 石景山区| 房产| 游戏| 申扎县| 合川市| 宁津县| 凌海市| 嘉义县| 余江县| 襄汾县| 潞西市| 江陵县| 农安县| 璧山县| 巨鹿县| 江安县| 舟山市| 犍为县| 来安县| 庆城县| 丰城市| 合江县| 阿拉尔市|