近年來,存儲設備的單位成本以驚人的速度下降,我們可以輕而易舉地積累起大量的數據。電信 運營商,可以記錄用戶通話、短消息、無線上網產生的每一條信令,省級運營商一小時寫入存儲設備的數據量可以達到幾百G。電子商務網站,可以記錄用戶的每一 次交易,甚至每一次點擊,可以復原用戶的完整訪問路徑找出用戶的興趣點。城市監(jiān)控體系,在各個重要路口,高速公路上的攝像頭,每秒鐘都在產生海量的視頻數 據。在生命科學領域,對人體的DNA分析,一個個體就能產生幾個G數據,可以想象如果一個生物信息數據庫里包含了成千萬的個體數據,信息量將會是怎樣一個 規(guī)模,如此等等,不勝枚舉。我們毫無疑問,正處于一個信息爆炸的時代。
大數據的火爆我們是有目共睹的,學習大數據無疑都會選擇一家專業(yè)的大數據培訓學校,因為一般自學的效果都不是很好,畢竟大數據包含的技術知識太多了,首先要先了解大數據的一些基本概念。
□01.第1周面向小白的統(tǒng)計學:描述性統(tǒng)計(均值,中位數,眾數,方差,標準差,與常見的統(tǒng)計…口02.第2周賭博設計:概率的基本概念,古典概型
□03.第3周每人腦袋里有個貝葉斯:條件概率與貝葉斯公式,獨立性
□04.第4周啊!微積分:隨機變量及其分布(二項分布,均勻分布,正態(tài)分布)
□05.第5周萬事皆由分布掌握:多維隨機變量及其分布
□06.第6周磚家的統(tǒng)計學:隨機變量的期望,方差與協(xié)方差
□07.第7周上帝之手,統(tǒng)計學的哲學基礎:大數定律、中心極限定理與抽樣分布
□08.第8周點數成金,從抽樣推測規(guī)律之一:點估計與區(qū)間估計
□09.第9周點數成金,從抽樣推測規(guī)律之二:參數估計口10.第10課對或錯?告別拍腦袋決策:基于正態(tài)總體的假設檢驗
□11.第11課扔掉正態(tài)分布:秩和檢驗
口12.第12課預測未來的技術:回歸分析
口13.第13課抓住表象背后那只手:方差分析
口14.第14課沿著時間軸前進,預測電子商務業(yè)績:時間序列分析簡介□15.第15課 PageRank的背后:隨機過程與馬爾科夫鏈簡介