機器學(xué)習(xí)是人工智能的基礎(chǔ),本課程將學(xué)習(xí)到大多數(shù)機器學(xué)習(xí)中的經(jīng)典算法。
機器學(xué)習(xí)(machine learning)形象的來說,就是使用機器(計算機)利用數(shù)據(jù),自行對數(shù)據(jù)特征進行學(xué)習(xí)(與手工編寫程序直接解決問題區(qū)分),來解決現(xiàn)實生活中的問題(如手寫數(shù)字識別、實例分割等等)。
機器學(xué)習(xí)算法已經(jīng)對人們對數(shù)據(jù)的利用方式造成了重大改變。例如醫(yī)院開始將診療數(shù)據(jù)保存下來,包括病人的基本信息、醫(yī)生的診斷結(jié)果、CT圖像等等。使用學(xué)習(xí)型算法對這些數(shù)據(jù)進行分析,就可以得到一段時間內(nèi)的病例發(fā)展趨勢,或者嘗試利用CT數(shù)據(jù)對病人的病灶進行自動檢測等等。
分類
機器學(xué)習(xí)可以簡單的認為是基于數(shù)據(jù)的學(xué)習(xí)。依據(jù)學(xué)習(xí)時是否有數(shù)據(jù)標簽,分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)指不僅把訓(xùn)練數(shù)據(jù)丟給計算機,而且還把分類的結(jié)果(數(shù)據(jù)具有的標簽)也一并丟給計算機分析。 計算機進行學(xué)習(xí)之后,再丟給它新的未知的數(shù)據(jù),它也能計算出該數(shù)據(jù)導(dǎo)致各種結(jié)果的概率,給你一個最接近正確的結(jié)果。 由于計算機在學(xué)習(xí)的過程中不僅有訓(xùn)練數(shù)據(jù),而且有訓(xùn)練結(jié)果(標簽),因此訓(xùn)練的效果通常不錯。監(jiān)督學(xué)習(xí)的結(jié)果可分為兩類:分類或回歸。
非監(jiān)督學(xué)習(xí)指的是只給計算機訓(xùn)練數(shù)據(jù),不給結(jié)果(標簽),因此計算機無法準確地知道哪些數(shù)據(jù)具有哪些標簽,只能通過發(fā)現(xiàn)數(shù)據(jù)內(nèi)部的一些相似特征,把數(shù)據(jù)劃分為若干類。非監(jiān)督學(xué)習(xí)一般表示為聚類算法。