機器學習是人工智能的基礎,本課程將學習到大多數機器學習中的經典算法。
機器學習(machine learning)形象的來說,就是使用機器(計算機)利用數據,自行對數據特征進行學習(與手工編寫程序直接解決問題區(qū)分),來解決現實生活中的問題(如手寫數字識別、實例分割等等)。
機器學習算法已經對人們對數據的利用方式造成了重大改變。例如醫(yī)院開始將診療數據保存下來,包括病人的基本信息、醫(yī)生的診斷結果、CT圖像等等。使用學習型算法對這些數據進行分析,就可以得到一段時間內的病例發(fā)展趨勢,或者嘗試利用CT數據對病人的病灶進行自動檢測等等。
分類
機器學習可以簡單的認為是基于數據的學習。依據學習時是否有數據標簽,分為監(jiān)督學習、無監(jiān)督學習和半監(jiān)督學習
監(jiān)督學習指不僅把訓練數據丟給計算機,而且還把分類的結果(數據具有的標簽)也一并丟給計算機分析。 計算機進行學習之后,再丟給它新的未知的數據,它也能計算出該數據導致各種結果的概率,給你一個最接近正確的結果。 由于計算機在學習的過程中不僅有訓練數據,而且有訓練結果(標簽),因此訓練的效果通常不錯。監(jiān)督學習的結果可分為兩類:分類或回歸。
非監(jiān)督學習指的是只給計算機訓練數據,不給結果(標簽),因此計算機無法準確地知道哪些數據具有哪些標簽,只能通過發(fā)現數據內部的一些相似特征,把數據劃分為若干類。非監(jiān)督學習一般表示為聚類算法。