古詩詞大全網 - 成語經典 - 人工智能十大算法

人工智能十大算法

人工智能十大算法如下

線性回歸(Linear Regression)可能是最流行的機器學習算法。線性回歸就是要找壹條直線,並且讓這條直線盡可能地擬合散點圖中的數據點。它試圖通過將直線方程與該數據擬合來表示自變量(x?值)和數值結果(y?值)。然後就可以用這條線來預測未來的值!

邏輯回歸(Logistic regression)與線性回歸類似,但它是用於輸出為二進制的情況(即,當結果只能有兩個可能的值)。對最終輸出的預測是壹個非線性的?S?型函數,稱為?logistic function, g()。

決策樹(Decision Trees)可用於回歸和分類任務。

樸素貝葉斯(Naive Bayes)是基於貝葉斯定理。它測量每個類的概率,每個類的條件概率給出?x?的值。這個算法用於分類問題,得到壹個二進制“是?/?非”的結果。看看下面的方程式。

支持向量機(Support Vector Machine,SVM)是壹種用於分類問題的監督算法。支持向量機試圖在數據點之間繪制兩條線,它們之間的邊距最大。為此,我們將數據項繪制為?n?維空間中的點,其中,n?是輸入特征的數量。在此基礎上,支持向量機找到壹個最優邊界,稱為超平面(Hyperplane),它通過類標簽將可能的輸出進行最佳分離。

K-?最近鄰算法(K-Nearest Neighbors,KNN)非常簡單。KNN?通過在整個訓練集中搜索?K?個最相似的實例,即?K?個鄰居,並為所有這些?K?個實例分配壹個公***輸出變量,來對對象進行分類。

K-?均值(K-means)是通過對數據集進行分類來聚類的。例如,這個算法可用於根據購買歷史將用戶分組。它在數據集中找到?K?個聚類。K-?均值用於無監督學習,因此,我們只需使用訓練數據?X,以及我們想要識別的聚類數量?K。

隨機森林(Random Forest)是壹種非常流行的集成機器學習算法。這個算法的基本思想是,許多人的意見要比個人的意見更準確。在隨機森林中,我們使用決策樹集成(參見決策樹)。

由於我們今天能夠捕獲的數據量之大,機器學習問題變得更加復雜。這就意味著訓練極其緩慢,而且很難找到壹個好的解決方案。這壹問題,通常被稱為“維數災難”(Curse of dimensionality)。

人工神經網絡(Artificial Neural Networks,ANN)可以處理大型復雜的機器學習任務。神經網絡本質上是壹組帶有權值的邊和節點組成的相互連接的層,稱為神經元。在輸入層和輸出層之間,我們可以插入多個隱藏層。人工神經網絡使用了兩個隱藏層。除此之外,還需要處理深度學習。