決策樹是壹種圖解法。
決策樹(DecisionTree)是在已知各種情況發生概率的基礎上,通過構成決策樹來求取凈現值的期望值大於等於零的概率,評價項目風險,判斷其可行性的決策分析方法,是直觀運用概率分析的壹種圖解法。由於這種決策分支畫成圖形很像壹棵樹的枝幹,故稱決策樹。
在機器學習中,決策樹是壹個預測模型,它代表的是對象屬性與對象值之間的壹種映射關系。Entropy=系統的淩亂程度。這壹度量是基於信息學理論中熵的概念。決策樹是壹種樹形結構,其中每個內部節點表示壹個屬性上的測試,每個分支代表壹個測試輸出,每個葉節點代表壹種類別。
決策樹的剪枝
剪枝是決策樹停止分支的方法之壹,剪枝有分預先剪枝和後剪枝兩種。預先剪枝是在樹的生長過程中設定壹個指標,當達到該指標時就停止生長,這樣做容易產生“視界局限”,就是壹旦停止分支,使得節點N成為葉節點,就斷絕了其後繼節點進行“好”的分支操作的任何可能性。
不嚴格的說這些已停止的分支會誤導學習算法,導致產生的樹不純度降差最大的地方過分靠近根節點。後剪枝中樹首先要充分生長,直到葉節點都有最小的不純度值為止,因而可以克服視界局限。
然後對所有相鄰的成對葉節點考慮是否消去它們,如果消去能引起令人滿意的不純度增長,那麽執行消去,並令它們的公***父節點成為新的葉節點。
以上內容參考百度百科-決策樹