古詩詞大全網 - 成語故事 - 各種遙感數據分類方法比較

各種遙感數據分類方法比較

常用的遙感數據的專題分類方法有多種,從分類判別決策方法的角度可以分為統計分類器、神經網絡分類器、專家系統分類器等;從是否需要訓練數據方面,又可以分為監督分類器和非監督分類器。

壹、統計分類方法

統計分類方法分為非監督分類方法和監督分類方法。非監督分類方法不需要通過選取已知類別的像元進行分類器訓練,而監督分類方法則需要選取壹定數量的已知類別的像元對分類器進行訓練,以估計分類器中的參數。非監督分類方法不需要任何先驗知識,也不會因訓練樣本選取而引入認為誤差,但非監督分類得到的自然類別常常和研究感興趣的類別不匹配。相應地,監督分類壹般需要預先定義分類類別,訓練數據的選取可能會缺少代表性,但也可能在訓練過程中發現嚴重的分類錯誤。

1.非監督分類器

非監督分類方法壹般為聚類算法。最常用的聚類非監督分類方法是 K-均值(K-Means Algorithm)聚類方法(Duda and Hart,1973)和叠代自組織數據分析算法(ISODATA)。其算法描述可見於壹般的統計模式識別文獻中。

壹般通過簡單的聚類方法得到的分類結果精度較低,因此很少單獨使用聚類方法進行遙感數據專題分類。但是,通過對遙感數據進行聚類分析,可以初步了解各類別的分布,獲取最大似然監督分類中各類別的先驗概率。聚類分析最終的類別的均值矢量和協方差矩陣可以用於最大似然分類過程(Schowengerdt,1997)。

2.監督分類器

監督分類器是遙感數據專題分類中最常用的壹種分類器。和非監督分類器相比,監督分類器需要選取壹定數量的訓練數據對分類器進行訓練,估計分類器中的關鍵參數,然後用訓練後的分類器將像元劃分到各類別。監督分類過程壹般包括定義分類類別、選擇訓練數據、訓練分類器和最終像元分類四個步驟(Richards,1997)。每壹步都對最終分類的不確定性有顯著影響。

監督分類器又分為參數分類器和非參數分類器兩種。參數分類器要求待分類數據滿足壹定的概率分布,而非參數分類器對數據的概率分布沒有要求。

遙感數據分類中常用的分類器有最大似然分類器、最小距離分類器、馬氏距離分類器、K-最近鄰分類器(K-Nearest neighborhood classifier,K-NN)以及平行六面體分類器(parallelepiped classifier)。最大似然、最小距離和馬氏距離分類器在第三章已經詳細介紹。這裏簡要介紹 K-NN 分類器和平行六面體分類器。

K-NN分類器是壹種非參數分類器。該分類器的決策規則是:將像元劃分到在特征空間中與其特征矢量最近的訓練數據特征矢量所代表的類別(Schowengerdt,1997)。當分類器中 K=1時,稱為1-NN分類器,這時以離待分類像元最近的訓練數據的類別作為該像元的類別;當 K >1 時,以待分類像元的 K 個最近的訓練數據中像元數量最多的類別作為該像元的類別,也可以計算待分類像元與其 K 個近鄰像元特征矢量的歐氏距離的倒數作為權重,以權重值最大的訓練數據的類別作為待分類像元的類別。Hardin,(1994)對 K-NN分類器進行了深入的討論。

平行六面體分類方法是壹個簡單的非參數分類算法。該方法通過計算訓練數據各波段直方圖的上限和下限確定各類別像元亮度值的範圍。對每壹類別來說,其每個波段的上下限壹起就形成了壹個多維的盒子(box)或平行六面體(parallelepiped)。因此 M 個類別就有M 個平行六面體。當待分類像元的亮度值落在某壹類別的平行六面體內時,該像元就被劃分為該平行六面體代表的類別。平行六面體分類器可以用圖5-1中兩波段的遙感數據分類問題來表示。圖中的橢圓表示從訓練數據估計的各類別亮度值分布,矩形表示各類別的亮度值範圍。像元的亮度落在哪個類別的亮度範圍內,就被劃分為哪個類別。

圖5-1 平行六面體分類方法示意圖

3.統計分類器的評價

各種統計分類器在遙感數據分類中的表現各不相同,這既與分類算法有關,又與數據的統計分布特征、訓練樣本的選取等因素有關。

非監督聚類算法對分類數據的統計特征沒有要求,但由於非監督分類方法沒有考慮任何先驗知識,壹般分類精度比較低。更多情況下,聚類分析被作為非監督分類前的壹個探索性分析,用於了解分類數據中各類別的分布和統計特征,為監督分類中類別定義、訓練數據的選取以及最終的分類過程提供先驗知識。在實際應用中,壹般用監督分類方法進行遙感數據分類。

最大似然分類方法是遙感數據分類中最常用的分類方法。最大似然分類屬於參數分類方法。在有足夠多的訓練樣本、壹定的類別先驗概率分布的知識,且數據接近正態分布的條件下,最大似然分類被認為是分類精度最高的分類方法。但是當訓練數據較少時,均值和協方差參數估計的偏差會嚴重影響分類精度。Swain and Davis(1978)認為,在N維光譜空間的最大似然分類中,每壹類別的訓練數據樣本至少應該達到10×N個,在可能的條件下,最好能達到100×N以上。而且,在許多情況下,遙感數據的統計分布不滿足正態分布的假設,也難以確定各類別的先驗概率。

最小距離分類器可以認為是在不考慮協方差矩陣時的最大似然分類方法。當訓練樣本較少時,對均值的估計精度壹般要高於對協方差矩陣的估計。因此,在有限的訓練樣本條件下,可以只估計訓練樣本的均值而不計算協方差矩陣。這樣最大似然算法就退化為最小距離算法。由於沒有考慮數據的協方差,類別的概率分布是對稱的,而且各類別的光譜特征分布的方差被認為是相等的。很顯然,當有足夠訓練樣本保證協方差矩陣的精確估計時,最大似然分類結果精度要高於最小距離精度。然而,在訓練數據較少時,最小距離分類精度可能比最大似然分類精度高(Richards,1993)。而且最小距離算法對數據概率分布特征沒有要求。

馬氏距離分類器可以認為是在各類別的協方差矩陣相等時的最大似然分類。由於假定各類別的協方差矩陣相等,和最大似然方法相比,它丟失了各類別之間協方差矩陣的差異的信息,但和最小距離法相比較,它通過協方差矩陣保持了壹定的方向靈敏性(Richards,1993)。因此,馬氏距離分類器可以認為是介於最大似然和最小距離分類器之間的壹種分類器。與最大似然分類壹樣,馬氏距離分類器要求數據服從正態分布。

K-NN分類器的壹個主要問題是需要很大的訓練數據集以保證分類算法收斂(Devijver and Kittler,1982)。K-NN分類器的另壹個問題是,訓練樣本選取的誤差對分類結果有很大的影響(Cortijo and Blanca,1997)。同時,K-NN分類器的計算復雜性隨著最近鄰範圍的擴大而增加。但由於 K-NN分類器考慮了像元鄰域上的空間關系,和其他光譜分類器相比,分類結果中“椒鹽現象”較少。

平行六面體分類方法的優點在於簡單,運算速度快,且不依賴於任何概率分布要求。它的缺陷在於:首先,落在所有類別亮度值範圍之外的像元只能被分類為未知類別;其次,落在各類別亮度範圍重疊區域內的像元難以區分其類別(如圖5-1所示)。

各種統計分類方法的特點可以總結為表5-1。

二、神經網絡分類器

神經網絡用於遙感數據分類的最大優勢在於它平等地對待多源輸入數據的能力,即使這些輸入數據具有完全不同的統計分布,但是由於神經網絡內部各層大量的神經元之間連接的權重是不透明的,因此用戶難以控制(Austin,Harding and Kanellopoulos et al.,1997)。

神經網絡遙感數據分類被認為是遙感數據分類的熱點研究領域之壹(Wilkinson,1996;Kimes,1998)。神經網絡分類器也可分為監督分類器和非監督分類器兩種。由於神經網絡分類器對分類數據的統計分布沒有任何要求,因此神經網絡分類器屬於非參數分類器。

遙感數據分類中最常用的神經網絡是多層感知器模型(multi-layer percep-tron,MLP)。該模型的網絡結構如圖5-2所示。該網絡包括三層:輸入層、隱層和輸出層。輸入層主要作為輸入數據和神經網絡輸入界面,其本身沒有處理功能;隱層和輸出層的處理能力包含在各個結點中。輸入的結構壹般為待分類數據的特征矢量,壹般情況下,為訓練像元的多光譜矢量,每個結點代表壹個光譜波段。當然,輸入結點也可以為像元的空間上下文信息(如紋理)等,或多時段的光譜矢量(Paola and Schowengerdt,1995)。

表5-1 各種統計分類器比較

圖5-2 多層感知器神經網絡結構

對於隱層和輸出層的結點來說,其處理過程是壹個激勵函數(activation function)。假設激勵函數為f(S),對隱層結點來說,有:

遙感信息的不確定性研究

其中,pi為隱層結點的輸入;hj為隱層結點的輸出;w為聯接各層神經之間的權重。

對輸出層來說,有如下關系:

遙感信息的不確定性研究

其中,hj為輸出層的輸入;ok為輸出層的輸出。

激勵函數壹般表達為:

遙感信息的不確定性研究

確定了網絡結構後,就要對網絡進行訓練,使網絡具有根據新的輸入數據預測輸出結果的能力。最常用的是後向傳播訓練算法(Back-Propagation)。這壹算法將訓練數據從輸入層進入網絡,隨機產生各結點連接權重,按式(5-1)(5-2)和(5-3)中的公式進行計算,將網絡輸出與預期的結果(訓練數據的類別)相比較並計算誤差。這個誤差被後向傳播的網絡並用於調整結點間的連接權重。調整連接權重的方法壹般為delta規則(Rumelhart,et al.,1986):

遙感信息的不確定性研究

其中,η為學習率(learning rate);δk為誤差變化率;α為動量參數。

將這樣的數據的前向和誤差後向傳播過程不斷叠代,直到網絡誤差減小到預設的水平,網絡訓練結束。這時就可以將待分類數據輸入神經網絡進行分類。

除了多層感知器神經網絡模型,其他結構的網絡模型也被用於遙感數據分類。例如,Kohonen自組織網絡被廣泛用於遙感數據的非監督聚類分析(Yoshida et al.,1994;Schaale et al.,1995);自適應***振理論(Adaptive Resonance Theory)網絡(Silva,S and Caetano,M.1997)、模糊ART圖(Fuzzy ART Maps)(Fischer,M.M and Gopal,S,1997)、徑向基函數(駱劍承,1999)等也被用於遙感數據分類。

許多因素影響神經網絡的遙感數據分類精度。Foody and Arora(1997)認為神經網絡結構、遙感數據的維數以及訓練數據的大小是影響神經網絡分類的重要因素。

神經網絡結構,特別是網絡的層數和各層神經元的數量是神經網絡設計最關鍵的問題。網絡結構不但影響分類精度,而且對網絡訓練時間有直接影響(Kavzoglu and Mather,1999)。對用於遙感數據分類的神經網絡來說,由於輸入層和輸出層的神經元數目分別由遙感數據的特征維數和總的類別數決定的,因此網絡結構的設計主要解決隱層的數目和隱層的神經元數目。壹般過於復雜的網絡結構在刻畫訓練數據方面較好,但分類精度較低,即“過度擬合”現象(over-fit)。而過於簡單的網絡結構由於不能很好的學習訓練數據中的模式,因此分類精度低。

網絡結構壹般是通過實驗的方法來確定。Hirose等(1991)提出了壹種方法。該方法從壹個小的網絡結構開始訓練,每次網絡訓練陷入局部最優時,增加壹個隱層神經元,然後再訓練,如此反復,直到網絡訓練收斂。這種方法可能導致網絡結構過於復雜。壹種解決辦法是每當認為網絡收斂時,減去最近壹次加入的神經元,直到網絡不再收斂,那麽最後壹次收斂的網絡被認為是最優結構。這種方法的缺點是非常耗時。“剪枝法”(pruning)是另壹種確定神經網絡結構的方法。和Hirose等(1991)的方法不同,“剪枝法”從壹個很大的網絡結構開始,然後逐步去掉認為多余的神經元(Sietsma and Dow,1988)。從壹個大的網絡開始的優點是,網絡學習速度快,對初始條件和學習參數不敏感。“剪枝”過程不斷重復,直到網絡不再收斂時,最後壹次收斂的網絡被認為最優(Castellano,Fanelli and Pelillo,1997)。

神經網絡訓練需要訓練數據樣本的多少隨不同的網絡結構、類別的多少等因素變化。但是,基本要求是訓練數據能夠充分描述代表性的類別。Foody等(1995)認為訓練數據的大小對遙感分類精度有顯著影響,但和統計分類器相比,神經網絡的訓練數據可以比較少。

分類變量的數據維對分類精度的影響是遙感數據分類中的普遍問題。許多研究表明,壹般類別之間的可分性和最終的分類精度會隨著數據維數的增大而增高,達到某壹點後,分類精度會隨數據維的繼續增大而降低(Shahshahani and Landgrebe,1994)。這就是有名的Hughes 現象。壹般需要通過特征選擇去掉信息相關性高的波段或通過主成分分析方法去掉冗余信息。分類數據的維數對神經網絡分類的精度同樣有明顯影響(Battiti,1994),但Hughes 現象沒有傳統統計分類器中嚴重(Foody and Arora,1997)。

Kanellopoulos(1997)通過長期的實踐認為壹個有效的ANN模型應考慮以下幾點:合適的神經網絡結構、優化學習算法、輸入數據的預處理、避免振蕩、采用混合分類方法。其中混合模型包括多種ANN模型的混合、ANN與傳統分類器的混合、ANN與知識處理器的混合等。

三、其他分類器

除了上述統計分類器和神經網絡分類器,還有多種分類器被用於遙感圖像分類。例如模糊分類器,它是針對地面類別變化連續而沒有明顯邊界情況下的壹種分類器。它通過模糊推理機制確定像元屬於每壹個類別的模糊隸屬度。壹般的模糊分類器有模糊C均值聚類法、監督模糊分類方法(Wang,1990)、混合像元模型(Foody and Cox,1994;Settle and Drake,1993)以及各種人工神經網絡方法等(Kanellopoulos et al.,1992;Paola and Schowengerdt,1995)。由於模糊分類的結果是像元屬於每個類別的模糊隸屬度,因此也稱其為“軟分類器”,而將傳統的分類方法稱為“硬分類器”。

另壹類是上下文分類器(contextual classifier),它是壹種綜合考慮圖像光譜和空間特征的分類器。壹般的光譜分類器只是考慮像元的光譜特征。但是,在遙感圖像中,相鄰的像元之間壹般具有空間自相關性。空間自相關程度強的像元壹般更可能屬於同壹個類別。同時考慮像元的光譜特征和空間特征可以提高圖像分類精度,並可以減少分類結果中的“椒鹽現象”。當類別之間的光譜空間具有重疊時,這種現象會更明顯(Cortijo et al.,1995)。這種“椒鹽現象”可以通過分類的後處理濾波消除,也可以通過在分類過程中加入代表像元鄰域關系的信息解決。

在分類過程中可以通過不同方式加入上下文信息。壹是在分類特征中加入圖像紋理信息;另壹種是圖像分割技術,包括區域增長/合並常用算法(Ketting and Landgrebe,1976)、邊緣檢測方法、馬爾可夫隨機場方法。Rignot and Chellappa(1992)用馬爾可夫隨機場方法進行SAR圖像分類,取得了很好的效果,Paul Smits(1997)提出了保持邊緣細節的馬爾可夫隨機場方法,並用於SAR圖像的分類;Crawford(1998)將層次分類方法和馬爾可夫隨機場方法結合進行SAR圖像分類,得到了更高的精度;Cortijo(1997)用非參數光譜分類對遙感圖像分類,然後用ICM算法對初始分類進行上下文校正。