古詩詞大全網 - 成語故事 - 各位學生態學的朋友,請教壹個問題,在研究小尺度的物種分布時壹般使用什麽物種分布模型?

各位學生態學的朋友,請教壹個問題,在研究小尺度的物種分布時壹般使用什麽物種分布模型?

物種分布模型的理論基礎,是生態位的概念,生態位被定義為生態系統中的種群在時間和空間上所占據的位置及其與其他種群之間的關系與作用。

物種分布模型的發展,始於BIOCLIM模型的開發和應用,隨後的二十多年內,湧現了HABITAT、DOMAIN、生態位因子分析模型(Ecological Niche Factor Analysis, ENFA)、馬氏距離(Mahalanobis Distance, MD)、邊界函數方法(Border Function, BF)、最大熵模(Maximum Entropy, Maxent)、廣義線性模型(Generalized Linear Model, GLM)、廣義加法模型(Generalized Additive Model, GAM)、分類與回歸樹模型(Classification and Regression Tree, CART)、推動回歸樹模型(Boosted Regression Tree, BRT)、多元適應性回歸樣條(Multivariate Adaptive Regression Splines, MARS)等基於統計的和基於規則集的遺傳算法(Genetic Algorithm for Rule-set Prediction, GARP)、人工神經網絡(Artificial Neural Network, ANN)等基於人工智能的模型。

BIOCLIM模型將生態位定義為在環境變量空間中包含所有研究物種樣本的超體積。按照此定義,該超體積是壹個以各環境變量的極值(極大值和極小值)界定的超矩形,超矩形所界定的變量範圍都被認為是適合於物種分布的。這種定義的缺陷在於,極限環境條件也被認為能夠維持種群的穩定,這是不合理的,因為在極限環境條件下,物種雖然能夠存活,但是不能維持種群的延續。因此,為減少極值對模型性能的影響,提高模型的預測能力,通常在界定多維超矩形的邊界之前,對所有樣本上的各變量值進行排序,在其中選擇壹定數量的極值樣本(例如最高的5%)並對這些環境變量的極值進行平均處理以得到超矩形的邊界,由此估計物種的潛在分布區。

HABITAT模型將生態位定義為物種在環境變量空間上的凸殼,與BIOCLIM模型不同,在環境變量空間中HABITAT模型不再將環境變量的極值作為生態位的邊界,即邊界不再是剛性的,而以樣本本身所對應環境變量的壹個鄰域作為適宜物種分布的環境條件,這樣就排除了某些極限環境條件。遺憾的是,HABITAT模型對邊界的刻畫仍然依賴於外圍樣本。

基於Gower距離算法的DOMAIN模型利用點-點的相似矩陣計算目標點上環境變量的適宜性,該適宜性表示了在環境變量空間中(而非現實分布空間中),目標點與離它最近的分布樣本點之間的相似程度。在確定物種的生境或者分布範圍時,首先需要確定壹個閾值以排除非適宜分布區。與之前BIOCLIM方法相比,DOMAIN模型在環境變量空間中確定的環境超矩形並不壹定是連續的。

生態位因子分析模型(ENFA)通過計算邊際性和環境偏差來度量目標點的適宜性。在壹維情況下,邊際性表現為該環境變量的值域上,分布樣本點所對應的環境變量的均值(樣本均值)與研究區所有點對應的環境變量的均值(全局均值)之間的差;環境偏差其實就是該環境變量的樣本方差與全局方差之間的差別。在多維情況下,邊際性和環境偏差以多維向量的形式表示。在確定了邊際性和環境偏差之後,應用閾值對環境條件進行篩選,可得到物種在環境變量空間中的適宜範圍, 將其映射到實際研究區,便可得到物種的分布區域。

BF模型以邊界函數界定物種在環境變量空間上的邊界。以二維環境變量(V1和V2)空間為例,邊界函數的確定方法分為以下步驟: 首先,收集物種分布樣本及與之相關的環境變量V1和V2,並作散點圖;其次,對其中的壹個變量(例如V1)進行分段並取各段的中值(或均值),對各段V1值相對應的V2進行排序,選擇壹定比例(如5%)的極值並統計極值的平均;再次,在對每壹段進行相應分析之後,可得壹系列環境變量對偶值,對這些值進行擬合,便可得環境變量的邊界函數,對影響研究物種分布的各環境變量都進行相應的分析,則可得出物種在整個環境變量空間上的邊界;最後,將所得邊界映射至研究區的環境變量,便可估計物種的潛在分布區。該方法更加準確的刻畫了環境變量空間上的生態位,其缺憾在於相關計算和處理較為繁瑣。

CART模型通過二值遞歸分割產生二叉樹,在每壹個可能的節點根據變量的值進行判斷並將變量的所有值分割為兩個子類。每壹次分割都只基於單個變量值,在此過程中,有些變量值可能會被采用多次,而另外壹些變量值則可能不會被采用。在每壹次分割之後,能夠保證包含在兩子類中的變量值是“有區別的最大化”。兩個子類的變量值根據壹定的準則被繼續分割,直至達到分類的目的。在物種潛在分布模擬中,通常以物種分布樣本上各變量的極值作為節點進行分割。

GARP模型利用物種的分布數據和環境數據運行產生不同規則的集合,判斷物種的生態需求,然後預測物種的潛在分布區。GARP模型是壹個反復叠代,尋找最優種類分布規則的過程,在模型中,遺傳算法本身並不能刻畫生物分布與環境因子的關系,被用來刻畫這種關系的是“規則(Rule)”,如Range規則, Atomic規則, Logit規則等等,遺傳算法的作用是為這些規則尋找最大的參數。GARP模型具有以下優點: 首先,它能快速有效的搜索多變量空間;其次,遺傳算法是壹種非參數方法,它對變量所屬總體的統計分布形式沒有嚴格要求;第三,GARP模型中集成了多類規則,各類規則之間的互補提高了GARP的模擬能力。

2 各物種分布模型的性能表現

應用本文提及的物種分布模型,Elith等對分布於全球6個不同地區的226種物種(澳大利亞濕潤赤道地區的鳥類和植物種、加拿大安大略省的鳥類、澳大利亞新南威爾士州的植物種、哺乳動物和爬行動物種、新西蘭的植物種、南美5個國家的植物種以及瑞士的植物種)的空間分布進行了模擬研究,並根據實測樣本數據對結果進行了評價,相關結論認為,Maxent模型具有較好的性能表現。自2006年被開發以來,應用該模型進行物種保護區規劃、入侵物種的潛在分布預測以及物種的空間分布對氣候變化的響應等研究的報道已超過2000次,這也從另壹個側面說明了相關研究領域對該模型的認可程度。GLM模型、GAM模型和GARP模型的性能位於Maxent模型之後,但優於DOMAIN模型和BIOCLIM模型。Tsor等選擇分布於以色列的42種蛇類、鳥類和蝙蝠物種進行了空間分布的研究和相關模型的性能評價,結論也同樣認為,BIOCLIM模型的性能較差。對其他模型性能的評價結果,卻與Elith等的結果有所區別:GARP模型和MD模型的性能優異,HABITAT模型、DOMAIN模型和ENFA模型的性能次之。關於物種分布模型性能評價的最新結果顯示:選用不同的性能評價手段對模型的性能進行評價,會導致得出不同的結果;另外,若對適宜分布區範圍較小的物種進行空間分布的模擬,則模型之間的差異較大,相反,若研究物種的分布較為廣泛,則各模型的性能表現出較高的壹致性。