古詩詞大全網 - 成語故事 - 統計學bootstrap用於解決什麽問題

統計學bootstrap用於解決什麽問題

Bootstrap方法根據給定的原始樣本復制觀測信息對總體的分布特性進行統計推斷,不需要額外的信息。

Efron(1979)認為該方法也屬於非參數統計方法。(推薦學習:Bootstrap視頻教程)

Bootstrap方法從觀察數據出發,不需任何分布假定,針對統計學中的參數估計及假設檢驗問題,利用Bootstrap方法產生的自舉樣本計算的某統計量的數據集可以用來反映該統計量的抽樣分布,即產生經驗分布,這樣,即使我們對總體分布不確定,也可以近似估計出該統計量及其置信區間,由此分布可得到不同置信水平相應的分位數——即為通常所謂的臨界值,可進壹步用於假設測驗。

因而,Bootstrap方法能夠解決許多傳統統計分析方法不能解決的問題。

在Bootstrap的實現過程中,計算機的地位不容忽視(Diaconis et al.,1983),因為Bootstrap涉及到大量的模擬計算。

可以說如果沒有計算機,Bootstrap理論只可能是壹紙空談。隨著計算機的快速發展,計算速度的提高,計算費時大大降低。

在數據的分布假設太牽強或者解析式太難推導時,Bootstrap為我們提供了解決問題的另壹種有效的思路。因此,該方法在生物科學研究中有壹定的利用價值和實際意義。

應用bootstrap的原因:

其實,在進行分析的時候,首先要做的就是,判斷隨機變量的類型,然後就是判斷隨機變量的數據服從什麽分布。

什麽分布至關重要,因為它直接決定能不能分析。舉例:如果進行方差分析,首先就要求正態分布,如果不是正態分布,就要有補救措施,這個補救措施就是bootstrap。

bootstrap還有壹個用處,因為經典統計學對集中趨勢比較完善,但是對其他壹些分布參數,例如中位數,四分位數,標準差,變異系數等的區間估計不完善,所以就需要bootstrap,這種方法。

bootstrap和經典統計學方法類似,壹般情況參數法效率高於非參數法,但是,參數法最大的弊端就是需要事先有壹個分布模型,如果模型不符合,分析結果可能錯誤,也就是白分析。

更多Bootstrap相關技術文章,請訪問Bootstrap教程欄目進行學習!