古詩詞大全網 - 成語故事 - 統計中的 Bootstrap 方法是指什麽

統計中的 Bootstrap 方法是指什麽

在統計學中,自助法(Bootstrap Method,Bootstrapping或自助抽樣法)是壹種從給定訓練集中有放回的均勻抽樣,也就是說,每當選中壹個樣本,它等可能地被再次選中並被再次添加到訓練集中。自助法由Bradley Efron於1979年在《Annals of Statistics》上發表。當樣本來自總體,能以正態分布來描述,其抽樣分布(Sampling Distribution)為正態分布(The Normal Distribution);但當樣本來自的總體無法以正態分布來描述,則以漸進分析法、自助法等來分析。采用隨機可置換抽樣(random samplingwith replacement)。對於小數據集,自助法效果很好。

Bootstrap

非參數統計中壹種重要的估計統計量方差進而進行區間估計的統計方法,也稱為自助法。其核心思想和基本步驟如下:[1]

(1)采用重抽樣技術從原始樣本中抽取壹定數量(自己給定)的樣本,此過程允許重復抽樣。

(2)根據抽出的樣本計算給定的統計量T。

(3)重復上述N次(壹般大於1000),得到N個統計量T。

(4)計算上述N個統計量T的樣本方差,得到統計量的方差。

應該說Bootstrap是現代統計學較為流行的壹種統計方法,在小樣本時效果很好。通過方差的估計可以構造置信區間等,其運用範圍得到進壹步延伸。

具體抽樣方法舉例:想要知道池塘裏面魚的數量,可以先抽取N條魚,做上記號,放回池塘。

進行重復抽樣,抽取M次,每次抽取N條,考察每次抽到的魚當中有記號的比例,綜合M次的比例,在進行統計量的計算。