2011年11月17日木曜日

やっぱりブートストラップ確率っていう表現はおかしいよね

週末に統計検定なるものを受けるので、統計解析の基礎を一通り復習すべく、入門書と現在格闘中。

で、確率論の章において、「確率」というものの定義を学んでみると、

「確率とは、多数回の実験の中で、その事象の起こる回数の比率である」

とある。



これを見ると、やっぱり巷でよく見るBootstrap Probabilityなんていう表現は適切ではないんじゃないか、と思ってしまう。

何故かというと、ブートストラップ解析で行う試行(実験)では、データが毎回違うから。

これは、例えて言うならば、

「面の数は同じ6面だが、形が毎回ぐにゃぐにゃに異なりうるサイコロを100回振って、6がN回出たから、6の出る確率はN/100だ」

と主張しているみたいなもん。

・・・う~ん、やっぱり適切な表現ではないと思う。

だから、ブートストラップ確率なんて言い方はすべきでないのであって、Bootstrap proportionとかBootstrap valueと呼ぶべきなんだよね。

まあ、自分のこの考えが一般的に正しいんだ!とかいう主張をするつもりはないし、系統解析の専門誌であっても殆どの論文でBootstrap probabilityという表現が多用されているのも事実。けど、少なくとも自分がこれから書くモノの中では、ブートストラップ確率という表現は使わないようにすると思う。

0 件のコメント: