2011年9月21日水曜日

メモ:Sliding Windowでのt検定

今使っている、ダルのSEが作ったプログラムに関する私的メモ。

ある系統樹(しばしばML)とある系統樹の対数尤度の差を取り、さらにサイトごとのΔlnLをあるサイズのwindowに分ける。windowのサイズを変えていった場合(所謂sliding window analysis)、「どのサイズのどのwindowで対数尤度の差が有意に大きくなるか」を検証するためには、1標本でのt検定を行う。

その際のt統計量の計算は以下の通り(だと思う)。



¯xが標本平均(各windowでのΔlnLの平均)、μが母平均(サイト全体でのΔlnLの平均)、nはwindowのサイト数、sは各windowでの標本標準偏差。


ただし、このような場合の母集団は正規分布しているとは限らないので、site ΔlnLsのデータからRELL法を用いてreplicateを生成、同様にt統計量を計算し、サンプルの分布を作ることにしている。


また、ESのプログラムだとt統計量を二乗してF統計量とし、p値を計算しているようだ。

0 件のコメント: