2011年5月10日火曜日

エラーバーの解釈

引用元
http://psycnet.apa.org/journals/amp/60/2/170/

初めに注意すべきなのは、エラーバーはあくまで「飾り」ということです。

エラーバーはデータを出す方ではなくデータを見る方のためのものであり、例えばプレゼンの時に、聴衆がサンプル間での実験結果に違いがあるかどうかをわかりやすくするための補助的なものでしかありません。

従って、本当にデータ間に違いがあるかどうかについては単なる「目安」程度の説得力しかないので、あんまりこれに頼りすぎるのは危険です。

バーなんて飾りですよ。偉い人にはそれが(ry

しかし、仮に飾りであったとしても、その持つ意味をちゃんと理解していなければ、データを綺麗に示すことは出来ず、飾りの意味すら為し得ません。

なので、エラーバーをどう解釈するべきかちゃんと理解しましょうね、という類の主張で度々引用されるのが上記の論文です。(転載しませんでしたが、Scholarで検索するとPDFが見られます)

論述されているエラーバーの解釈の前提として、

1、比較される2つのサンプル群が独立である(被験者内要因がない)
2、それぞれの群のサンプル数が10以上である
3、それぞれのエラーバー(この場合95%CI=mean+-2*SE)の長さが大体同じ(2倍以上とかはアウト)

ということが必要です。

色々書いてありますが、自分の中の結論としては、「エラーバーの重なりの部分の合計が2つのバーの平均の長さの半分以下なら5%危険水準で有意差検出」はちょっと危なっかしいので心に留めるだけとして、実際に使うのは「重なってないなら1%危険水準で有意差検出」ですかね・・・

0 件のコメント: