検定方法の選択2|t検定?多重比較?
- Manabu
- 2017年7月25日
- 読了時間: 3分
次の4つのことを基準に検定方法を選択する必要がある。
1、検定に用いるデータ(の母集団)が正規分布しているか
2、対応のあるデータか
3、群数が2か?3以上か?
4、関わる要因が1つか?二つか?(群数が3以上の場合)
前回の記事では1と2について書いたので、今日は3について書きます。
3−1、比較するサンプルが2つの群である場合
2群間比較をします。
パラメトリック・・・t検定( paired t test, unpaired t test)
ノンパラメトリック・・ウィルコクソン順位和検定(Wilcoxon rank sum test)、ウィルコクソン符号付順位検定(Wilcoxon signed rank test)
3−2、比較するサンプルが3つ以上の群である場合
多重比較か二元配置分散分析をします。(4へ)
4−1、関わる要因が1つの場合
多重比較をします。
パラメトリック・・・Tukey-Kramer法(全群で比較する場合)、Dunnett法(対象群とだけ比較する場合)
ノンパラメトリック・・・Steel-Dwass法(全群で比較する場合)、Steel法(対象群とだけ比較する場合)
4−2、関わる要因が2つの場合
二元配置分散分析をする。
→交互作用が検出された場合・・・多重比較をする(4-1へ)
実際はもっと様々な検定方法があるらしいけど、とっかかれるようにおそらく代表となる検定方法だけを書き出しました。
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
実験例1 ホタルのオスとメスでルシフェリンの量に差があるのか?
ホタルの発光にはホタルルシフェリンという化合物が基質として関与しています。
ヘイケボタルではオスの方が飛び回ってよく光りそうですが、メスは体が大きく、卵にもルシフェリンを与える必要があります。
では雌雄でルシフェリンの量に差があるのか?どっちが多く持っているのかを統計学を使って解析して見ましょう。
サンプルは生体の生理的な条件をできるだけ揃え分散を小さくするために、飼育したものを使います。
さらに、成虫は毎晩光るので、羽化したばかりの成虫を揃えましょう。
これらのサンプルからルシフェリンを有機溶媒で抽出し、HPLCなどを用いて蛍光強度からルシフェリンの定量を行います。
まず、得られたデータをF検定にかけ、データが等分散するかを推定します。
今回は等分散が仮定できたとしましょう。
用いたホタルは全て異なる個体なので、対応のないデータになりますから、unpaired t testを選ぶことになります。
実験例2 ルシフェリンの生合成に関与する遺伝子はどれだ?
ホタルルシフェリンは様々な研究分野や教育教材としても市販されるほど有名な化合物であり、ホタルの体内で合成されます。
ところが、そのホタルルシフェリンの生合成に関与する遺伝子についてはほとんどわかっていません。
ホタルの情報(が今後解読されたとして)から代謝に関連するものなどから、ルシフェリンの生合成に関わっていそうな遺伝子を20
個リストアップし、これらの遺伝子をゲノム編集技術でノックアウトできたとします。
これらの個体を成虫まで育てて、上と同様にルシフェリン量を定量し、群間比較して、ルシフェリン量が有意に小さいグループがあれば、それがルシフェリン生合成遺伝子をノックアウトしたグループである可能性が考えられます。
ではどの検定方法を使うべきでしょう。
3群以上、パラメトリック、関わる要因が1つ、対照群との比較 になるので、検定方法はDunnett法を選ぶことになります。
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
検定は奥が深いけど、間違わないように勉強していかねば。
ゲノムワイドな解析をするときのビックデータを使った検定も、基礎がないと理解できないよね。