2010年8月2日月曜日

お勉強ターイム

シミュレーションに使う解析方法を色々考えているが、どうにもややこしくなりそうだ。

実用的なモデルを可能な限り網羅的に試したいが、そうするとモデルごとに使えるプログラム、解析方法が限られてくるため、シミュレーションの統一性が崩れてしまうことになる。

(ベイズとMLの混合はどうなのよ? とか)

そこらへんのことは慎重に考えねばなるまい。

当初は塩基とアミノ酸で解析して比較しようと思っていたが、塩基だとモデル選択によって選択された任意のモデルを、系統樹上で均一に使うか不均一に使うかも含めてflexibleに実装できるプログラムがない。(bppmlはアミノ酸だとdat形式さえあればどんなモデルも実装できるが、塩基にはそれが無く、モデル選択に使われるモデル数よりも実際に解析に実装できるモデル数が少なくなってしまう。)

この条件を満たすもので可能性として考えられるのはp4だが、確証はない。塩基モデルも試そうとするとここらへんが今の所のネックである。

解析に使用できるのは塩基、コドン、アミノ酸のモデルだが、これらをどの範囲まで使用するかを熟考しないといけない。

ちなみに、今度のシミュレーションはPythonでコードを書いてみようと思う。Perlと似たようなもんだと思うが、Lisp習得にも役立つものがあるし、上述したp4の使い方をマスターするのにも必要だろうし、何よりプログラミング技術の向上のためには様々な言語を齧っておくだけでも将来役立つだろう。(一年の目標にも書いたし。)

なので、今週一杯はお勉強タイム。系統解析の書籍でまだ読んでないものが山積みになっているし、帰省中に書こうと思っている藻類最前線の原稿のための資料も読まないといけないし。

0 件のコメント: