2011年5月22日日曜日

圧倒的じゃないか

自前のデータセットで、1000以上のtaxaでML系統樹を得る必要があったので、初めてFastTreeを使ってみた。

使用したのは1522taxa,256aaの配列データ。64bit UbuntuでLinux用のバイナリとしてあらかじめ用意されたものを使った。オプションはデフォルト。

結果、計算時間は5分弱。・・・は?

最初何かエラーで計算が止まってしまったのかと思った。驚きの速さ。そこらのNJよりも速いんじゃないですか?

これで樹形空間の探索にはNNI+(簡易の)SPRを使ってるわけでしょ。どうやったらそんなに速くなるのだろう・・・?しかもSSE,OpenMP(マルチスレッド)を組み入れてコンパイルしたらもっと速くなる。どんだけ・・・

一応各ノードの支持をSH-aLRTで出力することも可能だが、まあこの速さの分精度の方はかなり犠牲になってるでしょうね。

なんで、PhyMLとかRAxMLで系統樹再構築する時の初期系統樹を、このFastTreeで作るのとかがいいんじゃないでしょうか。

実際、自分のデータはFastTreeで得られた系統樹を使って、現在PhyMLでの解析を行っている。

0 件のコメント: