2012年5月24日木曜日

さあ!願いをいえ!どんな願いも一つだけかなえてやろう…

「ラボの玄関が靴まみれで汚らしいんだ!靴箱を作っておくれ!」

『願いはかなえてやった ではさらばだ』


気付いたらラボに靴箱ができてました。
修士以上とちぇんこりんはHomo sapiensに描かれていますが、
B4以下は獣のようです。

奨励費

例年より内定通知が出るのが大分遅いようで随分待ったんですが、月曜日にやっと結果が来ました。

特別枠に応募してたんですがそれは外れました。でも90-90-90と(先輩方は70とか60とかと聞いていたので)結構多めに貰えたようで何よりです。

どうも今年は”DC1は”リッチらしく、特別枠応募の実験系だと大体90万は貰えているみたいです。特別枠応募してなかったりDC2とかPDは知りませんが、風の噂では今回内定が伸びたのは偉い先生方が上の方で頑張ってくださったからだとかなんとか・・・


とりあえず予想より多く貰えたぼは嬉しいんですが、本年度の研究計画はDDでやってることとかも考慮して、ちょっと色々と調整しないといけませんね。とりあえず、金曜〆切の申請書は急ぎで書いたので、明日あたり大ボスと相談しよう。

2012年5月21日月曜日

館山釣行結果


土・日といつものメンバーで館山まで釣りをしに行ってきました。
土曜日夜7時出発で、次の日3時頃帰筑というスケジュール。

最初はアオリイカとマゴチ・ヒラメ狙いで相浜港に向かいましたが、魚影が薄く期待できなさそうだったので、早々に退散して自衛隊航空基地に移動。

こちらでは既に陣取っていた餌釣りの人たちがいて、朝マヅメにはサバが大量に寄ってきました。



バイブレーション、ジグなど使って三人合わせて7匹ゲット!!(S井さんは4匹ゲットの絶好調でした)
僕も2匹釣りましたが、青物はやっぱり引きが強くて釣ってて楽しいですね。終わり際にかかった1匹がバレちゃったのが残念でした。

朝食後はまったりサビキもやりましたが、隣にいたファミリーが餌まいてくれたのでカタクチイワシも躍り食い。サブイベントも十分楽しみました。


これは上の写真の一番大きいのですが、食い応えのある身の引き締まった立派な真鯖です。
こいつは2枚におろしてとりあえず塩焼きにしましたが、まだ半分残ってますw

3月に行ったときにはI田先生がメバル釣った以外はボウズだったので、今回は何とかリベンジできて良かったです。次はエギングメインで行きたいな~

2012年5月10日木曜日

メモ:gprofの使い方

プログラムの実行時間における各ルーチンの負荷を調べるとき

コンパイル時に-pgをつけるが、Makefileがある場合はその中のCPPFLAGやLDFLAGSのオプションに-pgをつける、こうすれば全てのプログラムのコンパイル時に-pgが適用される。

なお-pgするときには最適化オプション(-O3とか)は削除する。

コンパイルされたプログラムを実行するとgmon.outが吐き出されるので、実行後

$gprof (実行したプログラム名) gmon.out

メモ:yumでOpenMPI入れたとき

そのままだとPATH通ってないので、ホームディレクトリの.bash_profileに

export PATH=$PATH:/usr/lib64/openmpi/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib64/openmpi/lib

を追加する。

2012年5月9日水曜日

minor rivisionもらった

正月に出した論文のrivisionが帰って来ました。

投稿締切直前の一ヶ月くらいでバタバタとデータをとったので、どっかに致命的な欠陥がないか少し心配だったのですが、論旨は概ね受け入れられ、細かい文法を修正すれば掲載して貰えるようです。

和文ですが、査読付きだし、貴重な業績です。ぱっぱと直して1st論文2本目をいただきましょう。

2012年5月7日月曜日

NHモデルでモデル選択が行えるソフト

2月くらいにMBEに出ていた論文です。
著者はUniversité MontpellierでBio++というPaup*に似た万能系統解析ソフトウェアを作っているグループの人たちです。またこの論文に関連して、testnhという名前のプログラムもリリースされています。

論文はこちら↓
http://mbe.oxfordjournals.org/content/early/2012/02/02/molbev.mss059.short

本当はこの論文をセミナーで発表しようかと思いましたが、実物(ソフトウェア)も使いながらじっくりゆっくり読みたいと思ったので、時間の関係上やめました。

さて、Bio++ではBppMLという最尤法用のプログラムが内包されていますが、このBppMLでは「系統樹の任意の枝で置換モデルを変える(breakpointを設定する)」ことが可能です。現状では樹形を固定したパラメータ最適化しかできませんが、使えるモデルは多種多様で、置換モデルのパラメータの値だけでなく、置換モデルそのものを変えることが可能です。

例えば、

・系統樹全体ではLGモデルを使うが、あるクレードではアミノ酸組成のパラメータを独自に変える、またはASRVの形状母数を変える(いわゆるcovarionみたいなもの)、あるいはそれら両方を行う。

・あるクレードではLGを使うが、違うクレードではWAGを使う(パラメータの設定も自由自在)。

などなど。そしてこのようなnon-homogeneousなモデルが、塩基・アミノ酸・コドンそれぞれのデータに対して適用可能です。

ここで、NHモデルを使う際に必要なのは、「どのくらいの数のbreakpointを設定し、系統樹のどのnodeにbreakpointを当てはめれば最適なのか」を判断することです。

nhPhyloBayesなどはMCMCの中でbreakpointの数、分布も最適化していきますが、「クソ遅い上にMCMCが収束するか分かんない」という点においてPhylogenomicsではあまり利便性のあるものではありません。

一方で、樹形探索を行わなくても、数種類の対立仮説樹形を用意した上で様々なNHモデルを試して仮説検定を行うことが出来れば、ある程度現実的な計算時間のもとで解析結果の妥当性を考える手段となりえます。多種多様な生物種から膨大な量の遺伝子配列をとってきて解析に使うPhylogenomicsでは、系統樹の各枝における置換モデルの単一性(すなわち進化プロセスの不変性)を仮定し系統樹の再構築を行うことはかなり危険な行為なんですが、単一性を仮定した置換モデルから出てきた結果について、対立仮説樹形を作り、いくつかのNHモデルを使って検定をすれば、いくらか適切な議論を行うことは可能になるのではないかと思います。

さて、この際重要となるのは、NHモデルも含めたモデル選択を行うことです。上記したように、どのくらいのbreakpointを用意し、どこにそれを当てはめるかというのは当てずっぽうではいけませんし、いわゆるbiologicalな根拠をもとに人間が勝手にbreakpointを設定するのも僕は不適切だと思っています。AICやBICなどの情報量基準をもとに、「単一性を仮定した従来のモデルよりも適切なNHモデル」を判断し、それを使って樹形比較を行うことが大事です。

これまでそのようなことを可能とするプログラムはありませんでしたが、ようやく現実的に使えそうなものが出てきた、というのが今回の論文です。然るに僕としてはかなりゲキアツな論文なわけです、はい。

testnhを使えば、これまでのセミナーでも何回か出てきた、「この系統樹アヤシイけどNHモデル使ったら異なる結果・解釈が導き出されるんじゃね?」という疑問を解決することが現実のものとなるわけです。勿論、これからこの研究室でもどんどん行われるであろう、「生物の大きなクレードを跨いだ広域なタクソンサンプリングに基づく大規模系統解析」において、解析結果の妥当性を評価する有効な手法にもなると思います。

問題は、testnhはBio++と同じ系列のプログラムですから、コマンドがアホみたいに複雑なこと、NHモデルについてはマニュアルに書いていないコマンドも多く自分で色々試行錯誤しないといけないこと、加えてバージョンアップのたびにコマンドの文法が変わる(しかもマニュアルに全部書かない)という鬼畜仕様であること、ってことでしょうかね。Bio++自体がまだv0.6.1でv1.0がリリースされていないというのもあるんですが、当分一般的には用いられんでしょう。それがちょっと残念です。

まあ、v0.6.1については統計数理の論文用データを取るときに大分苦労させられましたので、大体使い方は分かっています。このtestnh、ちょっと使ってみますかねー

2012年5月6日日曜日

天から殺意


今日のお昼頃、自転車で外へ出かけてちょっとしたころ。

何か雷近いし凄い雨が降ってきたので、一時雨宿りをした。

通り雨っぽくてちょっとしたら一旦止んだので、早めに再出発して目的地に向かおうかなーと思案していると、降ってきたのがこれ↓



こんな大きい雹は生まれて初めて見ました。
このあとも雷は連発するし、バケツの水ひっくり返したような大雨が降るしで生きた心地がしませんでした。