2011年5月30日月曜日

相変わらず機嫌の悪いWordさん

なんでWordすぐ死んでしまうん・・・(´・ω・`)

1時間に一回のペースでフリーズしてたら仕事になんねーですよ。

・・・もう眠いや。無駄なストレスが貯まる前に今日は寝ましょう。

2011年5月29日日曜日

ミスった

今日は昼過ぎからCCSの方で仕事をしていた。

家を出るときには雨風もそんなに強くなかったし、激しくなるのは今日未明くらいだろうと予想していたので先ほどまで仕事場に残っていたのだが、いざ帰るときに外に出てみると軽く嵐の状態。

持参してきたビニール傘は出発後ものの数秒で複雑骨折しただのゴミと化したので、結局体はずぶ濡れとなってしまった。

どうせちょっとみなぎった温帯低気圧だろ?とタカをくくり、台風+梅雨前線のコンボを甘く見た結果がKONOZAMAである。

まあ、ここでこんなこと書く前に、早く風呂にはいれ、という話なのですがね・・・

そういえば、小学生とか中学生の時は、日曜日の夜にこのように天候が荒ぶった際には、連絡簿で「明日学校休みやって」という伝言が回ってくるのを心踊らせながら待っていたものだが、そういう感覚ももう懐かしいものになってしまったのだなあ、としみじみ感じた今日この頃である。

とりあえず、明日の午前中は学校にはいけない(気持ち的な意味で)かなあ。

2011年5月28日土曜日

blogger何かヘン

このとこchromeとbologgerとの間で不具合がある。ログインのためのリンクがなく、パスワードボックスが出てくる。ここにパスワードを入れてもログインできない。って、これパスワードを盗むウィルスとかじゃないよな?パス、変えよ。

IE tabをカマせれば通常画面でログインできる。が、今度は画像のアップロードが出来ない。アップロードの完了ボタンをクリックしても何も起こらない。

googleの作ったブラウザとgoogleの提供するサービス間での不具合。これは無いわ。現在自宅のマシンで、Safariを使いこれを書いている。

---

用事があり、大学に来た。大学のオフィスのマシンのchromeでbloggerを見たら、通常画面で普通にログオンできた。オフィスのマシンのchromeは11.0.696.71である。

---

また家に戻ってchromeのバージョンを確認したけど、最新の11.0.696.71である。よくわからん。

特にすごい頻度でブログをアップしているわけではないし、ブログ(やツイッター)で自分の「ブランディング」をしようなんて気はさらさらないし。というわけで、この不具合もそのうち治るでしょ。それまではSafariかFirefox使えばいい。

卒業生訪問

このところ卒業生(うちのラボではないけど)が訪問してくれた。

まず今年度からJAMSTECでポスドクをしているY吹くんが家族で。apricotちゃんかわいい。でもAKBから誘いが来るかは、まだわからないな。


去年度から環境研でポスドク、来る6月からはカナダへ旅立つT郎くんの壮行会が昨日開かれた。


なぜかT郎くんとUkiくんとの初めての共同作業に。目線、ありがとう。T郎くん、ホントの奥さんがカナダにちゃんと来てくれるといいね。

2011年5月26日木曜日

幕張メッセなう

地球惑星科学連合の2011年大会で15分喋るために、バーツクから到着。幕張なんて学生時代分子生物学会できた以来かな。

このトークの準備のため、Ukiくんとkamiさまにはいろいろとお世話(?)になった。サンクス(まだ始ってないけど)。

久しぶりに顔を合わせる人も多い。みんな、会いたかったぜ(笑)!

さて行きますか。前2つのトークの内容で、イントロをちょっと変えようと思う。

2011年5月25日水曜日

動けよぉ・・・

Mac proに入れてるWord 2011が度々フリーズする。バックアップは取っているので一旦アプリを終了してからファイルを復旧することはできるが、申請書なんかでかなり変更を加えた後で凍結されるととても心臓に悪い。

なんとかならんのか。

追記:ああああああまた死んだあああああうぜえええええええええ!!@00:37

2011年5月24日火曜日

いわゆるガチンコである

来年受ける予定のDualDegreeは、情報工学系の学部生同様、編入する大学院の専攻の入試をパスすることでしか合格できない。特別措置はなく、全く同じ入試問題に挑まなければならないわけである。

なので、コンピュータサイエンス専攻の過去問をチェックしてみた。英語はTOEIC,あとは口述試験と筆記試験(数学・情報学)がある。

厄介なのは2分野の筆記試験で、こちらと同様過去問を勉強することである程度対策は打てるだろうが、そもそもの基礎が無ければちょっと捻った問題が出たときに全く対処できない。

また、入試をパスすることだけが目的ではないので、その後も考えれば、情報系の「比較的真面目に勉強してきた」学生と同じくらいの知識が必要となる。

で、肝心の問題はというと、数学では微積、線形代数あたり、情報学ではアルゴリズムの基本構造やグラフ理論なんかが主に出てくるようだ。

一応これらの分野は学部生時代にも生物、情報系、自然系の講義に混じって勉強したが、その後全くと言っていいほど触れてこなかったので、頭からすっぽり抜け落ちている。

最低でも、これらの分野の教科書を一度全部見返すくらいの勉強は必要だろう。

2~3ヶ月は他は休んでこれにマジで取り組む必要がある。

修論とかは夏休みとかに速めに終わらせてた方がいいな・・・

2011年5月23日月曜日

凄い量のAとT

亜ピコの塩基配列を収集中。

AT含量の%の数字では知っていたけど、実際に配列を見てみると
そのぶっ飛び具合に再度驚く。


AAAAAAAAAAAAとかザラ。
なにこれ怖い。シミュレーション配列ですか?
う~ん、果たして塩基で解析が上手く行くことやら・・・
ちなみに、PAL2NALを使えば、解析に使うサイトの選択も含め、
アミノ酸配列のアライメントを参考にコドンアライメントを行うことが
可能らしい。
Clustal形式(.aln)で#でポジションを指定すればいい。

2011年5月22日日曜日

圧倒的じゃないか

自前のデータセットで、1000以上のtaxaでML系統樹を得る必要があったので、初めてFastTreeを使ってみた。

使用したのは1522taxa,256aaの配列データ。64bit UbuntuでLinux用のバイナリとしてあらかじめ用意されたものを使った。オプションはデフォルト。

結果、計算時間は5分弱。・・・は?

最初何かエラーで計算が止まってしまったのかと思った。驚きの速さ。そこらのNJよりも速いんじゃないですか?

これで樹形空間の探索にはNNI+(簡易の)SPRを使ってるわけでしょ。どうやったらそんなに速くなるのだろう・・・?しかもSSE,OpenMP(マルチスレッド)を組み入れてコンパイルしたらもっと速くなる。どんだけ・・・

一応各ノードの支持をSH-aLRTで出力することも可能だが、まあこの速さの分精度の方はかなり犠牲になってるでしょうね。

なんで、PhyMLとかRAxMLで系統樹再構築する時の初期系統樹を、このFastTreeで作るのとかがいいんじゃないでしょうか。

実際、自分のデータはFastTreeで得られた系統樹を使って、現在PhyMLでの解析を行っている。

2011年5月20日金曜日

地球外生命体

系外惑星グリーゼ581dは生命発生の条件を満たす

その論文(Astrophysical Journal Lettersより)

そもそも「生命発生(生存)の条件」ってのは何なんですかねぇ。

要は地球と同じような環境ならば生物いるんじゃね?という考えに基づいているわけですが、それはものすご~く偏った考え方である訳で、「生命発生の条件」なんていうと、まるで地球と似たような環境でしか生物が発生しないみたいに聞こえて違和感を感じます。

パンスペルミア説を考えないならば、地球に生命が既に存在しているという時点で、宇宙のどこかに生命が存在する可能性は否定できませんし、地球に似た環境があるならば、そこに生命が存在する可能性はかなり高いと考えられると思います。

ただ、重要なのは「環境が整ったところに生命が誕生するのではなく、生物がいるところが生命発生に必要な環境である」ということじゃないでしょうか。

なので、我々が地球外生命体のことを語るときにまず考えるべきことは、生命発生の条件ではなく生命の定義だと思います。

まあ、そんなこと言い出すと人によって生き物の定義がまちまちになってしまうし、地球外生命体の「生物の定義」を決めるには、まず「それっぽいもの」を見つけないといけない、という点で既に矛盾が生じちゃうので、上のはただの屁理屈になってしまうんですが。

どのみち、実際に生き物を採ってこないことには地球外生命体の存在は証明できないので、地球の環境に近い環境を持つ惑星を探し、自分たちの常識から考えて生き物っぽいやつを見つけようとするのが、一番現実的だとは思います。(それが全てではないということをいいたかっただけです。)

そう考えると、今回のこの発見はかなり期待の持てる結果なのではないかと思います。しかし、この惑星はむちゃくちゃ遠いところにある(光で20年)ので、実際に生物を発見するのは今の人間の科学力では無理でしょうね・・・

2011年5月19日木曜日

参加記を書く

今日、日本進化学会のニュース(HPで半年に一回ほど公開されている、「藻類」みたいな雑誌です)の編集担当の方からメールをいただきました。

先月行ってきたCoMEについて、ここにも何回か書き込みましたが、それをご覧になったみたいで、進化学会のニュースにも体験記を執筆しないかとのお誘いを受けました。

こういうことは初めてですが、喜んで引き受けさせていただきました。

出典は定かではありませんが(知ったのは便所の落書き)、「賢くなるためには大量の情報のインプットと共に、それらを誰かに対しアウトプットすることが大切である」みたいな言葉がありました。 アウトプットにはこういうエッセイもあれば、論文の執筆やプレゼンもあろうし、このようなブログに記事を投稿することも含まれるでしょう。

僕はまだまだアウトプットするということに慣れていませんので、いい経験になりそうです。
自分の僅かな文章構成力をフル動員し、なるべく読み手に興味をもってもらえるようなおもしろい記事を書こうと思います。

締切りはまだ先みたいですが、記憶が薄れないうちに下書きだけでも終わらせておこう・・・

 しかし、前にも書きましたが、意外といろんな人がここを見てるんですねぇ。ブログもバカにできんものですわ。

2011年5月18日水曜日

SOLiDシステムによる次世代シーケンス

TARAセンターであった講習会に行ってきました。

SOLiDでは、454などのパイロシーケンサの方法とは違い、二塩基を一セットとし、四色の蛍光色素によるカラーリングによって塩基の決定をやるみたいです。リード開始位置をずらして五回反復を行うことで、フラグメントの配列決定を行います。パイロシーケンスよりかなり精度はいいみたいです。

基本的に6レーンでリードをやりますが、何レーン使うか、レーンごとにサンプルを変えるか、1レーンに複数のサンプルを使うかなども勿論設定でき、レーンごとのランの管理も可能みたいです。


ランニングコストの方は、cDNAライブラリを使ったEST解析を想定し、1サンプル(1レーン、1億2000万リードくらい)で15万ほど。454の例しか知らないのでこのリード数が十分かどうか分かりませんが。

意外と安いんですね。これくらいだったら申請書で「3種類くらいESTやるぜ」って書いても大丈夫かな・・・別にゲノム決めるわけでもなし

ISTD!

論文紹介の中で何回かHMMによる配列間の相同性検出の話が出たので、この際だからちゃんと勉強しようと思ってぱぱっと検索してみました。

・・・が、これをすぐ理解しようとするのはさすがに無☆理。配列の相同性検索の話は難しいんですよねぇ。CoMEでもFASTAの作者の話は「わけがわからないよ」状態でした。


とりあえず、HMMERの元論文と、根本となっている理論についての幾つかの資料を見ることにしますか。

といっても、すぐには読めそうになさそうですが。



*児玉清さんが逝去されたとニュースで知りました。享年77歳、そんなにお年だったのか意外に感じてしまいました。アタック25は氏あってこそのものだと思います。お悔みを申し上げます。

自分の知っている有名人がリアルタイムでこの世を去っていくのを実感する年となってしまいました。時間は残酷ですね・・・

2011年5月16日月曜日

一番手

第五回JSEPのプログラムが決定しました。

今年は応募者が少なかったのか、2日間の予定が1日のみとなりました。
そのせいか、参加者を見るにほぼ半分が身内ww楽しそうな学会になりそうです。

しかし、どうせ帰りは夜行バスなので、一日ほど暇になりますね・・・ふふふ


プログラムの中で、自分は一番目に発表します。というか僕らのグループが最初に纏まっていますが。
初っ端なので、強いインパクトを与えたいですね。

みんなでBPAを狙いましょう。Kami様のV3を阻止するためにも(笑)

一応書き上げた

学振DC1の書類をようやく書き終えた。
といっても、まだ第一段階で、これから怒涛の修正を行わなければならないが。

さっそく明日から大ボスと原稿訂正の打ち合わせに入る。初めてのこととはいえ、先行研究を読むうちに自分の知識が足りないのが芋づる式に分かってしまった。所属していた部活動のOB会誌の編集も重なってしまい、原稿を書き上げるのが予定より大分遅れてしまった。

おかげで休日は朝起きてから寝るまでPCの前に座り続ける羽目に。改めて椅子を新調しておいてよかったと思う。

さて、これからは原稿の修正とともに、JSEP,SMBE用のデータを急ピッチで採らなければならない。こんなんで忙しいとか言ったらバチが当たりそうなので、キリキリ馬車馬のように働こうと思います。

2011年5月15日日曜日

それはミミズっていうんじゃないんですか?

カンボジアで眼と脚のないトカゲが発見されたようです。

http://www.nationalgeographic.co.jp/news/news_article.php?file_id=20110513001&expand&source=gnews

世界には、まだまだ(人間から見て)珍妙な生物が沢山います。
毛のあるカエルとか。 キェェェェェェアァァァァァァモフッタァァァァァァァ!!! )

起き抜け一発からこのようなニュースを検索してwktkする自分はやはり生物学の学生です。

まあタイトルは冗談として、行くところまで行っちゃうとこうなるんですね・・・

ただ、地下で生息すると眼が要らなくなるのは分かりますが、脚が要らなくなるのはどうしてだろう。(ソースのコメントより)同じく脚のないヘビは地上でも生息しているというのに・・・

2011年5月14日土曜日

予想外

昨日想定外の事が起こった。

1.靴崩壊

昨日ボスとコーヒーを飲みながら歩いていると、何か歩きにくい。
はて?と思い、後ろを見ると僕の歩いたところに茶色の小さな塊がボロボロと落ちている。
まさか!?と思い、靴の裏を見ると靴底が砕けている。しかも両足とも仲良く。死なばもろともという感じだ。
こんなボロボロの靴を履いて、堂々と食堂を出入りし、ボスと〇タバに入ってコーヒーを飲んだかと思うと少し恥ずかしい。


2.夕立

昨日は少し早めに帰ろうと7時過ぎにラボを出た。
すると少しポツポツと雨が降ってきている。
ちなみに僕は雨男だ。
早めに出て良かったかな、と思いチャリを漕ぎ始めると、漕ぐたびに靴底が砕けて行くのが分かる。
O穂まで来た時「あっ、牛乳とパンねぇや。」という事に気づきカ〇ミへ。
それと同時に「あっ、オレの靴恥ずかしいんやった。」ということにも気づき、一瞬迷う。

しかし牛乳とパンには変えられない。どうせ誰も見てないやろと思いなおし、堂々と入店。

しかし、繰り返すが靴は砕け続けている。
僕の歩いた後ろをまるでウ〇コを垂れ流しているかのように付いてきているのだ。
もちろん雨で少し濡れた状態の小さな茶色の塊が床に落ちているのだ。かなりそれっぽい。

気にしたら負けだ!という強い意志の下、堂々と買い物を終えると外は土砂降り。

つまり傍から見た昨日の夕方1時間の僕は

・30歳前後のおっさんが
・チャリに乗り(バーツクではかなり珍しい。ほとんど皆車)
・雨なのに傘もささず
・ウ〇コをたれ
・ずぶぬれになりながら
・靴底には穴があいて踵が今にも飛び出しそう

という哀れな姿だったということだ。
もし別の靴を選び、スーパーに寄らず、もしくは帰る時間をもう少し早くしたり、もっと言えば傘さえ持っていれば、運命は変わったのだ。
こういう些細な事象の積み重ねが、人の運命を変える。


iPad講習

バーツク大の学術情報センターから、教職員を対象にしたiPadの使用法の講習のお知らせがきた。

わざわざ日本リンゴ社から講師が来て、

☆ iPad の基本機能(本体説明、マルチタッチデバイスの基本操作)
☆ 基本アプリケーションの動作
☆ 日常業務に便利なアプリケーション紹介(PDF の閲覧や手書き入力、PDF のiPad への取り込みなど)

などを教えていただけるらしい。講習の内容自体は特に興味はないが、この講習は教育研究業務でiPadを使用することを前提にしていると理解でき、興味深い。

某掲示板などでは、科研費などでiPadを購入できるか否かの議論がさかんになされていたが、わが大学では購入可能である解釈できるのか?買う買わないはさておき、今度事務のひとに聞いてみよッ。「だめです~」といわれても驚かないゼ。

上原美優さんのご冥福をお祈りします。

大ボスPCセットアップ

何か今朝からずっとブログに書き込みができなかったようですが、やっと回復したようです。(iPadの記事も消えた?)

今日は、大ボスのオフィスに設置するために購入したPC(AMD PhenomeII 1090T 6 cores)のセットアップをした。それまで使っていたWindows PCが最早ガラクタといっても差し支えないほどのレスポンスの悪さで、度々フリーズぶっこいて(´・ω・`)な顔してたから丁度よかったと思う。大ボスの作業効率のアップはすなわち我々学生にも大変な利益となる訳で・・・

ただやったことはWin 7 の初期環境設定(勝手にウザいことしないようにするため)と、幾つかのソフトの導入、あとCygwinのインストール、といった程度のこと。

折角6コアあるんで、系統解析も出来るようにした方がいいだろうということで、Cygwinを入れた。あとはMPI環境入れてRAxMLとMrBayes,PAML,PHYLIP,PhyML,PhyloBayes,PUZZLE,EMBOSS,Modeltest,CONSELくらいを入れときますかね。

そういえば半年くらい前の状態で同じようなことをやったときには、OpenMPIよりMPICH2の方がCygwinと相性が良かったような気がしたが、今はどうだろう。

あと、OpenMPIは1.4.3がpre-releaseで出てますが、やっぱり何時ぞやのver 1.5は問題があったんだろうか?あれ何か新しい機能あったっけか。忘れてしまった。

最後に、遊び心で大ボスのアカウント画像をGiardiaに変えておいた。大ボスはこの生物が一番好きらしい。確かに奇異な形してどことなく怪獣っぽい(例えるならばブ〇ック〇リナか)ので自分も好きだが、自分はそれよりTrypanoplasma borreliとかの方が好きかな。あのウネウネしたベル〇ルクに出てくる化け物みたいな形状が好き。(なので、こいつも含めた生物群の解析について書いてる申請書の内容を書くのが面白かったりする)

2011年5月11日水曜日

海外学振

海外学振に出してみた。
申請書類出すのは3年ぶりだ。
はたしてどうなるやら。

しばらく出したことは忘れていよう(でなきゃ気になってやってられない)。
そして実験に集中しよう。

全部駄目だったりしたら家族はどうなるのだろうか、、、
いやいや、その辺も忘れよう(でなきゃ研究者なんてやってられない)。

2011年5月10日火曜日

エラーバーの解釈

引用元
http://psycnet.apa.org/journals/amp/60/2/170/

初めに注意すべきなのは、エラーバーはあくまで「飾り」ということです。

エラーバーはデータを出す方ではなくデータを見る方のためのものであり、例えばプレゼンの時に、聴衆がサンプル間での実験結果に違いがあるかどうかをわかりやすくするための補助的なものでしかありません。

従って、本当にデータ間に違いがあるかどうかについては単なる「目安」程度の説得力しかないので、あんまりこれに頼りすぎるのは危険です。

バーなんて飾りですよ。偉い人にはそれが(ry

しかし、仮に飾りであったとしても、その持つ意味をちゃんと理解していなければ、データを綺麗に示すことは出来ず、飾りの意味すら為し得ません。

なので、エラーバーをどう解釈するべきかちゃんと理解しましょうね、という類の主張で度々引用されるのが上記の論文です。(転載しませんでしたが、Scholarで検索するとPDFが見られます)

論述されているエラーバーの解釈の前提として、

1、比較される2つのサンプル群が独立である(被験者内要因がない)
2、それぞれの群のサンプル数が10以上である
3、それぞれのエラーバー(この場合95%CI=mean+-2*SE)の長さが大体同じ(2倍以上とかはアウト)

ということが必要です。

色々書いてありますが、自分の中の結論としては、「エラーバーの重なりの部分の合計が2つのバーの平均の長さの半分以下なら5%危険水準で有意差検出」はちょっと危なっかしいので心に留めるだけとして、実際に使うのは「重なってないなら1%危険水準で有意差検出」ですかね・・・

ラベリング

投稿記事にラベルが付けられるようでしたので、2011年からの記事と自分の書いたコンピュータ関連のメモにラベルを付けました。

ラベルを付けると後々記事を見返す時に楽です。

ラベルは

Laboratory : 研究室関連のお知らせ(フォーラム、柳仙会の告知、〇〇さんの近況報告、論文受理など)

Science : 科学全般の話題、面白い論文など

Computer : コンピュータ関連の話

Statistics : 統計関連(系統学関連も含む)

Diary : 学会や遠征下での記録

Others : 未分類。身近な話題からどうでもいいことまで。

としました。基準は適当ですが。

定期的に管理者権限でラベルを整理しますが、投稿の際にラベルの欄に名前を書き込めばラベルが付けられるので、よければ試してみてください。

 それにしても今日は暑いですね。天気予報だと最高気温29℃とか。春はどこ行ったの?

2011年5月8日日曜日

2011年5月7日土曜日

ベイズ解析で尤度による収束判定は可能か?

ベイズ法を使った系統解析ではMr BayesかPhyloByaes(分野によってはPhase)などが多用される。

これらのベイズ系統解析では、収束判定の基準として主にbipartitionsの出現頻度を計算に使った値を使用している。

Mr BayesではASDSF、PhyloBayesでもbpcompを使ってbipartitionsの最大の差を計算して、run(chain)が収束しているかを判断することができる。

また、bipartitionsの出現頻度だけでなく、各runにおける世代ごとの尤度もチェックすることが可能である。

Mr BayesではTracerで尤度のプロットを確認することができ、いずれかのrunが明らかに局所解に捕まっていないかを目で確認することができるし、ESSを計算してサンプル数が十分であるかを判断することもできる。

PhyloBayesではtracecompでdiscrepancyを計算し、ESSと併せて収束を判断する方法もある。またnh-PhyloBayesでは99%信頼区間で2つのchainの収束を判定しているようだ。

ただ、これらの方法は決して「runの収束を検定している」のではない。

もし、これらの方法を使って収束を検定するならば、「各runのburn-in後の総世代のlikelihoodsの平均値に差がない」ことをいう必要がある。しかし、普通の検定では平均値に差がないというのは帰無仮説であり、「帰無仮説が棄却できない」ということは「帰無仮説を採用する」という結論には直には結びつかない、という問題が生じる。

また、Tracerでも各runの尤度の95% HPDI(最高事後密度区間)を比較することは可能だが、これもエラーバーが重なっているかどうかの判定であり、「明らかに差がある」ことは言えるが「明らかに差がない」ことは判断できない。

従って、 上述の方法はあくまで目安であって。ベイズ解析のrunの収束を厳密に判定するものではない。

 とすると、収束判定にはASDSFなどのbipartitionを基準にした値を優先的に使用するのが良いのかというと、それもまた怪しいものだと思う。


大きな疑問として、例えば大規模(taxon数が大規模)なデータセットを解析する場合、ASDSFなどが収束していれば同時にlikelihoodも収束しているとは言えないだろう、というのがある。(トポロジーが収束していてもBLなどのパラメータの推定が収束しているとは限らない)

逆に、ASDSFが0.01以下になっていなくても、(尤度を収束判定として用いる検定法があったとして)尤度は収束しているということも大いにあり得るだろう。

 だとすれば、尤度を使った検定による収束判定方法を考えることは意味のあることだと思うが、簡単に考えても、次の2つの問題をクリアする必要がある。


一つ目は、2つ以上のrunの収束を判定する際の、多重比較によるバイアスを考慮すること。

二つ目は、「平均値に差がない」ことを帰無仮説とするのではなく、薬効の分野などで用いられる「平均値に差がある」ことを帰無仮説とする同等性の検出の導入。

統計学を専攻していたうちの大ボス曰く「すっごい難しいよ」だったので、その言葉通りとても難しいのだろう。

しかし、非常に興味深い問題であると思う。
自分以外に価値があるかどうかは別として、チャレンジしてみたい課題である。

2011年5月6日金曜日

塩基でやってはどうか?

配列組成の不均一性は分子系統樹を再構築する上で最重要な問題の一つですが、この問題を解決し、アーティファクトの誘導を出来るだけ抑えたい場合、塩基配列を使った方がいいのか、アミノ酸配列を使った方がいいのか、ということが、最近疑問になってきています。

Protist関連の系統解析では、超divergentな配列を取り扱うことが多いため、たんぱく質コーディング遺伝子に関してはアミノ酸配列にtranslateしてから解析に用いることが多いです。
置換速度が極めて大きい配列を含む系統解析では、アミノ酸配列を用いた方が塩基配列を用いた時よりも、配列の置換が飽和状態になりにくいということから、LBAの影響を防ぐことが出来るということが先行研究でも言われています。


しかし、置換速度が大きいことに糅てて加えて、配列の組成が非常に偏っている場合には、単純にアミノ酸配列に翻訳するだけでアーティファクトの誘導を防げるかは怪しい所があります。


そこで、そのようなケースにおいては配列組成の不均一性を許容するようなモデルを使って尤度の計算を行うのが解決策の一つとして挙げられますが、このモデルを使用する際に塩基配列を使った方がいいのか、アミノ酸配列を使った方がいいのか、ということに疑問があるのです。

組成の不均一性を許容するモデルを一番実用的なレベルで実装しているソフトウェアならばnh-PhyloBayes(nhpb)でしょうが、アミノ酸配列を使ってnhpbで解析するとなると、以下の問題に悩まされます。


1、解析にもの凄い時間がかかる(計算科学的な問題。nhpbはMT非対応なのでなおさら)
2、解析がいつまで経っても収束しない(MCMCのアルゴリズムの問題?)


この二つの根本的な原因は、アミノ酸配列を用いてCAT+BPモデルを使う場合には、パラメータ数がバカみたいに大きくなってしまうことだと思います。


だったら塩基配列を使えば(収束しやすくなるかどうかは別問題として)時間の短縮は出来るのではないだろうか?というのが現時点での単純な意見。


塩基配列を用いることで、上述のとおり配列の置換が飽和状態に陥りやすくなる危険性もありますが、例えばコドンの3rd positionを削除することなどによってある程度ならその影響を防ぐことが出来るのではないか?
アミノ酸頻度がもの凄く偏っている場合には1st,2nd positionでも塩基組成が偏っていることが見受けられますから、その場合nhpbなどのソフトを使えば、実用的な計算時間で、組成の問題を解決した上で系統樹を得られることが可能かと思います。


その場合、アミノ酸配列を用いた方がいいのか、塩基を用いた方がいいのかを直接に比較することはできませんが、試してみる価値はあるでしょう。


また、nhpbでは塩基配列に対してCAT+F81+BPとGTR+BPの二つのモデルが試せますので、両者の違いをみることも可能。


ということで早速自分のデータで検証してみる。


面倒くさいのはアライメントの用意か。た んぱく質コーディングの遺伝子であるからコドン配列を取ってくるとして、アライメントはアミノ酸のアライメントを参考にするのがいいでしょう。 PAL2NALでも使ってアミノ酸のアライメントを反映させるとして、ポジションの選択は自分でスクリプトを書いてもそこまで苦にはならないと思う。


JSEPまでには間に合わせたいなあ。

2011年5月4日水曜日

椅子新調

金が戻ってくるまでが我慢できませんでした(笑)

CCSのデスクと自宅用の椅子を購入。ランクアップしないと意味がないので、かなりお金はかかりました。

一応、9月くらいまでの大まかな支出を計算した上なので、なんとかなるでしょう。

自宅用のはBauhutteのBriezeを買いました。正直イロモノかなあとは思いましたが、レビュー見てると座り心地も柔らかく、耐久性もありそうだったのと、値段のわりに座部や背部のスライドなど可動域が多かったので購入しました。

組み立てが非常にやりやすかったのが印象的でした。大抵この手のはユーザーフレンドリー(笑)なものが多いんですが、この椅子に関しては随所随所の細かい所で物理的に組み立てやすいようにする工夫がなされていて、好感がもてましたね。

実際の座り心地は一言で言うと「思ったよりいい」。今までになかったタイプなのでまだ慣れませんが、最大角度までロッキングして寝るとハンモックみたいな感じ(ちなみに顔の本で画像うpしたらMKから「拷問器具みたいじゃね?」と言われた)。が、ロッキングを戻したときでも背部が後ろに傾きすぎなのが難点ですかね。通常時には背筋をまっすぐ伸ばした状態で背部に身体が触れるぐらいが丁度いいのですが・・・

CCSのデスク用のは極めて一般的な椅子を買いました(同社のPreciosso)。デスクへはY崎の力を借りて搬入。Y崎ありがとう。下の方お大事に。

CCSのような所はGWと言えど人がそこそこはいるかなと思っていましたが、全然ヒトイナイ。意外でした。

おかけで音に気兼ねすることなく椅子は組み立てられましたが、完成後座ってみたら、最大角度までロッキングしたあと元に戻らなくなるアクシデントが発生。

また不良品かよ!?とイライラしながら試行錯誤したところ、最後に「バキャァッ!」という音とともに元に戻りました。自分は「これで完全に逝ったな」と思いましたけど、その後は正常な動作をするようになりました。大丈夫かな・・・

ともあれこれでデスクの環境は整いました。あんまり拘るものでもないかもしれませんが、この後最長で4年いることを考えれば、スタートはなるべく良い形から入りたいもんです。特に椅子は自分の研究にとってコンピュータの次に大事な資材ですのでw

ちなみに3番目は資料としての本。次に作業用BGM。これだけあったら他はいらないといっても過言じゃない。

痛い

昨日、用があり午前中に実験をして午後から友達と石神井にいた。

夕飯時になり友達と石神井にある有名なラーメン屋「井の庄」にいくこととなった。

友達はすでに来たことがあったので、友達のお勧めで「辛辛魚つけ麺」を注文。
今思えば食券を購入する前の友達の顔の笑みをとくに何も考えず受け流すべきではなかった。
さらに僕以外のお客さんに店員は「辛さはどうしますか?」という問いかけをし、お客さんは「控えめ」「控えめの控えめ」みたいな呪文を口にする。

・・・あれ?何で聞かれないんだ?と思いつつ待つこと数分でつけ麺が登場。

・・・唐辛子の粉末山盛りじゃね?汁赤黒くね?

汁を混ぜると鰹節のいい匂いとともにやばい雰囲気が立ち込める。

友達は平気な顔で同じつけ麺をすすっているので大丈夫だろうと一口すすると鰹節の風味が口に広がるや否や、痛みを伴った。
あとは痛みとの闘い。途中で何度か魚介系のスープの香りを感じたかに見えたがすべて移ろう意識のなかの幻想だった気がする。
何とか完食するも唇の痛みとともに腹痛気味。

友達は平然としている。汗ひとつかいていない。猛者とはこういう人を言うんだろう・・・

そして今実験室にいるのだが、体の入り口に遅れること1日、出口がものすごくいたいです。
普通のつけ麺を食えばおいしい時間を楽しめたに違いない。

麺処井の庄

2011年5月2日月曜日

省エネ

今日はラボメンバーで冷蔵庫の整理をした。
消費電力を極力抑えるためである。

第一弾として、今日は4つある実験試薬保管用冷蔵庫を2つにした。
2つは空にして電源を落とす。

最初は「半分になんてできるかい」と思っていたが、断捨離の精神でまとめたり捨てたりするとアラ不思議。
雑然と詰まっていた4つの冷蔵庫が2つに。
結局、今春購入した新品の冷蔵庫は出番を待つ身となった。

ゴールデンウィーク明けにはディープフリーザーや蛍光灯の整理をする。電力25%カットの目標まで地道に無駄を削って行こう。

2011年5月1日日曜日

旅立ち


学生時代の後輩であるM君(Mっちゃんではない)がアメリカへと旅立った。かなり都会の大学のようでバーツクとは基本景色が違う。田んぼや畑が一切ないのである。右がそうです。

彼はここで3年間生化学の修業を行う。今はラボ間のローカルルールの違いになれるために少々戸惑っているようだが、彼は優秀なのですぐに新しいラボでも先頭に立ってやっていくだろう。

と、ほのぼのとした先輩目線で書いているが内心はうれしい半面正直悔しい。
何故なら僕はまだ海外修業を経験していない。彼がさらにでっかくなって帰ってくる、彼の所に遊びに行く、将来起こるかもしれないことを色々考えると楽しくなるのだが。
やっぱりその半面、数年後彼が帰ってきたとき、僕がどこにいるのかさっぱりわからないが、せめて彼とまともに挨拶できるように「必死」でやって行こうと改めて思った次第だ。

さらに嬉しい報告も付いてきた。結婚することが決まったらしい。彼の嫁さんにはあったことがないので、上の写真を送ってくるのではなく、嫁さんの写真を添付してほしかった。末永くお幸せに。

それはそうと、このブログに登場する人物には「M」が多い。
うちのラボのMっちゃん、カナダのMちゃん、アメリカのM君(今回の主役)、、、そして彼らは皆SかMかと言えばMである。どうでもよいが。

Ubuntu 11.04

半年ごとのメジャーアップデートがリリースされたみたいなので、早速導入。

GNOME3はデフォルトでも導入されていないし、今のところする気もない。従来のインターフェースが十分気に入ってるし、他のディストロも歩調を合わせてきたら変えようか、というところ。

けど、アップデート直後ではデスクトップの外観がかなり変わってしまった。

今まであった、デスクトップ上部のパネルがなくなってしまい、代わりに画面左端にMacのドックのようなものが現れた。システムの設定等は電源管理のアイコンのところに収納されてしまった様だ。

はっきり言ってこれはいらない変化だった。
一番嫌なのは、ファイルをドラッグ&ドロップでアプリに直接読み込ませることが出来なくなってしまったこと。(Seaview,TreeviewXなんかはダメだった).phyや.treなんかをドラッグしても、「これはテキストエディタしか開けんですよー」みたいに拒否される。


まだ旧式の方に戻すやり方が分からないので、とりあえずはJalview,Dendroscopeを入れ、PATH追加してコマンドラインから起動出来るようにした。このやり方でも楽っちゃ楽だが・・・

JalviewとDendroscopeは少し使ってみたが、やはり結構使い勝手がいい。Jalviewは配列単位での追加、削除がseaviewよりも 楽に出来るし、Dendroscopeはイラレとの相性もいい。この二つは配列エディタ、系統樹描画ソフトとしては「何でも出来る系」だが、使い方にそこまでクセがあるようでもないので、こういうタイプのソフトによくある極厚なマニュアルを熟読しなくてもある程度は使えるんじゃないだろうか。


あと、OpenOfficeはLibreOfficeと名を変えていました。OOoがOracleの傘下に入って一時は有料になるかと心配しましたが、これからもほぼ同じ開発メンバーで無償版のLibreを作りつづけるみたいで安心しました。やっぱこういうのは無料のオープンソースじゃないとねぇ。