2011年7月31日日曜日

SMBE後記〜神戸入り

7/25~7/31まであったSMBEが終わりました。

学会の内容については、残念ながら自分の興味が引かれるような発表は少なかった気がします。方法論も少なかったし。まあ英語が分からないというのもあるんですけど・・・
(しかし海外でやったらまた変わるのかなあ。それか方法論ならばやっぱSyst. Biol.のEvolutionとかに行った方がいいのか。)

とりあえず今回の学会では、口頭発表よりはポスター発表の方が自分にとっては面白いものが多くありました。自分のポスターの隣にあったアピコ関連の奴とか(WMグループのポスターは自分のやっていることに近い分野でもあってどれも興味深かったです)、ニュージーランドから来たA.Drummondラボの学生であるCHWのベイズ法でモデル選択やるやつとか。あんま深くはイメージはしてないですが、ベイズ法を使ったモデル選択はBreak Pointやrootの位置などを最適化しなければならないNHモデルなども含めたモデル選択に使えるんじゃないかと思っています。

一方で自分のポスターには殆ど人が来てくれませんでした。残念ですが、これからもっとセクシーなデータを取り、ポスターの作り方を工夫して、また次の学会でリベンジしたいです。


しかし、発表内容云々はともかく、今回の学会でも多くの人と会い、試行錯誤しながらも色々コミュニケーションを取ることが出来ました。WTACで知り合った友達と再会し、彼らの友人達も飲み屋に連れて行ったりもしたし、ニュージーランドのPhylogeneticsの研究グループのこととか話を聞きたかったJLや、ダルハウジーのRBやDPとも飲みに行き、バイオインフォマティックスの話題などを交えて楽しい時間を過ごすことが出来ました。(魚民で深夜まで飲んでたときにはトイレの話とか何か変な方向に進んでいましたが)


こういう風に他の国から来た全然知らない研究者や学生と積極的にコンタクトを取り、「飲みに行こうぜっ」という感じで纏まり、真面目な話からどうでもいい話まで酒を交えて話すことこそが、国際学会とかトレーニングコースとかの一番の醍醐味だし、自分にとっても大事なことだと思います。そうでならなくてはならないと堅苦しく考えているわけではないですが。


また、学会以外では、修学旅行や前期入試では行けなかった場所を訪ね、京都を満喫することが出来ました。特にラーメンを。開催場所の観光を楽しむのも学会の醍醐味ですね。特にラーメンを(大事なことなので2回ry)。

天一総本店には31日に行きました。やっぱつくばの粉っぽい天一支店とは全然味や食感が異なりました。偶然隣り合わせた常連のおっちゃんにも「味噌入れると味が変わるで」と教えて貰い、一度で二度味わえる天一の味を堪能することが出来ました。一緒に行ったCHWも「凄い美味しい」といってスープまで飲み干してました。ちなみに彼女はラーメンを食べたのがこれが初めてだったそうです。かなりバイアスのかかったスタートですね。。。

所謂京都拉麺も(チェーン店ですが)違う店にも行き、たらふく喰らい尽くしました。これで京都に悔いは無し。そういえば今日のお昼は一風堂に行きましたが、ちょっと味が違いましたね。やっぱ天神の本店行かなきゃダメです。それに福岡に行けば、一風堂よりも旨いラーメン屋は山ほどありますので、いつか学会が福岡で開かれることを切に願います。


食べ物以外でも、今回は僕が今年前厄らしいので、そのお祓いのため京都の五社巡り(平安神宮、賀茂別雷神社、松尾大社、八坂神社、城南宮)をしました。中心の平安神宮から始まり、「北に玄武、東に青龍、西に白虎、南に朱雀」の文言の順番に回りました(というか結果的にそうなりました)。東西南北のかなり端っこにそれぞれが位置しているので、全部回るのに2日かかりました。努力の甲斐もあり朱印を集めることができましたが、なんかスタンプラリーみたいでしたね。とりあえず、これが厄除けになりますよう・・・

あとは、京都駅周辺でガメラ3巡りですかね。これについてはまた後で書こう。


さて、MEMグループも筑波に帰る人は帰り、違う場所へ行く人も散り散りになった訳ですが、僕は今、神戸理研である並列計算のサマーセミナーに引き続き参加するために神戸のポートアイランドにいます。

他の所を観光する時間がなかったのでまっすぐここに来たわけですが、見事にな〜んにもありません。コンビニが一件と、飲み屋が二軒。あとはホテルやマンション也。悪い意味で閑静な住宅街そのもの。筑波で言えば竹園あたりでしょうか。でも柳仙みたいな居酒屋もなければラーメン屋もありません。これはもう物理的にも精神的にもハメなど外す余地がないことは確定的に明らか。


なので、あと5日間は至極真面目にCSの勉強に集中することになりそうです。まあいいことです。

2011年7月29日金曜日

グロッキー

将月の二次会が終わり、まだ飲み足りないというJLやRBやDP達と共に魚民へ。

その三次会が今終わった。

やはり外人のタフネスは僕らとは根本的に違うようだ。

とても疲れた・・・


明日は何時出発なのだろうか。あまり起きられる気がしない・・・

2011年7月28日木曜日

おけいはん

京大からの帰り、出町柳から三条まで京阪に乗ってきた。

その電車内は京阪電鉄のイメージキャラクターである「おけいはん」だらけだったわけだが、惚れた。超可愛いと思う(嫁の次に)。

これまで、おかあさんといっしょのうたのたくみおねえさんカワイイよね?と賛同を得ようとしてきたが、まるで手応えがなかった。おけいはんもダメなんだろうか。

おけいはんのプロフィール等はこちら↓

2011年7月26日火曜日

SMBE一日目

一日目はregistrationとreception。

5時くらいまでは自由行動で、京都観光に繰り出す組とホテルで仕事orまったり組に分かれました。

wellcome receptionの前にはkami様いきつけの居酒屋へ。マトリョーシカのお祝いを兼ねてMEMグループだけで前祝い。ハモの天ぷらと(大ボスをべろべろにしたという)ハーフ&ハーフが美味しかったです。


今回のSMBEでは、事前にTMEのラボのPDであるTWから連絡を受けていたこともあり、WTACで会った友達の何人かに会えるだろうと楽しみにしていました。そしてwellcome receptionでは、3人に会えることが出来ました。

まあここは日本で、僕は日本人なので、当然のことながらreceptionの後は「夕食連れてって」の流れに。それも全然知らない初対面のグループもjointして14人とそこそこの大所帯。


僕は京都のことは全然詳しくないので、頼みの綱でreception前に行った居酒屋へ案内しました。運良く座敷も空いており、飛び入りながら(本当は当日予約のいる)飲み放題料理込みの3,500円コースを用意していただきました。こちらの我が侭を聞いていただき、頭の下がる思いでした。kami様パワーに感謝。外人さん達には結果的に満足して貰ったようで、良かったです。

ISEPの経験を踏まえ、会計をしっかり徴収し、カラ○ケのカの字など微塵も発しないまま無事終了。僕の他に2人日本人の方もいたので、英語がカスカスな自分でも何とかなりました。


さて、明日からはSMBEの本編が始まります。自分の一番興味があるのが、明日の午前中の系統学の方法論のセッション。一番集中すべきセッションが一番最初にあるのは暁光か。

ポスター発表も頑張ります。

マトリョーシカ万世!

M-たんのラスクを食べ損ねた、新幹線中のいながいYです。

7月25日付で、新学術領域に申請していた我々の課題「マトリョーシカ型進化原理」(代表・KKKのN崎先生)が採択されました!

我々の前にはやまがそびえている。これから5年弱をかけ、この山のてっぺんに登るぜ。みんなのチカラをオラとハッシーに!今後ともよろしくお願いします。

Nostalgicその後

1日目のレポートはkami様がしてくれたので、kami様が書き忘れた所と、その後をレポートします。

新幹線では、チームパンダ(壊し屋、M-たん、Euki)が早めに並んでくれたおかげで6人席を確保できて修学旅行のように京都までの道のりを楽しむ事が出来ました。
M-たんが、手作りラスクを作ってきてくれて、みんなでおいしくいただきました☆M-たんの双子の妹、C-たんも一緒に作ってくれたそうです。M-たん、C-たんありがとう!!M-たんの女子力UPです。

そんなこんなで京都到着後は↓のKami様ブログを参照。
最近、うちのラボメンバーはだんだんとM-たnize(M-たん化)されてきてるわけですが、ここにきてGTをM-たnizeしよう作戦が実行されてます。僕は彼の事を信じているので、帰国までにはM-たnizeされるでしょう。
ただ、「JMAにもやってもらう~」とM-たんびっくり発言も飛び出したので、それを実行出来れば彼女は神です。

JAM&GT接待が終わり、歩いて15分ぐらいのホテルに到着したのですが、時計を見るとまだ10時前。
なので、いざ2次会へ!ここで、small-ゆうきとKami様はドロップしたので、4人で街に繰り出しました。

会場は、暇人御用達のラウンド1。実は、ここはお好み焼き屋の隣だったのです・・・
知ってたけど、黙ってみんなを誘導しました。またホテルから15分ほど歩いてラウンド1のカラオケへ。
ラウンド1では、みんなでプリクラを撮り、ドライブゲームをし、カラオケを楽しみました。

Eukiと僕はよく一緒にカラオケに行くんですが、壊し屋&M-たんとは初カラオケです。
M-たんは想像通りの可愛さだったので割愛します。

ここにきて壊し屋がカラオケで壊れるさまを目の当たりにしました。
なんていいキャラ持ってるんだ!?!?!今まで一緒に行ったことなかったのが、ものすごいもったいなく思えてきた。壊し屋の特撮主題歌メドレーが繰り広げられました。テンションアゲアゲ↑↑
ただ、もってけセーラー服を歌ってくれれば完璧だったのに。
いつもはテンションの低い壊し屋は、テンションが上がるとものすごく面白くなります。
ボーリングとカラオケどっちがいい?と聞いた時も、「カラオケ!」と即答し、自己主張したのも壊し屋だった。やっぱり、就職が決まると人って自信が付くものなんだ。

壊し屋の内定が出れば、内定祝いでまたカラオケに行こう!!

おまけ:UFOキャッチャーに食いつく壊し屋。

Nostalgic

昨日はJMAとGTの接待。
そして今日もRegitrationまでの時間は接待のつもりだった。

先週、ポスターチェックの空き時間を利用して練りに練った接待計画(構想期間5分)。

そしてその計画はランチ中のGTの一言によって、もろくも崩れ去った。
「JMAは明日は仕事だよ。あれっ、言ってなかったね。」

・・・とりあえず、ランチに「100年の歴史を持つ」ハンバーグを戴き、デザートには抹茶 or 黒蜜のかき氷。M-たんは白玉パフェを頼んでいた。(「壊し屋」とM-たん以外誰も完食できず)。JMAに教えてもらったのだが、かき氷などを食べて頭が痛くなることを「ice cream headache」というらしい。
どの店も5年以上ぶりである。京都市街を歩かなくなってから、ずいぶんたつな~。

当初の予定では、昨日は京都駅と祇園周辺を紹介し、今日は金閣寺方面を見せるつもりだった。
が、単に予定を一日削るだけでは金閣寺というhigh impactな光景を見せられない。。。

と、いうことで急きょ祇園を諦め、一同市バスに乗り込んだ。
なんとか閉まる30分前に到着し、Golden templeを見せることができた。しかし金閣寺を見せたいと言っていたのはGTなので、JMAというよりはむしろGTの願望をかなえた場面と言える。

夕食はお好み焼き。行ったお店はけっこうな店舗数のチェーン店だが、僕が学生だった頃はK大付近の小さい店舗でやっていた。そのころから繁盛していたが、事業の成長ぶりに驚いた。味はかわらずおいしく、そして懐かしかった。

今日からはボスも到着し、全員集合。
いざ、SMBE。

ちなみにGTは、本日、マンガ喫茶等で「失われた時間」を取り戻すらしい。

2011年7月25日月曜日

「京都です」

京都に来たら真っ先に浮かぶのがこの台詞です。

元ネタはk松崎さんなら分かるでしょう。

しかも季節は夏、(台風とはかち合いませんでしたが)タイミングもバッチリ。

あとは京都駅で「ここにイ○スが入ったのかー」とか京都タワーで「ここにゴ○ラの熱戦が」とかやりたかったけど、時間がなかったので31日にとっておきます。

まああとは前期入試の苦い思い出が蘇ることかな。今思えばあの時の2点の違いで僕の人生は大きく分岐したと思っています。


・・・と、ここに書き込んでいる僕は他のメンバーから遅れての京都入りです。
今日はCCSでGPGPUプログラミングの講習会があったのでそれに参加したからです。

講義はかなり初歩的な物で、GPGPUの基本的な概念やCCのバージョンの違い、計算処理の仕方やAXPYを例にしたCUDAプログラムの実装方法について簡単な紹介がありました。

思ってたより実装自体は簡単そうですが、実際にはスレッドの数やSM単位での分け方、メモリバンド幅とスレッドごとの計算の容量のバランスなどをこと細かに考慮しなければいけないので、やってみるとやはり難しいんじゃないかと思います。

今後もこの講習会は発展的な内容に近づいていく形で続くようですので、積極的に参加したいと思います。

さて、おなかが減ったので何処かに食べに行こうかな。ホントは前日入りで僕も盛り上がりたいところですが、自分の論文を早く仕上げたいので、今日はそこそこにしてお仕事を頑張ります。まあこれから長いですしね。

京都拉麺でも食いに行くか。

Kyoto!!!

みな無事につきました!!

とりあえず暑い!!!

東洋亭のハンバーグは美味でした!!!!

明日からSMBE!!!!

がんばるぞー!!!!

フレッシュな感じを演出してみました。

2011年7月24日日曜日

準備完了!

ポスターも完成。
ちなみに今日刷ったのは「壊し屋」のポスター。

植え継も完了。頼む、2週間生き延びてくれ。

荷物も詰め終わり。

新聞も止めた。

生協も止めた。

風呂の排水溝掃除もした。

シンク磨きも終わり。

ゴミも(まだ前日だが)出した。

よし、学会へ向けた準備完了!!!



あっ、おやつ買ってない。。。M-たんに怒られる。

耐えがたきを耐え

、、、心が折れた。
マジでもう無理だ。
耐えられない。。。


と、一人明後日からの準備にいそしむのでした。
ところでおやつは300円まででしたっけ?
バナナはおやつじゃないんですよね?
飲み物はお茶以外にもありですか?





ちなみに準備に耐えられないわけではないです。

2011年7月23日土曜日

27時間テレビ

もうこんな時期になってたんですね。
最近いつの間にやら季節が流れて行って、桜が咲いたとおもったら梅雨が明けて、もう夏です。

気付けば7月も後半戦です。
以前ならビーチでライフセービングに精を出していたんですが。
実験室という異空間にいるとなんだか季節感が狂います。
季節感を感じるには学会で外に出るときに感じるしかない!!!

ということで京都の学会がもう3日後に迫って参りました・・・
7年ぶりの京都。中学の修学旅行と高校の修学旅行で同じ旅館に泊まったことが良い思い出。


とはいえポスター・・・頑張らなくては・・・

金盥ってマジで痛そうだ・・・

PSキノコの歌っていうとホクトの方が思い出されて当初戸惑っておりました

リミットを超えた

私の就寝時間のタイムリミットは午前3時半です。

これを超えちゃうと、床についても眩暈がぐわんぐわんして吐きそうになり、「俺死ぬんじゃね」という恐怖と戦うことになり、結局6時くらいまで眠れません。

そして今日は、今、SMBEのポスターが出来上がりました。

もう少し早く仕上げるはずが、図に一度まとめてみたデータがあまりにもクソッタレだったので、解析方法を根本的に変えて再度データを取り直すという愚行を犯しました。

学会前にやることじゃねぇなあ。。。

でも、こういう風にやる気があれば短時間でデータを取り直すことが実際に出来るというのも、ドライの利点だし魅力だと思います。(まあデメリットになることもありますが)。

さて、とりあえず今日はもう寝ます。寝られるか知らんけど。

2011年7月22日金曜日

もうすぐ学会。

怒涛の学会準備が終了!!!と言っても、僕自身は特に何もなかったんですが。
キッズ達も、準備バッチリなとこでしょう☆あ、まだ準備が十分でないメンバーはそれに集中して、学会を楽しめるようにしておくこと。
後は、無事に京都について、発表を楽しみ、講演を聞いて勉強し、無事に筑波に帰ってくるだけです。
そして、少しのお酒とw

僕とkamiさんは、地元なのであんまり京都に行くことに興味を示してませんが、京都めっちゃいい所ですよ!

さっきニュースを見てたら、ランチを食べようと計画してた老舗のすき焼き屋がテレビに出てた。
「セシウムの検出された牛が京都に出荷されてました」って・・・・
おもいっきり、三○亭って書いた提灯見えたしな。
営業大丈夫かな。あそこのお肉はほんとにおいしいから、ぜひみんなで食べたいです!

あ、後の準備は、M-たんが「旅のしおり」を作ってきてくれることかな。
おやつは300円までです!!バナナはおやつに入りません!この会話をオフィスで何人がしたことかw
新幹線の中では、みんなでUNOとババ抜きします。駅弁を食べながら、軽くビールを。おやつを食べながら話をして。
そして、京都での夜は、みんなでまくら投げでもしようか。「誰が好きなん!?せーので言おう!」とか話しながらwそしてお決まりの、夜更かししてるのを先生に見つかって廊下で正座・・・ボスの逆鱗に触れないようにしなければ・・・
今日は、こんな話ばっかりしてた気がする。
M-たんの加入により、学会が修学旅行のようになりそうです☆

キッズ達は、2回目の国際学会ですが、楽しんでくれることをお兄さん達は祈ってます。

そんな感じで、チーム青集は、SMBEに参戦すべく来週から京都入りします!
そして、京都タワーでオワターをする。

最近、ラボメンバーこんなにみんな仲良しでいいのかと思うw

おか〇さんと△っしょ

なぜかラボで最近はやりだした名曲。
M-たんはよくMっちゃんと一緒に歌っている。
しかも一部だけ(笑)覚えきれていないらしい。

そしてその歌を周りに教えようとするのだが、

・イマイチ覚えきれていない
・伝言ゲームのように伝わって行く

という二つの理由から少しずつ音程が変わっていき、誰かは少し違う音程で歌っていた。
せめて歌詞だけでも覚えてもらえるように下にコピペしておきます。

ただしY崎はまずポスターセッションの練習をしておくこと。






「ドコノコノキノコ」
作詞:もりちよこ 作曲:ザッハトルテ

(きのこのささやき) サルノコシカケキツネノチャブクロ マツタケシイタケアリッタケ~
ドコノコノキノコ コノキノコドコノ ドコノコノキノコ モリノキノコ  
もりの きのこは らっぱに なって おんぷが くもまで とんでった 
ぷっぷる ぱぱ~ ぷるぱっぱ~ ぷっぷる ぱぱ~ ぷるぱっぱ~ 
そらには ないしょの はなしだよ (ンダダ ンダ~)  
ドコノコノキノコ コノキノコドコノ ドコノコノキノコ ソラノキノコ  
そらの きのこは らっかさんに なって あおい なみまに まいおりた 
するする らら~ するらっら~ するする らら~ するらっら~ 
うみには ないしょの はなしだよ (ンダダ ンダ~)  
ドコノコノキノコ コノキノコドコノ ドコノコノキノコ ウミノキノコ  
うみの きのこは くらげに なって みどりの もりの ゆめをみた 
ゆらゆら るる~ ゆらるっる~ ゆらゆら るる~ ゆらるっる~ 
だれにも ないしょの はなしだよ (ンダダ ンダ~)  
ドコノコノキノコ コノキノコドコノ ドコノコノキノコ モリノキノコ 
ドコノコノキノコ コノキノコドコノ ドコノコノキノコ ソラノキノコ 
ドコノコノキノコ コノキノコドコノ ドコノコノキノコ ウミノキノコ 
ドコノコノキノコ コノキノコドコノ ドコノコノキノコ キノコキノコ 
かみさまだけが しってるよ (ホイ!)

訃報

俳優の原田芳雄さんが19日にお亡くなりになったと知りました。ここに追悼の意を表します。

自分の大好きな俳優の一人であったので、とても残念でなりません。

同氏の圧倒的な存在感は近年においても衰えることはなく、むしろその円熟した演技でこれからもまだまだ邦画界においてご活躍されるものと思っていましたが・・・


「砂の器」の本浦千代吉の演技なんか凄かったな。

密かに古畑任三郎で犯人役やってくれないかな、とも望んでいましたが、それも永遠に叶わなくなりました。

しかし、2008年に逝去された緒形拳さんをはじめ、自分の好きな役者さんが亡くなられていくという経験が多くなってきました。さびしいものです。

安藤梢選手が来学するよ!

なでしこジャパンの安藤梢選手がバーツク大にきて、WC優勝報告会をします。


初めて知ったけど、体専の学生なんだね。

女子サッカーワールドカップ優勝報告会

 日時:平成23722日(金)1800分~

 場所:大学会館前広場(嘉納治五郎先生像前) ※荒天時は、大学会館講堂ホワイエ


2011年7月21日木曜日

セフセフ

とりあえず何とかなったが、データの取り直しでは挙動がおかしいままだった。

なので、まずスクリプトの中からおかしくなる部分だけ分離(5つほど同じようなルーチンがあってその中で最初のだけがバグった。これも意味不明)

さらにカウンタの変数をそのままfor文内部のif文の条件として引用していたので、カウンタ変数を新たに別の変数に代入して、その変数を参照するようにした。

あとはif文の条件に~~~ =! ***とか使わない表現を変えるとか。

正直何が有効だったのかはよくわからん。どれか一つだけ直してもダメだったので、組み合わせだろう。

とにかくデータは纏められた。

今度からはこういうことも気にしながらコード書かないとなあ・・・

謎のバグ

スクリプトのテスト中にPerlがいきなりバグった。

for文で回すカウンタが正常に回らなくなった。

具体的には0,1,2,3...と増えていく数字が2のところで代入される値がnullになってそれ以降回らない。

スクリプトを変えたわけでもなし、それまでちゃんと走っていたのにいきなりバグった。

原因としては最終的に結果を出力するディレクトリを、それまでテストごとにいちいち消していたのを消し忘れたことしか考えられないが、なんでこれがこのバグに結びつくのかが全く分からない。

別の簡単なスクリプトを作ってその中でfor文を回してもそんなバグは起こらない。
for文の中で既存のディレクトリに入り、あるデータを取ってくるようなルーチンを入れるとバグる。でもデータの方がおかしくなっていることは確認されない。なんじゃこりゃ。

OSを再起動しようが全く改善せず。

これが解決されないとデータを纏めることが出来ず、ひじょーに不味い状況になる。

とりあえず、現在元データの方を取り直している。これでもバグったらお手上げだから、なんとかなって欲しい。


なんでこの忙しいときに・・・クソッ!

ありえない未来

U-ki. Yの発表原稿から

"we found some unusual futures in......"
featureのつもりだったようです。チェックしているkamiさんが突然笑い出してたよ。
ありえない未来って何やねん。
まぁ彼の頭の中では自動変換されるだろうから、問題ないかもしれないけど。
肥沃な膜に続いてU-ki. Yから今年度の流行語大賞へ二本目のノミネート。


明日の夜(もう今日だけど)からSMBE直前まで式根島に逃亡予定。フェリーが台風で欠航にならないといいなぁ。

2011年7月20日水曜日

戻した

やっぱり前の方が良かったので。

あとBlogger in Draftの設定でスマートフォンにも対応させました。

iPodとかでも、モバイル専用ページが見られます。

昨晩は

komatsuzakiくんのお祝いで柳仙会。参加者はいつも通り。学類3年のM原さんも参加した。

いつものようにむしむしを含むKKKガールズ、M上、ウズベン組、M-たんが騒いでいたのだが、むしむしは彼氏の写メを晒されていた。むしむしのガラケーがボス(皆の言う大ボス)のところにも回ってきたのだが、さすがといえる行動を目撃した。

ボスは最近まで携帯を持ったことがなく、震災後初めて持ったのがiPhone4で、ガラケーを使ったことがない。Gメールとかカレンダーとかしか使わず、最近までiPhoneにかかってきた電話の取り方も分からなかったツワモノである。

そんなボスは、むし彼の写メを拡大しようとガラケーの液晶をピンチアウト… 「一周遅れで携帯端末の先端を走る男は一味違う」と、衝撃を受けた光景だった。


そういえば、KKKガールズが中心となり「女子寄生虫会」なる女子会を企画しているという。JK会って言いたいらしい。近々「顔の本」でイベントとしてアナウンスするとか。


なにはともあれ、むしむし、今日のprogress meetingがんばれ。

2011年7月19日火曜日

はじめまして

皆さん、M−たんです。
新しくメンバーに入れてもらいました☆
よろしくお願いします♪

雨とTシャツと私


本日2度目のシャワー。
しかも天然水。
つまり雨。

ところにより(泥の)天然ミネラルまで配合。

運命を共にしたTシャツはこんな感じ←に干されている。
今僕がどんな姿でラボにいるか想像がつくだろうか?
心臓の弱い方はD308左を決して覗いてはなりません。。。









ロゴ改訂

ポスター作成の現実逃避で作ってみた。

全体的に赤っぽい気はする。系統樹のところを他の色に変えてもいいかもしれないが、このままでもいいかという感じもするのでとりあえず保留。

あとは、ブログのページのデザインとの兼ね合いで背景の白地が目立ってしまい、左右のバランスが少し変なのも気になる。

大体こういうロゴって完成した時に微妙な感じが否めないんですよね。根本的なところでセンスが足りないせいか。

画像サイズは横330、縦237です。ImageWellでサイズ変更。

ちなみに、桐の葉が赤いのは一つにはNE●Vのあれを真似しようとした名残なのと、もうひとつ個人的な理由からです。全体の形からなんとなく分かるかもしれませんが。

2011年7月15日金曜日

あぁ、、、、

なんか横で気配がすると思ったら、---ぐらいの大きさの虫がいた。
幸い、苦手なフォルムじゃなかったから、逃走まではしなかったけど。

昨日の現在逃走中のカブト♀はどこに行ったのだろうか??
無事に野外で元気してくれればいいけど。

ってこれ書いてる間に、---ぐらいの虫が足元に・・・だから、つくばの夏って嫌だ。
めっちゃ虫多いんやで!?!?

そんなことはどうでもいいんだけど、U-kiお疲れ!!
昨日、おもしろいデータも出たとスカイプ会議で聞いたので、お兄さん学会後に話できるの楽しみにしています。

そんな君にこれを送ろう。
ファイトーーーイッパーーーツ!!!!
落とし所は・・・ごめん、これを載せたかっただけ・・・

2011年7月14日木曜日

腹減り

最近朝早くにきて夜遅くまでいる。

なんでかって?家ですることがないからです(笑)

SMBEのためにポスターを書いていると大抵気付いたら20時を過ぎるという事態に。
今日はkami様とTak様が直してくださったポスターをもう一度自分の手で直してたら、23時に!!

夕飯も食べていない…

落とし所がないですが、自分的には23時までいたという事実に驚いて日記をかきました。

支離滅裂終わり!

絶望した

先ほどから計算するに1セットのデータの解析にフルコアで1時間。

総データ数は850個程度。

日数にしておよそ35日。

ヽ(´ー`)ノ


こんなんPCでやったら、ぶっ壊れる可能性もある。最近自分のPCすぐ熱くなるし。


まあどう考えてもSMBEには間に合わないから、データを削るしかないね。

でもね、、、in lab

一匹、、、

二匹、、、

三匹、、、


あぁ、やっぱり一匹足りない、、、



朝からラボの男ども3人は女(カブトムシ♀)に振り回されるのでした。
結局オフィスの大掃除。

確保

夜、諦めて寝ようとしたら彼女(カブトムシ♀)がガサゴソでてきた。
無事回収。

ラボでも箱と袋を突き破って逃走したらしい。
カブトムシ、恐るべし。

ボスの家で逃げ出さないことを願うばかり。

君に捧ぐ歌=アンサーソング= feat. TAK

君のことを さがしてる

ずっとさがしてる

机の下も、椅子の裏も、エアコンのあたりも

みつけた、君をみつけたよ

かわいらしく床に横たわる姿を

ひっしにしがみつくきみのすがたも

(きもちわるい~:コーラスbyTAK)


とりあえず昆虫王者-逃走編-は犯人確保(2名)のすえ投獄(血帯微多)にて一件落着。
オフィスにHey!和がもどりました。

君に捧ぐ歌パート2

って、下のKamiさんの日記を模して書こうかと思いましたがそんな余裕はありません。

えっと・・・・オフィスのカブト君が逃げ出しています・・・・

朝来たら、僕の椅子の下に仰向けで倒れてました。
あぁ、死んじゃったんだ。と思いつつ僕はオフィスの隅にパソコンを移動し、離れて仕事してました。

そうです。極度の虫嫌いなんです。というかめちゃくちゃ怖いです。
高い所と虫は、ほんとにダメなんです。
学部生時代、僕のロッカーにバッタの入った箱をいたずらで置いた、親友A。それ以降、3か月僕と口を聞くことが無かったという。

そして、小一時間経ったさっき。
「ガサゴソ」と音が・・・カブト君♂が悶えてます。
文字通り虫の息。

Kamiさんの置いた箱の中には、♂1匹、♀2匹。箱の中には、カブトムシの重さは感じるものの、1匹か2匹かは解像度が無く判別できない。
すなわち、最悪の事態を想像すると、♀1匹がオフィスの中にいるかもしれない。

かわいそうだけど、何も出来ない。
もう、ダメ。誰か助けてあげて。誰か早く来て。

夜中3時にカブトムシを捕まえた30前のおっさんもおかしいけど、女の子のように虫を怖がる30前のおっさんもかなりおかしい。

うちは、こんなおかしなお兄さん達のいる楽しいラボですw

あ、関東むしむしは好きですよ☆

君に捧ぐ歌


もう君には会えないのかな

それともいつか

すっかり変わった君を見ることがあるのだろうか


こうすればよかった、ああすればよかった

後ろ向きの気持ちを胸に

家を出る前、ふと二階を見上げる


思いつくままに

ひっくり返して、かき回して、また戻して、でも

君の気配はやはりどこにもない


もしもう一度会えるなら

手のひらサイズの箱に押し込んで

明日、僕と一緒に出かけるんだ






解説:
kamiは今、家の中で逃走したカブトムシ(♀)を探しています。
ボスの息子にあげようとチ〇ビタの空き箱に入れておいたのですが、ふたを押しのけ出ていってしまいました。kamiは今、ガムテープでふたをちゃんと閉めればよかったと後悔の念でいっぱいです。
そしていつか、干からびた姿で発見するのを恐れ、戦々恐々としているのです。
なんとか朝までに見つけ、ボスに手渡そうと、家じゅう探し回っています。
てか、さっさと探せ。踏みつぶす前に。



2011年7月13日水曜日

寝過ぎる

このクソ暑いのによく今の時間まで寝られるなと自分自身に感心する。

最近では目覚まし時計が(3つもあるにも関わらず)意味を為さなくなってきた。

どうしても9~10時間は寝ないと頭が働かない。8時間以下だと必ず1時間程度のシエスタが必要になります。CCSの自分の椅子が一番寝心地がいいんですよね。

睡眠障害でもあるのかね。


やんぬるかな、もっと早く寝れば良かったのにと毎度のごとく反省するが、一旦作業を始めると中々止まることができないので、それもまた難しい。

そのおかげで毎日出勤時間が気温MAXの1時とか2時になる。あちぃ。


PS
下の一連の投稿で、本ブログを立ち上げてから最高のコメントとアクセスカウンタの荒ぶりを見ました。
そしてアクセス数3万の大台をすごい勢いで超えました。この話題でか!

2011年7月12日火曜日

訂正

どうも。
30直前のおじさんです。

この前のブログで「最近ゆとりと笑顔が増えた」と書かれましたが、そんなことありません。
僕は常にゆとりを持って笑顔満開で30年近く生きてきました。

それが最近までなかった、とのたまわれる方々はむしろ自分のたちの方に余裕が無く、僕の百万ドルの笑顔に気づかなかっただけでしょう。

ですが、本日の夕飯を食べすぎたのは否定できません。
今でも苦しいです。
実はおなか壊れちゃいました、、、

どうも。
30直前のおじさんでした。

最近パート2

隣でU-ki.Yが書いててうらやましく思ったので、便乗してブログ投稿します!
久しく投稿してませんでしたが、KPCで、ばり暑いのに長袖赤ジャーを着て発表していたTakです。

しかし、うちのラボ最近華やかになってます!そして、笑顔が絶えません☆M-たんのおかげで。
あ、もちろん、研究や仕事はみんなちゃんとやってますよ!

個人的には、30前のおじさん(Kamiさん)がにこやかになったのが嬉しいです。
いつも何かに追われてたKamiさんにゆとりが出てきました。
昔はなかった笑顔があのおじさまには今溢れてます。
さっきなんて、「飯食い過ぎて胃が出てるねん。触って」って言ってたし、その後死にそうな顔しながらオフィスに来て「無理、食い過ぎた」って引きつった笑顔を見せてくれました。

そんなお茶目なKamiさんは、「マルマルモリモリ」をM-たんと踊って、その様子を撮影してYoutubeにあげてくれるそうです。みなさん楽しみにしましょう!!
あ、ちなみにうちのラボメンバーはこの踊りを覚えないといけないそうです・・・

最近

ラボが楽しい!
PCRも予想したものが増えてくるし、一応コンタミはしてないし、飲み会も多いし。
何よりラボが華やかになったからだと思う。
ゼミがあればKKKガールズがきてくるし(まぁ一応mrkmystkもいるけどwww)、なによりM-たんがいつも笑顔を振りまいてくれるから心が癒されます。
30前後のおじさま方も以前よりにこやかになったような気も…笑

個人的にはKKKガールズが参加する柳仙会が好きです。
酒量では勝てる気がしませんが…



学術雑誌評価指標の理解(3)【IF,Eigen Factor,Article Influence】

前述した計算で出したEFですが、早速問題点も主張されています。

一つには、「雑誌のトータルの被引用数とEFは強い正の相関がある」ということです。これは考えによっては「いっぱい論文を掲載するのがEFの大きくていい雑誌」ということにもなるわけです。まあ個人的にはそれが悪いことだとは思いませんが。

実際にどうなっているかを調べると、やはり被引用数とEFには上述した相関関係が認められました(引用7)。このペーパーでは、専門誌ながら超有名なCellよりも、一般紙であるNature,Science,PNASの方がEFと被引用数が高い傾向にあります。ただ、後者3誌が一般紙であることを考えれば、色々な分野の論文から引用される雑誌であって、別にEFの理念に逆らった物ではないように感じます。

ですが、今年のProsONEのEFがかなり高かったことなんかは、ProsONEの採択率の高さなどを考慮すると、一定のバイアスがかかっている可能性も考えられますね。

そのような懸念に対して考え出されたのがAIで、



の計算式で算出されます。要はAIはEFを発行論文数の比で割ったものになっています。aは先ほどの論文ベクトルです。しかし、こういう手出しをすると、AIとIFは結局似たような性質(掲載数の小さな雑誌が価値が大きい)を持ってしまうことになり、堂々巡りになっているようです。

事実、AIはEFよりもIFと強い正の相関を持つことも(ある分野の雑誌においては)示されています(文献8)。

とりあえずのEFとAIの扱いとして、提唱者側からは「EFはある雑誌の影響力をみるもの、AIはある雑誌のある論文の価値を調べる物」という風に区別がされているようです。

いずれにせよ、EFやAIが100%客観的な指標化と言えば、そうでもありませんし、そういう指標を作ることは相当難しいことなのです。一番確実に学術雑誌を評価することは、全ての雑誌を自分で読むことなのですから。

とにかく、これで今出ている雑誌評価の指標についてはだいたい理解できたとは思いますが、それらの値自体にあまりこだわるのは不適切だとも思います。

特に、まだ自分のようなレベルの者は、どんな価値の雑誌であれとにかくデータを論文にまとめて投稿しアクセプトを得ることが重要で、質よりは数がほしいのです。

けれど、これで毎年の発表の際今までよりも少し論理的に一喜一憂できるかなと思います。
 

引用文献
7,http://www.pnas.org/content/106/17/6883.short
8,http://d.hatena.ne.jp/min2-fly/20090204/1233768162

学術雑誌評価指標の理解(2)【IF,Eigen Factor,Article Influence】

さて、EFをどのように計算するかですが、公式で説明されているメソッドは中西印刷株式会社で和訳されていますので、それを見るのが簡単かと思います(引用4)。

(1)で書いた引用被引用のネットワークは、「研究者がある雑誌に費やす時間」を確率であると考えれば、ネットワーク全体を遷移確率行列と考えることができます。
なので、まずはその遷移確率行列を作るため、相互引用行列を求めます。

行列要素Zi,jは雑誌i に5年の間に掲載された論文が、EFを求める年に雑誌 j に掲載された論文から引用された数です。また、を求める際、同一雑誌中の自己引用(i=j)は0とします。これで、IFの時に問題となっていたことの一つがクリアできてしまうのです。

次に、この行列を規格化し、行列を算出します。これは既存のアミノ酸配列からWAGとかの遷移確率行列を算出するのに似ているかもしれませんね。


分母は各雑誌jからの引用総数です。これを見ると、EFの重み付けの一つである「あまり他の雑誌を引用しない雑誌からの引用は重みが大きい」がここに反映されているのがわかります。そういう雑誌では分母が小さくなるわけですから、Zi,jの値も大きくなります。

また、ここで算出される行列は遷移確率行列であるとみなせます。実はこの計算式はGoogleのページランキングで使われている計算式と同様のものです(引用5)。Googleのページランクでは、行列についてその最大固有値に対する固有ベクトル(固有ベクトルはそれにもとの行列Aに対しAπ = λπ:λは固有値、を満たすベクトルπ)を求めると、そのベクトルは各ページ(i)の評価値であるということになっています。これは、遷移確率行列を何回も掛け合わせる(先に述べた研究者の試行を何度も何度も繰り返す)と、最終的にはそれぞれの雑誌に研究者のかけた時間を表すベクトルに近づいていき、それは最大固有値に対する固有ベクトルとなるという理論に沿っています。ベクトルの各要素が雑誌iの価値を表すということですね。

さらに、この行列を掛け合わせることに、「多くの雑誌から引用される雑誌からの引用は価値が大きい」という重み付けが効いてくると僕は理解しています。研究者が試行を何度も繰り返せば(行列を掛け合わせ続ければ)、そういった雑誌からの引用で、ある雑誌iへ辿り着く確率は全体の中で大きくなります。最終的に得られる固有ベクトルには、その影響(と上述のもう一つの重み付けの影響)が大いに関係しているはずです。

ただ、上記の行列を何度も掛け合わせるには問題があります。それが「ぶらさがり結節(dangling node)」の存在です(引用3)。ぶら下がり結節とは行列の中でその要素が0しかない列のことですが、この例で言えば「他の雑誌を全く引用しない雑誌」ですね。なんでぶらさがり結節があるとダメなのかというと、行列計算よりも概念的に考えた方がわかりやすいです。上記のように固有ベクトルを求めることは遷移確率行列を何回も掛け合わせることが前提で、それは研究者が前述した試行123を繰り返すことを意味します。しかし、研究者が試行の中でぶら下がり結節に行き着くと、引用先が全くないわけですから、それ以上試行を続けることができなくなってしまいます。これが問題なわけですね。

そこで、EFの計算ではぶら下がり結節をなくすため、論文ベクトルaを計算し、ぶら下がり結節の列の要素(1~i)をaの要素で置き換えます。ここで要素a[i]は、考慮している5年間に渡り雑誌iに掲載された論文の数を、同じ5年間にどれかの雑誌に掲載された論文の総数で割ったものとなります。

これでぶら下がり結節は消せますが、この補正はかなり乱暴なので必ずしも正確な物ではありません。
そこで、この補正で算出された行列H'を、さらに行列で置換します。


行列の説明は文献4を見てほしいのですが、行列は一般にグーグル行列と呼ばれる物(文献6)で、EFでもグーグルのページランクと同様α=0.85を使用しています。簡単に説明すると、行列の計算では、研究者は試行の中である確率αで引用を辿る試行を続け、1-αで引用を辿るのをやめ、完全ランダムに新たに論文を選択し、試行をやり直します(ただし、その際論文ベクトルの要素、すなわち論文発行数で雑誌ごとの重み付けを行っている)。

そして、この行列について固有ベクトルπ*を求めます。これが、各雑誌の価値を示した物になるわけですね。最後にEFの計算を行います。


 補正をしてない状態の行列Hに対し固有ベクトルを掛け、EFをベクトルとして計算します。EFの各要素iが雑誌iのEF値です。ちなみにここで使う固有ベクトルは既に研究者の試行が十分に繰り返された後を想定して算出されたので、行列Hを使っても(ぶら下がり結節があっても)かまいません。
ちなみに、計算式を見れば分かるかと思いますが、EF値は割合なので、全ての雑誌のEFを合計すれば100になります。

これでEFが計算できたことになりますが、EFからさらに算出されるものとしてAIがあるので、それについても書きましょう。

もうちょっとだけ続くんじゃ。



引用文献
3,http://www.eigenfactor.org/methods.htm
4,http://www.nacos.com/pdf/abouteigen.pdf
5,http://ja.wikipedia.org/wiki/%E3%83%9A%E3%83%BC%E3%82%B8%E3%83%A9%E3%83%B3%E3%82%AF
6,http://web-tan.forum.impressrd.jp/e/2007/12/28/2428

学術雑誌評価指標の理解(1)【IF,Eigen Factor,Article Influence】

この先には、線形代数の理論を含んだ難解なお話があなたを待ち構えています。
それでも進みますか?

('A`) or 正に恐悦至極



現在JCRの発行する学術雑誌評価指標としては、Impact Factor(IF)2年分and5年分、EigenFactor(EF)、論文影響値(Article Influence:AI)があります。

この記事は特にEF、AIについて、その理論的な背景や算術方法もちゃんと理解しようという意図で(あくまで自分のためのまとめとして)作成しています。本当に正確にEFやAIを理解しようとしている人は、やっぱり自分で資料を集めて勉強するのがいいかと思います。

さて、EF、AIの説明をする前にまずIFについて簡単に。

IFとは、単純に言えばある雑誌について

A = 対象の雑誌が2008年に掲載した論文数
B = 対象の雑誌が2009年に掲載した論文数
C = 対象の雑誌が2008年・2009年に掲載した論文が、2010年に引用された延べ回数

C÷(A+B) = 2010年のIF

という計算式で表される指標です(引用1)。

IFは長年使われてきた指標ですが、雑誌の価値を客観的に表す指標としては何点か問題が挙げられてきました。

一つ目は、通常IFは2年分の論文について考慮するものですが、このような短期間だと雑誌ごとのin press期間のばらつきによってバイアスを受けるというものです。これについては、5年分の論文を考慮してIFを計算するということで改善が図られています。

二つ目は、IFでは引用の重み付けをやっていないということです。IFでは一つの引用は”それがどこからされようとも”一つの引用に変わりないという扱いですが、例えばNatureからの引用とPhycological Researchからの引用は同等でしょうか?また、自身の論文中で自身の掲載した論文の引用をすることの価値は?レビュー誌からの引用は?
これらの引用を全て同列に扱ってしまうと、例えば自身に掲載した論文を内輪で引用しまくればIFが上がるという、IFの客観性を損なう原因になりかねません。

その他、IFの計算式の性質から、あまり論文を掲載しない雑誌でも高いIFを保つことができてしまうことも考えられます。レビュー誌なんかはその典型ですね。被引用が圧倒的に多いですし。あとは分野ごとの平均引用数のばらつきも関係してきます。統計学の雑誌と生物学の雑誌では、その分野における一論文が引用する数の平均にも差があるでしょう。

ここで取り上げるEF,AIは特に2つ目(と3つ目)の問題に焦点を絞った物と捉えれば理解しやすいと思います。

EF,AIでは引用の重み付けを行うため、全ての分野の雑誌を一つの集合と考え、その中で引用被引用のネットワークモデルを構築します。IFでは引用被引用の関係を点で捉えていたのに対し、EFではそれを面で捉え、ある引用がどこからきたのかを考慮しています(引用2図1)。

 このネットワークモデルがどんなものなのかは以下のような例で説明されています(引用3)。

1. ある研究者が図書館(雑誌の集合)に行き、ある雑誌のある論文を選んで読む。
2. その論文で引用されている論文(の雑誌)をランダムに選ぶ。
3. 選んだ雑誌に掲載されている論文をランダムに選び、それを読む(以下無限に繰り返し)

実際には研究者はある目的(専門分野)のもとに探索を行う訳ですが、それを考慮してしまうと研究者の目的ごとに雑誌の評価指標が変わってしまい、客観性がなくなるので、ここではあくまでもランダムウォークの概念に沿います。

結論としては、EFとは上記試行を無限に繰り返した際「研究者が探索の中である雑誌にどれだけの時間留まったか」を表す数値です。価値の高い雑誌であればあるほど、ランダムウォークの中でも出会う可能性が高いということでもありますね。これでは並の専門誌よりも一般紙の方が価値も高くなりますが、それは僕らの主観的評価と一致していると言ってもいいと思います。

また、引用の重み付けに関してですが、EFでは引用被引用のネットワークの中で

・多くの雑誌から引用されている雑誌からの引用は重みが大きい。
・他の雑誌をあまり引用しない雑誌からの引用は重みが大きい。

一つ目は直感的に分かりやすいかと思います。二つ目については、ランダムウォークの観点から、100の雑誌を引用する論文(雑誌)より10しか雑誌を引用しない論文(雑誌)からの方がある雑誌に辿り着きやすい(両方の論文にその雑誌が引用されていたとして、1/100か1/10かの違い)ので、必然後者のような雑誌に引用してもらった方がネットワーク内での価値を上げることになるからです。

この2つの考え方を導入すれば、レビュー誌の評価が不当に高くなってしまうこともある程度防げると予想されています。実際EFはその傾向があるみたいです。

さて、それでは実際にどうやってEFを計算するかですが、長いのでここで区切ります。

引用文献

1,http://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%B3%E3%83%91%E3%82%AF%E3%83%88%E3%83%95%E3%82%A1%E3%82%AF%E3%82%BF%E3%83%BC
2,http://www.nii.ac.jp/sparc/event/2008/pdf/112508/document/Jevin_West_document_jp.pdf 
3,http://www.eigenfactor.org/methods.htm

2011年7月11日月曜日

定義

僕はプログラムとかソフトウェアとかの言葉の定義を次のように考えています。(個人的な見解なので事実とは異なる部分もあります。しかも結構人によって言い方違ったりそもそもちゃんと言葉の分類をして使っている例も一般的には少ないんで、時にこんがらがることがあります。)

・人間でも手作業でできるルーチンを自動化したのが「スクリプト」

・人間じゃできない(根性入れて人生かければできるけど圧倒的に不効率)確率計算や行列計算などの作業をコンピュータにやらせるための命令が「プログラム」

・プログラム、スクリプトの具体的な内容を示すのが「コードあるいはソースコード」

・ プログラム、スクリプトをパッケージングしたもののうち、狭い範囲の指向性を持つもの(一つあるいは複数だが分野の狭い目的の達成のために製作されたもの)はソフトウェア、ユーザごとの目的には依存せず、その目的を達成するためのプログラムやスクリプトで引用されることを目的に作られたものが「ライブラリあるいはモジュール」

・より大きなサブジェクトのためにソフトウェアを集合させたものが「パッケージ」

まあ実際に日常的にこの定義を厳密に守って言動しているかというと、その限りではないのですが・・・



また、これは半分冗談の感覚ですが、生物学者もその性質で二分できると考えています。

実際に生きてる物を取り扱って、配列とったり遺伝子導入したり形態観察したりする人は「ナマモノ学者」です。ほっとくと腐ります(いや結構真面目な意味で)

外見上生物を研究対象にしているように見えても、その内実ではin silicoなデータだけを扱い、数理統計とか行列計算とか微分方程式とかプログラミングとか理論的なことだけしこしこやってるのがエセイブツ学者です。かっちょよく言おうとすれば理論生物学者です。上記二つ言い方は失礼かもしれませんが、まあそこは冗談と言うことで^^

ちなみに、エセイブツ学者は往々にして「目的のためには手段を選ばないの反対」になることが多い気がします。ソースは俺。

もうちょい柔らかな言い方をすると、生物学を料理と考えるならば、前者が農家(これだと培養関連になってしまうか?)、後者が包丁職人です。どちらも美味しい料理を作るためには欠かすことのできない人種だということは否定できないでしょう。

しかし、これについては全ての人がきれいに分類されるわけではなく、その中間体をとることが多いんじゃないかと思います。例えるならば家庭菜園をもって包丁使いも達者な主婦といったところですか・・・細かいところでどれが得意かは人によって様々でしょうが。料理をする、というのはこの二つとはまた違ったスキルになりますね。よくうちの飲み会なんかで言われることに近いんじゃないかと思います。

ただ、自分が何になりたいかといえば、やはり生粋の包丁職人になりたいと考えます。然るに「自分の包丁を使えば食材を上手く調理できて美味しい料理が作れる使う人によるけどね」なのが理想型となるわけですが、そのためには自分の器具が他のよりも優れているということを証明せねばなりません。さらにそのためには自分の対極の分野も含め、美味しい料理を作るための総合的な知識や経験を蓄積せねばならず、これが自分の専門を極めるのと同じくらい大事な(だけど遙かに難しい)ことだと最近になって実感しています。

まあ、僕は上述したうちの何にもなれていない状態ですが、一つ一つ項目をクリアしていって、自分の理想像に近づければと思いますね。

2011年7月8日金曜日

初蝉

今日、今年初めて油の声を聞いた。

なんか、今年は蝉が鳴き始めるのが遅かったようにも感じる。

これから、どんどん暑くなっていくだろう。

僕は夏は好きではないが、つくばの田舎の方(どこもそうか)の晩夏の夕暮れに蜩が鳴いている光景なんかは好きだ。

郷愁、といってもここと自分の田舎はかなり違うが、日本の田舎はかくあれかしというイメージでもあるんだろうか。

2011年7月7日木曜日

あー夏休みー

ここ最近、有機酸とU-ki.Y(僕はサボりがち)は夏に向けてバキバキの身体を作るべく週2でウェイトトレーニングをしている。
今日もウェイトをするべく19時30分くらいにオフィスを後にし陸上競技場脇のウェイト場へ。いつもはこの時間だと部活動の連中がわんさかいて肩身狭くベンチプレスやスクワットをやるのだが、夏休みとなったので部活の時間帯が昼間にシフトしているためがらーんとしていた。ウェイトやりほーだいじゃんと思いながらトレーニングを開始!

トレーニング開始してから20分くらいして突然制服姿の恰幅の良いおっさんが登場。何だろうと思っていると「夏休みだから19時までなんだー!僕が1時間間違えちゃったけど、19時までだから窓締めて扇風機止めてかえってー!」とおっさん。警備員のおっさんが鍵をかけにきた。

まさかの途中退場・・・夏休みの恩恵は預かることはあいできなかった・・・

せめて張り紙しておいてくれたら良かったのに・・・

CCS HPC SS 二日目

*注:このブログは生物学を主に取り扱う研究室のです。あしからず(?)

二日目は並列処理化する計算アルゴリズムの具体例としての高速フーリエ変換の話から始まりました。フーリエ変換は学部生のときにチャレンジしましたが、難易度Lunaticだったので逃げ出してしまった苦い記憶があります。

高速フーリエ変換(FFT)は離散フーリエ変換(DFT)を高速に計算するためのアルゴリズムで、DFTの周期性に着目して行列の分解を行い、演算量の減少を狙います。理学的には偏微分方程式の解法、工学的には信号処理などの分野で使われるみたいです。

FFTのやり方については、バタフライ演算に則ったCooley-Tukey法までなら分かりました。この方法は仕組み的にもMPIに適応する場合を直感的に理解することができたので、苦ではなかったです。が、続くSix-Step FFTやNine-Step FFTなんかのアルゴリズムは理解不能でしたね。なにやってんのか数式見てもプログラム見ても分かんない。まあフーリエ変換自体は多分分子系統解析では使わないと思うので、いいか・・・

この講義で重要だったのは、データをどのように分割するかということだったでしょう。データ(問題領域)のサイズは、それがキャッシュに載るか載らないかという点で計算処理の効率に大きく影響します。でかいデータを一気に処理しようとすれば、そのデータがキャッシュに入りきらず、処理プロセスがパンク状態になってしまいます。従って、データ分割(ブロック分割、サイクリック分割、ブロックサイクリック分割、またそれらを一次元でやるか二次元でやるか)をし、キャッシュ容量にあったサイズのデータを処理できるようにすることは、プログラムを書くときにはきちんと吟味しないといけない課題です。
この点は次の最適化の講義でも重要だったと思います。

最適化の講義では、ソフトウェアの最適化と通信の最適化について学びました。まずはソフトウェアですが、最近ではコンパイラも優秀だしプロセッサも高性能だから、ソフトウェアをプログラマ側がちゃんと最適化して性能チューニングするという認識が甘い人が多いみたいです。

んで、ちゃんと最適化しようとすると、まずプロファイラ(例えばgprof)を使ってコードのどの部分がホットスポットなのかを同定する必要があります。(実際の計算処理ではコードの5%が全体の処理の95%を占める)

ホットスポットが分かったなら、その部分に対して最適化を行いますが、この時大切なのがデータの再利用性です。再利用性のないデータ処理では記憶域(メモリ、キャッシュ、レジスタとか)に対するアクセスパターンの局所性が無くなり、特にキャッシュに載るか否かの境界を超えると、問題の規模に応じて処理性能が下がってしまいます。なので、計算処理は行列ベクトル積やベクトル積ではなく、行列同士の積にして、再利用性を高めることが重要です。また、コードの中でループアンローリング(ループの展開)をして、ロード・ストア回数に対する浮動小数点演算回数の比を大きくすることも有効です。

あとはループの入れ替え(ストライドの減少)、パディング(スラッシング予防)、ループのブロック化(データの分割とメモリ参照の最適化)とか。ループアンローリングはレジスタブロッキング、ループのブロック化などはキャッシュブロッキングに有効みたいですが、プログラマ側がどこでそれを区別するのかはまだいまいちよく分かってません。

また、浮動小数点演算命令(SSE3)についての話もありました。今ではSSE4.2とか出てますが、SSE3とSSE4では新しい命令はあまり追加されてないようです。

それよりも、sandy bridgeで追加されたIntel AVX命令の方が効果的とのことです。AVXではこれまで128bit長のデータにSIMD処理してたのが256bitまで拡大されたので、計算処理の向上はかなり見込めるみたいです。

AVXはICCで対応してるみたいなので、sandy積んでるPC買って性能を見てみたいですね。GCCでは5になるまで対応しないんじゃないか、ということらしいです。

さて一方で、MPIでの通信の最適化を考えたときには、扱うデータサイズが大きいほど性能がいい(スループット・通信バンド幅が大きい)とのことです(データサイズが十分大きくなるとピークには達してしまうのですが)。とりあえず、元々のデータが小さいならまだしも(それなら並列処理しなくてもいい)、でかいデータをちまちま分けて通信しては当然粒度が細かくなってしまうし、なるべくでかいデータを通信し、各計算処理ではデータの分割を行って最適化をする、というのがいいようです。なるべくでかいデータを通信するためには、複数の通信データを纏めて一回で通信する(通信ブロッキング)ことが有効で、どうしても小さいデータを個別に通信しなければならないときには、非ブロック型通信を利用して通信と計算処理のオーバーラップを試みるのが良い。ちなみに、大抵研究室レベルまでで所有するクラスタ計算機では、ネットワークとしてGigabit Ethernetが使われますが、Gigabit Ethではパケットを落とすことがあるので、通信性能が安定しないことが往々にしてあるみたいです。T2KなんかはInfiniBandを使っているので、パケットを落とすことはないです。


OpenMPの講義はMPIよりは分かりやすかったです。まずプログラムの書き方がMPIよりは単純だったことが一番でしょうね。

OpenMPは共有メモリ型システムでの並列処理用の並列プログラミングモデルですが、共有メモリ型システムでもMPIは使用可能で、実は共有メモリ型システムでOpenMPとMPIを実行したときにはMPIの方が性能が良かったりするそうです。共有メモリ型では通信や同期のコストがMPI,OpenMPでほぼ差がないので、MPIの方が遅くなる道理はありません。さらに、MPIではメモリが分散していることが前提となっているので、同じ共有メモリ型での処理でもメモリアクセスの最適化という点でMPIの方に分があるのでしょう。(ハード的にはNUMAみたいなもんか)

ただ、OpenMPはコードを書くことが容易だし、並列処理のためのコーディングの練習や、16コア以下の共有メモリ型システムでのみ使うプログラムの開発にはやはりOpenMPを使うのがいいと思います。ちなみにOpenMPでもソフトを使うことで分散メモリ型システムにも対応可能みたいです。

ざっとこんな感じでしたが、この二日間は非常に濃かったですね。このサマースクールで学んだことはちゃんと復習して、後に続く試験や神戸理研のSS(連絡来ないけど行けるのかな?そして宿泊費とか支給してもらえるようになったのかな?)に生かそうと思います。

まあ今はそれはおいといて、これからマニュアルとの対決を再開せねば。解析に使うプログラムは選定できてマニュアルも凄く丁寧に作られて読みやすいんですけど、とにかく長い。PAMLくらい。ちゃんとオプションとか調べてないといけないので熟読する必要がありますが、早いとこ一気に解析したい。

メモ:openMPの簡単なコード

実行には
gcc -fopenmp hogehoge.c
./a.out

#include
#include   --- おまじない

main()
{
   printf("start ...\n");
   #pragma omp parallel  --- openMP並列化のための指示文
   {
      printf("proc id=%d n=%d\n",
      omp_get_thread_num(),omp_get_num_threads());
      --- omp_get_thread_numでスレッドの番号取得、**_num_threadsで総スレッド数(このコードでは=プロセッサ数)
   }
   printf("end...\n");
}

openMPの利点の一つは、指示文を逐次処理コードに加えるだけなので、並列処理のコードへの実装(と削除)が容易ということですね。

2011年7月6日水曜日

CCS HPC SS 一日目

CCS HPC サマースクールの一日目。

今日の内容は

1、並列処理の基礎
2、並列システム
3、MPI
4、連立一次方程式の解法

まず、並列処理の基礎では、演算性能FLOPSと通信性能B/s、ムーアの法則から昨今の計算性能の向上についての話から始まった。

どうもプロセッサのクロックはもうこれ以上(4GHz以上?)上がらないらしい。理由は今の状態でのチップ単位の発熱量が限界の域(発電所の熱密度と同じレベル)だからとのこと。冷却性能を上げても電気を食うから好ましくなく、これからはコア数を増やしたり、省電力なプロセッサの開発に寄っていくようだ。

次に、並列処理の形式(EP、データ並列、パイプライン並列、master/worker型並列処理)を学び、message passingにおける通信と同期のオーバヘッドによるコストの話があった。

あとは、アムダールの法則を考慮した場合の並列処理の効率評価(s(p)あるいはe(p))について、並列処理システムあるいは問題規模の拡張性(scalability)と並列処理における粒度(granularity)、計算プロセスの負荷バランスについて。ちなみにアムダールの法則は並列計算だけじゃなくても適応できる。

曰く「ある作業の全体としての処理効率は、作業員全員の平均的な作業効率ではなく、一部の非効率な人間によって律速される」まあ人間の場合は、マスターノードが優秀なら、負荷バランスや通信頻度の(自己判断的な)調整によって全体の効率をそこまで下げないようにする工夫はできるんじゃなかろうか。

ちなみにこの法則が正しいとすると、プロセッサ台数をいくら増やしても、処理する問題に並列処理不可能部分Tsがある限り、並列処理の効率は極限には0に近づく(つまり超並列は無駄)。これを解決するには、問題の規模を大きくし、Tsが無視できるほど並列処理可能部分Tpを大きくしてやればいいが、そうすると全体としての計算時間も増えてしまうというジレンマもある。結構繊細で難しい問題のようだ。

並列システムの講義では、並列計算機アーキテクチャとネットワーク構成についての話が主だった。アーキテクチャとしては分散メモリ型と共有メモリ型、あるいは分散・共有メモリ・ハイブリッド型が詳解された。共有メモリ型ではプロセッサとメモリの配置についてSMP,NUMAなどの解説もあった。ネットワーク構成としてはstaticなものとdynamicなもの、特にdynamic型でのFat Tree形式を代表的に取り扱った。実際に殆どの超並列計算機ではFat Tree形式が採用されているらしい。あとは並列処理ネットワークの性能メトリックとして、スループットとレイテンシの定義を再確認した。

ちなみに、理化学研究所の京スパコンの話題もあったが、TOP500で採用されている性能評価メトリックは、ネットワーク性能がある程度低くても高得点を稼げるようなものらしい。HPCCとかもっと現実的なベンチマークはあるが、採用されてないとのこと。

ここら辺までは十分理解できたが、やっぱMPIの話からは難しくなっていった。

MPIの講義では集団通信(バリア通信、大域データ通信、リダクション)までは分かりやすかったが、1対1通信でのブロック・非ブロック型通信らへんから雲行きが怪しくなってきた。それぞれの型における通信モードとか、ブロック型ではMPI_Sendしたときにメッセージがバッファリングされるかどうかで実行可能になるかどうかとか、非ブロック型通信でプロセス間の送信・受信の完了を確認する仕組みとか。それで出遅れてしまったので、MPIの実装例も理解が曖昧になってしまった。単純な例なら理解できたが、ラプラス方程式の差分法による解法(とても基本的な解法で学部生のときにもやったが、記憶が錆び付いてた)になると今回の講義ではカバーできなかった。復習の必要有り。

続く連立一次方程式も難しかった。

はじめは単純な連立一次方程式に対する反復解法について、Krylov部分空間反復法(ヤコビ法とかガウス・ザイデル法よりは並列処理がしやすいらしい)を用い、Hermite行列(共益勾配法)、非Hermite行列(双共役勾配法とか)、複素対称行列に対する計算方式、それぞれの収束特性の話があった。あとは、疎行列の格納形式(CRS,CCS)を使った行列ベクトル積など。ここまではまだ何とかなった(と思えた)が、前処理法とか複数右辺ベクトルをもつ方程式に対するBlock Krylov部分空間反復法らへんでドロップアウト。しかもそれを並列化するとかの話にはついていけなかった。行列計算とか微分・偏微分方程式の解法もちゃんとやり直す必要が大いにあるな・・・

とりあえず、ラプラス方程式の解法と単純な連立一次方程式の解法くらいのプログラムは一度Cで書いておこうと思う。

明日は初っぱなから高速フーリエ変換の話があるし、OpenMPの講義もある。このサマースクールは凄く楽しいけど内容濃いしやはり自分にとってはハードルも高めだ(特にレポート課題が)。

Eigenfactor 2010

とりあえずまとめとく。()はこの前書いたIF

Nature (36.101)  1.74466
Science (31.364)  1.46485
PNAS (9.771)  1.66833
Plos One (4.411)  0.32131 
Syst Biol (9.532)  0.02671
MBE (5.510)  0.09129 
Proceedings B (5.064)  0.09093
MPE (3.889)  0.04073
BMC Evol Biol (3.702)  0.03976
Evolutionary Bioinformatics (2.684)  0.00926
Gene (2.266)  0.03425
GBE (2.674)  0.00128
JME (2.311)  0.01359
Genome Res (13.588)  0.12633
Genome Biol (6.885)  0.07688
Curr Biol (10.025)  0.20777
Mol Microbiol (4.819)  0.10483
J. Eukaryot Microbiol (2.397)  0.00599
Protist (3.329)  0.00373
Eur J. Protistol (2.322)  0.00146
Algorithm Mol Biol (2.800)  0.00148
Bioinformatics (4.877)  0.17973

ほか
Mar Micropaleontol (2.321)  0.00548
J. Syst Palaeontol (3.844)  0.00280
Paleobiology (3.045)  0.00602
Biol Letters (3.651)  0.02728
Environ Microbiol (5.537)  0.04522
J. Bacteriol (3.726)  0.13002
Biostatistics (2.769)  0.01177



やっぱりEFを見ると、特にMBEなんかのIFの低下を鵜呑みにするのは適当ではないように思いますね。それとおねぇのEF高っけー。それだけ面白くて注目を浴びる(ビッグジャーナルに引用される)論文が出ているのだろうか。だとすればおねぇは結構高い質も維持していることになるが・・・


ただ、EFの計算時に引用の重み付けをする場合、どの雑誌が重要な雑誌なのかをどう判断しているのか? それぞれのEFを参照するような計算式があるのかな。まさかIFを参照することはないだろう。それじゃIFのバイアスがそのまま影響しちゃってEFの意義ないし。

関東プロチスト倶楽部後記

第一回関東プロチスト倶楽部も盛況のうちに終わりました。
総合討論会(という名の飲み会)は勿論、皆さん発表も含め楽しんでいたようでした。

N崎先生によると、次は東大M崎さん主催だとか。
やはり最後の締めを飾ったくらいですから、次はそうなること間違いなしでしょう(笑)

今回に引き続き、第二回、第三回とこの勢いのまま続いていくといいですね。

さて二次会も終わり、今はMEMメンバーの若い人たち+508の皆さんはカラオケです。
といっても、僕は明日並列計算の講義があるので帰宅してしまいましたが。

明日の講義は、最近では一番楽しみにしていたものです。並列計算プロセスにMPIなどのプログラミング、考えるだけでwktkします。

というわけで、遅刻するわけにはいかないので、今日は必殺床寝です。

2011年7月5日火曜日

渦鞭組

最近研究によるとtakuさんとU-ki.Yは渦鞭組とまとめられます。
渦鞭組は雑、適当、実験がすき、発表苦手という共通形質を有します。
最近になってMF(最近ではFkshと呼ばれることも)が渦鞭組とクレードを組むことがわかりました。
まだ共有形質などはわかっていませんが、考えが似通っている可能性が示唆されます。
よって、このクレードをKuzuveolataとして提唱したいと思います。

U-ki.Y et al. 2011

2011年7月4日月曜日

九州の人間は、お客さん来るとき、本人はいるものです

そんな事実は塵芥ほども見たこともなければ聞いたこともないことをここに明記します。

こうやって自分の嘘や失態を正当化しようとして他人を巻き込んで変なイメージ植え付けるのやめてほしい。政治家ならなおさらでしょう。

・・・て思うのも虚しくなってきた現状。自分を救世主か何かと勘違いしてるのか?

口蹄疫の時からなんら変わってはいませんね。何よりこれら一連の発言を知って被災者がどう思うのか慮ることはなかったのか。(それともそれがあったから「報道したらその社は終わりだから」なのかな。どちらにせよ頭悪いとしかいいようがないですね)

日本においては政治は理屈ではなく感情に訴えるものだということを理解していないことが如実に分かります。まあ悪い意味で大成功してますが、それも民主党全体が一丸となって。


これでまた復興大臣の辞任問題で騒ぎが起き、実質的な災害復興はまた遅れますね。はーあ

統計数理

統計数理の2012年12月号で「多様性と進化の統計解析」(ただし方法論的なものに限る)のテーマで論文を募集しているようだ。


http://www.ism.ac.jp/editsec/toukei/koubo-60-2.html


締め切りは2011年12月31日、丁度いいので投稿することに決めた。今まで貯まってるデータならいけるかな。落ちても別に痛くはないし。


といっても、原著論文は相っ当統計数理学に寄ってる必要があるし、当然のことながら未発表のものじゃないといけないので、出すなら研究詳解かな。それまでに既存の解析結果をどこぞの雑誌に通す必要があるが・・・

2011年7月3日日曜日

ふるふるクラッシュアイス

「ふるふるクラッシュアイス」はロッテリアのデザートメニューであるが、完全にぼったくりである。

昨日Q'tのロッテリアで子供たちと食べたのだが、クラッシュアイスにシロップが掛っており、その上に寒天が散らしてある。確かに寒天が「ふるふる」である。お値段は230円。

しかし問題は使う氷である。なんと「クラッシュアイス」はかき氷(シェイブドアイス)ではなく、ジュースなどの清涼飲料につかう「あの」氷を、ただスコップですくって専用の容器に入れ、それにシロップを掛けるのである。カウンター越しにおねーさんが氷を入れる姿を見たときは、「いやいやいや… それはないやろ」と心の中でツッコミ。

あの状態では、水で希釈し忘れたジュースに寒天がふるふるしているだけである。ロッテリアはハンバーガーとか最近うまくなっているが、あのデザートは大失敗作である。買ってはいけない。

ちょっとググってみたら同じような評価が多い。以外にもロッテリア寄りのコメントもあるが、ドリンク用の氷を入れる姿をもろに見たら、ゲンナリするはず。

関東プロティスト倶楽部

今週火曜日開催です。簡単にweb pageを作りました。参考になれば。


Ukiくんの投稿にもありますが、総合討論会会場は変更です。それも上記web page参照のこと。いまのところ討論会参加者は40人程度になりそうです。

2011年7月2日土曜日

メモ:perlでMPI

PCクラスタなんかでperlスクリプトを走らせるときには、MPIでperlを走らせるためのモジュールを用意する必要がある。

詳しくはここを見れ

http://search.cpan.org/~ajgough/Parallel-MPI-Simple/Simple.pm

2011年7月1日金曜日

オフィスって

今週1週間ほとんどオフィスにいることになった。
なんだか実験をしていないというのは不思議な感じ。

ずっと文章を書いたり図を作ったりしているだけだと、なんだか実験しているより疲れるような・・・
たぶん慣れていないからかもしれないけど、takuさんが「実験したい~~」っていうのはわかる気がします。

がんばってポスター書かなきゃ!!!


サブミット(?)

進化学会ニュース用の原稿ができたので、先方に送った。

字数制限はなかったが、いざ書いてみると意外に長くなった。書いてるときにも色々思い出したけど、やっぱりCoMEの10日間は短くも濃密だった。

といっても、その内容を記すためには、自分の語彙や文章構成力がまだまだ足りないことも再認識した。文章を書くのは日本語でも英語でもそれだけで難しい。大学のレポートとかはほぼ直感と思いつきによりノンストップで書き、それで済んでたが、公に出る文章はそういうわけにはいかない。

ただ、こういう表現はどうだろうかと悩みながら原稿を仕上げていくのは難しかったが、やりごたえがあって楽しくもあった。

また、このようなエッセイでなく、より論理的な文章を、英語で書かなければならず、しかも査読までつく論文をちゃんと自分の力で仕上げられるようになるにはもっと沢山経験を積まなければならず、これから大変な道のりだとも思った。

まあとりあえずは、上手くかけたかわかんないけど、自分の文章がニュースに載るのを楽しみに待つことにしましょう。

アクセプト

JAMSTECのI谷さんとの共著論文が、Mar Micropaleontolに受理されました。

reviewerの難解なコメントなど、(僕の知らないところでも)様々問題があったように思いますが、まずはacceptになって嬉しいです。

僕自身は論文作成とかreviseとかにあまり直接的に協力できなかったので、系統解析の依頼とか何か質問が来たときには、なるべく早くレスするように心がけました(当然っちゃ当然なんですけど)。

放散虫の話は、生物の特徴とか化石があるところとかおもしろい部分が沢山あったので、また何かの機会に解析できればいいなあと思います。