PDISニュース

解析拠点・機能ゲノミクス領域A 池尾一穂先生にインタビューしました

ikeo.png

2015年9月14日取材

先生が遺伝学に興味を持たれた一番のきっかけというのは何かございますか?

 僕は最初生化学をやっていて、タンパク質の活性とか精製とかやっていたんですよね。それはそれで面白かったんだけど、もうちょっとクリアに決定的なデータが出るようなことはできないのかなという思いはあった。やっていたことが、ものを見ているんだけど、そのものを見ているというよりか、キャラクターがなかなか決まらないというか、間接的だという思いがあって、DNAとかアミノ酸配列とかの方が、もうちょっとモノとしてのイメージがしっかりしているのではないかという思いがあったんです。それと、私的には昔の時代なので、大学に雇ってくれるところがあって、行くところがないんだったらうちで人を探しているからちょっと来てって言われて、興味が必ずしもそれほど離れていなかったからそのままズルズルと居ついたっていうのもあるかな(笑)。

それで、現在に至るまでにはどのようなことがあったのでしょうか?

 仕事についてから、比較ゲノムだとか、分子進化だとかの配列のデータの解析が本業になったんです。最初は紙と鉛筆だとか、データベース(DB)メインのつもりは全然なかったんです。もともとDBには興味を持ってはいたんですが。ただ、その後、DBだったら雇ってくれるところがあるっていうことで、そういう流れがあって、最初はDBを構築したり公開するサービスにかかわってきたんです。それが2007-8年くらいにシークエンスは次世代型のシーケンサの時代になってきて、特にゲノムの世界のドライとウエットの関係がガラッと変わってきて、今ではその二つは区別もなくなりつつあるし、ドライがメインでウエットがサブじゃなければ、ウエットがメインでドライがサブっていうわけでもなく、そこは一つの塊になってきた。それと同時に、解析をできる人が、今でも少ないですけど、当時はもっと少なくって、そのような中でセルイノベーションのようなプロジェクトが始まり、解析ツールだとか解析システムの開発っていうのに比重が置かれるようになったんです。我々の流れは、もともとヒトゲノムの時代からゲノムのデータをもっとちゃんと使えるようにしましょう、ということなんですが、自分たちの研究ベースだったのが世の中の流れで支援が大事になってきたんです。それで、現在は、ゲノムのシーケンス支援、配列決定の解析じゃなくてデータ解析をするということでこのプロジェクトにかかわっているんです。

そこではウエットもドライもないということですね。今までのお話をお伺いしていますと、日本の中で新しく起きてきた学問にいち早くかかわってこられたのですね。

 カッコよくいうとそういうことになるかもしれないけれど、実際は、大学で講義なんかするときに実感するんですが、基本的に生物学っていうやつは、特に日本では、数学とか物理学が嫌い、もしくはダメな人がとっていて、なんとなく理学的なこととかサイエンスは好きという人で、「生き物大好きだけど数学じゃないな」、っていう人が多いように思うんです。でも、生物学 の中で遺伝学っていうのはかなり数学的なんです。もともとのスタートから、要するにメンデルの予測っていうのは簡単な統計で、メンデルの出た19世紀以降に遺伝学の世界で活躍していた人たちの中にはかなり数学者がいるんです。場合によったら、有名なウエットな仕事をしている研究者の中にも実は数学が主になっている人だっていて、生物学の中で最も数学的なんですよね。
 この遺伝研っていうのは遺伝学の研究所で、ずっとゲノムのことが得意だったんです。その中でゲノムの木原均先生とか集団遺伝学の木村資生先生みたいに数学をやる遺伝学者が結構いたんです。私自身も数学をやりたくて来たわけではないんです。それまで実験しかやったことなかったんだけれども、若い時でようわからんで、遺伝学とか進化をやりたくて、進化がやれるからって来てみたら、そこは配列を並べて、AとBと配列の違いを計算する分野だった(笑)。
 それにシーケンシングでDNAの配列決定ができるようになって、PCRとかがやっと出回り始めた時期に学位をとったので、分子生物学的なものが、今でいうバイオインフォマティクスみたいに先端で、「遺伝学って今更」、みたいな時代にスタートを切っているんです。だからさっき新しい分野だって言ったけど、カッコつけて言うとそうかもしれないけれど、実は我々は、新しいことをやっているようで、さっきも言ったけど、昔々に当時僕らでも「集団遺伝学は古い、遺伝学って今更」、みたいな時代にスタートを切っているから、意識としてはそうでもないんです。

はじめられた頃には今ほどのデータ量はなかったと思うのですが。

 そう、データで勝負するような量じゃなかったので、本当にその当時やっていた人たちのかなりは数学的なことをやっていたんですよ。だって当時、僕がまだ学生の時の一番最初のDDBjっていうのは、データの入力を手でやっていたんですから。何人かの人で手分けして、ジャーナルを毎号見て、シーケンスが出ていればそれを手で入力していたんですから。

インターネットが普及する前ですよね。

 そう、まだ走りで、アメリカと日本のごく一部にあっただけ。そういうときだったので、データ解析っていうのは、実はあんまりなくって、数理解析に近いような解析だったんですよね、その当時は。だから我々としては新しいことを求めていたらここに流れ着いたな、というよりは、元々やっていたことの延長にあると思っているんです。当時はもちろんデータベースを構築するとか、今みたいにすごく大きな計算機を使ってというのはない話ですけど。そんな違ったことをやっている気持はないんですが。

それでは、先生が研究を目指された時から、この分野の根本は変わってはいないけれど、機器の発達とかが発展の方向を決めてきたということなのでしょうか。

 広い意味ではね。シーケンサとかね。ゲノムの全配列が決定できるというような。今でも覚えていますけど、ヒトゲノムの全配列決定の提案があった頃には10年をうたい文句にしていたんです。そしてみんなは、10年で終わる訳がないからどうするんだって批判していたのが、今ではヒトゲノムの配列決定が、ライブラリ作成から入れても1週間とかで終わってしまって、すごい量のデータが一度に出て来てしまう。ともかくその辺が一番変わった。中にいて感じるのは、そこで世の中大きくかわったよな、と思いますよ。ヒトゲノムの全配列決定が終わった時にも変わったんですけどね。あそこで情報屋がいっぱい入ってきたから。あの前後で。
 もう一方で、そこから得られる情報のことになると、配列屋さんと構造屋さんとではもともとの発想が違っているし、その情報には研究している人もアクセスしたい、治療している人もアクセスしたい、その上に患者さん自身もアクセスしたいとなる。でもみんな同じ目的ではないということですね。ウエットの方からデータは個々に入ってくるけれど、大本では個々のそれらを意識しながら一つのものを作って見せられないかとか、ある情報をどう使うかを精緻に考えて、集約して多面的に使えるようにできればいいなと。それは2001年宇宙の旅に出てくるコンピュータのハルを作るプロジェクトみたいなものだと仲間内では言っているんです。究極はコンピュータの中で進化できるというようなものを目指す。いろいろなデータベースを理想的には一つに収められないかなと。

具体的には今後はどのようになっていくとお考えですか。

 我々は、本来は研究者なので、自分のことは決められるけど、みんなでとなるとザクッとしたことは決められても一つにまとめることは難しい。支援の部分はクリアにできることがあるから、その部分は企業に投げてもいいのではないかな。そしてヒトの思考作業をもっと底上げして、コンピュータで、たとえば、人が見逃している部分をなくして、見える範囲を360度まで広げるというようなイメージに近い、人の能力を拡大するっていうことができればね。そうすれば、できたシステムにはこれまで入り口がわからなかった人たちもアクセスできるようになるし。

次世代シークエンサでゲノムの世界では大きな変化がありましたが、そこで得られたデータをすべて使いこなす技術があるかというとまだまだというところがありますよね。そういう意味での技術開発、技術革新も必要ということですね。

 次世代シーケンサで得られる情報は一回のシーケンスでギガ、テラのオーダー、その上に、たとえばがん細胞なんかを考えると、極端な話、1個の細胞から情報が得られるわけだから、経時的に眺めることもできて、そうなると変化の仕方が異なる可能性があって、場合によっていろいろに変化していくことを追うこともできるわけ。そんな風に考えると、出てくるデータ量は多くて、やってられないくらいの量になる。それを踏まえて考えてやっていかないとね。

実際にやる前に良く考えてやる必要もあるということですね。きょうは貴重なお時間をありがとうございました。

ページの先頭へ戻る