ブログ

COGNANOのいむらです。ITエンジニアから視える景色に立ってみる(後編)です。

今回は、ITエンジニアのまつもとりーさん、つるべーさんに出会うまでを、、、

バイオマンが視ている景色

バイオは夢中になってウェット実験をする文化なので、(本当は必要だったのに)久しくエンジニアと接点がありませんでした。論文(PubMed)検索やメール以外の用事を感じない環境で暮らしてましたね、、、

遺伝子物質はDNAだとわかって以後をワトソン・クリック時代と呼んでいいと思いますが、バイオ研究は遺伝子ベースの分子学に集中したこともお話ししました。分子が機能する場は細胞という単位ですから、分子細胞生物学、とも言います。業界聖書のような教科書のタイトルは、まさしく「Molecular Biology of the Cell(細胞の分子生物学)」です。表紙のイラストで、複雑な緑色がタンパク質分子で、白い帯は細胞膜を表しています。細胞膜にあるタンパク質分子が、クスリの標的として興味(と創薬ビジネス)の対象になっていることが、表紙にすでに明示されています。

Image
Molecular Biology of the Cell(細胞の分子生物学)

さて、ここでCOGNANOが手に入れたアプローチをもう一度整理して見ます。

  • 超高速で変化し最適化コンテキストを持つゲノム → 遺伝子データ(ゲノム中で明示的な意味付けができる情報ウインドウは抗体遺伝子だけと言ってよい)
  • 計算資源 → 生きているアルパカ(オレゴンからの空輸に成功!)
  • 超高速で解読する技術 → 次世代シークエンサ(受託会社がたくさん稼働しているし、どんどん単価が安くなっている)

・・・・イケる!作戦は完璧じゃないでしょうか。しかし、実際に起こったことは停滞でした。苦い記憶ですが、このステップに初めて到達した5年前、ぼくたちは次世代シークエンサから吐き出される遺伝子データを前に思考停止していました。当たり前ですが、アルパカから得たデータは、atgc・・・・というアルファベットが何億文字も並んでいる行列でした。遺伝子がコードする抗体がアルパカの体内に実在し、標的タンパク質(抗原)に結合する親和性をもっていることは確実です。でも、どのくらいの強さでどの部分に結合し、どんな機能を持っているのかはわかりません。アルパカという生きた計算機は、どのような経過と判断で必要な抗体をリストしているのか、、、、 そもそも人間が抗体を欲しがるのは「役に立つ物質=クスリ」になるからです。「遺伝子配列から有用性を推定できるようになる」しか解決策はありません。この時まで、このように大きなスケールの抗体遺伝子情報は存在しなかったので、当然ながら情報処理の方法論は存在しないわけです。このときの気分は、ドイツ機甲師団を待ち受ける連合国部隊のようなものだったでしょうか。エニグマ(ドイツ軍暗号)を解読しないと、全滅するかもしれない、、、、、もう一つの道は、従来のように、生物実験を実施して一つ一つの抗体クローンの機能を調べることです。頑張れば、1週間に100クローンか500クローンをチェックできるかもしれません。しかし、それだけはダメでした。手作業に戻れば、この研究を始めた意味を失ってしまう。

プログラムが必要らしいんですけど、、、

、、、、情けない話なのですが、こうなることはわかっていたはずなのに、データを見るまで「オレたちはやれる」と思っていたんですね。ときどきやってしまうんですが、遺伝子もタンパク質も抗体も扱えるエキスパートなので、「やれるゼ」になってしまったわけです。パソコンに、有用遺伝子を選ぶファンクションキーは付いてないという事実に気づくまで、しばらくかかりました。よほどボーッとしていたのでしょう。

どれくらい意識を失っていたでしょうか、あるとき「データ触っていいですか?」と声をかけてくれた人がいました。普段医師として働いているYさんでしたが、私生活ではプログラミングを趣味にしているということは聞いていましたので、「ああ、興味ありますか?いいよ、やってみて」と何気にデータを渡しました。どうせ宝の持ち腐れなのだから、試してもらうのは歓迎でした。自分がわかっている業界のことは評価できるけれど、違う領域については、誰にどんな能力があるかわかりません。誰にコンタクトしたら良いか、がわからないのです。トッププログラマーが周辺にいないことははっきりしていますし(というか会ったこともないし)、仮にコンタクトできても、基本的には、バイオマンはプログラムがわからず、エンジニアはバイオの言語がわかりません。「抗体と抗原の関係」について、いやその前に「遺伝子とはなにか」から、つまりゼロから説明しないと始まりません。プログラミングが好きすぎて生物研究に進んだ、というヒトは聞いたことがありません。

突破口はYさんが開いてくれました。数千万の抗体クローンを分類して、どのような親戚関係としてバンドルできるか、どの程度の結合強度と見込めるか、さらには、抗原表面のどのあたりに結合していそうか、、、、を、ウェット実験なしにカテゴライズしていったのです。こんなことができるなんて!「ま、これやりたくてアルパカ輸入したんですけどね」と冷静に言ったつもりでしたが、じつは踊り出したいくらいでした。アルパカ抗体遺伝子のデータを実験なしで評価できるプログラムが書けたことは重大な未来を示していました。コンピュータがクスリを予言できる時代が約束され、ぼくらにはその道筋が具体的に見えているわけです。ちなみに当時、仲間を集めようとして「一緒にやりませんか」とコンタクトした国内ベンチャーや企業には、うまく説明できなかったかもしれません。見たことも聞いたこともないコンセプトは、目の前でプレゼンしてもわからないのだ、ということが納得できるまで、また何年もかかりました。理由は簡単です。バイオとIT、両方わかる人が、世の中に(ほとんど)いないからです。ただし1チームだけ、興味を示してくれた海外企業があり、その企業とは現在共同研究を進めています。

Image

アイアンドーム

もう2年前になりますが、パンデミックが始まった瞬間、ぼくらは新型コロナに舵をきりました。パンデミックまで(偶然にも)エイズウイルスを標的の一つにしていたので、RNAウイルスが急速に変異すること、どんな薬も早晩無力化されると予想していました。可能な限り素早くゲノム変異に追いすがり、追いつき、できることなら先回りして抗体効果を予言的中させたい、、、、人類はまだ、そのパスを構築していません。ゲノム変異(ウイルス)にはゲノム変異(抗体遺伝子)で対抗です。例えて言えば、ガザから発射される変則的なロケット弾を「着弾前に」撃ち落とす技に似ています。ミサイル火力よりむしろ、レーダー網とリアルタイム・マルチ対応、つまり情報能力の方が鍵になります。イスラエルがアイアンドームを開発できたのは、ITテックの力が大きかったと聞きます。ぼくらの腕を試すにはもってこいのチャンスです。このタイミングでバイオ創薬の仕組みを向上できるかもしれません。

もうひとつ、パンデミックでぼくが新たに注目したことは、医学以外のテーマ「社会運用」でした。コロナでわかったことは、

  1. 1滴のウイルスで人間社会を滅亡させられるリスクがある
  2. 迎え撃つにも、パーソナルな病気の側面と、社会安全保障の側面がある。両立はむずかしいとはいえ、上手にコントロールすることが文明社会には必須(成熟度のバロメータですらある)例えば世界で起きている「ワクチン拒否」は、バカにして済む話ではなく、人権や思想の問題にもなる。
  3. ウイルスは刻々と姿を変え、開発すれどもワクチンや薬は効かなくなる
  4. パンデミックは総じて、天災とか環境災害にちかい現象と理解した方がよく、治療学・医学以外の「社会運用」がさらに重要となる。

社会を安全に保つためには、無用な動線を排除し、隔離や医療を実効的に運用することが不可欠です。運用は、「いつ、どこで、だれが、どのような状態に」なっているのかを把握し、確度の高い予想を立てることから始まります。そのためには、変異ウイルスのタイプ、所在、量、時系列に関する可能な限りの細やかな情報を入手しなければなりません。ぼくがこのようなことを考えたのは、バイオに行き詰まったときに参考にした、「地球上のどんな地点でもリアルタイムに把握している地図」が頭にあったからに違いありません。でも残念なことに、Google mapには、今日もまだコロナウイルスの所在と量は掲載されていません。感染者数がPCR結果によって示されるだけです。(先進国の恵まれた場所だけで行われる)PCR検査数というバイアスデータではなく、地球上すべての場所でリアルタイムのバイオデータはとれないものか、、、、その開発もまた、バイオマンの義務だろうと思い、ある国内企業の賛同と支援を得てコロナ検査キットを作り始めました。どのみちクスリにする抗体をたくさん開発するのですから、検査にも使わなきゃもったいない、です。ウイルスをリアルタイムに数量化すれば、きっとITテックの人が見つけてくれて、「クラウド」という仕組みで、すごいことをやってくれるだろうと信じて、、、、

Image
蛍光標識したVHH抗体でウイルスを検出する原理

エントリーが長くなりました。クラウドってどうやるんですか、IoTって何ですか、と聞いて回っている中で、ITエンジニアのまつもとりーさんと出会ったのは、パンデミックが始まって9ヶ月後です。この時には、すでに創薬シーズができていました。それから1年半たった今でも、(実験室レベルですが)オミクロン株に薬として効いていることはアナウンスしておきたいですね。そのような抗体は極めて稀ですから、、、、従来の職人芸を、アルゴリズムが追い抜いた!という自信を持てる結果です。この2年間は、まつもとりーさんに続いて機械学習エキスパートのつるべーさんの参加、海外ITテックとの共同研究、創薬シーズ開発成功、論文投稿、、、など、めまぐるしく時間が過ぎ、気づいたら、このようにブログを書くようになっています。この経過はまだ生々しいので、そのうち落ち着いて書かせていただこうと思います。

ハイブリッドチームができた!

現在、COGNANOは、バイオ班とAI班から成っています。バイオとAIのメンバーが共通言語を持てるようにする、というのが企業目標であり、データの質x量という強みを生かして、自動創薬のリーディングカンパニーになるのがビジョンです。さらに幸運にも、まつもとりーさんの相棒であるつるべーさんが、COGNANOの機械学習能力を劇的に向上させてくれています。新型コロナで、オミクロン変異以後を継続して追撃できるチームは、世界でも限られています。ぼくたちと同じようなアイデアを持っている会社が世界にあるかもしれません。競争するのか、協力するのか、、、、今後が楽しみです。

Image
まつもとりー
Image
つるべー

このブログに絡んでもらうといいのかな、と思い、次はバイオマンのまえださんに、書き継いでもらう予定です。引き続いて、まつもとりーさんには、IT系の目線で書いていただくことを期待しています。ぼく以外の目線で書いてもらうと、さらにCOGNANOのことをわかっていただけると思いますし、バイオがデータの時代に移行していることも(以前から予言はされていましたが)実感でわかっていただけると思います。長くなりましたが、ITエンジニアから視える景色に立ってみる(後編)を終わります。

Image
アルパカの赤ちゃん。かわいい!!