お知らせ

さくらインターネットとCOGNANOのAI創薬に関する共同研究論文が世界最高峰のAI国際会議「NeurIPS 2024」に採択

2024年9月30日

  • Publication

さくらインターネット株式会社(本社:大阪府大阪市、代表取締役社長:田中 邦裕)の組織内研究所である「さくらインターネット研究所」と株式会社COGNANO(本社:京都府京都市、代表取締役社長:伊村 明浩、以下「COGNANO」)が共同で行う人工知能(AI)創薬 *1 に関する研究論文が、AIおよび機械学習分野の最難関国際会議「Neural Information Processing Systems (NeurIPS) 2024」のDatasets and Benchmarks Trackに採択されました。

また、本論文の発表をカナダブリティッシュコロンビア州バンクーバーで、現地時間2024年12月11日(水)~13日(金)に行います。

Image
研究の概要図

さくらインターネット研究所とCOGNANOは、新型コロナウイルス(SARS-CoV-2)を標的抗原として選択し、生きたアルパカの免疫システムを利用して、SARS-CoV-2と多様な抗体との大規模なラベル付き相互作用データセットを作成し、公開しました。公開したデータセットの新規性と有用性が評価され、研究論文採択にいたりました。

ChatGPTの登場を契機に、大規模言語モデル(LLM)の研究開発が活発化し、自然言語処理の技術が急速に発展しています。この技術の進歩は、私たちが日常的に使用する自然言語にとどまらず、創薬分野、特に抗体 *2 創薬の世界にも広がりを見せています。その理由は、抗体はアミノ酸配列、すなわち1文字のアルファベットで表現される20種類のアミノ酸が並んだ文字列として表現できるからです。この特徴を活かし、現在、膨大な抗体配列データを用いて学習した言語モデル(以下、抗体言語モデル)の研究開発が盛んに行われており、効率的な抗体医薬の探索の可能性を広げることが期待されています。しかし、抗体配列データは、インターネット上に膨大な公開データが存在する自然言語とは対照的に、公開データが限られています。特に、特定の抗体配列がどの抗原(ウイルスや細菌など)に相互作用するかを示すラベル付きデータセットの不足は、今後の抗体言語モデルの発展において重要な課題となっています。

この課題に取り組むため、さくらインターネット研究所とCOGNANOは、アルパカを利用した大規模な抗原抗体相互作用のデータの生成方法を確立し、生成したデータセットを公開しました。アルパカをはじめとしたラクダ科の動物は、他の動物に比べて例外的に単純な構造の抗体をもち、より効率的に配列をデータ化できる利点があります。さくらインターネット研究所とCOGNANOは、2020年初頭から世界的なパンデミックを引き起こした新型コロナウイルス(SARS-CoV-2)を標的抗原として選択し、生きたアルパカの免疫システムを利用して、SARS-CoV-2と多様な抗体との大規模なラベル付き相互作用データセットを作成し、公開しました。このデータセットの公開により、世界中の研究者がより精度の高い抗体言語モデルを開発し、評価することが可能になります。本論文は、この新たに公開したデータセットの新規性と有用性が評価され、採択にいたりました。この研究成果がAI技術を活用した抗体創薬に新たな可能性をもたらし、医療の進歩やAIの応用分野の拡大に寄与することを期待します。

さくらインターネット研究所とCOGNANOは、今後も社会にとって有用で新しいインターネットインフラを実現するための研究開発に努めてまいります。

  • *1: AI創薬とは、AI技術を活用して医薬品の研究開発プロセスを推進するアプローチのこと。
  • *2: 抗体とは、体内に入ってきたウイルスや細菌などの有害な異物を排除するために免疫システムによって生成されるタンパク質のこと。抗体は現在、ヒトの病気を治療するための重要な創薬モダリティの一つである。

本共同研究における、それぞれの役割

株式会社COGNANO:
バイオ実験を通じて、AIが学習するために必要なデータセットを構築する役割を担いました。COGNANOは、抗原抗体相互作用のラベル付きデータセットを構築するための革新的な手法を独自に開発し、SARS-CoV-2を標的とした大規模なラベル付きデータセットを作成および公開しました。

さくらインターネット研究所:
作成したデータセットを用いて抗原抗体相互作用を予測するAIモデルの構築と評価を行う役割を担いました。独自に抗体言語モデルを開発し、多様な公開済みタンパク質・抗体言語モデルとの比較実験を通じて、提案するデータセットの有用性を検証しました。

採択された論文について

タイトル:
A SARS-CoV-2 Interaction Dataset and VHH Sequence Corpus for Antibody Language Models
和訳)抗体言語モデルのためのSARS-CoV-2相互作用データセットとVHH配列コーパス

著者:
Hirofumi Tsuruta (SAKURA internet Inc., COGNANO, Inc.), Hiroyuki Yamazaki (COGNANO, Inc., Biorhodes, Inc.), Ryota Maeda (COGNANO, Inc., Biorhodes, Inc.), Ryotaro Tamura (SAKURA internet Inc., COGNANO, Inc.), Akihiro Imura (COGNANO, Inc., Biorhodes, Inc.)
和訳)鶴田博文(さくらインターネット株式会社、株式会社COGNANO)、山崎寛章(株式会社COGNANO、株式会社ビオロドス)、前田良太(株式会社COGNANO、株式会社ビオロドス)、田村龍太郎(さくらインターネット株式会社、株式会社COGNANO)、伊村明浩(株式会社COGNANO、株式会社ビオロドス)

論文: https://arxiv.org/abs/2405.18749

公開データセット: https://datasets.cognanous.com

概要:
抗体は、ウイルスや細菌などの有害な異物を排除するために免疫システムによって生成される重要なタンパク質であり、人間の病気の治療に極めて重要な治療薬です。近年、抗体治療薬の探索を加速するために、抗体配列を用いた言語モデルの構築への関心が高まっています。しかし、構築された言語モデルの抗体探索への適用性を十分に評価するためのラベル付きデータセットが不足していることが課題として挙げられます。この課題を克服するためにさくらインターネット研究所とCOGNANOは、SARS-CoV-2のスパイクタンパク質で免疫された2頭のアルパカから得られた抗原抗体相互作用に関するデータセットであるAVIDa-SARS-CoV-2を公開しました。AVIDa-SARS-CoV-2には、アルパカから採取された多様なVHH抗体が、デルタ株やオミクロン株を含む12のSARS-CoV-2変異体に対して結合するかしないかを示すラベルが含まれています。さらに、抗体言語モデルの事前学習用コーパスとして、200万を超えるVHH配列を含むVHHCorpus-2Mを公開しました。論文中の実験では、既存のさまざまなタンパク質、抗体言語モデル、およびVHHCorpus-2Mを用いて独自に事前学習した言語モデルを用いて、SARS-CoV-2とVHH間の結合を予測したベンチマーク結果を報告しました。これらの実験結果は、AVIDa-SARS-CoV-2が、抗体言語モデルの性能を評価するための貴重なベンチマークを提供し、AIを活用した抗体探索を促進することを示しました。

「NeurIPS 2024」での発表について

「NeurIPS」について:
「NeurIPS」は、1987年に設立されたAIおよび機械学習分野の国際会議であり、投稿件数の多さと厳格な査読プロセスによる低い採択率から、世界的に権威のある会議の一つとされています。本会議では、深層学習、強化学習、コンピュータビジョン、自然言語処理、さらには様々な分野の応用研究など、AIと機械学習の広範な領域における最先端の研究成果が発表されています。本会議の第38回目となる「NeurIPS 2024」は、2024年12月にカナダで開催されます。

日時・場所:
日時:2024年12月11日(水)~13日(金)
場所:カナダブリティッシュコロンビア州バンクーバー Vancouver Convention Center

発表者:
さくらインターネット株式会社、株式会社COGNANO 鶴田 博文

詳細:
オフィシャルサイトをご参照ください。https://neurips.cc/Conferences/2024

Datasets and Benchmarks Trackについて

「Datasets and Benchmarks Track」は、今後のAIおよび機械学習分野の研究の発展に欠かせない高品質なデータセットとベンチマークの設計および開発や、データ中心AIに関する研究などの議論の場として、2021年にNeurIPSに新設された研究トラックです。

  • 掲載されている内容は発表時点の情報で、予告せず変更となる場合があります
  • 記載されている会社名、製品名は、各社の商標、もしくは登録商標です

Icon
さくらインターネット株式会社について

代表者:代表取締役社長 田中 邦裕
本 社:大阪府大阪市北区大深町6-38 グラングリーン大阪 北館 JAM BASE 3F
創 業:1996年12月23日
設 立:1999年8月17日
URL:
https://www.sakura.ad.jp/corporate/

Icon
株式会社COGNANOについて

代表者:代表取締役社長 伊村 明浩
住 所:京都府京都市左京区上高野東山64-101
創 業:2014年10月17日
設 立:2014年10月17日
URL:
https://www.cognano.co.jp/

Icon
ニュースリリースに関するお問い合わせ先(報道機関窓口)

さくらインターネット株式会社 広報担当
問い合わせフォーム:
https://sakura.f-form.com/sakurapr

株式会社COGNANO
問い合わせフォーム:
https://www.cognano.co.jp/contact