Photo by Unsplash
AVIDa-hIL6
AVIDa-hIL6は、ヒトIL-6タンパク質を免疫したアルパカから生成されたVHH (Variable domain of Heavy chain of Heavy chain antibody)の相互作用データセットです。すべての抗原-VHHペアには、ファージディスプレイ法とバイオパニングを組み合わせた親和性選択と次世代シークエンサー解析の統計処理を組み合わせたラベリング方法によって生成された、”結合”または”非結合”の信頼できるラベルが付与されています。AVIDa-hIL6は、VHHの単純な構造を活用して抗体全長をDNAシーケンシング技術によって同定したアミノ酸配列が明示された573,891の抗原-VHHペアで構成されており、そのうち20,980の結合ペアが含まれています。抗原にはIL-6タンパク質の野生型と30種類の異なる変異体が含まれており、IL-6タンパク質のどのアミノ酸点変異がどの抗体との相互作用にどういった影響を及ぼすのかといった情報が含まれています。AVIDa-hIL6は、抗原-抗体相互作用の予測の成長する分野における機械学習研究の貴重なベンチマークとして役立ちます。
列の説明
データセットの各列の内容と形式の説明です。
AVIDa-hIL6.csv
列名 | 説明 |
VHH_sequence | VHHのアミノ酸配列 |
Ag_label | 抗原の種類 |
label | 1は結合ペアを表し、0は非結合ペアを表すバイナリラベル |
subject_species | VHHが採取された対象の種 |
subject_name | VHHが採取された対象の名前 |
subject_sex | VHHが採取された対象の性別 |
antigen_sequences.csv
列名 | 説明 |
Ag_label | 抗原の種類 |
Ag_sequence | 抗原のアミノ酸配列 |
統計値
AVIDa-hIL6には、20,980のバインディングペアと552,911の非バインディングペアを含む573,891のデータサンプルが含まれています。以下の図は、各抗原タイプのデータサンプルの数を示しています。AVIDa-hIL6には、少なくとも250のバインダーVHH配列を含む、各タイプのIL-6タンパク質に対して10,000以上のサンプルが含まれています。
マザーライブラリ
マザーライブラリは、アルパカの血液および様々なリンパ節から収集されたサンプルを基に構築されました。収集プロセスは4つの異なる時間点で行われ、2番目の時間点では複数のリンパ節からサンプルが採取され、複数のリンパ節からのサンプルが存在することになりました。
サブライブラリ
母ライブラリに対して、野生型抗原(3回)、陰性対照、および30種類の異なる突然変異原を使用してアフィニティ選択を実行することにより、サブライブラリグループが生成されました。 12種類の母ライブラリがあり、それぞれについて34回の実験を実施したため、総数408のサブライブラリが存在します。