JP6778932B2 - 免疫実体クラスタリングソフトウェア - Google Patents

免疫実体クラスタリングソフトウェア Download PDF

Info

Publication number
JP6778932B2
JP6778932B2 JP2018539195A JP2018539195A JP6778932B2 JP 6778932 B2 JP6778932 B2 JP 6778932B2 JP 2018539195 A JP2018539195 A JP 2018539195A JP 2018539195 A JP2018539195 A JP 2018539195A JP 6778932 B2 JP6778932 B2 JP 6778932B2
Authority
JP
Japan
Prior art keywords
immune
epitope
similarity
immune entity
antibody
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018539195A
Other languages
English (en)
Other versions
JPWO2018052131A1 (ja
Inventor
ダーロン ミケランジェロ スタンドレー
ダーロン ミケランジェロ スタンドレー
ジョン デイビッド オークリー ニエリー
ジョン デイビッド オークリー ニエリー
ソンリン リ
ソンリン リ
ディミトゥリ シェリット
ディミトゥリ シェリット
山下 和男
和男 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka University NUC
Original Assignee
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka University NUC filed Critical Osaka University NUC
Publication of JPWO2018052131A1 publication Critical patent/JPWO2018052131A1/ja
Application granted granted Critical
Publication of JP6778932B2 publication Critical patent/JP6778932B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Analytical Chemistry (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

本発明は、抗体等の免疫実体をエピトープに基づいて分類する方法、エピトープクラスターの作成およびその応用に関する。
抗体は抗原に特異的にかつ高親和性で結合するタンパク質である。ヒト抗体は重鎖、軽鎖と呼ばれる2つの高分子配列からなる(図1)。重鎖、軽鎖はそれぞれさらに可変領域と定常領域という2つの領域に分けられる(図2)。そして、この可変領域は、抗体の生理活性に重要な多様性をもたらすことがわかっている。この可変領域はさらにフレームワーク領域と相補性決定領域(CDR)に分けられる(図3)。抗体はターゲットとして結合する分子を抗原という。抗体は一般的にCDRが抗原と物理的に相互作用することにより、抗原を特異的にまた高親和性で結合する。抗原において抗体と物理的に相互作用する領域を「エピトープ」と呼ぶ(図4)。
抗体は非常に多様性に富んでいる。各個人は1011ものアミノ酸配列の異なる抗体を作り出すことができる。この多様性によってB細胞レパトアは多様な抗原と、さらに同じ抗原の異なるエピトープと異なる親和性で結合することができる。CDR領域のアミノ酸配列が多様性の源泉である。CDRの中でも重鎖の3番目のループ(CDR−H3)が最も多様性に富む。複数のアミノ酸配列の非常に異なる抗体が同一のまたは非常に似たエピトープと結合することがある。この「配列の縮退」によって抗体、とりわけ別々の個体によって作られた抗体を抗原やエピトープによって比較することは非常に難しい。
抗体は商業的に非常に価値のある分子で、現在最も商業的に成功している薬の多くが抗体医薬である。さらに、抗体医薬は製薬業界において最も急速に成長している分野である。抗体は高親和性と特異性という特長を生かし、医療用だけではなく、基礎研究や製薬以外の産業界においても広く利用されている。
T細胞もまた、B細胞と構造的によく似た受容体(TCR)を発現する。重要な違いは、TCRは可溶性ではなく、常にT細胞に結合している点である。(B細胞は可溶性の受容体である抗体と、細胞膜に結合したBCRとを産生する。)。BCRほどの多様性はないものの、T細胞もこれまで非常によく研究されてきた。とりわけ、悪性腫瘍に対する作用では細胞傷害性T細胞による細胞破壊が重要である。
近年、抗体やTCRのアミノ酸配列を次世代シーケンシング技術によって大規模に同定することが可能になった。他方、それらの抗体、TCRと結合する抗原やエピトープの同定が課題であり、商業的にも大きな需要が期待される。
既存の抗原同定方法は、抗体やTCRを1つまたは複数の抗原候補と相互作用させ、実験的に相互作用を同定する方法である(例えば、表面プラズモン共鳴)。これに変わる技術としては、プロテインチップや、各種のライブラリ法がある。これらは比較的安価で高速であるが、関節リウマチ等幾つかの疾患で重要な翻訳後修飾を受けたタンパク質やペプチドに対しては適用することができない。また、構造エピトープの同定は困難である。
これらの実験的なスクリーニング技術は、抗原が同定されている必要がある。言い換えると、抗体、TCRの発見の前に抗原が同定されていなくてはならない。
非特許文献1は、残基ペアリング優先度およびクロスブロッキング法を用いる抗体特異的B細胞エピトープを予測する計算法を開示する。
Sela-Culang I. et al., Structure 22, 646−657, 2014
一つの局面において、本発明は、同じエピトープをターゲットとする抗体等の免疫実体をそのアミノ酸配列情報のみを用いてグループ分け(クラスタリング)するアルゴリズムおよびこれを利用する発明を記述する。BCR、TCRは抗体と同一のタンパク質スーパーファミリーに属することから、本発明の手法はBCR、TCR等の他の免疫実体に対しても適用可能である。既存の配列クラスタリング手法と異なり、本発明者らの手法は抗体などの免疫実体の3次元構造モデルを、抗体などの免疫実体の配列をグループ分けする特徴量として用いる。この手法には幾つかの新規な側面があり、1.抗体などの免疫実体の配列を幾つかの部分に分けること(例えば、フレームワーク領域などの保存領域と3つのCDRなどの非保存領域);2.フレームワーク領域などの保存領域とCDRなどの非保存領域を定義するために、予測された3次元構造モデルと配列を用いること;3.2つの抗体などの免疫実体の類似性と非類似性を評価するための評価関数に、構造および配列特徴量などのパラメータを取り入れること;4.抗体などの免疫実体の類似性からエピトープの類似性を類推することが挙げられる。
抗体、TCRの発見の前に抗原などの免疫実体結合物が同定される必要がないことは本発明のクラスタリングアルゴリズムの重要なアドバンテージである。本発明の技術は抗原などの免疫実体結合物に対する事前の知識を必要としない。本発明の技術の魅力的な応用の一つとしては、抗体、TCRクラスターを病気のバイオマーカー、創薬ターゲット候補の同定、抗体医薬、キメラ抗原受容体として遺伝子改変T細胞治療に利用することである。例えば、ある種の白血病やリンパ腫ではBCRおよびTCRが典型的な配列パターンを示すことが知られており、抗原などの免疫実体結合物がわかっていなくても、それを同定することで病気の診断に用いることができる。
例えば、本発明は以下を提供する。
(1)第一の免疫実体(immunological entity)および第二の免疫実体について、結合するエピトープが同一か異なるかを分類する方法であって、該方法は、
(A)該第一の免疫実体および該第二の免疫実体のアミノ酸配列の保存領域を同定するステップと、
(B)該第一の免疫実体および該第二の免疫実体の三次元構造モデルを作成するステップと、
(C)該三次元構造モデルにおいて該第一の免疫実体の該保存領域と該第二の免疫実体の該保存領域とを重ね合わせるステップと、
(D)該重ね合わせ後の該三次元構造モデルにおいて、該第一の免疫実体の非保存領域と該第二の免疫実体の非保存領域との類似度を決定するステップと、
(E)該類似度に基づいて、該第一の免疫実体と結合するエピトープと該第二の免疫実体と結合するエピトープが同一か異なるかを判定するステップと
を包含する、方法。
(1A)前記保存領域はフレームワーク領域またはその一部を含み、前記非保存領域は相補性決定領域(CDR)またはその一部を含む、項目1に記載の方法。
(1B)前記第一の免疫実体の保存領域と前記第二の免疫実体の保存領域とは、対応関係にある、項目1または1Aに記載の方法。
(2)前記免疫実体は抗体、抗体の抗原結合断片、B細胞受容体、B細胞受容体の断片、T細胞受容体、T細胞受容体の断片、キメラ抗原受容体(CAR)、またはこれらのいずれかまたは複数を含む細胞である、項目1、1Aまたは1Bに記載の方法。
(3)前記保存領域の同定は、Kabat、Chotia、改変Chotia、IMGTおよびHonneggerからなる群より選択される番号付け手法に基づいて行われる、項目1、1A、1Bまたは2に記載の方法。
(4)前記三次元構造モデルは、ホモロジーモデリング手法、分子動力学計算、フラグメントアセンブリ、モンテカルロシミュレーション、エネルギー最小化手法(焼きなまし法等)およびそれらのコンビネーションからなる群より選択されるモデリング手法によって
行われる、項目1、1A、1B、2または3に記載の方法。
(5)前記重ね合わせは、最小二乗法、行列対角化、特異値分解による平均二乗誤差の最小化、または動的計画法に基づく構造類似度のスコアの最適化からなる群より選択される手法に基づいて行われる、項目1、1A、1Bまたは2〜4のいずれかに記載の方法。
(6)前記重ね合わせは、1オングストローム以内の誤差で行われる、項目1、1A、1Bまたは2〜5のいずれかに記載の方法。
(7)前記類似度の決定において、同一残基の定義がなされる、項目1、1A、1Bまたは2〜6のいずれかに記載の方法。
(8)前記同一残基の定義はアラインメントに基づいて行われる、項目7に記載の方法。(9)前記アラインメントは、
A)与えられたCDR対のすべてのアミノ酸残基の構造類似度行列を計算する工程、およ

B)動的計画法に基づいて整列させる工程を包含し、
ここで、該CDR対の2つのCDRの座標をr1およびr2で表す場合、任意の2つの残基kおよびlの類似度Sklは以下のように定義され、
ここで、kおよびlの座標はそれぞれr1とr2で表され、
は2つのアミノ酸の座標の差からなるベクトルであり、d0は経験的に決定されるパラメー
タである、項目8に記載の方法。
(10)前記座標として、Cα原子または重心座標が使用される、項目9に記載の方法。
(11)前記類似度を表現する手法は、
以下:
(A)
の値を計算すること、ここで、この値が大きいことは、重なり合いが多いことを示す、および/または
(B)アミノ酸のアライメントを、グローバルな配列アライメント手法を用いて計算することを包含する、項目1、1A、1Bまたは2〜10のいずれかに記載の方法。
(12)前記類似度は、長さの違い、配列類似度および三次元構造類似度の少なくとも1つに基づいて決定される、項目1、1A、1Bまたは2〜11のいずれかに記載の方法。
(13)前記類似度は、少なくとも三次元構造類似度を含む、項目1、1A、1Bまたは2〜12のいずれかに記載の方法。
(14)前記類似度は、回帰的な手法、ニューラルネットワーク法や、サポートベクトルマシン、ランダムフォレストといった機械学習アルゴリズムからなる群より選択される、項目1、1A、1Bまたは2〜13のいずれかに記載の方法。
(15)項目1、1A、1Bまたは2〜14のいずれかに記載の方法をコンピュータに実行させるプログラム。
(16)項目1、1A、1Bまたは2〜14のいずれかに記載の方法をコンピュータに実行させるプログラムを格納した記録媒体。
(17)項目1、1A、1Bまたは2〜14のいずれかに記載の方法をコンピュータに実行させるプログラムを含むシステム。
(18)項目1、1A、1Bまたは2〜14のいずれかに記載の方法で同定された構造を有するエピトープまたは免疫実体結合物(例えば、抗原)。
(19) 前記エピトープについて、生体情報と関連付ける工程を包含するステップを包含する、項目1、1A、1Bまたは2〜14のいずれかに記載の方法。
(19A)前記分類したエピトープを同定する工程をさらに包含する、項目1、1A、1B、2〜14または19のいずれかに記載の方法。
(19B)前記同定は、アミノ酸配列の決定、三次元構造の同定、三次元構造以外の構造上の同定、および生物学的機能の同定からなる群より選択される少なくとも1つを含む、項目19Aに記載の方法。
(19C)前記同定は、前記エピトープの構造を決定することを含む、項目19Aまたは19Bに記載の方法。
(20)項目1、1A、1B、2〜14、19、19A、19Bまたは19Cのいずれかに記載の分類方法を用いて、結合するエピトープが同一である免疫実体を同一のクラスターに分類する工程を包含する、エピトープのクラスターを生成する方法。
(20A)前記免疫実体を、その特性および既知の免疫実体との類似性からなる群より選択される少なくとも1つの評価項目を評価し、所定の基準を満たした免疫実体を対象に前記クラスター分類を行うことを特徴とする、項目20に記載の方法。
(20B)複数の前記エピトープが同一である場合、該エピトープの三次元構造が少なくとも一部重複すると判断される、項目20または20Aに記載の方法。
(20C)複数の前記エピトープが同一である場合、該エピトープのアミノ酸配列が少なくとも一部重複すると判断される、項目20、20Aまたは20Bに記載の方法。
(21)項目20、20A、20Bまたは20Cに記載の方法で生成クラスターに基づき、前記免疫実体の保有者を既知の疾患または障害あるいは生体の状態と関連付ける工程を包含する、疾患または障害あるいは生体の状態の同定法。
(21A)項目20、20A、20Bまたは20Cに記載の方法で生成されたクラスターを一つまたは複数用いて、該クラスターの保有者の疾患または障害あるいは生体の状態を評価する工程を含む、疾患または障害あるいは生体の状態の同定法。
(21B)前記評価は、前記複数のクラスターの存在量の順位および/または存在比に基づく分析、または一定数のB細胞を調べ、その中に興味あるBCRと類似のもの/クラスターがあるかどうかという定量による分析からなる群より選択される少なくとも1つの指標を用いてなされる、項目21Aに記載の方法。
(21C)前記評価は、前記クラスター以外の指標も用いてなされる、項目21Aまたは21Bに記載の方法。
(21D)前記クラスター以外の指標は、疾患関連遺伝子、疾患関連遺伝子の多型、疾患関連遺伝子の発現プロファイル、エピジェネティクス解析、TCRおよびBCRのクラスターの組合せから選択される少なくとも1つを含む、項目21Cに記載の方法。
(21E)前記疾患または障害あるいは生体の状態の同定は、前記疾患または障害あるいは生体の状態の診断、予後、薬力学、予測、代替法の決定、患者層の特定、安全性の評価、毒性の評価、およびこれらのモニタリングからなる群より選択される少なくとも1つを含む、項目21、21A,21B,21Cまたは21Dのいずれかに記載の方法。
(21F)項目19に記載の方法で同定されたエピトープ、および/または項目20に記載の方法で生成されたクラスターを1つまたは複数用いて、疾患または障害あるいは生体の状態の指標となるバイオマーカーの評価を行う工程を含む、該バイオマーカーの評価のための方法。
(21G)項目19、19A,19Bまたは19Cに記載の方法で同定されたエピトープ、および/または項目20、20A、20Bまたは20Cに記載の方法で生成されたクラスターを1つまたは複数用いて、疾患または障害あるいは生体の状態との関連付け、バイオマーカーを決定する工程を含む、該バイオマーカーの同定のための方法。
(22)項目21、21A、21Bまたは21Cに基づいて同定されたエピトープに対する免疫実体を含む、前記生体情報の同定のための組成物。
(22A)項目21、21A、21Bまたは21Cに基づいて同定されたエピトープまたはそれを含む免疫実体結合物(例えば、抗原)を含む、前記生体情報の同定のための組成物。
(23)項目1に基づいて同定されたエピトープに対する免疫実体を含む、項目21に記載の疾患または障害あるいは生体の状態を診断するための組成物。
(23A)項目21、21A、21Bまたは21Cに基づいて同定されたエピトープに対する免疫実体を標的とする物質を含む、項目21に記載の疾患または障害あるいは生体の状態を診断するための組成物。
(23B)項目21、21A、21Bまたは21Cに基づいて同定されたエピトープまたはそれを含む免疫実体結合物(例えば、抗原)を含む、項目21に記載の疾患または障害あるいは生体の状態を診断するための組成物。
(24)項目1、1A、1B、2〜14、19、19A、19Bまたは19Cのいずれかに記載の方法に基づいて同定されたエピトープに対する免疫実体を含む、項目21に記載の疾患または障害あるいは生体の状態を治療または予防するための組成物。
(24A)前記免疫実体は、抗体、抗体の抗原結合断片、T細胞受容体、T細胞受容体の断片、B細胞受容体、B細胞受容体の断片、キメラ抗原受容体(CAR)、これらのいずれか
または複数を含む細胞(例えば、キメラ抗原受容体(CAR)を含むT細胞)からなる群より
選択される、項目22、22A、23、23A,23Bまたは24のいずれか1項に記載
の組成物。
(24B)項目21に基づいて同定されたエピトープに対する免疫実体を標的とする物質を含む、項目21に記載の疾患または障害あるいは生体の状態を予防または治療するための組成物。
(24C)項目21に基づいて同定されたエピトープまたはそれを含む免疫実体結合物(例えば、抗原)を含む、項目21に記載の疾患または障害あるいは生体の状態を治療または予防するための組成物。
(25)前記組成物はワクチンを含む、請求24に記載の組成物。
(25A)項目21に基づいて同定されたエピトープに対する免疫実体を含む、疾患または障害あるいは生体の状態を予防または治療するためのワクチンを評価するための組成物。
(26)第一の免疫実体(immunological entity)および第二の免疫実体について、結合するエピトープが同一か異なるかを分類する方法をコンピュータに実行させるコンピュータプログラムであって、該方法は、
(A)該第一の免疫実体および該第二の免疫実体のアミノ酸配列の保存領域を同定するステップと、
(B)該第一の免疫実体および該第二の免疫実体の三次元構造モデルを作成するステップと、
(C)該三次元構造モデルにおいて該第一の免疫実体の該保存領域と該第二の免疫実体の該保存領域とを重ね合わせるステップと、
(D)該重ね合わせ後の該三次元構造モデルにおいて、該第一の免疫実体の非保存領域と該第二の免疫実体の非保存領域との類似度を決定するステップと、
(E)該類似度に基づいて、該第一の免疫実体と結合するエピトープと該第二の免疫実体と結合するエピトープが同一か異なるかを判定するステップと
を包含する、プログラム。
(26A)前記項目に記載される1つまたは複数の特徴をさらに含む、項目26に記載のプログラム。
(27)第一の免疫実体(immunological entity)および第二の免疫実体について、結合するエピトープが同一か異なるかを分類する方法をコンピュータに実行させるコンピュータプログラムを格納した記録媒体であって、該方法は、
(A)該第一の免疫実体および該第二の免疫実体のアミノ酸配列の保存領域を同定するステップと、
(B)該第一の免疫実体および該第二の免疫実体の三次元構造モデルを作成するステップと、
(C)該三次元構造モデルにおいて該第一の免疫実体の該保存領域と該第二の免疫実体の該保存領域とを重ね合わせるステップと、
(D)該重ね合わせ後の該三次元構造モデルにおいて、該第一の免疫実体の非保存領域と該第二の免疫実体の非保存領域との類似度を決定するステップと、
(E)該類似度に基づいて、該第一の免疫実体と結合するエピトープと該第二の免疫実体と結合するエピトープが同一か異なるかを判定するステップと
を包含する、記録媒体。
(27A)前記項目に記載される1つまたは複数の特徴をさらに含む、項目27に記載の記録媒体。
(28)第一の免疫実体(immunological entity)および第二の免疫実体について、結合するエピトープが同一か異なるかを分類するシステムであって、該システムは、
(A)該第一の免疫実体および該第二の免疫実体のアミノ酸配列の保存領域を同定する保存領域同定部と、
(B)該第一の免疫実体および該第二の免疫実体の三次元構造モデルを作成する三次元構造モデル作成部と、
(C)該三次元構造モデルにおいて該第一の免疫実体の該保存領域と該第二の免疫実体の該保存領域とを重ね合わせる重ね合わせ部と、
(D)該重ね合わせ後の該三次元構造モデルにおいて、該第一の免疫実体の非保存領域と該第二の免疫実体の非保存領域との類似度を決定する類似度決定部と、
(E)該類似度に基づいて、該第一の免疫実体と結合するエピトープと該第二の免疫実体と結合するエピトープが同一か異なるかを判定する同一性判定部と
を包含する、システム。
(28A)前記項目に記載される1つまたは複数の特徴をさらに含む、項目28に記載のシステム。
本発明において、上記の1つまたは複数の特徴は、明示された組み合わせに加え、さらに組み合わせて提供され得ることが意図される。本発明のなおさらなる実施形態および利点は、必要に応じて以下の詳細な説明を読んで理解すれば、当業者に認識される。
抗体やTCRをエピトープごとにクラスタリングすることは実際的に大きな効果を生む。とりわけ、免疫実体結合物(例えば、抗原)またはエピトープごとに分けられたクラスターそれ自体が、免疫実体結合物(例えば、抗原)が同定されていなくても、価値のあるものである。このようなクラスタリングは幾つかの直接的な利益がある。例えば、別々の個体からの抗体、TCRレパトアの比較が可能になる(例:ドナーXはドナーYと比較して、クラスターZの発現が多い。)。また、疾患特異的、新規免疫実体結合物(例えば、抗原)やエピトープの発見の可能性。新規免疫実体結合物(例えば、抗原)の発見は創薬において極めて価値がある。加えて、興味あるエピトープに対する抗体の定量的評価。既存のプロテインチップと組み合わせることで、より定量的かつ、高解像度・高精度な情報が得られる。さらに言えば、下流の解析を容易化、低コスト化できる。例えば、N個のBCRまたはTCRをスクリーニングするのではなく、N個がM個(N>M)のクラスターに含まれているのであれば、M個のスクリーニングで済ませることができる。さらにまた、免疫実体結合物(例えば、抗原)またはエピトープ既知のBCR、TCRを用いたバーチャルスクリーニング(類似性探索による、免疫実体結合物(例えば、抗原)、エピトープの推定)。実験的なスクリーニングと相補的な技術になることも特徴であるといえる。
異なるアミノ酸配列を持つ抗体が同一のエピトープを認識し得るので、既存のバイオインフォマティクスツール、例えば配列アライメント、はエピトープごとの抗体のクラスタリングには妥当な手法とはいえない。また、構造バイオインフォマティクスにおいてはいわゆるタンパク質複合体構造を予測するドッキングや既知のタンパク質複合体の界面との類似性に基づいて複合体構造を予測する手法があるが、これらもエピトープごとの抗体のクラスタリングには妥当な手法とはいえない。TCRも同様の問題があるが、さらに免疫実体結合物(例えば、抗原)が1次元的なペプチドとそれを提示する分子であるMHCとの複合体であり、MHCそれ自体も多様であることが問題を複雑にしている。それゆえ、抗体やTCRを頑強な手法でエピトープごとにクラスタリングできる手法はこれまでの手法では不可能であった重要な発明である。
図1は、ヒト抗体の代表的模式図を示す。左パネルは重鎖および軽鎖を模し、右側の構造は、重鎖と軽鎖とがどのように構成されるかを示す。左側は配列レベル、右側は構造レベルでの模式図を示す。 図2は、重鎖および軽鎖をさらに領域に分けた模式図である。重鎖、軽鎖はそれぞれさらに可変領域と定常領域という2つの領域に分けられる。左側は配列レベル、右側は構造レベルでの模式図を示す。 図3は、可変領域のさらなる説明図である。可変領域はさらにフレームワーク領域等の保存領域と相補性決定領域(CDR)等の非保存領域に分けられ、それぞれCDR1、CDR2、CDR3とに分けられる。状態の定義は以下の通りである。1−3:非保存領域(例:CDR1−3);4:保存領域(例:フレームワーク領域);0:その他。 図4は、抗原において抗体と物理的に相互作用する領域であるエピトープの模式図である。 図5は、上パネルは、非保存領域の例であるCDRの模式図を示し、左に構造1、右に構造2を示す。下パネルの右側には、保存領域の例として、構造1と構造2のフレームワークの重ね合わせ模式図を示す。下パネルの右側には、等価な残基の定義を示す。この場合、(1,1)、(2,2)、(3、−)、(4,3)、(6,−)、(7,5)を示す。下パネルの矢印の下には構造類似度の行列を示す。 図6Aは、抗原をスーパーインポーズした抗体を示す(HIV Envタンパク質の例)。 図6Bは、抗体のネットワークの代表図を示す。 図7は、上グラフに本発明の実施例である(予測された構造を用いた)KOTAIプログラムを用いたトレーニングセットでのHIVと非HIVの分類を示す。左側(濃いグレー)にHIV、右側(薄いグレー)に非HIVを示す。下グラフには従来技術の(予測された構造を用いない)BLASTプログラムを用いたトレーニングセットでのHIVと非HIVの分類を示す。具体的には、特徴量をサポートベクターマシン(SVM)の学習に用いる。SVMは5分割交差検証によって以下のように評価する:1)全ての可能な抗HIV抗体対(同じ、または異なるエピトープに対する)をランダムに学習セットと検証セットに分ける;2)SVMは同じエピトープを認識する抗HIV抗体(positive)と異なるエピトープを認識する抗体(negative)とを区別するよう学習し、検証セットを用いて性能を検証する;および3)実施例1に示した通りの実験を行う。図7にはこの結果が示されている。 図8は、SVMによって各対の距離行列が出力された結果を示し、本発明を用いた場合の精度を示す。いずれパネルとも、最後に、全ての抗HIV抗体を距離行列を用いてクラスタリングした結果を示す。結果を真のネットワークとの類似性によって評価したものである。結果は、従来技術である配列類似性(プログラムBLASTによって得られたアライメントによる類似性)によってつくられたネットワークとともに示される。図8Aは、本発明を用いて提唱されたアルゴリズムエピトープネットワークの精度を示す。精度(改変Rand指数)は0.72と算出された。図8BはBLASTネットワークを用いて算出された精度で0と算出された。 図8は、SVMによって各対の距離行列が出力された結果を示し、本発明を用いた場合の精度を示す。いずれパネルとも、最後に、全ての抗HIV抗体を距離行列を用いてクラスタリングした結果を示す。結果を真のネットワークとの類似性によって評価したものである。結果は、従来技術である配列類似性(プログラムBLASTによって得られたアライメントによる類似性)によってつくられたネットワークとともに示される。図8Aは、本発明を用いて提唱されたアルゴリズムエピトープネットワークの精度を示す。精度(改変Rand指数)は0.72と算出された。図8BはBLASTネットワークを用いて算出された精度で0と算出された。 図9は、抗HIV、非抗HIV抗体をまとめたセットについても抗HIV抗体および非抗HIV抗体のSVMによって得られた距離行列によってクラスタリングした結果を示す。本発明を用いた場合の精度を示す。図9Aは、抗HIV抗体について、本発明を用いて提唱されたアルゴリズムエピトープネットワークの精度を示す。精度(改変Rand指数)は0.82と算出された。図9Bは非抗HIV抗体について、BLASTネットワークを用いて算出された精度で0と算出された 図9は、抗HIV、非抗HIV抗体をまとめたセットについても抗HIV抗体および非抗HIV抗体のSVMによって得られた距離行列によってクラスタリングした結果を示す。本発明を用いた場合の精度を示す。図9Aは、抗HIV抗体について、本発明を用いて提唱されたアルゴリズムエピトープネットワークの精度を示す。精度(改変Rand指数)は0.82と算出された。図9Bは非抗HIV抗体について、BLASTネットワークを用いて算出された精度で0と算出された 図10は本発明のシステム構成概要図である。 図11は本発明の模式的フローである。 図12は、実施例5で使用したエピトープ配列(CMV TCR データ)を示す。 図13は、実施例5(CMV特異的TCRのクラスタリング)の結果を示す。カーネル関数は”rbf”とし、class_weighオプションは”balanced”とした。閾値0.34とし、TCR対を2つのクラスに分け(対の距離が<0.34(左)と>=0.34(右))、それぞれに属するTCR対が同一のエピトープを認識しているかどうかを評価した結果である。 図14は、PDB中の2タイプの抗ヘマグルチニンBCRの模式図を示す。 図15は、抗ステムBCRおよび抗非ステムBCRを得るための実験設計を示す。 図16は、配列データの分析方法の3Dモデリング段階およびクラスタリング段階の手順(分析方法)を示す。 図17は、公知の抗HA PDBエントリー(図17A)および77個の抗HAマウスBCR(図17B)に関するStrucSim値の分布を示す。 図18は、ステムおよび非ステムクラスを異なるエピトープに分離するためのカットオフ(構造的特徴、StrucSim>=0.95)を示す。X軸は、評価値を示し、Y軸は頻度を示す。モデル内の特徴の分布を分析した後に厳密なカットオフを選択した。 図19は、Python NetworkX graphviz packageを使用して可視化した、ステム(三角)および非ステム(丸)のクラスターを示す。結合BCRは、提案した特徴によって十分に分離した。
以下、本発明を最良の形態を示しながら説明する。本明細書の全体にわたり、単数形の表現は、特に言及しない限り、その複数形の概念をも含むことが理解されるべきである。従って、単数形の冠詞(例えば、英語の場合は「a」、「an」、「the」など)は、特に言及しない限り、その複数形の概念をも含むことが理解されるべきである。また、本明細書において使用される用語は、特に言及しない限り、当該分野で通常用いられる意味で用いられることが理解されるべきである。したがって、他に定義されない限り、本明細書中で使用される全ての専門用語および科学技術用語は、本発明の属する分野の当業者によって一般的に理解されるのと同じ意味を有する。矛盾する場合、本明細書(定義を含めて)が優先する。
(定義)
以下に本明細書において特に使用される用語の定義および/または基本的技術内容を適宜説明する。
本明細書において「免疫実体(immunological entity)」とは、免疫反応を担う任意の物質をいう。免疫実体には、抗体、抗体の抗原結合断片、T細胞受容体、T細胞受容体の断片、B細胞受容体、B細胞受容体の断片、キメラ抗原受容体(CAR)、これらのいずれかまたは複数を含む細胞(例えば、キメラ抗原受容体(CAR)を含むT細胞(CAR−T))等が含まれる。免疫実体は広く考えることができ、アルパカ等の動物が産生するナノボディ(nanobody)や人工的に多様性(diversity)を持たせたファージディスプレイ等(これにはscFvやナノボディを含む)の解析で使用される免疫学的に関連する実体(entity)も同様に包含される。本明細書において「第一」および「第二」等(「第三」…等)の記載は、相互に異なる実体であることを示す。
本明細書において「抗体」とは、当該分野で通常使用されるのと同様の意義で用いられ、抗原が生体の免疫系と接触する(抗原刺激)ときに免疫系でつくられる,抗原と高度に特異的な反応をするタンパク質をいう。本発明で用いられるエピトープに対する抗体は、それぞれ、特定のエピトープに結合すればよく、その由来、種類、形状などは問われない。本明細書に記載される抗体はフレームワーク領域と抗原結合領域(CDR)とに分割することができる。
本明細書において「T細胞レセプター(TCR)」とは、T細胞受容体、T細胞抗原レセプター、T細胞抗原受容体ともいい、免疫系をつかさどるT細胞の細胞膜に発現する受容体(レセプター)をいい、抗原を認識する。α鎖、β鎖、γ鎖およびδ鎖が存在し、αβまたはγδの二量体を構成する。前者の組み合わせからなるTCRをαβTCR、後者の組み合わせからなるTCRをγδTCRと呼び、それぞれのTCRを持つT細胞はαβT細胞、γδT細胞と呼ばれる。構造的にB細胞の産生する抗体のFabフラグメントと非常に類似しており、MHC分子に結合した抗原分子を認識する。成熟T細胞の持つTCR遺伝子は遺伝子再編成を経ているため、一個体は多様性に富んだTCRを持ち、様々な抗原を認識することができる。TCRはさらに細胞膜に存在する不可変なCD3分子と結合し複合体を形成する。CD3は細胞内領域にITAM(immunoreceptor tyrosine−based activation motif)と呼ばれるアミノ酸配列を持ち、このモチーフが細胞内のシグナル伝達に関与するとされている。それぞれのTCR鎖は可変部(V)と定常部(C)から構成され、定常部は細胞膜を貫通して短い細胞質部分を持つ。可変部は細胞外に存在して、抗原−MHC複合体と結合する。可変部には超可変部、あるいは相補性決定領域(CDR)と呼ばれる領域が3つ存在し、この領域が抗原−MHC複合体と結合する。3つのCDRはそれぞれCDR1、CDR2、CDR3と呼ばれる。TCRの遺伝子再構成は免疫グロブリンとして知られるB細胞受容体の過程と同様である。αβTCRの遺伝子再編成ではまず、β鎖のVDJ再編成が行われ、続いてα鎖のVJ再編成が行われる。α鎖の再編成が行われる際にδ鎖の遺伝子は染色体上から欠失するため、αβTCRを持つT細胞がγδTCRを同時に持つことはない。逆にγδTCRを持つT細胞ではこのTCRを介したシグナルがβ鎖の発現を抑制するため、γδTCRを持つT細胞がαβTCRを同時に持つこともない。
本明細書において「B細胞レセプター(BCR)」とは、B細胞受容体、B細胞抗原レセプター、B細胞抗原受容体とも呼ばれ、膜結合型免疫グロブリン(mIg)分子と会合したIgα/Igβ(CD79a/CD79b)ヘテロ二量体(α/β)から構成されるものをいう。mIgサブユニットは抗原に結合し、受容体の凝集を起こすが、一方、α/βサブユニットは細胞内に向かってシグナルを伝達する。BCRが凝集すると、チロシンキナーゼのSyk及びBtkと同様に、SrcファミリーキナーゼのLyn、Blk、及びFynを速やかに活性化するといわれる。BCRシグナル伝達の複雑さによって多くの異なる結果が生じるが、その中には、生存、耐性(アネルギー;抗原に対する過敏反応の欠如)またはアポトーシス、細胞分裂、抗体産生細胞または記憶B細胞への分化などが含まれる。TCRの可変領域の配列が異なるT細胞が何億種類も生成し、またBCR(または抗体)の可変領域の配列が異なるB細胞が何億種類も生成する。TCRとBCRの個々の配列はゲノム配列の再構成や変異導入により異なるので、T細胞やB細胞の抗原特異性については、TCR・BCRのゲノム配列またはmRNA(cDNA)の配列を決定することにより手掛かりを得ることができる。
本明細書において「キメラ抗原受容体(CAR)」とは、腫瘍抗原に特異的なモノクローナル抗体可変領域の軽鎖(VL)と重鎖(VH)を直列に結合させた単鎖抗体(scFv)をN末端側に,T細胞受容体(TCR)ζ鎖をC末端側に持つキメラ蛋白の総称であり、腫瘍免疫回避機構に打ち勝つための遺伝子操作を加えた人工T細胞受容体を患者T細胞に遺伝子導入し,そのT細胞を体外で増幅培養した後に患者に輸注するという遺伝子・細胞治療法において使用される人工T細胞受容体である(Dotti G,et al..Hum Gene Ther 20: 1229−1239, 2009)。本発明により同定またはクラスター化されたエピトープを用いて、このようなCARを生産することができ、生産されたCARまたはそれを含む遺伝子改変T細胞を用いて遺伝子細胞治療法を実現することができる(Credit: Brentjens R, et al. “Driving CAR T cells forward.” Nat Rev Clin Oncol. 2016 13, 370-383等を参照)。
本明細書において「遺伝子領域」とは、フレームワーク領域および抗原結合領域(CDR)や、V領域、D領域、J領域およびC領域等の各領域をさす。このような遺伝子領域は、当該分野で公知であり、データベース等を参酌して適宜決定することができる。本明細書において遺伝子の「相同性」とは、2以上の遺伝子配列の、互いに対する同一性の程度をいい、一般に「相同性」を有するとは、同一性または類似性の程度が高いことをいう。従って、ある2つの遺伝子の相同性が高いほど、それらの配列の同一性または類似性は高い。2種類の遺伝子が相同性を有するか否かは、配列の直接の比較、または核酸の場合ストリンジェントな条件下でのハイブリダイゼーション法によって調べられ得る。本明細書において「相同性検索」とは、相同性の検索をいう。好ましくは、コンピュータを用いてインシリコで行うことができる。
本明細書において「V領域」とは、抗体、TCRまたはBCR等の免疫実体の可変領域の可変部(V)領域をいう。
本明細書において「D領域」とは、抗体、TCRまたはBCR等の免疫実体の可変領域のD領域をいう。
本明細書において「J領域」とは、抗体、TCRまたはBCR等の免疫実体の可変領域のJ領域をいう。
本明細書において「C領域」とは、抗体、TCRまたはBCR等の免疫実体の定常部(C)領域をいう。
本明細書において「可変領域のレパトア(repertoire)」とは、TCRまたはBCRで遺伝子再構成により任意に作り出されたV(D)J領域の集合をいう。TCRレパトア、BCRレパトア等と熟語で使用されるが、これらは例えば、T細胞レパトア、B細胞レパトアなどと称されることもある。例えば、「T細胞レパトア」とは、抗原認識または免疫実体結合物の認識において重要な役割を果たすT細胞レセプター(TCR)の発現によって特徴づけられるリンパ球の集合をいう。T細胞レパトアの変化は、生理的状態および疾患状態における免疫状態の有意な指標をもたらすため、T細胞レパトア解析は、疾患の発症に関与する抗原特異性T細胞の同定およびTリンパ球の異常の診断のために行われてきた。
TCRやBCRはゲノム上に存在する複数のV領域、D領域、J領域、C領域の遺伝子断片の遺伝子再構成によって、多様な遺伝子配列を創出している。
本明細書において「アイソタイプ」とは、IgM、IgA、IgG、IgEおよびIgD等において、同じタイプに属するが、相互に配列が異なるタイプを言う。アイソタイプは種々の遺伝子の略称や記号を用いて表示される。
本明細書において「サブタイプ」とは、BCRの場合IgAおよびIgGにおいて存在するタイプ内のタイプであって、IgGについては、IgG1、IgG2、IgG3もしくはIgG4、IgAについてはIgA1もしくはIgA2が存在する。TCRについても、β鎖およびγ鎖において存在することが知られており、それぞれTRBC1,TRBC2、あるいはTRGC1,TRGC2が存在する。
本明細書において「免疫実体結合体」とは、抗体、TCRまたはBCR等の免疫実体によって特異的に結合され得る任意の基質をいう。本明細書において「抗原」と称した場合、広義には「免疫実体結合物」を指すことがあるが、当該分野において「抗原」とは狭義には抗体と対で用いられることがあり、狭義には「抗原」は「抗体」に特異的に結合され得る任意の基質をいう。
本明細書において「エピトープ」とは、抗体またはリンパ球レセプター(TCR、BCR等)等の免疫実体が結合する免疫実体結合物(例えば、抗原)分子中の部位をいう。アミノ酸の直鎖がエピトープを構成することもあるが(直鎖状エピトープ)、タンパク質の離れた部分が立体構造を構成しエピトープとして機能することもある(コンフォメーショナルエピトープ)。本発明が対象とするエピトープはこのようなエピトープの詳細な分類は問わない。ある抗体等の免疫実体に関してエピトープが同じであれば、他の配列を有する抗体等の免疫実体であっても同様に利用することができることが理解される。
本明細書においてエピトープが「同一」か「異なる」かは、本発明に基づく分類に従って、類似度(アミノ酸配列、三次元構造等)によって判断することができる。「同一」は、アミノ酸配列が完全同一に同一するというものではなく、立体構造が実質的に同質であることをいい、同一のエピトープのクラスターに属するエピトープは本発明では「同一」と判断される。従って、「異なる」エピトープとは、「同一」のクラスターに属するものではないエピトープを指す。一つの実施形態では、エピトープが「同一」か「異なる」かによって、同一のクラスターに属するかどうかを決定することができる。クラスター分析を行った場合、あるエピトープは、別のエピトープと比較して同じクラスターに属する場合は同一と判断し、別のクラスターに属する場合は異なると判断する。したがって、結合するエピトープが同一である免疫実体を同一のクラスターに分類し、クラスターを生成することもできる。また、免疫実体を、その特性および既知の免疫実体との類似性からなる群より選択される少なくとも1つの評価項目を評価し、所定の基準を満たした免疫実体を対象に前記クラスター分類を行うことができる。したがって、1つの実施形態では、エピトープが同一である場合、該エピトープの三次元構造が少なくとも一部重複あるいはすべて重複することがあり、あるいは、該エピトープのアミノ酸配列が少なくとも一部あるいはすべて重複することがある。重要な指標としては、確実に確認できる構造データ等とよく合うように閾値を決めるのが適切であるが、統計学的有意性を重視する場合、他の閾値を採用することもあり得、当業者は状況に応じて本明細書の記載を参考に適宜閾値を設定することができる。例えば、階層的クラスタリング手法(例えば、群平均法(average linkage clustering)、最短距離法(NN法)、K−NN法、Ward法、再長距離砲、重心法)を用いてクラスタリング分析をした場合に求められる最大距離が特定の値未満のものを同一クラスターとみなすことができる。このような値としては、1未満、0.95未満、0.9未満、0.85未満、0.8未満、0.75未満、0.7未満、0.65未満、0.6未満、0.55未満、0.5未満、0.45未満、0.4未満、0.35未満、0.3未満、0.25未満、0.2未満、0.15未満、0.1未満、0.05未満などを挙げることができるがこれらに限定されない。クラスタリング手法としては階層的手法に限られず、非階層的手法を用いてもよい。
本明細書においてエピトープの「クラスター」とは、一般に、ある集団の要素(この場合エピトープ)を,外的基準や群の数の指定なしに,多次元空間における要素の分布から、類似したものを集めたものをいい、本明細書では、多数のエピトープのうち類似したものを集めたものをいう。同一のクラスターに属するエピトープには、同様の抗体が結合する。多変量解析によって分類することができ、種々のクラスター分析手法を用いてクラスターを構成することができる。本発明が提供するエピトープのクラスターは、そのクラスターへ属していることを示すことにより、生体内の状態(例えば、疾患、障害や薬効、特に免疫状態等)を反映することが示された。
本明細書において「類似度」とは、免疫実体結合物(例えば、抗原)、エピトープ等の分子またはその一部について、分子が類似している度合いをいう。類似度は、長さの違い、配列類似度および三次元構造類似度などに基づいて決定することができ、一般に広義の「構造類似度」もこの概念に入る。理論に束縛されることを望まないが、本発明の一部の実施形態では、この類似度に基づいてエピトープの分類したところ、同一のクラスターに属するエピトープに結合する抗体、TCR、BCR等は、同一のカテゴリーに入る疾患、障害、症状や生理現象等に割り当てられ得ることが理解される。従って、本発明の手法を用いて同じエピトープクラスターに反応する抗体、TCR、BCR等を有するかどうかを調べることによって、各種の診断(がんの罹患、投与薬の適合性等)を行うことができる。
本明細書において「類似性スコア」とは、類似性を示す具体的な数値をいい、「類似度」ともいう。構造類似度を計算した場合に使用される技法に応じて、適宜適切なスコアが採用されうる。類似性スコアは、例えば、回帰的な手法、ニューラルネットワーク法や、サポートベクトルマシン、ランダムフォレストといった機械学習アルゴリズムなどを用いて算出することができる。
本明細書において、「保存領域」とは、免疫実体について言及するとき、複数の免疫実体にわたり構造が保存されている領域をいう。保存領域としては、例えば、抗体等のフレームワーク領域またはその一部が挙げられるが、それらに限定されない。
本明細書において「非保存領域」とは、免疫実体に言及するとき、複数の免疫実体にわたり構造が保存されていない領域を言う。非保存領域としては、例えば、抗体等の相補性決定領域(CDR)またはその一部を挙げることができるが、それらに限定されない。
本明細書において「相補性決定領域(CDR)」とは、抗体等の免疫実体において、実際に免疫実体結合物(例えば、抗原)に接触して結合部位を形成している領域である。一般的にCDRは、抗体および抗体に相当する分子(免疫実体)のFv(重鎖可変領域(VH)および軽鎖可変領域(VL)を含む)上に位置している。また一般的にCDRは、5〜30アミノ酸残基程度からなるCDR1、CDR2、CDR3が存在する。そして、抗原抗体反応では、特に重鎖のCDRが抗体の抗原への結合に寄与していることが知られている。またCDRの中でも、CDR3、特にCDR−H3が抗体の抗原への結合における寄与が最も高いことが知られている。例えば、"Willy et al., Biochemical and Biophysical Research Communications Volume 356, Issue 1, 27 April 2007, Pages 124-128"には、重鎖CDR3を改変させることで抗体の結合能を上昇させたことが記載されている。CDRの定義およびその位置を決定する方法は複数報告されている。例えば、Kabatの定義(Sequences of Proteins of Immunological Interest, 5th ed., Public Health Service, National Institutes of Health, Bethesda, MD. (1991))、またはChothiaの定義(Chothia et al., J. Mol. Biol.,1987;196:901-917)を採用してもよい。本発明の一実施形態においては、Kabatの定義を好適な例として採用するが、必ずしもこれに限定されない。また、場合によっては、Kabatの定義とChothiaの定義の両方を考慮して決定しても良く(改変Chothia法)、例えば、各々の定義によるCDRの重複部分を、または各々の定義によるCDRの両方を含んだ部分をCDRとすることもでき、あるいはIMGTまたはHoneggerに従って決定することもできる。そのような方法の具体例としては、Kabatの定義とChothiaの定義の折衷案である、Oxford Molecular's AbM antibody modeling softwareを用いたMartinらの方法(Proc. Natl. Acad. Sci. USA, 1989;86:9268-9272)がある。このようなCDRの情報を用いて、本発明を実施することができる。本明細書において「CDR3」とは、3つめの相補性決定領域(complementarity−determining region: CDR)をいい、ここで、CDRとは、可変領域のうち、直接免疫実体結合物(例えば、抗原)と接触する領域は特に変化が大きく、この超可変領域のことをいう。軽鎖と重鎖の可変領域に、それぞれ3つのCDR(CDR1〜CDR3)と、3つのCDRを取り囲む4つのFR(FR1〜FR4)が存在する。CDR3領域は、V領域、D領域、J領域にまたがって存在するとされているため、可変領域の鍵を握るといわれており、分析対象として用いられる。
本明細書において「フレームワーク領域」とは、CDR以外のFv領域の領域をいい、通常FR1、FR2、FR3およびFR4からなり、抗体間で比較的よく保存されているとされる(Kabat et al.,「Sequence of Proteins of Immunological Interest」US Dept. Health and Human Services,1983.)。それゆえ、本発明において、各配列の比較の際にフレームワーク領域を固定する手法を採用しうる。
本明細書においてアミノ酸配列等の領域の「同定」とは、アミノ酸配列をある観点で特徴づけることをいい、一つの性質を有する特徴で定められる領域を定めることをいう。同定には、具体的にアミノ酸番号を含む領域を特定すること、それらの領域に関する特徴をリンクさせることなどが含まれるがこれらに限定されない。本明細書においてアミノ酸配列等の領域の「分割」とは、アミノ酸配列を特徴づけたのち、一つの性質を有する特徴で定められる領域ごとに区別し別々の領域にすることをいう。このような同定および分割は、バイオインフォマティクス分野で使用される任意の技術、例えばKabat、Chotia、改変Chotia、IMGT、Honegger等を用いて実施することができる。本明細書において、アミノ酸配列等の領域の処理の際、フレームワーク等に例示される保存領域を同定することが一つの重要な特徴であり、同定の結果、保存領域と非保存領域(例えば、CDR等)とに分割されることも想定される。2つ以上の免疫実体の保存領域または非保存領域の一部を同定して重ね合わせを行う場合、それぞれの免疫実体の一部は実質的に対応関係にあることが好ましい。本明細書において「対応関係」にあるとは、保存領域についていう場合は、第一の免疫実体の一部と、第二の免疫実体の一部とについて、三次元構造の位置を考慮したときに互いに重ね合わせられ得る関係にある。非保存領域の場合は、本明細書において説明される同一残基の定義を行うことで、三次元構造の位置を考慮したときに互いに対応するアミノ酸残基が存在することになる。したがって、「対応関係」は、配列等のアラインメントまたは同一残基の同定などを行うことによって確認することができる。
本明細書において「三次元構造モデル」とは、抗体等の免疫実体を含むタンパク質の高分子についていう場合、そのタンパク質等のアミノ酸配列をもとに構築された三次元構造(三次構造、立体配座、コンフォメーション)のモデルをいい、そのモデルを作成することをモデリングともいう。タンパク質のアミノ酸配列は一次構造と呼ばれ、生体内において、ほとんどのタンパク質の一次構造は、折り畳み(folding)などを経て、一意的に三次元構造をとる。三次元構造モデルの作成(モデリング)の手法としては、例えば、ホモロジーモデリング手法、分子動力学計算、フラグメントアセンブリ、およびそれらの組み合わせなどを挙げることができるがそれらに限定されない。
本明細書において「重ね合わせ」(superpose)とは、ある免疫実体等の分子の立体構造と、別の免疫実体等の分子の立体構造とを重ね合わせることをいい、代表的には、分子の各原子の位置、座標などを重ね合わせることで実施することができる。重ね合わせの際には、例えば、行列対角化、特異値分解による平均二乗誤差の最小化を利用して、できるだけ近似させて重ね合わせることができる。通常数オングストローム(約2Å、約3Å、約4Å、約5Å、約6Å、約7Å、約8Å、約9Å等)等で、好ましい実施形態では、1オングストロームの誤差で重ね合わせることができる。
本明細書において「同一残基の定義」とは、2つの免疫実体(例えば、抗体、TCR、BCR等)を重ね合わせたときに、構造類似度を決定する際、構造的に、すなわち三次元構造の位置を考慮したときに互いに対応するアミノ酸残基を決定することをいう。場合によっては、一方のアミノ酸に対応するアミノ酸が他方のアミノ酸にないこともあるため、その際は同一残基はなしと定義される。
本明細書において「アラインメント」(英語では、alignment(名詞)またはalign(動詞))とは、アライメント、整列とも言い、バイオインフォマティクスにおいて、DNAやRNA、タンパク質の一次構造の類似した領域を特定できるように並べたものをいう。機能的、構造的、あるいは進化的な配列の関係性を知るヒントを与えることが多い。アラインメントされたアミノ酸残基等の配列は、典型的には行列の行として表現され、同一あるいは類似性質の配列が同じ列に並ぶようギャップが挿入される。2つの配列を比較する場合は、ペアワイズシーケンスアラインメントと称され、2配列間でのアラインメントで、部分的、あるいは全体の類似性を詳しく調べるときに用いる。アラインメントには、代表的には動的計画法を用いることができ、代表的な手法として、グローバルアラインメントについてはNeedleman−Wunsch法(ニードルマン=ウンシュ法)、ローカルアライメントについてはSmith−Waterman法(スミス=ウォーターマン法)を利用することができる。ここで、グローバルアラインメントとは配列中の全残基がアラインメントされるようにしたもので、ほぼ同じ長さの配列間での比較に有効である。ローカルアラインメントは、配列が全体としては似ておらず、部分的類似を見つけたい場合に有効である。本明細書において「ミスマッチ」とは、核酸配列、アミノ酸配列等をアラインメントしたときに、互いに同一ではない塩基またはアミノ酸が存在することをいう。「ギャップ」は、アラインメントにおいて、一方には存在するが他方には存在しない塩基またはアミノ酸が存在することをいう。
本明細書において「アサイン」とは、ある配列(例えば、核酸配列、タンパク質配列等)に、特定の遺伝子名、機能、特徴領域(例えば、V領域、J領域など)等情報を割り当てることをいう。具体的には、ある配列に特定の情報を入力またはリンクさせる等により達成することができる。
本明細書において「特異的」とは、対象となる配列に結合するが、少なくとも対象となる抗体、TCRまたはBCRのプールにおいて、好ましくは存在する抗体、TCRまたはBCRの配列すべてにおいて、他の配列とは結合性が低い、好ましくは結合しないことをいう。特異的な配列は好ましくは対象となる配列に対して完全に相補的であることが有利であるが、必ずしも限定されない。
本明細書において「タンパク質」、「ポリペプチド」、「オリゴペプチド」および「ペプチド」は、本明細書において同じ意味で使用され、任意の長さのアミノ酸のポリマーをいう。このポリマーは、直鎖であっても分岐していてもよく、環状であってもよい。アミノ酸は、天然のものであっても非天然のものであってもよく、改変されたアミノ酸であってもよい。この用語はまた、複数のポリペプチド鎖の複合体へとアセンブルされたものを包含し得る。この用語はまた、天然または人工的に改変されたアミノ酸ポリマーも包含する。そのような改変としては、例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化または任意の他の操作もしくは改変(例えば、標識成分との結合体化)が包含される。この定義にはまた、例えば、アミノ酸の1または2以上のアナログを含むポリペプチド(例えば、非天然アミノ酸などを含む)、ペプチド様化合物(例えば、ペプトイド)および当該分野において公知の他の改変が包含される。
本明細書において、「アミノ酸」は、本発明の目的を満たす限り、天然のものでも非天然のものでもよい。
本明細書において「ポリヌクレオチド」、「オリゴヌクレオチド」および「核酸」は、本明細書において同じ意味で使用され、任意の長さのヌクレオチドのポリマーをいう。この用語はまた、「オリゴヌクレオチド誘導体」または「ポリヌクレオチド誘導体」を含む。「オリゴヌクレオチド誘導体」または「ポリヌクレオチド誘導体」とは、ヌクレオチドの誘導体を含むか、またはヌクレオチド間の結合が通常とは異なるオリゴヌクレオチドまたはポリヌクレオチドをいい、互換的に使用される。そのようなオリゴヌクレオチドとして具体的には、例えば、2’−O−メチル−リボヌクレオチド、オリゴヌクレオチド中のリン酸ジエステル結合がホスホロチオエート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリン酸ジエステル結合がN3’−P5’ホスホロアミデート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースとリン酸ジエステル結合とがペプチド核酸結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5プロピニルウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5チアゾールウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがC−5プロピニルシトシンで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがフェノキサジン修飾シトシン(phenoxazine-modified cytosine)で置換されたオリゴヌクレオチド誘導体、DNA中のリボースが2’−O−プロピルリボースで置換されたオリゴヌクレオチド誘導体およびオリゴヌクレオチド中のリボースが2’−メトキシエトキシリボースで置換されたオリゴヌクレオチド誘導体などが例示される。他にそうではないと示されなければ、特定の核酸配列はまた、明示的に示された配列と同様に、その保存的に改変された改変体(例えば、縮重コドン置換体)および相補配列を包含することが企図される。具体的には、縮重コドン置換体は、1またはそれ以上の選択された(または、すべての)コドンの3番目の位置が混合塩基および/またはデオキシイノシン残基で置換された配列を作成することにより達成され得る(Batzer et al., Nucleic Acid Res.19:5081(1991); Ohtsuka et al., J. Biol. Chem. 260: 2605-2608(1985); Rossolini et al., Mol .Cell. Probes 8:91-98(1994))。本明細書において「核酸」はまた、遺伝子、cDNA、mRNA、オリゴヌクレオチド、およびポリヌクレオチドと互換可能に使用される。本明細書において「ヌクレオチド」は、天然のものでも非天然のものでもよい。
本明細書において「遺伝子」とは、遺伝形質を規定する因子をいう。通常染色体上に一定の順序に配列している。タンパク質の一次構造を規定する遺伝子を構造遺伝子といい、その発現を左右する遺伝子を調節遺伝子という。本明細書では、「遺伝子」は、「ポリヌクレオチド」、「オリゴヌクレオチド」および「核酸」をさすことがある。「遺伝子産物」とは、遺伝子に基づいて産生された物質でありタンパク質、mRNAなどをさす。
本明細書において遺伝子の「相同性」とは、2以上の遺伝子配列の、互いに対する同一性の程度をいい、一般に「相同性」を有するとは、同一性または類似性の程度が高いことをいう。従って、ある2つの遺伝子の相同性が高いほど、それらの配列の同一性または類似性は高い。2種類の遺伝子が相同性を有するか否かは、配列の直接の比較、または核酸の場合ストリンジェントな条件下でのハイブリダイゼーション法によって調べられ得る。2つの遺伝子配列を直接比較する場合、その遺伝子配列間でDNA配列が、代表的には少なくとも50%同一である場合、好ましくは少なくとも70%同一である場合、より好ましくは少なくとも80%、90%、95%、96%、97%、98%または99%同一である場合、それらの遺伝子は相同性を有する。従って本明細書において「相同体」または「相同遺伝子産物」は、本明細書にさらに記載する複合体のタンパク質構成要素と同じ生物学的機能を発揮する、別の種、好ましくは哺乳動物におけるタンパク質を意味する。
アミノ酸は、その一般に公知の3文字記号か、またはIUPAC−IUB Biochemical Nomenclature Commissionにより推奨される1文字記号のいずれかにより、本明細書中で言及され得る。ヌクレオチドも同様に、一般に認知された1文字コードにより言及され得る。本明細書では、アミノ酸配列および塩基配列の類似性、同一性および相同性の比較は、配列分析用ツールであるBLASTを用いてデフォルトパラメータを用いて算出される。同一性の検索は例えば、NCBIのBLAST 2.2.28(2013.4.2発行)を用いて行うことができる。本明細書における同一性の値は通常は上記BLASTを用い、デフォルトの条件でアラインした際の値をいう。ただし、パラメータの変更により、より高い値が出る場合は、最も高い値を同一性の値とする。複数の領域で同一性が評価される場合はそのうちの最も高い値を同一性の値とする。類似性は、同一性に加え、類似のアミノ酸についても計算に入れた数値である。
本明細書において「フラグメント(断片)」とは、全長のポリペプチドまたはポリヌクレオチド(長さがn)に対して、1〜n−1までの配列長さを有するポリペプチドまたはポリヌクレオチドをいう。フラグメントの長さは、その目的に応じて、適宜変更することができ、例えば、その長さの下限としては、ポリペプチドの場合、3、4、5、6、7、8、9、10、15、20、25、30、40、50およびそれ以上のアミノ酸が挙げられ、ここの具体的に列挙していない整数で表される長さ(例えば、11など)もまた、下限として適切であり得る。また、ポリヌクレオチドの場合、5、6、7、8、9、10、15、20、25、30、40、50、75、100およびそれ以上のヌクレオチドが挙げられ、ここの具体的に列挙していない整数で表される長さ(例えば、11など)もまた、下限として適切であり得る。本明細書において、このようなフラグメントは、例えば、全長のものがマーカーとして機能する場合、そのフラグメント自体もまたマーカーとしての機能を有する限り、本発明の範囲内に入ることが理解される。
本発明で用いられるIgG等の分子のアイソタイプ等の機能的等価物は、データベース等を検索することによって、見出すことができる。本明細書において「検索」とは、電子的にまたは生物学的あるいは他の方法により、好ましくは電子的に、ある核酸塩基配列を利用して、特定の機能および/または性質を有する他の核酸塩基配列を見出すことをいう。電子的な検索としては、BLAST(Altschul et al., J.Mol.Biol. 215:403-410(1990))、FASTA(Pearson & Lipman, Proc.Natl.Acad.Sci.,USA 85:2444-2448(1988))、Smith and Waterman法(Smith and Waterman, J.Mol.Biol. 147:195-197(1981))、およびNeedleman and Wunsch法(Needleman and Wunsch, J.Mol.Biol. 48: 443-453(1970))などが挙げられるがそれらに限定されない。BLASTが代表的に用いられている。生物学的な検索としては、ストリンジェントハイブリダイゼーション、ゲノムDNAをナイロンメンブレン等に貼り付けたマクロアレイまたはガラス板に貼り付けたマイクロアレイ(マイクロアレイアッセイ)、PCRおよびin situハイブリダイゼーションなどが挙げられるがそれらに限定されない。本明細書において、本発明において使用される遺伝子には、このような電子的検索、生物学的検索によって同定された対応遺伝子も含まれるべきであることが意図される。
本発明の機能的等価物としては、アミノ酸配列において、1もしくは複数個のアミノ酸の挿入、置換もしくは欠失、またはその一方もしくは両末端への付加されたものを用いることができる。本明細書において、「アミノ酸配列において、1もしくは複数個のアミノ酸の挿入、置換もしくは欠失、またはその一方もしくは両末端への付加」とは、部位特異的変異誘発法等の周知の技術的方法により、あるいは天然の変異により、天然に生じ得る程度の複数個の数のアミノ酸の置換等により改変がなされていることを意味する。分子の改変アミノ酸配列は、例えば1〜30個、好ましくは1〜20個、より好ましくは1〜9個、さらに好ましくは1〜5個、特に好ましくは1〜2個のアミノ酸の挿入、置換、もしくは欠失、またはその一方もしくは両末端への付加がなされたものであることができる。改変アミノ酸配列は、好ましくは、そのアミノ酸配列が、対象の分子のアミノ酸配列において1または複数個(好ましくは1もしくは数個または1、2、3、もしくは4個)の保存的置換を有するアミノ酸配列であってもよい。ここで「保存的置換」とは、タンパク質の機能を実質的に改変しないように、1または複数個のアミノ酸残基を、別の化学的に類似したアミノ酸残基で置換えることを意味する。例えば、ある疎水性残基を別の疎水性残基によって置換する場合、ある極性残基を同じ電荷を有する別の極性残基によって置換する場合などが挙げられる。このような置換を行うことができる機能的に類似のアミノ酸は、アミノ酸毎に当該分野において公知である。具体例を挙げると、非極性(疎水性)アミノ酸としては、アラニン、バリン、イソロイシン、ロイシン、プロリン、トリプトファン、フェニルアラニン、メチオニンなどが挙げられる。極性(中性)アミノ酸としては、グリシン、セリン、スレオニン、チロシン、グルタミン、アスパラギン、システインなどが挙げられる。陽電荷をもつ(塩基性)アミノ酸としては、アルギニン、ヒスチジン、リジンなどが挙げられる。また、負電荷をもつ(酸性)アミノ酸としては、アスパラギン酸、グルタミン酸などが挙げられる。
本明細書において「精製された」物質または生物学的因子(例えば、核酸またはタンパク質など)とは、その生物学的因子に天然に随伴する因子の少なくとも一部が除去されたものをいう。従って、通常、精製された生物学的因子におけるその生物学的因子の純度は、その生物学的因子が通常存在する状態よりも高い(すなわち濃縮されている)。本明細書中で使用される用語「精製された」は、好ましくは少なくとも75重量%、より好ましくは少なくとも85重量%、よりさらに好ましくは少なくとも95重量%、そして最も好ましくは少なくとも98重量%の、同型の生物学的因子が存在することを意味する。本発明で用いられる物質は、好ましくは「精製された」物質である。本明細書において「単離」されたとは、天然に存在する状態で付随する任意のものを少なくとも1つ除去したものをいい、例えば、ゲノム配列からその特定の遺伝子配列を取り出した場合も単離といいうる。
本明細書において「対応する」アミノ酸または核酸とは、あるポリペプチド分子またはポリヌクレオチド分子において、比較の基準となるポリペプチドまたはポリヌクレオチドにおける所定のアミノ酸またはヌクレオチドと同様の作用を有するか、または有することが予測されるアミノ酸またはヌクレオチドをいい、例えば、酵素分子にあっては、活性部位中の同様の位置に存在し触媒活性に同様の寄与をするアミノ酸をいう。例えば、アンチセンス分子であれば、そのアンチセンス分子の特定の部分に対応するオルソログにおける同様の部分であり得る。対応するアミノ酸を調査する際には同一残基を定義することが好ましい。対応するアミノ酸は、例えば、システイン化、グルタチオン化、S−S結合形成、酸化(例えば、メチオニン側鎖の酸化)、ホルミル化、アセチル化、リン酸化、糖鎖付加、ミリスチル化などがされる特定のアミノ酸であり得る。あるいは、対応するアミノ酸は、二量体化を担うアミノ酸であり得る。このような「対応する」アミノ酸または核酸は、一定範囲にわたる領域またはドメイン(例えば、V領域、D領域等)であってもよい。従って、そのような場合、本明細書において「対応する」領域またはドメインと称される。
本明細書において「マーカー(物質、タンパク質または遺伝子(核酸))」とは、ある状態(例えば、正常細胞状態、形質転換状態、疾患状態、障害状態、あるいは増殖能、分化状態のレベル、有無等)にあるかまたはその危険性があるかどうかを追跡する示標となる物質をいう。このようなマーカーとしては、遺伝子(核酸=DNAレベル)、遺伝子産物(mRNA、タンパク質など)、代謝物質、酵素などを挙げることができる。本発明において、ある状態(例えば、分化障害などの疾患)についての検出、診断、予備的検出、予測または事前診断は、その状態に関連するマーカーに特異的な薬剤、剤、因子または手段、あるいはそれらを含む組成物、キットまたはシステム等を用いて実現することができる。本明細書において、「遺伝子産物」とは、遺伝子によってコードされるタンパク質またはmRNAをいう。
本明細書において「被験体」とは、本発明の診断または検出等の対象となる対象(例えば、ヒト等の生物または生物から取り出した器官あるいは細胞等)をいう。
本明細書において「試料」とは、被験体等から得られた任意の物質をいい、例えば、細胞等が含まれる。当業者は本明細書の記載をもとに適宜好ましい試料を選択することができる。
本明細書において「薬剤」、「剤」または「因子」(いずれも英語ではagentに相当する)は、広義には、交換可能に使用され、意図する目的を達成することができる限りどのような物質または他の要素(例えば、光、放射能、熱、電気などのエネルギー)でもあってもよい。そのような物質としては、例えば、タンパク質、ポリペプチド、オリゴペプチド、ペプチド、ポリヌクレオチド、オリゴヌクレオチド、ヌクレオチド、核酸(例えば、cDNA、ゲノムDNAのようなDNA、mRNAのようなRNAを含む)、ポリサッカリド、オリゴサッカリド、脂質、有機低分子(例えば、ホルモン、リガンド、情報伝達物質、有機低分子、コンビナトリアルケミストリで合成された分子、医薬品として利用され得る低分子(例えば、低分子リガンドなど)など)、これらの複合分子が挙げられるがそれらに限定されない。ポリヌクレオチドに対して特異的な因子としては、代表的には、そのポリヌクレオチドの配列に対して一定の配列相同性を(例えば、70%以上の配列同一性)もって相補性を有するポリヌクレオチド、プロモーター領域に結合する転写因子のようなポリペプチドなどが挙げられるがそれらに限定されない。ポリペプチドに対して特異的な因子としては、代表的には、そのポリペプチドに対して特異的に指向された抗体またはその誘導体あるいはその類似物(例えば、単鎖抗体)、そのポリペプチドがレセプターまたはリガンドである場合の特異的なリガンドまたはレセプター、そのポリペプチドが酵素である場合、その基質などが挙げられるがそれらに限定されない。
本明細書において「検出剤」とは、広義には、目的の対象を検出することができるあらゆる薬剤をいう。
本明細書において「診断剤」とは、広義には、目的の状態(例えば、疾患など)を診断することができるあらゆる薬剤をいう。
本発明の検出剤は、検出可能とする部分(例えば、抗体等)に他の物質(例えば、標識等)を結合させた複合体または複合分子であってもよい。本明細書において使用される場合、「複合体」または「複合分子」とは、2以上の部分を含む任意の構成体を意味する。例えば、一方の部分がポリペプチドである場合は、他方の部分は、ポリペプチドであってもよく、それ以外の物質(例えば、糖、脂質、核酸、他の炭化水素等)であってもよい。本明細書において複合体を構成する2以上の部分は、共有結合で結合されていてもよくそれ以外の結合(例えば、水素結合、イオン結合、疎水性相互作用、ファンデルワールス力等)で結合されていてもよい。2以上の部分がポリペプチドの場合は、キメラポリペプチドとも称しうる。従って、本明細書において「複合体」は、ポリペプチド、ポリヌクレオチド、脂質、糖、低分子などの分子が複数種連結してできた分子を含む。
本明細書において「相互作用」とは、2つの物質についていうとき、一方の物質と他方の物質との間で力(例えば、分子間力(ファンデルワールス力)、水素結合、疎水性相互作用など)を及ぼしあうこという。通常、相互作用をした2つの物質は、会合または結合している状態にある。
本明細書中で使用される用語「結合」は、2つの物質の間、あるいはそれらの組み合わせの間での、物理的相互作用または化学的相互作用を意味する。結合には、イオン結合、非イオン結合、水素結合、ファンデルワールス結合、疎水性相互作用などが含まれる。物理的相互作用(結合)は、直接的または間接的であり得、間接的なものは、別のタンパク質または化合物の効果を介するかまたは起因する。直接的な結合とは、別のタンパク質または化合物の効果を介してもまたはそれらに起因しても起こらず、他の実質的な化学中間体を伴わない、相互作用をいう。結合または相互作用を測定することによって、本発明のマーカーの発現の度合い等を測定することができる。
従って、本明細書においてポリヌクレオチドまたはポリペプチドなどの生物学的因子に対して「特異的に」相互作用する(または結合する)「因子」(または、薬剤、検出剤等)とは、そのポリヌクレオチドまたはそのポリペプチドなどの生物学的因子に対する親和性が、他の無関連の(特に、同一性が30%未満の)ポリヌクレオチドまたはポリペプチドに対する親和性よりも、代表的には同等またはより高いか、好ましくは有意に(例えば、統計学的に有意に)高いものを包含する。そのような親和性は、例えば、ハイブリダイゼーションアッセイ、結合アッセイなどによって測定することができる。
本明細書において第一の物質または因子が第二の物質または因子に「特異的に」相互作用する(または結合する)とは、第一の物質または因子が、第二の物質または因子に対して、第二の物質または因子以外の物質または因子(特に、第二の物質または因子を含む試料中に存在する他の物質または因子)に対するよりも高い親和性で相互作用する(または結合する)ことをいう。物質または因子について特異的な相互作用(または結合)としては、例えば、リガンド−レセプター反応、核酸におけるハイブリダイゼーション、タンパク質における抗原抗体反応、酵素−基質反応など、核酸およびタンパク質の両方が関係する場合、転写因子とその転写因子の結合部位との反応など、タンパク質−脂質相互作用、核酸−脂質相互作用などが挙げられるがそれらに限定されない。従って、物質または因子がともに核酸である場合、第一の物質または因子が第二の物質または因子に「特異的に相互作用する」ことには、第一の物質または因子が、第二の物質または因子に対して少なくとも一部に相補性を有することが包含される。また例えば、物質または因子がともにタンパク質である場合、第一の物質または因子が第二の物質または因子に「特異的に」相互作用する(または結合する)こととしては、例えば、抗原抗体反応による相互作用、レセプター−リガンド反応による相互作用、酵素−基質相互作用などが挙げられるがそれらに限定されない。2種類の物質または因子がタンパク質および核酸を含む場合、第一の物質または因子が第二の物質または因子に「特異的に」相互作用する(または結合する)ことには、転写因子と、その転写因子が対象とする核酸分子の結合領域との間の相互作用(または結合)が包含される。
本明細書においてポリヌクレオチドまたはポリペプチド発現の「検出」または「定量」は、例えば、マーカー検出剤への結合または相互作用を含む、mRNAの測定および免疫学的測定方法を含む適切な方法を用いて達成され得るが、本発明では、PCR産物の量をもって測定することができる。分子生物学的測定方法としては、例えば、ノーザンブロット法、ドットブロット法またはPCR法などが例示される。免疫学的測定方法としては、例えば、方法としては、マイクロタイタープレートを用いるELISA法、RIA法、蛍光抗体法、発光イムノアッセイ(LIA)、免疫沈降法(IP)、免疫拡散法(SRID)、免疫比濁法(TIA)、ウェスタンブロット法、免疫組織染色法などが例示される。また、定量方法としては、ELISA法またはRIA法などが例示される。アレイ(例えば、DNAアレイ、プロテインアレイ)を用いた遺伝子解析方法によっても行われ得る。DNAアレイについては、(秀潤社編、細胞工学別冊「DNAマイクロアレイと最新PCR法」)に広く概説されている。プロテインアレイについては、Nat Genet.2002 Dec;32 Suppl:526-32に詳述されている。遺伝子発現の分析法としては、上述に加えて、RT−PCR、RACE法、SSCP法、免疫沈降法、two−hybridシステム、in vitro翻訳などが挙げられるがそれらに限定されない。そのようなさらなる分析方法は、例えば、ゲノム解析実験法・中村祐輔ラボ・マニュアル、編集・中村祐輔羊土社(2002)などに記載されており、本明細書においてそれらの記載はすべて参考として援用される。
本明細書において「手段」とは、ある目的(例えば、検出、診断、治療)を達成する任意の道具となり得るものをいい、特に、本明細書では、「選択的に認識(検出)する手段」とは、ある対象を他のものとは異なって認識(検出)することができる手段をいう。
本発明により、免疫系の状態の指標として有用である。従って、本発明によって、免疫系の状態の指標を識別し、疾患の状態を知るために用いることができる。
本明細書において「(核酸)プライマー」とは、高分子合成酵素反応において、合成される高分子化合物の反応の開始に必要な物質をいう。核酸分子の合成反応では、合成されるべき高分子化合物の一部の配列に相補的な核酸分子(例えば、DNAまたはRNAなど)が用いられ得る。本明細書においてプライマーはマーカー検出手段として使用され得る。
通常プライマーとして用いられる核酸分子としては、目的とする遺伝子(例えば、本発明のマーカー)の核酸配列と相補的な、少なくとも8の連続するヌクレオチド長の核酸配列を有するものが挙げられる。そのような核酸配列は、好ましくは、少なくとも9の連続するヌクレオチド長の、より好ましくは少なくとも10の連続するヌクレオチド長の、さらに好ましくは少なくとも11の連続するヌクレオチド長の、少なくとも12の連続するヌクレオチド長の、少なくとも13の連続するヌクレオチド長の、少なくとも14の連続するヌクレオチド長の、少なくとも15の連続するヌクレオチド長の、少なくとも16の連続するヌクレオチド長の、少なくとも17の連続するヌクレオチド長の、少なくとも18の連続するヌクレオチド長の、少なくとも19の連続するヌクレオチド長の、少なくとも20の連続するヌクレオチド長の、少なくとも25の連続するヌクレオチド長の、少なくとも30の連続するヌクレオチド長の、少なくとも40の連続するヌクレオチド長の、少なくとも50の連続するヌクレオチド長の、核酸配列であり得る。プローブとして使用される核酸配列には、上述の配列に対して、少なくとも70%相同な、より好ましくは、少なくとも80%相同な、さらに好ましくは、少なくとも90%相同な、少なくとも95%相同な核酸配列が含まれる。プライマーとして適切な配列は、合成(増幅)が意図される配列の性質によって変動し得るが、当業者は、意図される配列に応じて適宜プライマーを設計することができる。そのようなプライマーの設計は当該分野において周知であり、手動でおこなってもよくコンピュータプログラム(例えば、LASERGENE,PrimerSelect,DNAStar)を用いて行ってもよい。
本明細書において「プローブ」とは、インビトロおよび/またはインビボなどのスクリーニングなどの生物学的実験において用いられる、検索の手段となる物質をいい、例えば、特定の塩基配列を含む核酸分子または特定のアミノ酸配列を含むペプチド、特異的抗体またはそのフラグメントなどが挙げられるがそれに限定されない。本明細書においてプローブは、マーカー検出手段としてもちいられる。
本明細書において「診断」とは、被験体における疾患、障害、状態などに関連する種々のパラメータを同定し、そのような疾患、障害、状態の現状または未来を判定することをいう。本発明の方法、装置、システムを用いることによって、体内の状態を調べることができ、そのような情報を用いて、被験体における疾患、障害、状態、投与すべき処置または予防のための処方物または方法などの種々のパラメータを選定することができる。本明細書において、狭義には、「診断」は、現状を診断することをいうが、広義には「早期診断」、「予測診断」、「事前診断」等を含む。本発明の診断方法は、原則として、身体から出たものを利用することができ、医師などの医療従事者の手を離れて実施することができることから、産業上有用である。本明細書において、医師などの医療従事者の手を離れて実施することができることを明確にするために、特に「予測診断、事前診断もしくは診断」を「支援」すると称することがある。
本発明の診断薬等の医薬等としての処方手順は、当該分野において公知であり、例えば、日本薬局方、米国薬局方、他の国の薬局方などに記載されている。従って、当業者は、本明細書の記載があれば、過度な実験を行うことなく、使用すべき量を決定することができる。
(好ましい実施形態の説明)
以下に本発明の好ましい実施形態を説明する。以下に提供される実施形態は、本発明のよりよい理解のために提供されるものであり、本発明の範囲は以下の記載に限定されるべきでないことが理解される。従って、当業者は、本明細書中の記載を参酌して、本発明の範囲内で適宜改変を行うことができることは明らかである。これらの実施形態について、当業者は適宜、任意の実施形態を組み合わせ得る。
<エピトープクラスター化技術>
1つの局面において、本発明は、第一の免疫実体(immunological entity)および第二の免疫実体について、結合するエピトープが同一か異なるかを分類する方法であって、該方法は、(1)該第一の免疫実体および該第二の免疫実体のアミノ酸配列の保存領域を同定するステップと、(2)該第一の免疫実体および該第二の免疫実体の三次元構造モデルを作成するステップと、(3)該三次元構造モデルにおいて該第一の免疫実体の該保存領域と該第二の免疫実体の該保存領域とを重ね合わせるステップと、(4)該重ね合わせ後の該三次元構造モデルにおいて、該第一の免疫実体の該非保存領域と該第二の免疫実体の該非保存領域との類似度を決定するステップと、(5)該類似度に基づいて、該第一の免疫実体と結合するエピトープと該第二の免疫実体と結合するエピトープが同一か異なるかを判定するステップとを包含する、方法を提供する。
ここで、第一の免疫実体および該第二の免疫実体のアミノ酸配列の保存領域を同定するステップでは、免疫実体の配列の保存領域を同定する。同定は、アラインメントや三次元構造のモデル等から実施することができる。1つの好ましい実施形態では、保存領域はフレームワーク領域またはその一部を含み、および/または非保存領域は相補性決定領域(CDR)またはその一部を含む。第一の免疫実体の保存領域と前記第二の免疫実体の保存領域とは、対応関係にある。1つの実施形態では、この同定ステップでは、保存領域と非保存領域とへの分割がなされ得る。この場合、好ましい実施形態では、フレームワーク領域とCDR領域とへの分割がなされる。抗体等の免疫実体のアミノ酸配列からCDR領域を記述するための方法として、多くの枠組み、あるいは「番号付け」手法(Kabat,、Chothia等)がある。これらは詳細が異なっているが、定性的には同じものである。本発明のアルゴリズムのために重要なことはCDRやフレームワークという分け方にも依らず、共通の枠組みを使用すること、例えば、三次元構造的に同一の残基に同一の番号を割り当てることである。形式的にはこのステップは、各アミノ酸残基に領域番号を割り当てる(アサインする)ことである。本発明の実施において、保存領域と非保存領域とに2分割することは必須ではなく、本発明での意図は構造的にユニバーサルに保存されている部分(すなわち、保存領域、一般にはフレームワークと言われている領域であり、その一部であっても良い)を用いて、構造の重ね合わせをすることができる準備をすることである。そのためにその領域を選び出すことが重要な特徴の一つである。図3に示す代表例では、1−3はそれぞれのCDRを、4はフレームワーク領域、そして0はそれ以外である(図3)。
次に、第一の免疫実体および該第二の免疫実体の三次元構造モデルを作成するステップでは、一般的な手法で三次元構造モデルを製作することができる。ここで、好ましい実施形態では、第一の免疫実体および該第二の免疫実体のそれぞれについて、該フレームワーク領域またはその一部および該CDRまたはその一部の三次元構造モデルを作成してもよい。このようにして、免疫実体の可変領域の3次元構造モデリングがなされる。当該分野で公知のように、免疫実体の可変領域の3次元構造モデリングを行う手法は多い。(ホモロジーモデリング手法、分子動力学計算、フラグメントアセンブリ、およびそれらのコンビネーション等)。本発明のアルゴリズムは、これらの3次元構造モデリング手法の詳細とは無関係であり、任意のモデリング手法を応用することができる。しかしながら、クラスタリングまたはグループ分けの精度は3次元構造モデリングの精度によっている。特にCDR領域とりわけ、最も構造モデリングが難しいCDR−H3の精度は表現型に基づく正確なグループ分けには必須である。別の言い方をすると、クラスタリングアルゴリズムの観点からは、できるだけ精度の高い3次元構造モデルを使用することが望ましい。使用可能であれば、実験的に決定された構造を使用することができる。
三次元構造モデルにおいて該第一の免疫実体の該保存領域(例えば、フレームワーク領域またはその一部)と該第二の免疫実体の該保存領域(例えば、フレームワーク領域またはその一部)とを重ね合わせるステップでは、保存領域(例えば、フレームワーク領域またはその一部)の重ね合わせが実現される。同じ種の免疫実体のフレームワーク構造は十分に似ており、1オングストローム程度の誤差で構造的重ね合わせが可能である。これがフレームワーク構造と呼ばれる所以である。この重ね合わせについてもすでに様々な方法(行列対角化や特異値分解による平均二乗誤差の最小化が最も有名である)が報告されているが、本発明のアルゴリズムはこれら特定の重ね合わせ手法には寄らないため、任意のアルゴリズムを用いることができる。選択した重ね合わせ手法に基づき、すべてのユニークな抗体対の構造を比較し、保存領域(例えば、フレームワーク領域またはその一部)の構造重ね合わせを行うことができる。
重ね合わせ後の該三次元構造モデルにおいて、該第一の免疫実体の非保存領域(例えば、CDR)と該第二の免疫実体の非保存領域(例えば、CDR)との類似度を決定するステップでは、類似度計算(構造の類似度計算の場合構造類似度計算ともいう。)がなされる。必要に応じて、同一残基の定義を行ってもよい。同一残基の定義は、例えば、構造重ね合わせされた免疫実体のモデルを用いて(例えば、CDR領域とフレームワーク領域)の類似度を計算することで達成される。非保存領域(例えば、CDR領域)は一般に抗体同士異なる長さを持っていることが取り扱いを難しくするため、好ましくはそれらの類似性を評価できるようにするために、まずアミノ酸残基を「整列(アライメント)」させることが望ましい。大変多くのタンパク質構造アライメント手法が従来技術において議論されてきた。一般的な手法は、与えられた非保存領域(例えば、CDR領域)の対のすべてのアミノ酸残基の構造類似度行列を計算することで、これは2つの構造がすでに構造的に重ね合わされている時に使用可能である(図5)。また、高い類似性スコアを持つものを動的計画法に基づいて整列させることができる。このような例は、上述する例の他、モンテカルロ法(例えば、DALI)、combination extension法、SSAP法、などを用いることができる(Poleksic A (2009). "Algorithms for optimal protein structure alignment". Bioinformatics. 25 (21): 2751−2756などを参照することができるがこれらに限定されない。)。他にも類似度を表現する手法はあり、空間的に重なり合っているアミノ酸には正の値を、重なりが少ないものには零に近い値を与えようという手法を採用することができる。次のステップはアミノ酸の「アライメント」を、動的計画法等を用いて計算することである。これはr1にあるアミノ酸を、r2にあるアミノ酸と同一視する、ということである。配列アライメント手法はすでに多くのものがあり任意のものを用いることができる。ここでは「グローバルアライメント」手法に属する手法を用いることが好ましい。これはCDRの最初と最後の位置がおおよそ同一であるためである。アライメントの結果は、すべてのr1およびr2対情報からなるリストであらわされうる(図5参照)。
類似度計算では、次に2つのアライメントから、類似度/非類似度を定量化するため「特徴量」を計算する。例えば、以下の項目を考慮することができる。
(a)長さの違い。値は絶対値(|N1-N2|)、相対的な値、例えば2*(N1-N2)/(N1+N2)または(N1-N2)/Na、標準化された値などとして表される。ここでNaはアライメントの長さである。あるいは、ループの長さの違い(ΔLoop、CDRループ長の最大の相違等であり得る)などであってもよい。
(b)配列類似度。一般的にアミノ酸の変異はアミノ酸置換行列(例えばBLOSUM62)によって計算され、アライメントにギャップがある場合にはペナルティを与える。また、単に同一のアミノ酸の数を数えることもある。
(c)構造類似度。三次元構造を評価し得る任意の手法を採用することができる。三次元構造の構造類似度を評価したことが本発明の一つの特徴であり、これにより、精度の高いエピトープクラスター化技術が達成される。好ましい手法としては、例えば、0から1の間に正規化できる技術を用いることが好ましくありうる。
上記はあくまで一例であり、本発明を実施するために、より多くの項を含んだより複雑な関数型を用いることもできる。
該類似度に基づいて、該第一の免疫実体と結合するエピトープと該第二の免疫実体と結合するエピトープとが同一か異なるかを判定するステップでは、2つの免疫実体(例えば、抗体)の非保存領域(例えば、CDR等の可変領域)の構造類似度計算が行われる。非保存領域(CDR等)と保存領域(フレームワーク等)等に代表される種々の特徴量等の類似性を記述するための特徴量のセットを用いることで、2つの抗体の類似性、非類似性を様々な方法で定量化することができる。代表的な非限定的な例の1つの手法は回帰的な手法、例えば類似性/非類似性特徴量の重み付けされた和である。好まし実施形態として、より洗練された方法として、各種のニューラルネットワーク法や、サポートベクトルマシン、ランダムフォレストといった機械学習アルゴリズムにこれらの特徴量を入力することが考えられる。
本発明の類似度を評価するステップは免疫実体結合物(例えば、抗原)が既知という特別なケースや、一部の抗体ターゲットを知っている場合には応用として、これら既知のケースをクラスタリングに含むことができる。すなわち、免疫実体結合物(例えば、抗原)/エピトープ既知の免疫実体(例えば、抗体)を用いることで、免疫実体(例えば、抗体)の免疫実体結合物(例えば、抗原)/エピトープを予測することができる。
本明細書で記載されるクラスター分類したエピトープは、生体情報と関連付けることができる。例えば、本発明の分類方法に基づいて同定されたエピトープの一つまたは複数のクラスターに基づき、前記抗体の保有者を既知の疾患または障害あるいは生体の状態と関連付けることができる。
本発明が関与し得る疾患または障害あるいは生体の状態には、例えば、異物(例えば、細菌やウイルス等)の感染状態のほか、非自己と認識される自己由来の実体(例えば、新生成物(がん、腫瘍)や自己免疫疾患に関連する実体)がある。免疫系は、生物にとって内因性の分子(「自己」分子)を、生物に対する外因性または外来性の物質(「非自己分子」)と識別するように機能する。免疫系は、応答を媒介する構成成分に基づいて異物に対して2つのタイプの適応応答(体液性応答および細胞性応答)を有する。体液性応答は抗体により媒介され、他方で、細胞性免疫はリンパ球として類別される細胞に関与する。最近の抗癌および抗ウイルス戦略において、抗癌もしくは抗ウイルス治療または療法の手段として、宿主免疫系を利用することが一つの重要な戦略となっている。本発明の分類およびクラスター化技術は、体液性応答および細胞性応答のいずれの戦略でも応用することができる。
免疫系は、宿主の異物からの防御において、3つの段階(認識、活性化、およびエフェクター)を経て機能する。認識段階では、免疫系は、身体中の外来抗原または侵入物の存在を認識し、それを認知させる。外来抗原は、例えば異物(ウイルスタンパク質由来の細胞表面マーカー等)のほか、非自己と認識されうる細胞(がん細胞)の細胞表面マーカー等であり得る。免疫系が侵入物を認識すると、免疫系の抗原特異的細胞は、侵入物誘発性シグナルに応答して増殖および分化する(活性化段階)。最終的に、免疫系のエフェクター細胞が検出された侵入物に応答して、それを中和するエフェクター段階である。エフェクター細胞は免疫応答を実行する役割を担う。エフェクター細胞としては、B細胞、T細胞やナチュラルキラー(NK)細胞等が挙げられる。B細胞は、侵入物に対する抗体を生成し、抗体は補体系と組み合わせて、特定の標的であるエピトープ(抗原等の免疫実体結合物)を含む細胞ないし生物を破壊へと導く。T細胞は、ヘルパーT細胞、制御性T細胞、細胞傷害性T細胞(CTL細胞)等の種類があり、ヘルパーT細胞はサイトカインを分泌し、他の細胞の増殖等を刺激し免疫応答の有効性を強化する。制御性T細胞は免疫応答を下方制御する。CTL細胞は、表面上に外来抗原を提示する細胞を直接溶解融解ことで破壊する。NK細胞は、ウイルス感染細胞や悪性腫瘍細胞等を認識し破壊するとされる。したがって、これらのエフェクター細胞が対象とするエピトープを分類し、これを疾患または障害あるいは生体の状態と結びつけることは、治療や診断の有効性に非常の重要な役割を果たすといえる。
このように、T細胞は、特定の抗原シグナルに応答して機能する抗原特異的免疫細胞である。Bリンパ球およびそれらが産生する抗体は、また抗原特異的物体である。本発明は、これらの特定の免疫実体結合物(例えば、抗原)について、エピトープクラスターを用いて分類し、最終的な機能(特定の疾患または障害あるいは生体の状態との関連)ごとに分類し、クラスター化することができることを提供する。
上述のようにB細胞は遊離型または可溶型の抗原に応答するが、T細胞はこれらに応答しない。T細胞が抗原に応答するためには、抗原がペプチドにプロセシングされ、腫瘍組織適合性複合体(MHC)でコードされる提示構造に結合されることが必要である(「MHC拘束」と呼ばれる)。T細胞はこのメカニズムにより自己細胞と非自己細胞とを識別する。抗原が認識可能なMHC分子により提示されない場合、T細胞は抗原シグナルを認識しない。認識可能なMHC分子に結合したペプチドに特異的なT細胞はMHCペプチド複合体に結合し免疫応答が進行する。MHCには2つのクラスがあり(クラスI MHC、クラスII MHC)、CD4T細胞はクラスII MHCタンパク質を優先的に相互作用し、他方で、細胞傷害性T細胞(CD8)はクラスI MHCと優先的に相互作用するとされる。これらのMHCタンパク質はいずれのクラスのものも、細胞の外部表面上にその大部分の構造が含まれる膜貫通タンパク質であり、その外部にペプチド結合間隙がある。この間隙には内因性、外来性のいずれのタンパク質の断片も細胞外環境に結合および提示される。この際、プロフェッショナル抗原提示細胞(pAPC)と呼ばれる細胞が、MHCタンパク質を用いてT細胞に対する抗原を提示し、種々の特定の今日刺激分子を用いてT細胞がとる分化、活性化の経路を誘導し、免疫系の効果を実現する。本発明のエピトープの分類およびクラスター化技術は、これらのMHCが関与する治療や診断に関しても従来提供できない応用法を提供する。
非自己実体については、従来の免疫系を十分活用することで、治療や診断に関する応用法を提供することができるが、自己についてはさらなる工夫が必要でありうる。がん細胞等は正常細胞と由来を同じくし、遺伝子レベルでは正常細胞と実質的に同一であるからである。ただし、がん細胞は腫瘍関連抗原(TuAA)を提示することが知られており、この抗原または他の免疫実体結合物を活用することで、被験者の免疫系を活用しがん細胞を攻撃することができる。このような腫瘍関連抗原もまた、本発明の技術によりエピトープを指標に分類し、クラスター化することができる。例えば、腫瘍関連抗原を応用し抗がんワクチン等に応用することができる。従来例えば、活性化腫瘍細胞全体を使用する技術が米国特許第5,993,828号で開示されている。あるいは単離された腫瘍抗原を含有する組成物を応用する技術も試みられている(例えば、Krishnadas DK et al., Cancer Immunol Immunother. 2015 Oct;64(10):1251-60)。同定されたエピトープを認識するキメラ抗原受容体(CAR)を用いた遺伝子改変T細胞(CAR−Tとも称する。)を用いることもできる。また、PD−1やPD−L1などの免疫チェックポイントに関する作用に基づく免疫チェックポイント阻害剤等を利用した免疫療法も最近注目を浴びている。PD−1は抗原提示細胞に発現するPD−1リガンド(PD−L1及びPD−L2)と結合し、リンパ球に抑制性シグナルを伝達してリンパ球の活性化状態を負に調節している。PD−1リガンドは抗原提示細胞以外にヒトの様々な腫瘍組織に発現しており、悪性黒色腫においても切除した腫瘍組織におけるPD−L1の発現と術後の生存期間との間に負の相関関係があるとされている。PD−1抗体やPD−L1抗体でPD−1とPD−L1との結合を阻害するとその細胞傷害活性が回復するとされており、抗原特異的なT細胞の活性化及びがん細胞に対する細胞傷害活性を増強することで持続的な抗腫瘍効果を示すことができる(例えば、ニボルマブ等)。このような免疫活性の負の調節機構をもとに戻すメカニズムについても、本発明のエピトープの分類、クラスター化法を応用することができる。
ワクチンについては、ウイルス疾患についても本発明のエピトープの分類、クラスター化法を応用することができる。ウイルスに対するワクチンは、弱毒化生ウイルスのほか、不活化ワクチンのほか、サブユニットワクチン等が利用されている。サブユニットワクチンの成功率は高くないが、エンベロープタンパク質に基づいた組換えB型肝炎ワクチン等での成功例が報告されている。本発明のエピトープの分類、クラスター化法を用いると、適切に生体の状態を関連付けることができるため、サブユニットワクチン等での有効性も上昇すると考えられる。また、適切なクラスターの定量的な評価によって、ワクチンの有効性評価にもつながると考えられる。またあるワクチンが有効な症例との比較により、層別化も可能である。結果として有効性が上がる、あるいは上市の可能性が高まることも考えられる。実際に本発明の手法を用いて、ワクチンに反応するクラスターをインシリコで同定した結果が示されている。
1つの実施形態では、本発明のエピトープの分類、クラスター化法で使用されうる免疫実体として抗体、抗体の抗原結合断片、B細胞受容体、B細胞受容体の断片、T細胞受容体、T細胞受容体の断片、キメラ抗原受容体(CAR)、これらのいずれかまたは複数を含む細胞(例えば、キメラ抗原受容体(CAR)を含むT細胞(CAR−T))等を挙げることができる。
1つの具体的な実施形態では、本発明で利用されうる分割ステップは、抗体配列のフレームワーク領域とCDR領域とへの分割ができる限り任意の手法を用いることができ、また、抗体アミノ酸配列からCDR領域を記述するための任意の方法を用いることができ、これらは、多くの枠組みがあり、Kabat、Chotia、改変Chotia、IMGTおよびHonnegger等の種々の番号付け手法に基づいて行われるがこれらに限定されない。本発明の方法は、使用される技術に依存するものではなく、むしろ、どのような技術でも同様の分類が可能であることが理解される。これらは詳細は異なっているものの、定性的には同じものである。本発明者のアルゴリズムのために重要なことは共通の枠組みを使用することである。形式的にはこのステップは、各アミノ酸残基に領域番号を割り当てることである。図3で示す例示的なスキームにおいて、1−3はそれぞれのCDRを、4はフレームワーク領域、そして0はそれ以外である。なお、本発明は以下に限定されるものではないが、以下のような手法を用いると有利でありうる。構造的に同一視される残基に対して同じ番号を付与する番号付け手法を使用すること。また、フレームワークとして、多くの抗体において構造的に安定な残基を選択し定義すること。使用可能な構造情報は日々増加しており、これらの定義は適宜更新していくのが良い。
1つの具体的な実施形態では、本発明で利用されうる三次元構造モデルの生成(モデリング)は、抗体可変領域の三次元構造モデリングを行うことができる限り任意の手法を用いることができ、ホモロジーモデリング手法、分子動力学計算、フラグメントアセンブリ、モンテカルロシミュレーション、焼きなまし法などの最適化手法およびそれらのコンビネーション等のモデリング手法に基づいて行われるがこれらに限定されない。本発明の方法は、使用されるモデリング手法に依存するものではなく、むしろ、どのようなモデリング技術でも同様のモデリングが可能であることが理解される。本発明者らのアルゴリズムは、これらの三次元構造モデリング手法の詳細に依存するものではない。しかしながら、クラスタリングまたはグループ分けの精度は三次元構造モデリングの精度によっている。特にCDR領域、とりわけ、最も構造モデリングが難しいCDR−H3の精度は表現型に基づく正確なグループ分けには重要であり、ここの精度を上昇させることが好ましい。別の言い方をすると、クラスタリングアルゴリズムの観点からは、できるだけ精度の高い三次元構造モデルを使用することが望ましい。使用可能であれば、実験的に決定された構造を使用することができる。モデリングにおける1つの有利な実施形態では、CDR重鎖3を精度よくモデリングすることで、より精度の高い分類を行うことができるが本発明はこれに限定されるものではない。なお、本発明は以下に限定されるものではないが、精度の高いモデリングが得られるものが有利でありうる。
別の実施形態では、構造予測において、構造予測内部における最初のステップとして配列アライメントを行って、その後に3次元構造モデリングを行うこともできる。例えば、鋳型間のアライメントを変化させることなく、構造を予測したい問い合わせ配列(query sequence;qと表示され得る)を複数配列アラインメント(MSA、mと表示され得る)に対して効率的にアライメントすることができる(Katoh, K. and Standley, D.M. MAFFT multiple sequence alignment software version 7: improvements in performance and usability. Mol Biol Evol 2013;30(4):772−780.)。1つの具体的実施形態では、最初に、フレームワークMSAに対するアライメントによってCDRなどの非保存領域の長さを推測し、最も高い、全体のフレームワークスコアを有する自然に対になった鋳型(例えば、BCR_L−HまたはTCR_A−B)を選択し、2つのフレームワーク鋳型の方向付けを定義することができる。次いで、各CDRなどの非保存領域について、適切なMSAに対して、完全長の問い合わせ配列をアライメントすることができる。理論に束縛されることを望まないが、CDR MSAなどにおいて完全長の配列を使用することができるのは、CDR外の残基がその安定性に寄与し得るからである。例えば、CDR前および後の4残基のRMSD重ね合わせをアンカーとして使用して、最も高いスコアのCDR鋳型を、最も高いスコアのフレームワーク鋳型に移植することができる。各ステップにおいて、不一致をモニタリングし、不一致が閾値を超える場合、最も高いスコアの鋳型を最適でない鋳型で置き換えることができる。問い合わせと鋳型との間で異なる側鎖を、対応するMSA列において頻繁に見られるコンホメーションを使用して再構築することができる。
1つの具体的な実施形態では、本発明で利用されうる重ね合わせステップは、フレームワーク領域の重ね合わせを行うことができる限りどのような手法を用いてもよい。同じ種の抗体フレームワーク構造は十分に似ており、1オングストローム程度あるいは数オングストローム(例えば、2Å、3Å、4Å、5Å、6Å、7Å、8Å、9Å、10Å等)の誤差で構造的重ね合わせすることができる。この重ね合わせについてもすでに様々な方法、例えば公知の最小二乗法、行列対角化、特異値分解による平均二乗誤差の最小化、または動的計画法に基づく構造類似度の最適化等の重ね合わせ手法に基づいて行うことができるがこれらに限定されない。本発明の方法は、使用される重ね合わせ手法に依存するものではなく、むしろ、どのような重ね合わせ技術でも同様の重ね合わせが可能であることが理解される。本発明者らのアルゴリズムはこれら特定の重ね合わせ手法には依存するものではない。選択した重ね合わせ手法に基づき、すべてのユニークな抗体対の構造を比較し、フレームワーク領域の構造重ね合わせを行うことができる。なお、本発明は以下に限定されるものではないが、以下のような重ね合わせの手法を用いると有利でありうる。構造的に多くの免疫実体(例えば、抗体)にわたってユニバーサルに安定な残基をフレームワーク領域として選択し、それらを重ね合せる。それにより、構造的に可変な領域の類似性をより正確に評価することができる。
好ましい実施形態では、本発明で実施される重ね合わせは、1オングストロームまたは数オングストローム(例えば、2Å、3Å、4Å、5Å、6Å、7Å、8Å、9Å、10Å等)以内の誤差で行われることが有利でありうる。分類やクラスター化の精度を増強することができるからである。
好ましい実施形態では、本発明において構造類似度の決定を行う際に、同一残基の定義がなされる。本発明で実施されうる同一残基の定義は、構造重ね合わせされた抗体モデルを用いて(例えば、CDR領域とフレームワーク領域)の類似性を計算することを可能とするものであれば、任意のものを採用することができる。CDR領域は一般に抗体ごとに異なる長さを持っていることが取り扱いを難しくする。そこで、1つの実施形態ではそれらの類似性を評価できるようにするために、まずアミノ酸残基を「整列(アライメント)」させることが有利であるがこれに限定されない。多くのタンパク質構造アライメント手法が現在まで議論されてきており、一般的な手法は、限定されないが、与えられたCDR対のすべてのアミノ酸残基の構造類似度行列を計算することを挙げることができる。これは2つの構造がすでに構造的に重ね合わされている場合に使用可能である手法である(図5)。
そして、高い類似性スコアを持つものを動的計画法に基づいて整列させることができる。具体的な実施形態の一つでは、使用されうる同一残基の定義はアラインメントに基づいて行われる。利用される例示的なアラインメントの具体的な手順は以下を挙げることができる:1)与えられたCDR対のすべてのアミノ酸残基の構造類似度行列を計算する工程、および2)動的計画法に基づいて整列させる工程を包含する。ここで、該CDR対の2つのCDRの座標をrおよびrで表す場合、任意の2つの残基kおよびlの類似度Sklは以下のように定義され、
ここで、kおよびlの座標はそれぞれrとrで表され、r[i]−r[j]は2つのアミノ酸の座標の差からなるベクトルであり、dは経験的に決定されるパラメータである。ここで、好ましくは、代表的な座標として、Cα原子または重心座標が使用されるがこれに限定されない。
好ましい実施形態では、本発明における構造類似度の決定において、類似度を表現する手法は、以下:
(1)
の値を計算すること、ここで、この値が大きいことは、重なり合いが多いことを示す、および/または(2)アミノ酸のアライメントを、グローバルな配列アライメント手法を用いて計算することを包含する。
このステップでの主たる考え方は空間的に重なり合っているアミノ酸(|r1[i]-r2[j]|が小さい)には正の値を、重なりが少ないもの(|r1[i]-r2[j]|が大きい)には零に近い値を与えようというものである。次のステップはアミノ酸配列のアライメントを、動的計画法等を用いて計算することである。これはr1にあるアミノ酸を、r2にあるアミノ酸と同一視する、ということである。配列アライメント手法はすでに多くのものがある。好ましくは「グローバルな配列アライメント手法」に属する手法を用いる。これはCDRの最初と最後の位置がおおよそ同一であるためであるが本発明はこれに限定されるものではない。アライメントの結果は、すべてのr1およびr2対情報からなるリストであり以下のように例示される。
ここで上述の例において3行目に現れた「−」は、r[3]と対となるアミノ酸がrに見つからなかったことを意味する。上記の場合、アライメントは次のように記述できる。a=[(1,1),(2,2),(3,−),(4,3)…](図5を参照)。
1つの実施形態では、本発明で実施されうる構造類似度の算出において採用されうる構造類似度は、長さの違い、配列類似度および三次元構造類似度の少なくとも1つに基づいて決定され得る。これは、次に2つのアライメントから、類似度/類似度を定量化するため「特徴量」を計算することである。
ここで、長さの違いは、値は絶対値(|N−N|)、相対的な値、例えば2*(N−N)/(N+N)または(N−N)/N、標準化または正規化された値などとして表され得る。ここでNはアライメントの長さを示す。あるいは、6個のCDR全てに関するCDRの長さの最大の差異と定義することもできる。この公式は、BCRが標的とする異なるエピトープは唯1つのCDRにおけるCDRの長さの点でしばしば異なることから、CDRの平均化または長さによる分割は、ほとんど影響がないとみなすことができるという知見に基づいている。
配列類似度は、一般的にアミノ酸の変異を計算することで算出され得る。配列類似度もまた、絶対値または相対値であり得、標準化または正規化されてもよい。アミノ酸変異は一般にアミノ酸置換行列(例えばBLOSUM62)によって計算され、アライメントにギャップがある場合にはペナルティを与えることができる。あるいは、単に同一のアミノ酸の数を数えてもよい。具体的な例としては、配列類似度は、以下のように算出することもできる。すなわち、CDRの場合は、配列類似度を、アライメントされた残基のBLOSUM62 行列の成分の観点から規定することができる。2つの免疫実体に関してアライメントした残基対がアミノ酸aおよびaからなる場合、BLOSUM62a−a行列の成分をBと示し、他方、対角線上の要素a−aおよびa−aの成分をCおよびDと示す場合、所定のCDRについてのスコアを以下のように規定することができる。
構造類似度は、構造を特定する任意のパラメータを用いてその類似度を計算することで算出することができる。構造類似度もまた、絶対値または相対値であり得、標準化または正規化されてもよい。同一残基の定義をした場合、例えば、その単純な拡張として、構造類似度を以下の式で計算することができる:
ここで、Naはアライメントの長さ、w1とw2は経験的に決定されるパラメータである。この関数型を用いる優位性は、0から1の間に正規化できる点にある。
あるいは、構造類似度は、上記式をさらにNで割って評価することもできる(実施例3参照)。なお、CDRなどの場合の構造類似度を、タンパク質構造アライメントに関して以前に記載した理論を参考にすることができる(Standley, D.M., Toh, H. and Nakamura, H. Detecting local structural similarity in proteins by maximizing number of equivalent residues. Proteins 2004;57(2):381−391.)。具体的な実施形態では、ある対象について、構造類似度は、6個のCDRに関する平均として算出することもできるが、これに限定されない。
本発明で実施されうる構造類似度の算出では当然のこと、より多くの項を含んだより複雑な関数型を用いることができる。
好ましい実施形態では、構造類似度は、少なくとも三次元構造類似度を含む。三次元構造類似度を用いて計算することで、エピトープの分類およびクラスター化がより精度を増し、生物学的な意義により精確に結びつけることができるからである。
1つの実施形態では、本発明の構造類似度計算では、2つの抗体の可変領域の構造類似度計算を計算できる限り任意の計算を用いることができ、例えば、回帰的な手法、ニューラルネットワーク法や、サポートベクトルマシン、ランダムフォレストといった機械学習アルゴリズム等を用いることができる。好ましい実施形態では、CDRおよびフレームワークの類似性を記述するための特徴量のセットを用いることで、2つの抗体の類似性、非類似性を様々な方法で定量化することができる。1つの例示的な手法は回帰的な手法、例えば類似性/非類似性特徴量の重み付けされた和である。1つの別の例示的な手法として、より洗練された方法である、各種のニューラルネットワーク法や、サポートベクトルマシン、ランダムフォレストといった機械学習アルゴリズムにこれらの特徴量を入力することを利用することができる。1つの例として以下においてサポートベクトルマシンを用いた場合を記述するが、当業者は同様の結果は他の手法を用いても得られることを理解する。本発明特定の類似性スコアや詳細に依存するものではない。1つの実施形態において鍵となるのは、機械学習やその他のスコア関数を抗体の対を記述するために適用された、という点である。一般的な実施形態では、抗原等の免疫実体結合物やエピトープが既知であると想定するのではなく、この場合、それゆえ抗原やエピトープを予測するよりも抗体対の一致度を予測することが重要である。このような場合にも本発明の分類およびクラスター化を実現できることが一つの特徴である。
ここで、本発明は、本発明の手法に基づいて分類されたエピトープのクラスターを生成する方法を提供し、ここで、この方法は、結合するエピトープが同一である免疫実体を同一のクラスターに分類する工程を包含する。また、1つの実施形態では、免疫実体を、その特性および既知の免疫実体との類似性からなる群より選択される少なくとも1つの評価項目を評価し、所定の基準を満たした免疫実体を対象に前記クラスター分類を行う。複数の前記エピトープが同一である場合、該エピトープの三次元構造が少なくとも一部または全部重複することがあり、複数の前記エピトープが同一である場合、該エピトープのアミノ酸配列が少なくとも一部または全部重複することがある。
1つの実施形態において評価のために、特定の閾値を設定することができる。例えば、構造類似度、配列類似度、長さの相違などは、最小値を0、最大値を1とすることができ、この場合、閾値は、例えば、0.8以上、0.85以上、0.9以上、0.95以上、0.99以上などの値、あるいはこれらの間の任意の値(例えば、0.1刻みなど)を設定することができる。
例えば、全ての免疫実体(抗体、TCR、BCRなど)および全ての免疫実体(抗体、TCR、BCR)の間の構造類似度(例えば、StrucSimスコア)を計算することができる。StrucSimスコアの場合は、0と1との間で値を設定することができ、閾値は適宜設定することができ、例えば、約0.9を採用することができ、同一エピトープのグループまたはそれ以外のグループに属するものであるかを仕分けることができる。分離度を上げるために、閾値を適宜上昇させることができ、例えば、約0.9を用いた場合、それより高く設定し、約0.95などで設定することができる。閾値内でマッチする特徴を有する対の部分の間で単一の線を描いてクラスターを可視化することができ、その際には、例えば、Python Network X graphviz packageなどのソフトウェアを使用することができる。
2つの免疫実体(例えば、抗体)の可変領域の構造類似度計算を行う場合、免疫実体結合物(例えば、抗原)既知という特別な場合や、一部の抗体ターゲットを知っている場合では、応用として、これら既知のケースをクラスタリングに含むことができる。この場合、免疫実体結合物(例えば、抗原)/エピトープ既知の抗体を用いることで、免疫実体(例えば、抗体)の抗原/エピトープを予測することができる。これらの手法としては、幾つかの使用方法が考えられる。以下説明する。
1.興味ある既知抗体(または他の免疫実体)との類似性により、類似抗体(または他の免疫実体)のみを抜き出す場合。
2.全体、または一部をクラスタリングしたのち、各クラスターの代表またはすべての抗体(または他の免疫実体)と既知抗体(または他の免疫実体)の類似性を評価する場合。
3.単一の抗体(または他の免疫実体)が複数の既知抗体(または他の免疫実体)と類似であると評価された場合には、最も類似度の高いものを選択すべきである。単一クラスターにおいて複数の抗体(または他の免疫実体)が複数の既知抗体(または他の免疫実体)と類似であると評価された場合には、類似度や類似と判断された抗体(または他の免疫実体)の数によって最も妥当な既知抗体(または他の免疫実体)を選択する、またはクラスタリングの閾値を見直し複数のクラスターに分割することが望ましい。
4.興味ある既知抗体(または他の免疫実体)は、目的に応じて1つまたは複数でありうる。抗原(または他の免疫実体結合物)未知の場合には抗原スクリーニングを目的として1,000から数万の既知抗体(または他の免疫実体)を用いることもありうる。
なお、上記例は、代表的に抗体を例に説明しているが、抗体以外の免疫実体についても同様に適用し得ることが理解される。
<エピトープクラスターと抗原類>
さらに別の局面では、本発明は、本発明の方法で同定された構造を有するエピトープまたは抗原(またはそれに対応する免疫実体結合物)、あるいはそれらのクラスターを提供する。ここで定義されるエピトープ等は、本明細書の<エピトープクラスター化技術>に記載される任意の特徴を有し得、あるいはそれらの技術で同定、分類またはクラスター化されたものでありうる。ここで、クラスターを生成する方法としては、結合するエピトープが同一である免疫実体を同一のクラスターに分類する工程を包含することを挙げることができる。好ましい実施形態では、免疫実体を、その特性および既知の免疫実体との類似性からなる群より選択される少なくとも1つの評価項目を評価し、所定の基準を満たした免疫実体を対象にクラスター分類を行うことができる。ここで採用され得る基準としては、例えば、複数の前記エピトープが同一である場合、該エピトープの三次元構造が少なくとも一部重複することがあり得、あるいは、複数の前記エピトープが同一である場合、該エピトープのアミノ酸配列が少なくとも一部重複してもよい。
本発明の1つの実施形態は、分類されたエピトープ、またはクラスター化されたエピトープおよび上記エピトープを含む免疫実体結合物(例えば、抗原)またはポリペプチドに関する。
ここで、分類されたエピトープまたはクラスター化されたエピトープの記述(同定)方法として以下を挙げることができる。すなわち、本発明の手法で同定された免疫実体(例えば、抗体)のクラスターは高い精度で同一エピトープを認識するものと考えられるため、クラスターが認識するエピトープの同定には、免疫実体結合物(例えば、抗原)が既知の免疫実体(例えば、抗原既知抗体)に対する類似性評価や、実験的な抗原スクリーニング(または、他の免疫実体結合物のスクリーニング)、さらに望ましくは抗原−抗体ペア(あるいは、他の免疫実体−免疫実体結合物)の変異体実験、NMR化学シフト、結晶構造解析、相互作用に関わるエピトープの同定、またはインビトロもしくはインビボ実験により機能評価を行い同定することができる。従って、既存のエピトープまたは免疫実体結合物(例えば、抗原)およびそれに基づく免疫実体が提供されるとしても、本発明のようにクラスター化または分類されたものは、特定の情報を持ったものであり、特定の用途に使用することができ、特定の効果および機能を有するものということができ、その点で従来のエピトープまたは免疫実体結合物(例えば、抗原)およびそれに基づく免疫実体にない新たな特徴を付与するものであり、新規かつ顕著な特徴のある技術的事項を提供するといえる。
<プログラム、媒体、システム構成>
1つの局面では、本発明は、本発明の方法を実行させるプログラムを提供する。ここで採用され得る任意の特徴は本明細書の<エピトープクラスター化技術>に記載される任意の特徴またはその組み合わせでありうる。本発明のプログラムは、第一の免疫実体(immunological entity)および第二の免疫実体について、結合するエピトープが同一か異なるかを分類する方法をコンピュータに実行させるコンピュータプログラムであって、該方法は、(A)該第一の免疫実体および該第二の免疫実体のアミノ酸配列の保存領域を同定するステップと、(B)該第一の免疫実体および該第二の免疫実体の三次元構造モデルを作成するステップと、(C)該三次元構造モデルにおいて該第一の免疫実体の該保存領域と該第二の免疫実体の該保存領域とを重ね合わせるステップと、(D)該重ね合わせ後の該三次元構造モデルにおいて、該第一の免疫実体の非保存領域と該第二の免疫実体の非保存領域との類似度を決定するステップと、(E)該類似度に基づいて、該第一の免疫実体と結合するエピトープと該第二の免疫実体と結合するエピトープが同一か異なるかを判定するステップとを包含する、プログラムであり得る。
別の局面では、本発明は、本発明の方法を実行させるプログラムを格納した記録媒体を提供する。1つの実施形態では、記録媒体は、内部に格納され得るROMやHDD、磁気ディスク、USBメモリ等のフラッシュメモリなどの外部記憶装置でありうる。ここで採用され得る任意の特徴は本明細書の<エピトープクラスター化技術>に記載される任意の特徴またはその組み合わせでありうる。本発明の記録媒体は、第一の免疫実体(immunological entity)および第二の免疫実体について、結合するエピトープが同一か異なるかを分類する方法をコンピュータに実行させるコンピュータプログラムを格納した記録媒体であって、該方法は、(A)該第一の免疫実体および該第二の免疫実体のアミノ酸配列の保存領域を同定するステップと、(B)該第一の免疫実体および該第二の免疫実体の三次元構造モデルを作成するステップと、(C)該三次元構造モデルにおいて該第一の免疫実体の該保存領域と該第二の免疫実体の該保存領域とを重ね合わせるステップと、(D)該重ね合わせ後の該三次元構造モデルにおいて、該第一の免疫実体の非保存領域と該第二の免疫実体の非保存領域との類似度を決定するステップと、(E)該類似度に基づいて、該第一の免疫実体と結合するエピトープと該第二の免疫実体と結合するエピトープが同一か異なるかを判定するステップとを包含する、記録媒体であり得る。
別の局面では、本発明は、本発明の方法を実行させるプログラムを含むシステムを提供する。ここで採用され得る任意の特徴は本明細書の<エピトープクラスター化技術>に記載される任意の特徴またはその組み合わせでありうる。本発明のシステムは、第一の免疫実体(immunological entity)および第二の免疫実体について、結合するエピトープが同一か異なるかを分類するシステムであって、該システムは、(A)該第一の免疫実体および該第二の免疫実体のアミノ酸配列の保存領域を同定する保存領域同定部と、(B)該第一の免疫実体および該第二の免疫実体の三次元構造モデルを作成する三次元構造モデル作成部と、(C)該三次元構造モデルにおいて該第一の免疫実体の該保存領域と該第二の免疫実体の該保存領域とを重ね合わせる重ね合わせ部と、(D)該重ね合わせ後の該三次元構造モデルにおいて、該第一の免疫実体の非保存領域と該第二の免疫実体の非保存領域との類似度を決定する類似度決定部と、(E)該類似度に基づいて、該第一の免疫実体と結合するエピトープと該第二の免疫実体と結合するエピトープが同一か異なるかを判定する同一性判定部とを包含する、システムであり得る。保存領域同定部、三次元構造モデル作成部、重ね合わせ部、類似度決定部および同一性判定部は別々の構成要素で実現されてもよく、これら2つ以上が、1つの構成要素によって実現されていてもよい。
次に、図10の機能ブロック図を参照して、本発明のシステム1の構成を説明する。なお、本図においては、単一のシステムで実現した場合を示しているが、複数のシステムで実現される場合も本発明の範囲に包含されることが理解される。
本発明のシステム1000は、コンピュータシステムに内蔵されたCPU1001にシステムバス1020を介してRAM1003、ROMやHDD、磁気ディスク、USBメモリ等のフラッシュメモリなどの外部記憶装置1005及び入出力インターフェース(I/F)1025が接続されて構成される。入出力I/F1025には、キーボードやマウスなどの入力装置1009、ディスプレイなどの出力装置1007、及びモデムなどの通信デバイス1011がそれぞれ接続されている。外部記憶装置1005は、情報データベース格納部1030とプログラム格納部1040とを備えている。何れも、外部記憶装置1005内に確保された一定の記憶領域である。
このようなハードウェア構成において、入力装置1009を介して各種の指令(コマンド)が入力されることで、又は通信I/Fや通信デバイス1011等を介してコマンドを受信することで、この記憶装置1005にインストールされたソフトウェアプログラムがCPU1001によってRAM1003上に呼び出されて展開され実行されることで、OS(オペレーションシステム)と協働して本発明の機能を奏するようになっている。もちろん、このような協働する場合以外の仕組みでも本発明を実装することは可能である。
本発明の実装において、第一の免疫実体および該第二の免疫実体(これらは、抗体、B細胞受容体またはT細胞受容体等でありうる)のアミノ酸配列またはこれと同等の情報(例えば、これをコードする核酸配列等)は、入力装置1009を介して入力され、あるいは、通信I/Fや通信デバイス1011等を介して入力されるか、あるいは、データベース格納部1030に格納されたものであってもよい。第一の免疫実体および第二の免疫実体のアミノ酸配列をフレームワーク領域と相補性決定領域(CDR)とに分割するステップは、プログラム格納部1040に格納されたプログラム、または、入力装置1009を介して各種の指令(コマンド)が入力されることで、又は通信I/Fや通信デバイス1011等を介してコマンドを受信することで、この外部記憶装置1005にインストールされたソフトウェアプログラムによって実行することができる。分割されたデータは、出力装置1007を通じて出力されるかまたは情報データベース格納部1030等の外部記憶装置1005に格納されてもよい。第一の免疫実体および第二の免疫実体のそれぞれについて、フレームワーク領域およびCDRの三次元構造モデルを作成するステップもまた、プログラム格納部1040に格納されたプログラム、または、入力装置1009を介して各種の指令(コマンド)が入力されることで、又は通信I/Fや通信デバイス1011等を介してコマンドを受信することで、この記憶装置1005にインストールされたソフトウェアプログラムによって実行することができる。作成された三次元構造モデルのデータは、出力装置1007を通じて出力されるかまたは情報データベース格納部1030等の外部記憶装置1005に格納されてもよい。三次元構造モデルにおいて第一の免疫実体のフレームワーク領域と第二の免疫実体の該フレームワーク領域とを重ね合わせるステップもまた、プログラム格納部1040に格納されたプログラム、または、入力装置1009を介して各種の指令(コマンド)が入力されることで、又は通信I/Fや通信デバイス1011等を介してコマンドを受信することで、この記憶装置1005にインストールされたソフトウェアプログラムによって実行することができる。作成された重ね合わせデータは、出力装置1007を通じて出力されるかまたは情報データベース格納部1030等の外部記憶装置1005に格納されてもよい。重ね合わせ後の該三次元構造モデルにおいて、第一の免疫実体の該CDRと第二の免疫実体のCDRとの構造類似度を決定するステップもまた、プログラム格納部1040に格納されたプログラム、または、入力装置1009を介して各種の指令(コマンド)が入力されることで、又は通信I/Fや通信デバイス1011等を介してコマンドを受信することで、この記憶装置1005にインストールされたソフトウェアプログラムによって実行することができる。作成された構造類似度データは、出力装置1007を通じて出力されるかまたは情報データベース格納部1030等の外部記憶装置1005に格納されてもよい。構造類似度を行う際に行われる同一残基の定義もまた、プログラム格納部1040に格納されたプログラム、または、入力装置1009を介して各種の指令(コマンド)が入力されることで、又は通信I/Fや通信デバイス1011等を介してコマンドを受信することで、この記憶装置1005にインストールされたソフトウェアプログラムによって実行することができる。作成された同一残基の定義は、出力装置1007を通じて出力されるかまたは情報データベース格納部1030等の外部記憶装置1005に格納されてもよい。
構造類似度に基づいて、第一の免疫実体と結合するエピトープと第二の免疫実体と結合するエピトープとが同一か異なるかを判定するステップもまた、プログラム格納部1040に格納されたプログラム、または、入力装置1009を介して各種の指令(コマンド)が入力されることで、又は通信I/Fや通信デバイス1011等を介してコマンドを受信することで、この記憶装置1005にインストールされたソフトウェアプログラムによって実行することができる。出された判定は、出力装置1007を通じて出力されるかまたは情報データベース格納部1030等の外部記憶装置1005に格納されてもよい。
データベース格納部1030には、これらのデータや計算結果、もしくは通信デバイス1011等を介して取得した情報が随時書き込まれ、更新される。各入力配列セット中の各々の配列、参照データベースの各遺伝子情報ID等の情報を各マスタテーブルで管理することにより、蓄積対象となるサンプルに帰属する情報を、各マスタテーブルにおいて定義されたIDにより管理することが可能となる。
データベース格納部1030には、上記計算結果は、疾患、障害、生体情報等の既知の情報と関連付けて格納されてもよい。このような関連付けは、ネットワーク(インターネット、イントラネット等)を通じて入手可能なデータをそのまままたはネットワークのリンクとしてなされてもよい。
また、プログラム格納部1040に格納されるコンピュータプログラムは、コンピュータを、上記した処理システム、例えば、各種分類、分割、三次元構造モデリング、重ね合わせ、構造類似度の計算または処理、同一残基の定義、類比判断等を行う処理を実施するシステムとして構成するものである。これらの各機能は、それぞれが独立したコンピュータプログラムやそのモジュール、ルーチンなどであり、上記CPU1001によって実行されることでコンピュータを各システムや装置として構成させるものである。なお、以下においては、それぞれのシステムにおける各機能が協働してそれぞれのシステムを構成しているものとする。
1つの局面において、本発明は、データベースを用いて被験体のエピトープまたはそのクラスターを解析し、および/または診断もしくは診断結果に基づき治療する方法を提供する。この方法および本明細書で説明される1つまたは複数の更なる特徴を含む方法を、本明細書において「本発明のエピトープクラスター解析法」とも呼ぶ。そして本発明のレパトア解析法を実現するシステムを「本発明のエピトープクラスター解析システム」ともいう。
以上のステップを図10に加え、図11も参照しながらさらに説明する。
S1(ステップ(1))において、第一の免疫実体および第二の免疫実体のアミノ酸配列が提供され、それらの配列を保存領域(例えば、フレームワーク領域)を同定し、必要に応じて他の領域、例えば非保存領域(例えば、相補性決定領域(CDR))とを同定する。必要に応じて保存領域と非保存領域とに分割する。これは、外部記憶装置1005に保存されたものであってもよいが、通常は、通信デバイス1011を通じて、公共で提供されるデータベースとして取得することができる。あるいは入力装置1009を用いて入力し、必要に応じてRAM1003または外部記憶装置1005に記録してもよい。ここでは、免疫実体の配列情報を含むデータベースが提供される。配列情報はまた、実際に得られた試料の配列を決定することによって入手され得る。RNAまたはDNAを腫瘍および健常組織から、各組織からポリA+RNAを単離してcDNAを調製し、標準プライマーを用いてcDNAの配列決定を行うことによって、単離され、配列情報を入手し得る。かかる技術は当分野において周知である。また、患者のゲノムの全てまたは一部の配列決定が、当該分野において周知である。ハイスループットDNA配列決定法は当分野において公知であり、例えば、イルミナ(登録商標)配列決定技術によるMiSeq(商標)シリーズのシステムを含む。これは、大規模パラレルSBS手法を用いて、数十億の塩基の高品質のDNA配列を1処理あたりに生成する。あるいは、抗体のアミノ酸配列を質量分析によって決定することもできる。本発明のシステムにおいてS1を実現する部分は保存領域同定部とも呼ばれる。
S2(ステップ(2))では、第一の免疫実体および第二の免疫実体の三次元構造モデルが作成される。1つの具体的な実施形態では、第一の免疫実体および第二の免疫実体のそれぞれについて、保存領域(例えば、フレームワーク領域)および非保存領域(例えば、CDR)の三次元構造モデルが作成される。ここでは、入力装置1009を用いるか通信デバイス1011を介して、例えば三次元構造モデリングソフトを用いて、アミノ酸配列をもとに作成された三次元構造モデルが入力される。ここではS1でも提供されている、第一の免疫実体および第二の免疫実体のアミノ酸配列(一次配列)情報を受け取り、それを遺伝子配列解析する装置が接続されていてもよい。あるいはこれらの情報は、実際に入手した抗体等の免疫実体のアミノ酸配列または核酸配列を、実際に配列決定を行うことによって、入手してもよい。遺伝子配列解析する装置へのそのような接続はシステムバス1020を通じて行われるかまたは通信デバイス1011を通じて行われる。ここでは、必要に応じてトリミングおよび/または適切な長さのものの抽出を行うことができる。そのような処理は、CPU1001で行われる。三次元モデリングをするためのプログラムはそれぞれ外部記憶装置または通信デバイスまたは入力装置を介して提供されうる。本発明のシステムにおいてS2を実現する部分は三次元構造モデル作成部とも呼ばれる。
S3(ステップ(3))では、重ね合わせがなされる。ここでは、S2で作成された三次元構造モデリングに基づき、S1で同定または分割した第一の免疫実体の保存領域(例えば、フレームワーク領域)と該第二の免疫実体の保存領域(例えば、フレームワーク領域)との重ね合わせがなされる。重ね合わせの際には、行列対角化、特異値分解による平均二乗誤差の最小化等の具体的な処理がなされてもよい。このような重ね合わせのために、通信デバイス1011等を介して得られるかまたはS2で得られたデータに対して処理を行う。この処理はCPU1001で行われる。これらを実行するためのプログラムは、それぞれ外部記憶装置または通信デバイスまたは入力装置を介して提供されうる。本発明のシステムにおいてS3を実現する部分は重ね合わせ部とも呼ばれる。
S4(ステップ(4))では、S3の重ね合わせ後の該三次元構造モデルにおいて、該第一の免疫実体と該第二の免疫実体との類似度(例えば、構造類似度、配列類似度等)等を決定する。ここでは、代表的に、非保存領域(例えば、CDR)の類似度が決定され、S5におけるエピトープの類比判断に使用される。この処理もまたCPU1001で行われる。これらを実行するためのプログラムは、それぞれ外部記憶装置または通信デバイスまたは入力装置を介して提供されうる。ここでは、好ましい実施形態では、アラインメント等を用いて同一残基の定義を行うことができる。同一残基の定義もまたCPU1001でなされる。また、構造類似度の算出もまたCPU1001でなされる。これらのプログラムもまた、それぞれ外部記憶装置または通信デバイスまたは入力装置を介して提供されうる。結果は、RAM1003または外部記憶装置1005に保存することができる。このような処理のためのプログラムもまた、それぞれ外部記憶装置または通信デバイスまたは入力装置を介して提供されうる。本発明のシステムにおいてS4を実現する部分は類似度決定部とも呼ばれる。
S5(ステップ(5)では、S4で得られた類似度(例えば、構造類似度、配列類似度等)に基づいて、第一の免疫実体と結合するエピトープと第二の免疫実体と結合するエピトープとが同一か異なるかを判定する。類似度を比較し、第一の免疫実体お結合するエピトープと、第二の免疫実体とを結合するエピトープとが同一(同一クラスターに属するほど類似する)のか、異なっているのかを判定するが、これもまたCPU1001でなされる。この処理のためのプログラムもまた、それぞれ外部記憶装置または通信デバイスまたは入力装置を介して提供されうる。類似度の判定により、その後同一クラスターとするかまたは異なるクラスターを作成してもよい。このような処理もまた、CPU1001でなされる。この処理のためのプログラムもまた、それぞれ外部記憶装置または通信デバイスまたは入力装置を介して提供されうる。本発明のシステムにおいてS5を実現する部分は同一性判定部とも呼ばれる。
<組成物、治療、診断、医薬等>
本発明はまた、実施形態としては、上述の分類またはクラスター化されたエピトープ、ポリペプチド、免疫実体結合物(例えば、抗原;抗原としては、エピトープを含むペプチド等の他、糖鎖等翻訳後修飾を含むもの、DNA/RNAといった核酸、低分子も含まれる)、免疫実体結合物またはクラスターに対して実質的類似性を有するポリペプチドを含む。他の好ましい実施形態としては、上記のいずれかに対して機能的類似性を有するポリペプチドを含む。さらなる実施形態は、本発明は、上述の分類またはクラスター化されたエピトープ、ポリペプチド、免疫実体結合物(例えば、抗原)、またはクラスター、ならびにそれらに対して実質的類似性を有するポリペプチドをコードする核酸を含む。ここで採用され得る任意の特徴は本明細書の<エピトープクラスター化技術>に記載される任意の特徴またはその組み合わせ、あるいはそれらの技術で同定、分類またはクラスター化されたものでありうる。
1つの実施形態では、本発明のエピトープ、クラスターまたはそれらを含むポリペプチドは、HLA−A2分子に対して親和性を有することができる。親和性は、結合アッセイ、エピトープ認識の制限アッセイ、予測アルゴリズム等により決定することができる。エピトープ、クラスターまたはそれらを含むポリペプチドは、HLA−B7、HLA−B51分子等に対して親和性を有することができる。
本発明の他の実施形態では、本発明は、本発明で分類またはクラスター化されたエピトープ、それらを含むクラスターまたはポリペプチド、を包含するポリペプチド、および薬学的に許容可能なアジュバント、キャリア、希釈剤、賦形剤等を含む薬学的組成物を提供する。アジュバントはポリヌクレオチドであり得る。ポリヌクレオチドはジヌレクオチドを含むことができる。アジュバントは、ポリヌクレオチドによりコードされ得る。アジュバントはサイトカインであり得る。
さらなる実施形態では、本発明は、本発明で分類またはクラスター化されたエピトープまたは免疫実体結合物(例えば、抗原)を含むポリペプチドをコードする核酸を含む本明細書中に記載する核酸のいずれかを含む薬学的組成物に関する。かかる組成物は、薬学的に許容可能なアジュバント、キャリア、希釈剤、賦形剤等を含むことができる。
さらなる実施形態では、本発明は、本発明で分類またはクラスター化されたエピトープの少なくとも1つに特異的に結合する単離されおよび/または精製された抗体、抗原結合断片または他の免疫実体(例えば、B細胞受容体、B細胞受容体の断片、T細胞受容体、T細胞受容体の断片、キメラ抗原受容体(CAR)、またはこれらのいずれかまたは複数を含む細胞)に関する。他の実施形態では、本発明は、本発明で分類またはクラスター化されたエピトープまたは任意の他の適切なエピトープを含むペプチド−MHCタンパク質複合体に特異的に結合する単離されおよび/または精製された抗体または他の免疫実体に関する。いずれかの実施形態からの抗体はモノクローナル抗体またはポリクローナル抗体であり得る。これらの組成物は、薬学的に許容可能なアジュバント、キャリア、希釈剤、賦形剤等を含むことができる。
さらなる実施形態では、本発明は、本発明で分類またはクラスター化されたエピトープの少なくとも1つに特異的に相互作用するT細胞受容体(TCR)および/またはB細胞受容体(BCR)、それらの断片、またはその結合ドメインを含む単離されたタンパク質分子、またはTCRおよび/またはBCRのレパトア、キメラ抗原受容体(CAR)、またはこれらのいずれかまたは複数を含む細胞(例えば、キメラ抗原受容体(CAR)を含む遺伝子改変T細胞(CAR−T細胞ともいう)等)または他の免疫実体に関する。他の実施形態では、本発明は、本発明で分類またはクラスター化されたエピトープまたは任意の他の適切なエピトープを含むペプチド−MHCタンパク質複合体に特異的に結合する単離されおよび/または精製された抗体または他の免疫実体に関する。これらの組成物は、薬学的に許容可能なアジュバント、キャリア、希釈剤、賦形剤等を含むことができる。
さらなる局面では、本発明は、本発明の方法で生成されたクラスターに基づき、前記免疫実体の保有者を既知の疾患または障害あるいは生体の状態と関連付ける工程を包含する、疾患または障害あるいは生体の状態の同定法を提供する。あるいは別の局面では、本発明は、別の局面では、本発明の方法で生成されたクラスターを一つまたは複数用いて、該クラスターの保有者の疾患または障害あるいは生体の状態を評価する工程を含む疾患または障害あるいは生体の状態の同定法を提供する。ここで採用され得る任意の特徴は本明細書の<エピトープクラスター化技術>に記載される任意の特徴またはその組み合わせ、あるいはそれらの技術で同定、分類またはクラスター化されたものでありうる。ここで、上記評価は、評価は、前記複数のクラスターの存在量の順位、複数のクラスターの存在比に基づく分析、一定数のB細胞を調べ、その中に興味あるBCRと類似のもの/クラスターがあるかどうかという定量による分析などから選択される少なくとも1つの指標を用いてなされうるが、これらに限定されない。さらに別の実施形態では、上記評価は、前記クラスター以外の指標(例えば、疾患関連遺伝子、疾患関連遺伝子の多型、疾患関連遺伝子の発現プロファイル、エピジェネティクス解析、TCRおよびBCRのクラスターの組合せなどを挙げることができる。)も用いてなされる。本発明を用いることで、例えば、具体的には免疫系で重要な疾患特異的遺伝子(HLA allele等)、疾患関連遺伝子多型や遺伝子発現プロファイル(RNA-seq等)、エピジェネティクス解析(メチル化解析等)と組み合わせるこ
とができる。
1つの実施形態では、本発明が同定し得る疾患または障害あるいは生体の状態の同定は、前記疾患または障害あるいは生体の状態の診断、予後、薬力学、予測、代替法の決定、患者層の特定、安全性の評価、毒性の評価、およびこれらのモニタリングなどでありうる。
別の局面において、本発明は本発明で同定または分類されたエピトープ、あるいは精製したクラスターを1つまたは複数用いて、疾患または障害あるいは生体の状態の指標となるバイオマーカーの評価を行う工程を含む、該バイオマーカーの評価のための方法を提供する。あるいは本発明は本発明で同定または分類されたエピトープ、あるいは精製したクラスターを1つまたは複数用いて、疾患または障害あるいは生体の状態と関連付け、バイオマーカーを決定する工程を含む、該バイオマーカーの同定のための方法を提供する。ここで、バイオマーカーの同定法については以下のような手法を用いることができる。例えば、シーケンサーで読んだB細胞レパトアの興味あるクラスターの存在、大きさ、占有率
等をマーカーとして同定し、またそれらを利用することができる。
さらなる実施形態では、本発明は、本発明で分類またはクラスター化されたエピトープ、クラスターまたはそれらを含むポリペプチドをコードする構築物を含む本明細書中に記載する組換え構築物を発現する宿主細胞に関する。宿主細胞は樹状細胞、マクロファージ、腫瘍細胞、腫瘍由来細胞、細菌、真菌、原生動物等であり得る。この実施形態はまたこのような宿主細胞、および薬学的に許容可能なアジュバント、キャリア、希釈剤、賦形剤等を含む薬学的組成物を提供する。
別の局面では、本発明は、本発明に基づいて同定されたエピトープまたはそれを含む抗原または免疫実体結合物を含む、前記生体情報の同定のための組成物を提供する。あるいは、本発明は、本発明に基づいて同定されたエピトープまたはそれを含む抗原または免疫実体結合物を含む、疾患または障害あるいは生体の状態を診断するための組成物を提供する。ここで採用され得る任意の特徴は本明細書の<エピトープクラスター化技術>に記載される任意の特徴またはその組み合わせ、あるいはそれらの技術で同定、分類またはクラスター化されたものでありうる。
別の局面では、本発明は、本発明に基づいて同定されたエピトープに対する免疫実体を標的とする物質を含む、疾患または障害あるいは生体の状態を診断するための組成物を提供する。あるいは、本発明は、本発明同定されたエピトープまたはそれを含む抗原または免疫実体結合物を含む、疾患または障害あるいは生体の状態を診断するための組成物を提供する。ここで採用され得る任意の特徴は本明細書の<エピトープクラスター化技術>に記載される任意の特徴またはその組み合わせ、あるいはそれらの技術で同定、分類またはクラスター化されたものでありうる。したがって、免疫実体としては、例えば、抗体、抗体の抗原結合断片、T細胞受容体、T細胞受容体の断片、B細胞受容体、B細胞受容体の断片、キメラ抗原受容体(CAR)、これらのいずれかまたは複数を含む細胞(例えば、キメラ抗原受容体(CAR)を含むT細胞)などを挙げることができる。
さらに別の局面では、本発明は、本発明に基づいて同定されたエピトープに対する免疫実体を含む疾患または障害あるいは生体の状態を治療または予防するための組成物を提供する。ここで採用され得る任意の特徴は本明細書の<エピトープクラスター化技術>に記載される任意の特徴またはその組み合わせ、あるいはそれらの技術で同定、分類またはクラスター化されたものでありうる。また、使用され得る免疫実体は、抗体、抗原結合断片、キメラ抗原受容体(CAR)、キメラ抗原受容体(CAR)を含むT細胞などを挙げることができるがこれらに限定されない。
別の局面において、本発明は、本発明に基づいて同定されたエピトープに対する免疫実体を標的とする物質を含む、疾患または障害あるいは生体の状態を予防または治療するための組成物を提供する。ここで採用され得る任意の特徴は本明細書の<エピトープクラスター化技術>に記載される任意の特徴またはその組み合わせ、あるいはそれらの技術で同定、分類またはクラスター化されたものでありうる。使用され得る物質としては、ペプチド、ポリペプチド、タンパク質、核酸、糖、低分子、高分子、金属イオンこれらの複合体を挙げることができるがこれらに限定されない。
別の局面では、本発明は、本発明に基づいて同定されたエピトープまたはそれを含む免疫実体結合物(例えば、抗原)を含む、疾患または障害あるいは生体の状態を治療または予防するための組成物を提供する。ここで採用され得る任意の特徴は本明細書の<エピトープクラスター化技術>に記載される任意の特徴またはその組み合わせ、あるいはそれらの技術で同定、分類またはクラスター化されたものでありうる。
さらなる実施形態では、本発明は、本発明で分類またはクラスター化されたエピトープ、このエピトープを含むクラスター、このエピトープを含む免疫実体結合物(例えば、抗原)またはポリペプチド、上記および本明細書中に記載の組成物、上記および本明細書中に記載のT細胞または宿主細胞のような少なくとも1つの構成成分を含むワクチンまたは免疫治療用組成物に関する。
本発明はまた、診断方法または治療方法に関する。この方法は、本明細書中に開示するものを含むワクチンまたは免疫治療用組成物のような薬学的組成物を動物に投与するステップを含むことができる。投与は、例えば、経皮、結節内、結節周囲、経口、静脈内、皮内、筋内、腹腔内、粘膜、エーロゾル吸入、滴注等のよう送達様式を含むことができる。この方法は、標的細胞の状態を示す特徴を決定するためにアッセイする工程をさらに含むことができる。上記方法は、第1のアッセイ工程、および第2のアッセイ工程をさらに含むことができ、ここで第1のアッセイ工程は治療薬等の投与工程前に行われ、該第2のアッセイ工程は上記治療薬等の投与工程後に行われる。この場合、第1のアッセイ工程で決定される特徴を、第2のアッセイ工程で決定される特徴と比較する工程であって、それにより結果を得る、比較する工程をさらに含むことができる。結果は、例えば、免疫応答の徴候、標的細胞数の減少、標的細胞を含む腫瘍の質量またはサイズの低下、細胞内寄生生物感染標的細胞の数または濃度の低減等であり得、本発明の方法で分類、同定またはクラスター化されたエピトープに基づいて、判定を行うことができる。
本発明は、本発明の本発明で分類またはクラスター化されたエピトープ、このエピトープを含むクラスター、このエピトープを含む免疫実体結合物(例えば、抗原)またはポリペプチドを、受動/養子免疫治療薬を作製する方法に関する。この方法は、本明細書中の他の箇所に記載するもののようなT細胞または宿主細胞を、薬学的に許容可能なアジュバント、キャリア、希釈剤、賦形剤等と組み合わせることを含むことができる。賦形剤としては、緩衝剤、結合剤、爆破剤、希釈剤、香味料、潤滑剤などを含むことができる。
1つの局面において、本発明は、本発明で分類またはクラスター化されたエピトープ、このエピトープを含むクラスター、このエピトープを含む免疫実体結合物(例えば、抗原)またはポリペプチド等を用いて、障害、疾患または生体状態を診断する方法に関する。上記方法は、被験体組織を、上記および本明細書中の他の箇所に記載するもののいずれかを含む、例えばT細胞、宿主細胞、抗体、タンパク質を含む少なくとも1つの構成成分と接触させること、および上記組織または該構成成分の特徴に基づいて疾患を診断することを含むことができる。接触工程は、例えばin vivoまたはin vitroで行われ得る。本発明は、分類したエピトープを同定する工程をさらに包含する。このような同定する工程には、その構造の決定が含まれ、このほか、例えば、アミノ酸配列の決定、三次元構造の同定、その他構造上の同定、生物学的機能の同定などを含むがこれらに限定されない。
さらなる実施形態では、本発明はワクチンを作製する方法に関する。この方法は、本明細書中の他の箇所に記載するもののいずれかを含むエピトープ、組成物、構築物、T細胞、宿主細胞を含めた少なくとも1つの構成成分を、薬学的に許容可能なアジュバント、キャリア、希釈剤、賦形剤等と組み合わせることを含むことができる。別の実施形態では、本発明は、本発明のクラスタリングおよび分類法ならびにそれにより同定されたエピトープ、免疫実体または免疫実体結合物を用いて、ワクチンの評価または改善を行うことができ、同定されたエピトープまたはそれを含む免疫実体結合物、あるいはクラスターそれ自体を用いてバイオマーカーの評価および/または作成あるいは改善をおこなうことができる。ここで、「改善」は、クラスタリングにより、抗体価を上げたいクラスターを同定するなどして、ワクチン接種時の中和抗体産生をより適切に評価することができ、通常の実験と並行して行うことで、ワクチン性能改善のための手法を提供することを意味する。バイオマーカーの「評価」としては、例えば、まずそれ自身バイオマーカーとなり得るようなクラスター(例えば、疾患の状態と相関するクラスター)を同定し、より単純な実験(例えば、ELISA結合アッセイ等)を用いて実施することができる。)が適切に期待するクラスターの変化をフォローできているか調べる方法を例として挙げることができる。この場合、クラスターそれ自身がマーカーとしての機能を果たしているということが前提であるが、同様に(クラスターの情報を反映するように)作製も行うこともできる。
本発明はまた、本発明に基づいて同定されたエピトープに対する免疫実体を含む、疾患または障害あるいは生体の状態を予防または治療するためのワクチンを評価するための組成物を提供する。これらの評価は、例えば、インフルエンザウイルスの例が実施例6等に記載されており、これらを応用することができる。別の局面において、本発明は、本発明で分類またはクラスター化されたエピトープ、このエピトープを含むクラスター、このエピトープを含む免疫実体結合物(例えば、抗原)またはポリペプチド等を用いて、疾患を治療または予防する方法に関する。この方法は、本明細書中の他の箇所に記載するようなワクチンまたは免疫治療用組成物を動物に投与することを含む動物の治療方法を、例えば放射線療法、化学療法、生化学療法、手術を含む少なくとも1つの治療様式と組み合わせることを含むことができる。
本発明はまた、本発明で分類またはクラスター化されたエピトープ、このエピトープを含むクラスター、このエピトープを含む免疫実体結合物(例えば、抗原)またはポリペプチド等を含むワクチンまたは免疫治療用生成物に関する。さらに他の実施形態は、本明細書中の他の箇所に記載するポリペプチドをコードする単離されたポリヌクレオチドに関する。他の実施形態は、これらのポリヌクレオチドを含むワクチンまたは免疫治療用生成物に関する。ポリヌクレオチドは、DNA、RNA等であり得る。
1つの実施形態では、本発明はまた、送達(デリバリー)デバイス、および本明細書中の他の箇所に記述した実施形態のいずれかを含むキットに関する。送達デバイスは、カテーテル、シリンジ、内部または外部ポンプ、リザーバ、吸入器、マイクロインジェクター、パッチ、および送達の任意の経路に適した任意の他の同様のデバイスであり得る。上述のように、送達デバイスに加えて、キットはまた、本明細書中に開示する実施形態のいずれかを含むことができる。例えば、キットは、単離されたエピトープ、ポリペプチド、クラスター、核酸、免疫実体結合物(例えば、抗原)、上述のいずれかを含む薬学的組成物、抗体、T細胞、T細胞受容体、エピトープ−MHC複合体、ワクチン、免疫治療薬等を含むことができるが、これらに限定されない。キットはまた、使用のための詳細な説明書および任意の他の同様の品目のような品目を含むことができる。
エピトープおよび/またはエピトープクラスターをワクチンまたは薬学的組成物に含めるための特に望ましい戦略は、2000年4月28日に出願された「EPITOPE SYNCHRONIZATION IN ANTIGEN PRESENTING CELLS)」という表題の米国特許出願第09/560,465号に開示されている。
本発明で使用され得るワクチンは、本発明で分類、同定またはクラスター化したエピトープを提示させるのに有効な濃度でエピトープまたはそれを含む免疫実体結合物(例えば、抗原)を含有する。好ましくは、本発明のワクチンは、任意に1つまたは複数の免疫性エピトープと組み合わせて、複数の本発明のエピトープあるいはそのクラスターを含むことができる。本発明のワクチン製剤は、標的に対してエピトープを提示させるのに十分な濃度でペプチドおよび/または核酸を含有する。本発明の製剤は好ましくは、約1μg〜1mg/(ワクチン調製物100μl)の総濃度でエピトープまたはそれを含むペプチドを含有する。ペプチドワクチンおよび/または核酸ワクチンに関する従来の投与量および投薬を本発明ととともに使用することができ、かかる投薬レジメンは当該技術分野で十分に理解されている。一実施形態では、成人に関する一回の投与量はかかる組成物約1〜約5000μlであることが好適であり、一回または複数回で、例えば1週間、2週間、1ヶ月、またはそれ以上に分けた2回、3回、4回またはそれ以上の投与量で投与される。本発明のワクチンは、遺伝的に宿主中でエピトープを発現するように操作されたウイルス、細菌または原生動物のような組換え生物を含むことができる。
本発明のワクチン、組成物、方法は、ワクチンの性能を増強するために、製剤にアジュバントを配合することができる。具体的には、エピトープの送達および取り込みを増強するように設計することができる。本発明により意図されるアジュバントは、当業者に既知であり、例えばGMCSF、GCSF、IL−2、IL−12、BCG、破傷風トキソイド、オステオポンチン、およびETA−1が挙げられる。
本発明のワクチン等は、任意の適切な手法で投与することができる。本発明のワクチンは、当該技術分野で公知の標準的なワクチン送達プロトコルと一致した様式で患者に投与される。エピトープ送達方法としては、注射、滴注、または吸入による送達を含む、経皮、結節内、結節周辺、経口、静脈内、皮内、筋内、腹腔内、および粘膜投与が挙げられるが、これらに限定されない。CTL応答を誘発するためのワクチン送達の特に有用な方法は、2002年1月17日に発行されたオーストラリア特許第739189号、1999年9月1日に出願された米国特許出願第09/380,534号、および2001年2月2日に出願されたその一部同時継続の米国特許出願第09/776,232号に開示されており、これらは本明細書において参考として援用される。
1つの実施形態では、本発明はまた、本発明で分類、同定またはクラスター化したエピトープを提示させるのに有効な濃度でエピトープまたはそれを含む免疫実体結合物(例えば、抗原)に対して特異的に結合するタンパク質、抗体、これらを発現し得る細胞、特異的なB細胞およびT細胞等を含みうる。これらの試薬は、免疫グロブリン、すなわちその生成方法が当該技術分野で周知であるポリクローナル血清またはモノクローナル抗体の形態をとる。ペプチド−MHC分子複合体に関する特異性を有するmAbの生成は当該技術分野で公知である(Aharoni et al. Nature 351:147-150, 1991等)。一般的な構築および使用は、T CELL RECEPTORS AND THEIR USE IN THERAPEUTIC AND DIAGNOSTIC METHODSという表題の米国特許第5,830,755号でも取り扱われている。
1つの実施形態では、本発明で分類、同定またはクラスター化したエピトープを提示させるのに有効な濃度でエピトープまたはそれを含む免疫実体結合物(例えば、抗原)のいずれかを、エピトープに関連した病原状態の診断(イメージング、または他の検出)、モニタリング、および治療で使用するために、酵素、放射化学物質、蛍光タグ、および毒素と結合させることができる。したがって、毒素結合体は、腫瘍細胞を死滅させるのに投与することができ、放射標識は、エピトープ陽性腫瘍のイメージングを容易にすることができ、酵素結合体は、癌を診断し生検組織におけるエピトープ発現を確認するために、ELISA様アッセイで使用することができる。さらなる実施形態では、上述に記載するようなT細胞は、エピトープおよび/またはサイトカインによる刺激により達成される増殖後に、養子免疫療法として患者に投与することができる。
別の実施形態では、本発明は、本発明で分類、同定またはクラスター化したエピトープとMHCとの複合体または、エピトープとしてのペプチド−MHC複合体を提供する。特に好適な実施形態では、複合体は、米国特許第5,635,363号(四量体)、または米国特許第6,015,884号(Ig−二量体)に記載されるもののような可溶性の多量体タンパク質であり得る。かかる試薬は、特定のT細胞応答を検出およびモニタリングする際に、ならびにかかるT細胞を精製する際に有用である。
別の実施形態では、本発明で分類、同定またはクラスター化したエピトープを用いて、機能アッセイを行い、免疫性の内因性レベル、免疫学的刺激(例えば、ワクチン)に対する応答を評価し、疾患と治療の進路による免疫状態をモニタリングすることができる。免疫性の内因性レベルを測定する場合を除いて、これらのアッセイのいずれも、対処される問題の性質に応じて、in vivoでもin vitroでも、免疫の予備工程を前提とし得る。かかる免疫は、本発明の様々な実施形態を用いて、あるいは同様の免疫性を誘起することができる他の形態の免疫原を用いて実施することができる。同族TCRの発現を検出することができるPCRおよび四量体/Ig−二量体型解析を除いて、これらのアッセイは概して、特定の機能活性を検出するために、上述のような本発明の様々な実施形態を好適に使用することができるin vitro抗原性刺激の工程から利益を得る(高細胞溶解性応答はときには直接検出され得る)。最終的に、細胞溶解活性の検出はエピトープ提示標的細胞を必要とし、それは本発明の様々な実施形態を用いて生成することができる。任意の特定の工程に関して選択される特定の実施形態は、対処されるべき問題、使用の容易性、コスト等に依存するが、任意の特定組の状況に関する別の実施形態を上回る一実施形態の利点は当業者に明らかである。
このような機能アッセイでは、本発明のエピトープ、またはMHC分子とのその複合体の形態で、活性化工程もしくは読み取り工程、またはその両方で用いることができる。当該分野で公知のT細胞機能の多くのアッセイ(詳細な手順は、Current Protocols in Immunology 1999 John Wiley & Sons Inc., N.Yのような標準的な免疫学的参照文献に見出すことができる)のうち、細胞プールの応答を測定するアッセイと個々の細胞の応答を測定するアッセイの2つのカテゴリーを実施することができる。前者は、答強度の全体的な測定が可能なのに対して、後者は、応答細胞の相対的頻度を決定し得る。全体的な応答を測定するアッセイの例は、細胞傷害性アッセイ、ELISA、およびサイトカイン分泌を検出する増殖アッセイである。個々の細胞(またはそれらに由来する小クローン)の応答を測定するアッセイとしては、限界希釈解析(LDA)、ELISPOT、未分泌サイトカインのフローサイトメトリー検出(米国特許第5,445,939号、米国特許第5,656,446号および同第5,843,689号に記載されており、それらのための試薬は、商品名「FASTIMMUNE」でBecton, Dickinson & Companyで販売されている)、および上述のように、かつ上記に引用するように四量体またはIg−二量体により特異的TCRの検出が挙げられる(Yee, C. et al. Current Opinion in Immunology, 13:141-146, 2001にも参照。
本発明はキットとして提供されることができる。本明細書において「キット」とは、通常2つ以上の区画に分けて、提供されるべき部分(例えば、検査薬、診断薬、治療薬、抗体、標識、説明書など)が提供されるユニットをいう。安定性等のため、混合されて提供されるべきでなく、使用直前に混合して使用することが好ましいような組成物の提供を目的とするときに、このキットの形態は好ましい。そのようなキットは、好ましくは、提供される部分(例えば、検査薬、診断薬、治療薬をどのように使用するか、あるいは、試薬をどのように処理すべきかを記載する指示書または説明書を備えていることが有利である。本明細書においてキットが試薬キットとして使用される場合、キットには、通常、検査薬、診断薬、治療薬、抗体等の使い方などを記載した指示書などが含まれる。
このように、本発明のさらなる局面では、本発明はキットに関するものであり、このキットは、(a)本発明の医薬組成物を溶液形状または凍結乾燥形状で包含する容器と、(b)選択的に、該凍結乾燥製剤用の希釈剤または再構成液を包含する第2の容器と、(c)選択的に、(i)該溶液の使用または(ii)該凍結乾燥製剤の再構成および/または使用に関する説明書とを有する。該キットは、1もしくはそれ以上の(iii)緩衝剤、(iv)希釈剤、(v)フィルター、(vi)針、または(v)シリンジをさらに有する。該容器は、好ましくは瓶、バイアル瓶、シリンジ、または試験管であり、多用途容器でよい。該医薬組成物は、好ましくは乾燥凍結される。
本発明のキットは、好ましくは、本発明の乾燥凍結製剤およびその再構成および/または使用に関する説明書を、適切な容器内に有する。適切な容器として含まれるのは、例えば、瓶、バイアル瓶(例えばデュアルチャンババイアル)、シリンジ(デュアルチャンパシリンジなど)、および試験管である。該容器は、ガラスまたはプラスチックのような様々な材料から形成することができる。好ましくは、該キットおよび/または容器は、該容器上にある、あるいは該容器に伴う、再構成および/または使用の方法を示す説明書を包含する。例えば、そのラベルは、該乾燥凍結製剤を再構成して上記のペプチド濃度にするという説明を示すことができる。該ラベルは、さらに、該製剤が皮下注射に有用であるもしくは皮下注射のためのものであるという説明を示すことができる。
該製剤の容器は、繰り返し投与(例えば2〜6回の投与)に使うことができる多用途バイアル瓶でもよい。該キットは、さらに、適切な希釈剤(例えば重曹溶液)を有する第2の容器を有することができる。
該希釈剤と該凍結乾燥製剤を混合して作られる再構成された製剤の最終ペプチド濃度は、好ましくは少なくとも0.15mg/mL/ペプチド(=75μg、0.5mlの場合)であり、好ましくは3mg/mL/ペプチド(=1500μg、0.5mlの場合)以下である。該キットは、さらに、商業的観点およびユーザーの観点から見て望ましいその他の材料(その他の緩衝剤、希釈剤、フィルター、針、シリンジ、およびパッケージに挿入される使用説明書を含む)を含むことができる。
本発明のキットは、他の構成要素(例えば他の化合物またはこれら他の化合物の医薬組成物)と共に、もしくはそれらなしに、本発明の医薬組成物の製剤を包含する単一の容器を有すること、または各構成要素によって別の容器を有することができる。
好ましくは、本発明のキットは、第2の化合物(アジュバント(例えばGM-CSF)、化学療法薬剤、天然生成物、ホルモンまたは拮抗薬、他の医薬など)またはその医薬組成物の併投与との組み合わせとして使用するためにパッケージされた本発明の処方を含む。該キットの構成要素は、予め複合体として作られたもの、もしくは、患者に投与するまで各構成要素が異なる別々の容器に入ったものが可能である。該キットの構成要素は、1もしくはそれ以上の液体溶液として提供することができ、好ましくは水溶液であり、より好ましくは滅菌水溶液である。該キットの構成要素は、固体として提供することも可能であり、好ましくは別の異なる容器にて提供される適切な溶剤をそれに加えて液体に変換することができる。
療法キットの容器としては、バイアル、試験管、フラスコ、瓶、シリンジ、もしくは固体または液体を密封する他の任意の手段が可能である。通常、複数の構成要素がある場合、別々に投薬できるように、該キットは第2のバイアルまたはその他の容器を包含する。該キットは、薬学的に許容される液体用の別の容器も包含することができる。好ましくは、治療キットは、該キットの構成要素である本発明の薬剤を投与することを可能にする器具(例えば1もしくはそれ以上の針、シリンジ、点眼器、ピペットなど)を包含する。
本発明の医薬組成物は、経口(経腸)、経鼻腔、経眼、皮下、皮内、筋内、静脈内、または経皮のような任意の許容される経路によって該ペプチドを投与するのに適したものである。好ましくは、該投与は皮下投与であり、最も好ましくは皮内投与である。投与は注入ポンプによって行うことができる。
本明細書において「指示書」は、本発明を使用する方法を医師または他の使用者に対する説明を記載したものである。この指示書は、本発明の検出方法、診断薬の使い方、または医薬などを投与することを指示する文言が記載されている。また、指示書には、投与部位として、経口、食道への投与(例えば、注射などによる)することを指示する文言が記載されていてもよい。この指示書は、本発明が実施される国の監督官庁(例えば、日本であれば厚生労働省、米国であれば食品医薬品局(FDA)など)が規定した様式に従って作成され、その監督官庁により承認を受けた旨が明記される。指示書は、いわゆる添付文書(package insert)であり、通常は紙媒体で提供されるが、それに限定されず、例えば、電子媒体(例えば、インターネットで提供されるホームページ、電子メール)のような形態でも提供され得る。
本明細書において「または」は、文章中に列挙されている事項の「少なくとも1つ以上」を採用できるときに使用される。「もしくは」も同様である。本明細書において「2つの値」の「範囲内」と明記した場合、その範囲には2つの値自体も含む。
(一般技術)
本明細書において用いられる分子生物学的手法、生化学的手法、微生物学的手法、バイオインフォマティクスは、当該分野において公知であり、周知でありまたは慣用される任意のものが使用され得る。
本明細書において引用された、科学文献、特許、特許出願などの参考文献は、その全体が、各々具体的に記載されたのと同じ程度に本明細書において参考として援用される。
以上、本発明を、理解の容易のために好ましい実施形態を示して説明してきた。以下に、実施例に基づいて本発明を説明するが、上述の説明および以下の実施例は、例示の目的のみに提供され、本発明を限定する目的で提供したのではない。従って、本発明の範囲は、本明細書に具体的に記載された実施形態にも実施例にも限定されず、特許請求の範囲によってのみ限定される。
以下に実施例を記載する。必要な場合、以下の実施例において、全ての実験は、大阪大学倫理委員会で承認されたガイドラインに従って実施した。試薬類は具体的には実施例中に記載した製品を使用したが、他メーカー(Sigma−Aldrich、和光純薬、ナカライ、R&D Systems、USCN Life Science INC等)の同等品でも代用可能である。
(実施例1:HIV抗体を用いた例)
本実施例では、本件で提案した手法を用いて非抗HIV抗体が非常に多く存在する場合にも、抗HIV抗体をエピトープごとにクラスタリングできることを示す。
本実施例ではまずPDB(Protein Data Bank)に登録されている構造の中から、抗原の長さが6残基以上のペプチドであるヒト由来抗体−抗原複合体構造を選び出し、その上で以下の二つのデータセットを検討した。
(HIVセット)
270個のヒト由来抗HIV抗体をPDBデータベースから入手した。その抗体の名称は以下のリストのとおりである(表中、最初の4桁がPDB ID、5−7桁目はそれぞれ重鎖、軽鎖、抗原の鎖ID.を示す。)。
配列相同性が非常に近いもの(90%以上)のものはcd-hitというプログラム(J. Craig Venter Instituteから入手可能)を用いてあらかじめ除いた。ここで重鎖、軽鎖ともに90%未満の配列相同性のもののみを残した。抗体構造に可変部分だけでなく定常部分が含まれているものはそれも含めた。
各抗体の3次元構造はPDBに登録されており、エピトープも構造データから知ることができる。
さらに、同一エピトープを認識しているとみなされる抗体が1つの場合は除外した。
選び出された構造のPDBにおけるIDは以下の通りである。
2b1hHLP 3lh2HLS 3mlrHLP 3mlwHLP 3se8HLG 3se9HLG 4j6rHLG 4janABI 4jb9HLG 4jpvHLG 4jpwHLG 4lspHLG 4lsuHLG 4m62HLS 4rwyHLA 4tvpHLG 4xcfHLP 4xmpHLG 4xnyHLG 4xvtHLG 4ydiHLG 4ydkHLG 4ydlBCA 4yflFIE 5cezHLG 5f96HLG 5f9oHLG
(非HIVセット)
275のヒト由来非抗HIV抗体(PDBデータベースから入手した。凡例は表1と同じである。)
配列相同性が非常に近いもの(90%以上)のものはcd-hitを用いてあらかじめ除いた。ここで重鎖、軽鎖ともに90%未満の配列相同性のもののみを残した。抗体構造に可変部分だけでなく定常部分が含まれているものはそれも含めた。
各抗体の3次元構造はPDBに登録されており、エピトープも構造データから知ることができる。
さらに、同一エピトープを認識しているとみなされる抗体が1つの場合は除外した。
選び出された構造のPDBにおけるIDは以下の通りである。
1a2yBAC 1ahwBAC 1bvkBAC 1g7jBAC 1jpsHLT 1orsBAC 2a0lDCA 2eizBAC 3d9aHLC 3l5wBAJ 3l5xHLA 4g6aCDB 4gagHLP 4hs6BAZ 4tsaHLA 4tscHLA 4y5vABC 4y5yABC 最初に全ての抗体は、それぞれのエピトープによって分類される(いわゆる「答え合わせ」の答え)ことを確認した。これらは3次元結晶構造を用いて以下の方法で行った。
(1)抗原の結晶構造をRASH(高速ASH、Rapid ASH、Daron M Standley, Hiroyuki Toh, Haruki Nakamura BMC Bioinformatics. 2007; 8: 116. Published online 2007 Apr 4. doi: 10.1186/1471-2105-8-116を参照)というプ
ログラムを用いて重ね合わせた。構造類似度のスコアがある閾値より高ければ、式1
を用いて(抗原の重ね合わせ時の)抗体の構造類似度(式(1)<数5>で評価される重ね合わせられた各残基ごとの距離のことを言う。)を評価した。重ね合わさった残基を足し合わせ、それを重ね合わさった二つの抗体のRASHスコアで割った。>。これによって、「エピトープ類似性スコア」を得た(0−1)。もし、抗原のASHスコアが閾値より低ければ、「エピトープ類似性スコア」は0とした。本スコアは次に、「真(=解)」のネットワークを作成するために用いた(図6)。
(2)全ての抗体の構造モデルを作成した。ここで、構造モデリングには配列相同なモデルを避けるため、ブラックリスト(配列相同性<85%)を使用した。ここでは更新されたバージョンのKOTAI Antibody Builder (Yamashita K, et al. Bioinformatics 30, 3279-3280 (2014))を用いた。
(3)下記の類似性特徴量を全ての抗HIV抗体対について計算した。
*重鎖、軽鎖それぞれのCDR1−3についてアライメントされた長さ
*重鎖、軽鎖それぞれのCDR1−3について長さの差
*重鎖、軽鎖それぞれのCDR1−3についてNERとアライメントされた長さの比
*重鎖、軽鎖それぞれのCDR1−3についてアライメントされた長さあたりの一致している残基の数
*重鎖、軽鎖それぞれのフレームワーク領域のアライメントされた長さ
*重鎖、軽鎖それぞれのフレームワーク領域の長さの差
*重鎖、軽鎖それぞれのフレームワーク領域のNERとアライメントされた長さの比
*重鎖、軽鎖それぞれのフレームワーク領域のアライメントされた長さあたりの一致している残基の数
*重鎖、軽鎖それぞれのフレームワーク領域のNER
ここで、NERは(Nearly equivalent residues)であり、[数7]で示される。
(4)特徴量をサポートベクターマシン(SVM)の学習に用いた。SVMは5分割交差検証によって以下のように評価した。scikit-learnと呼ばれる機械学習ライブラリを用いた。カーネル関数は”linear”とし、class_weighオプションは”balanced”とした。
(A)全ての可能な抗HIV抗体対(同じ、または異なるエピトープに対する)をランダムに学習セットと検証セットに分けた。ここでは、StratifiedKFoldと呼ばれるサンプリング手法を用いた。
(B)SVMは同じエピトープを認識する抗HIV抗体(positive)と異なるエピトープを認識するもの(negative)を区別するよう学習し、検証セットを用いて性能を検証した。
(C)(B)を検証セットを変えながら5回繰り返した。
(D)(A)〜(C)をセットに分けるための乱数を変えながら100回繰り返した。
図7に結果を示す。
SVMを用いて各対の距離行列を出力した。最後に、全ての抗HIV抗体を距離行列を用いてクラスタリングした。結果を真のネットワークとの類似性によって評価する。結果は配列類似性(既存ソフトウェアのBLASTによって得られたアライメントによる類似性)によってつくられたネットワークとともに図8に示す。
抗HIV抗体、非抗HIV抗体をまとめたセットについても抗HIVと非抗HIV抗体のSVMによって得られた距離行列によってクラスタリングした(図9)。クラスタリングにはPythonのscipyモジュールを用いて階層的クラスタリング手法の一つである、群平均法(average linkage clustering)を適用した。最大距離が0.85未満のものを同一クラスターとみなした。
図8の結果は明らかに提案した発明が配列類似性のみのものに比べて共通のエピトープを持つ抗体をよく同定できることを表している。配列類似性の場合は全てが一つのクラスターになっているが、本発明では最大のクラスターは他のエピトープと離れている。これは真のクラスターとの類似性を評価する、調整ランド指数によって定量化される(図6)。本発明の結果はランド指数0.72、一方で配列類似性の場合は0である。
抗HIV抗体および非抗HIV抗体の両方をまとめた場合には、本発明では抗HIVと非抗HIVとは同一クラスターにならず、最大のHIVクラスターは再び同定された。一方、配列相同性の場合には、大きなクラスターを形成することができなかった。ランド指数はそれぞれ、0.82、0.2であった。
(実施例2:実施例1で構成したPDBデータに基づくクラスターにNGSデータのマッピング例)
本実施例では、実施例1で構成したPDBデータベースに基づくクラスターを用いて、NGSデータをマッピングし、本発明の予測精度を確認する。
HIV陽性のドナー<これらのドナーは、いずれも入手した国または地域の基準(米国等)または国際基準(ICH)に従って構成された倫理委員会の審査を経たものであり、ヘルシンキ宣言等の基準を満たしているものである。>から得られる末梢血から抗原未知の数十個<61個>のB細胞の1細胞次世代シーケンシング(例えばTan et al., Clinical Immunology, 2014, 151, 55)により得られる抗体配列(NGS抗体配列)に実施例1にて構築したSVMをパラメータ等の変更なく適用する。変更なしで適用するのは、新規データに対して統一したあるいは以前に既存データのみに基づいて作成したSVMを適用することができることを示しており、実施例1では、実施例2のデータを分類するには十分なデータを用いて作成されたということを示すものである。実施例1で作成したSVMは実施者が答えを知らないデータに対しても正しくクラスタリングを行えることを示しており、本発明の作用効果が実証されていることの一つの証左である。
以上の操作により、実施例1で構成した既知抗原-抗体構造によるSVMが、未知の配列に対しても有効であるかどうかを調べる。実施例1で考慮したPDB構造(実施例1と同じ)と本実施例のNGS抗体配列を元に作成した構造モデル(Kotai Antibody Builderを用いた)<実施例1でも用いたものであり、Yamashita, K. et al. Bioinformatics30,3279-3280 (2014)を参照。パラメータは実施例1と同じである。>を用い、実施例1と同様の配列、構造それぞれの特徴量を計算、SVMに入力し距離行列を作成する。使用した項目、パラメータは実施例1と同様、図6〜9に記載されるのと同様の手順を行う。
ここでフレームワーク領域の重ね合わせをRASHによって行った。PDB構造同士は、実施例1と同様に、それぞれのNGS抗体は、最短距離のPDB構造とのみ繋がるようにネットワークを描画する。ネットワーク構築において、距離行列を作成すれば、「最短距離のPDB構
造とのみ繋がる」条件は使用したプログラムにおいて距離標列において全てのPDB構造との距離を調べ最短のものを選択することで定める。この結果、すべてのNGS抗体が実施例1で作成された一つのHIV抗体クラスターに属するいずれかのPDB構造との距離が最短である、すなわち一つのHIV抗体エピトープを認識すると判断された。ここでは、単純に最短距離を持つ基地構造と接続した。実際、これらの新たに入手したNGS抗体配列は実験的に抗HIV抗体であることが示され、本発明の手法の有効性が実証される。
(実施例3: ワクチン接種後の増幅クラスターの同定)
本実施例では、ワクチン接種後の増幅クラスターを同定する。これらのデータは、Wiley et al., Science Trans. Med. 2011,93, 1に記載されているものを応用する。
BALB/cマウス(日本チャールスリバーなどから入手可能)等の宿主動物にマラリア原虫(Plasmodium vivax)の抗原を免疫する。この抗原による免疫の際、様々なアジュバント(IDRI から入手可能なGLA-SE 3M Pharmaceuticalsから入手可能な R848-SEを適量(例えば、20μg)))を別々にまた同時に免疫する。標準的な免疫化手順に従い、免役後3週と6週で再度1回目と同じ免疫化手順で免疫を行う。最初の免疫から7週で血液サンプルを得る。また免疫をしていないBALB/cマウスからも同様に血液サンプルを得る。
これらの抗体重鎖配列をLong-read MPSS法<Long-read Massive Parallel signature sequencing;Wiley et al., Science Trans. Med. 2011,93,1参照>により解析する。免疫した後のマウスのレパトア(5000〜10000配列ほどあると見積もられる)と免疫をしていないBALB/cマウスのレパトア2000〜4000配列ほどあると見積もられる)を比較する(なお、レパトアの作成および比較は実施例1を参照)。解析した配列は全部で1万あまりになると見積もられる。通常は入力として重鎖と軽鎖が必要であるが、軽鎖部分の計算を省略し、重鎖のみの構造モデルを作成できるようにしたKotai Antibody Builder(実施例1等を参照)によって三次元モデルを作成する。配列全体のうち、構造モデリングに成功したのは、免疫していないマウス、免疫しているマウスから得られた配列のうち、それぞれ70〜80%程度と予測される。
本発明が提案する手法にしたがって、まずそれぞれの構造のフレームワーク領域を、RASHプログラムを用いて重ね合わせた上で、各構造対の配列及び構造類似度を評価する。ここでは重鎖のみの構造に対して構築したSVMを用いる。SVM構築の方法は以下の通りである。
(1)実施例1で使用したPDB構造を用いてSVMのトレーニングを行った。本実施例ではこれらのうち重鎖の配列一致度が少なくとも90%のもののみをcd-hitを用いて選び出す。重ね合わせ手法、使用した特徴量は実施例1の通りである。ただし、軽鎖の情報は使用しなかった。配列一致度の具体的数値については、適宜変更可能であり、85〜90%程度が良い閾値として採用され得る。
(2)次に、本実施例で使用した抗原に対する既知の抗体構造(例えば、PDBID: 4k2uH、4k4mH、4qexH)との類似性を免疫していないサンプルと免疫サンプル由来の配列それぞれに対して調べる。その結果、免疫後サンプルおよび免疫していないサンプルからそれぞれ3〜5%程度の類似(距離が<0.1)と判定される構造が見つかると推定される(ここで、複数のPDB構造と類似されたものはその分(複数回)カウントする。)。
この結果p値が0.05未満(Chi-squared one-tailed test.)となると見積もられ、免疫したサンプルに既知の抗原に対する抗体と類似構造が有意に多く含まれていることが示される。
(実施例4. より大きなサイズのクラスタリング)
本実施例ではさらに大きなデータセット(数万配列)の解析結果を示す。本実施例はマラリア原虫の抗原の接種後の人のデータを用いる。全ての配列の構造モデリングを、実施例1に準じてKotai Antibody Builderによって行う。本発明が提案する手法にしたがって、まずそれぞれの構造のフレームワーク領域をRASHプログラムを用いて重ね合わせた上で、各構造対の構造類似度を評価する。
本実施例では配列については考慮せず、構造類似度のみを評価する。
ここlenkはアラインされた長さ、CDR領域のnerkは正規化されたガウシアンによる類
似性スコアである。
さらに重みwkとしてそれぞれ1と0.5を用いる。
次に群平均法(閾値=0.1)を用いて配列全てをクラスタリングする。
IMGTデータベースに公開されている20程度のワクチン構成要素に対する抗体を選び出し、データセットに含まれる構造との類似性を評価する。IMGTデータベースの配列についても同様に構造モデリングを行い、構造類似度は上記の式を用いて、類似度(=1−距離)が0.9以上のものを類似とみなす。数万の配列のうち5〜10%程度の構造で既知抗体との類似物が見つかると見積もられる。
さらに抗体の提供者が抗原を同定した抗体のペア(100×100=1万程度)について、より距離の小さい抗体ペアが同一の抗原をターゲットとするかを評価する。その結果、距離が0.1未満のペアの中では20〜30%の割合で正しい興味あるペアを見出し、0.1以上のペアの中では5〜10%の割合でペアを見出すと見積もられる。これは統計的に有意な(p〜10−6)結果と見積もられる。この結果は、本発明者らが提案するより小さな構造的距離をもつ抗体同士が同一のエピトープを認識するという作業仮説を満たすものである。なお、原理的に配列的にも構造的にも非常に似たエピトープであれば区別できないため、ここで、構造的に同じカテゴリーと分類できる類似の抗原の集合体であれば、同一と判断され得る。
(実施例5.サイトメガロウイルス特異的 CD8+T細胞受容体のクラスタリング)
本実施例では、サイトメガロウイルス特異的 CD8+T細胞受容体のクラスタリングを行った。
サイトメガロウイルス(CMV)は免疫力のない人、例えば臓器移植を受けた患者、にとって重大な疾患の原因となる。そのためCMVに対するワクチンの開発が必要である。CMVウイルスが感染するとCMV特異的CD8T細胞が産生される。これまで多くのCMV特異的CD8T細胞の配列が同定されてきた。HLAによって提示されるCMV配列はHLA型によって異なるため、それぞれのドナーが産生するT細胞レパトアはHLA型に依存する。従ってワクチンの有効性をモニターする方法としてワクチン接種後のCMV特異的TCRの産生量を調べることが挙げられる。
図12にエピトープ配列(配列番号1〜6)を示す。(下記表3論文に基づく)。
から収集したCMVのエピトープと結合するHLA型、そしてそれらを認識するTCR β鎖配列(cd−hitプログラムによって95%以上の配列一致を除いたもの)である。
TCR構造モデリングを行った。モデリングの手順は以下のとおりである。
最初にIMGTの定義に従い、CDR3領域をマスクしてBLASTpでPDBに対し、類似PDB配列を検索した。CDR3領域以外のテンプレートとしてe-valueの最も小さいものを採用した。パラメータはデフォルトを使用した。さらにspanner(Lis M, et al., Immunome Res. 2011,7,1)によってCDR3領域の構造を3つ作成した。ここでoscar-star(Liang S, et al., Bioinformatics, 2011, 27, 2913)を用いて側鎖モデリングを行った。さらにoscar-loop(Liang, S., J. Chem. Theory Comput. 2012, 8, 1820)によってCDR3領域のエネルギー最小化及びスコアリングを行い、エネルギー最小のモデルを採用した。結果として132のTCR β鎖配列の構造モデリングに成功した。本発明で提案される手法にしたがって、実施例1と同様の手順により、まずTCR構造において安定な領域をフレームワーク領域と定義し、RASHを用いて構造重ね合わせを行った。重ね合わせ構造を基に配列特徴と構造特徴を用いてSVMを用いた距離行列を作成し、クラスタリングを行った。ここでSVMにはscikit-learnと呼ばれる機械学習ライブラリを用いた。カーネル関数は”rbf”とし、class_weighオプションは”balanced”とした。閾値0.34とし、TCR対を2つのクラスに分け(対の距離が<0.34と>=0.34)、それぞれに属するTCR対が同一のエピトープを認識しているかどうかを評価した(図13)。
その結果、距離の小さい対(<0.34に属するグループ)でより多く同一エピトープを認識する対があることが示された。
(実施例6 B細胞スクリーニング(1))
本実施例では、B細胞のスクリーニングの本手法を応用する例を提示する。
本発明のクラスタリングを用いた技術は、B細胞のスクリーニングに応用可能である。B細胞レパトアのスクリーニングには幾つかの応用が考えられる。一つには興味ある抗体の抗原を抗体配列から探し出すという方法であり、もう一つは興味ある抗体配列群からこれまで知られていなかった未知のものを探し出す方法である。
1つ目の方法の例として、実験が正しく行われたかの評価に使う例をあげる。次世代シーケンシングにおいては複数のサンプルを一度にシーケンシングするため、一般にコンタミネーションが起きる可能性がある。コンタミネーションが起きているかどうかは解析が難しいが、抗体配列をエピトープクラスタリングを用いてスクリーニングを行うことで、意図しない抗原を認識する抗体を見つけ、実験の評価を行うことができる。
ここでは、意図しない抗原を認識する抗体が見つかった場合、コンタミネーションと判断することができる。あるいは、仮説の修正を行うこともできる。
より具体的には、例えば全体の配列数の1%以上を占めるクラスター(あるいは、例えば、順位として10番目までのクラスター)の抗原が同定され、それがワクチンと関係のないものであった場合にはコンタミネーションを疑うということが考えられる。
ワクチン精製に関しても同様に、意図しないアジュバント等に対する抗体産生は抗原(アジュバント)が容易に想定されることから、先に免疫原性を例えば血清との共免疫沈降法等での検出と併用してもよい。本発明の方法は、意図せず混入したものを同定する手法ことができる点で共免疫沈降法では得られない情報を提供することができる。
また、ワクチン評価においてはワクチン精製の良し悪しや、意図しない例えばアジュバントに対する抗体産生が起きていないか等の評価も同様に可能である。
日本では通常、インフルエンザワクチンを鶏卵を用いて作成するため、ワクチンの精製時に卵の成分卵白やリゾチームが残る可能性があり、例えばワクチンの精製が悪いと卵の成分に対する抗体価が上がることが予想される。
このような場合、インフルエンザワクチンを接種したマウスのB細胞レパトアに対して、既知の抗体との類似性評価を行う。ワクチン接種から1週間後のマウスの採血を行う。既知抗体は公的なデータベースに登録されている抗原既知の構造データおよび、配列データを用いる。配列データの場合には構造モデルを作成する。本発明の手法により、実施例1に準じて既知抗体それぞれとレパトア中の抗体との類似性を評価する。ある抗体に対し、類似と判断する閾値の中に複数の既知抗体が選ばれた場合には、最も類似のものを選ぶことにする。実施例1等に記載される上記の方法によりそれぞれ既知抗体を中心とするクラスターを作成し、特に大きなクラスターで抗リゾチーム抗体や抗アジュバント抗体または、全く関係のないもの等意図しない抗原が含まれていないかを調べ、実験が意図通りの結果であるかどうか評価を行う。
<全体の例>
興味ある抗体群を同定し、さらに結合能や中和能が高いものを選び出したい場合がある。この場合、本提案手法を用いればより簡便に効率よく興味ある抗体を選び出すことができる。その手法について述べる。
HIVの広域中和抗体として興味あるB細胞受容体(BCR)はすでに(例えば複数のウイルス株(strain)に対するFACS及び中和能IC50によって)同定してあるとする。興味あるBCRを含むドナーの抹消血からPBMCを作成し、FACSによって興味あるプラズマブラストB細胞を選び出し、1細胞シーケンシングを行う。数万の配列がありさらに他の抗体の検討(例えば特定のウイルス株に対しより親和性の高いものを見出す等)をすすめたいが、どれを優先して検討すべきかわからない場合、実施例1に準じて、構造モデルを作成し、モデルの重ね合わせをして構造、配列類似性特徴量を得る。これをSVMの入力とし、構造クラスターを作成する。同時に、例えばIgBLAST(Ye, et al., NAR, 2013, 41, W34)やIMGT HighV/QUEST (Brochet et al., NAR, 2008, 36, W503)を用いて各配列に対してV(D)J遺伝子のアサイメントを行い、使用されている遺伝子及びCDR3配列によって配列系統(lineageあるいはclone)ごとに分割する。この方法は様々なものが提案されており、当該分野において既知である。(例えばDeKosky, et al., Nat Biotechnol. 2013, 31, 166)。
異なる方法は異なる分割結果を与えるが、その差は些少であり本目的のためには問題にはならない。次に、興味ある同定済みのBCRが構造クラスターのどこに属するかを調べる。比較的広く興味ある抗体周辺を調べたい場合、その抗体が属する構造クラスターだけではなく、その構造クラスターに属するすべての配列系統を比較する。すなわち配列解析と組み合わせることで、興味あるBCRと同じ構造クラスターに属するすべての配列系統を検討すれば良い。本提案手法はエピトープによってクラスター化を行うため、興味あるBCRが属する配列系統だけではなく、機能的によく似たより広い系統を効率的に解析できる。さらに検討すべきBCR配列を絞りたい/広げたい場合には、構造クラスタリングの閾値を変更し、クラスターをさらに分割/統合する、あるいは、配列解析により共通する体細胞突然変異(somatic hyper mutation)ごとに配列系統をさらに分割/統合し、同定済みのBCRと離れた、あるいは近いBCRを選択的に選ぶことで、効率的な探索と評価が可能になる。
(実施例7 B細胞スクリーニング(2))
本実施例では、B細胞スクリーニングの2つ目の方法の例を記載する。
有効なインフルエンザワクチンとは、より幅広いウイルス株を一度に中和する抗体を産生するB細胞を誘導するものである。遺伝的によく保存されているインフルエンザ表面タンパク質(ヘマグルチニン)のステム領域を標的エピトープとするワクチンの作成が試みられている。このワクチンの評価に重要になるのが、ステム領域と結合する抗体をそれ以外の抗体と区別することである。ステム領域を認識する幾つかの抗体群がすでに知られており、それぞれの特徴的な配列モチーフが報告されてきた。(例えばGordon Joyce et al., 2016, Cell 166, 609) ワクチンの評価には網羅的に標的エピトープを認識する抗体を選び出す必要があるが、既存の配列モチーフが標的領域を認識する抗体を網羅している保証はない。
本実施例では、A型インフルエンザのヘマグルチニン(HA)はGroup1とGroup2に分けられる。Group1に属するH1タンパク質をヒトに免疫し、1週間後に血液を摂取する。FACSを用いてGroup1とGroup2に属するHAと結合するB細胞を選び出し、それらの配列を次世代シーケンシングによって得る。これらを既知のインフルエンザ抗体配列を元に、実施例1等の手法に準じて本発明で提案する手法を用いてクラスタリングを行う。これにより、既知の抗体配列と類似のもの含むクラスターと、未知の抗体配列を含むクラスターに分けることができる。既知のものと類似のものを含むクラスターに対してはこれまで報告されてきた配列モチーフが十分にそのクラスターをカバーできていたかどうかを確認し、もしそれに該当しない配列が含まれていれば配列モチーフが十分なものではないことを意味している。理想的には実験的に既知のものと同一エピトープを認識するかどうか確認するのが良い。この目的のためには、例えば結晶構造解析を行うことができる。未知のクラスターについても同様に結晶構造解析を行い、実験的に確認を行うことができる。
(実施例8:aPAP(疾患特異的マーカー))
本実施例では、疾患特異的マーカーの同定手法例を記載する。
その例として、自己免疫性肺胞蛋白症(aPAP)を用いる。
自己免疫性肺胞蛋白症(aPAP)は、肺胞腔内にサーファクタント様物質が溜まり呼吸困難をきたす稀な呼吸器疾患(10万人あたり0.37人)である。この患者は抗GM-CSF抗体を持つことが知られており、例えばGM-CSFノックアウトマウス(G Dranoff, et al., Science 1994, 264, 713-716)の病態再現の報告もある等、抗GM-CSF抗体の病原性が示唆されている。最近、GM-CSFの別々の複数のエピトープを認識する自己抗体がin vitroにおいてGM-CSFを中和し、in vivoにおいてGM-CSFを含む免疫複合体を分解することが知られている。(Piccoli, et al., Nature Communications 2015, 6, 7375) そこで、患者の末梢血から得られたB細胞を用いてこれら異なるエピトープを認識する自己BCRのクラスターを同定し、それらと患者重症度との比較を行う。
B細胞レパトアからクラスターを探し出し、それらと重症度の比較を行うことも可能であろうが、本疾患の場合には抗原が既知であるため、末梢血から抗GM-CSF BCRを持つB細胞をFACSによって選び出し、サンガー法により複数の配列を得てそれらを含むクラスターをB細胞レパトアから探し出す方が簡易である。理想的にはin vitro実験(例えばBiacore)によって、得られた抗GM-CSF BCRの競合度を解析し、かつ/または実施例1にしたがって、本発明で提案するクラスタリング手法によって、得られた抗GM-CSF BCRをエピトープごとに分割する。
複数の異なる重症度の患者の末梢血から各患者のB細胞レパトアを免疫細胞シーケンシング技術によって得る。さらに、「代表的」抗GM-CSF BCR配列を元に、類似のBCR配列を、実施例1にしたがって、本発明で提案するクラスタリング技術によって選び出す。FACSにより検出したBCR配列が次世代シーケンサーで得られたレパトアの中に見つかるとは限らず、また逆も正しい。従って、抗原未知のクラスターでも重症度を表すために重要である可能性は十分にある。上記の重症度との関連性を評価するにあたっては、既知の抗GM-CSF BCR抗体配列を除いたレパトアを、実施例1に準じて、本発明で提案する手法でクラスタリングし、重症度の高い患者において特徴的なクラスター、または重症度とクラスタサイズの相関が高いクラスターを選び出す。
ここで重症度と最も相関するマーカーを選び出すにあたり、幾つかのパターンが期待できる。
1. N(例えば3)以上の抗GM-CSF BCRクラスターが見つかる。
1b. 1に加えてそれらがレパトア全体の(例えば)1%以上を占める場合。
2. 最も重症度と相関するクラスターがあり、かつ他の複数(2以上)のクラスターが発見される。
2b. それらの量的関係性についても重要なクラスターが最大である、それぞれのサイズがほぼ一定である、等。
以上の手順を行うことにより、本発明を、疾患特異的マーカーの同定に応用し得る。
(実施例9:B細胞受容体(BCR)による検証)
本実施例では、B細胞受容体(BCR)を用いて本発明のクラスタリング技術が適切であるかどうかを検証した。ここでは、本発明者らの中心的な仮説は、類似の配列および構造的特徴を有するBCRは、異なる特徴を有するBCRよりも、同一の抗原およびエピトープをより標的にする可能性が高いというものである。
この仮説を試験するために、本発明者らはインフルエンザヘマグルチニン(HA)をモデル抗原として使用した。HAは大きく2つの領域に分けることができる:ステムおよび非ステム(図14)。各領域は複数のエピトープからなり、ステムエピトープは、一般に種々の株の間でよく保存された配列、および構造をもつことから中和抗体のエピトープとして期待されている。HAは軸対称の3量体であり、全てのBCRを共通参照フレーム上に配置するように(すなわち、BCRが(図の背景中の)最小の表面積を占め、HAが結合していないかのようにHA鎖のうちの2つを前面に露出させるように;実際に、これらの「露出された」HA鎖は、BCR中で同様に覆われる。)図を作成した。タンパク質データバンク(PDB)に投稿された非ステムバインダーは、およそ2つのクラスターを占める(クラスター1およびクラスター2と標識する)。
以下に、本実施例の手法を記載する。
(材料および方法)
(抗原特異的B細胞のBCR−seqおよび抗体の特徴付け)
大阪大学の黒崎教授において開発された単一のB細胞サンプルからの免疫グロブリン(Ig)遺伝子レパトアおよびIg親和性プロファイリングの組み合わせ分析を可能にする高効率の方法体系を用いた。
抗ステムBCRおよび抗非ステムBCRを誘発するようにマウスを調製するように実験を設計した(図15)。まず、マウスにインフルエンザヘマグルチニン(HA)をワクチン接種した。フローサイトメトリーを使用して、ワクチン接種マウスから、抗原(HA)特異的胚中心(GC)またはメモリーB細胞について単一細胞選別した。各細胞に関して、Ig重鎖および軽鎖遺伝子転写物を独立してPCR増幅し、配列決定し、哺乳動物発現ベクターにクローニングした。
哺乳動物Expi293F細胞において組換え抗体を産生させて、HA抗原に対する親和性のELISAベースの測定を行った。
この方法を使用して、本発明者らは、Ig配列情報を抗体反応性と関連させ、そして免疫組織間(例えば、脾臓対リンパ節)、時点間(例えば、感染から2週間対4週間)、およびマウス個体間のIgレパトアおよび親和性の多様性を分析した。これらのデータは、ウイルス抗原に対する免疫応答中の、BCRのクローン選択および親和性成熟の機構の理解のために有用であった。
以上の手順によって、9個のステム結合抗HA B細胞および68個の非ステム結合抗HA B細胞を得た。
(3Dモデリングおよびクラスタリング)
次いで、配列データの分析を2段階で実行した:3Dモデリングおよびクラスタリング(図16)。本発明者らは、以下の(BCR3Dモデリング)に記載されるような鋳型の選択方法を用いたこと以外は実施例1に記載したとおり、Kotai Antibody Builderに基づき、3Dモデリング段階の工程を行った ]クラスタリング段階において、本発明者らはまず、配列および構造的特徴を定義し、次いで、これらの特徴を使用して、77個のモデルをPDBから得た43個の既知の抗HABCRと比較し、そして77個のモデル同士で互いに比較した。
(BCR3Dモデリング)
ヒト、マウスおよびラット由来の鋳型可変断片(Fv)配列の非重複セットを、以前に記載した対での構造アライメントに由来する制約を使用して、複数アライニングした(Katoh, K. and Standley, D.M. MAFFT multiple sequence alignment software version 7: improvements in performance and usability. Mol Biol Evol 2013;30(4):772−780.)。フレームワーク鋳型に関して、発明者らは、包括的なセットの配列を含めた。CDR鋳型に関して、発明者らは、各鎖タイプ(BCR_L1−3、BCR_H1−3、TCR_A1−3、TCR_B1−3)において、各CDRの各長さに関する別個のサブセットを調製した。目的のCDRに対応する列ならびにCDRのすぐ上流またはすぐ下流4残基におけるギャップは観察されなかった。MSA m(i、j)(式中、iはアライメントされた配列(行)であり、jはアライメント位置(列)である)を考え、発明者らは、鋳型の任意の対間の配列類似度を、以下式

(式中、w(k)は重みベクトルであり、B(i、j)はギャップペナルティとして追加の次元を含むBLOSUM62スコアの行列である)と規定した。重みw(k)は、Sijと、所定の長さの各CDRに関する配列iおよびjの構造類似度との間の最適な結果を達成するために適合された調節可能なパラメータである。換言すると、本発明者らは、Monte Carloと、Theano pysonライブラリにおいて実行された勾配降下経路とを使用して、Sベースのランキングと類似度ベースのランキングとの間の差異を最小化した。
本発明者らは、鋳型間のアライメントを変化させることなく、構造を予測したい問い合わせ配列(query sequence)qをmに対して効率的にアライメントすることができる(Katoh, K. and Standley, D.M. MAFFT multiple sequence alignment software version 7: improvements in performance and usability. Mol Biol Evol 2013;30(4):772−780.)。所定の問い合わせのモデルを表現するために、発明者らは、最初に、フレームワークMSAに対するアライメントによってCDRの長さを推測した。最も高い、全体のフレームワークスコアを有する自然に対になった鋳型(例えば、BCR_L−HまたはTCR_A−B)を選択し、2つのフレームワーク鋳型の方向付けを規定するために使用した。次いで、各CDRについて、発明者らは、適切なMSAに対して、完全長の問い合わせ配列をアライメントした。CDR MSAにおいて完全長の配列を使用することについての根拠は、CDR外の残基がその安定性に寄与し得ることであった。CDR前および後の4残基のRMSD重ね合わせをアンカーとして使用して、最も高いスコアのCDR鋳型を、最も高いスコアのフレームワーク鋳型に移植した。各ステップにおいて、不一致をモニタリングし、不一致が閾値を超える場合、最も高いスコアの鋳型を最適でない鋳型で置き換えた。問い合わせと鋳型との間で異なる側鎖を、対応するMSA列において頻繁に見られるコンホメーションを使用して再構築した。
(BCRモデルクラスタリング)
クラスタリングに関して、発明者らは、3つのCDR特徴を検討した:
(a)構造類似度
(b)配列類似度および
(c)長さの差異。
所定のCDRについての構造類似度は、タンパク質構造アライメントに関して以前に記載した様に規定した(Standley, D.M., Toh, H. and Nakamura, H. Detecting local structural similarity in proteins by maximizing number of equivalent residues. Proteins 2004;57(2):381−391.)。

式中、dは2つのモデルにおいてアライメントされた残基中のC−アルファ原子間の距離であり、Nはアライメントの長さであり、dは定常参照距離である。1つのモデルに関して、構造類似度を6個のCDRに関する平均として規定した。
所定のCDRについての配列類似度は、アライメントされた残基のBLOSUM62 行列の成分の観点から規定した。モデル1および2に関してアライメントした残基対がアミノ酸aおよびaからなる場合、発明者らは、BLOSUM62a−a行列の成分をBと示す一方で、発明者らは対角線上の要素a−aおよびa−aの成分をCおよびDと示し、所定のCDRについてのスコアを以下のように規定した。
長さの差異は、6個のCDR全てに関するCDRの長さの最大の差異と単純に規定した。この公式を、BCRが標的とする異なるエピトープは唯1つのCDRにおけるCDRの長さの点でしばしば異なり;このため、CDRの平均化または長さによる分割は、ほとんど影響がないとみなされたという知見に基づいて使用した。
次いで、それらがカットオフ内にあった場合、ノードを連結することによってクラスタリングを行った。
(特徴閾値の決定)
まず、同一のエピトープを標的化する異なるアミノ酸配列を有する2個より多くのBCRを有する全てのPDBエントリーをクラスタリングした。この結果、60個のエピトープを標的とする399個のBCRを得た。
次いで、本発明者らは、全てのBCR内および全てのBCR間のStrucSimスコアを計算した。図17Aにおいて示され得るように、約0.9の閾値において、エピトープ間対(すなわち、同一のエピトープ群のもの)のほとんどをエピトープ内対(すなわち、異なるのエピトープ群の間のもの)と分けることができる。次に、本発明者らは、ステムおよび非ステムマウスBCRモデルに関する同一のStrucSimスコアを計算した(図17B)。ここで、「ステム」および「非ステム」クラスはそれぞれ、多くの異なるエピトープを表すという事実のために、分離は完全なものではなかった。
そこで、ステムおよび非ステムクラスを異なるエピトープに分離するために、発明者らは、StrucSimの閾値を0.95に設定した(図18)。
閾値内でマッチする特徴を有する対の部分の間で単一の線を描くPython NetworkX graphviz packageを使用して、クラスターを可視化した(図19)。
(考察)
本発明者らがモデルを互いに比較したとき、高度の類似度を見出した(図19)。特に、抗非ステムBCRの大半は、大きなクラスターを形成し、それは、抗ステムBCRを一切含有しなかった。その内容と一致して、抗ステムBCRのうちの2つは、一緒にクラスター化した。既知の抗ステムBCRの分析によって、このクラスは多様なエピトープおよびBCRを表すことが確認された(「特徴閾値の決定」を参照)。このため、抗ステムBCR間のより低いクラスター化は、実験データと一致している。
本実施例では、非ステム(non-stem)とステム(stem)とが、実験的に確かめられたBCRを用いて分類することができた、すなわち、非ステム(non-stem)とアサインされたものとステム(stem)とアサインされたものが分離されたという点が、本実施例において重要な点であり、本発明の有用性を示すものである。さらなる分類は、閾値を適宜調整することで可能なことが理解される。
ステム領域について、分離されなかったことには、PDBに蓄積されたデータ層の問題とステム領域の生物学的意味の点から説明することができ、この点は、本発明の理論によく整合する。すなわち、インフルエンザヘマグルチニン(HA)のステム(stem)領域と非ステム(non-stem) (HeadまたはStalkともよばれる) 領域はそれぞれ大きなタンパク質であり、それぞれに多数エピトープが存在する。PDBにある構造は中和抗体として注目されている、ステム領域、および非ステム領域のうち、シアル酸の受容体結合サイトを認識しているものがほとんどであることが知られており、さらに、ステム領域より非ステム領域の受容体結合サイトがよく保存されていることが知られている(そうでなければ結合できない)。従って、図14では多くの抗体が重なって見える((Cluster 2)。他方、ステム領域は図14では様々な株(系統)を重ね書きしているため、いくつかの株(系統)に渡って中和するものも全てを中和するというわけではない(スペクトル幅が異なる)ため、広がって見えることになる。実際にも、非ステム領域には中和しない抗体が結合する株(系統)特異的な免疫優勢な部位(エピトープ)が知られている(各4〜5個程度)。ただし、科学的に注目されることが少ないため、PDBのデータベースに蓄積された結晶構造は少ないと考えられており、いみじくも本発明の技術によって蓄積しているデータの特徴が明らかになったといえる。
(注記)
以上のように、本発明の好ましい実施形態を用いて本発明を例示してきたが、本発明は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。本明細書において引用した特許、特許出願および文献は、その内容自体が具体的に本明細書に記載されているのと同様にその内容が本明細書に対する参考として援用されるべきであることが理解される。本願は、日本国に2017年9月16日に出願された特願2016−181250に対して優先権主張するものであり、その内容は、本明細書においてその全体が参考として援用される。
免疫関連の疾患について、精確度が高い、臨床応用が可能である。
配列番号1〜6:実施例5で使用したエピトープ配列

Claims (10)

  1. 第一の免疫実体(immunological entity)および第二の免疫実体について、結合するエピトープが同一か異なるかを分類する方法であって、該方法は、
    (1)該第一の免疫実体および該第二の免疫実体のアミノ酸配列の保存領域を同定するステップと、
    (2)該第一の免疫実体および該第二の免疫実体の三次元構造モデルを作成するステップと、
    (3)該三次元構造モデルにおいて該第一の免疫実体の該保存領域と該第二の免疫実体の該保存領域とを重ね合わせるステップと、
    (4)該重ね合わせ後の該三次元構造モデルにおいて、該第一の免疫実体の非保存領域と該第二の免疫実体の非保存領域との類似度を決定するステップと、
    (5)該類似度に基づいて、該第一の免疫実体と結合するエピトープと該第二の免疫実体と結合するエピトープが同一か異なるかを判定するステップと
    を包含する、方法。
  2. 前記免疫実体は抗体、抗体の抗原結合断片、B細胞受容体、B細胞受容体の断片、T細胞受容体、T細胞受容体の断片、キメラ抗原受容体(CAR)、またはこれらのいずれかまたは複数を含む細胞である、請求項1に記載の方法。
  3. 前記類似度の決定において、同一残基の定義がなされる、請求項1に記載の方法。
  4. 前記類似度は、長さの違い、配列類似度および三次元構造類似度の少なくとも1つに基づいて決定される、請求項1に記載の方法。
  5. 前記類似度は、少なくとも三次元構造類似度を含む、請求項1に記載の方法。
  6. 請求項1に記載の方法をコンピュータに実行させるプログラム。
  7. 請求項1に記載の方法をコンピュータに実行させるプログラムを格納した記録媒体。
  8. 請求項1に記載の方法をコンピュータに実行させるプログラムを含むシステム
  9. 前記エピトープについて、生体情報と関連付ける工程を包含するステップを包含する、請求項1に記載の方法。
  10. 請求項1または9に記載の分類方法を用いて、結合するエピトープが同一である免疫実体を同一のクラスターに分類する工程を包含する、エピトープのクラスターを生成する方法。
JP2018539195A 2016-09-16 2017-09-15 免疫実体クラスタリングソフトウェア Active JP6778932B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016181520 2016-09-16
JP2016181520 2016-09-16
PCT/JP2017/033530 WO2018052131A1 (ja) 2016-09-16 2017-09-15 免疫実体クラスタリングソフトウェア

Publications (2)

Publication Number Publication Date
JPWO2018052131A1 JPWO2018052131A1 (ja) 2019-08-08
JP6778932B2 true JP6778932B2 (ja) 2020-11-04

Family

ID=61620156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018539195A Active JP6778932B2 (ja) 2016-09-16 2017-09-15 免疫実体クラスタリングソフトウェア

Country Status (3)

Country Link
US (1) US20190214108A1 (ja)
JP (1) JP6778932B2 (ja)
WO (1) WO2018052131A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210012858A1 (en) * 2018-03-16 2021-01-14 Kotai Biotechnologies, Inc. Effective clustering of immunological entities
JP6500144B1 (ja) * 2018-03-28 2019-04-10 Kotaiバイオテクノロジーズ株式会社 免疫実体の効率的クラスタリング
AU2022363929A1 (en) * 2021-10-13 2024-05-02 Invitae Corporation High-throughput prediction of variant effects from conformational dynamics

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7117096B2 (en) * 2001-04-17 2006-10-03 Abmaxis, Inc. Structure-based selection and affinity maturation of antibody library
SG135053A1 (en) * 2002-05-20 2007-09-28 Abmaxis Inc Generation and selection of protein library in silico
JP4231922B2 (ja) * 2002-12-26 2009-03-04 独立行政法人産業技術総合研究所 タンパク質立体構造予測システム
JP4250443B2 (ja) * 2003-03-25 2009-04-08 セレスター・レキシコ・サイエンシズ株式会社 抗体設計装置、抗体設計方法、プログラム、および、記録媒体
AU2009322185A1 (en) * 2008-12-05 2011-07-21 Lpath, Inc. Antibody design using anti-lipid antibody crystal structures
CN104520439A (zh) * 2012-02-28 2015-04-15 国立大学法人东京农工大学 Tdp-43细胞内存在量关联疾患的认定方法

Also Published As

Publication number Publication date
WO2018052131A1 (ja) 2018-03-22
JPWO2018052131A1 (ja) 2019-08-08
US20190214108A1 (en) 2019-07-11

Similar Documents

Publication Publication Date Title
Cao et al. Design of protein-binding proteins from the target structure alone
US11560409B2 (en) Epitope focusing by variable effective antigen surface concentration
JP6661107B2 (ja) T細胞受容体およびb細胞受容体レパトアの解析のための方法およびそのためのソフトウェア
Angeletti et al. Understanding and manipulating viral immunity: antibody immunodominance enters center stage
Galson et al. BCR repertoire sequencing: different patterns of B‐cell activation after two Meningococcal vaccines
US20150259749A1 (en) Methods for producing high-fidelity autologous idiotype vaccines
TW202132573A (zh) 腫瘤微環境之分類
CN106164289A (zh) 癌症对免疫疗法的反应的决定因素
JP6778932B2 (ja) 免疫実体クラスタリングソフトウェア
JP6500144B1 (ja) 免疫実体の効率的クラスタリング
JP7097100B2 (ja) 免疫実体の効率的クラスタリング
Abduljaleel et al. Peptides-based vaccine against SARS-n CoV-2 antigenic fragmented synthetic epitopes recognized by T cell and β-cell initiation of specific antibodies to fight the infection
Valentini et al. Identification of neoepitopes recognized by tumor-infiltrating lymphocytes (TILs) from patients with glioma
US20220275043A1 (en) Soluble multimeric immunoglobulin-scaffold based fusion proteins and uses thereof
Harris et al. Reducing immunogenicity by design: approaches to minimize immunogenicity of monoclonal antibodies
Choy et al. SARS-CoV-2 infection establishes a stable and age-independent CD8+ T cell response against a dominant nucleocapsid epitope using restricted T cell receptors
Salaikumaran et al. Epitope order Matters in multi-epitope-based peptide (MEBP) vaccine design: An in silico study
WO2022196701A1 (ja) 濾胞性t細胞を用いた新規医療技術
US11635434B2 (en) Betaretrovirus epitopes and related methods of use
EP4361267A1 (en) Method for identifying t-cell epitope sequence, and application of same
McIntire et al. Maturation of germinal center B cells after influenza virus vaccination in humans
US20220042993A1 (en) Betaretrovirus epitopes and related methods of use
Sibener Molecular Determinants of T Cell Receptor Specificity and Activation
Fourie et al. OPEN ACCESS EDITED BY
US20220073963A1 (en) Compositions and methods for detecting and treating type 1 diabetes and other autoimmune diseases

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200929

R150 Certificate of patent or registration of utility model

Ref document number: 6778932

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04