JP2024064128A - 抗原探索方法及び抗原探索システム - Google Patents

抗原探索方法及び抗原探索システム Download PDF

Info

Publication number
JP2024064128A
JP2024064128A JP2022172488A JP2022172488A JP2024064128A JP 2024064128 A JP2024064128 A JP 2024064128A JP 2022172488 A JP2022172488 A JP 2022172488A JP 2022172488 A JP2022172488 A JP 2022172488A JP 2024064128 A JP2024064128 A JP 2024064128A
Authority
JP
Japan
Prior art keywords
data
antibody
antigen
target proteins
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022172488A
Other languages
English (en)
Inventor
裕一 引地
悠矢 宮本
慎弥 渡辺
基樹 高木
順一 今井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tuning Fork Bio Inc
Original Assignee
Tuning Fork Bio Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tuning Fork Bio Inc filed Critical Tuning Fork Bio Inc
Priority to JP2022172488A priority Critical patent/JP2024064128A/ja
Priority to PCT/JP2023/033322 priority patent/WO2024090062A1/ja
Publication of JP2024064128A publication Critical patent/JP2024064128A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • C12M1/34Measuring or testing with condition measuring or sensing means, e.g. colony counters
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Zoology (AREA)
  • Medicinal Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Sustainable Development (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Cell Biology (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Peptides Or Proteins (AREA)

Abstract

【課題】基板上に複数の標的タンパク質が固定されてなるタンパク質マイクロアレイを用いて、複数の疾患のそれぞれに関連する疾患関連抗原と相関を有する標的タンパク質を効率よく探索することが可能な抗原探索方法及び抗原探索システムを提供する。【解決手段】抗原探索方法は、測定データD1を取得するデータ取得工程S1、データ算出工程S2、及び抗原選定工程S3を含む。データ算出工程S2では、測定データD1に基づいて、タンパク質マイクロアレイ4に固定された第1数の標的タンパク質TPと複数の被検体試料SPS中の自己抗体ABAとの抗原抗体反応に関する抗体データD3を算出する。抗原選定工程S3では、抗体データD3を入力データとして機械学習モデルLMに入力し、複数の疾患のそれぞれに対応して、第1数の標的タンパク質TPの中から選定された疾患関連抗原AGと相関を有する特定の標的タンパク質TPSを出力する。【選択図】図4

Description

本発明は、タンパク質マイクロアレイを用いて複数の疾患のそれぞれに関連する疾患関連抗原と相関を有する標的タンパク質を探索する抗原探索方法及び抗原探索システムに関する。
疾患を有する被検体に由来する被検体試料を、タンパク質マイクロアレイを用いて分析することが知られている(例えば特許文献1参照)。タンパク質マイクロアレイは、スライドガラス等の基板上に標的タンパク質を数千~数万スポット並べて固定化したものである。基板上の各標的タンパク質に被検体試料を接触させることにより、被検体試料中の自己抗体と各標的タンパク質との抗原抗体反応に伴う結合性の指標となる特徴量を測定データとして得ることができる。
特表2021-521536号公報
自己抗体は、疾患に関連する疾患関連抗原に対して産生される。このため、タンパク質マイクロアレイの基板上の各標的タンパク質と自己抗体との抗原抗体反応に関する測定データを解析することで、各標的タンパク質の中から疾患関連抗原と相関を有する特定の標的タンパク質を探索することができる。
しかしながら、複数の疾患が存在するところ、当該複数の疾患のそれぞれに対応して、各疾患に関連する各疾患関連抗原と相関を有する特定の標的タンパク質を効率よく探索する点で改善の余地がある。
本発明の目的は、基板上に複数の標的タンパク質が固定されてなるタンパク質マイクロアレイを用いて、複数の疾患のそれぞれに関連する疾患関連抗原と相関を有する標的タンパク質を効率よく探索することが可能な抗原探索方法及び抗原探索システムを提供することである。
本発明の一の局面に係る抗原探索方法は、基板上に第1数の複数の標的タンパク質が固定されてなるタンパク質マイクロアレイを用いて、複数の疾患のそれぞれに関連する疾患関連抗原と相関を有する標的タンパク質を探索する方法である。この抗原探索方法は、複数の被検体に由来する複数の被検体試料のそれぞれを前記第1数の標的タンパク質に接触させたときの所定の特徴量に関する、前記第1数の標的タンパク質のそれぞれについての測定データを取得するデータ取得工程と、前記測定データに基づいて、前記複数の被検体試料中の自己抗体と前記第1数の標的タンパク質との抗原抗体反応に伴う結合性に関する、前記第1数の標的タンパク質のそれぞれについての抗体データを、前記複数の被検体のそれぞれに対する複数の疾患に関する診断結果を示す診断データと対応付けて算出するデータ算出工程と、前記診断データと対応付けられた前記第1数の標的タンパク質のそれぞれについての前記抗体データを入力データとする機械学習モデルを生成し、前記機械学習モデルに従って、前記診断データで示される複数の疾患のそれぞれに対応して、前記第1数の標的タンパク質の中から前記抗体データに基づき前記疾患関連抗原と相関を有する特定の標的タンパク質を選定し、当該選定した前記特定の標的タンパク質を出力データとして出力する抗原選定工程と、を含む。
この抗原探索方法によれば、タンパク質マイクロアレイの基板上に固定された第1数の標的タンパク質と複数の被検体試料中の自己抗体との抗原抗体反応に伴う結合性に関する抗体データを入力データとして機械学習モデルに入力することにより、診断データで示される複数の疾患のそれぞれに対応して、第1数の標的タンパク質の中から抗体データに基づき選定された疾患関連抗原と相関を有する特定の標的タンパク質を出力データとして出力することができる。これにより、複数の疾患のそれぞれに対応して個別に標的タンパク質を探索する場合と比較して、複数の疾患のそれぞれに関連する各疾患関連抗原と相関を有する特定の標的タンパク質を効率よく探索することが可能である。
上記の抗原探索方法において、前記抗体データは、疾患を有しないとの診断結果を示す前記診断データと対応付けられた第1抗体データのデータ群と、疾患を有するとの診断結果を示す前記診断データと対応付けられた第2抗体データのデータ群と、を含んでもよい。この場合、前記抗原選定工程では、前記第1抗体データが第1閾値以下であり且つ前記第2抗体データが前記第1閾値よりも大きい第2閾値以上である条件を満たすとともに、前記第1数よりも少ない第2数の複数の標的タンパク質を前記第1数の標的タンパク質の中から抽出し、前記第2数の標的タンパク質の中から前記特定の標的タンパク質を選定する。
この態様では、診断データで示される複数の疾患のそれぞれについて、機械学習モデルに従って疾患関連抗原と相関を有する特定の標的タンパク質を選定する際に、タンパク質マイクロアレイの基板上に固定された第1数の標的タンパク質よりも少ない第2数の標的タンパク質の中から特定の標的タンパク質を選定する。これにより、機械学習モデルを用いて特定の標的タンパク質を選定するのに要する時間の短縮化を図ることができるとともに、複数の疾患のそれぞれに対応して特定の標的タンパク質をより的確に探索することが可能である。
上記の抗原探索方法において、前記抗原選定工程では、前記第2数の標的タンパク質のそれぞれについての前記抗体データの間の類似度を求め、前記類似度に基づく階層的クラスタリングによって前記第2数の標的タンパク質を、前記診断データで示される複数の疾患のそれぞれに対応して複数のグループに分類することにより、前記複数のグループにそれぞれ属する標的タンパク質を前記特定の標的タンパク質として選定してもよい。
この態様では、第2数の標的タンパク質のそれぞれについての抗体データの間の類似度に基づいて、階層的クラスタリングによって第2数の標的タンパク質を複数のグループに分類する。そして、複数のグループにそれぞれ属する標的タンパク質を、複数の疾患のそれぞれに関連する各疾患関連抗原と相関を有する特定の標的タンパク質として選定することができる。
階層的クラスタリングでは、第2数の標的タンパク質のそれぞれについての抗体データが1個ずつのクラスタに割り当てられるところから開始され、抗体データの類似したクラスタが再帰的に結合される。階層的クラスタリングには、結合するクラスタを選択する基準によって、最短距離法、最長距離法、群平均法などの手法がある。クラスタ間の類似度は、クラスタを跨る抗体データの間の類似度で定義される。クラスタ間の類似度が大きい組から順次結合して1個のクラスタとしていき、全てのクラスタ間の類似度が予め定めた類似度基準値を下回ったときに結合を停止する。階層的クラスタリングでは、クラスタの結合が停止されたときに、第2数の標的タンパク質が複数の疾患のそれぞれに対応した複数のグループに分類される。この際、各グループに属する標的タンパク質の数について最大制限数を設定しておき、結合する2個のクラスタに含まれる抗体データの数の合計が前記最大制限数より大きい場合は類似度をゼロとみなすことにより、各グループに属する標的タンパク質の数が前記最大制限数を超えないようにすることが可能である。
上記の抗原探索方法において、前記抗原選定工程では、前記複数のグループにそれぞれ属する各標的タンパク質の各前記抗体データに対応した前記診断データで示される各疾患が同一となることを目標として、遺伝的アルゴリズムを用いて前記機械学習モデルを生成してもよい。
この態様では、診断データと対応付けられた第2数の標的タンパク質のそれぞれについての抗体データを入力データとし、階層的クラスタリングによって分類された各グループに属する特定の標的タンパク質を出力データとする機械学習モデルを、遺伝的アルゴリズムを用いて生成する。遺伝的アルゴリズムを用いることによって、階層的クラスタリングによって分類された各グループに属する各標的タンパク質の各抗体データに対応した診断データで示される各疾患が同一となることを目標として、機械学習モデルを生成することができる。
遺伝的アルゴリズムでは、例えば、階層的クラスタリングによって分類された各グループに属する各標的タンパク質に対応した各疾患の同一性について評価し、各疾患が同一の場合は第1の報酬を与え、各疾患が同一ではない場合には第1の報酬よりも低い第2の報酬を与える。このような遺伝的アルゴリズムを繰り返し行うことによって、階層的クラスタリングによって分類された各グループに属する各標的タンパク質に対応した各疾患が同一となるような機械学習モデルを生成することができる。これにより、遺伝的アルゴリズムを用いて生成される機械学習モデルに対し、第2数の標的タンパク質のそれぞれについての抗体データが入力データとして入力されると、階層的クラスタリングによって第2数の標的タンパク質を、診断データで示される複数の疾患のそれぞれに対応して複数のグループに分類することができる。
上記の抗原探索方法において、前記データ算出工程では、前記診断データで示される複数の疾患のそれぞれに対応した前記測定データの間の測定誤差を吸収するための所定の標準化処理を行うことにより、標準化された前記抗体データを前記第1数の標的タンパク質のそれぞれについて算出してもよい。
タンパク質マイクロアレイを用いた場合の測定データは、再現性が低いことがある。このため、複数の疾患のそれぞれに対応して複数のタンパク質マイクロアレイを用いて各疾患に関連する疾患関連抗原と相関を有する特定の標的タンパク質を探索する場合、複数の疾患のそれぞれに対応した測定データの間の測定誤差を考慮する必要がある。そこで、機械学習モデルに対して入力データとして入力される抗体データについて、複数の疾患のそれぞれに対応した測定データの間の測定誤差を吸収するための所定の標準化処理を行うことにより、標準化された抗体データを第1数の標的タンパク質のそれぞれについて算出する。この場合、標準化された抗体データを入力データとして機械学習モデルに入力することにより、診断データで示される複数の疾患のそれぞれに対応して、的確な特定の標的タンパク質を出力データとして出力することができる。
上記の抗原探索方法において、前記データ算出工程では、前記診断データで示される複数の疾患ごとの前記抗体データについて、少なくとも一のパーセンタイルにある値を用いて前記標準化処理を行うことにより、標準化された前記抗体データを前記第1数の標的タンパク質のそれぞれについて算出してもよい。
この態様では、診断データで示される複数の疾患ごとの抗体データについて、少なくとも一のパーセンタイルにある値を用いて標準化処理を行う。このパーセンタイル基準の標準化処理によって、複数の疾患のそれぞれに対応した測定データの間の測定誤差を適切に吸収した、標準化された抗体データを算出することができる。
上記の抗原探索方法において、前記測定データは、前記第1数の標的タンパク質の何れに対しても結合する所定のリファレンス抗体に結合可能であって、第1蛍光物質で標識された第1二次抗体において、前記第1蛍光物質から放出された蛍光の強度を前記特徴量とする第1蛍光強度値と、前記複数の被検体試料中の自己抗体に結合可能であって、第2蛍光物質で標識された第2二次抗体において、前記第2蛍光物質から放出された蛍光の強度を前記特徴量とする第2蛍光強度値と、を含んでもよい。この場合、前記データ算出工程では、前記第1蛍光強度値及び前記第2蛍光強度値を用いて前記標準化処理を行うことにより、標準化された前記抗体データを前記第1数の標的タンパク質のそれぞれについて算出する。
タンパク質マイクロアレイにおいては、基板上に固定された第1数の標的タンパク質の量にばらつきが生じていることがある。このため、複数の疾患のそれぞれに対応してタンパク質マイクロアレイを用いて各疾患に関連する疾患関連抗原と相関を有する特定の標的タンパク質を探索する場合、複数の疾患のそれぞれに対応した測定データについて、基板上における標的タンパク質の固定量の相違に起因した測定誤差を考慮する必要がある。
そこで、タンパク質マイクロアレイの基板上に固定された第1数の標的タンパク質のそれぞれについての測定データとして、第1数の全ての標的タンパク質に結合した所定のリファレンス抗体に結合された第1二次抗体の第1蛍光物質から放出された蛍光の強度に関する第1蛍光強度値と、被検体試料中の自己抗体に結合された第2二次抗体の第2蛍光物質から放出された蛍光の強度に関する第2蛍光強度値と、を取得する。そして、機械学習モデルに対して入力データとして入力される抗体データについて、第1蛍光強度値及び第2蛍光強度値を用いて標準化処理を行うことにより、標準化された抗体データを第1数の標的タンパク質のそれぞれについて算出する。これにより、複数の疾患のそれぞれに対応した測定データについて、基板上における標的タンパク質の固定量の相違に起因した測定誤差を適切に吸収した、標準化された抗体データを算出することができる。この場合、標準化された抗体データを入力データとして機械学習モデルに入力することにより、診断データで示される複数の疾患のそれぞれに対応して、的確な特定の標的タンパク質を出力データとして出力することができる。
本発明の他の局面に係る抗原探索システムは、基板上に第1数の複数の標的タンパク質が固定されてなるタンパク質マイクロアレイを用いて、複数の被検体に由来する複数の被検体試料のそれぞれを前記第1数の標的タンパク質に接触させたときの所定の特徴量を測定し、その測定結果を示す前記第1数の標的タンパク質のそれぞれについての測定データを出力する測定装置と、複数の疾患のそれぞれに関連する疾患関連抗原と相関を有する標的タンパク質を探索する抗原探索装置と、を備える。前記抗原探索装置は、前記測定データを取得するデータ取得部と、前記測定データに基づいて、前記複数の被検体試料中の自己抗体と前記第1数の標的タンパク質との抗原抗体反応に伴う結合性に関する、前記第1数の標的タンパク質のそれぞれについての抗体データを、前記複数の被検体のそれぞれに対する複数の疾患に関する診断結果を示す診断データと対応付けて算出するデータ算出部と、前記診断データと対応付けられた前記第1数の標的タンパク質のそれぞれについての前記抗体データを入力データとする機械学習モデルを生成し、前記機械学習モデルに従って、前記診断データで示される複数の疾患のそれぞれに対応して、前記第1数の標的タンパク質の中から前記抗体データに基づき前記疾患関連抗原と相関を有する特定の標的タンパク質を選定し、当該選定した前記特定の標的タンパク質を出力データとして出力する抗原選定部と、を含む。
この抗原探索システムによれば、抗原探索装置の抗原選定部は、タンパク質マイクロアレイの基板上に固定された第1数の標的タンパク質と複数の被検体試料中の自己抗体との抗原抗体反応に伴う結合性に関する抗体データを入力データとして機械学習モデルに入力することにより、診断データで示される複数の疾患のそれぞれに対応して、第1数の標的タンパク質の中から抗体データに基づき選定された疾患関連抗原と相関を有する特定の標的タンパク質を出力データとして出力することができる。これにより、複数の疾患のそれぞれに対応して個別に標的タンパク質を探索する場合と比較して、複数の疾患のそれぞれに関連する各疾患関連抗原と相関を有する特定の標的タンパク質を効率よく探索することが可能である。
以上説明したように、本発明によれば、基板上に複数の標的タンパク質が固定されてなるタンパク質マイクロアレイを用いて、複数の疾患のそれぞれに関連する疾患関連抗原と相関を有する標的タンパク質を効率よく探索することが可能な抗原探索方法及び抗原探索システムを提供することができる。
本発明の実施形態に係る抗原探索システムのブロック図である。 抗原探索システムに備えられる測定装置による測定処理を説明する図である。 測定装置による測定結果を示す測定データの一例を示す図である。 抗原探索システムに備えられる抗原探索装置によって実行される抗原探索方法のフローチャートである。 抗原探索装置のデータ算出部により算出される抗体データの一例を示す図である。
以下、本発明の実施形態に係る抗原探索システム、及び、抗原探索システムの抗原探索装置によって実行される抗原探索方法について、図面に基づいて説明する。
[抗原探索システムの全体構成]
図1に示されるように、抗原探索システム1は、測定装置2と抗原探索装置3とを備えるシステムである。抗原探索システム1では、測定装置2において図2に示されるタンパク質マイクロアレイ4を用いて複数の被検体の疾患に関する測定データD1が取得され、抗原探索装置3において複数の疾患のそれぞれに関連する疾患関連抗原と相関を有するタンパク質が探索される。
被検体は、主として、ヒト、及びその他の哺乳動物を意味する。その他の哺乳動物としては、例えば、サル、チンパンジー等の霊長類の動物、ウシ、ウマ、ブタ、ヒツジ等の家畜動物、イヌ、ネコ等のペット用動物、マウス、ラット、ウサギ等の実験動物などが挙げられる。これらのうち、被検体は、ヒトであることが好ましい。
疾患としては、注意欠陥多動性障害、レビー小体型認知症、軽度認知障害、大うつ病障害、パーキンソン病等の神経・筋疾患、脳腫瘍、胃がん、大腸がん、肝がん、肺がん等の悪性腫瘍、潰瘍性大腸炎等の消化器系疾患、特発性間質性肺炎等の呼吸器系疾患、特発性拡張型心筋症等の循環器系疾患、特発性血小板減少性紫斑病等の血液系疾患、新型コロナウイルス感染症等の感染症の後遺症などが挙げられる。これらのうち、神経・筋疾患としての複数の疾患を対象とすることが好ましい。
[測定装置について]
測定装置2は、図2に示されるタンパク質マイクロアレイ4を用いて、基準試料SPRと、複数の被検体に由来する複数の被検体試料SPSとに関する測定データD1を取得する装置である。
タンパク質マイクロアレイ4は、スライドガラス等の基板41上に複数のスポット42がマトリクス状に配列されたものである。タンパク質マイクロアレイ4では、基板41上のスポット42において、数千~数万の第1数の複数の標的タンパク質TPが固定されている。すなわち、タンパク質マイクロアレイ4は、基板41上のスポット42に数千~数万の第1数の標的タンパク質TPが固定されたものである。標的タンパク質TPは、コムギ胚芽抽出液等の無細胞発現系で発現された組換えタンパク質などの抗原タンパク質である。標的タンパク質TPとしては、例えば、A1BG(1alpha-1-B glycoprotein)、A1CF(APOBEC1 complementation factor)、A2M(2alpha-2-macroglobulin)等の標準型タンパク質、p53遺伝子に由来する変異体タンパク質、ALK融合遺伝子に由来する融合タンパク質などが挙げられる。
被検体に由来する被検体試料SPSとしては、例えば、全血、血清、血漿、尿、前立腺液、涙、粘液腹水、口腔液、唾液、精液、精漿、粘液、大便、痰、脳脊髄液、骨髄、リンパ液などが挙げられ、これらを希釈液等で調製してもよい。被検体試料SPSは、疾患を有しない被検体に由来する試料と、疾患を有する被検体に由来する試料とを含む。疾患を有する被検体に由来する被検体試料SPSは、疾患に関連する疾患関連抗原AG(後記の図4)に対して産生される自己抗体ABAを含んでいる。一方、疾患を有しない被検体に由来する被検体試料SPSは、自己抗体ABAを含んではいない。
疾患関連抗原AGは、被検体の体内において疾患で自己抗体ABAが産生されるタンパク質である。自己抗体ABAは、疾患関連抗原AGに対する抗体を意味する。自己抗体ABAとしては、グロブリンタイプ(クラス)がIgG型、IgM型、IgA型、IgD型、IgE型の抗体が挙げられる。自己抗体ABAは、タンパク質マイクロアレイ4の基板41上のスポット42に固定された第1数の標的タンパク質TPのうちの、疾患に関連する疾患関連抗原AGと相関を有する標的タンパク質TPとの抗原抗体反応によって、当該標的タンパク質TPと結合する。一方、第1数の標的タンパク質TPのうちの、疾患に関連する疾患関連抗原AGと相関を有しない標的タンパク質TPに対しては、自己抗体ABAは、結合しないか、或いは、結合したとしてもその結合力は弱い。すなわち、自己抗体ABAは、自己抗体ABAに対応した疾患に関連する疾患関連抗原AGと相関を有する標的タンパク質TPに対しては高い結合性を示す一方、疾患関連抗原AGと相関を有しない標的タンパク質TPに対する結合性は低い。
基準試料SPRは、タンパク質マイクロアレイ4の基板41上のスポット42に固定された第1数の標的タンパク質TPの何れに対しても抗原抗体反応によって結合可能なリファレンス抗体ABRを含む試料である。リファレンス抗体ABRとしては、例えば、Goatリファレンス抗体などが挙げられる。
測定装置2は、タンパク質マイクロアレイ4の基板41上のスポット42に固定された第1数の標的タンパク質TPに対して複数の被検体に由来する複数の被検体試料SPSのそれぞれを接触させたときの所定の特徴量を測定する。測定装置2は、第1数の標的タンパク質TPと被検体試料SPS中の自己抗体ABAとの抗原抗体反応に伴う結合性に関する指標となる特徴量の測定が可能であれば、その測定手法は特に限定されない。測定装置2の測定手法は、特徴量の測定のために自己抗体ABAに結合させる標識物質に応じて区別される。測定装置2の測定手法としては、標識物質として蛍光物質を用いる手法、標識物質として酵素を用いる手法、標識物質としてRI(放射性同位元素)を用いる手法などが挙げられる。
本実施形態では、測定装置2は、標識物質として蛍光物質を用いて特徴量として蛍光強度を測定する。具体的には、測定装置2は、基準試料SPR中のリファレンス抗体ABRに結合可能であって第1蛍光物質で標識された第1二次抗体AB1において、所定の励起光の照射に応じて第1蛍光物質から放出された蛍光の蛍光強度を測定する。また、測定装置2は、被検体試料SPS中の自己抗体ABAに結合可能であって第2蛍光物質で標識された第2二次抗体AB2において、所定の励起光の照射に応じて第2蛍光物質から放出された蛍光の蛍光強度を測定する。第1二次抗体AB1は、例えば、緑色の蛍光を放出する第1蛍光物質で標識された抗GoatIgG抗体などである。第2二次抗体AB2は、例えば、赤色の蛍光を放出する第2蛍光物質で標識された、抗ヒトIgG抗体、抗ヒトIgM抗体、抗ヒトIgA抗体、抗ヒトIgD抗体、抗ヒトIgE抗体などである。
図2に示されるように、タンパク質マイクロアレイ4の基板41上のスポット42に固定された第1数の標的タンパク質TPに対して基準試料SPRのみを接触させた場合を想定する。この場合、基準試料SPR中のリファレンス抗体ABRが、抗原抗体反応(一次反応)によって、第1数の全ての標的タンパク質TPに結合する。第1数の全ての標的タンパク質TPに対してリファレンス抗体ABRが結合した状態で第1二次抗体AB1及び第2二次抗体AB2を接触させると、二次反応下において、第1二次抗体AB1がリファレンス抗体ABRに結合し、第2二次抗体AB2は結合対象が存在しないのでそのまま浮遊して除去される。この場合、第1数の標的タンパク質TPのそれぞれに対して、リファレンス抗体ABRを介して第1蛍光物質で標識された第1二次抗体AB1が結合される一方、第2二次抗体AB2は結合されていない。
第1数の標的タンパク質TPに対して基準試料SPRのみを接触させた場合、測定装置2は、測定結果を示すデータとして、第1数の標的タンパク質TPのそれぞれについてのネガティブコントロール(NC)の測定データD1を出力する。NCの測定データD1は、リファレンス抗体ABRに結合可能な第1二次抗体AB1の第1蛍光物質から放出された蛍光の強度を示す第1蛍光強度値D11と、被検体試料SPS中の自己抗体ABAに結合可能な第2二次抗体AB2の第2蛍光物質から放出された蛍光の強度を示す第2蛍光強度値D12と、を含む。第1数の標的タンパク質TPに対して基準試料SPRのみを接触させた場合には、上記の通り、第1数の標的タンパク質TPのそれぞれに対して、リファレンス抗体ABRを介して第1蛍光物質で標識された第1二次抗体AB1が結合される一方、第2二次抗体AB2は結合されていない。このため、NCの測定データD1においては、理想的には、第1数の標的タンパク質TPのそれぞれについて、第1蛍光強度値D11は所定の第1基準強度値以上の値を示し、第2蛍光強度値D12は所定の第2基準強度値未満のゼロに近い値を示す。
タンパク質マイクロアレイ4の基板41上のスポット42に固定された第1数の標的タンパク質TPに対して基準試料SPR及び被検体試料SPSを接触させた場合を想定する。この場合、基準試料SPR中のリファレンス抗体ABRは、抗原抗体反応(一次反応)によって、第1数の全ての標的タンパク質TPに結合する。一方、被検体試料SPS中の自己抗体ABAは、第1数の標的タンパク質TPのうち、自己抗体ABAに対応した疾患に関連する疾患関連抗原AGと相関を有する標的タンパク質TPに対しては抗原抗体反応(一次反応)によって結合する一方、疾患関連抗原AGと相関を有しない標的タンパク質TPに対しては結合しない。第1数の全ての標的タンパク質TPに対してリファレンス抗体ABRが結合し、疾患関連抗原AGと相関を有する標的タンパク質TPに対して自己抗体ABAが結合した状態で第1二次抗体AB1及び第2二次抗体AB2を接触させると、二次反応下において、第1二次抗体AB1がリファレンス抗体ABRに結合するとともに、第2二次抗体AB2が自己抗体ABAに結合する。この場合、第1数の標的タンパク質TPのそれぞれに対してリファレンス抗体ABRを介して第1蛍光物質で標識された第1二次抗体AB1が結合され、疾患関連抗原AGと相関を有する標的タンパク質TPに対しては自己抗体ABAを介して第2蛍光物質で標識された第2二次抗体AB2が結合される。
第1数の標的タンパク質TPに対して基準試料SPR及び被検体試料SPSを接触させた場合、測定装置2は、測定結果を示すデータとして、第1数の標的タンパク質TPのそれぞれについての被検体試料SPSに関する測定データD1を、被検体に対する疾患に関する診断結果を示す診断データD2(図1)と対応付けて出力する。被検体試料SPSに関する測定データD1は、リファレンス抗体ABRに結合可能な第1二次抗体AB1の第1蛍光物質から放出された蛍光の強度を示す第1蛍光強度値D11と、被検体試料SPS中の自己抗体ABAに結合可能な第2二次抗体AB2の第2蛍光物質から放出された蛍光の強度を示す第2蛍光強度値D12と、を含む。第1数の標的タンパク質TPに対して基準試料SPR及び被検体試料SPSを接触させた場合には、上記の通り、第1数の標的タンパク質TPのそれぞれに対してリファレンス抗体ABRを介して第1蛍光物質で標識された第1二次抗体AB1が結合され、疾患関連抗原AGと相関を有する標的タンパク質TPに対しては自己抗体ABAを介して第2蛍光物質で標識された第2二次抗体AB2が結合される。このため、被検体試料SPSに関する測定データD1においては、理想的には、第1数の標的タンパク質TPにおいて、疾患関連抗原AGと相関を有する標的タンパク質TPについては第1蛍光強度値D11が前記第1基準強度値以上の値を示すとともに第2蛍光強度値D12が前記第2基準強度値以上の値を示し、疾患関連抗原AGと相関を有しない標的タンパク質TPについては第1蛍光強度値D11が前記第1基準強度値以上の値を示すとともに第2蛍光強度値D12が前記第2基準強度値未満のゼロに近い値を示す。
なお、疾患を有しない被検体に由来する被検体試料SPSには、疾患関連抗原AGに対して産生される自己抗体ABAが含まれていない。このため、疾患を有しない被検体に由来する被検体試料SPSに関する測定データD1においては、理想的には、第1数の標的タンパク質TPのそれぞれについて、第1蛍光強度値D11は前記第1基準強度値以上の値を示し、第2蛍光強度値D12は前記第2基準強度値未満のゼロに近い値を示す。
図3には、測定装置2から出力された測定データD1の一例が示されている。図3の例では、測定データD1は、第1数の標的タンパク質TPのそれぞれについて、NCに関する第1蛍光強度値D11及び第2蛍光強度値D12と、複数の被検体に由来する複数の被検体試料SPSに関して診断データD2と対応付けられた第1蛍光強度値D11及び第2蛍光強度値D12と、を含む。この際、複数の被検体試料SPSに関する測定データD1には、第1蛍光強度値D11及び第2蛍光強度値D12のデータ群として、疾患を有しないとの診断結果を示す第1診断データD21と対応付けられたデータ群と、例えば神経・筋疾患に関する疾患を有するとの診断結果を示す第2~第6診断データD22~D26と対応付けられたデータ群と、が含まれる。例えば、第2診断データD22は、注意欠陥多動性障害を有するとの診断結果を示す診断データである。第3診断データD23は、レビー小体型認知症を有するとの診断結果を示す診断データである。第4診断データD24は、軽度認知障害を有するとの診断結果を示す診断データである。第5診断データD25は、大うつ病障害を有するとの診断結果を示す診断データである。第6診断データD26は、パーキンソン病を有するとの診断結果を示す診断データである。
[抗原探索装置について]
測定装置2から出力された測定データD1は、抗原探索装置3に入力される。抗原探索装置3について、図1に加えて図4及び図5を参照しながら説明する。抗原探索装置3は、CPU(Central Processing Unit)、HDD(Hard Disk Drive)やフラッシュメモリなどの記憶領域、CPUの作業領域として使用されるRAM(Random Access Memory)等を備えたコンピュータである。抗原探索装置3は、測定データD1に基づいて、タンパク質マイクロアレイ4の基板41上に固定された第1数の標的タンパク質TPの中から、複数の疾患(例えば神経・筋疾患に関する疾患)のそれぞれに関連する各疾患関連抗原AGと相関を有する標的タンパク質TPを探索する。抗原探索装置3は、ニューラルネットワーク(Neural Network)を用いた機械学習によって、複数の疾患のそれぞれに関連する各疾患関連抗原AGと相関を有する標的タンパク質TPを探索する抗原探索方法を実行する。ニューラルネットワークは、人間の脳の構造を模した構成となっており、人間の脳におけるニューロン(神経細胞)の機能を模した論理回路を多層に積層して構成される。
抗原探索装置3は、機能的構成として、抗原探索方法におけるデータ取得工程S1を行うデータ取得部31と、抗原探索方法におけるデータ算出工程S2を行うデータ算出部32と、抗原探索方法における抗原選定工程S3を行う抗原選定部33と、を備える。
データ取得部31は、測定装置2から出力された測定データD1を取得することにより、データ取得工程S1を行う。本実施形態では、上記の通り、測定データD1は、タンパク質マイクロアレイ4の基板41上に固定された第1数の標的タンパク質TPのそれぞれについて、NCに関する第1蛍光強度値D11及び第2蛍光強度値D12と、複数の被検体に由来する複数の被検体試料SPSに関して診断データD2と対応付けられた第1蛍光強度値D11及び第2蛍光強度値D12と、を含む。データ取得部31は、測定データD1を取得し(ステップS11)、その取得した測定データD1をデータ算出部32に向けて出力する(ステップS12)。
データ算出部32は、測定データD1に基づいて、複数の被検体試料SPS中の自己抗体ABAと第1数の標的タンパク質TPとの抗原抗体反応に伴う結合性に関する、第1数の標的タンパク質TPのそれぞれについての抗体データD3を、複数の被検体のそれぞれに対する診断データD2と対応付けて算出することにより、データ算出工程S2を行う。データ算出部32は、測定データD1に基づいて診断データD2と対応付けて抗体データD3を算出し(ステップS21)、その算出した抗体データD3を抗原選定部33に向けて出力する(ステップS22)。
第1数の標的タンパク質TPのそれぞれについての抗体データD3は、各標的タンパク質TPに対する自己抗体ABAの結合性の違いに応じて異なる値を示し、自己抗体ABAの結合性が高くなるに従って大きい値を示す。図5に示されるように、第1数の標的タンパク質TPのそれぞれについての抗体データD3は、疾患を有しないとの診断結果を示す第1診断データD21と対応付けられた第1抗体データD31のデータ群と、疾患を有するとの診断結果を示す第2~第6診断データD22~D26と対応付けられた第2抗体データD32のデータ群と、を含む。
第1診断データD21と対応付けられた第1抗体データD31は、測定データD1において第1診断データD21と対応付けられた第1蛍光強度値D11及び第2蛍光強度値D12に基づいて算出される。第1抗体データD31は、第1数の標的タンパク質TPごとに、第2~第6診断データD22~D26と対応付けられた第2抗体データD32よりも小さい値を示す。
第2~第6診断データD22~D26と対応付けられた第2抗体データD32は、測定データD1において第2~第6診断データD22~D26と対応付けられた第1蛍光強度値D11及び第2蛍光強度値D12に基づいて算出される。第2~第6診断データD22~D26と対応付けられた第2抗体データD32では、第1数の標的タンパク質TPにおいて、第2~第6診断データD22~D26で示される各疾患に関連する各疾患関連抗原AGと相関を有する標的タンパク質TPに対する値が、その他の標的タンパク質TPに対する値よりも大きくなる。
なお、第1診断データD21と対応付けられた第1抗体データD31のデータ群の数は、第1診断データD21で示される診断結果の被検体に由来する被検体試料SPSの数と一致している。また、第2~第6診断データD22~D26とそれぞれ対応付けられた第2抗体データD32の各データ群の数は、第2~第6診断データD22~D26で示される診断結果の各被検体に由来する各被検体試料SPSの数と一致している。例えば、第1~第6診断データD21~D26で示される診断結果の被検体に由来する被検体試料SPSの数がそれぞれ10個ずつであった場合を想定する。この場合、第1診断データD21と対応付けられた第1抗体データD31のデータ群の数、第2診断データD22と対応付けられた第2抗体データD32のデータ群の数、第3診断データD23と対応付けられた第2抗体データD32のデータ群の数、第4診断データD24と対応付けられた第2抗体データD32のデータ群の数、第5診断データD25と対応付けられた第2抗体データD32のデータ群の数、第6診断データD26と対応付けられた第2抗体データD32のデータ群の数は、それぞれ「10」である。
抗原選定部33は、診断データD2で示される複数の疾患のそれぞれに対応して、第1数の標的タンパク質TPの中から抗体データD3に基づき疾患関連抗原AGと相関を有する特定の標的タンパク質TPSを選定することにより、抗原選定工程S3を行う。具体的には、抗原選定部33は、診断データD2と対応付けられた第1数の標的タンパク質TPのそれぞれについての抗体データD3を入力データとし、診断データD2で示される複数の疾患のそれぞれに対応して第1数の標的タンパク質TPの中から抗体データD3に基づき疾患関連抗原AGと相関を有する特定の標的タンパク質TPSを選定し、当該選定した特定の標的タンパク質TPSを出力データとして出力する機械学習モデルLMを生成する(ステップS31)。抗原選定部33は、入力データが入力されると、機械学習モデルLMに従って、抗体データD3に基づき診断データD2と第1数の標的タンパク質TPとの関係性を解析し、診断データD2で示される複数の疾患のそれぞれに対応して第1数の標的タンパク質TPの中から特定の標的タンパク質TPSを選定する(ステップS33)。そして、抗原選定部33は、診断データD2で示される複数の疾患のそれぞれに対応して選定した特定の標的タンパク質TPSを、各疾患に関連する各疾患関連抗原AGと相関を有する標的タンパク質TPとして出力する(ステップS34)。
抗原探索装置3では、タンパク質マイクロアレイ4の基板41上に固定された第1数の標的タンパク質TPと複数の被検体試料SPS中の自己抗体ABAとの抗原抗体反応に伴う結合性に関する抗体データD3を入力データとして機械学習モデルLMに入力することにより、診断データD2で示される複数の疾患のそれぞれに対応して、第1数の標的タンパク質TPの中から抗体データD3に基づき選定された疾患関連抗原AGと相関を有する特定の標的タンパク質TPSを出力データとして出力することができる。これにより、複数の疾患のそれぞれに対応して個別に標的タンパク質TPを探索する場合と比較して、複数の疾患のそれぞれに関連する各疾患関連抗原AGと相関を有する特定の標的タンパク質TPSを効率よく探索することが可能である。
既述の通り、データ算出部32により算出される第1数の標的タンパク質TPのそれぞれについての抗体データD3は、疾患を有しないとの診断結果を示す第1診断データD21と対応付けられた第1抗体データD31のデータ群と、疾患を有するとの診断結果を示す第2~第6診断データD22~D26と対応付けられた第2抗体データD32のデータ群と、を含む。この場合、図4に示されるように、抗原選定部33は、特定の標的タンパク質TPSを選定するステップS33の処理の前に、第1数の標的タンパク質TPの中から、第1数よりも少ない第2数の複数の標的タンパク質TPを抽出するステップS32の処理を行ってもよい。抗原選定部33は、第1抗体データD31が第1閾値以下であり且つ第2抗体データD32が第1閾値よりも大きい第2閾値以上である条件を満たす第2数の標的タンパク質TPを、第1数の標的タンパク質TPの中から抽出する。なお、第1診断データD21と対応付けられた第1抗体データD31のデータ群が複数存在し、第2~第6診断データD22~D26とそれぞれ対応付けられた第2抗体データD32の各データ群が複数存在する場合、抗原選定部33は、第1閾値以上の第1抗体データD31の数が第1判定数以下であり、且つ、第2閾値以上の第2抗体データD32の数が第2判定数以上である条件を満たす第2数の標的タンパク質TPを、第1数の標的タンパク質TPの中から抽出するようにしてもよい。
ステップS32において第1数の標的タンパク質TPの中から第2数の標的タンパク質TPを抽出した場合、抗原選定部33は、機械学習モデルLMに従って、抗体データD3に基づき診断データD2と第2数の標的タンパク質TPとの関係性を解析し、診断データD2で示される複数の疾患のそれぞれに対応して第2数の標的タンパク質TPの中から特定の標的タンパク質TPSを選定する(ステップS33)。この場合、診断データD2で示される複数の疾患のそれぞれについて、機械学習モデルLMに従って疾患関連抗原AGと相関を有する特定の標的タンパク質TPSを選定する際に、タンパク質マイクロアレイ4の基板41上に固定された第1数の標的タンパク質TPよりも少ない第2数の標的タンパク質TPの中から特定の標的タンパク質TPSを選定する。これにより、機械学習モデルLMを用いて特定の標的タンパク質TPSを選定するのに要する時間の短縮化を図ることができるとともに、複数の疾患のそれぞれに対応して特定の標的タンパク質TPSをより的確に探索することが可能である。
また、ステップS33において第2数の標的タンパク質TPの中から特定の標的タンパク質TPSを選定する場合、抗原選定部33は、第2数の標的タンパク質TPのそれぞれについての抗体データD3の間の類似度を求め、当該類似度に基づく階層的クラスタリングHCによって第2数の標的タンパク質TPを、診断データD2で示される複数の疾患のそれぞれに対応して複数のグループに分類してもよい。そして、抗原選定部33は、複数のグループにそれぞれ属する標的タンパク質TPを特定の標的タンパク質TPSとして選定する。この場合、抗原選定部33は、第2数の標的タンパク質TPのそれぞれについての抗体データD3の間の類似度に基づいて、階層的クラスタリングHCによって第2数の標的タンパク質TPを複数のグループに分類する。そして、抗原選定部33は、複数のグループにそれぞれ属する標的タンパク質TPを、複数の疾患のそれぞれに関連する各疾患関連抗原AGと相関を有する特定の標的タンパク質TPSとして選定することができる。
抗原選定部33は、階層的クラスタリングHCにおいて、第2数の標的タンパク質TPのそれぞれについての抗体データD3を1個ずつのクラスタに割り当てるところから開始し、抗体データD3の類似したクラスタを再帰的に結合する。階層的クラスタリングHCには、結合するクラスタを選択する基準によって、最短距離法、最長距離法、群平均法などの手法がある。クラスタ間の類似度は、クラスタを跨る抗体データD3の間の類似度で定義される。
抗原選定部33は、クラスタ間の類似度が大きい組から順次結合して1個のクラスタとしていき、全てのクラスタ間の類似度が予め定めた類似度基準値を下回ったときに結合を停止する。抗原選定部33による階層的クラスタリングHCでは、クラスタの結合が停止されたときに、第2数の標的タンパク質TPが複数の疾患のそれぞれに対応した複数のグループに分類される。この際、抗原選定部33は、各グループに属する標的タンパク質TPの数について最大制限数を設定しておき、結合する2個のクラスタに含まれる抗体データD3の数の合計が前記最大制限数より大きい場合は類似度をゼロとみなすことにより、各グループに属する標的タンパク質TPの数が前記最大制限数を超えないようにすることが可能である。
また、抗原選定部33は、ステップS31において機械学習モデルLMを生成する際に、遺伝的アルゴリズムGAを用いてもよい(ステップS35)。この場合、抗原選定部33は、複数のグループにそれぞれ属する各標的タンパク質TPの各抗体データD3に対応した診断データD2で示される各疾患が同一となることを目標として、遺伝的アルゴリズムGAを用いて機械学習モデルLMを生成する。抗原選定部33は、診断データD2と対応付けられた第2数の標的タンパク質TPのそれぞれについての抗体データD3を入力データとし、階層的クラスタリングHCによって分類された各グループに属する特定の標的タンパク質TPSを出力データとする機械学習モデルLMを、遺伝的アルゴリズムGAを用いて生成する。抗原選定部33は、遺伝的アルゴリズムGAを用いることによって、階層的クラスタリングHCによって分類された各グループに属する各標的タンパク質TPの各抗体データD3に対応した診断データD2で示される各疾患が同一となることを目標として、機械学習モデルLMを生成することができる。
遺伝的アルゴリズムGAにおいて、抗原選定部33は、例えば、階層的クラスタリングHCによって分類された各グループに属する各標的タンパク質TPに対応した各疾患の同一性について評価し、各疾患が同一の場合は第1の報酬を与え、各疾患が同一ではない場合には第1の報酬よりも低い第2の報酬を与える。抗原選定部33は、このような遺伝的アルゴリズムGAを繰り返し行うことによって、階層的クラスタリングHCによって分類された各グループに属する各標的タンパク質TPに対応した各疾患が同一となるような機械学習モデルLMを生成することができる。これにより、遺伝的アルゴリズムGAを用いて生成される機械学習モデルLMに対し、第2数の標的タンパク質TPのそれぞれについての抗体データD3が入力データとして入力されると、階層的クラスタリングHCによって第2数の標的タンパク質TPを、診断データD2で示される複数の疾患のそれぞれに対応して複数のグループに分類することができる。
タンパク質マイクロアレイ4を用いた場合の測定データD1は、再現性が低いことがある。このため、抗原探索装置3において複数の疾患のそれぞれに対応して複数のタンパク質マイクロアレイ4を用いて各疾患に関連する疾患関連抗原AGと相関を有する特定の標的タンパク質TPSを探索する場合、複数の疾患のそれぞれに対応した測定データD1の間の測定誤差を考慮する必要がある。
そこで、本実施形態に係る抗原探索装置3において、データ算出部32は、機械学習モデルLMに対して入力データとして入力される抗体データD3について、診断データD2で示される複数の疾患のそれぞれに対応した測定データD1の間の測定誤差を吸収するための所定の標準化処理を行うことにより、標準化された抗体データD3を第1数の標的タンパク質TPのそれぞれについて算出する。具体的には、データ算出部32は、診断データD2で示される複数の疾患ごとの抗体データD3について、少なくとも一のパーセンタイルにある値を用いて標準化処理を行うことにより、標準化された抗体データD3を第1数の標的タンパク質TPのそれぞれについて算出する。データ算出部32は、このパーセンタイル基準の標準化処理によって、複数の疾患のそれぞれに対応した測定データD1の間の測定誤差を適切に吸収した、標準化された抗体データD3を算出することができる。この場合、抗原選定部33は、標準化された抗体データD3を入力データとして機械学習モデルLMに入力することにより、診断データD2で示される複数の疾患のそれぞれに対応して、的確な特定の標的タンパク質TPSを出力データとして出力することができる。
また、タンパク質マイクロアレイ4においては、基板41上に固定された第1数の標的タンパク質TPの量にばらつきが生じていることがある。このため、抗原探索装置3において複数の疾患のそれぞれに対応してタンパク質マイクロアレイ4を用いて各疾患に関連する疾患関連抗原AGと相関を有する特定の標的タンパク質TPを探索する場合、複数の疾患のそれぞれに対応した測定データD1について、基板41上における標的タンパク質TPの固定量の相違に起因した測定誤差を考慮する必要がある。
そこで、本実施形態に係る抗原探索装置3において、データ取得部31は、タンパク質マイクロアレイ4の基板41上に固定された第1数の標的タンパク質TPのそれぞれについての測定データD1として、第1数の全ての標的タンパク質TPに結合した所定のリファレンス抗体ABRに結合された第1二次抗体AB1の第1蛍光物質から放出された蛍光の強度に関する第1蛍光強度値D11と、第1数の標的タンパク質TPのうちの一部の標的タンパク質TPに結合した自己抗体ABAに結合された第2二次抗体AB2の第2蛍光物質から放出された蛍光の強度に関する第2蛍光強度値D12と、を取得する。そして、データ算出部32は、機械学習モデルLMに対して入力データとして入力される抗体データD3について、第1蛍光強度値D11及び第2蛍光強度値D12を用いて標準化処理を行うことにより、標準化された抗体データD3を第1数の標的タンパク質TPのそれぞれについて算出する。これにより、データ算出部32は、複数の疾患のそれぞれに対応した測定データD1について、基板41上における標的タンパク質TPの固定量の相違に起因した測定誤差を適切に吸収した、標準化された抗体データD3を算出することができる。この場合、抗原選定部33は、標準化された抗体データD3を入力データとして機械学習モデルLMに入力することにより、診断データD2で示される複数の疾患のそれぞれに対応して、的確な特定の標的タンパク質TPSを出力データとして出力することができる。
次に、図3に示される測定データD1と図5に示される抗体データD3とを対比しながら、データ算出部32が測定データD1に基づき抗体データD3を算出する際の標準化処理の一例について、より詳細に説明する。データ算出部32は、以下に示す第1~第5の標準化処理ステップに従って、測定データD1に基づき標準化された抗体データD3を算出する。
第1の標準化処理ステップにおいて、データ算出部32は、第1数の標的タンパク質TPごとに、NCの第1蛍光強度値D11と第1~第6診断データD21~D26のそれぞれに対応付けられた第1蛍光強度値D11との各第1蛍光強度値D11を、各第1蛍光強度値D11の平均値で除算する。これにより、データ算出部32は、NCと第1~第6診断データD21~D26のそれぞれとに対応付けて、第1数の標的タンパク質TPのそれぞれについての第1標準化指標値を求める。
第2の標準化処理ステップにおいて、データ算出部32は、第1数の標的タンパク質TPのそれぞれについて、NCの第2蛍光強度値D12と第1~第6診断データD21~D26のそれぞれに対応付けられた第2蛍光強度値D12との各第2蛍光強度値D12を、各第1標準化指標値で除算する。これにより、データ算出部32は、NCと第1~第6診断データD21~D26のそれぞれとに対応付けて、第1数の標的タンパク質TPのそれぞれについての第2標準化指標値を求める。
第3の標準化処理ステップにおいて、データ算出部32は、第1数の標的タンパク質TPのそれぞれについて、第1~第6診断データD21~D26のそれぞれに対応付けられた各第2標準化指標値から、NCに対応付けられた第2標準化指標値を減算する。これにより、データ算出部32は、第1~第6診断データD21~D26のそれぞれに対応付けて、第1数の標的タンパク質TPのそれぞれについての第3標準化指標値を求める。
第4の標準化処理ステップにおいて、データ算出部32は、第1~第6診断データD21~D26ごとに、第1数の標的タンパク質TPのそれぞれについての各第3標準化指標値から25パーセンタイルにある値を減算し、その減算値を標準偏差で除算する。これにより、データ算出部32は、第1~第6診断データD21~D26のそれぞれに対応付けて、第1数の標的タンパク質TPのそれぞれについての第4標準化指標値を求める。
第5の標準化処理ステップにおいて、データ算出部32は、第1~第6診断データD21~D26ごとに、第1数の標的タンパク質TPのそれぞれについての各第4標準化指標値を75パーセンタイルにある値で除算し、その除算値に「10」を乗算する。これにより、データ算出部32は、第1~第6診断データD21~D26のそれぞれに対応付けて、第1数の標的タンパク質TPのそれぞれについての標準化された抗体データD3を求める。
データ算出部32は、上記の第1~第5の標準化処理ステップに従って標準化処理を行うことにより、タンパク質マイクロアレイ4の基板41上における標的タンパク質TPの固定量の相違に起因した測定データD1の測定誤差、第1~第6診断データD21~D26のそれぞれに対応した測定データD1の間の測定誤差を適切に吸収した、標準化された抗体データD3を算出することができる。この場合、抗原選定部33は、標準化された抗体データD3を入力データとして機械学習モデルLMに入力することにより、診断データD2で示される複数の疾患のそれぞれに対応して、的確な特定の標的タンパク質TPSを出力データとして出力することができる。
本実施形態に係る抗原探索装置3において、抗原選定部33は、OMIM、Genecards、AAgAtlas等の既存のデータベースに登録された情報に基づいて、複数の疾患のそれぞれに関連する各種のタンパク質を抽出するように構成されてもよい。この場合、抗原選定部33は、複数の疾患のそれぞれに関連する疾患関連抗原AGと相関を有するタンパク質として、機械学習モデルLMから出力された特定の標的タンパク質TPSに対し、抽出した各種のタンパク質と共通するタンパク質に絞り込むことができる。
1 抗原探索システム
2 測定装置
3 抗原探索装置
31 データ取得部
32 データ算出部
33 抗原選定部
4 タンパク質マイクロアレイ
41 基板
AB1 第1二次抗体
AB2 第2二次抗体
ABA 自己抗体
ABR リファレンス抗体
AG 疾患関連抗原
D1 測定データ
D11 第1蛍光強度値
D12 第2蛍光強度値
D2 診断データ
D3 抗体データ
D31 第1抗体データ
D32 第2抗体データ
GA 遺伝的アルゴリズム
HC 階層的クラスタリング
LM 機械学習モデル
S1 データ取得工程
S2 データ算出工程
S3 抗原選定工程
SPR 基準試料
SPS 被検体試料
TP 標的タンパク質
TPS 特定の標的タンパク質

Claims (8)

  1. 基板上に第1数の複数の標的タンパク質が固定されてなるタンパク質マイクロアレイを用いて、複数の疾患のそれぞれに関連する疾患関連抗原と相関を有する標的タンパク質を探索する抗原探索方法であって、
    複数の被検体に由来する複数の被検体試料のそれぞれを前記第1数の標的タンパク質に接触させたときの所定の特徴量に関する、前記第1数の標的タンパク質のそれぞれについての測定データを取得するデータ取得工程と、
    前記測定データに基づいて、前記複数の被検体試料中の自己抗体と前記第1数の標的タンパク質との抗原抗体反応に伴う結合性に関する、前記第1数の標的タンパク質のそれぞれについての抗体データを、前記複数の被検体のそれぞれに対する複数の疾患に関する診断結果を示す診断データと対応付けて算出するデータ算出工程と、
    前記診断データと対応付けられた前記第1数の標的タンパク質のそれぞれについての前記抗体データを入力データとする機械学習モデルを生成し、前記機械学習モデルに従って、前記診断データで示される複数の疾患のそれぞれに対応して、前記第1数の標的タンパク質の中から前記抗体データに基づき前記疾患関連抗原と相関を有する特定の標的タンパク質を選定し、当該選定した前記特定の標的タンパク質を出力データとして出力する抗原選定工程と、を含む、抗原探索方法。
  2. 前記抗体データは、疾患を有しないとの診断結果を示す前記診断データと対応付けられた第1抗体データのデータ群と、疾患を有するとの診断結果を示す前記診断データと対応付けられた第2抗体データのデータ群と、を含み、
    前記抗原選定工程では、前記第1抗体データが第1閾値以下であり且つ前記第2抗体データが前記第1閾値よりも大きい第2閾値以上である条件を満たすとともに、前記第1数よりも少ない第2数の複数の標的タンパク質を前記第1数の標的タンパク質の中から抽出し、前記第2数の標的タンパク質の中から前記特定の標的タンパク質を選定する、請求項1に記載の抗原探索方法。
  3. 前記抗原選定工程では、前記第2数の標的タンパク質のそれぞれについての前記抗体データの間の類似度を求め、前記類似度に基づく階層的クラスタリングによって前記第2数の標的タンパク質を、前記診断データで示される複数の疾患のそれぞれに対応して複数のグループに分類することにより、前記複数のグループにそれぞれ属する標的タンパク質を前記特定の標的タンパク質として選定する、請求項2に記載の抗原探索方法。
  4. 前記抗原選定工程では、前記複数のグループにそれぞれ属する各標的タンパク質の各前記抗体データに対応した前記診断データで示される各疾患が同一となることを目標として、遺伝的アルゴリズムを用いて前記機械学習モデルを生成する、請求項3に記載の抗原探索方法。
  5. 前記データ算出工程では、前記診断データで示される複数の疾患のそれぞれに対応した前記測定データの間の測定誤差を吸収するための所定の標準化処理を行うことにより、標準化された前記抗体データを前記第1数の標的タンパク質のそれぞれについて算出する、請求項1に記載の抗原探索方法。
  6. 前記データ算出工程では、前記診断データで示される複数の疾患ごとの前記抗体データについて、少なくとも一のパーセンタイルにある値を用いて前記標準化処理を行うことにより、標準化された前記抗体データを前記第1数の標的タンパク質のそれぞれについて算出する、請求項5に記載の抗原探索方法。
  7. 前記測定データは、
    前記第1数の標的タンパク質の何れに対しても結合する所定のリファレンス抗体に結合可能であって、第1蛍光物質で標識された第1二次抗体において、前記第1蛍光物質から放出された蛍光の強度を前記特徴量とする第1蛍光強度値と、
    前記複数の被検体試料中の自己抗体に結合可能であって、第2蛍光物質で標識された第2二次抗体において、前記第2蛍光物質から放出された蛍光の強度を前記特徴量とする第2蛍光強度値と、を含み、
    前記データ算出工程では、前記第1蛍光強度値及び前記第2蛍光強度値を用いて前記標準化処理を行うことにより、標準化された前記抗体データを前記第1数の標的タンパク質のそれぞれについて算出する、請求項5に記載の抗原探索方法。
  8. 基板上に第1数の複数の標的タンパク質が固定されてなるタンパク質マイクロアレイを用いて、複数の被検体に由来する複数の被検体試料のそれぞれを前記第1数の標的タンパク質に接触させたときの所定の特徴量を測定し、その測定結果を示す前記第1数の標的タンパク質のそれぞれについての測定データを出力する測定装置と、
    複数の疾患のそれぞれに関連する疾患関連抗原と相関を有する標的タンパク質を探索する抗原探索装置と、を備え、
    前記抗原探索装置は、
    前記測定データを取得するデータ取得部と、
    前記測定データに基づいて、前記複数の被検体試料中の自己抗体と前記第1数の標的タンパク質との抗原抗体反応に伴う結合性に関する、前記第1数の標的タンパク質のそれぞれについての抗体データを、前記複数の被検体のそれぞれに対する複数の疾患に関する診断結果を示す診断データと対応付けて算出するデータ算出部と、
    前記診断データと対応付けられた前記第1数の標的タンパク質のそれぞれについての前記抗体データを入力データとする機械学習モデルを生成し、前記機械学習モデルに従って、前記診断データで示される複数の疾患のそれぞれに対応して、前記第1数の標的タンパク質の中から前記抗体データに基づき前記疾患関連抗原と相関を有する特定の標的タンパク質を選定し、当該選定した前記特定の標的タンパク質を出力データとして出力する抗原選定部と、を含む、抗原探索システム。
JP2022172488A 2022-10-27 2022-10-27 抗原探索方法及び抗原探索システム Pending JP2024064128A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022172488A JP2024064128A (ja) 2022-10-27 2022-10-27 抗原探索方法及び抗原探索システム
PCT/JP2023/033322 WO2024090062A1 (ja) 2022-10-27 2023-09-13 抗原探索方法及び抗原探索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022172488A JP2024064128A (ja) 2022-10-27 2022-10-27 抗原探索方法及び抗原探索システム

Publications (1)

Publication Number Publication Date
JP2024064128A true JP2024064128A (ja) 2024-05-14

Family

ID=90830487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022172488A Pending JP2024064128A (ja) 2022-10-27 2022-10-27 抗原探索方法及び抗原探索システム

Country Status (2)

Country Link
JP (1) JP2024064128A (ja)
WO (1) WO2024090062A1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100405062C (zh) * 2001-04-10 2008-07-23 利兰·斯坦福青年大学托管委员会 抗体特异性分布的治疗和诊断使用
CN112292697A (zh) * 2018-04-13 2021-01-29 弗里诺姆控股股份有限公司 用于生物样品的多分析物测定的机器学习实施方式
WO2022076237A1 (en) * 2020-10-05 2022-04-14 Freenome Holdings, Inc. Markers for the early detection of colon cell proliferative disorders

Also Published As

Publication number Publication date
WO2024090062A1 (ja) 2024-05-02

Similar Documents

Publication Publication Date Title
Gayoso et al. Joint probabilistic modeling of single-cell multi-omic data with totalVI
JP7434161B2 (ja) タンパク質同定のための方法およびシステム
Suprun et al. Novel Bead-Based Epitope Assay is a sensitive and reliable tool for profiling epitope-specific antibody repertoire in food allergy
JP2021508885A (ja) タンパク質同定のためのデコーディングアプローチ方法
US20110275537A1 (en) Method of biological and medical diagnostics using immune patterns obtained with arrays of peptide probes
Copple et al. Interpretation of ANA indirect immunofluorescence test outside the darkroom using NOVA view compared to manual microscopy
CN110178013B (zh) 标记物选择支持系统、标记物选择支持装置、支持标记物选择的方法和支持标记物选择的程序
CN106461647A (zh) 用于检测结肠直肠肿瘤的蛋白质生物标志物谱
US10126300B2 (en) Immunosignature based diagnosis and characterization of canine lymphoma
US20180231565A1 (en) Methods for determining the risk of a systemic lupus erythematosus (sle) patient to develop neuropsychiatric syndromes
Prechl et al. Antigen microarrays: descriptive chemistry or functional immunomics?
Daly et al. Evaluating concentration estimation errors in ELISA microarray experiments
US20220299525A1 (en) Computational sensing with a multiplexed flow assays for high-sensitivity analyte quantification
Bankova et al. Rapid immunoassays for diagnosis of heparin-induced thrombocytopenia: comparison of diagnostic accuracy, reproducibility, and costs in clinical practice
Mani et al. Data mining strategies to improve multiplex microbead immunoassay tolerance in a mouse model of infectious diseases
Rausch et al. Comparison of pre-processing methods for multiplex bead-based immunoassays
US20200393465A1 (en) Markers, methods and systems for identifying cell populations, diagnosing, monitoring, predicting and treating conditions
WO2024090062A1 (ja) 抗原探索方法及び抗原探索システム
US20150023568A1 (en) Computing systems, computer-readable media and methods of antibody profiling
Binder et al. Protein arrays and pattern recognition: new tools to assist in the identification and management of autoimmune disease
JP2004533223A (ja) 生理学的または病態生理学的プロセスに関連するゲノムおよびプロテオーム経路のアソシエーション法
Lin et al. An antibody-based leukocyte-capture microarray for the diagnosis of systemic lupus erythematosus
Kalina et al. Profiling of polychromatic flow cytometry data on B‐cells reveals patients' clusters in common variable immunodeficiency
CN116635950A (zh) 样本定量分析的改进或与样本定量分析相关的改进
Johansen et al. Projecting clumped transcriptomes onto single cell atlases to achieve single cell resolution

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20221110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20221110

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20240116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20240116