JP2023512239A - 標的バリアントがクローンレベルで存在しないことの有意性モデリング - Google Patents

標的バリアントがクローンレベルで存在しないことの有意性モデリング Download PDF

Info

Publication number
JP2023512239A
JP2023512239A JP2022545998A JP2022545998A JP2023512239A JP 2023512239 A JP2023512239 A JP 2023512239A JP 2022545998 A JP2022545998 A JP 2022545998A JP 2022545998 A JP2022545998 A JP 2022545998A JP 2023512239 A JP2023512239 A JP 2023512239A
Authority
JP
Japan
Prior art keywords
determining
nucleic acid
value
sample
variant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022545998A
Other languages
English (en)
Other versions
JPWO2021155241A5 (ja
Inventor
アレクサンドル アルツィオメンカ,
アーロン アイザック ハーディン,
スティーブン フェアクロー,
マーシン シコラ,
カタリン バルバチオル,
Original Assignee
ガーダント ヘルス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ガーダント ヘルス, インコーポレイテッド filed Critical ガーダント ヘルス, インコーポレイテッド
Publication of JP2023512239A publication Critical patent/JP2023512239A/ja
Publication of JPWO2021155241A5 publication Critical patent/JPWO2021155241A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本明細書において、陰性予測を行う方法を提供する。一部の態様では、少なくとも部分的にコンピュータを使用して、第1の標的核酸バリアントが、所定のがんの型を有する対象から得た無細胞核酸(cfNA)試料中の第1の遺伝子座に存在しないことを決定する方法を提供する。ある特定のこれらの方法は、第1の標的核酸バリアントが、対象から得たcfNA試料中に検出されないことを決定するステップ、コンピュータによって、少なくとも1つの腫瘍割合に基づく値を生成するステップ、コンピュータによって少なくとも1つの相互排他性値を生成するステップ、ならびに腫瘍割合に基づく値および/または相互排他性値を使用して、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップを含む。追加の方法および関連するシステムおよびコンピュータ可読媒体も同様に提供する。

Description

相互参照
本出願は、その全体が全ての目的に関して参照により本明細書に組み込まれる、2020年1月31日に出願された米国特許仮出願第62/968,507号の優先日の利益を主張する。
背景
進行した結腸直腸がん(CRC)では、ガイドラインは、その腫瘍がKRAS、NRAS、およびBRAFに関して野生型である患者に限って抗EGFR療法の使用を推奨した。今日まで、無細胞循環腫瘍DNA(ctDNA)試験は、組織の配列決定と高度に一致する腫瘍由来のゲノムの変化およびマイクロサテライト不安定性(MSI)を陽性に検出するための有力な試験として使用されている(Gupta et al., Oncologist, 24:1-9 (2019), Parikh et at., Nat Med., 25(9):1415-1421 (2019))。しかし、そのような突然変異を除外する能力は、検出感度に影響を及ぼすctDNAの低い排出能により制限されている。ctDNAまたは他の核酸を使用して腫瘍内の特定の遺伝子の野生型状態を高い信頼度で決定することができれば、時宜を得た治療の決定が容易となり、野生型状態の確認のための組織生検を回避するであろう。
Gupta et al., Oncologist, 24:1-9 (2019), Parikh et at., Nat Med., 25(9):1415-1421 (2019)
したがって、特に無細胞核酸(cfNA)試料から遺伝子解析を通して検出可能である疾患を診断するおよび/またはその処置を誘導するためには、遺伝子バリアントまたはその非存在を特定する必要がある。
要旨
本開示は、試料から配列決定されるゲノム、染色体、または他の遺伝子部分からのDNAまたはRNAなどの核酸の様々な状態の決定に基づいて精密診断を生成するテクノロジーに関する。標的バリアントの検出は、処置計画を誘導するための助けとなり得る。
遺伝子バリアントが検出されない場合、バリアントが試料中にクローンレベルで実際に存在しないために遺伝子バリアントが検出されなかった(真の陰性結果)のか、または遺伝子バリアントがクローンレベルでは実際に存在するが検出されなかった(偽陰性結果)のかを決定することは等しく重要であり得る。本明細書において、陰性予測の有意性モデリング、例えば遺伝子バリアントが検出されなかったのか、または試料中に実際に存在しないのかに関連する改善を記載する。特定の例では、有意性モデリングは、試料から生成された核酸配列読み取りデータ(sequence reads)に基づいて、コンピュータによる腫瘍バリアントまたは突然変異の腫瘍割合(TF)推定値を生成および使用し得る。
あるいはまたは加えて、有意性モデリングは、試料中に検出される、または検出されない他のバリアントの出現および/または多様性を決定および使用してもよい。例えば、有意性モデリングは、標的バリアントと同時発生する共変性バリアント、または標的バリアントと通常同時発生しない相互排他性バリアントの検出を使用してもよい。試料中に検出される、または検出されないバリアントのTF推定値および/または多様性に基づいて陰性予測値(「NPV」)を生成してもよい。結果を使用して、陰性診断(例えば、目的の座での所定のバリアントの非存在)の信頼レベルを提供してもよく、および/または陰性診断に基づいて処置計画をさらに誘導してもよい。例えば、がんの診断の文脈では、同時発生バリアントは、腫瘍形成を促進する傾向があるドライバーバリアントを含んでもよく、相互排他性バリアントは腫瘍形成を抑制する傾向がある腫瘍抑制性バリアントを含んでもよい。
一態様では、本開示は、目的の第1のバリアントが、対象から得た核酸試料中の第1の座にクローンレベルで存在しない確率を決定する方法を提供する。方法は、試料中の核酸の複数の配列読み取りデータにアクセスするステップ、および複数の配列読み取りデータに基づいて、第1のバリアントが試料中の第1の座で検出されていなかったことを決定するステップを含む。方法はまた、第1のバリアントがクローンレベルで存在しない確率に基づく第1の尤度値、および第1のバリアントがクローンレベルで存在する確率に基づく第2の尤度値を生成するステップ;第1の尤度値および第2の尤度値に基づいて定量値を決定するステップ;定量値を閾値と比較するステップ;ならびに比較に基づいて、目的の第1のバリアントが第1の座にクローンレベルで存在しないことを決定するステップも含む。
一態様では、本開示は、目的の第1のバリアントが、ヒト対象の無細胞核酸(cfNA)試料中の第1の座にクローンレベルで存在しないこと(および陰性予測)を決定する方法を提供する。方法は、cfNA試料の複数の配列読み取りデータにアクセスするステップ;および複数の配列読み取りデータに基づいて、第1のバリアントが試料中の第1の座で検出されていなかったことを決定するステップを含む。方法はまた、第1のバリアントがクローンレベルで存在しない確率に基づく第1の尤度値、および/または第1のバリアントがクローンレベルで存在する確率に基づく第2の尤度値を生成するステップ;ならびに比較に基づいて、目的の第1のバリアントが第1の座にクローンレベルで存在しないことを分類するステップも含む。
一態様では、本開示は、目的の第1のバリアントが、ヒト対象の無細胞デオキシリボ核酸(cfDNA)試料中の第1の座にクローンレベルで存在しないこと(および陰性予測)を決定する方法を提供する。方法は、cfDNA試料の複数の配列読み取りデータにアクセスするステップ;および複数の配列読み取りデータに基づいて、第1のバリアントが試料中の第1の座で検出されていなかったことを決定するステップを含む。方法はまた、第1のバリアントがクローンレベルで存在しない確率に基づく第1の尤度値、および/または第1のバリアントがクローンレベルで存在する確率に基づく第2の尤度値を生成するステップ;必要に応じて、第1の尤度値および/または第2の尤度値に基づく定量値を決定するステップ;定量値および/または第1の尤度値および/または第2の尤度値を、閾値と比較するステップ;ならびに比較に基づいて、目的の第1のバリアントが第1の座にクローンレベルで存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)も含む。
一部の実施形態では、第1の尤度値および第2の尤度値を生成するステップは、試料の腫瘍割合推定値を決定するステップであって、第1の尤度値および第2の尤度値が腫瘍割合推定値に基づくステップを含む。ある特定の実施形態では、腫瘍割合推定値を決定するステップは、試料中の腫瘍の突然変異の最大突然変異体対立遺伝子頻度(MAX MAF)を決定するステップを含む。これらの実施形態の一部では、MAX MAFを決定するステップは、複数の配列読み取りデータに基づいて腫瘍の突然変異に関連する分子カウントを決定するステップを含む。ある特定の実施形態では、第1の尤度値および第2の尤度値を生成するステップは、少なくとも第2のバリアントの対立遺伝子頻度を決定するステップであって、第1の尤度値および第2の尤度値が対立遺伝子頻度およびMAX MAFにさらに基づくステップを含む。ある特定のこれらの実施形態では、方法はさらに、対立遺伝子頻度をMAX MAFに基づく第2の閾値と比較するステップであって、目的の第1のバリアントが第1の座にクローンレベルで存在しないことを決定するステップが、MAFを第2の閾値と比較することにさらに基づくステップを含む。ある特定のこれらの実施形態では、対立遺伝子頻度を決定するステップは、複数の配列読み取りデータに基づいて第1のバリアントに関連する第1の分子カウントを決定するステップを含む。一部の実施形態では、定量値を決定するステップは、第1のバリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスするステップであって、定量値が共変量情報に基づくステップを含む。これらの一部の実施形態では、方法はさらに、cfDNA試料中の少なくとも第2のバリアントの出現を決定するステップであって、定量値が共変量情報にさらに基づくステップを含む。
ある特定の実施形態では、定量値を決定するステップは、第1のバリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスするステップであって、定量値が共変量情報に基づくステップを含む。一部のこれらの実施形態では、方法はさらに、cfDNA試料中の少なくとも第2のバリアントの出現を決定するステップであって、定量値が第2のバリアントの出現にさらに基づくステップを含む。ある特定の実施形態では、定量値は、第1の尤度値の第2の尤度値に対する比に基づく。ある特定の実施形態では、方法は、第1のバリアントが、定量値に基づいてcfDNA試料中にクローンレベルで存在しない信頼レベルを決定するステップをさらに含む。一部の実施形態では、方法は、ヒト対象における疾患を処置するための処置計画の生成を決定するステップをさらに含む。一部のこれらの実施形態では、疾患はがんである。ある特定の実施形態では、方法はさらに、cfDNA試料中の少なくとも第2のバリアントの出現を決定するステップ、およびcfDNA試料中の少なくとも第2のバリアントの出現に基づいて定量値を調整するステップをさらに含む。
別の態様では、本開示は、少なくとも部分的にコンピュータを使用して、第1の標的核酸バリアントが、所定のがんの型を有する対象から得た無細胞核酸(cfNA)試料中の第1の遺伝子座に存在しないことを決定する方法を提供する。方法は、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座で検出されないことを決定するステップ;コンピュータによって、cfNA試料から生成された配列情報から、第1の遺伝子座のカバレッジを決定するステップ;およびコンピュータによって、cfNA試料から生成された配列情報から腫瘍割合を決定するステップを含む。方法はまた、コンピュータによって、カバレッジおよび腫瘍割合から、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在する確率を決定して、定量値を生成するステップ;ならびに定量値が閾値と異なれば、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)も含む。
別の態様では、本開示は、少なくとも部分的にコンピュータを使用して、第1の標的核酸バリアントが対象から得た無細胞核酸(cfNA)試料中の第1の遺伝子座に存在しないことを決定する方法を提供する。方法は、第1の標的核酸バリアントが対象から得たcfNA試料中に検出されないことを決定して、第1の試験結果を生成するステップ;少なくとも第2の標的核酸バリアントが対象から得たcfNA試料中に検出されることを決定して、第2の試験結果を生成するステップ;ならびにコンピュータによって、第2の試験結果が与えられると、第1の標的核酸バリアントがcfNA試料中に存在しない第1の確率および/または第2の試験結果が与えられると、第1の標的核酸がcfNA試料中に存在する第2の確率を決定するステップを含む。方法はまた、コンピュータによって、第1の確率、第2の確率、および/またはその比を使用して定量値を生成するステップ;ならびに定量値が閾値と異なれば、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)も含む。
別の態様では、本開示は、少なくとも部分的にコンピュータを使用して、第1の標的核酸バリアントが所定のがんの型を有する対象から得た無細胞核酸(cfNA)試料中の第1の遺伝子座に存在しないことを決定する方法を提供する。方法は、第1の標的核酸バリアントが対象から得たcfNA試料中に検出されないことを決定するステップ;コンピュータによって、少なくとも1つの腫瘍割合に基づく値を生成するステップ;コンピュータによって少なくとも1つの相互排他性値を生成するステップ;ならびに腫瘍割合に基づく値および/または相互排他性値を使用して、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)を含む。
一部の実施形態では、定量値は閾値より小さいが、他の実施形態では、定量値は閾値より大きい。ある特定の実施形態では、定量値は対数尤度比(LLR)閾値を含む。典型的に、第1および第2の試験結果は互いに従属する。ある特定の実施形態では、本明細書に開示される方法は、複数の他の選択された標的核酸バリアントが1つまたは複数の他の遺伝子座(例えば、選択されたまたは標的座のパネル)に存在しないことを決定するステップを含む。
ある特定の実施形態では、方法は、第1の標的核酸バリアントが複数の参照cfNA試料中の第1の遺伝子座に存在しないことを決定して閾値を生成するステップを含む。一部のこれらの実施形態では、閾値は、クローン性またはサブクローン性の閾値を含む。本明細書に開示される方法の一部の実施形態では、第1の標的核酸バリアントはドライバー突然変異を含む。ある特定の実施形態では、方法は、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないという決定に基づいて、対象に1つまたは複数の療法を投与するステップをさらに含む。一部の実施形態では、方法は、腫瘍割合および二項モデルを使用して、第1の標的核酸バリアントをcfNA試料中の第1の遺伝子座で検出する確率を推定するステップを含む。ある特定のこれらの実施形態では、二項モデルは、所定のがんの型および/または第2の標的核酸バリアントに関する情報を含む。他のモデルもまた必要に応じて使用される。
本明細書に開示される方法の一部の実施形態では、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないという決定は、第1の遺伝子座が野生型であることを示している。ある特定の実施形態では、所定のがんの型は結腸直腸がんであり、第1の遺伝子座は、KRAS、BRAF、またはNRASであり、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないという決定は、第1の遺伝子座が野生型KRAS、BRAF、またはNRASであることを示している。ある特定のこれらの実施形態では、方法は、セツキシマブおよび/またはパニツムマブを対象に投与するステップをさらに含む。一部の実施形態では、cfNAは、cfDNAおよび/またはcfRNAを含む。
ある特定の実施形態では、本明細書に開示される方法は、第1の標的核酸バリアントが、異なる時点で対象から得た異なるcfNA試料中の第1の遺伝子座に存在しないか否かをモニターするために方法を1回または複数回繰り返すことをさらに含む。ある特定の実施形態では、方法は、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないという決定を確認または反証するために1つまたは複数の追加の試験を実施するステップをさらに含む。一部の実施形態では、方法は、cfNA試料に関して最大突然変異体対立遺伝子頻度(MAX MAF)を決定するステップ、およびMAX MAFを腫瘍割合推定値として使用するステップを含む。ある特定の実施形態では、方法は、cfNA試料から得た複数の配列決定読み取りデータに基づいて、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座で検出されないことを決定するステップを含む。一部の実施形態では、方法は、第1の標的核酸バリアントが、cfNA試料中にクローンレベルで存在しないことを決定するステップを含む。ある特定の実施形態では、方法は、第1の確率に基づく第1の尤度値および第2の確率に基づく第2の尤度値を生成するステップを含む。ある特定の実施形態では、方法は、第1の尤度値および第2の尤度値に基づいて定量値を決定するステップを含む。
本明細書に開示される方法の一部の実施形態では、第1の尤度値および第2の尤度値を生成するステップは、cfNA試料の腫瘍割合推定値を決定するステップであって、第1の尤度値および第2の尤度値が腫瘍割合推定値に基づくステップを含む。ある特定の実施形態では、方法は、cfNA試料中の腫瘍突然変異の最大突然変異体対立遺伝子頻度(MAX MAF)を決定するステップを含む、腫瘍割合推定値を決定するステップを含む。ある特定の実施形態では、方法は、複数の配列読み取りデータに基づいて腫瘍突然変異に関連する分子カウントを決定するステップを含む、MAX MAFを決定するステップを含む。一部の実施形態では、方法は、少なくとも第2のバリアントの対立遺伝子頻度を決定するステップを含む、第1の尤度値および第2の尤度値を生成するステップであって、第1の尤度値および第2の尤度値が対立遺伝子頻度およびMAX MAFにさらに基づくステップを含む。一部のこれらの実施形態では、方法はさらに、対立遺伝子頻度を、MAX MAFに基づく第2の閾値と比較するステップであって、目的の第1の標的核酸バリアントが第1の遺伝子座にクローンレベルで存在しないことを決定するステップがMAFと第2の閾値との比較にさらに基づくステップを含む。
一部の実施形態では、第1の対立遺伝子頻度を決定するステップは、複数の配列読み取りデータに基づいて第1の標的核酸バリアントに関連する第1の分子カウントを決定するステップを含む。ある特定の実施形態では、定量値を決定するステップは、第1のバリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスするステップであって、定量値が共変量情報に基づくステップを含む。一部の実施形態では、方法はさらに、cfDNA試料中の少なくとも第2の標的核酸バリアントの出現を決定するステップであって、定量値が共変量情報にさらに基づくステップを含む。ある特定の実施形態では、方法は、第1の標的核酸バリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスするステップを含む定量値を決定するステップであって、定量値が共変量情報に基づくステップを含む。一部の実施形態では、方法はさらに、cfNA試料中の少なくとも第2の標的核酸バリアントの出現を決定するステップであって、定量値が第2の標的核酸バリアントの出現にさらに基づくステップを含む。一部のこれらの実施形態では、定量値は、第1の尤度値の第2の尤度値に対する比に基づく。ある特定のこれらの実施形態では、方法はさらに、定量値に基づいて、第1の標的核酸バリアントがcfNA試料中にクローンレベルで存在しない信頼レベルを決定するステップを含む。一部のこれらの実施形態では、方法はさらに、cfNA試料中に少なくとも第2の標的核酸バリアントの出現を決定するステップ、およびcfNA試料中の少なくとも第2の標的核酸バリアントの出現に基づいて定量値を調整するステップを含む。
本明細書に開示される方法の一部の実施形態では、比は、対数尤度腫瘍割合値、対数尤度相互排他性値、および対数事前値の合計に等しいに対数事後確率比(LPPR)を含む。ある特定の実施形態では、第1の遺伝子座または第2の遺伝子座は、第2の標的核酸バリアントを含む。ある特定の実施形態では、定量値は、陰性予測値(NPV)スコアを含む。一部の実施形態では、所定のがんの型は肺がんを含み、第1の標的核酸バリアントは、EGFR、BRAF(例えば、V600E)、ALK(例えば、融合体)、ROS1(例えば、融合体)、およびMETからなる群から選択される遺伝子における突然変異である。一部の実施形態では、所定のがんの型は結腸直腸がんを含み、第1の標的核酸バリアントは、KRAS(例えば、G12X、G13X、Q61X、K117N、A146P/146T/146V)、BRAF、およびNRASからなる群から選択される遺伝子における突然変異である。
別の態様では、本開示は、少なくとも1つの電子プロセッサーによって実行される場合に、cfDNA試料の複数の配列読み取りデータにアクセスするステップ;複数の配列読み取りデータに基づいて、第1のバリアントが試料中の第1の座で検出されていなかったことを決定するステップ;第1のバリアントがクローンレベルで存在しない確率に基づく第1の尤度値および第1のバリアントがクローンレベルで存在する確率に基づく第2の尤度値を生成するステップ;第1の尤度値および第2の尤度値に基づいて定量値を決定するステップ;定量値を閾値と比較するステップ;ならびに比較に基づいて、目的の第1のバリアントが第1の座にクローンレベルで存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体を含むかまたはそれにアクセスすることが可能なコントローラを含むシステムを提供する。
別の態様では、本開示は、少なくとも1つの電子プロセッサーによって実行される場合に、所定のがんの型を有する対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;配列情報から、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座で検出されないことを決定するステップ;配列情報から、第1の遺伝子座のカバレッジを決定するステップ;配列情報から腫瘍割合を決定するステップ;カバレッジおよび腫瘍割合から、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在する確率を決定して、定量値を生成するステップ;ならびに定量値が閾値と異なれば、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体を含むかまたはそれにアクセスすることが可能なコントローラを含むシステムを提供する。
別の態様では、本開示は、少なくとも1つの電子プロセッサーによって実行される場合に、対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;配列情報から、第1の標的核酸バリアントがcfNA試料中に検出されないことを決定して、第1の試験結果を生成するステップ;配列情報から、少なくとも第2の標的核酸バリアントがcfNA試料中に検出されることを決定して、第2の試験結果を生成するステップ;第2の試験結果が与えられると、第1の標的核酸バリアントがcfNA試料中に存在しない第1の確率および/または第2の試験結果が与えられると、第1の標的核酸がcfNA試料中に存在する第2の確率を決定するステップ;第1の確率、第2の確率、および/またはその比から定量値を生成するステップ;ならびに定量値が閾値と異なれば、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体を含むかまたはそれにアクセスすることが可能なコントローラを含むシステムを提供する。
別の態様では、本開示は、少なくとも1つの電子プロセッサーによって実行される場合に、対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;配列情報から、第1の標的核酸バリアントがcfNA試料中に検出されないことを決定するステップ;少なくとも1つの腫瘍割合に基づく値を生成するステップ;少なくとも1つの相互排他性値を生成するステップ;ならびに腫瘍割合に基づく値および/または相互排他性値を使用して、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)を少なくとも実施する非一時的コンピュータ実行可能な命令を含むコンピュータ可読媒体を含むかまたはそれにアクセスすることが可能なコントローラを含むシステムを提供する。
別の態様では、本開示は、少なくとも電子プロセッサーによって実行される場合に、cfDNA試料の複数の配列読み取りデータにアクセスするステップ;複数の配列読み取りデータに基づいて、第1のバリアントが試料中の第1の座で検出されていなかったことを決定するステップ;第1のバリアントがクローンレベルで存在しない確率に基づく第1の尤度値および第1のバリアントがクローンレベルで存在する確率に基づく第2の尤度値を生成するステップ;第1の尤度値および第2の尤度値に基づいて定量値を決定するステップ;定量値を閾値と比較するステップ;ならびに比較に基づいて、目的の第1のバリアントが第1の座にクローンレベルで存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体を提供する。
別の態様では、本開示は、少なくとも電子プロセッサーによって実行される場合に、所定のがんの型を有する対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;配列情報から、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座で検出されないことを決定するステップ;配列情報から、第1の遺伝子座のカバレッジを決定するステップ;配列情報から、腫瘍割合を決定するステップ;カバレッジおよび腫瘍割合から、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在する確率を決定して定量値を生成するステップ;ならびに定量値が閾値と異なれば、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体を提供する。
別の態様では、本開示は、少なくとも電子プロセッサーによって実行される場合に、対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;配列情報から、第1の標的核酸バリアントがcfNA試料中に検出されないことを決定して、第1の試験結果を生成するステップ;配列情報から、少なくとも第2の標的核酸バリアントがcfNA試料中に検出されることを決定して、第2の試験結果を生成するステップ;第2の試験結果が与えられると、第1の標的核酸バリアントがcfNA試料中に存在しない第1の確率および/または第2の試験結果が与えられると、第1の標的核酸がcfNA試料中に存在する第2の確率を決定するステップ;第1の確率、第2の確率、および/またはその比を使用して定量値を生成するステップ;ならびに定量値が閾値と異なれば、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)を少なくとも実施する非一時的コンピュータ実行可能な命令を含むコンピュータ可読媒体を提供する。
別の態様では、本開示は、少なくとも電子プロセッサーによって実行される場合に、対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;配列情報から、第1の標的核酸バリアントがcfNA試料中に検出されないことを決定するステップ;少なくとも1つの腫瘍割合に基づく値を生成するステップ;少なくとも1つの相互排他性値を生成するステップ;ならびに腫瘍割合に基づく値および/または相互排他性値を使用して、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ(例えば、この文脈では分類するまたはコールするステップ)を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体を提供する。
本明細書に開示されるシステムまたはコンピュータ可読媒体の一部の実施形態では、定量値は閾値より小さいが、他の例示的な実施形態では、定量値は閾値より大きい。一部のこれらの実施形態では、第1および第2の試験結果は互いに従属する。ある特定のこれらの実施形態では、非一時的コンピュータ実行可能命令は、複数の他の選択された標的核酸バリアントが、1つまたは複数の他の遺伝子座に存在しないことを決定するステップを含む。一部のこれらの実施形態では、定量値は、対数尤度比(LLR)閾値を含む。ある特定のこれらの実施形態では、非一時的コンピュータ実行可能命令は、第1の標的核酸バリアントが、複数の参照cfNA試料中の第1の遺伝子座に存在しないことを決定して、閾値を生成するステップを含む。一部のこれらの実施形態では、閾値はクローン性またはサブクローン性閾値を含む。一部のこれらの実施形態では、第1の標的核酸バリアントは、ドライバー突然変異を含む。一部のこれらの実施形態では、命令はさらに、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないという決定に基づいて対象に関して1つまたは複数の療法推奨を出力するステップを少なくとも実施する。
本明細書に開示されるシステムまたはコンピュータ可読媒体の一部の実施形態では、命令はさらに、腫瘍割合および二項モデルを使用してcfNA試料中の第1の遺伝子座で第1の標的核酸バリアントを検出する確率を推定するステップを少なくとも実施する。一部のこれらの実施形態では、命令はさらに、cfNA試料に関して最大突然変異体対立遺伝子頻度(MAX MAF)を決定するステップ、およびMAX MAFを腫瘍割合推定値として使用するステップを少なくとも実施する。一部のこれらの実施形態では、命令はさらに、第1の標的核酸バリアントがcfNA試料中にクローンレベルで存在しないことを決定するステップを少なくとも実施する。ある特定のこれらの実施形態では、命令はさらに、第1の確率に基づく第1の尤度値および第2の確率に基づく第2の尤度値を生成するステップを少なくとも実施する。ある特定のこれらの実施形態では、命令はさらに、第1の尤度値および第2の尤度値に基づいて定量値を決定するステップを少なくとも実施する。
本明細書に開示されるシステムまたはコンピュータ可読媒体の一部の実施形態では、命令はさらに、cfNA試料の腫瘍割合推定値を決定することによって第1の尤度値および第2の尤度値を生成するステップであって、第1の尤度値および第2の尤度値が腫瘍割合推定値に基づくステップを少なくとも実施する。ある特定のこれらの実施形態では、命令はさらに、cfNA試料中の腫瘍突然変異の最大突然変異体対立遺伝子頻度(MAX MAF)を決定することによって腫瘍割合推定値を決定するステップを少なくとも実施する。ある特定のこれらの実施形態では、命令はさらに、複数の配列読み取りデータに基づいて、腫瘍突然変異に関連する分子カウントを決定することによってMAX MAFを決定するステップを少なくとも実施する。ある特定のこれらの実施形態では、命令はさらに、少なくとも第2のバリアントの対立遺伝子頻度を決定することによって第1の尤度値および第2の尤度値を生成するステップであって、第1の尤度値および第2の尤度値が対立遺伝子頻度およびMAX MAFにさらに基づくステップを少なくとも実施する。一部のこれらの実施形態では、命令はさらに、対立遺伝子頻度をMAX MAFに基づく第2の閾値と比較するステップ、およびMAFと第2の閾値との比較にさらに基づいて、目的の第1の標的核酸バリアントが第1の遺伝子座にクローンレベルで存在しないことを決定するステップを少なくとも実施する。一部のこれらの実施形態では、命令はさらに、複数の配列読み取りデータに基づいて、第1の標的核酸バリアントに関連する第1の分子カウントを決定するステップによって対立遺伝子頻度を決定するステップを少なくとも実施する。
本明細書に開示されるシステムまたはコンピュータ可読媒体の一部の実施形態では、命令はさらに、第1のバリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスすることによって定量値を決定するステップであって、定量値が共変量情報に基づくステップを少なくとも実施する。一部のこれらの実施形態では、命令はさらに、cfDNA試料中の少なくとも第2の標的核酸バリアントの出現を決定するステップであって、定量値が共変量情報にさらに基づくステップを少なくとも実施する。一部のこれらの実施形態では、命令はさらに、第1の標的核酸バリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスすることによって定量値を決定するステップであって、定量値が共変量情報に基づくステップを少なくとも実施する。ある特定のこれらの実施形態では、命令はさらに、cfNA試料中の少なくとも第2の標的核酸バリアントの出現を決定するステップであって、定量値が第2の標的核酸バリアントの出現にさらに基づくステップを少なくとも実施する。ある特定のこれらの実施形態では、命令はさらに、定量値に基づいて、第1の標的核酸バリアントがcfNA試料中にクローンレベルで存在しない信頼レベルを決定するステップを少なくとも実施する。ある特定のこれらの実施形態では、命令はさらに、cfNA試料中の少なくとも第2の標的核酸バリアントの出現を決定するステップ;およびcfNA試料中の少なくとも第2の標的核酸バリアントの出現に基づいて定量値を調整するステップを少なくとも実施する。ある特定のこれらの実施形態では、比は、対数尤度腫瘍割合値、対数尤度相互排他性値、および対数事前値の合計に等しい対数事後確率比(LPPR)を含む。
一部の実施形態では、本明細書に開示されるシステムおよび方法の結果は、報告書を作成するための入力として使用される。報告書は、紙であっても電子フォーマットであってもよい。例えば、本明細書に開示される方法およびシステムによって得られる場合、目的の第1のバリアントが第1の座にクローンレベルでは存在しないという分類を、そのような報告書に直接表示することができる。あるいはまたは加えて、目的の第1のバリアントが第1の座にクローンレベルで存在しない確率に基づく診断情報または療法推奨を、報告書に含めることができる。
決定が、閾値とは異なる定量値に基づく場合、この決定に使用される定量値は、閾値の性質に応じて、閾値より小さくてもよく、または閾値より大きくてもよい。このように、定量値は、閾値を満たしてもよく、満たさなくてもよい。
ある特定の態様では、本開示は、対象における疾患を処置する方法であって、対象から得た無細胞デオキシリボ核酸(cfDNA)試料の複数の配列読み取りデータにアクセスするステップ;複数の配列読み取りデータに基づいて、目的の第1のバリアントがcfDNA試料中の第1の座で検出されていなかったことを決定するステップ;第1のバリアントがクローンレベルで存在しない確率に基づく第1の尤度値および/または第1のバリアントがクローンレベルで存在する確率に基づく第2の尤度値を生成するステップ;第1の尤度値および/または第2の尤度値に基づく定量値を決定するステップ;定量値および/または第1の尤度値および/または第2の尤度値を閾値と比較するステップ;比較に基づいて、目的の第1のバリアントが第1の座にクローンレベルで存在しないことを決定するステップ;ならびに目的の第1のバリアントが第1の座にクローンレベルで存在しないという決定に少なくとも部分的に基づいて対象に1つまたは複数の療法を投与し、それによって対象における疾患を処置するステップを含む方法を提供する。ある特定の実施形態では、1つまたは複数の療法は、目的の第1のバリアントが第1の座にクローンレベルで存在しないという決定に少なくとも部分的に基づいて対象への投与が中止され、それによって対象における疾患を処置する。ある特定の実施形態では、本明細書に記載される方法は、複数の対象について実施される。ある特定の実施形態では、対象のサブセットは、目的の第1のバリアントが第1の座にクローンレベルで存在しないという決定に少なくとも部分的に基づいて1つまたは複数の療法を投与され、対象の別のサブセットは、それらの対象に以前に投与された1つまたは複数の療法を中止される。ある特定の実施形態では、対象は、目的の第1のバリアントが第1の座にクローンレベルで存在しないという決定に少なくとも部分的に基づいて対象に以前に投与された療法とは異なる療法を投与される。
ある特定の態様では、本開示は、対象における疾患を処置する方法であって、目的の第1のバリアントが、対象から得た無細胞デオキシリボ核酸(cfDNA)試料中の第1の座にクローンレベルで存在しないという決定に少なくとも部分的に基づいて、対象に1つまたは複数の療法を投与するかまたは投与を中止するステップを含み、決定が、cfDNA試料の複数の配列読み取りデータにアクセスするステップ;複数の配列読み取りデータに基づいて、第1のバリアントが試料中の第1の座で検出されていなかったことを決定するステップ;第1のバリアントがクローンレベルで存在しない確率に基づく第1の尤度値および/または第1のバリアントがクローンレベルで存在する確率に基づく第2の尤度値を生成するステップ;第1の尤度値および/または第2の尤度値に基づいて定量値を決定するステップ;定量値、および/または第1の尤度値および/または第2の尤度値を閾値と比較するステップ;ならびに比較に基づいて、目的の第1のバリアントが第1の座にクローンレベルで存在しないことを決定するステップによって得られる方法を提供する。
ある特定の態様では、本開示は、対象におけるがんを処置する方法であって、第1の標的核酸バリアントが、がんを有する対象から得た無細胞核酸(cfNA)試料中の第1の遺伝子座で検出されないことを決定するステップ;cfNA試料から生成された配列情報から、第1の遺伝子座のカバレッジを決定するステップ;cfNA試料から生成された配列情報から、腫瘍割合を決定するステップ;カバレッジおよび腫瘍割合から、第1の標的核酸バリアントが、cfNA試料中の第1の遺伝子座に存在する確率を決定して定量値を生成するステップ;定量値が閾値と異なれば、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ;ならびに第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないという決定に少なくとも部分的に基づいて、対象に1つまたは複数の療法を投与するかまたは投与を中止し、それによって対象におけるがんを処置するステップを含む方法を提供する。
ある特定の態様では、本開示は、対象におけるがんを処置する方法であって、第1の標的核酸バリアントが、がんを有する対象から得た無細胞デオキシリボ核酸(cfDNA)試料中の第1の遺伝子座に存在しないという決定に少なくとも部分的に基づいて対象に1つまたは複数の療法を投与するかまたは投与を中止するステップを含み、決定が、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座で検出されないことを決定するステップ;cfNA試料から生成された配列情報から、第1の遺伝子座のカバレッジを決定するステップ;cfNA試料から生成された配列情報から腫瘍割合を決定するステップ;カバレッジおよび腫瘍割合から、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在する確率を決定して定量値を生成するステップ;および定量値が閾値と異なれば、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップによって得られる方法を提供する。
ある特定の態様では、本開示は、対象における疾患を処置する方法であって、第1の標的核酸バリアントが対象から得た無細胞核酸(cfNA)試料中に検出されないことを決定して、第1の試験結果を生成するステップ;少なくとも第2の標的核酸バリアントが対象から得たcfNA試料中に検出されることを決定して、第2の試験結果を生成するステップ;第2の試験結果が与えられると、第1の標的核酸バリアントがcfNA試料中に存在しない第1の確率、および/または第2の試験結果が与えられると、第1の標的核酸がcfNA試料中に存在する第2の確率を決定するステップ;第1の確率、第2の確率、および/またはその比を使用して定量値を生成するステップ;定量値が閾値と異なれば、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ;ならびに第1の標的核酸バリアントが第1の遺伝子座に存在しないという決定に少なくとも部分的に基づいて、対象に1つまたは複数の療法を投与するかまたは投与を中止し、それによって対象における疾患を処置するステップを含む方法を提供する。
ある特定の態様では、本開示は、対象における疾患を処置する方法であって、第1の標的核酸バリアントが、対象から得た無細胞核酸(cfNA)試料中の第1の遺伝子座に存在しないという決定に少なくとも部分的に基づいて、対象に1つまたは複数の療法を投与するかまたは投与を中止するステップを含み、決定が、第1の標的核酸バリアントが対象から得たcfNA試料中に検出されないことを決定して、第1の試験結果を生成するステップ;少なくとも第2の標的核酸バリアントが対象から得たcfNA試料中に検出されることを決定して、第2の試験結果を生成するステップ;第2の試験結果が与えられると、第1の標的核酸バリアントがcfNA試料中に存在しない第1の確率および/または第2の試験結果が与えられると、第1の標的核酸がcfNA試料中に存在する第2の確率を決定するステップ;第1の確率、第2の確率、および/またはその比を使用して定量値を生成するステップ;ならびに定量値が閾値と異なれば、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップによって得られる方法を提供する。
ある特定の態様では、本開示は、対象におけるがんを処置する方法であって、第1の標的核酸バリアントが、所定のがんの型を有する対象から得た無細胞核酸(cfNA)試料中の第1の遺伝子座に存在しないことを決定するステップ;少なくとも1つの腫瘍割合に基づく値を生成するステップ;少なくとも1つの相互排他性値を生成するステップ;腫瘍割合値および/または相互排他性値を使用して、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないことを決定するステップ;ならびに第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座に存在しないという決定に少なくとも部分的に基づいて、対象に1つまたは複数の療法を投与するかまたは投与を中止して、それによって対象におけるがんを処置するステップを含む方法を提供する。
ある特定の態様では、本開示は、対象におけるがんを処置する方法であって、第1の標的核酸バリアントが、所定のがんの型を有する対象から得た無細胞核酸(cfNA)試料中の第1の遺伝子座に存在しないという決定に少なくとも部分的に基づいて、対象に1つまたは複数の療法を投与するかまたは投与を中止するステップを含み、決定が、第1の標的核酸バリアントが、対象から得たcfNA試料中に検出されないことを決定するステップ;少なくとも1つの腫瘍割合に基づく値を生成するステップ;少なくとも1つの相互排他性値を生成するステップ;ならびに腫瘍割合に基づく値および/または相互排他性値を使用して、第1の標的核酸バリアントが、cfNA試料中の第1の遺伝子座に存在しないことを決定するステップによって得られる方法を提供する。
本開示の方法の様々なステップ、または本明細書に開示されるシステムによって実行されるステップは、同時または異なる時期に、同じまたは異なる地理的場所で、例えば国で、および/または同じまたは異なる人々によって実行されてもよい。
図1は、本開示の実施形態に従う、対象の試料中の標的バリアントの陰性予測を生成するためのシステムの例を例証する。
図2は、一実施形態に従う陰性予測アナライザーの入力および出力の概略図を例証する。
図3は、本開示の一実施形態に従う対象の試料中の標的バリアントの陰性予測を生成する方法の例を例証する。
図4Aは、一実施形態に従って、標的バリアント(その標的バリアント)が試料中に存在しない(またはサブクローンMAFに存在する)という試験仮説のグラフを例証する。
図4Bは、一実施形態に従って標的バリアントが試料中に存在するという帰無仮説のグラフを例証する。
定義
本開示をより容易に理解するために、ある特定の用語を最初に以下に定義する。以下の用語および他の用語に関する追加の定義は、本明細書を通して記載され得る。以下に記載される用語の定義が、参照により本明細書に組み込まれる特許出願または交付された特許の定義と一貫しない場合、本出願に記載した定義を、用語の意味を理解するために使用すべきである。
本明細書および添付の特許請求の範囲で使用される場合、単数形「1つの」、「1つの(an)」、および「その」は、本文が明白にそれ以外を示していない限り複数形を含む。このように、例えば、「1つの方法」という言及は、本明細書に記載される型の、および/または本開示を読むことによって当業者に明らかとなる、1つまたは複数の方法および/またはステップを含む。本開示で考察される温度、濃度、時間、塩基または塩基対の数、カバレッジ等の前には暗示的な「約」が存在し、わずかなおよび実質的でない等価物が本開示の範囲内であるとも認識される。本出願では、単数形の使用は、それ以外であることを具体的に述べていない限り複数形を含む。同様に、「含む」、「含む(comprises)」、「含む(comprising)」、「含有する」、「含有する(contains)」、「含有する(containing)」、「含む(include)」、「含む(includes)」、および「含む(including)」の使用は、限定的ではないと意図される。
本明細書で使用される用語法は、特定の実施形態を説明する目的に限られ、限定的でないと意図されるとも理解される。さらに、それ以外であると定義していない限り、本明細書で使用される全ての化学技術用語は、本開示が属する当業者によって一般的に理解される意味と同じ意味を有する。方法、コンピュータ可読媒体、およびシステムを説明するおよび特許請求する場合、以下の用語およびその文法的変化形は、以下に記載される定義に従って使用される。
約:本明細書で使用される場合、「約」または「およそ」は、目的の1つまたは複数の値または要素に適用される場合、記載の参照値または要素と類似である値または要素を指す。ある特定の実施形態では、用語「約」または「およそ」は、それ以外であることを記載していない限り、または本文からそれ以外であることが明白でない限り(そのような数が、可能性がある値または要素の100%を超える場合を除く)、記載の参照値または要素のいずれかの方向(より大きいまたはより小さい)の25%以内、20%以内、19%以内、18%以内、17%以内、16%以内、15%以内、14%以内、13%以内、12%以内、11%以内、10%以内、9%以内、8%以内、7%以内、6%以内、5%以内、4%以内、3%以内、2%以内、1%以内、またはそれ未満内に入る値または要素の範囲を指す。
アダプター:本明細書で使用される場合、「アダプター」は、典型的に少なくとも部分的に二本鎖であり、所定の試料核酸分子のいずれかまたは両方の末端を連結するために使用される短い核酸(例えば、長さが約500ヌクレオチド未満、約100ヌクレオチド未満、または約50ヌクレオチド未満)を指す。アダプターは、両方の末端でアダプターが隣接する核酸分子の増幅を可能にするための核酸プライマー結合部位、および/または配列決定応用、例えば様々な次世代配列決定(NGS)応用のためのプライマー結合部位を含む、配列決定プライマー結合部位を含むことができる。アダプターはまた、フローセル支持体またはその他に結合したオリゴヌクレオチドなどの捕捉プローブのための結合部位も含み得る。アダプターはまた、本明細書に記載される核酸タグを含み得る。核酸タグは、典型的に、核酸タグが所定の核酸分子のアンプリコンおよび配列決定読み取りデータに含まれるように、増幅プライマーおよび配列決定プライマー結合部位と相対して位置する。同じまたは異なる配列のアダプターを、核酸分子のそれぞれの末端に連結することができる。ある特定の実施形態では、同じ配列のアダプターを、核酸タグのその配列が異なる場合を除き、核酸分子のそれぞれの末端に連結する。一部の実施形態では、アダプターはY型アダプターであり、これは、同様に平滑末端であるかまたは1つもしくは複数の相補的ヌクレオチドのテールを有する核酸分子に結合するために、本明細書に記載されるように1つの末端が平滑末端であるかまたはテールを有する。なお他の例示的な実施形態では、アダプターは、解析される核酸分子に結合するための平滑末端またはテールを有する末端を含むベル型アダプターである。他の例示的なアダプターは、T-テールおよびC-テールアダプターを含む。
投与する:本明細書で使用される場合、治療剤(例えば、免疫療法剤)を対象に「投与する」、または「投与すること」は、組成物を対象に与える、適用するまたは対象に接触させることを意味する。投与は、例えば局所、経口、皮下、筋肉内、腹腔内、静脈内、髄腔内、および皮内を含む任意の複数の経路によって達成することができる。
対立遺伝子:本明細書で使用される場合、「対立遺伝子」または「対立遺伝子バリアント」は、定義されたゲノム位置または座での特定の遺伝子バリアントを指す。対立遺伝子バリアントは通常、対立遺伝子がヘテロ接合であるかまたはホモ接合であるかに応じて、50%(0.5)または100%の頻度で存在する。例えば、生殖系列バリアントは、受け継がれ、通常0.5または1の頻度を有する。しかし、体細胞バリアントは後天性のバリアントであり、通常<0.5の頻度を有する。遺伝子座のメジャーおよびマイナー対立遺伝子はそれぞれ、座が参照配列のヌクレオチドおよび参照配列とは異なるバリアントヌクレオチドによって占有される座を有する核酸を指す。座での測定は、対立遺伝子の割合(AF)の形態をとることができ、これは対立遺伝子が試料において観察される頻度を測定する。
増幅する:本明細書で使用される場合、核酸の文脈における「増幅する」または「増幅」は、典型的に少量のポリヌクレオチド(例えば単一のポリヌクレオチド分子)から始まるポリヌクレオチドまたはポリヌクレオチドの一部の複数のコピーの産生を指し、増幅産物またはアンプリコンは一般的に検出可能である。ポリヌクレオチドの増幅は、多様な化学および酵素的プロセスを包含する。
バーコード:本明細書で使用される場合、核酸の文脈における「バーコード」は、分子識別子として作用することができる配列を有する核酸分子を指す。例えば、個々の「バーコード」配列は典型的に、各々の読み取りデータを最終データ解析前に特定し、選別することができるように、次世代配列決定(NGS)ライブラリ調製の間に各DNA断片に付加される。
がんの型:本明細書で使用される場合、「がん」、「がんの型」、または「腫瘍の型」は、例えば組織病理学によって定義されるがんの型または亜型を指す。がんの型は、任意の従来の基準によって、例えば所定の組織における発生(例えば、血液のがん、中枢神経系(CNS)、脳のがん、肺がん(小細胞および非小細胞)、皮膚がん、鼻のがん、喉のがん、肝臓がん、骨がん、リンパ腫、膵臓がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、乳がん、前立腺がん、卵巣がん、肺がん、腸がん、軟部組織がん、神経内分泌がん、胃食道がん、頭頸部がん、婦人科がん、結腸直腸がん、尿路上皮がん、固形状態のがん、不均一ながん、均一ながん)、不明な原発起源およびその他、および/または同じ細胞系列のがん(例えば、癌腫、肉腫、リンパ腫、胆管癌、白血病、中皮腫、黒色腫、または膠芽腫)、および/またはがんマーカー、例えばHer2、CA15-3、CA19-9、CA-125、CEA、AFP、PSA、HCG、KRAS、BRAF、NRAS、ホルモン受容体およびNMP-22を示すがんに基づいて定義することができる。がんはまた、ステージ(例えば、ステージ1、2、3、または4)および原発であるか二次起源であるかによっても分類することができる。
無細胞核酸:本明細書で使用される場合、「無細胞核酸」は、細胞内に含有されていない、またはそれ以外の方法で細胞に結合していない核酸を指す。無細胞核酸は、例えば対象からの体液(例えば、血液、血漿、血清、尿、脳脊髄液(CSF)等)を起源とする全ての非カプセル化核酸を含み得る。無細胞核酸は、例えばゲノムDNA、ミトコンドリアDNA、循環DNA、siRNA、miRNA、循環RNA(cRNA)、tRNA、rRNA、低分子核RNA(snoRNA)、Piwi相互作用RNA(piRNA)、長い非コードRNA(長いncRNA)、および/またはこれらの任意の断片を含む、DNA(cfDNA)、RNA(cfRNA)、およびそのハイブリッドを含む。無細胞核酸は二本鎖、一本鎖、またはそのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば細胞壊死、アポトーシス、またはその他を通して体液に放出され得る。一部の無細胞核酸、例えば循環腫瘍DNA(ctDNA)は、がん細胞から体液に放出される。その他は健康な細胞から放出される。ctDNAは、非カプセル化腫瘍由来断片化DNAであり得る。無細胞核酸の別の例は、母親の血流中を自由に循環する胎児DNAであり、同様に無細胞胎児DNA(cffDNA)と呼ばれる。無細胞核酸は、1つまたは複数のエピジェネティック改変を有することができ、例えば無細胞核酸はアセチル化、5-メチル化、ユビキチン化、リン酸化、スモイル化、リボシル化、および/またはシトルリン化され得る。
クローン性:本明細書で使用される場合、「クローン性」は、少なくとも目的の所定の座で互いに実質的または完全に同一である(例えば、標的バリアント)ヌクレオチド配列を含む核酸集団を指す。
信頼区間:本明細書で使用される場合、「信頼区間」または「信頼レベル」は、所定のパラメータの値が値のその範囲内にある指定された確率が存在するように定義される値の範囲を意味する。
コピー数バリアント:本明細書で使用される場合、「コピー数バリアント」、「CNV」、または「コピー数多型」は、ゲノムの区分が反復され、ゲノムにおける反復配列の数が検討中の集団の個体間で異なる現象を指す。
カバレッジ:本明細書で使用される場合、「カバレッジ」は、特定の塩基位置を表す核酸分子の数を指す。
デオキシリボ核酸またはリボ核酸:本明細書で使用される場合、「デオキシリボ核酸」または「DNA」は、糖部分の2’位で水素基を有する天然または改変ヌクレオチドを指す。DNAは典型的には、各々が4つの型の核酸塩基、すなわちアデニン(A)、チミン(T)、シトシン(C)、およびグアニン(G)のうちの1つを含むデオキシリボヌクレオシドを含むヌクレオチドの鎖を含む。本明細書で使用される場合、「リボ核酸」または「RNA」は、糖部分の2’位にヒドロキシル基を有する天然または改変ヌクレオチドを指す。RNAは典型的に、各々が4つの型の核酸塩基、すなわちA、ウラシル(U)、G、およびCのうちの1つを含むリボヌクレオシドを含むヌクレオチドの鎖を含む。本明細書で使用される場合、用語「ヌクレオチド」は、天然のヌクレオチドまたは改変ヌクレオチドを指す。ヌクレオチドのある特定の対は相補的に互いに特異的に結合する(相補的塩基対形成と呼ばれる)。DNAでは、アデニン(A)は、チミン(T)と対を形成し、シトシン(C)はグアニン(G)と対を形成する。RNAでは、アデニン(A)はウラシル(U)と対を形成し、シトシン(C)はグアニン(G)と対を形成する。第1の核酸鎖が、第1の鎖におけるヌクレオチドと相補的であるヌクレオチドで構成される第2の核酸鎖に結合する場合、2つの鎖は結合して二本鎖を形成する。本明細書で使用される場合、「核酸配列決定データ」、「核酸配列決定情報」、「配列情報」、「核酸配列」、「ヌクレオチド配列」、「ゲノム配列」、「遺伝子配列」、または「断片配列」、または「核酸配列決定読み取りデータ」は、DNAまたはRNAなどの核酸の分子(例えば、ゲノム全体、全トランスクリプトーム、エクソーム、オリゴヌクレオチド、ポリヌクレオチド、または断片)中のヌクレオチド塩基(例えば、アデニン、グアニン、シトシン、およびチミン、またはウラシル)の順序および同一性を示す任意の情報またはデータを示す。本教示は、キャピラリー電気泳動、マイクロアレイ、ライゲーションに基づくシステム、ポリメラーゼに基づくシステム、ハイブリダイゼーションに基づくシステム、直接または間接的ヌクレオチド同定システム、パイロシーケンシング、イオンまたはpHに基づく検出システム、および電子シグネチャーに基づくシステムを含むがこれらに限定されない全ての利用可能な多様な技術、プラットフォーム、またはテクノロジーを使用して得られた配列情報を企図すると理解すべきである。
検出する:本明細書で使用される場合、「検出する」、「検出する(detecting)」、または「検出」は、試料中の1つまたは複数の標的核酸(例えば、標的化突然変異または他のマーカーを有する核酸)の実在または存在を決定する行為を指す。
ドライバー突然変異:本明細書で使用される場合、「ドライバー突然変異」は、がんの進行を促進する突然変異を意味する。
過去の有病率:本明細書で使用される場合、「過去の有病率」は、1つまたは複数の参照試料(例えば、所定のがんの型を有する参照対象からの)および/または所定の対象から得た配列情報またはそれに由来するデータを指す。
免疫療法:本明細書で使用される場合、「免疫療法」は、がん細胞を殺滅するまたはその成長を少なくとも阻害するために、好ましくはがんのさらなる成長を低減するために、がんのサイズを低減するために、および/またはがんを消滅させるために、免疫系を刺激するように作用する1つまたは複数の作用剤による処置を指す。一部のそのような作用剤は、がん細胞上に存在する標的に結合するが、一部は、免疫細胞に存在するががん細胞には存在しない標的に結合し、一部は、がん細胞および免疫細胞の両方に存在する標的に結合する。そのような作用剤としては、チェックポイント阻害剤および/または抗体が挙げられるがこれらに限定されない。チェックポイント阻害剤は、自己寛容を維持し、末梢組織における生理的免疫応答の持続および大きさをモジュレートして側副組織損傷を最小限にする免疫系の経路の阻害剤である(例えば、Pardoll, Nature Reviews Cancer 12, 252-264 (2012)を参照されたい)。例としての作用剤としては、PD-1、PD-2、PD-L1、PD-L2、CTLA-4、OX40、B7.1、B7He、LAG3、CD137、KIR、CCR5、CD27、CD40、またはCD47のいずれかに対する抗体が挙げられる。他の例示的な作用剤としては、炎症促進性サイトカイン、例えばIL-1β、IL-6、およびTNF-αが挙げられる。他の例示的な作用剤は、腫瘍に対して活性化されるT細胞、例えばT細胞によって認識される腫瘍抗原を標的化するキメラ抗原を発現することによって活性化されるT細胞である。
インデル:本明細書で使用される場合、「インデル」は、対象のゲノムにおけるヌクレオチド位置の挿入または欠失を伴う突然変異を指す。
対数事前データ:本明細書で使用される場合、「対数事前データ」は、試料集団における核酸バリアント(単数または複数)または突然変異体(単数または複数)(例えば、標的核酸バリアント(単数または複数)または突然変異(単数または複数))の野生型バリアントに対する比の対数を指す。
最大突然変異体対立遺伝子頻度:本明細書で使用される場合、「最大突然変異体対立遺伝子頻度」、「最大MAF」、または「MAX MAF」は、所定の試料中に存在するかまたは観察される全ての体細胞バリアントの最大または最も大きいMAFを指す。
突然変異体対立遺伝子頻度:本明細書で使用される場合、「突然変異体対立遺伝子頻度」、または「MAF」は、突然変異体対立遺伝子が、対象から得た試料などの核酸の所定の集団に起こる頻度を指す。MAFは一般的に割合またはパーセンテージとして表記される。
突然変異:本明細書で使用される場合、「突然変異」、「バリアント」、または「遺伝子異常」は、公知の参照配列からの多形を指し、例えば、一ヌクレオチドバリアント(SNV)、コピー数バリアントまたは多型(CNV)/異常、挿入、または欠失(インデル)、トランケーション、遺伝子融合、トランスバージョン、転座、フレームシフト、重複、反復増殖、およびエピジェネティックバリアントなどの突然変異を含む。突然変異は、生殖系列または体細胞突然変異であり得る。一部の実施形態では、比較目的のための参照配列は、試験試料を提供する対象の種の野生型ゲノム配列、典型的にはヒトゲノムである。
次世代配列決定:本明細書で使用される場合、「次世代配列決定」または「NGS」は、従来のサンガーおよびキャピラリー電気泳動に基づくアプローチと比較して増加した処理能力、例えば何十万もの比較的小さい配列読み取りデータを一度に生成する能力を有する配列決定テクノロジーを指す。次世代配列決定技術の一部の例としては、合成による配列決定、ライゲーションによる配列決定、およびハイブリダイゼーションによる配列決定が挙げられるがこれらに限定されない。
核酸タグ:本明細書で使用される場合、「核酸タグ」は、異なる試料からの核酸(例えば、試料インデックスを表す)、または異なる型のもしくは異なる処理を受けている同じ試料中の異なる核酸分子(例えば、分子タグを表す)を区別するために核酸分子を標識するために使用される短い核酸(例えば約500ヌクレオチド長未満、約100ヌクレオチド長未満、約50ヌクレオチド長未満、または約10ヌクレオチド長未満)を指す。核酸タグは、一本鎖、二本鎖、または少なくとも部分的二本鎖であり得る。核酸タグは、必要に応じて同じ長さまたは異なる長さを有する。核酸タグはまた、1つまたは複数の平滑末端を有する二本鎖分子も含み得て、5’または3’一本鎖領域(例えば、オーバーハング)を含み得て、および/または所定の分子内の他の位置に1つまたは複数の他の一本鎖領域を含み得る。核酸タグは、他の核酸(例えば、増幅および/または配列決定される試料核酸)の1つの末端または両方の末端に結合させることができる。核酸タグを復号して、所定の核酸の起源の試料、形態、または処理などの情報を明らかにすることができる。核酸タグはまた、異なる核酸タグを有する核酸、および/または核酸タグを読み取ることによって核酸がその後デコンボリュートされる試料インデックスを有する核酸を含む複数の試料のプーリングおよび/または並列処理を可能にするためにも使用することができる。核酸タグはまた、分子識別子またはタグ、試料識別子、インデックスタグ、および/またはバーコードとも呼ぶことができる。加えてまたはあるいは、核酸タグを使用して、同じ試料中の異なる分子を区別することができる。これは、例えば所定の試料中の各々の異なる核酸分子を一意的にタグ付けするステップ、またはそのような分子を非一意的にタグ付けするステップを含む。非一意的にタグ付けする応用の場合、限定数の異なる配列を有するタグを使用して各核酸分子をタグ付けすることができ、それによって異なる分子を、例えばそれらが少なくとも1つの核酸タグと組み合わせて選択された参照ゲノムにマッピングする開始および/または停止コドン位置に基づいて区別することができる。典型的に、任意の2つの分子が同じ開始/停止位置を有し、同様に同じ核酸タグを有する確率が低くなる(例えば、約10%未満、約5%未満、約1%未満、または約0.1%未満の見込み)ように、十分数の異なる核酸タグを使用する。一部の核酸タグは、試料、試料内の核酸分子の形態、ならびに同じ開始および停止位置を有する形態内の核酸分子を標識するために複数の分子識別子を含む。そのような核酸タグは、例示的な形態「A1i」を使用して参照することができ、ここで大文字は試料の型を示し、アラビア数字は試料内の分子の形態を示し、小文字のローマ数字は形態内の分子を示す。
ポリヌクレオチド:本明細書で使用される場合、「ポリヌクレオチド」、「核酸」、「核酸分子」、または「オリゴヌクレオチド」は、ヌクレオシド間連結によって結合したヌクレオシド(デオキシリボヌクレオシド、リボヌクレオシドまたはそのアナログを含む)の線形ポリマーを指す。典型的に、ポリヌクレオチドは、少なくとも3つのヌクレオシドを含む。オリゴヌクレオチドは、しばしばサイズが少数の単量体単位、例えば3~4個から数百個の単量体単位までの範囲である。ポリヌクレオチドが「ATGCCTG」などの文字列によって表される場合は常に、ヌクレオチドは左から右に5’→3’の順であると理解され、DNAの場合、それ以外であることが示されていない限り、「A」は、デオキシアデノシンを示し、「C」はデオキシシチジンを示し、「G」はデオキシグアノシンを示し、および「T」は、デオキシチミジンを示す。文字A、C、G、およびTは、当技術分野で標準であるように、塩基そのもの、ヌクレオシド、または塩基を含むヌクレオチドを指すために使用され得る。
参照試料:本明細書で使用される場合、「参照試料」または「参照cfNA試料」は、解析手順の精度を評価するために試験試料と共にまたは試験試料と比較して解析される、公知の組成の、および/または特定の特性(例えば、公知の核酸バリアント(単数または複数)、公知の細胞起源、公知の腫瘍割合、公知のカバレッジ、および/またはその他)を有するまたは有することが公知であるもしくは欠如する試料を指す。参照試料データセットは、典型的に少なくとも約25~少なくとも約30,000個またはそれより多くの参照試料を含む。一部の実施形態では、参照試料データセットは、約50、75、100、150、200、300、400、500、600、700、800、900、1,000、2,500、5,000、7,500、10,000、15,000、20,000、25,000、50,000、100,000、1,000,000個、またはそれより多くの参照試料を含む。
参照配列:本明細書で使用される場合、「参照配列」、または「参照ゲノム」は、経験的に決定された配列との比較目的のために使用される公知の配列を指す。例えば、公知の配列は、全ゲノム、染色体、またはその任意のセグメントであり得る。参照配列は典型的に、少なくとも約20個、少なくとも約50個、少なくとも約100個、少なくとも約200個、少なくとも約250個、少なくとも約300個、少なくとも約350個、少なくとも約400個、少なくとも約450個、少なくとも約500個、少なくとも約1000個、またはそれより多くのヌクレオチドを含む。参照配列は、ゲノムもしくは染色体の単一の連続する配列と整列することができ、またはゲノムもしくは染色体の異なる領域と整列する不連続なセグメントを含み得る。例示的な参照配列は、例えばヒトゲノム、例えばhG19およびhG38を含む。
試料:本明細書で使用される場合、「試料」は、本明細書に開示される方法および/またはシステムによって解析することが可能な任意のものを意味する。
感度:本明細書で使用される場合、所定のアッセイまたは方法の文脈における「感度」は、アッセイまたは方法が、標的検体(例えば、核酸バリアント)と非標的検体との間を検出および区別する能力を指す。
配列決定:本明細書で使用される場合、「配列決定」は、生体分子、例えばDNAまたはRNAなどの核酸の配列(例えば、単量体単位の同一性および順序)を決定するために使用される複数のテクノロジーのいずれかを指す。例示的な配列決定方法としては、標的化配列決定、単分子リアルタイム配列決定、エクソンまたはエクソーム配列決定、イントロン配列決定、電子顕微鏡に基づく配列決定、パネル配列決定、トランジスター媒介配列決定、直接配列決定、ランダムショットガン配列決定、サンガージデオキシターミネーション配列決定、全ゲノム配列決定、ハイブリダイゼーションによる配列決定、パイロシーケンシング、キャピラリー電気泳動、二本鎖配列決定、サイクル配列決定、一塩基伸長配列決定、固相配列決定、ハイスループット配列決定、超並列シグネチャー配列決定、エマルジョンPCR、低変性温度での同時増幅-PCR(COLD-PCR)、マルチプレックスPCR、可逆性色素ターミネーターによる配列決定、ペアエンド配列決定、ニアターム配列決定、エキソヌクレアーゼ配列決定、ライゲーションによる配列決定、ショートリード配列決定、単分子配列決定、合成による配列決定、リアルタイム配列決定、リバース-ターミネーター配列決定、ナノポア配列決定、454配列決定、Solexa Genome Analyzer配列決定、SOLiD(商標)配列決定、MS-PET配列決定、およびその組合せが挙げられるがこれらに限定されない。一部の実施形態では、配列決定は、遺伝子アナライザー、例えば他の多くの中でもIllumina,Inc.、Pacific Biosciences,Inc.、またはApplied Biosystems/Thermo Fisher Scientificから市販されている遺伝子アナライザーによって実施され得る。
配列情報:本明細書で使用される場合、核酸ポリマーの文脈における「配列情報」は、そのポリマーにおける単量体単位(例えば、ヌクレオチド等)の順序および同一性を意味する。
一ヌクレオチドバリアント:本明細書で使用される場合、「一ヌクレオチドバリアント」または「SNV」は、ゲノムにおける特定の位置で起こる単一のヌクレオチドの突然変異または多型を意味する。
体細胞突然変異:本明細書で使用される場合、「体細胞突然変異」は、妊娠後に起こるゲノムにおける突然変異を意味する。体細胞突然変異は、生殖細胞を除く体の任意の細胞で起こり得て、したがって子孫に受け継がれない。
特異度:本明細書で使用される場合、診断解析またはアッセイの文脈における「特異度」は、解析またはアッセイが意図される標的検体を、所定の試料の他の成分を除外するように検出する程度を指す。
サブクローン性:本明細書で使用される場合、核酸の文脈における「サブクローン性」は、少なくとも目的の所定の座(例えば、標的バリアント)で互いに実質的または完全に同一であるヌクレオチド配列を含む核酸の亜集団を指す。
対象:本明細書で使用される場合、「対象」、または「試験対象」は、動物、例えば哺乳動物種(例えば、ヒト)または鳥類(例えば、トリ)種、または他の生物、例えば植物を指す。より具体的には、対象は、脊椎動物、例えば、哺乳動物、例えばマウス、霊長類、サル、またはヒトであり得る。動物は、農場動物(例えば、肉牛、乳牛、家禽、ウマ、ブタ、およびその他)、競技用動物、コンパニオン動物(例えば、ペットまたは介助用動物)を含む。対象は、健康な個体、疾患を有するもしくは疾患に対する素因を有するもしくは有することが疑われる個体、または療法を必要とするもしくは療法を必要とすることが疑われる個体であり得る。用語「個体」、または「患者」は、「対象」と互換的であると意図される。一部の実施形態では、対象は、がんを有するまたはがんを有することが疑われるヒトである。例えば、対象は、がんを有すると診断されている、がんの療法を受ける予定である、および/または少なくとも1つのがんの療法を受けたことがある個体であり得る。対象は、がんの寛解状態にあり得る。別の例として、対象は、自己免疫疾患を有すると診断された個体であり得る。別の例として、対象は、疾患、例えばがん、自己免疫疾患を有すると診断されていてもよいまたは有することが疑われていてもよい、妊娠中のまたは妊娠を計画している雌性の個体であり得る。
閾値:本明細書で使用される場合、「閾値」は、実験によって決定された値を特徴付けるまたは分類するために使用される個別に決定された値を指す。ある特定の実施形態では、例えば、「閾値」は、所定の標的核酸バリアントが所定の遺伝子座に存在しないことを決定するために定量値が比較される選択された値を指す。
腫瘍割合:本明細書で使用される場合、「腫瘍割合」は、所定の試料中の腫瘍に由来する核酸分子の割合の推定値を指す。例えば、試料の腫瘍割合は、試料の最大突然変異体対立遺伝子頻度(MAX MAF)もしくは試料のカバレッジ、または試料中のcfNA断片の長さ、エピジェネティック状態、もしくは他の特性、または試料の他の任意の選択された特色に由来する測定値であり得る。用語「MAX MAF」は、所定の試料中に存在する全ての体細胞バリアントの最大または最も大きいMAFを指す。一部の実施形態では、試料の腫瘍割合は、試料のMAX MAFに等しい。
値:本明細書で使用される場合、「値」は、一般的に値が指す特色を特徴付ける任意のものであり得るデータセットにおけるエントリーを指す。これには、数字、言葉または語句、記号(例えば+または-)または程度が挙げられるがこれらに限定されない。
詳細な説明
図1は、本開示の実施形態に従う対象111の試料中の標的バリアントの陰性予測を生成するためのシステム100の例を例証する。システム100は、対象111からの1つまたは複数の試料101を処理して、バリアントの検出および陰性予測のための配列読み取りデータを生成し得る。システム100は、研究所のシステム102、コンピュータシステム110、および/または他の構成成分を含み得る。研究所のシステム102およびコンピュータシステム110は、互いに遠隔であってもよく、互いにコンピュータネットワークによって接続されていてもよい(例示していない)ことに注意すべきである。研究所のシステム102は、試料の収集および調製パイプライン103、配列決定パイプライン105、配列読み取りデータのデータストア109、および/または他の構成成分を含み得る。配列決定パイプライン105は、1つまたは複数の配列決定デバイス107(図1に配列決定デバイス107a...nとして例証する)を含み得る。
コンピュータシステム110は、配列解析パイプライン112、プロセッサー120、保存デバイス122、バリアント検出パイプライン130、および/または他の構成成分を含み得る。
配列解析パイプライン112は、研究所のシステム102からの配列読み取りデータをトリミングするまたは捨てることができる配列品質管理(QC)構成成分113、参照ゲノムとの予備的アライメントを実施し得る他の解析構成成分115、および解析構成成分115の出力に対する品質管理を実施し得る解析QC構成成分116を含み得る。出力、例えば配列解析パイプライン112からの対象111の試料101の配列読み取りデータは、解析データストア117において保存され得る。
一般的に言って、プロセッサー120は、バリアント検出パイプライン130の様々な構成成分、例えばバリアント検出器132、陰性予測アナライザー134、および/または他の構成成分をインプリメントし得る(それによってプログラムされ得る)。あるいは、バリアント検出パイプライン130のこれらの構成成分の各々は、ハードウェアモジュールを含み得ることに注意すべきである。便宜上個別に例証するが、様々な構成成分または命令の1つまたは複数、例えばバリアント検出器132および陰性予測アナライザー134は、互いに組み込まれてもよい。いずれにせよ、バリアント検出パイプライン130によって、コンピュータシステム110は、バリアント、バリアントに由来する疾患(精密診断)、陰性予測、および/または処置レジメンを特定し得る。精密診断および処置レジメンは、臨床結果ストア160または診断結果ストア150などのリポジトリに保存され得る。
バリアント検出器132は、標的バリアントが、研究所システム102からの配列読み取りデータの解析に基づいて検出されていなかったことを決定してもよい。少なくとも1つの配列読み取りデータおよび/または配列決定される少なくとも1つの分子が、標的バリアントを立証し得るが、これはバリアント検出器132が標的バリアントを検出するためには十分ではないことに注意すべきである。例として、一部の実施形態では、バリアント検出器132は、標的バリアントを立証する配列読み取りデータの数(および/または配列決定される分子の数)が閾値より多い場合に限って標的バリアントを検出し得る。加えてまたはあるいは、バリアント検出器132は、配列読み取りデータおよび/または配列決定される分子によって立証される標的バリアントが品質閾値を満たす場合に限って標的バリアントを検出し得る。少なくとも1つの配列読み取りデータおよび/または配列決定される少なくとも1つの分子によって立証されるが、閾値を満たさない標的バリアントは、このため一部の実施形態では偽陽性として無視されることがあり、バリアント検出器132によって検出されないことがある。標的バリアントが配列読み取りデータの解析に基づいて検出されていなかったことを決定する他の方法を使用してもよいが、この決定を行うためのさらなる詳細は、明快にするために省略する。
陰性予測アナライザー134は、バリアント検出器132の出力にアクセスして、バリアント検出器に対するアドオンとして陰性予測を確認し得る。あるいはまたは加えて、陰性予測アナライザー134は、バリアント検出器132と共に組み込まれてもよい。
図2は、一実施形態に従う陰性予測アナライザー134の例示的な入力および出力の概略図を例証する。陰性予測アナライザー134は、共変量情報202、標的部位でのカバレッジ情報204、疾患の型206、および/または有意性モデリングのための他の入力情報を使用してもよい。陰性予測アナライザー134は、陰性予測が正しいか否かの尤度を表し得る定量値出力210および定量値出力210に基づく信頼レベルまたは精密診断を含み得る陰性予測評価212を生成し得る。
例えば、研究所のシステム102からの配列読み取りデータを、参照ゲノム、特に参照ゲノムにおける様々な座と整列させて、共変量情報202を決定してもよい。共変量情報202は、バリアントの過去の相互排他性データおよび/または同時発生データを含み得る共変性バリアント情報を含み得る。共変量バリアントは、研究所のシステム102からの配列データおよび/または他のデータソースの過去の観察に基づいて、互いに負の相関(相互排他性)または正の相関(同時発生)を有する2つまたはそれより多くのバリアントを指し得る。例えば、相互排他性バリアントは、互いに観察されない傾向があるバリアントを含み得る。同時発生バリアントは、ドライバーバリアント突然変異とその同時発生バリアントなどの、別のバリアントが観察される場合に起こることが観察され得る。
特定の例では、有意性モデリングは、試料から生成された核酸配列読み取りデータに基づいて、標的バリアントの腫瘍割合(TF)のコンピュータによる推定値を生成して使用してもよい。あるいはまたは加えて、有意性モデリングは、試料中に検出されるまたは検出されない他のバリアントの多様性を決定して使用してもよい。例えば、有意性モデリングは、通常(過去の共変性バリアント情報に基づいて)、標的バリアントと同時発生する共変性バリアント、または通常(過去の共変性バリアント情報に基づいて)、標的バリアントと同時発生しない相互排他性バリアントの検出を使用してもよい。陰性予測値(「NPV」)は、試料中に検出されるまたは検出されないバリアントのTF推定値および/または多様性に基づいて生成され得る。結果を使用して負の診断における信頼レベルを提供してもよく、および/または負の診断に基づいて処置計画をさらに誘導してもよい。例えば、がんの診断の文脈では、共変性バリアントは、腫瘍形成を促進する傾向があるドライバーバリアントを含み得て、相互排他性バリアントは腫瘍形成を抑制する傾向がある腫瘍抑制性バリアントを含み得る。
陰性予測
図3は、本開示の一実施形態に従う対象の試料中の標的バリアントの陰性予測を生成するための方法300の例を例証する。
本発明の方法は、目的のバリアントが存在しない(例えば、クローンレベルで存在しない)ことを真の負の結果として決定するために使用することができる。このように、図3を参照して、302では、方法300は、cfDNA試料の複数の配列読み取りデータにアクセスするステップを含み得る。304では、方法300は、複数の配列読み取りデータに基づいて、標的バリアント(その標的バリアント)が試料(例えば、cfNA試料)中の第1の座で検出されていなかったことを決定するステップを含み得る。一部の例では、標的バリアント(および/または本明細書に記載される他のバリアント)は、体細胞バリアントを含み得る。一部の例では、標的バリアント(および/または本明細書に記載される他のバリアント)は、生殖系列バリアントを含まなくてもよい。
陰性予測の評価
306では、方法300は、標的バリアントがクローンレベルで存在しない確率に基づく第1の尤度値および標的バリアントがクローンレベルで存在する確率に基づく第2の尤度値を生成するステップを含み得る。308では、方法300は、第1の尤度値および第2の尤度値に基づいて定量値を決定するステップを含み得る。310では、方法300は、定量値を閾値と比較するステップを含み得る。312では、方法300は、比較に基づいて、標的バリアントが第1の座にクローンレベルで存在しないことを決定するステップを含み得る。例えば、方法300は、標的バリアントの対立遺伝子頻度が閾値(例えば、図4Aおよび4Bを参照して記載されるサブクローン性の閾値)を超えないことを決定するステップを含み得る。
腫瘍割合推定値に基づく陰性予測の評価
一部の例では、方法300および/または陰性予測アナライザー134(方法300をインプリメントすることによって)は、試験仮説または代替仮説(H)として、標的バリアントがクローンレベルで存在しない(または腫瘍バリアントのサブクローンレベルで存在する)確率をモデル化して、第1の尤度値を生成し得る。例えば、図4Aは、一実施形態に従って、標的バリアント(その標的バリアント)が試料に存在しない(または腫瘍バリアントのサブクローンレベルで存在する)試験仮説のグラフ400Aを例証する。これに対応して、陰性予測アナライザー134は、帰無仮説((H))として、標的バリアントがクローンレベルで存在する確率をモデル化し、第2の尤度値を生成し得る。例えば、図4Bは、一実施形態に従って標的バリアントが試料中に存在する(および腫瘍バリアントの対立遺伝子頻度と相関する)帰無仮説のグラフ400Bを例証する。両方のグラフ400Aおよび400Bにおいて、「C」は、標的座でのマイナー対立遺伝子を反映する。値「0.3」は、0.3×α1の積がサブクローン性の閾値として作用するようにα1(腫瘍バリアントの突然変異体対立遺伝子頻度に基づくTF推定値)に適用される重みを反映する。サブクローン性の閾値を超える対象111の試料101中の標的バリアントの対立遺伝子頻度(α2)は、標的バリアントが腫瘍バリアントに相関することを示し得る。
これらの例では、陰性予測アナライザー134は、試料の腫瘍割合(TF)推定値(例えば、本明細書に記載される式におけるα)を決定することによって第1の尤度値および第2の尤度値を生成し得る。TF推定値は、試料中に検出される腫瘍DNAの割合を示し得る。一部の例では、TF推定値は、試料中の腫瘍バリアントの対立遺伝子頻度(MAX MAFと呼ばれる)を決定することによって決定され得る。MAX MAFは、複数の配列読み取りデータに基づいて腫瘍バリアントに関連する分子カウントを決定することによって決定され得る。標的バリアントがクローンレベルで存在しない確率(例えば、本明細書に記載される式におけるL)に基づく第1の尤度値、および標的バリアントがクローンレベルで存在するかまたはサブクローンレベルで存在する第2の尤度値(例えば、本明細書に記載される式におけるL)は、TF推定値に基づき得る。
一部の実施形態では、陰性予測アナライザー134は、TF推定値を使用して陰性予測の品質を評価する定量値を生成し得る(例えば、陰性予測が正しいかまたは偽りであるかに関する確率を示すことによって)。例えば、陰性予測アナライザー134は、標的バリアント(その標的バリアント)の第1の対立遺伝子頻度を決定し得る。陰性予測アナライザー134は、複数の配列読み取りデータに基づいて標的バリアントに関連する第1の分子カウントを決定することによって第1の対立遺伝子頻度を決定し得る。陰性予測アナライザー134は、第1の対立遺伝子頻度をMAX MAFと共に使用して、第1の対立遺伝子頻度およびMAX MAFにさらに基づく第1の尤度値および第2の尤度値を決定し得る。
図4Aを参照して、標的バリアントがクローンレベルで存在しない(またはサブクローンレベルで存在する)確率は、サブクローン閾値(0.3α1として例証される)に基づき得る。これは、サブクローン重み(0.3として例証される)に腫瘍割合推定値(腫瘍バリアントのMAX MAFなどの対立遺伝子頻度として例証される)を乗算したものであり得る。サブクローン閾値は、特定の遺伝子、がんの型、または他の予測値に基づいて決定され得る。これらの値は、0.01、0.10、0.20、0.30、0.40、0.50、0.60、0.70、0.80、0.90、および0.99を含むがこれらに限定されない0.01~0.99のいずれかの範囲内であり得る。以下の式1~3は、ある特定の実施形態における第1および第2の尤度値および得られた定量値を生成することに関する。
Figure 2023512239000002
Figure 2023512239000003
Figure 2023512239000004
(全ての可能性がある値の確率の合計)
式1~3を参照して、
は、バリアントがクローンレベルで存在しない試験仮説の尤度値を指す。帰無仮説を、Lに関して同じ式を使用して生成したが、アルファ2は異なる値の範囲を有する(例えば、0.3~1)。
αは、腫瘍バリアントの対立遺伝子頻度を指し、これはTF推定値として使用され得る。
αは、標的バリアント(その標的バリアント)の対立遺伝子頻度を指す。
は、腫瘍バリアントの座での腫瘍バリアントを立証する分子カウントを指す。
は、腫瘍バリアントの座で参照野生型を立証する分子カウントを指す。
’は、標的バリアントの座で標的バリアントを立証する分子カウントを指す。
Mr’は、標的バリアントの座で参照野生型を立証する分子カウントを指す。
εは、TF推定値の誤り率を指す。
ε’は、標的バリアントの誤り率を指す。
誤り率は、典型的に、健康なまたは正常な対象から得た試料から得た配列情報(例えば、zスコアまたはその他)に由来する。
α=t*α(式4)。この式は、単純化する目的のためであるが(式1と同じ)、式1における積分より計算がより容易である。
腫瘍割合におけるεおよびε’誤り率(maxmaf)および標的バリアントはこれに対応して
Figure 2023512239000005
Figure 2023512239000006
である。
イプシロン(ε)は、健康または正常な対象から得た試料から得た配列情報に由来するzスコアの計算から得られる。
以下の式において:
は、標的バリアントがクローンレベルで存在しないことを指す。
は、標的バリアントがクローンレベルで存在することを指す。
は、バリアント(標的以外)が存在することを指す(i=1、…、n、他の全てのコールされたバリアント)。
は、尤度値を指す(基本仮説i=0、試験仮説、i=1)。
他のバリアントの出現に基づいて定量値を調整する
一部の例では、陰性予測アナライザー134は、対象111の試料101中の標的バリアント以外の1つまたは複数のバリアントの存在に基づいて、TF推定値から決定される定量値を調整してもよい。例えば、陰性予測アナライザー134は、cfDNA試料101における少なくとも第2のバリアントの出現を決定し、少なくとも第2のバリアントの出現に基づいて定量値を調整してもよい。
例えば、出現データは、式7および8に従って決定され得る:
Figure 2023512239000007
Figure 2023512239000008
試験仮説が正しい尤度値(L1)を、式9に基づいて調整し、調整された尤度値(L1a)を生成してもよく、尤度比(LR)を、式10に従って生成してもよい:
Figure 2023512239000009
Figure 2023512239000010
式10は、条件従属の特性を使用する尤度比である。
LLRに基づく陰性予測の評価
一部の例では、定量値は、第1の尤度値と第2の尤度値との間のLLRに基づき得る。そのため、定量値は、第1の尤度値(例えば式14のL)と第2の尤度値(例えば式15のL)の間の比に基づき得る。一部の例では、陰性予測アナライザー134は、TFに基づいてLLR(例えば、式16に例証されるLLRtf)を生成してもよい。陰性予測アナライザー134は、式11に基づいて定量値(例えば、LLR)を生成してもよい:
LLR=LLRtf+LLRme(式11)(腫瘍割合(LLRtf)および相互排他性(LLRme)の対数尤度比(LLR))。
共変性(相互排他性)データに基づいてLLRを使用する陰性予測の評価
一部の例では、定量値は、共変性データのLLRに基づき得る。例えば、陰性予測アナライザー134は、式18に例証されるように、共変性データを反映するLLRme(バリアントが共に観察される回数の条件確率)を生成し得る。
Figure 2023512239000011
Figure 2023512239000012
LLRの組合せを使用する陰性予測の評価
一部の実施形態では、定量値は、帰無仮説または試験仮説が正しいかに関するTFに基づく対数尤度、帰無仮説または試験仮説が正しいかに関する共変性に基づく(例えば、相互排他性)対数尤度、ならびに以下の式19および21に表されるような事前データに基づく対数データの組合せに基づく対数事後確率比(LPPR)として表記され得る。一部の例では、定量値(例えば、式11のLLR)は、対象111の試料101に必ずしも限定されない過去の観察されたデータに基づく対数事前データにさらに基づき得る。そのような対数事前データは、標的バリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報に基づき得る。例えば、対数事前データは、
Figure 2023512239000013
として表記され得る。対数事前データを使用して、例えば式19における他の値と組み合わせて定量値を生成してもよい。
Figure 2023512239000014
Figure 2023512239000015
Figure 2023512239000016
Figure 2023512239000017
Figure 2023512239000018
Figure 2023512239000019
LPPR=TFに基づく+共変性に基づく+事前データに基づく
Figure 2023512239000020
Figure 2023512239000021
Figure 2023512239000022
以前の例では、陰性予測アナライザー134は、方法300をインプリメントし、前述の追加の操作を実施すると記載されていることを理解すべきである。前述の追加の操作は、方法300の一部であり、方法300を拡大し得ることをさらに理解すべきである。
図に示される様々な処理、操作、および/または方法は、本明細書において詳細に記載されるシステム構成成分の一部または全てを使用して達成することができ、一部のインプリメンテーションでは、様々な操作を異なる順序で実施してもよく、様々な操作を省略してもよい。追加の操作を、示される流れ図に示される操作の一部または全てと共に実施してもよい。1つまたは複数の操作を同時に実施してもよい。したがって、例証される(および本明細書により詳細に記載される)操作は例として提供され、そのため限定であると見なしてはならない。
コンピュータインプリメンテーション
本発明の方法は、湿式化学ステップ以外の本明細書または添付の特許請求の範囲に記載される操作のいずれかまたは全てが適したプログラムされたコンピュータにおいて実施することができるように、コンピュータによりインプリメントされ得る。コンピュータは、メインフレーム、パーソナルコンピュータ、タブレット、スマートフォン、クラウド、オンラインデータストレージ、リモートデータストレージ、またはその他であり得る。コンピュータは、1つまたは複数の場所で操作することができる。
本発明の方法の様々な操作は、情報および/またはプログラムを利用して、結果を生成することができ、これをコンピュータ可読媒体(例えば、ハードドライブ、補助メモリー、拡張メモリー、サーバー、データベース、携帯型メモリーデバイス(例えば、CD-R、DVD、ZIPディスク、フラッシュメモリーカード)、およびその他に保存する。
本開示は、実行される場合に本発明の方法のステップをインプリメントする1つまたは複数のプログラムを含有する機械可読媒体を含む核酸集団を解析するための製品も含む。
本開示は、ハードウェアおよび/またはソフトウェアにおいてインプリメントすることができる。例えば、本開示の異なる態様を、クライアント側のロジックまたはサーバー側のロジックのいずれかでインプリメントすることができる。本開示またはその構成成分は、適切に構成されたコンピュータデバイスにロードされた場合に、そのデバイスを本開示に従って実施させるロジック命令および/またはデータを含有する固定媒体プログラム構成成分において具体化することができる。ロジック命令を含有する固定媒体を、ビューアーのコンピュータに物理的にロードするために、固定媒体上でビューアーに送ることができ、またはロジック命令を含有する固定媒体は、プログラム構成成分をダウンロードするために伝達媒体を通してビューアーがアクセスするリモートサーバー上に存在してもよい。
本開示は、本開示の方法をインプリメントするようにプログラムされるコンピュータ制御システムを提供する。プロセッサー120は、シングルコアもしくはマルチコアプロセッサー、または並列処理のための複数のプロセッサーを含み得る。ストレージデバイス122は、ランダムアクセスメモリー、読み取り専用メモリー、フラッシュメモリー、ハードディスク、および/または他の型のストレージを含み得る。コンピュータシステム110は、1つまたは複数の他のシステムと通信するための通信インターフェース(例えば、ネットワークアダプター)、ならびに周辺デバイス、例えばキャッシュ、他のメモリー、データストレージ、および/または電子ディスプレイアダプターを含み得る。コンピュータシステム110の構成成分は、マザーボードなどの内部通信バスを通して互いに通信し得る。ストレージデバイス122は、データを保存するためのデータストレージユニット(またはデータリポジトリ)であり得る。コンピュータシステム110は、通信インターフェースの助けを借りてコンピュータネットワーク(「ネットワーク」)に作動可能に連結されてもよい。ネットワークは、Internet、インターネット、および/またはエクストラネット、またはInternetと通信するイントラネットおよび/もしくはエクストラネットであり得る。一部の場合ではネットワークは、電気通信および/またはデータネットワークである。ネットワークは、ローカルエリアネットワークを含み得る。ネットワークは、クラウドコンピューティングなどの分散コンピューティングを可能にし得る1つまたは複数のコンピュータサーバーを含み得る。ネットワークは、一部の例ではコンピュータシステム110の助けを借りて、コンピュータシステム120にカップリングされたデバイスがクライアントまたはサーバーとして挙動することを可能にし得るピアツーピアネットワークをインプリメントし得る。
プロセッサー120は、プログラムまたはソフトウェアにおいて具体化され得る機械可読命令のシーケンスを実行し得る。命令は、ストレージデバイス122などのメモリーの場所で保存され得る。命令をプロセッサー120に指示することができ、これはその後、プロセッサー120をプログラムするかまたはそれ以外の方法で構成して本開示の方法をインプリメントすることができる。プロセッサー120によって実施される操作の例としては、フェッチ、復号、実行、およびライトバックが挙げられ得る。
プロセッサー120は、集積回路などの回路の一部であり得る。システム100の1つまたは複数の他の構成成分を回路に含めてもよい。一部の例では、回路は、アプリケーション特異的集積回路(ASIC)を含み得る。
ストレージデバイス122は、ドライバー、ライブラリ、およびセーブされたプログラムなどのファイルを保存し得る。ストレージデバイス122は、ユーザーデータ、例えばユーザーの好みおよびユーザープログラムを保存することができる。コンピュータシステム110は、一部の例では、コンピュータシステム110に対して外部の、例えばイントラネットまたはInternetを通してコンピュータシステム110と通信するリモートサーバーに位置する1つまたは複数の追加のデータストレージユニットを含み得る。
コンピュータシステム110は、ネットワークを通して1つまたは複数のリモートコンピュータシステムと通信することができる。例として、コンピュータシステム110は、ユーザーのリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、ポータブルPC)、スレートまたはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、アンドロイド(登録商標)型デバイス、Blackberry(登録商標))、またはパーソナルデジタルアシスタントが挙げられる。ユーザーは、ネットワークを介してコンピュータシステム110にアクセスすることができる。
本明細書に記載される方法は、コンピュータシステム110の電子ストレージ場所、例えばストレージデバイス122に保存された機械(例えば、コンピュータプロセッサ-)実行可能なコードによってインプリメントすることができる。機械実行可能または機械可読コードは、ソフトウェアの形態(例えば、コンピュータ可読媒体)で提供することができる。使用時に、コードは、プロセッサー120によって実行することができる。一部の例では、コードは、ストレージデバイス122から取得され、プロセッサー120によって容易にアクセスされるようにストレージデバイス122に保存することができる。
コードは、プリコンパイルされて、コードを実行するように適合させたプロセッサーを有する機械と共に使用するように構成されてもよく、またはルーチンの間にコンパイルすることができる。コードは、プリコンパイル済みまたはコンパイル済みとしてコードを実行することを可能にするように選択することができるプログラミング言語で供給され得る。
コンピュータシステム110などの本明細書に提供されるシステムおよび方法の態様は、プログラミングにおいて具体化することができる。テクノロジーの様々な態様は、典型的に機械(またはプロセッサー)実行可能なコードおよび/または機械可読媒体の型で実行もしくは具体化される関連するデータの形態での「産物」または「製品」であると考えられ得る。機械実行可能コードは、メモリー(例えば、読み取り専用メモリー、ランダムアクセスメモリー、フラッシュメモリー)、またはハードディスクなどの電子ストレージユニットに保存することができる。
「ストレージ」型の媒体は、コンピュータの有形メモリー、プロセッサーまたはその他、またはそれに関連するモジュール、例えばソフトウェアプログラミングのために任意の時期で非一時的ストレージを提供し得る様々な半導体メモリー、テープドライブ、ディスクドライブおよびその他のいずれかまたは全てを含み得る。ソフトウェアの全てまたは一部は、時にはInternetまたは様々な他の電気通信ネットワークを通して通信され得る。そのような通信は、例えば1つのコンピュータまたはプロセッサーから別のコンピュータまたはプロセッサーへの、例えば管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームへのソフトウェアのローディングを可能にし得る。このように、ソフトウェアエレメントを有し得る別の型の媒体は、例えば有線および光電話ネットワークを通しておよび様々なエアリンクによってローカルデバイス間の物理的インターフェースを超えて使用される光波、電波、および電磁波を含む。そのような波を有する物理的エレメント、例えば有線または無線リンク、光学リンク、またはその他もまた、ソフトウェアを有する媒体であると考えられ得る。本明細書で使用される場合、非一時的な有形のストレージ媒体に限定されない場合、「媒体」は、他の型の(無形)媒体を含み得る。
「ストレージ」媒体、コンピュータまたは機械「可読媒体」などの用語は、命令を実行させるためにプロセッサーに提供することに関与する任意の有形の(例えば物理的)非一時的媒体を指す。
したがって、機械可読媒体、例えばコンピュータ実行可能コードは、有形のストレージ媒体、搬送波媒体、または物理的伝送媒体を含むがこれらに限定されない多くの形態をとり得る。不揮発性ストレージ媒体は、例えば、光学または磁気ディスク、例えば任意のコンピュータ(単数または複数)またはその他におけるストレージデバイスのいずれか、例えば描画に示されるデータベースをインプリメントするために使用され得るものを含む。揮発性ストレージ媒体は、動的メモリー、例えばそのようなコンピュータプラットフォームのメインメモリーを含む。有形の伝送媒体は、コンピュータシステム内のバスを含むワイヤを含む同軸ケーブル、銅線、または光ファイバーを含む。搬送波伝送媒体は、電気シグナルまたは電磁シグナル、または音波もしくは光波の形態、例えば高周波(RF)および赤外線(IR)データ通信の際に生成される形態をとり得る。したがって、コンピュータ可読媒体の一般的な形態は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、他の任意の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、他の任意の光学媒体、パンチカード、紙テープ、ホールパターンを有する他の任意の物理的ストレージ媒体、RAM、ROM、PROM、およびEPROM、FLASH-EPROM、他の任意のメモリーチップもしくはカートリッジ、搬送波輸送データもしくは命令、そのような搬送波を輸送するケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび/もしくはデータを読み取り得る他の任意の媒体を含む。コンピュータ可読可能媒体のこれらの形態の多くは、1つまたは複数の命令の1つまたは複数のシーケンスをプロセッサーに実行させるために輸送することに関係し得る。
コンピュータシステム110は、例えば報告書を提供するためにユーザーインターフェース(UI)を含む電子ディスプレイ935を含み得るか、またはそれと通信することができる。UIの例としては、グラフィカルユーザーインターフェース(GUI)、およびウェブに基づくユーザーインターフェースが挙げられるがこれらに限定されない。
本開示の方法およびシステムは、1つまたは複数のアルゴリズムによってインプリメントすることができる。アルゴリズムは、プロセッサーによって実行されるとソフトウェアによってインプリメントされ得る。
試料収集および解析パイプライン
試料101は、対象から単離された任意の生物試料であり得る。試料は、体組織、例えば公知のまたは疑われる固形腫瘍、全血、血小板、血清、血漿、便、赤血球、白血球または白血球(leucocyte)、内皮細胞、組織生検、脳脊髄液、滑液、リンパ液、腹水、間質液または細胞外液、歯肉溝滲出液を含む細胞間の空隙の液体、骨髄、胸水、脳脊髄液、唾液、粘液、喀痰、精液、汗、尿が挙げられ得る。試料は好ましくは、体液、特に血液およびその分画、および尿である。そのような試料は、腫瘍から排出された核酸を含む。核酸は、DNAおよびRNAを含み得て、二本鎖および/または一本鎖形態であり得る。試料は対象から元々単離された形態であり得るか、または細胞などの構成成分を除去もしくは追加する、1つの構成成分を他の構成成分と比較して濃縮する、もしくは1つの形態の核酸を別の形態に変換する、例えばRNAをDNAに変換する、もしくは一本鎖核酸を二本鎖核酸に変換するさらなる処理に供されていてもよい。このように、例えば解析するための体液は、無細胞核酸、例えば無細胞DNA(cfDNA)を含有する血漿または血清である。
ある特定の実施形態では、ポリヌクレオチドを配列決定の前に濃縮することができる。濃縮は、特異的標的領域(「標的配列」)についてまたは非特異的に実施することができる。一部の実施形態では、目的の標的化領域は、示差的タイリングおよび捕捉スキームを使用して1つまたは複数のベイトセットパネルに関して選択される捕捉プローブ(「ベイト」)によって濃縮され得る。示差的タイリングおよび捕捉スキームは、異なる相対濃度のベイトセットを使用して、ベイトに関連するゲノム領域にわたって示差的にタイリングし(例えば、異なる「分解能」で)、制約セット(例えば、シーケンサー制約、例えば配列決定ロード、各ベイトの有用性など)に供し、それらを下流での配列決定のために所望のレベルで捕捉する。目的のこれらの標的化ゲノム領域は、対象のゲノムまたはトランスクリプトームの領域を含み得る。一部の実施形態では、目的の1つまたは複数の領域に対するプローブを有するビオチン標識ビーズを使用して、標的配列を捕捉することができ、必要に応じてその後それらの領域を増幅し、目的の領域に関して濃縮することができる。
配列捕捉は典型的に、標的配列にハイブリダイズするオリゴヌクレオチドプローブの使用を伴う。プローブセット戦略は、目的の領域にわたってプローブをタイリングすることを伴い得る。そのようなプローブは、例えば約60~130塩基長であり得る。セットは、約2×、3×、4×、5×、6×、8×、9×、l0×、15×、30×、50×、またはそれより多くの深度を有し得る。配列捕捉の有効性は、プローブの配列と相補的である(またはほぼ相補的である)標的分子における配列の長さに一部依存する。
一部の実施形態では、本開示の方法は、配列決定の前の対象のゲノムまたはトランスクリプトームからの選択的濃縮領域を含む。他の実施形態では、本開示の方法は、配列決定前の対象のゲノムまたはトランスクリプトームからの非選択的濃縮領域を含む。
ある特定の実施形態では、試料インデックス配列は濃縮後にポリヌクレオチドに導入される。試料インデックス配列は、PCRを通して導入されてもよく、または必要に応じてアダプターの一部としてポリヌクレオチドにライゲーションされてもよい。
血漿の体積は、配列決定された領域に関する所望の読み取りデータ深度に依存し得る。例示的な体積は、0.4~40ml、5~20ml、10~20mlである。例えば、体積は0.5ml、1ml、5ml、10ml、20ml、30ml、または40mlであり得る。試料を採取した血漿の体積は5~20mlであり得る。
試料は、ゲノム当量を含有する核酸の様々な量を含み得る。例えば、約30ngのDNAの試料は、約10,000(10)個の半数体ヒトゲノム当量を含有し得て、cfDNAの場合、約2000億(2×1011)個の個々のポリヌクレオチド分子を含有し得る。同様に、約100ngのDNA試料は、約30,000個の半数体ヒトゲノム当量を含有し得て、cfDNAの場合、約6000億個の個々の分子を含有し得る。
試料は、異なる起源からの、例えば細胞および無細胞の核酸を含み得る。試料は、突然変異を有する核酸を含み得る。例えば、試料は、生殖系列突然変異および/または体細胞突然変異を有するDNAを含み得る。試料は、がん関連突然変異(例えば、がん関連体細胞突然変異)を有するDNAを含み得る。
増幅前の試料中の無細胞核酸の例示的な量は、約1fg~約1μgの範囲、例えば、1pg~200ng、1ng~100ng、10ng~1000ngの範囲である。例えば量は、最大約600ng、最大約500ng、最大約400ng、最大約300ng、最大約200ng、最大約100ng、最大約50ng、または最大約20ngの無細胞核酸分子であり得る。量は、少なくとも1fg、少なくとも10fg、少なくとも100fg、少なくとも1pg、少なくとも10pg、少なくとも100pg、少なくとも1ng、少なくとも10ng、少なくとも100ng、少なくとも150ng、または少なくとも200ngの無細胞核酸分子であり得る。量は、最大1フェムトモル(fg)、10fg、100fg、1ピコグラム(pg)、10pg、100pg、1ng、10ng、100ng、150ng、または200ngの無細胞核酸分子であり得る。方法は、1フェムトグラム(fg)から200ngを得ることを含み得る。
無細胞核酸は、約100~500ヌクレオチドの例示的なサイズ分布を有し、110~約230ヌクレオチドの分子は、約90%の分子を表し、ヒトにおける最頻値は約168ヌクレオチドであり、第2の小さいピークは240~430ヌクレオチドの範囲であった。無細胞核酸は、約160~約180ヌクレオチド、または約320~約360ヌクレオチド、または約430~約480ヌクレオチドであり得る。
無細胞核酸は、溶液中で見出される無細胞核酸をインタクト細胞および体液の他の不溶性構成成分から分離する分配ステップを通して体液から単離することができる。分配は、遠心分離または濾過などの技術を含み得る。あるいは、体液中の細胞を溶解し、無細胞および細胞核酸を共に処理することができる。一般的に、緩衝液の添加および洗浄ステップの後、無細胞核酸をアルコールによって沈殿させることができる。さらなる洗浄ステップ、例えばシリカに基づくカラムを使用して、夾雑物または塩を除去してもよい。例えば、非特異的バルク担体核酸を反応全体に添加して、収量などのある特定の態様の手順を最適化してもよい。
そのような処理後、試料は、二本鎖DNA、一本鎖DNA、および一本鎖RNAを含む核酸の様々な形態を含み得る。必要に応じて、一本鎖DNAおよびRNAを、それらがその後の処理および解析ステップに含まれるように、二本鎖形態に変換することができる。
増幅
アダプターが隣接する試料核酸を、PCRによって増幅し、他の増幅方法は典型的に、増幅されるDNA分子に隣接するアダプターにおけるプライマー結合部位に結合するプライマーからプライミングされ得る。増幅方法は、サーモサイクリングに起因する伸長、変性、およびアニーリングのサイクルを伴い得るか、または転写媒介増幅のような等温であり得る。他の増幅方法としては、リガーゼ連鎖反応、鎖置換増幅、核酸配列に基づく増幅、および自家持続配列に基づく増幅が挙げられる。
1つまたは複数の増幅を適用して、従来の核酸増幅方法を使用して核酸分子にバーコードを導入することができる。増幅は、1つまたは複数の反応混合物で実施することができる。分子タグおよび試料インデックス/タグを同時にまたは任意の連続する順序で導入することができる。分子タグおよび試料インデックス/タグは、配列捕捉の前および/または後に導入することができる。一部の場合、分子タグのみをプローブ捕捉の前に導入し、試料インデックス/タグは、配列捕捉後に導入される。一部の例では、分子タグおよび試料インデックス/タグの両方がプローブ捕捉の前に導入される。一部の例では、試料インデックス/タグは、配列捕捉後に導入される。通常、配列捕捉は、標的化配列と相補的な一本鎖核酸分子、例えばゲノム領域のコード配列を導入するステップを伴い、そのような領域の突然変異はがんの型に関連する。典型的に、増幅は、200nt~700nt、250nt~350nt、または320nt~550ntの範囲のサイズの分子タグおよび試料インデックス/タグを有する複数の非一意的または一意的にタグ付けされた核酸アンプリコンを生成する。一部の実施形態では、アンプリコンは、約300ntのサイズを有する。一部の実施形態では、アンプリコンは約500ntのサイズを有する。
バーコード
バーコードは、他の方法の中でも化学合成、ライゲーション、オーバーラップ伸長PCRによってアダプターに組み込まれ得るかまたはそれ以外の方法で結合され得る。一般的に、反応中の一意的または非一意的バーコードの割り当ては、米国特許出願公開第20010053519号、第20110160078号、および米国特許第6,582,908号および米国特許第7,537,898号、および米国特許第9,598,731号に記載される方法およびシステムに従う。
タグを、試料核酸に無作為または非無作為に連結することができる。一部の例では、それらは識別子(すなわち、バーコードの組合せ)のマイクロウェルに対する予測される比で導入される。バーコードのコレクションは、一意的であり得て、例えば全てのバーコードが、異なるヌクレオチド配列を有する。バーコードのコレクションは、非一意的であり得て、すなわちバーコードの一部は同じヌクレオチド配列を有し、バーコードの一部が異なるヌクレオチド配列を有する。例えば、識別子は、1個より多く、2個より多く、3個より多く、4個より多く、5個より多く、6個より多く、7個より多く、8個より多く、9個より多く、10個より多く、20個より多く、50個より多く、100個より多く、500個より多く、1000個より多く、5000個より多く、10000個より多く、50,000個より多く、100,000個より多く、500,000個より多く、1,000,000個より多く、10,000,000個より多く、50,000,000個より多く、または1,000,000,000個より多くの識別子がゲノム試料あたりにロードされるようにロードされ得る。一部の例では、識別子は、2個未満、3個未満、4個未満、5個未満、6個未満、7個未満、8個未満、9個未満、10個未満、20個未満、50個未満、100個未満、500個未満、1000個未満、5000個未満、10000個未満、50,000個未満、100,000個未満、500,000個未満、1,000,000個未満、10,000,000個未満、50,000,000個未満、または1,000,000,000個未満の識別子がゲノム試料あたりにロードされるようにロードされ得る。一部の例では、試料ゲノムあたりにロードされる識別子の平均数は、ゲノム試料あたり約1個未満もしくはそれより多く、約2個未満もしくはそれより多く、約3個未満もしくはそれより多く、約4個未満もしくはそれより多く、約5個未満もしくはそれより多く、約6個未満もしくはそれより多く、約7個未満もしくはそれより多く、約8個未満もしくはそれより多く、約9個未満もしくはそれより多く、約10個未満もしくはそれより多く、約20個未満もしくはそれより多く、約50個未満もしくはそれより多く、約100個未満もしくはそれより多く、約500個未満もしくはそれより多く、約1000個未満もしくはそれより多く、約5000個未満もしくはそれより多く、約10000個未満もしくはそれより多く、約50,000個未満もしくはそれより多く、約100,000個未満もしくはそれより多く、約500,000個未満もしくはそれより多く、約1,000,000個未満もしくはそれより多く、約10,000,000個未満もしくはそれより多く、約50,000,000個未満もしくはそれより多く、または約1,000,000,000個未満もしくはそれより多くの識別子である。
好ましいフォーマットは、20~50個の異なるタグを使用し、標的分子の両方の末端にライゲーションされ、20~50×20~50個のタグ、すなわち400~2500個のタグの組合せを作製する。そのようなタグの数は十分であるため、同じ開始および停止点を有する異なる分子が、異なるタグの組合せを受ける確率は高い(例えば、少なくとも94%、99.5%、99.99%、99.999%)。
一部の例では、識別子は、予め決定された、または無作為または半無作為の配列オリゴヌクレオチドであり得る。他の例では、バーコードが複数の中で互いに必ずしも一意的ではないように、複数のバーコードを使用してもよい。この例では、バーコードは、バーコードとそれが結合され得る配列の組合せが、個々に追跡され得る一意的配列を作製するように、個々の分子に結合され得る(例えば、ライゲーションまたはPCR増幅によって)。本明細書で記載されるように、所定の配列決定された試料分子(すなわち、バーコード、アダプター、およびその他から得られた配列情報を除外する)の始まり(開始)および/または終わり(停止)のゲノム座標と組み合わせた非一意的にタグ付けされたバーコードの検出は、特定の分子に対する一意的同一性の割り当てを可能にし得る。個々の配列決定された試料分子(すなわち、バーコード、アダプター、およびその他に対応する配列情報を除外する)の塩基対の長さまたは数もまた使用して、そのような分子に一意的同一性を割り当ててもよい。本明細書で記載されるように、一意的同一性が割り当てられている核酸の一本鎖からの断片は、それによって親の鎖および/または相補鎖からの断片のその後の特定を可能にし得る。
配列決定パイプライン
事前の増幅を伴うまたは伴わない、アダプターが隣接する試料核酸を、例えば1つまたは複数の配列決定デバイス107による配列決定に供することができる。配列決定方法は、例えば、サンガー配列決定、ハイスループット配列決定、パイロシーケンシング、合成による配列決定、単分子配列決定、ナノポア配列決定、半導体配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、RNA-Seq(Illumina)、Digital Gene Expression(Helicos)、次世代配列決定、合成による単分子配列決定(SMSS)(Helicos)、超並列配列決定、Clonal Single Molecule Array(Solexa)、ショットガン配列決定、Ion Torrent、Oxford Nanopore、Roche Genia、マキサムギルバート配列決定、プライマー歩行、PacBio、SOLiD、Ion Torren、またはNanoporeプラットフォームを使用する配列決定が挙げられる。配列決定反応は、複数のレーン、複数のチャネル、複数のウェル、または複数の試料セットを実質的に同時に処理する他の手段であり得る多様な試料処理ユニットで実施することができる。試料処理ユニットはまた、複数のランを同時に処理することが可能である複数の試料チャンバーも含むことができる。
配列決定反応は、他の疾患のがんのマーカーを含有することが公知である1つまたは複数の断片型について実施することができる。配列決定反応はまた、試料中に存在する任意の核酸断片についても実施することができる。配列反応は、所定のゲノムの少なくとも5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%、または100%を配列決定することを提供し得る。他の例では、配列決定反応は、所定のゲノムの5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、50%未満、60%未満、70%未満、80%未満、90%未満、95%未満、99%未満、99.9%未満、または100%未満を配列決定することを提供し得る。
マルチプレックス配列決定を使用して、同時の配列決定反応を実施してもよい。一部の例では、無細胞ポリヌクレオチドは、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000個の配列決定反応によって配列決定され得る。他の例では、無細胞ポリヌクレオチドは、1000個未満、2000個未満、3000個未満、4000個未満、5000個未満、6000個未満、7000個未満、8000個未満、9000個未満、10000個未満、50000個未満、100,000個未満の配列決定反応によって配列決定され得る。配列決定反応は逐次的または同時に実施され得る。その後のデータ解析は、配列決定反応の全てまたは一部について実施され得る。一部の例では、データ解析は、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000個の配列決定反応について実施され得る。他の例では、データ解析は、1000個未満、2000個未満、3000個未満、4000個未満、5000個未満、6000個未満、7000個未満、8000個未満、9000個未満、10000個未満、50000個未満、100,000個未満の配列決定反応について実施され得る。例示的な読み取りデータ深度は、座(塩基)あたり1000~50000読み取りデータである。
配列解析パイプライン
本発明の方法を使用して、対象における状態、特にがんの存在または非存在を診断する、状態を特徴付ける(例えば、がんのステージを決定するまたはがんの不均一性を決定する)、状態の処置に対する応答をモニターする、状態を発症するまたは状態のその後の経過の予後リスクを決定することができる。
様々ながんが、本発明の方法を使用して検出され得る。がん細胞は、ほとんどの細胞と同様に、古い細胞が死滅し、新しい細胞が取って代わる代謝速度によって特徴付けることができる。一般的に死細胞は、所定の対象において血管と接触すると、DNAまたはDNAの断片を血流に排出し得る。これは、疾患の様々なステージの間のがん細胞についても当てはまる。がん細胞はまた、疾患のステージに応じて、様々な遺伝子異常、例えばコピー数多型ならびにまれな突然変異によっても特徴付けられ得る。この現象を使用して、本明細書に記載される方法およびシステムを使用して個体におけるがんの存在または非存在を検出してもよい。
検出され得るがんの型および数は、血液のがん、脳がん、肺がん、皮膚がん、鼻のがん、喉のがん、肝臓がん、骨がん、リンパ腫、膵臓がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固形状態の腫瘍、不均一な腫瘍、均一な腫瘍およびその他が挙げられ得る。
がんは、突然変異、まれな突然変異、インデル、コピー数多型、トランスバージョン、転座、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造異常、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体病変、DNA病変、核酸化学修飾の異常な変化、エピジェネティックパターンの異常な変化を含む遺伝的変異から検出することができる。
遺伝子データは、がんの特定の型を特徴付けるためにも使用することができる。がんはしばしば、組成およびステージングの両方において不均一である。遺伝子プロファイルデータは、その特定の亜型の診断または処置において重要であり得るがんの特定の亜型の特徴付けを可能にし得る。この情報はまた、対象または医師に、がんの特定の型の予後に関する手がかりを提供し、対象または医師が、疾患の進行に応じて処置の選択肢をとることを可能にし得る。一部のがんは進行し、より侵襲性となり、遺伝的に不安定となる。他のがんは良性、不活性、または休眠のままであり得る。本開示のシステムおよび方法は、疾患の進行を決定するために有用であり得る。
本発明の解析はまた、特定の処置選択肢の有効性を決定するためにも有用である。処置選択肢の成功は、処置が成功すれば、より多くのがんが死滅し、DNAを排出することから、対象の血液中に検出されるコピー数多型またはまれな突然変異の量を増加させ得る。他の例では、これは起こらなくてもよい。別の例では、おそらくある特定の処置選択肢は、経時的ながんの遺伝子プロファイルと相関し得る。この相関は、療法の選択において有用であり得る。加えて、がんが、処置後に寛解状態にあると観察される場合、本発明の方法を使用して、残存疾患または疾患の再発をモニターすることができる。
本発明の方法はまた、がん以外の状態における遺伝的変異を検出するためにも使用することができる。免疫細胞、例えばB細胞は、ある特定の疾患の存在に基づいて急速なクローン性の増大を経験し得る。クローン性の増大を、コピー数多型の検出を使用してモニターしてもよく、ある特定の免疫状態をモニターしてもよい。この例では、コピー数多型解析を経時的に実施して、特定の疾患がどのように進行し得るかのプロファイルを作製してもよい。コピー数多型またはさらにまれな突然変異の検出を使用して、病原体の集団が感染の経過の間にどのように変化しているかを決定してもよい。これは、慢性感染症、例えば、HIV/AIDs、または肝炎感染症の際に、それによってウイルスが、生活環状態を変化させ、および/または感染の経過の間によりビルレント形態へと変異し得ることから特に重要であり得る。免疫細胞は、移植された組織を破壊しようと試みることから、移植された組織の状態ならびに処置の経過を変化させるためもしくは拒絶の防止をモニターするために、本発明の方法を使用して、宿主体の拒絶活性を決定またはプロファイリングしてもよい。
さらに、本開示の方法を使用して、対象における異常な状態の不均一性を特徴付けてもよく、方法は対象における細胞外ポリヌクレオチドの遺伝的プロファイルを生成するステップを含み、遺伝的プロファイルが、コピー数多型およびまれな突然変異解析に起因する複数のデータを含む。がんを含むがこれらに限定されない一部の例では、疾患は不均一であり得る。疾患細胞は同一でなくてもよい。がんの例では、一部の腫瘍は、異なる型の腫瘍細胞、がんの異なるステージにある一部の細胞を含むことが公知である。他の例では、不均一性は、複数の疾患病巣を含み得る。この場合も、がんの例では、複数の腫瘍病巣が存在してもよく、おそらく1つまたは複数の病巣は、原発部位から広がった転移の結果である。
本発明の方法を使用して、不均一な疾患中の異なる細胞に由来する遺伝子情報の要約であるデータのフィンガープリント、またはセットを生成またはプロファイリングすることができる。このデータセットは、コピー数多型およびまれな突然変異解析を単独または組み合わせて含み得る。
本発明の方法を使用して、がんまたは胎児起源の他の疾患を診断、予後判定、モニター、または観察することができる。すなわち、これらの方法論を妊娠中の対象に使用して、そのDNAおよび他のポリヌクレオチドが母体の分子と共循環し得るまだ生まれていない対象におけるがんまたは他の疾患を診断、予後判定、モニター、または観察してもよい。
例示的な精密処置
改善されたコンピュータシステム110によって提供される精密診断は、コンピュータシステム110によって特定され得る(および/または保健の専門家によって精選された)精密処置計画をもたらし得る。例えば、肺がんおよび他の疾患では、目標は、所定のバリアントの存在が与えられると、優れた処置選択肢が存在しないことを確実にすることであり得る。例えば、EGFR(L858R、エクソン19欠失)、BRAF V600E、ALK、およびROS1融合は、白金および化学療法より好適であり得る標的化療法によって処置され得る。これらは、主なドライバーの例であるが、他の標的化可能なドライバー、例えばMETエクソン14スキッピングが存在する。別の例では、結腸がんの場合、目標は、有効ではない処置を回避することであり得る。KRASまたはNRASが野生型である場合、FOLFIRIによる化学療法またはイリノテカンレジメンによる化学療法は、セツキシマブまたはパニツムマブによって補助され得る。このように、KRASおよびNRASが野生型である確証は、セツキシマブまたはパニツムマブを追加するステップが正しい処置選択肢であり、さらなる試験は必要ではないという確証を増加させる。この生物学的説明は、セツキシマブまたはパニツムマブがEGFRを標的として、その活性を阻害することである。RAS(K/NRAS)は、EGFRの下流であり、そのためRASが活性化されると、EGFRを阻害してもほとんどまたは全く影響がなく、そのためセツキシマブまたはパニツムマブ処置の投与は不適切である。
追加の療法が様々な疾患に関して開発されていることから、陰性予測の解釈は、ますます複雑化するが、精密療法の設計において極めて重要である。
別の目標は、下流の診断手順が実施されるか否かを誘導することであり得る。例として、バリアントの非存在を決定するステップによって、高価なまたは侵襲性の診断試験、例えば撮像手順、スキャン(例えば、CT、MRI、またはPETスキャン)、内視鏡手順、および/または固形組織生検(例えば、針生検)を回避する(または回避することを推奨する)ことが可能であり得る。同様に、別のリキッドバイオプシー試験(例えば、血液、血漿、尿、脳脊髄液)、または便の試験を回避する(または回避するステップを推奨する)ことも可能であり得る。血液アッセイに基づく結果をこのように使用して反射的な組織試験を誘導し、目的の任意の潜在的バリアントに関する野生型状態を確認するための固形組織生検の必要性を回避することができる。上記の陰性予測を使用して、リキッドバイオプシーにおいて臨床的に有意な突然変異が存在しない確率を評価してもよく、リキッドバイオプシーが、目的のバリアントの潜在的存在を検出するために十分であること、および下流の診断手順が必要ではないという確信を与え得る。これはまた、時宜を得た治療決定を容易にし得る。
配列決定した核酸におけるヌクレオチド多型は、配列決定した核酸を、参照配列と比較することによって決定することができる。参照配列はしばしば公知の配列であり、例えば対象から得た公知の全体のまたは部分的ゲノム配列、ヒト対象の全ゲノム配列である。参照配列はhG19であり得る。配列決定される核酸は、試料中の核酸に関して直接決定された配列、または上記のそのような核酸の増幅産物の配列のコンセンサスを表すことができる。比較は、参照配列の1つまたは複数の指定された位置で実施することができる。参照配列を最大に整列させた場合に、参照配列の設計された位置に対応する位置を含む配列決定された核酸のサブセットを同定することができる。そのようなサブセット内で、もしあれば配列決定された核酸が、指定された位置でヌクレオチド多型を含むか否か、および必要に応じて、もしあれば、参照ヌクレオチドを含む(すなわち、参照配列と同じ)か否かを決定することができる。ヌクレオチドバリアントを含むサブセットにおいて配列決定された核酸の数が閾値を超える場合、バリアントヌクレオチドを、指定された位置でコールすることができる。閾値は、基数、例えばヌクレオチドバリアントを含むサブセット内の少なくとも1、2、3、4、5、6、7、8、9、または10個の配列決定された核酸であり得るか、または他の可能性の中でもヌクレオチドバリアントを含むサブセット内の配列決定された核酸の比、例えば少なくとも0.5、1、2、3、4、5、10、15、または20であり得る。比較を、参照配列における目的の任意の指定された位置で反復することができる。時に、比較を、参照配列における少なくとも20、100、200、または300個の連続する位置、例えば、20~500、または50~300個の連続する位置を占める指定された位置について実施することができる。
(実施例1)
進行結腸直腸がん(CRC)における抗EGFR療法の陰性予測因子のリキッドバイオプシー野生型予測
方法
解析方法は、Guardant360(登録商標)ctDNA試験(Guardant Health,Redwood City,CA)のために開発され、これは推定される腫瘍割合および相互排他性突然変異の存在を合同で解析して、クローン性活性化RAS/RAF突然変異に関するあり/なし/評価不能の野生型状態を提供する。
結果
クローン性野生型決定におけるこの方法およびモデルの信頼性を検証するために、臨床Guardant360試験(n=98)を受けた、CRCを有するおよび組織配列決定により公知の陽性RAS/RAF突然変異状態を有する患者の試料のサブセットを使用した。79個は、RAS/RAFの一致した検出を有したが、19個は、Guardant360によってRAS/RAFは検出されず、これを使用してモデル予測を確認することができた。モデルは、19個全ての試料を、野生型状態に関して評価不能であると正確に同定し、公知のRAS/RAF突然変異の存在に関して高い信頼度で野生型コールを提供しなかった。全体としての性能を評価するために、この方法を、8,500人を超えるCRCを有する患者の試料のコホートに適用すると、高い信頼度でRAS/RAF突然変異体(40.7%)またはクローン性野生型状態(21.3%)のいずれであるかを決定することができ、RAS/RAF状態の最終決定を、ctDNA試験を通して容易に達成できる患者のコホートを有意に拡大した。
結論
Guardant360 ctDNA試験は、大多数の進行CRC患者においてRAS/RAF遺伝子の野生型状態を信頼可能に決定することができ、抗EGFR療法の決定を信頼可能に誘導することができる。
(実施例2)
進行がんのリキッドバイオプシーにおいて観察された相互排他性と突然変異の同時発生
緒言
未処置の固形腫瘍を有する患者における体細胞突然変異は、クローン性である傾向があり、しばしば突然変異発生の組織学特異的なステレオタイプのパターンを示す。例えば、未処置の非小細胞肺がん(NSCLC)患者では、EGFRエクソン19欠失は、METエクソン14スキッピング欠失またはEML4-ALK融合(TCGA、2017)などの他のドライバー突然変異と同時に起こることが観察されていない。これに対し、以前に処置された疾患を有する患者からの腫瘍は、その腫瘍生物学および突然変異パターンに影響を及ぼす異なる生物学的および薬物環境に供されている。Guardant360の無細胞循環腫瘍DNA(ctDNA)血漿試験を使用して、本発明者らは、進行したNSCLCおよび結腸直腸(CRC)がんの非常に大きいコホートにおいて突然変異パターンを特徴付けた。
方法
臨床Guardant360試験(Guardant Health,Redwood City,CA)を受けた進行NSCLC(n=59,589)およびCRC(n=13,116)患者の非特定化された結果を、相互排他性およびバリアントの同時発生に関する解析のために使用した。患者は、未処置の患者、および以前に処置された患者の両方であった。解析に含まれるバリアントは、少なくとも200の観察を必要とし、各々は0.01より大きいバリアント対立遺伝子の割合を有した。基準を満たしたバリアントを、フィッシャーの正確確立検定を使用して評価し、ボンフェローニ法によって多重試験に関して補正した。
結果
進行NSCLCを有する患者からの59,000個を超えるctDNA結果において、EGFRエクソン19欠失などの公知のNSCLCドライバーとMETエクソン14スキッピング変化との相互排他性の以前に報告された組織解析知見が確認された。公知のNSCLCドライバー突然変異と相互に排他性であることが観察されたSTK11、TERT、およびBRAF(クラス3)における突然変異を有する新規対を含む、相互排他性突然変異のさらなる70対が発見された。同様に、EGFR耐性突然変異T790MおよびC797SとEGFRドライバーとの排他的同時発生も観察され、TCGAにおいて認められた同時発生を要約した。古典的に相互排他性ドライバー突然変異ではないことが公知であるがんの型であるCRCでは、13,000例を超える解析により、バリアントBRAF V600EおよびAPC R876の間で以前に記載されていない相互排他性が特定された。、p<0.005。特異的な相互排他性突然変異の追加の対は、KRAS、BRAF、APC、およびTP53において見出された。
結論
ctDNA血漿に基づく包括的ゲノムプロファイリングによって試験した非常に大きい進行したNSCLCおよびCRCコホートを利用して、以前に報告された相互排他性ドライバー突然変異のパターンが確認され、同時発生および排他性の新規パターンが発見された。これらの結果は、臨床的に関連する突然変異および新規生物学的突然変異パターンの特定に関するctDNAの有用性を強調する。
上記または以下で引用される全ての特許出願、ウェブサイト、他の刊行物、受託番号およびその他は、各々の個々の項目が具体的および個々に参照により本明細書に組み込まれることが示されているのと同程度に、全ての目的に関してその全体が参照により本明細書に組み込まれる。異なるバージョンの配列が異なる時間で受託番号に関連している場合、本出願の有効な出願日での受託番号に関連するバージョンを意味する。有効な出願日は、実際の出願日または適用可能であれば受託番号を参照する優先権出願の出願日のいずれか早いほうを意味する。同様に、刊行物、ウェブサイト、またはその他の異なるバージョンが異なる時間で公開されている場合、それ以外であることが示されていない限り、その出願の有効な公開日で最近公開されたバージョンを意味する。本開示の特色、ステップ、要素、実施形態、または態様は、具体的にそれ以外であることが示されていない限り他のいずれかと組み合わせて使用することができる。本開示は、明快にするおよび理解のための目的で例証および実施例によっていくぶん詳細に記載してきたが、ある特定の変化および改変が、添付の特許請求の範囲内で実践され得ることは明白である。

Claims (97)

  1. 目的の第1のバリアントが、ヒト対象の無細胞デオキシリボ核酸(cfDNA)試料中の第1の座にクローンレベルで存在しないことを決定する方法であって:
    前記cfDNA試料の複数の配列読み取りデータにアクセスするステップ;
    前記複数の配列読み取りデータに基づいて、前記第1のバリアントが前記試料中の前記第1の座で検出されていなかったことを決定するステップ;
    前記第1のバリアントがクローンレベルで存在しない確率に基づく第1の尤度値、および/または前記第1のバリアントがクローンレベルで存在する確率に基づく第2の尤度値を生成するステップ;
    必要に応じて、前記第1の尤度値および/または前記第2の尤度値に基づいて定量値を決定するステップ;
    前記定量値および/または前記第1の尤度値および/または前記第2の尤度値を閾値と比較するステップ;ならびに
    前記比較に基づいて、前記目的の第1のバリアントが前記第1の座にクローンレベルで存在しないことを決定するステップ
    を含む方法。
  2. 前記第1の尤度値および前記第2の尤度値を生成するステップが:
    前記試料の腫瘍割合推定値を決定するステップであって、前記第1の尤度値および前記第2の尤度値が前記腫瘍割合推定値に基づくステップ
    を含む、請求項1に記載の方法。
  3. 前記腫瘍割合推定値を決定するステップが:
    前記試料中の腫瘍突然変異の最大突然変異体対立遺伝子頻度(MAX MAF)を決定するステップ
    を含む、請求項2に記載の方法。
  4. 前記MAX MAFを決定するステップが、前記複数の配列読み取りデータに基づいて前記腫瘍突然変異に関連する分子カウントを決定するステップを含む、請求項3に記載の方法。
  5. 前記第1の尤度値および前記第2の尤度値を生成するステップが:
    少なくとも第2のバリアントの対立遺伝子頻度を決定するステップであって、前記第1の尤度値および前記第2の尤度値が、前記対立遺伝子頻度および前記MAX MAFにさらに基づくステップ
    を含む、請求項3に記載の方法。
  6. 前記対立遺伝子頻度を、前記MAX MAFに基づく第2の閾値と比較するステップであって、前記目的の第1のバリアントが前記第1の座にクローンレベルで存在しないことを決定するステップが、前記MAFと前記第2の閾値との比較にさらに基づくステップをさらに含む、請求項5に記載の方法。
  7. 前記対立遺伝子頻度を決定するステップが、
    前記複数の配列読み取りデータに基づいて、前記第1のバリアントに関連する第1の分子カウントを決定するステップを含む、請求項5に記載の方法。
  8. 前記定量値を決定するステップが:
    前記第1のバリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスするステップであって、前記定量値が前記共変量情報に基づくステップを含む、請求項5に記載の方法。
  9. 前記cfDNA試料中の少なくとも第2のバリアントの出現を決定するステップであって、前記定量値が前記共変量情報にさらに基づくステップをさらに含む、請求項8に記載の方法。
  10. 前記定量値を決定するステップが:
    前記第1のバリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスするステップであって、前記定量値が前記共変量情報に基づくステップを含む、請求項1に記載の方法。
  11. 前記cfDNA試料中の少なくとも第2のバリアントの出現を決定するステップであって、前記定量値が、前記第2のバリアントの出現にさらに基づくステップをさらに含む、請求項10に記載の方法。
  12. 前記定量値が、前記第1の尤度値の前記第2の尤度値に対する比に基づく、請求項1に記載の方法。
  13. 前記第1のバリアントが前記定量値に基づいて前記cfDNA試料中にクローンレベルで存在しない信頼レベルを決定するステップをさらに含む、請求項1に記載の方法。
  14. 前記ヒト対象における疾患を処置するための処置計画を決定するステップをさらに含む、請求項1に記載の方法。
  15. 前記疾患ががんである、請求項14に記載の方法。
  16. 前記cfDNA試料中の少なくとも第2のバリアントの出現を決定するステップ;および
    前記cfDNA試料中の前記少なくとも第2のバリアントの出現に基づいて前記定量値を調整するステップ
    をさらに含む、請求項1に記載の方法。
  17. 少なくとも部分的にコンピュータを使用して、第1の標的核酸バリアントが所定のがんの型を有する対象から得た無細胞核酸(cfNA)試料中の第1の遺伝子座に存在しないことを決定する方法であって:
    前記第1の標的核酸バリアントが、前記cfNA試料中の前記第1の遺伝子座で検出されないことを決定するステップ;
    前記コンピュータによって、前記cfNA試料から生成された配列情報から、前記第1の遺伝子座のカバレッジを決定するステップ;
    前記コンピュータによって、前記cfNA試料から生成された配列情報から、腫瘍割合を決定するステップ;
    前記コンピュータによって、前記カバレッジおよび前記腫瘍割合から、前記第1の標的核酸バリアントが前記cfNA試料中の第1の遺伝子座に存在する確率を決定して、定量値を生成するステップ;ならびに
    前記定量値が閾値と異なれば、前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座に存在しないことを決定するステップ
    を含む方法。
  18. 少なくとも部分的にコンピュータを使用して、第1の標的核酸バリアントが対象から得た無細胞核酸(cfNA)試料中の第1の遺伝子座に存在しないことを決定する方法であって:
    前記第1の標的核酸バリアントが前記対象から得た前記cfNA試料中に検出されないことを決定して、第1の試験結果を生成するステップ;
    少なくとも第2の標的核酸バリアントが前記対象から得た前記cfNA試料中に検出されることを決定して、第2の試験結果を生成するステップ;
    前記コンピュータによって、前記第2の試験結果が与えられると、前記第1の標的核酸バリアントが前記cfNA試料中に存在しない第1の確率、および/または前記第2の試験結果が与えられると、前記第1の標的核酸が前記cfNA試料中に存在する第2の確率を決定するステップ;
    前記コンピュータによって、前記第1の確率、前記第2の確率、および/またはその比を使用して定量値を生成するステップ;ならびに
    前記定量値が閾値と異なれば、前記第1の標的核酸バリアントが前記cfNA試料中の第1の遺伝子座に存在しないことを決定するステップ
    を含む方法。
  19. 少なくとも部分的にコンピュータを使用して、第1の標的核酸バリアントが、所定のがんの型を有する対象から得た無細胞核酸(cfNA)試料中の第1の遺伝子座に存在しないことを決定する方法であって:
    前記第1の標的核酸バリアントが、前記対象から得た前記cfNA試料中に検出されないことを決定するステップ;
    前記コンピュータによって、少なくとも1つの腫瘍割合に基づく値を生成するステップ;
    前記コンピュータによって、少なくとも1つの相互排他性値を生成するステップ;ならびに
    前記腫瘍割合に基づく値および/または前記相互排他性値を使用して、前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座に存在しないことを決定するステップ
    を含む方法。
  20. 前記定量値が、前記閾値より小さい、先行請求項のいずれか一項に記載の方法。
  21. 前記定量値が、前記閾値より大きい、先行請求項のいずれか一項に記載の方法。
  22. 前記第1および第2の試験結果が、互いに従属する、先行請求項のいずれか一項に記載の方法。
  23. 複数の他の選択された標的核酸バリアントが1つまたは複数の他の遺伝子座に存在しないことを決定するステップを含む、先行請求項のいずれか一項に記載の方法。
  24. 前記定量値が、対数尤度比(LLR)閾値を含む、先行請求項のいずれか一項に記載の方法。
  25. 前記第1の標的核酸バリアントが、複数の参照cfNA試料中の前記第1の遺伝子座に存在しないことを決定して、閾値を生成するステップを含む、先行請求項のいずれか一項に記載の方法。
  26. 前記閾値がクローン性またはサブクローン性閾値を含む、請求項25に記載の方法。
  27. 前記第1の標的核酸バリアントがドライバー突然変異を含む、先行請求項のいずれか一項に記載の方法。
  28. 前記第1の標的核酸バリアントが、前記cfNA試料中の前記第1の遺伝子座に存在しないという決定に基づいて、前記対象に1つまたは複数の療法を投与するステップをさらに含む、先行請求項のいずれか一項に記載の方法。
  29. 前記腫瘍割合および二項モデルを使用して、前記第1の標的核酸バリアントを前記cfNA試料中の第1の遺伝子座で検出する確率を推定するステップを含む、先行請求項のいずれか一項に記載の方法。
  30. 前記二項モデルが、所定のがんの型および/または第2の標的核酸バリアントに関する情報を含む、請求項29に記載の方法。
  31. 前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座に存在しないという決定が、前記第1の遺伝子座が野生型であることを示している、先行請求項のいずれか一項に記載の方法。
  32. 前記所定のがんの型が、結腸直腸がんであり、前記第1の遺伝子座が、KRAS、BRAF、またはNRASであり、前記第1の標的核酸バリアントが、前記cfNA試料中の前記第1の遺伝子座に存在しないという決定が、前記第1の遺伝子座が野生型KRAS、BRAF、またはNRASであることを示している、先行請求項のいずれか一項に記載の方法。
  33. セツキシマブおよび/またはパニツムマブを前記対象に投与するステップをさらに含む、請求項32に記載の方法。
  34. 前記cfNAがcfDNAを含む、先行請求項のいずれか一項に記載の方法。
  35. 前記cfNAがcfRNAを含む、先行請求項のいずれか一項に記載の方法。
  36. 前記第1の標的核酸バリアントが前記対象から異なる時点で得た異なるcfNA試料中の前記第1の遺伝子座に存在しないか否かをモニターするために、前記方法を1回または複数回反復するステップをさらに含む、先行請求項のいずれか一項に記載の方法。
  37. 前記第1の標的核酸バリアントが、前記cfNA試料中の前記第1の遺伝子座に存在しないという決定を確認または反証するために1つまたは複数の追加の試験を実施するステップをさらに含む、先行請求項のいずれか一項に記載の方法。
  38. 前記cfNA試料に関して最大突然変異体対立遺伝子頻度(MAX MAF)を決定するステップ、および前記MAX MAFを腫瘍割合推定値として使用するステップを含む、先行請求項のいずれか一項に記載の方法。
  39. 前記cfNA試料から得た複数の配列読み取りデータに基づいて、前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座で検出されないことを決定するステップを含む、先行請求項のいずれか一項に記載の方法。
  40. 前記第1の標的核酸バリアントが、前記cfNA試料中にクローンレベルで存在しないことを決定するステップを含む、先行請求項のいずれか一項に記載の方法。
  41. 前記第1の確率に基づく第1の尤度値および前記第2の確率に基づく第2の尤度値を生成するステップをさらに含む、先行請求項のいずれか一項に記載の方法。
  42. 前記第1の尤度値および前記第2の尤度値に基づいて定量値を決定するステップを含む、先行請求項のいずれか一項に記載の方法。
  43. 前記第1の尤度値および前記第2の尤度値を生成するステップが、前記cfNA試料の腫瘍割合推定値を決定するステップを含み、前記第1の尤度値および第2の尤度値が、前記腫瘍割合推定値に基づく、先行請求項のいずれか一項に記載の方法。
  44. 前記腫瘍割合推定値を決定するステップが、前記cfNA試料中の腫瘍突然変異の最大突然変異体対立遺伝子頻度(MAX MAF)を決定するステップを含む、請求項43に記載の方法。
  45. 前記MAX MAFを決定するステップが、前記複数の配列読み取りデータに基づいて腫瘍突然変異に関連する分子カウントを決定するステップを含む、請求項44に記載の方法。
  46. 前記第1の尤度値および前記第2の尤度値を生成するステップが、少なくとも第2のバリアントの対立遺伝子頻度を決定するステップを含み、前記第1の尤度値および前記第2の尤度値が、前記対立遺伝子頻度および前記MAX MAFにさらに基づく、請求項45に記載の方法。
  47. 前記対立遺伝子頻度を、前記MAX MAFに基づく第2の閾値と比較するステップであって、前記目的の第1の標的核酸バリアントが前記第1の遺伝子座にクローンレベルで存在しないことを決定するステップが、前記MAFと前記第2の閾値との比較にさらに基づくステップをさらに含む、請求項46に記載の方法。
  48. 前記対立遺伝子頻度を決定するステップが、前記複数の配列読み取りデータに基づいて前記第1の標的核酸バリアントに関連する第1の分子カウントを決定するステップを含む、請求項46に記載の方法。
  49. 前記定量値を決定するステップが、前記第1のバリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスするステップを含み、前記定量値が前記共変量情報に基づく、請求項46に記載の方法。
  50. 前記cfDNA試料中の少なくとも前記第2の標的核酸バリアントの出現を決定するステップであって、前記定量値が前記共変量情報にさらに基づくステップをさらに含む、請求項49に記載の方法。
  51. 前記定量値を決定するステップが、前記第1の標的核酸バリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスするステップを含み、前記定量値が前記共変量情報に基づく、請求項42に記載の方法。
  52. 前記cfNA試料中の少なくとも前記第2の標的核酸バリアントの出現を決定するステップであって、前記定量値が、前記第2の標的核酸バリアントの出現にさらに基づくステップをさらに含む、請求項51に記載の方法。
  53. 前記定量値が、前記第1の尤度値の前記第2の尤度値に対する比に基づく、請求項42に記載の方法。
  54. 前記第1の標的核酸バリアントが、前記定量値に基づいて前記cfNA試料中にクローンレベルで存在しない信頼レベルを決定するステップをさらに含む、請求項42に記載の方法。
  55. 前記cfNA試料中の少なくとも前記第2の標的核酸バリアントの出現を決定するステップ、および前記cfNA試料中の少なくとも前記第2の標的核酸バリアントの出現に基づいて前記定量値を調整するステップをさらに含む、請求項42に記載の方法。
  56. 前記比が、対数尤度腫瘍割合値、対数尤度相互排他性値、および対数事前値の合計に等しい対数事後確率比(LPPR)を含む、先行請求項のいずれか一項に記載の方法。
  57. 前記第1の遺伝子座または第2の遺伝子座が前記第2の標的核酸バリアントを含む、先行請求項のいずれか一項に記載の方法。
  58. 前記定量値が、陰性予測値(NPV)スコアを含む、先行請求項のいずれか一項に記載の方法。
  59. 前記所定のがんの型が肺がんを含み、前記第1の標的核酸バリアントが、EGFR、BRAF、ALK、ROS1、およびMETからなる群から選択される遺伝子における突然変異である、先行請求項のいずれか一項に記載の方法。
  60. 前記所定のがんの型が、結腸直腸がんを含み、前記第1の標的核酸バリアントが、KRAS、BRAF、およびNRASからなる群から選択される遺伝子における突然変異である、先行請求項のいずれか一項に記載の方法。
  61. 少なくとも1つの電子プロセッサーによって実行される場合に:
    cfDNA試料の複数の配列読み取りデータにアクセスするステップ;
    前記複数の配列読み取りデータに基づいて、第1のバリアントが前記試料中の第1の座で検出されていなかったことを決定するステップ;
    前記第1のバリアントがクローンレベルで存在しない確率に基づく第1の尤度値、および前記第1のバリアントがクローンレベルで存在する確率に基づく第2の尤度値を生成するステップ;
    前記第1の尤度値および前記第2の尤度値に基づいて定量値を決定するステップ;
    前記定量値を閾値と比較するステップ;ならびに
    前記比較に基づいて、前記目的の第1のバリアントが前記第1の座にクローンレベルで存在しないことを決定するステップ
    を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体を含むかまたはそれにアクセスすることが可能なコントローラを含むシステム。
  62. 少なくとも1つの電子プロセッサーによって実行される場合に:
    所定のがんの型を有する対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;
    前記配列情報から、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座で検出されないことを決定するステップ;
    前記配列情報から、前記第1の遺伝子座のカバレッジを決定するステップ;
    前記配列情報から、腫瘍割合を決定するステップ;
    前記カバレッジおよび前記腫瘍割合から、前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座に存在する確率を決定して、定量値を生成するステップ;ならびに
    前記定量値が閾値と異なれば、前記第1の標的核酸バリアントが、前記cfNA試料中の前記第1の遺伝子座に存在しないことを決定するステップ
    を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体を含むかまたはそれにアクセスすることが可能なコントローラを含むシステム。
  63. 少なくとも1つの電子プロセッサーによって実行される場合に:
    対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;
    前記配列情報から、第1の標的核酸バリアントが前記cfNA試料中に検出されないことを決定して、第1の試験結果を生成するステップ;
    前記配列情報から、少なくとも第2の標的核酸バリアントが前記cfNA試料中に検出されることを決定して、第2の試験結果を生成するステップ;
    前記第2の試験結果が与えられると、前記第1の標的核酸バリアントが前記cfNA試料中に存在しない第1の確率および/または前記第2の試験結果が与えられると、前記第1の標的核酸が前記cfNA試料中に存在する第2の確率を決定するステップ;
    第1の確率、第2の確率、および/またはその比を使用して定量値を生成するステップ;ならびに
    前記定量値が閾値と異なれば、前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座に存在しないことを決定するステップ
    を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体を含むかまたはそれにアクセスすることが可能なコントローラを含むシステム。
  64. 少なくとも1つの電子プロセッサーによって実行される場合に:
    対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;
    前記配列情報から、第1の標的核酸バリアントが前記cfNA試料中に検出されないことを決定するステップ;
    少なくとも1つの腫瘍割合に基づく値を生成するステップ;
    少なくとも1つの相互排他性値を生成するステップ;ならびに
    前記腫瘍割合に基づく値および/または前記相互排他性値を使用して、前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座に存在しないことを決定するステップ
    を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体を含むかまたはそれにアクセスすることが可能なコントローラを含むシステム。
  65. 少なくとも電子プロセッサーによって実行される場合に:
    cfDNA試料の複数の配列読み取りデータにアクセスするステップ;
    前記複数の配列読み取りデータに基づいて、第1のバリアントが前記試料中の第1の座で検出されていなかったことを決定するステップ;
    前記第1のバリアントがクローンレベルで存在しない確率に基づく第1の尤度値、および前記第1のバリアントがクローンレベルで存在する確率に基づく第2の尤度値を生成するステップ;
    前記第1の尤度値および前記第2の尤度値に基づいて定量値を決定するステップ;
    前記定量値を閾値と比較するステップ;ならびに
    前記比較に基づいて、前記目的の第1のバリアントが第1の座にクローンレベルで存在しないことを決定するステップ
    を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体。
  66. 少なくとも電子プロセッサーによって実行される場合に:
    所定のがんの型を有する対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;
    前記配列情報から、第1の標的核酸バリアントがcfNA試料中の第1の遺伝子座で検出されないことを決定するステップ;
    前記配列情報から、前記第1の遺伝子座のカバレッジを決定するステップ;
    前記配列情報から、腫瘍割合を決定するステップ;
    前記カバレッジおよび前記腫瘍割合から、前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座に存在する確率を決定して、定量値を生成するステップ;ならびに
    前記定量値が閾値と異なれば、前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座に存在しないことを決定するステップ
    を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体。
  67. 少なくとも電子プロセッサーによって実行される場合に:
    対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;
    前記配列情報から、第1の標的核酸バリアントが前記cfNA試料中に検出されないことを決定して、第1の試験結果を生成するステップ;
    前記配列情報から、少なくとも第2の標的核酸バリアントが前記cfNA試料中に検出されることを決定して、第2の試験結果を生成するステップ;
    前記第2の試験結果が与えられると、前記第1の標的核酸バリアントがcfNA試料中に存在しない第1の確率、および/または前記第2の試験結果が与えられると、前記第1の標的核酸が前記cfNA試料中に存在する第2の確率を決定するステップ;
    前記第1の確率、前記第2の確率、および/またはその比を使用して、定量値を生成するステップ;ならびに
    前記定量値が閾値と異なれば、前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座に存在しないことを決定するステップ
    を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体。
  68. 少なくとも電子プロセッサーによって実行される場合に:
    対象から得た無細胞核酸(cfNA)試料から生成された配列情報にアクセスするステップ;
    前記配列情報から、第1の標的核酸バリアントが前記cfNA試料中に検出されないことを決定するステップ;
    少なくとも1つの腫瘍割合に基づく値を生成するステップ;
    少なくとも1つの相互排他性値を生成するステップ;ならびに
    前記腫瘍割合に基づく値および/または前記相互排他性値を使用して、前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座に存在しないことを決定するステップ
    を少なくとも実施する非一時的コンピュータ実行可能命令を含むコンピュータ可読媒体。
  69. 前記定量値が、前記閾値より小さい、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  70. 前記定量値が、前記閾値より大きい、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  71. 前記第1および第2の試験結果が互いに従属する、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  72. 複数の他の選択された標的核酸バリアントが1つまたは複数の他の遺伝子座に存在しないことを決定するステップを含む、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  73. 前記定量値が、対数尤度比(LLR)閾値を含む、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  74. 前記第1の標的核酸バリアントが複数の参照cfNA試料中の前記第1の遺伝子座に存在しないことを決定して、前記閾値を生成するステップを含む、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  75. 前記閾値が、クローン性またはサブクローン性閾値を含む、請求項74に記載のシステムまたはコンピュータ可読媒体。
  76. 前記第1の標的核酸バリアントが、ドライバー突然変異を含む、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  77. 前記命令がさらに、前記第1の標的核酸バリアントが前記cfNA試料中の前記第1の遺伝子座に存在しないという決定に基づいて、前記対象に関して1つまたは複数の療法推奨を出力するステップを少なくとも実施する、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  78. 前記命令がさらに、前記腫瘍割合および二項モデルを使用して、前記第1の標的核酸バリアントを前記cfNA試料中の前記第1の遺伝子座で検出する確率を推定するステップを少なくとも実施する、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  79. 前記命令がさらに、前記cfNA試料に関して最大突然変異体対立遺伝子頻度(MAX MAF)を決定するステップ、および前記MAX MAFを前記腫瘍割合推定値として使用するステップを少なくとも実施する、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  80. 前記命令がさらに、前記第1の標的核酸バリアントが前記cfNA試料中にクローンレベルで存在しないこと決定するステップを少なくとも実施する、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  81. 前記命令がさらに、前記第1の確率に基づく第1の尤度値および前記第2の確率に基づく第2の尤度値を生成するステップを少なくとも実施する、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  82. 前記命令がさらに、前記第1の尤度値および前記第2の尤度値に基づいて前記定量値を決定するステップを少なくとも実施する、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  83. 前記命令がさらに、前記cfNA試料の前記腫瘍割合推定値を決定することによって、前記第1の尤度値および前記第2の尤度値を生成するステップであって、前記第1の尤度値および前記第2の尤度値が前記腫瘍割合推定値に基づくステップを少なくとも実施する、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  84. 前記命令がさらに、前記cfNA試料中の腫瘍突然変異の最大突然変異体対立遺伝子頻度(MAX MAF)を決定することによって前記腫瘍割合推定値を決定するステップを少なくとも実施する、請求項83に記載のシステムまたはコンピュータ可読媒体。
  85. 前記命令がさらに、前記複数の配列読み取りデータに基づいて前記腫瘍突然変異に関連する分子カウントを決定することによって前記MAX MAFを決定するステップを少なくとも実施する、請求項84に記載のシステムまたはコンピュータ可読媒体。
  86. 前記命令がさらに、少なくとも第2のバリアントの対立遺伝子頻度を決定することによって、前記第1の尤度値および前記第2の尤度値を生成するステップであって、前記第1の尤度値および前記第2の尤度値が、前記対立遺伝子頻度および前記MAX MAFにさらに基づくステップを少なくとも実施する、請求項84に記載のシステムまたはコンピュータ可読媒体。
  87. 前記命令がさらに、前記対立遺伝子頻度を、前記MAX MAFに基づく前記第2の閾値と比較するステップ、および前記MAFと前記第2の閾値との比較にさらに基づいて、前記目的の第1の標的核酸バリアントが前記第1の遺伝子座にクローンレベルで存在しないことを決定するステップを少なくとも実施する、請求項86に記載のシステムまたはコンピュータ可読媒体。
  88. 前記命令がさらに、前記複数の配列読み取りデータに基づいて前記第1の標的核酸バリアントに関連する第1の分子カウントを決定することによって、前記対立遺伝子頻度を決定するステップを少なくとも実施する、請求項86に記載のシステムまたはコンピュータ可読媒体。
  89. 前記命令がさらに、前記第1のバリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスすることによって前記定量値を決定するステップであって、前記定量値が前記共変量情報に基づくステップを少なくとも実施する、請求項86に記載のシステムまたはコンピュータ可読媒体。
  90. 前記命令がさらに、前記cfDNA試料中の少なくとも前記第2の標的核酸バリアントの出現を決定するステップであって、前記定量値が前記共変量情報にさらに基づくステップを少なくとも実施する、請求項89に記載のシステムまたはコンピュータ可読媒体。
  91. 前記命令がさらに、前記第1の標的核酸バリアントとの同時発生および/または相互排他性を示す1つまたは複数のバリアントの過去の有病率を示す共変量情報にアクセスすることによって前記定量値を決定するステップであって、前記定量値が前記共変量情報に基づくステップを少なくとも実施する、請求項83に記載のシステムまたはコンピュータ可読媒体。
  92. 前記命令がさらに、前記cfNA試料中の少なくとも前記第2の標的核酸バリアントの出現を決定するステップであって、前記定量値が前記第2の標的核酸バリアントの出現にさらに基づくステップを少なくとも実施する、請求項91に記載のシステムまたはコンピュータ可読媒体。
  93. 前記命令がさらに、前記定量値に基づいて、前記第1の標的核酸バリアントが前記cfNA試料中にクローンレベルで存在しない信頼レベルを決定するステップを少なくとも実施する、請求項83に記載のシステムまたはコンピュータ可読媒体。
  94. 前記命令がさらに、前記cfNA試料中の少なくとも前記第2の標的核酸バリアントの出現を決定するステップ、および前記cfNA試料中の少なくとも前記第2の標的核酸バリアントの出現に基づいて前記定量値を調整するステップを少なくとも実施する、請求項83に記載のシステムまたはコンピュータ可読媒体。
  95. 前記比が、対数尤度腫瘍割合値、対数尤度相互排他性値、および対数事前値の合計に等しい対数事後確率比(LPPR)を含む、先行請求項のいずれか一項に記載のシステムまたはコンピュータ可読媒体。
  96. 前記第1の標的核酸バリアントが前記試料中の前記第1の遺伝子座に存在しないことに関する情報、および/またはそれに由来する情報を必要に応じて含む報告書を作成するステップをさらに含む、先行請求項のいずれか一項に記載の方法またはシステム。
  97. 前記試料が由来する対象または医療従事者などの第3者に報告書を通信するステップをさらに含む、請求項96に記載の方法またはシステム。
JP2022545998A 2020-01-31 2021-01-29 標的バリアントがクローンレベルで存在しないことの有意性モデリング Pending JP2023512239A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062968507P 2020-01-31 2020-01-31
US62/968,507 2020-01-31
PCT/US2021/015837 WO2021155241A1 (en) 2020-01-31 2021-01-29 Significance modeling of clonal-level absence of target variants

Publications (2)

Publication Number Publication Date
JP2023512239A true JP2023512239A (ja) 2023-03-24
JPWO2021155241A5 JPWO2021155241A5 (ja) 2024-01-31

Family

ID=74759476

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022545998A Pending JP2023512239A (ja) 2020-01-31 2021-01-29 標的バリアントがクローンレベルで存在しないことの有意性モデリング

Country Status (5)

Country Link
US (1) US20210398610A1 (ja)
EP (1) EP4097724A1 (ja)
JP (1) JP2023512239A (ja)
CN (1) CN115428087A (ja)
WO (1) WO2021155241A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117219162A (zh) * 2023-09-12 2023-12-12 四川大学 针对肿瘤组织str图谱进行身源鉴定的证据强度评估方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
EP1448799B2 (en) 2001-11-28 2018-05-16 Life Technologies Corporation Methods of selective nucleic acid isolation
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
ES2906714T3 (es) 2012-09-04 2022-04-20 Guardant Health Inc Métodos para detectar mutaciones raras y variación en el número de copias
GB201412834D0 (en) * 2014-07-18 2014-09-03 Cancer Rec Tech Ltd A method for detecting a genetic variant
WO2016179049A1 (en) * 2015-05-01 2016-11-10 Guardant Health, Inc Diagnostic methods
US20190316184A1 (en) * 2018-04-14 2019-10-17 Natera, Inc. Methods for cancer detection and monitoring
WO2019241250A1 (en) * 2018-06-11 2019-12-19 Foundation Medicine, Inc. Compositions and methods for evaluating genomic alterations

Also Published As

Publication number Publication date
CN115428087A (zh) 2022-12-02
WO2021155241A1 (en) 2021-08-05
US20210398610A1 (en) 2021-12-23
EP4097724A1 (en) 2022-12-07

Similar Documents

Publication Publication Date Title
JP7421474B2 (ja) 腫瘍遺伝子変異量の正規化
JP7242644B2 (ja) 体細胞および生殖細胞系統バリアントを鑑別するための方法およびシステム
US20220025468A1 (en) Homologous recombination repair deficiency detection
US20230360727A1 (en) Computational modeling of loss of function based on allelic frequency
JP2023517029A (ja) 無細胞核酸において検出された遺伝的突然変異を、腫瘍起源または非腫瘍起源として分類するための方法
US20210358569A1 (en) Methods and systems for assessing microsatellite instability
US20240141425A1 (en) Correcting for deamination-induced sequence errors
US20210398610A1 (en) Significance modeling of clonal-level absence of target variants
US20220344004A1 (en) Detecting the presence of a tumor based on off-target polynucleotide sequencing data
US20220068433A1 (en) Computational detection of copy number variation at a locus in the absence of direct measurement of the locus

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240123

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240123