JP7332695B2 - 循環核酸からの全ゲノム配列データにおける包括的配列特徴の同定 - Google Patents

循環核酸からの全ゲノム配列データにおける包括的配列特徴の同定 Download PDF

Info

Publication number
JP7332695B2
JP7332695B2 JP2021534660A JP2021534660A JP7332695B2 JP 7332695 B2 JP7332695 B2 JP 7332695B2 JP 2021534660 A JP2021534660 A JP 2021534660A JP 2021534660 A JP2021534660 A JP 2021534660A JP 7332695 B2 JP7332695 B2 JP 7332695B2
Authority
JP
Japan
Prior art keywords
cell
free dna
fragment size
sample
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021534660A
Other languages
English (en)
Other versions
JP2022513946A (ja
Inventor
ラブジョイ,アレクサンダー
ケイシー,ファーガル
ツァイ,ミーンヤーン
フオン,リヤーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2022513946A publication Critical patent/JP2022513946A/ja
Application granted granted Critical
Publication of JP7332695B2 publication Critical patent/JP7332695B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Epidemiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

本開示は、一般に、がんスクリーニングに関するものであり、より具体的には、無細胞DNA(cfDNA)試料から得られる全ゲノム配列データにおける包括的ながん特異的配列特徴の同定のための技術に関するものである。
血漿ジェノタイピングアッセイ及び他の液体細胞診アッセイの開発は、がん患者管理のための非侵襲性がんバイオマーカーとしての無細胞DNA(cfDNA)の臨床的有用性を拡大した。例えば、血漿ジェノタイピングアッセイは、非悪性細胞によって放出された野生型DNAの高バックグラウンドにおいて、循環腫瘍DNA(ctDNA)内の臨床的に重要な点突然変異、挿入/欠失、増幅、再配列、及び異数性を非侵襲的に検出し、定量化することができる。従来の物理的及び生化学的方法と比較して、血液に基づくctDNA検出は、病態のモニタリング、予後判定、及び治療についての指導のための非侵襲的かつ容易に利用可能な方法を提供する。しかしながら、血漿ジェノタイピングアッセイ及び他の液体細胞診アッセイは、非侵襲的ctDNA突然変異検出及び微小残存病変(MRD)のモニタリングにおいて有用性が証明されているため、臨床診断がなされる前に、がんの存在を識別する検出力を有するかどうかを決定するために技術を拡張すること(すなわち、がんスクリーニング)に関心が寄せられている。
現在、cfDNAの次世代配列決定(NGS)アッセイは、既知のがん遺伝子と再発がん変形位置をカバーする小さな標的パネル(通常はサイズで300kb未満)から情報を抽出するように設計されており、このようなパネルは病態のモニタリングに成功している。いくつかのアプローチでは、ctDNA突然変異を、エキソソーム、循環腫瘍細胞、タンパク質、及び代謝産物などの複数の他の血液ベースの分析物と統合するとともに、初期段階のがんを検出するためのcfDNAのNGSアッセイを拡大するために、各個体についてこれらのシグナルを経時的に統合している。しかしながら、スクリーニング適用(発症前又は臨床診断前のがんの検出)では、モニタリングとは対照的に、特定のがん突然変異の有無は、がんと正常な試料との間で差があるcfDNA配列データから一般的な包括的ながん特異的配列特徴を見つけることよりも重要ではない。したがって、がんスクリーニングには新しい技術が望まれる。
無細胞DNA(cfDNA)試料から得られた全ゲノム配列データにおける包括的ながん特異的配列特徴の同定のための技術が提供される(例えば、方法、システム、1つ又は複数のプロセッサによって実行可能なコード又は命令を記憶する非一時的なコンピュータ可読媒体)。
1つ又は複数のコンピュータのシステムは、ソフトウェア、ファームウェア、ハードウェア、又はそれらの組み合わせをシステムにインストールして、操作中にシステムに動作を実行させることにより、特定の操作又は動作を実行するように構成することができる。データ処理装置によって実行されると、装置に動作を実行させる命令を含めることによって、特定の操作又は動作を実行するように1つ又は複数のコンピュータプログラムを構成することができる。1つの一般的な態様は、以下を含む方法に向けられる:(a)データ処理システムによって、対象からの無細胞DNAの試料から全ゲノム配列データを得ることであって、ここで、全ゲノム配列データは複数の全ゲノム配列読み取りを含む。この方法はまた、(b)データ処理システムによって、複数のゲノム配列読み取りの少なくとも過半数から2つ以上のメトリックを計算することを含み、ここで、2つ以上のメトリックの第1のメトリックは、(i)無細胞DNAのフラグメントサイズ、(ii)複数の全ゲノム配列読み取りの相対読み取り深度、又は(iii)生殖系列対立遺伝子不均衡である。この方法はまた、(c)データ処理システムによって、2つ以上のメトリックを分類器に入力して、第1のクラスについての第1の予測及び第2のクラスについての第2の予測を得ることを含み、ここで、第1のクラスは循環腫瘍DNAを含む無細胞DNAの試料であり、第2のクラスは循環腫瘍DNAを含まない無細胞DNAの試料である。この方法はまた、(d)データ処理システムによって、第1の予測及び第2の予測に基づいて、無細胞DNAの試料を第1のクラス又は第2のクラスとして分類することを含む。この態様の他の実施態様は、対応するコンピュータシステム、装置、及び1つ又は複数のコンピュータ記憶装置に記録されたコンピュータプログラムを含み、それぞれが方法の動作を実行するように構成されている。
実装は、次の特徴の1つ又は複数を含み得る。2つ以上のメトリックの第2のメトリックが、(i)無細胞DNAのフラグメントサイズ、(ii)複数の全ゲノム配列読み取りの相対読み取り深度、又は(iii)生殖系列対立遺伝子不均衡であって;ここで、第2のメトリックは第1のメトリックと異なる、方法。分類器が線形判別分析である方法。第3のメトリックが計算されて分類器に入力される方法、第3のメトリックは、(i)無細胞DNAのフラグメントサイズ、(ii)複数の全ゲノム配列読み取りの相対読み取り深度、又は(iii)生殖系列対立遺伝子不均衡であり;ここで、第1のメトリック、第2のメトリック、及び第3のメトリックのそれぞれは異なるメトリックである。
実装は、次の特徴の1つ又は複数を含み得る。試料中で得られた無細胞DNAフラグメントサイズを正規化し、それにより確率密度関数値を得ることにより、無細胞DNAのフラグメントサイズが計算される方法。無細胞DNAのフラグメントサイズが確率密度関数内の領域の比率を含む方法。確率密度関数内の領域の比率が、長さが約116から約156の間のヌクレオチドの無細胞DNAフラグメントサイズの確率の比率、及び長さが約164から約168の間のヌクレオチドのモードの周辺の無細胞DNAフラグメントサイズの確率の比率を含む方法。
実装は、次の特徴の1つ又は複数を含み得る。無細胞DNAのフラグメントサイズが、以下によって得られる統計的スコアである方法:(i)試料中で得られた無細胞DNAフラグメントサイズを正規化し、それによって確率密度関数値を得ること;(ii)無細胞DNAフラグメントサイズの値の対数及び連続する無細胞DNAフラグメントサイズ間の第1の差を決定すること;(iii)少なくとも20個の最小無細胞DNAフラグメントサイズを除去して、残りの無細胞DNAフラグメントサイズを得ること;及び(iv)循環腫瘍DNAを含む無細胞DNA及び循環腫瘍DNAを含まない無細胞DNAと比較した、残りの無細胞DNAフラグメントサイズの第1の主成分軸を決定すること。複数の全ゲノム配列読み取りの相対読み取り深度が以下によって計算される方法:(i)無細胞DNAフラグメントサイズ配列読み取りカウントを前処理して、正規化された無細胞DNAフラグメントサイズ配列読み取りカウントのセットを得ること;(ii)正規化された無細胞DNAフラグメントサイズ配列読み取りカウントのセットについて、染色体アームあたりの読み取り深度の中央値を決定すること;及び(iii)染色体アームあたりの読み取り深度の中央値の最大値を決定して、コピー数増幅スコアを得ること。
実装は、次の特徴の1つ又は複数を含み得る。前処理が以下を含む方法:(i)様々な試料からの配列読み取りカウントを所定のサイズを有するウィンドウ中にマッピングすること;(ii)1つ又は複数の因子に基づいて、各ウィンドウ中の配列読み取りカウントをフィルタリングし、各ウィンドウの残りの無細胞DNAフラグメントサイズ配列読み取りカウントのセットを得ること;(iii)各ウィンドウ中のグアニン-シトシン含有量及びマッピング可能性バイアスを補正すること;及び(iv)循環腫瘍DNAを含む無細胞DNA試料からの配列データに対して、各ウィンドウ中の残りの無細胞DNAフラグメントサイズ配列読み取りカウントを正規化すること。複数の全ゲノム配列読み取りの相対読み取り深度が、以下によって計算される方法:(i)固有の無細胞DNAフラグメントサイズ配列読み取りカウントをマッピングして、パーセンタイルで測定された無細胞DNAフラグメントサイズ読み取りカウント分布を得ること;及び(ii)99パーセンタイル以上での無細胞DNAフラグメントサイズ読み取りカウント分布を評価して、複数の全ゲノム配列読み取りの相対読み取り深度を決定し、コピー数増幅スコアを得ること。複数の全ゲノム配列読み取りの相対読み取り深度が、以下によって計算される方法:(i)固有の無細胞DNAフラグメントサイズ配列読み取りカウントをマッピングして、パーセンタイルで測定された無細胞DNAフラグメントサイズ読み取りカウント分布を得ること;及び(ii)各染色体アームの配列読み取りカウント深度の少なくとも90パーセンタイルを各染色体アームの配列読み取りカウント深度の中央値で割った比率を決定し、コピー数増幅スコアを得ること。
実装は、次の特徴の1つ又は複数を含み得る。生殖系列対立遺伝子不均衡を、統計モデルを使用して計算し、無細胞DNAの試料中の1つ又は複数の生殖系列対立遺伝子不均衡部位の確率値の中央値を決定し、対立遺伝子不均衡スコアを得る方法。統計モデルが二項確率モデルを含む方法。1つ又は複数の生殖系列対立遺伝子不均衡部位の確率値の中央値が所定の有意水準を下回る場合、確率値の中央値が、無細胞DNAの試料中の1つ又は複数の生殖系列部位における対立遺伝子不均衡を示す方法。
実装は、次の特徴の1つ又は複数を含み得る。生殖系列対立遺伝子不均衡がヘテロ接合性の喪失を含む方法。対象におけるがんの臨床診断の前に、対象から無細胞DNAの試料を得る方法。対象におけるがんの臨床診断後に、対象から無細胞DNAの試料を得る方法。方法は、データ処理システムによって、無細胞DNAの試料の第1のクラス又は第2のクラスとしての分類に基づいて、対象が微小残存病変を有するかどうかを予測することをさらに含む。方法は、対象が最小残存病変を有すると予測した場合に、対象の治療を改変することをさらに含む。
1つの一般的な態様は、以下を含む方法に向けられる:(a)対象からの無細胞DNAの試料から得られた全ゲノム配列データの特徴について2つ以上のスコアを計算すること。ここで、特徴は以下を含む:(i)無細胞DNAのフラグメントサイズ、(ii)複数の全ゲノム配列読み取りの相対読み取り深度、(iii)生殖系列対立遺伝子不均衡;(iv)ソフトクリッピング率、(v)置換型の比率、(vi)全体的な予測体細胞変異カウント、(vii)不一致な読み取りの比率、(vi)相対的なLINE/SINE要素の読み取り深度、又はそれらの組み合わせ;(b)データ処理システムによって、2つ以上のスコアを分類器に入力して、第1のクラスについての第1の予測及び第2のクラスについての第2の予測を得ること、ここで、第1のクラスは循環腫瘍DNAを含む無細胞DNAの試料であり、第2のクラスは循環腫瘍DNAを含まない無細胞DNAの試料である;(c)データ処理システムによって、第1の予測及び第2の予測に基づいて、無細胞DNAの試料を第1のクラス又は第2のクラスとして分類すること;及び(d)データ処理システムによって、無細胞DNAの試料を第1のクラス又は第2のクラスとして分類することに基づいて、対象が微小残存病変を有するかどうかを決定すること。
実装は、次の特徴の1つ又は複数を含み得る。無細胞DNAの試料が第1のクラスとして分類された場合、対象が微小残存病変を有すると決定する方法。無細胞DNAの試料が第2のクラスとして分類された場合、対象が微小残存病変を有しないと決定する方法。この方法はさらに、データ処理システムによって、対象が微小残存病変を有するかどうかに基づいて、対象の治療レジメンの臨床転帰を予測すること;及び対象が微小残存病変を有すると決定され、陰性の臨床転帰を予測すると、対象の治療レジメンを改変することを含む。この態様の他の実施態様は、対応するコンピュータシステム、装置、及び1つ又は複数のコンピュータ記憶装置に記録されたコンピュータプログラムを含み、それぞれが方法の動作を実行するように構成されている。
上記及び以下に記載する技術は、多くの方法及び多くの状況において実施され得る。以下に詳細に記述するように、以下の図を参照して、いくつかの例の実装及びコンテキストが提供される。しかし、以下の実装及びコンテキストは、数ある中のほんの一部に過ぎない。
図1は、様々な実施態様による、無細胞DNA試料から得られた全ゲノム配列データにおける包括的ながん特異的配列特徴の同定のためのプロセスを示すフローチャートを示す。 図2は、様々な実施態様による、配列分析システムのブロック図を示す。 図3は、様々な実施態様による、計算システム又はデータ処理システムのブロック図を示す。 図4は、様々な実施態様による、フラグメントスコアを計算するためのプロセスを示すフローチャートを示す。 図5は、様々な実施態様による、コピー数増幅スコアを計算するためのプロセスを示すフローチャートを示す。 図6は、様々な実施態様による、がん試料及び正常試料におけるカバレッジプロファイルからノイズを除去するための前処理の効果を示す。 図7A-7Cは、様々な実施態様による、正常試料から結腸がん及び肺がんのデータセットを分離するための特徴要約の単変量解析を示す。 図8は、様々な実施態様による、特徴要約の多変量解析において使用される分類器の曲線下受信者操作特性(ROC)領域(AUC)を示している。 図9は、様々な実施態様による、健常である、結腸がんを呈する、又は肺がんを呈する個体由来の多数の試料についてのLDAスコア及びCNAスコアを示す。 図10は、様々な実施態様による、微小残存病変を有する患者を診断するためのプロセスを示すフローチャートを示す。
以下の記述では、様々な実施態様が記述されるであろう。説明の目的のために、具体的な構成及び詳細は、実施態様の完全な理解を提供するために示される。しかし、具体的な詳細なしに実施することができることは、当業者にも明らかであろう。さらに、記載されている実施態様を不明瞭にしないために、周知の特徴を省略又は単純化してもよい。
I.序文
様々な実施態様では、循環核酸から得られた配列データを使用して、がんをスクリーニングするための技術(例えば、方法、システム、コード又は1つ若しくは複数のプロセッサによって実行可能な命令を記憶する非一時的なコンピュータ可読媒体)が提供される。いくつかの実施態様では、循環核酸は、腫瘍から直接由来するか、或いは原発腫瘍から脱落して血流又はリンパ系に入る生存可能な無傷の腫瘍細胞である循環腫瘍細胞(CTC)に由来するctDNAである。ctDNAは、血流中で自由に循環しているが、必ずしも腫瘍起源ではないDNAを記述するより広い用語であるcfDNAとは異なる。ctDNAは腫瘍ゲノム全体を反映している可能性があるため、その潜在的な臨床的有用性について注目されている。例えば、ctDNAの液体細胞診を、様々な時点での採血のような非侵襲的形態で得て、治療レジメン全体にわたって腫瘍の進行を監視することができる。
より最近では、研究者は、一般的ながんの種類をスクリーニングするために、ctDNAの液体細胞診の通常の使用を拡大している。本明細書で使用される、がんなどの疾患又は病態に対する「スクリーニング」又はスクリーニングとは、症状を呈していないか、或いは疾患又は病態と以前に診断されていない対象における、疾患又は病態の可能性の有無を決定するための技術を指す。これらのアッセイは、血液ベースの分析物(エキソソーム、循環腫瘍細胞、タンパク質、及び代謝産物など)のレベル及び血液中のcfDNAからのがん遺伝子突然変異の存在を同時に評価する。がん遺伝子突然変異を同定するために使用されるアッセイにおける突然変異パネルは、偽陽性結果を最小限に抑え、アッセイを安価に保つために意図的に小さく保たれている。これらのアッセイに関連する問題は、循環中のctDNAが局所疾患よりも進行した患者及び転移性の患者においてより代表的なものであり、突然変異を発見する可能性は疾患の侵攻性とともに高くなり、したがって、これらのアッセイにおける突然変異パネルは、cfDNAにおけるがん関連の遺伝子変化を検出するのに必ずしも十分な感度があるとは限らない。さらに、血液ベースの分析物又はがん遺伝子突然変異の存在だけでは、がんのスクリーニングに十分な感度がないので、多分析物アプローチは適切な感度を有するスクリーニングアッセイを開発するために重要である。
これらの問題に対処するために、本明細書に開示される様々な実施態様は、循環核酸から得られる全ゲノム配列データにおける包括的ながん特異的配列特徴の同定のための技術に向けられる。この技術は、包括的ながん特異的配列特徴を多変量分類器で組み合わせて、循環核酸を含む試料がctDNAを含むかどうかを予測し、任意で基準標準のセットを保留して、配列決定バックグラウンドの変動を体系的にモデル化する。包括的ながん特異的配列特徴は、循環核酸に存在する特定の突然変異とは無関係であり、本明細書中で実証されるように、がん試料と非がん試料とを正確に区別するために決定されている。驚くべきことに、これらの技術によって同定されるがん試料のいくつかは、通常のctDNA突然変異パネルによって検出される単一の体細胞突然変異を有していないことが発見され、したがって、これらの技術は、検出可能な突然変異が存在しない場合でも、実際にctDNAを可視化する。
本開示の1つの例示的実施態様は、(a)データ処理システムによって、対象からの無細胞DNAの試料から全ゲノム配列データを得ることであって、ここで、全ゲノム配列データが複数の全ゲノム配列読み取りを含む、全ゲノム配列データを得ることを含む。この方法はまた、(b)データ処理システムによって、複数のゲノム配列読み取りの少なくとも過半数から2つ以上のメトリックを決定することを含み、ここで、2つ以上のメトリックの第1のメトリックは、(i)無細胞DNAのフラグメントサイズ、(ii)複数の全ゲノム配列読み取りの相対読み取り深度、又は(iii)生殖系列対立遺伝子不均衡である。この方法はまた、(c)データ処理システムによって、2つ以上のメトリックを分類器に入力して、第1のクラスについての第1の予測及び第2のクラスについての第2の予測を得ることを含み、ここで、第1のクラスは循環腫瘍DNAを含む無細胞DNAの試料であり、第2のクラスは循環腫瘍DNAを含まない無細胞DNAの試料である。この方法はまた、(d)データ処理システムによって、第1の予測及び第2の予測に基づいて、無細胞DNAの試料を第1のクラス又は第2のクラスとして分類することを含む。本明細書で使用される場合、動作が何かによって「トリガーされる」か「それに基づく」場合、これは、動作がトリガーされるか、又は何かの少なくとも一部に少なくとも部分的に基づくことを意味する。
有利なことに、これらのアプローチは、突然変異の検出に依存することなくがんをスクリーニングするためのctDNAの液体細胞診の通常の使用を拡大する。さらに、これらのアプローチは、がん試料と非がん試料を正確に区別するだけでなく、単一の体細胞突然変異が検出されない試料中のがんを検出することも実証されている。したがって、これらのアプローチは、検出可能な突然変異がない場合にctDNAを可視化することができる。
II.循環核酸から得られた全ゲノム配列データにおける包括的ながん特異的配列特徴の同定のための技術
図1は、循環核酸から得られる全ゲノム配列データにおける包括的ながん特異的配列特徴の同定のためのプロセス及び操作を示す。個々の実施態様は、フローチャート、フローダイアグラム、データフローダイアグラム、構造ダイアグラム、又はブロックダイアグラムとして描かれるプロセスとして記述することができる。フローチャートは、操作を連続プロセスとして記述し得るが、操作の多くは並行して或いは同時に実行され得る。さらに、操作の順序は再配置され得る。プロセスは、その操作が完了したときに終了するが、図又はその記述に含まれない追加のステップを有し得る。プロセスは、方法、機能、手順、サブルーチン、サブプログラムなどに対応し得る。プロセスが関数に対応する場合、その終了は関数の呼び出し元の関数又はmain関数への戻りに対応し得る。
図1に示されているプロセス及び/又は操作は、1つ又は複数の処理ユニット(例えば、プロセッサコア)、ハードウェア、又はそれらの組み合わせによって実行されるソフトウェア(例えば、コード、指示、プログラム)で実装され得る。ソフトウェアは、メモリ(例えば、メモリデバイス上、非一時的なコンピュータ可読媒体上)に記憶することができる。図1の特定の一連の処理ステップは、限定することを意図するものではない。また別の実施態様によれば、ステップの他の順序を実行することもできる。例えば、代替の実施態様では、本明細書に概説されるステップは、異なる順序で実施され得る。さらに、図1に示される個々のステップは、個々のステップに適切な様々な順序で実行され得る複数のサブステップを含み得る。さらに、特定の用途に応じて、操作又はステップが追加又は削除され得る。当業者は、多くの変更、改変及び代替を理解するであろう。
図1は、循環核酸から得られる全ゲノム配列データにおける包括的ながん特異的配列特徴の同定のためのプロセスを示すフローチャート100を示す。いくつかの実施態様では、フローチャート100に示されるプロセスは、図2及び3に示されるアーキテクチャ、システム、及び技術によって実装され得る。ステップ105において、全ゲノム配列データは、対象(例えば、患者)からのcfDNAの試料から得られる。全ゲノム配列データは、複数の全ゲノム配列読み取りを含む。配列の読み取りは、シングルエンド又はペアエンド配列決定によって得られ、セクションIIIで詳細に記述されているように、任意の適切な配列決定技術を使用して分析され得る。いくつかの実施態様では、cfDNAを有する1つ又は複数の試料が得られ(例えば、対象から血液を採取することにより)、配列分析システムにより配列決定され、cfDNAの配列データが生成され、配列データがデータ処理システムによって分析され、腫瘍負荷及び腫瘍負荷の統計的有意性などの出力が提供される。他の実施態様では、配列データは、データ処理システムによって、任意の供給源(公的又は私的)から適切な方法で得られ、データ処理システムによって分析され、cfDNAのフラグメントサイズ、複数の全ゲノム配列読み取りの相対読み取り深度、又は生殖系列対立遺伝子不均衡などの出力を提供する。いくつかの実施態様では、cfDNAの試料は、対象におけるがんの臨床診断の前に、対象から得られる。他の実施態様では、cfDNAの試料は、対象におけるがんの臨床診断後に、対象から得られる。
全ゲノム配列決定(WGS、全ゲノム配列決定、完全ゲノム配列決定、又はゲノム全体の配列決定としても知られる)は、生物のゲノムの完全なDNA配列を一度に決定するプロセスである。例えば、cfDNAは、対象から単純な静脈穿刺によって採取することができ、対象の全ゲノム配列決定のために使用することができる。いくつかの実施態様では、全ゲノム配列決定は、cfDNAの低カバレッジ全ゲノム配列データを生成するためのローパス全ゲノム配列決定である。本明細書で使用される場合、DNA配列決定における「カバレッジ」(又は深度)は、再構築された配列内に所与のヌクレオチドを含む固有の読み取りの数である。深部配列決定とは、配列の各領域の多数の固有の読み取り(例えば、>100x)を目的とする一般的な概念を指し、通常、cfDNAにおける変異体の検出に使用される。対照的に、本明細書で使用される場合、「ローパス」配列決定は、10x未満の深度まで配列決定されるゲノムを指す。
ステップ110において、複数のゲノム配列読み取りの少なくとも過半数から、2つ以上のメトリックが計算される。本明細書で使用される場合、「過半数」は、全体の大部分、又は半分以上である。例えば、過半数は、複数のゲノム配列読み取りの半分以上からなる複数のゲノム配列読み取りのサブセットである。いくつかの実施態様では、2つ以上のメトリックの第1のメトリックは、(i)cfDNAのフラグメントサイズ、(ii)複数の全ゲノム配列読み取りの相対読み取り深度、又は(iii)生殖系列対立遺伝子不均衡である。いくつかの実施態様では、2つ以上のメトリックの第2のメトリックは、(i)cfDNAのフラグメントサイズ、(ii)複数の全ゲノム配列読み取りの相対読み取り深度、又は(iii)生殖系列対立遺伝子不均衡であり、第2のメトリックは第1のメトリックとは異なる。いくつかの実施態様では、2つ以上のメトリックの第3のメトリックは、(i)cfDNAのフラグメントサイズ、(ii)複数の全ゲノム配列読み取りの相対読み取り深度、又は(iii)生殖系列対立遺伝子不均衡であり、第1のメトリック、第2のメトリック、及び第3のメトリックのそれぞれは異なるメトリックである。
様々な実施態様では、cfDNAのフラグメントサイズは、試料中で得られた無細胞DNAフラグメントサイズを正規化し、それにより確率密度関数値を得ることによって計算される。本明細書で使用される場合、「フラグメントサイズ」は、ティーチフラグメントを構成するインサート及びアダプターの塩基対のカウント又は数の平均を指す。本明細書で使用される場合、「インサート」はアダプター間の塩基対であり、「インサートサイズ」はインサートの塩基対の数又は数の平均である。確率密度関数値を得る技術は、ctDNAとcfDNAの間の見かけのサイズの違いを利用する。特に、これまでの研究では、ctDNAは高度に断片化されており、<100bpのサイズで最も一般的に生じるが、正常な無細胞DNAは>400bpのサイズで比例的により多く表されることが示されている。したがって、がんに関連するctDNAを検出するために、セクションIVで詳細に記述するように、確率密度関数値を使用して、フラグメントサイズの差異を利用して、ctDNAをバックグラウンドcfDNAから分離することができる。その際、ctDNAとcfDNAの間のフラグメント長の正確な違いが同定され得る。いくつかの実施態様では、cfDNAのフラグメントサイズは、確率密度関数内の領域の比率を含む。いくつかの実施態様では、確率密度関数内の領域の比率は、長さが約116から約156の間のヌクレオチドのcfDNAフラグメントサイズの確率の比率、及び長さが約164から約168の間のヌクレオチドのモードの周辺のcfDNAフラグメントサイズの確率の比率を含む。特定の実施態様では、cfDNAのフラグメントサイズは、以下によって得られる統計的フラグメントスコアである:(i)試料中で得られたcfDNAフラグメントサイズを正規化し、それによって確率密度関数値を得ること;(ii)cfDNAフラグメントサイズの値の対数及び連続する無細胞DNAフラグメントサイズ間の第1の差を決定すること;(iii)少なくとも20個の最小cfDNAフラグメントサイズを除去して、残りのcfDNAフラグメントサイズを得ること;及び(iv)循環腫瘍DNAを含むcfDNA及び循環腫瘍DNAを含まないcfDNAと比較した、残りのcfDNAフラグメントサイズの第1の主成分軸を決定すること。
様々な実施態様では、複数の全ゲノム配列読み取りの相対読み取り深度は、以下によって計算される:セクションVで詳細に記述するように、(i)無細胞DNAフラグメントサイズ配列読み取りカウントを前処理して、正規化された無細胞DNAフラグメントサイズ配列読み取りカウントのセットを得ること;(ii)正規化されたcfDNAフラグメントサイズ配列読み取りカウントのセットについて、染色体アームあたりの読み取り深度の中央値を決定すること;及び(iii)染色体アームあたりの読み取り深度の中央値の最大値を決定して、コピー数増幅スコアを得ること。いくつかの実施態様では、cfDNAの前処理は以下を含む:(i)様々な試料からの配列読み取りカウントを所定のサイズを有するウィンドウ中にマッピングすること;(ii)1つ又は複数の因子に基づいて、各ウィンドウ中の配列読み取りカウントをフィルタリングし、各ウィンドウの残りのcfDNAフラグメントサイズ配列読み取りカウントのセットを得ること;(iii)各ウィンドウ中のグアニン-シトシン含有量及びマッピング可能性バイアスを補正すること;及び(iv)ctDNAを含むcfDNA試料からの配列データに対して、各ウィンドウ中の残りのcfDNAフラグメントサイズ配列読み取りカウントを正規化すること。他の実施態様では、複数の全ゲノム配列読み取りの相対読み取り深度は、以下によって計算される:(i)固有のcfDNAフラグメントサイズ配列読み取りカウントをマッピングして、パーセンタイルで測定されたcfDNAフラグメントサイズ読み取りカウント分布を得ること;及び(ii)99パーセンタイル以上でのcfDNAフラグメントサイズ読み取りカウント分布を評価して、複数の全ゲノム配列読み取りの相対読み取り深度を決定し、コピー数増幅スコアを得ること。他の実施態様では、複数の全ゲノム配列読み取りの相対読み取り深度は、以下によって計算される:(i)固有のcfDNAフラグメントサイズ配列読み取りカウントをマッピングして、パーセンタイルで測定されたcfDNAフラグメントサイズ読み取りカウント分布を得ること;及び(ii)99パーセンタイル以上でのcfDNAフラグメントサイズ読み取りカウント分布を評価して、複数の全ゲノム配列読み取りの相対読み取り深度を決定し、コピー数増幅スコアを得ること。
様々な実施態様では、セクションVIで詳細に記述するように、生殖系列対立遺伝子不均衡を統計モデルを使用して計算し、cfDNAの試料中の1つ又は複数の生殖系列対立遺伝子不均衡部位の確率値の中央値を得て、対立遺伝子不均衡スコアを得る。いくつかの実施態様では、統計モデルは二項確率モデルを含む。いくつかの実施態様では、1つ又は複数の生殖系列対立遺伝子不均衡部位の確率値の中央値が所定の有意水準を下回る場合、確率値の中央値が、cfDNAの試料中の1つ又は複数の生殖系列部位における対立遺伝子不均衡を示す。特定の実施態様では、生殖系列対立遺伝子不均衡はヘテロ接合性の喪失を含む。
様々な実施態様では、2つ以上のメトリックは、以下を含む:(i)cfDNAのフラグメントサイズ、(ii)複数の全ゲノム配列読み取りの相対読み取り深度、(iii)生殖系列対立遺伝子不均衡、(iv)ソフトクリッピング率、(v)置換型の比率、(vi)全体的な予測体細胞変異カウント、(vii)不一致な読み取りの比率、(vi)相対的なLINE/SINE要素の読み取り深度、又はそれらの組み合わせ。フラグメントサイズ、相対読み取り深度、及び対立遺伝子不均衡は、それぞれスコア、コピー数増幅スコア、及び対立遺伝子不均衡スコアとして計算され得る(セクションIV、V、及びVIで説明される)。比率であるメトリックは、所与のカテゴリに分類される読み取り/バリアント(総計のうち)読み取りのパーセンテージとして計算され得る。いくつかの実施態様では、2つ以上のメトリックの第1のメトリックはフラグメントスコアであり、2つ以上のメトリックの第2のメトリックは、コピー数増幅スコア、又は対立遺伝子不均衡スコアである。いくつかの実施態様では、2つ以上のメトリックの第1のメトリックはフラグメントスコアであり、2つ以上のメトリックの第2のメトリックはコピー数増幅スコアであり、2つ以上のメトリックの第3のメトリックは対立遺伝子不均衡スコアである。いくつかの実施態様では、2つ以上のメトリックの決定は、標準的な品質管理ステップ(例えば、fastq品質チェック、アダプタートリミング、重複除去)を実行し、下流分析のために複数のゲノム配列読み取りの少なくとも過半数から2つ以上のメトリックを計算する、全ゲノム配列決定データ分析パイプラインの一部である。
任意のステップ115において、cfDNAの試料中のバックグラウンドがモデル化される。いくつかの実施態様では、モデリングは、「クリーン」であるゲノム領域を同定するために、取っておいた標準参照セットに関する事前情報を使用することを含む。すなわち、例えば、包括的なフラグメントサイズスコアが定義される場合、最初に基準標準のセットを調べ、基準標準のうち、>200bp又は>400bpなどの所定の閾値よりも大きいフラグメントサイズスコアを一貫して持つ領域が同定されるであろう。次いで、基準標準の領域を使用して、その後の処理でバックグラウンドシグナルを除外することができる。同じタイプの事前選択を、標準において不一致の読み取りが存在しないか、又はほとんど存在しない領域を同定するために使用することができる。このようにして、バックグラウンドシグナルは、標準において可能な限り低く保たれ、感度及び特異性は、cfDNAの試料を分類するために改善される。ステップ120において、セクションVIIで詳細に記述するように、2つ以上のメトリックが分類器に入力されて、第1のクラスについて第1の予測と、第2のクラスについて第2の予測を得る。いくつかの実施態様では、第1のクラスは、循環腫瘍DNAを含むcfDNAの試料であり、第2のクラスは、循環腫瘍DNAを含まないcfDNAの試料である。特定の実施態様では、分類器は、線形判別分析である。いくつかの実施態様では、バックグラウンドは、ステップ115からのモデリングに基づいて分類器からフィルタリングされる。ステップ125において、cfDNAの試料は、第1の予測及び第2の予測に基づいて、第1のクラス又は第2のクラスとして分類される。
III.配列決定試料及び分析システム
図2は、試料ホルダ210、例えば、cfDNAの液滴を含むフローセル又はチューブ内にcfDNAを含む血液試料などの試料205を含む、様々な実施態様に従って使用される例示的な配列分析システム200を示す。試料205からの蛍光強度値などの物理的特性215は、検出器220によって検出される。検出器220からのデータ信号225は、プロセッサ250及びメモリ235を含み得るデータ処理システム230(検出器に搭載されているか、又は検出器から分離されている)に送ることができる。データ信号225は、メモリ235内のデータ処理システム230内に局所的に、又は外部メモリ240又は記憶装置245内に外部的に記憶され得る。検出器220は、光(例えば、異なる塩基に対する異なるプローブからの蛍光)又は電気信号(例えば、ナノポアを通って移動する分子から生成される)などの様々な物理的信号を検出することができる。データ処理システム230は、図3に関してさらに詳細に記述されるように、コンピュータシステム、ASIC、マイクロプロセッサなどであり得るか、又はそれらを含み得る。データ処理システム230はまた、ディスプレイ(例えば、モニター、LEDディスプレイなど)及びユーザ入力装置(例えば、マウス、キーボード、ボタンなど)を含み得るか、又はそれらと結合され得る。データ処理システム230及び他の構成要素は、スタンドアロン又はネットワーク接続されたコンピュータシステムの一部であり得るか、或いはそれらは、サーマルサイクラー装置に取り付けられ、又は組み込まれ得る。データ処理システム230はまた、プロセッサ250内で実行する最適化ソフトウェアを含み得る。配列データに基づいて、1つ又は複数の読み取りにおける突然変異を定量化し、分析して、腫瘍負荷及び腫瘍負荷の統計的有意性を決定することができる。
本明細書に記載のコンピュータシステム又はデータ処理システムのいずれも、任意の適切な数のサブシステムを利用することができる。コンピュータシステム又はデータ処理システム(例えば、図2に関して記述したデータ処理システム230)及び関連するサブシステムの例が図3に示される。計算システム300は、適切な計算システムの一例に過ぎず、本実施態様の使用又は機能の範囲に関していかなる限定も示唆するものではない。また、計算システム300は、配列分析システム200に示される構成要素のいずれか1つ又は組み合わせに関連する依存性又は要件を有すると解釈されるべきではない。
図3に示されるように、計算システム300は、計算装置305を含む。計算装置305は、クラウド環境内などのネットワーク基盤上に存在することができ、又は別個の独立した計算装置(例えば、サービスプロバイダの計算装置)であり得る。計算装置350は、バス310、プロセッサ315、記憶装置320、システムメモリ(ハードウェア装置)325、1つ又は複数の入力装置330、1つ又は複数の出力装置335、及び通信インターフェース340を含み得る。
バス310は、計算装置305の構成要素間の通信を可能にする。例えば、バス310は、計算装置305の様々な他の構成要素へ、該構成要素から、又は該構成要素との間でデータ及び/又は電力を転送するための1つ又は複数の有線又は無線の通信リンク又は経路を提供するための、様々なバスアーキテクチャのいずれかを使用するメモリバス又はメモリコントローラ、周辺バス、及びローカルバスを含む、数種類のバス構造のいずれかであり得る。
プロセッサ315は、本発明の機能、ステップ、及び/又は性能を実装するための計算装置305の様々な他の構成要素のうちの1つ又は複数の操作及び性能を制御するためのプログラム命令など、コンピュータ可読プログラム命令を解釈し、実行するように作動する処理回路を含む、1つ又は複数の通常のプロセッサ、マイクロプロセッサ、又は専門的に特化したプロセッサであり得る。特定の実施態様では、プロセッサ315は、本発明のプロセス、ステップ、機能、及び/又は操作を解釈し、実行し、これらは、コンピュータ可読プログラム命令によって動作可能に実装され得る。例えば、プロセッサ315は、配列データを取り込み、例えば、取り込み、かつ/又は他の方法で取得又は生成し、配列データを問い合わせ、メトリックを決定又は計算し、バックグラウンドをモデル化し、確率値を決定し、クラス、解釈上の診断、及び臨床転帰などの予測を提供することができる。実施態様では、プロセッサ315によって取得又は生成された情報、例えば、配列データ、メトリック、バックグラウンドモデル、確率値、クラスなどは、記憶装置320に記憶され得る。
記憶装置320は、磁気及び/又は光記録媒体などの非一時的機械可読記憶媒体並びにそれらの対応するドライブなどであるが、これらに限定されない、取外し可能/取外し不可能、揮発性/不揮発性コンピュータ可読媒体を含み得る。ドライブ及びそれらに関連するコンピュータ可読媒体は、本発明の異なる態様による、計算装置305の操作のためのコンピュータ可読プログラム命令、データ構造、プログラムモジュール及び他のデータの記憶を提供する。実施態様では、記憶装置320は、本発明の態様による、オペレーティングシステム345、アプリケーションプログラム350、及びプログラムデータ355を記憶することができる。
システムメモリ325は、例えば、フラッシュメモリのような非一時的機械可読記憶媒体、読み取り専用メモリのような永久メモリ、ランダムアクセスメモリのような半永久メモリ、任意の他の適切なタイプの非一時的記憶構成要素、又はそれらの任意の組み合わせを含む、1つ又は複数の記憶媒体を含み得る。いくつかの実施態様では、起動中など、計算装置305の様々な他の構成要素間で情報を転送するのを支援する基本ルーチンを含む入出力システム360(BIOS)をROMに格納することができる。さらに、プロセッサ315によってアクセス可能であり、かつ/又は現在操作されている、オペレーティングシステム345、プログラムモジュール、アプリケーションプログラム350、及び/又はプログラムデータ355の少なくとも一部などのデータ及び/又はプログラムモジュール365が、RAMに含まれていてもよい。実施態様では、プログラムモジュール365及び/又はアプリケーションプログラム350は、メトリックのインデックス又はテーブル、バックグラウンドをモデル化するためのモンテカルロアルゴリズムなどのアルゴリズム又はモデル、線形判別分析などの分類器、及びプロセッサ315の実行のための命令を提供する比較ツールを含むことができる。
1つ又は複数の入力装置330は、タッチパッド、ダイヤル、クリックホイール、スクロールホイール、タッチスクリーン、1つ又は複数のボタン(例えば、キーボード)、マウス、ゲームコントローラ、トラックボール、マイクロフォン、カメラ、近接センサ、光検出器、動きセンサ、生体認証センサ、及びそれらの組み合わせなどであるがこれらに限定されない、オペレータが計算装置305に情報を入力することを可能にする1つ又は複数の機構を含み得る。1つ又は複数の出力装置335は、音声スピーカ、ヘッドホン、音声ラインアウト、表示装置、アンテナ、赤外線ポート、触覚フィードバック、プリンタ、又はそれらの組み合わせなどであるが、これらに限定されない、オペレータに情報を出力する1つ又は複数の機構を含み得る。
通信インターフェース340は、計算装置305が、モバイル装置、又は他の計算装置、例えばネットワーク環境、例えば、クラウド環境のサーバなどの遠隔装置又はシステムと通信することを可能にする、任意の送受信機様機構(例えば、ネットワークインターフェース、ネットワークアダプタ、モデム、又はそれらの組み合わせ)を含み得る。例えば、計算装置305は、通信インターフェース340を使用して、1つ若しくは複数のローカルエリアネットワーク(LAN)及び/又は1つ若しくは複数の広域ネットワーク(WAN)を介して、遠隔装置又はシステムに接続され得る。
本明細書中で議論されるように、計算システム300は、血液中で監視されるバリアントの事前の知識を用いた、循環核酸の超高感度検出のために構成され得る。特に、計算装置305は、システムメモリ325などの非一時的機械可読記憶媒体に含まれるプログラム命令を実行するプロセッサ315に応答して、タスク(例えば、プロセス、ステップ、方法及び/又は機能)を実行し得る。プログラム命令は、データ記憶装置320のような別のコンピュータ可読媒体(例えば、非一時的機械可読記憶媒体)から、又は通信インターフェース340を介して、或いはクラウド環境内外のサーバを介して別の装置から、システムメモリ325に読み込まれ得る。実施態様では、オペレータは、1つ又は複数の入力装置330及び/又は1つ又は複数の出力装置335を介して計算装置305と対話して、タスクの実行を容易にし、かつ/又は本発明の態様によるそのようなタスクの最終結果を実現することができる。追加又は代替の実施態様では、本発明の異なる態様に一致するタスク、例えば、ステップ、方法、及び/又は機能を実施するために、プログラム命令の代わりに、又はプログラム命令と組み合わせて、ハードワイヤード回路を使用することができる。したがって、本明細書に開示されるステップ、方法、及び/又は機能は、ハードウェア回路及びソフトウェアの任意の組み合わせで実装することができる。
IV.フラグメントメトリック
様々な実施態様では、配列読み取りのフラグメントサイズに関連するフラグメントスコアが計算される。ctDNAフラグメントは、健常なcfDNAと比較してDNAフラグメントサイズが小さいことが発見されている。いくつかの実施態様では、フラグメントサイズ分布は、図4に示されるように、フラグメントサイズについてのフラグメントスコアを計算するために決定される。cfDNA試料についてのフラグメントサイズの分布は、配列データの全ての可能なサイズ(例えば、塩基対の数)及び各フラグメントサイズがどれくらいの頻度で存在するかを示すリスト又は関数として決定される。ステップ405では、試料のフラグメントサイズ分布を、その分布が確率密度関数(例えば、所与のサイズが発生する確率を記述する関数、及び所与のサイズ又はそれより小さい任意のサイズが発生する累積確率を記述する関数が分布関数)となるように正規化する。フラグメントサイズ分布の確率密度関数は、分布関数の導関数として定義することができる。特定の実施態様では、正規化は、配列データから得られたフラグメントサイズデータが単位間隔に再スケーリングされるように、線形変換を用いて実行される。ステップ410において、対数変換(対数をとる)がフラグメントサイズ値に対して実行され、連続する挿入サイズ長間の第1の差が得られる。これは、フラグメント分布の形状に関する情報を提供する。ステップ415において、フラグメントサイズは、最初の20、30、40、又は50のフラグメント長の値を除去することによってフィルタリングされる(これらのカウントは低すぎてノイズが多い可能性がある)。特定の実施態様では、10から60の間のフラグメント長の値が、フラグメントサイズをフィルタリングするために除去される。
ステップ420において、フラグメント長分布の第1の主成分軸が、正常試料及びがん試料のコレクション全体にわたって計算される。このステップは、変動を強調し、フラグメントサイズデータセット内の強いパターンを引き出すために、いくつかの前処理ステップの一部として実行され得る。特定の実施態様では、フラグメントサイズは、第1の主成分とされ、第2の主成分(例えば、同じフラグメントサイズの数)が削除される。主成分分析の結果は、成分スコア又は因子スコア(特定のデータポイントに対応する変換された変数値)、及び負荷(フラグメントスコアを得るために、標準化された各元の変数に乗算すべき重み)を提供する。特定の実施態様では、第1の主成分は、試験データ(例えば、処理されるcfDNA試料(ステップ105)を参照のこと)においてインサートサイズ値を与えるための重み付け(負荷)を提供する。
他の実施態様では、がん試料の検出を増強するために、フラグメント分布についての代替的要約が可能である。例えば、分布のより低い分位数(.1%、1%、5%)を使用して、フラグメントサイズのフラグメントスコアを計算することができる。或いは、設定されたカットオフ又は範囲内の確率密度関数値を使用して、フラグメントサイズのフラグメントスコア、例えば、120bp、130bp、又は140bpのフラグメント長、又は分布のモード(例えば、通常、分布のモードはcfDNAについて約166bpである)よりも少ない固定数の単位での確率密度関数、モードよりも50単位から10単位少ない(例えば、約116bpから約156bpの間)確率密度関数値の合計を計算することもできる。或いは、確率密度関数内の領域の比率を使用して、フラグメントサイズのフラグメントスコアを計算することもでき、例えば、フラグメントの長さが短いほど、相対的な濃縮が期待されるため、約116bpから約168bpの間のモード周辺のフラグメント長の確率に対する、約116bpから約156bpの間にあるフラグメント長の確率の比率を計算することができる。本明細書で使用される場合、用語「実質的に」、「ほぼ」、又は「約」とは、指定されたものの「[パーセンテージ]以内」で置き換えられてもよく、ここで、パーセンテージは、0.1、1、5、及び10パーセントを含む。
V.相対読み取り深度メトリクス
様々な実施態様では、配列読み取りにおけるコピー数変動の尺度に関連するコピー数増幅スコアが計算される。コピー数増幅(コピー数の変化又は変動の増加)の存在は、健常cfDNAと比較してctDNAフラグメントにおいてより頻繁に見出されることが発見されている。相対読み取り深度は、cfDNA試料内の局所的又は広範なコピー数の変化の存在を評価することを意図している。したがって、本明細書で使用する「相対読み取り深度」は、コピー数変動の尺度である。いくつかの実施態様では、図5に示すように、複数の全ゲノム配列読み取りの相対読み取り深度が計算される。いくつかの実施態様では、計算は、複数の前処理ステップが、カバレッジプロファイルからノイズを除去し、正規化されたcfDNAフラグメントサイズ配列読み取りカウントのセットを取得するために実行されるステップ505を含む。ステップ505aにおいて、様々なcfDNA試料(例えば、ctDNAを含むcfDNA及びctDNAを含まないcfDNA)からの配列読み取りカウントが、所定のサイズを有するビン又はウィンドウ中にマッピングされる。配列読み取りカウントは、配列決定において使用される各プローブについての読み取りの数であり、任意で、任意の偏りを補正するために、1つ又は複数の異なる公知の因子に従って補正され得る。特定の実施態様では、ビン又はウィンドウのサイズは、10kbから1000kbの間、例えば、200kbである。ステップ505bにおいて、配列読み取りカウントは、1つ又は複数の因子に基づいて各ウィンドウにおいてフィルタリングされ、各ウィンドウについて残りのcfDNAフラグメントサイズ配列読み取りカウントのセットが得られる。フィルタリングは、後続の分析からの配列読み取りカウントの削除を含む。いくつかの実施態様では、1つ又は複数の因子は、所定の閾値未満である配列カウントを含む。特定の実施態様では、所定の閾値は、350未満の配列読み取り、例えば、200未満の配列読み取りである。いくつかの実施態様では、1つ又は複数の因子は、セントロメア読み取りを含む。いくつかの実施態様では、1つ又は複数の因子は、可変サイトバンドを有する配列読み取りを含む。
ステップ505cにおいて、グアニン-シトシン(GC)含有量及びマッピング可能性のバイアスが各ウィンドウにおいて補正される。GC含有量バイアスは、フラグメントカウント(読み取りカバレッジ)と配列決定データに見られるGC含有量との間の依存性を記述する。GCバイアスは、補正されない場合、ゲノム内のフラグメントの存在量を測定することに重点を置いた分析の対象となるシグナルを支配する可能性がある。読み取りマッピング手順は、領域マッピング可能性バイアスを生成する。ゲノム中の複数の部位にマッピングされる塩基配列の読み取りは通常捨てられるので、塩基配列の縮重度が高いゲノム領域は、固有の領域よりもマッピングされた読み取りカバレッジを低く示し、補正されなければ系統的なバイアスが生じる。ステップ505dにおいて、各ウィンドウにおける残りのcfDNAフラグメントサイズ配列読み取りカウントを、ctDNAを含むcfDNA試料からの配列データに対して正規化する。得られたクリーンアップを、図6のがん及び正常試料に示す。
前処理が完了した後、正規化された深度データ(すなわち、正規化されたcfDNAフラグメントサイズ配列読み取りカウントのセット)について、いくつかのゲノム全域にわたる要約を評価することができる。いくつかの実施態様では、正規化された深度データの要約は、染色体アームによる正規化された深度の中央値の最大値である。例えば、相対読み取り深度計算は、染色体アームあたりの読み取り深度の中央値が、正規化されたcfDNAフラグメントサイズ配列の読み取りカウントのセットに対して決定されるステップ510、及び染色体アームあたりの読み取り深度の中央値の最大値が決定され、アームレベルの増幅を捕捉するコピー数増幅スコアを得るステップ515をさらに含み得る。他の実施態様では、正規化された深度データの要約は、99パーセンタイル、99.9パーセンタイル、及び99.99パーセンタイルなどのビニングされた値又はウィンドウ化された値の高いパーセンタイルである。複数の全ゲノム配列読み取りの相対読み取り深度は、以下によって計算され得る:(i)固有のcfDNAフラグメントサイズ配列読み取りカウントをマッピングして、パーセンタイルで測定されたcfDNAフラグメントサイズ読み取りカウント分布を得ること;及び(ii)99パーセンタイル以上での無細胞DNAフラグメントサイズ読み取りカウント分布を評価して、複数の全ゲノム配列読み取りの相対読み取り深度を決定し、コピー数増幅スコアを得ること。他の実施態様では、正規化された深度データの要約は、局所的増幅を同定するために、高パーセンタイルを染色体アームあたりの深度中央値で割った比率である。例えば、各染色体アームの深度の90パーセンタイルを、各アームの深度の中央値で割ったものである。複数の全ゲノム配列読み取りの相対読み取り深度は、以下によって計算される:(i)固有のcfDNAフラグメントサイズ配列読み取りカウントをマッピングして、パーセンタイルで測定されたcfDNAフラグメントサイズ読み取りカウント分布を得ること;及び(ii)各染色体アームの配列読み取りカウント深度の少なくとも90パーセンタイルを各染色体アームの配列読み取りカウント深度の中央値で割った比率を決定し、コピー数増幅スコアを得ること。
VI.生殖系列対立遺伝子不均衡メトリック
様々な実施態様では、配列読み取りにおけるコピー数変動の尺度に関連する対立遺伝子不均衡スコアが計算される。生殖系列不均衡の存在は、健常なcfDNAと比較してctDNAフラグメントにおいてより頻繁に見出されることが発見されている。正常なコピー数の領域におけるヘテロ接合性一塩基多型(SNP)の場合、予想される対立遺伝子頻度(AF)は50%である。コピー数の増加又は減少がみられる領域では、AFが50%からずれてゆがむことがある。例えば、ある遺伝子座に3コピーあると、ヘテロ接合性SNPは2/3=66%又は1/3=33%のAFとなるであろう。これは「生殖系列対立遺伝子不均衡」と呼ばれ、対立遺伝子不均衡のスコアを計算するための式が二項確率に基づいて提供される。いくつかの実施態様では、対立遺伝子不均衡スコアは、統計モデルを使用して計算され、無細胞DNAの試料中の1つ又は複数の生殖系列対立遺伝子不均衡部位についての確率値の中央値を得る。いくつかの実施態様では、統計モデルは、生殖系列バリアントがヘテロ接合であり、ある部位での所与の読み取りにおいて生殖系列バリアントが見られる確率がp0=0.5の有意水準である帰無仮説を含み、次いで、ある部位での全n個の読み取りのうちのyobs非参照読み取りの観察について、帰無仮説を棄却するためのp値は、以下の式(1-3)によって与えられる:
Figure 0007332695000001
Figure 0007332695000002
Figure 0007332695000003
この統計モデルにおいて、確率値(p値)は、生殖系列部位ごとに作成され、対立遺伝子不均衡スコアとして使用される。例えば、試料全体のp値の中央値が低い場合は、生殖系列の不均衡を示している。或いは、生殖系列対立遺伝子不均衡はコピー数の変化に関連しているはずなので、対立遺伝子不均衡スコアは、対立遺伝子不均衡と正規化された深度との相関として定義され、生殖系列対立遺伝子不均衡の低いp値は、正規化された深度が高い(増幅)か又は低い(ヘテロ接合性欠失)のどちらかに対応するため、相関関係が生じるであろう。
VII.単変量及び多変量実験並びに解析
がん試料(25のステージIV肺がん試料、及び25の転移性CRC試料)からのcfDNAの低カバレッジ(平均深度が1~5の範囲)の全ゲノム配列(WGS)データについて、並びに健常対照(24試料)からのcfDNAについて、概念実証実験と分析を行い、がん由来cfDNAの存在を示す潜在的な包括的配列読み取り特徴を評価した。これらは後期がんであるが、同じ血漿試料の一致した深部配列決定データセットから推定されるctDNA含有量は、広範囲のctDNA含有量(<0.5%のctDNAを有する試料の15%-AVENIO ctDNA分析キットの検出限界)を示唆するため、このアプローチを評価するのに十分に挑戦的なセットである。標準的なQCステップ(fastq品質チェック、アダプタートリミング、重複除去)を実行し、下流分析のための関連するグローバルメトリックを計算する全ゲノム配列決定データ分析パイプラインを開発した。
図7A-7Cは、正常試料から結腸がん及び肺がんデータセットを分離するための、包括的配列決定特徴要約の単変量分析の検出力を示す。例えば、図7Aは、肺がん、結腸がん、及び正常データセット間のフラグメントスコア(PCA軸1)を示す。図7Bは、肺がん、結腸がん、及び正常データセット間の読み取り深度分析に基づくコピー数増幅スコアを示す。図7Cは、肺がん、結腸がん、及び正常データセットの間の対立遺伝子不均衡スコア(例えば、中央値p値)を示す。実証されるように、包括的配列決定特徴要約の各々は、個々に、がん試料(ctDNAを含む試料)と正常試料(ctDNAを含まない試料)との間の識別が可能である。本明細書中で議論される他の特徴及びメトリックはまた、がん試料と正常試料とを識別するための様々な能力を示すことが見出された。
多変量解析では、少なくとも2つの特徴又はメトリックが線形判別分析分類器に組み合わされ、正常試料(ctDNAを含まない試料)とがん試料(ctDNAを含む試料)をより高い特異性と感度で判別する能力を実証する。例えば、3分割交差検証線形判別分析分類器を使用して、正常試料とがん試料を識別する性能を確立した。図8は、この分類器についての曲線下受信者操作特性(ROC)領域(AUC)を示し、>70%の感度(真陽性率)が100%の特異性(偽陽性率=0)で達成可能であることを示している。図9は、各試料の線形判別分析スコア及びコピー数変化スコアを、試料中の既知の体細胞一塩基多型(SNV)のAF値によって色分けして示している。示されるように、検出可能なSNVを有しないがん試料として正しく分類されるいくつかの試料があり、がん試料としても確実に分類されるSNV AFが<0.5%(LOD未満)のいくつかの試料がある。
VIII.診断アッセイと治療
様々な実施態様では、本明細書に開示される技術による第1のクラス又は第2のクラスとしての無細胞DNAの試料の分類に基づいて、対象が微小残存病変を有するかどうかを決定するための技術が提供される。いくつかの実施態様は、対象の治療レジメンの臨床転帰を予測するための、又は微小残存病変の決定に基づいて対象におけるがんの予後を提供するための技術をさらに包含する。例えば、一旦試料が第1のクラス又は第2のクラスとして分類されると、その分類を使用して、対象における微小残存病変の存在を決定することができる。
図10は、微小残存病変を有する患者を診断するためのプロセス及び操作を示すフローチャート1000を示す。個々の実施態様は、図1に関して前述したように、フローチャート、フローダイアグラム、データフローダイアグラム、構造ダイアグラム、又はブロックダイアグラムとして描かれるプロセスとして記述することができる。フローチャート1000に示されるプロセスは、図1に関して記述されるフローチャート100において実行されるステップの一部又は全てを含み、図2及び3に示されるアーキテクチャ、システム、及び技術によって実装され得る。ステップ1005において、全ゲノム配列データは、対象(例えば、患者)からのcfDNAの試料から得られる。全ゲノム配列データは、複数の全ゲノム配列読み取りを含む。いくつかの実施態様では、全ゲノム配列データは、診断アッセイを使用して得られる。アッセイは様々な方法で作成することができ、PCR、配列決定、ハイブリダイゼーションアレイ、及び固有の分子識別子などの様々な技術を使用する。アッセイは、治療前のレベルでctDNAを検出できるものでなければならない。いくつかの実施態様では、アッセイは、cfDNAから全ゲノム配列データを得るために必要な試薬を含むキットの一部として作成することができる。例えば、キットは、全ゲノム配列に特異的なプローブ及び増幅プライマーなどのオリゴヌクレオチドを含み得る。いくつかの実施態様では、キットは、PCR、リアルタイムPCR、又は転写増幅法(TMA)の成分など、増幅及び検出アッセイの実施に必要な試薬をさらに含む。いくつかの実施態様では、全ゲノムオリゴヌクレオチドは、検出可能に標識される。このような実施態様では、キットは、標識を標識化し、検出するための試薬を含む。例えば、オリゴヌクレオチドがビオチンで標識される場合、キットは、酵素及びその発色基質を含むストレプトアビジン試薬を含み得る。
ステップ1010において、無細胞DNAの試料から得られた全ゲノム配列データの特徴についての2つ以上のスコアが計算され、分類器に入力されて、第1のクラスについての第1の予測及び第2のクラスについての第2の予測が得られる。いくつかの実施態様では、特徴は、cfDNAのフラグメントサイズ、複数の全ゲノム配列読み取りの相対読み取り深度、全ゲノム配列読み取りの生殖系列対立遺伝子不均衡、又はそれらの組み合わせを含む。他の実施態様では、特徴は、(i)cfDNAのフラグメントサイズ、(ii)複数の全ゲノム配列読み取りの相対読み取り深度、(iii)生殖系列対立遺伝子不均衡、(iv)ソフトクリッピング率、(v)置換型の比率、(vi)全体的な予測体細胞変異カウント、(vii)不一致な読み取りの比率、(vi)相対的なLINE/SINE要素の読み取り深度、又はそれらの組み合わせを含む。いくつかの実施態様では、第1のクラスは、循環腫瘍DNAを含む無細胞DNAの試料であり、第2のクラスは、循環腫瘍DNAを含まない無細胞DNAの試料である。ステップ1015において、対象が微小残存病変を有するかどうかは、無細胞DNAの試料の第1のクラス又は第2のクラスとしての分類に基づいて決定される。微小残存病変とは、治療中又は治療後に対象に残存する残存腫瘍の存在である。例えば、無細胞DNAの試料が、無細胞DNAの試料が循環腫瘍DNAを含む第1のクラスとして分類される場合、対象は微小残存病変を有すると決定され得る。或いは、無細胞DNAの試料が、無細胞DNAの試料が循環腫瘍DNAを含まない第2のクラスとして分類される場合、対象は微小残存病変を有していないと決定され得る。
ステップ1020において、対象の治療レジメンの臨床転帰は、対象が微小残存病変を有するかどうかに基づいて予測される。いくつかの研究では、患者の臨床転帰の予測を支援するために、治療レジメンの間又は後の微小残存病変の潜在的な存在を評価することの重要性が確認されている。例えば、持続性微小残存病変を示さない患者は、持続性微小残存病変を示す患者よりも有意に良好である。ステップ1025において、対象が微小残存病変を有すると決定し、陰性臨床転帰を予測すると、対象の治療レジメンは改変され得る。或いは、対象が微小残存病変を有さないと決定し、陽性臨床転帰を予測すると、対象の治療レジメンは維持され得る。

Claims (11)

  1. (a)データ処理システムによって、対象からの無細胞DNAの試料から全ゲノム配列データを得ること、ここで、全ゲノム配列データが複数の全ゲノム配列読み取りを含むものである;
    (b)データ処理システムによって、複数のゲノム配列読み取りの少なくとも過半数から3つ以上のメトリックを計算すること、
    ここで、3つ以上のメトリックの第1のメトリックが、
    (i)無細胞DNAのフラグメントサイズ、
    (ii)複数の全ゲノム配列読み取りの相対読み取り深度、又は
    (iii)生殖系列対立遺伝子不均衡であり、
    3つ以上のメトリックの第2のメトリックが、
    (i)無細胞DNAのフラグメントサイズ、
    (ii)複数の全ゲノム配列読み取りの相対読み取り深度、又は
    (iii)生殖系列対立遺伝子不均衡であって、
    3つ以上のメトリックの第3のメトリックが、
    (i)無細胞DNAのフラグメントサイズ、
    (ii)複数の全ゲノム配列読み取りの相対読み取り深度、又は
    (iii)生殖系列対立遺伝子不均衡であり、
    ここで、第1のメトリック、第2のメトリック、及び第3のメトリックのそれぞれが異なるメトリックである; (c)データ処理システムによって、3つ以上のメトリックを分類器に入力して、第1のクラスについての第1の予測及び第2のクラスについての第2の予測を得ること、ここで、第1のクラスは循環腫瘍DNAを含む無細胞DNAの試料であり、第2のクラスは循環腫瘍DNAを含まない無細胞DNAの試料である;及び
    (d)データ処理システムによって、第1の予測及び第2の予測に基づいて、無細胞DNAの試料を第1のクラス又は第2のクラスとして分類すること;
    を含み、
    無細胞DNAのフラグメントサイズが確率密度関数内の領域の比率を含む、方法。
  2. 分類器が線形判別分析である、請求項1に記載の方法。
  3. 確率密度関数内の領域の比率が、長さが約116から約156の間のヌクレオチドの無細胞DNAフラグメントサイズの確率の比率、及び長さが約164から約168の間のヌクレオチドのモードの周辺の無細胞DNAフラグメントサイズの確率の比率を含む、請求項1又は2に記載の方法。
  4. 無細胞DNAのフラグメントサイズが、以下:
    (i)試料中で得られた無細胞DNAフラグメントサイズを正規化し、それによって確率密度関数値を得ること;
    (ii)無細胞DNAフラグメントサイズの値の対数及び連続する無細胞DNAフラグメントサイズ間の第1の差を決定すること;
    (iii)少なくとも20個の最小無細胞DNAフラグメントサイズを除去して、残りの無細胞DNAフラグメントサイズを得ること;及び
    (iv)循環腫瘍DNAを含む無細胞DNA及び循環腫瘍DNAを含まない無細胞DNAと比較した、残りの無細胞DNAフラグメントサイズの第1の主成分軸を決定すること
    によって計算される統計的フラグメントスコアである、請求項1~のいずれか一項に記載の方法。
  5. 複数の全ゲノム配列読み取りの相対読み取り深度が、以下:
    (i)無細胞DNAフラグメントサイズ配列読み取りカウントを前処理して、正規化された無細胞DNAフラグメントサイズ配列読み取りカウントのセットを得ること;
    (ii)正規化された無細胞DNAフラグメントサイズ配列読み取りカウントのセットについて、染色体アームあたりの読み取り深度の中央値を決定すること;及び
    (iii)染色体アームあたりの読み取り深度の中央値の最大値を決定して、コピー数増幅スコアを得ること
    によって計算される、請求項1~のいずれか一項に記載の方法。
  6. 前処理が、
    (i)様々な試料からの配列読み取りカウントを所定のサイズを有するウィンドウ中にマッピングすること;
    (ii)1つ又は複数の因子に基づいて、各ウィンドウ中の配列読み取りカウントをフィルタリングし、各ウィンドウの残りの無細胞DNAフラグメントサイズ配列読み取りカウントのセットを得ること;
    (iii)各ウィンドウ中のグアニン-シトシン含有量及びマッピング可能性バイアスを補正すること;及び
    (iv)循環腫瘍DNAを含む無細胞DNA試料からの配列データに対して、各ウィンドウ中の残りの無細胞DNAフラグメントサイズ配列読み取りカウントを正規化すること
    を含む、請求項に記載の方法。
  7. 生殖系列対立遺伝子不均衡を、好ましくは二項確率モデルである統計モデルを使用して計算し、無細胞DNAの試料中の1つ又は複数の生殖系列対立遺伝子不均衡部位の確率値の中央値を決定し、対立遺伝子不均衡スコアを得る、請求項1~のいずれか一項に記載の方法。
  8. 1つ又は複数の生殖系列対立遺伝子不均衡部位の確率値の中央値が所定の有意水準を下回る場合、確率値の中央値が、無細胞DNAの試料中の1つ又は複数の生殖系列部位における対立遺伝子不均衡を示す、請求項に記載の方法。
  9. データ処理システムによって、無細胞DNAの試料の第1のクラス又は第2のクラスとしての分類に基づいて、対象が微小残存病変を有するかどうかを予測することをさらに含む、請求項1~のいずれか一項に記載の方法。
  10. 1つ又は複数のプロセッサ;及び
    前記1つ又は複数のプロセッサにアクセス可能なメモリであって、前記1つ又は複数のプロセッサによって実行可能な複数の命令を記憶し、前記複数の命令が、前記1つ又は複数のプロセッサによって実行されると、前記1つ又は複数のプロセッサに請求項1~のいずれか一項に記載の方法を実行させる命令を含む、前記メモリ;
    を含む、システム。
  11. コンピュータシステムを制御して請求項1~のいずれか一項に記載の方法を実行するための複数の命令を記憶するコンピュータ可読媒体を含むコンピュータ製品。
JP2021534660A 2018-12-21 2019-12-19 循環核酸からの全ゲノム配列データにおける包括的配列特徴の同定 Active JP7332695B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862783801P 2018-12-21 2018-12-21
US62/783,801 2018-12-21
PCT/EP2019/086156 WO2020127629A1 (en) 2018-12-21 2019-12-19 Identification of global sequence features in whole genome sequence data from circulating nucelic acid

Publications (2)

Publication Number Publication Date
JP2022513946A JP2022513946A (ja) 2022-02-09
JP7332695B2 true JP7332695B2 (ja) 2023-08-23

Family

ID=69061361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021534660A Active JP7332695B2 (ja) 2018-12-21 2019-12-19 循環核酸からの全ゲノム配列データにおける包括的配列特徴の同定

Country Status (5)

Country Link
US (1) US20210310050A1 (ja)
EP (1) EP3899049A1 (ja)
JP (1) JP7332695B2 (ja)
CN (1) CN113195741A (ja)
WO (1) WO2020127629A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115558716B (zh) * 2022-09-29 2023-11-03 南京医科大学 一种用于预测癌症的cfDNA片段特征组合、系统及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180300451A1 (en) 2017-04-12 2018-10-18 Echelon Diagnostics, Inc. Techniques for fractional component fragment-size weighted correction of count and bias for massively parallel DNA sequencing
US20180307796A1 (en) 2017-04-21 2018-10-25 Illumina, Inc. Using cell-free dna fragment size to detect tumor-associated variant

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6196157B2 (ja) * 2010-11-30 2017-09-20 ザ チャイニーズ ユニバーシティ オブ ホンコン 癌関連の遺伝子または分子異常の検出
US10095831B2 (en) * 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
ES2967443T3 (es) * 2016-07-06 2024-04-30 Guardant Health Inc Procedimientos de perfilado de fragmentoma de ácidos nucleicos sin células

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180300451A1 (en) 2017-04-12 2018-10-18 Echelon Diagnostics, Inc. Techniques for fractional component fragment-size weighted correction of count and bias for massively parallel DNA sequencing
US20180307796A1 (en) 2017-04-21 2018-10-25 Illumina, Inc. Using cell-free dna fragment size to detect tumor-associated variant

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Journal of Molecular Diagnostics,2006年,vol. 8, no. 1,p. 22-30
PLOS Genetics,2016年,12(7):e1006162,p.1-24
Sci Transl Med,2018年,vol. 10, no. 466,p. 1-28

Also Published As

Publication number Publication date
WO2020127629A1 (en) 2020-06-25
US20210310050A1 (en) 2021-10-07
EP3899049A1 (en) 2021-10-27
CN113195741A (zh) 2021-07-30
JP2022513946A (ja) 2022-02-09

Similar Documents

Publication Publication Date Title
CN111742059B (zh) 用于靶向测序的模型
EP3899018B1 (en) Cell-free dna end characteristics
AU2018305609B2 (en) Enhancement of cancer screening using cell-free viral nucleic acids
KR20230017169A (ko) 핵산 메틸화 분석을 통한 결장직장암 검출을 위한 방법 및 시스템
CN113574602A (zh) 从循环无细胞核酸中灵敏地检测拷贝数变异(cnv)
US20220068434A1 (en) Monitoring mutations using prior knowledge of variants
JP7332695B2 (ja) 循環核酸からの全ゲノム配列データにおける包括的配列特徴の同定
AU2022346858A1 (en) Methylation fragment probabilistic noise model with noisy region filtration
US20220301654A1 (en) Systems and methods for predicting and monitoring treatment response from cell-free nucleic acids
CN113710818A (zh) 病毒相关联的癌症风险分层

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221128

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230620

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230728

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230810

R150 Certificate of patent or registration of utility model

Ref document number: 7332695

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150