JP2019507585A - 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 - Google Patents

無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 Download PDF

Info

Publication number
JP2019507585A
JP2019507585A JP2018531350A JP2018531350A JP2019507585A JP 2019507585 A JP2019507585 A JP 2019507585A JP 2018531350 A JP2018531350 A JP 2018531350A JP 2018531350 A JP2018531350 A JP 2018531350A JP 2019507585 A JP2019507585 A JP 2019507585A
Authority
JP
Japan
Prior art keywords
loci
locus
sequencing
data set
coverage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2018531350A
Other languages
English (en)
Other versions
JP2019507585A5 (ja
Inventor
ヘルミー エルトーキー,
ヘルミー エルトーキー,
アミルアリ タラサズ,
アミルアリ タラサズ,
ダーリヤ チュドヴァ,
ダーリヤ チュドヴァ,
ダイアナ アブドゥエヴァ,
ダイアナ アブドゥエヴァ,
Original Assignee
ガーダント ヘルス, インコーポレイテッド
ガーダント ヘルス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ガーダント ヘルス, インコーポレイテッド, ガーダント ヘルス, インコーポレイテッド filed Critical ガーダント ヘルス, インコーポレイテッド
Publication of JP2019507585A publication Critical patent/JP2019507585A/ja
Publication of JP2019507585A5 publication Critical patent/JP2019507585A5/ja
Priority to JP2021064099A priority Critical patent/JP2021101732A/ja
Priority to JP2023108348A priority patent/JP2023126874A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass

Abstract

核酸試料におけるコピー数変異の自動検出を改善するための方法が、本明細書に提供される。これらの方法は、試料内における遺伝子座のベースラインコピー数を決定するための改善されたアプローチを提供し、遺伝子座、試料調製およびプローブ消耗の特色による変異を低下させる。一局面では、本発明の方法は、(a)被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子の配列決定リードを得るステップ、(b)上記配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップ、および(c)飽和平衡補正およびプローブ効率補正を遂行することにより、上記第1のデータセットを補正するステップなどを含む。

Description

相互参照
この出願は、2015年12月17日に出願された米国仮出願第62/269,051号(これは、その全体が参考として本明細書に援用される)に対する優先権を主張する。
がんは、個体の正常細胞内の突然変異の蓄積に起因し、この突然変異の少なくとも一部は、不適切に調節された細胞分裂をもたらす。かかる突然変異は一般的に、腫瘍ゲノム内の遺伝子のコピーの数が被験体の非がん性細胞と比べて増加または減少した、コピー数変異を含む。
腫瘍細胞におけるコピー数変異の検出および特徴付けは、腫瘍進行のモニタリング、患者の転帰の予測および処置選択の緻密化に使用される。しかし、従来方法は、痛みを伴いかつ時間がかかる生検によって得られることが多い、細胞試料において遂行される。かかる生検はまた、多くの場合、被験体内の腫瘍細胞のごく僅かしか試験できず、よって、必ずしも腫瘍細胞の集団を代表するとは限らない。細胞生検、蛍光in situハイブリダイゼーション(FISH)、比較ゲノムハイブリダイゼーションアレイまたは定量的蛍光ポリメラーゼ連鎖反応(PCR)アッセイを要求しない、腫瘍におけるコピー数変異のためのより単純でより迅速な検査の必要がある。
配列決定データを使用した、コピー数変異の決定における特に困難な課題とは、真のコピー数とは無関係な理由から、遺伝子座が、そのカバレッジ(coverage)の深度において変動(variance)を示すことである。例えば、増幅効率、PCR効率およびグアニン−シトシン含量は、同じコピー数の試料に存在する個々の遺伝子座であっても、カバレッジの異なる深度を引き起こし得る。かかる効果によるバイアスを除去する改善された方法が、コピー数検出の改善に必要とされる。
無細胞体液に由来する試料由来の腫瘍細胞におけるコピー数変異を検出する改善された方法が相当に必要とされている。本発明は、この必要に取り組み、追加的な利点を提供する。一態様では、本開示は、(a)被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子の配列決定リードを得るステップと、(b)配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、(c)飽和平衡補正(saturation equilibrium correction)およびプローブ効率補正(probe efficiency correction)を遂行することにより、第1のデータセットを補正するステップと、(d)第1のデータセットについてベースラインリードカバレッジを決定するステップであって、ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、(e)ベースラインリードカバレッジと比べた複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップとを含む方法を提供する。一部の実施形態では、第1のデータセットは、複数の遺伝子座における遺伝子座毎に、(i)遺伝子座のグアニン−シトシン含量(「GC含量」)に関連する定量的尺度を含む。一部の実施形態では、本方法は、(c)に先立ち、第1のデータセットから、高変動遺伝子座である遺伝子座を除去するステップを含み、除去するステップは、(i)グアニン−シトシン含量に関連する定量的尺度および遺伝子座の配列決定リードカバレッジの定量的尺度に関連するモデルを適合させるステップと、(ii)遺伝子座から、遺伝子座の少なくとも10%を除去するステップであって、この遺伝子座を除去するステップは、モデルと最も異なる遺伝子座を除去し、これにより、ベースライン化遺伝子座(baselining genetic locus)の第1のデータセットを提供することを含む、ステップとを含む。一部の実施形態では、本方法は、遺伝子座の少なくとも45%を除去するステップを含む。
一部の実施形態では、飽和平衡補正を遂行するステップは、(i)ベースライン化遺伝子座の第1のデータセット由来の遺伝子座毎に、遺伝子座に由来する試料由来のDNA分子の鎖が、配列決定リード内に表される確率に関連する定量的尺度を決定し、(ii)ベースライン化遺伝子座の第1のデータセットのリードカバレッジを、ベースライン化遺伝子座の第1のデータセットのGC含量、およびベースライン化遺伝子座の第1のデータセットにおける各座位に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度の両方に関連付けることにより、リードカバレッジのための第1の変換を決定し、(iii)ベースライン化遺伝子座の第1のデータセット由来の各遺伝子座のリードカバレッジに第1の変換を適用して、ベースライン化遺伝子座の第1のデータセットの変換されたリードカバレッジの第1のセットを含む、飽和補正されたデータセットを提供することにより、ベースライン化データ遺伝子座の第1のデータセットを飽和補正されたデータセットに変換するステップを含む。
一部の実施形態では、第1の変換を決定するステップは、(i)ベースライン化遺伝子座の第1のデータセットのリードカバレッジの中心傾向(central tendency)に関連する尺度を決定するステップと、(ii)遺伝子座のGC含量に基づくベースライン化遺伝子座の第1のデータセットのリードカバレッジの中心傾向に関連する尺度、および遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度を適合させる関数を決定するステップと、(iii)ベースライン化遺伝子座の第1のデータセットの遺伝子座毎に、関数によって予測されるリードカバレッジおよびリードカバレッジの間の差を決定するステップであって、差が、変換されたリードカバレッジである、ステップとを含む。一部の実施形態では、関数は、表面近似(surface approximation)である。本明細書に提供される一部の実施形態では、表面近似は、二次元二次多項式である。
一部の実施形態では、プローブ効率補正を遂行するステップは、(i)飽和補正されたデータセットから、変換されたリードカバレッジの第1のセットに関して高変動遺伝子座である遺伝子座を除去し、これにより、ベースライン化遺伝子座の第2のデータセットを提供し、(ii)ベースライン化遺伝子座の第2のデータセットのプローブ効率に関連する変換されたリードカバレッジの第1のセットのための第2の変換を決定し、(iii)第2の変換を用いて、ベースライン化遺伝子座の第2のデータセットの変換されたリードカバレッジの第1のセットを変換し、これにより、ベースライン化遺伝子座の第2のデータセットの変換されたリードカバレッジの第2のセットを含む、プローブ効率補正されたデータセットを提供することにより、飽和補正されたデータセットをプローブ効率補正されたデータセットへと変換するステップを含む。一部の実施形態では、第1のデータセットから、高変動遺伝子座である遺伝子座を除去するステップは、(i)GC含量および飽和補正されたデータセットの変換されたリードカバレッジの第1のセットに関連するモデルを適合させるステップと、(ii)飽和補正されたデータセットから、遺伝子座の少なくとも10%を除去するステップであって、この遺伝子座を除去するステップは、モデルと最も異なる遺伝子座を除去し、これにより、ベースライン化遺伝子座の第2のデータセットを提供するステップを含む、ステップとを含む。本明細書に提供される一部の実施形態では、除去は、遺伝子座の少なくとも45%である。
一部の実施形態では、プローブ効率は、1種または複数の参照試料において飽和平衡補正を遂行することにより決定され、プローブ効率は、飽和平衡補正を遂行することにより得られる変換されたリードカバレッジである。一部の実施形態では、1種または複数の参照試料は、がんを有しない被験体由来の無細胞体液試料である。本明細書に提供される一部の実施形態では、1種または複数の参照試料は、がんを有する被験体由来の無細胞体液試料であり、対応する遺伝子座は、コピー数変更を起こしていない。
一部の実施形態では、第2の変換を決定するステップは、(i)1種または複数の参照試料由来の遺伝子座について決定されたプローブ効率を、ベースライン化遺伝子座の第2のデータセット由来のリードカバレッジの第1のセットに適合させるステップと、(ii)ベースライン化遺伝子座の第2のデータセットの各遺伝子座の変換されたリードカバレッジを、(i)の適合に基づき予測されるプローブ効率で割るステップとを含む。一部の実施形態では、本方法は、(f)ベースライン化遺伝子座の第2のデータセットの変換されたリードカバレッジを、ベースライン化遺伝子座の第2のデータセットのGC含量、およびベースライン化遺伝子座の第2のデータセットにおける各座位に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度の両方に関連付けることにより、変換されたリードカバレッジの第2のセットのための第3の変換を決定するステップと、(g)第3の変換を、変換されたリードカバレッジの第2のセットに適用して、変換された定量的リードカバレッジの第3のセットを含む、第4のデータセットを提供するステップとをさらに含む。
一部の実施形態では、無細胞体液試料のDNAは、遺伝子座のセット由来の遺伝子座の少なくとも一部分に相補的な1種または複数のオリゴヌクレオチドプローブを使用して、遺伝子座のセットについて濃縮される。一部の実施形態では、遺伝子座のセット由来の各遺伝子座のGC含量は、遺伝子座のセット由来の遺伝子座の少なくとも一部分に相補的な1種または複数のオリゴヌクレオチドプローブのグアニン−シトシン含量の中心傾向に関連する尺度である。一部の実施形態では、遺伝子座のリードカバレッジは、1種または複数のオリゴヌクレオチドプローブに対応する遺伝子座の領域のリードカバレッジの中心傾向に関連する尺度である。一部の実施形態では、飽和平衡補正を遂行するステップおよびプローブ効率補正を遂行するステップは、ラングミュアモデルを適合させるステップを含み、ラングミュアモデルは、プローブ効率(K)および飽和平衡定数(Isat)を含む。一部の実施形態では、KおよびIsatは、1種または複数のオリゴヌクレオチドプローブにおけるオリゴヌクレオチドプローブ毎に経験的に決定される。一部の実施形態では、飽和平衡補正を遂行するステップおよびプローブ補正を遂行するステップは、遺伝子座のリードカバレッジを、遺伝子座が同一コピー数状態で存在することを仮定してラングミュアモデルに適合させ、これにより、ベースラインリードカバレッジを提供するステップを含む。一部の実施形態では、同一コピー数状態は、二倍体である。一部の実施形態では、ベースラインリード(rad)カバレッジは、プローブ効率および飽和平衡に依存する関数である。
一部の実施形態では、コピー数状態を決定するステップは、遺伝子座のリードカバレッジをベースラインリードカバレッジと比較するステップを含む。一部の実施形態では、無細胞体液は、血清、血漿、尿および脳脊髄液からなる群より選択される。一部の実施形態では、リードカバレッジは、配列決定リードを参照ゲノムにマッピングすることにより決定される。一部の実施形態では、配列決定リードを得るステップは、被験体由来の無細胞体液由来のDNA分子にアダプターをライゲーションするステップを含む。一部の実施形態では、DNA分子は、二重鎖DNA分子であり、各アダプターが、DNA分子の相補鎖を異なる形でタグ付けして、タグ付けされた鎖を提供するように、アダプターは、二重鎖DNA分子にライゲーションされる。一部の実施形態では、遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度を決定するステップは、配列決定リードを、対になったリードおよび対にならないリードへと選別するステップを含み、(i)各対になったリードは、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なる形でタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各対にならないリードは、配列リードの前記セットにおける前記配列リード中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なる形でタグ付けされた相補鎖を有しない第1のタグ付けされた鎖を表す。一部の実施形態では、本方法は、1種または複数の遺伝子座のそれぞれにマッピングする、(i)前記対になったリードおよび(ii)前記対にならないリードの定量的尺度を決定して、各座位にマッピングする対になったリードおよび対にならないリードに関連する前記定量的尺度に基づき、前記1種または複数の遺伝子座のそれぞれにマッピングする、前記試料における総二本鎖DNA分子に関連する定量的尺度を決定するステップをさらに含む。一部の実施形態では、アダプターは、バーコード配列を含む。
一部の実施形態では、リードカバレッジを決定するステップは、参照ゲノムへの配列決定リードのマッピングの位置およびバーコード配列に基づき配列決定リードを折り畳む(collapsing)ステップを含む。一部の実施形態では、遺伝子座は、1種または複数の癌遺伝子を含む。一部の実施形態では、方法は、被験体の生殖系列ゲノムがヘテロ接合性であるベースライン化遺伝子座内のバリアントの相対量を決定することにより、ベースライン化遺伝子座の少なくともサブセットが、被験体の腫瘍細胞においてコピー数変更を起こしたことを決定するステップを含む。一部の実施形態では、バリアントの相対量は、ほぼ等しいわけではない。一部の実施形態では、バリアントの相対量がほぼ等しいわけではないベースライン化遺伝子座は、ベースライン化遺伝子座から除去され、これにより、アレル頻度補正されたベースライン化遺伝子座を提供する。一部の実施形態では、アレル頻度補正されたベースライン化遺伝子座は、先行する請求項のいずれか一項に記載の方法におけるベースライン化座位として使用される。
別の態様では、本開示は、メモリに、被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子の配列決定リードを受け取るステップと、コンピュータプロセッサを用いてコードを実行して、次のステップ:配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと;飽和平衡補正およびプローブ効率補正を遂行することにより、第1のデータセットを補正するステップと;第1のデータセットについてベースラインリードカバレッジを決定するステップであって、ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと;ベースラインリードカバレッジと比べた複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップとを遂行するステップとを含む方法を提供する。
別の態様では、本開示は、ネットワークと、ネットワークに接続された核酸(例えば、DNA)配列データを記憶するように構成されたコンピュータメモリを含むデータベースと、コンピュータメモリおよび1個または複数のコンピュータプロセッサを含むバイオインフォマティクスコンピュータであって、ネットワークに接続されたコンピュータとを含むシステムであって、コンピュータが、1個または複数のコンピュータプロセッサによって実行されると、データベースに記憶された核酸(例えば、DNA)配列データをコピーし、コピーされたデータを、バイオインフォマティクスコンピュータにおけるメモリに書き出し、核酸(例えば、DNA)配列データから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと;飽和平衡補正およびプローブ効率補正を遂行することにより、第1のデータセットを補正するステップと;第1のデータセットについてベースラインリードカバレッジを決定するステップであって、ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと;ベースラインリードカバレッジと比べた複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップとを含むステップを遂行する、機械実行可能なコードをさらに含む、システムを提供する。一部の実施形態では、データベースは、DNAシーケンサーに接続される。
参照による組込み
本明細書において言及されているあらゆる刊行物、特許および特許出願は、あたかも個々の刊行物、特許または特許出願が、参照により組み込まれていると特にかつ個々に示されているのと同じ程度まで、参照により本明細書に組み込まれている。
本発明の新規特色は、添付の特許請求の範囲において詳細に明記されている。本発明の特色および利点のより十分な理解は、本発明の原理が利用される説明的実施形態を明記する次の詳細な説明および添付の図面を参照することにより得られるであろう。
図1は、例示的な癌遺伝子および配列捕捉プローブの標的を例示する。
図2は、3種のスパイクイン(spike−in)にわたる遺伝子レベルシグナル対理論的コピー数およびスパイクイン遺伝子にわたるプローブレベルシグナル変異を例示する。
図3は、特有の分子計数を有するベイト量に関連するベイト最適化実験を例示する。
図4Aおよび図4Bは、特有の分子計数に対するp(図4A)およびGC含量(図4B)の非線形効果を例示する。 図4Aおよび図4Bは、特有の分子計数に対するp(図4A)およびGC含量(図4B)の非線形効果を例示する。
図5は、飽和補正もプローブ効率補正も遂行されていない、プローブ当たりの特有の分子計数を例示する。
図6は、プローブ当たりの飽和補正後の特有の分子計数を例示する。
図7は、プローブ当たりの飽和補正後およびプローブ効率補正後の特有の分子計数を例示する。
図8は、プローブ飽和およびプローブ効率に関連する、真のコピー数および特有の分子計数の間の相互作用の提案されたラングミュアモデルを例示する。
図9は、典型的臨床試料における飽和補正、プローブ効率補正および第2ラウンドのプローブ効率補正後の、ベースライン化遺伝子座のプローブシグナルノイズ低下を例示する。
図10Aおよび図10Bは、プローブ効率補正を遂行するために、参照試料において決定されたプローブ効率に対してプロットされた、飽和補正後のUMCを例示する。図10Aは、腫瘍細胞におけるコピー数変更を有しない被験体に由来する。図10Bは、腫瘍細胞におけるコピー数変更を有する被験体に由来する。 図10Aおよび図10Bは、プローブ効率補正を遂行するために、参照試料において決定されたプローブ効率に対してプロットされた、飽和補正後のUMCを例示する。図10Aは、腫瘍細胞におけるコピー数変更を有しない被験体に由来する。図10Bは、腫瘍細胞におけるコピー数変更を有する被験体に由来する。
図11は、患者試料における飽和およびプローブ効率補正されたコピー数変異検出の最終報告を例示する。試料の上の星印は、補正されたシグナルおよびマイナーアレル頻度(minor−allele frequency)補正されたベースライン最適化に基づき検出された遺伝子増幅を示す。
図12は、本開示の方法を実施するようにプログラムされたまたは他の仕方で構成された、コンピュータシステム1201を例示する。
図13は、本開示の方法を使用して測定された、遺伝子ERBB2の観察されたコピー数(CN)対理論的CNを例示する。黒塗りの(solid)ドットは、ほぼ2(二倍体試料)の観察されたコピー数を表し、白抜きの(open)ドットは、検出された増幅事象を表し、太い水平破線は、平均遺伝子CNカットオフをマークする。
図14は、対照方法(四角形)と比較した、本開示の方法(ドット)を使用して測定された、遺伝子ERBB2の観察されたコピー数(CN)対理論的CNを例示する。黒塗りのドットは、ほぼ2(二倍体試料)の観察されたコピー数を表し、白抜きのドットは、検出された増幅事象を表し、太い水平破線は、平均遺伝子CNカットオフをマークする。
図15は、本開示の方法(三角形)対対照方法(X)のための検証試験において使用されたプローブに対してプロットされた、プローブコピー数を例示する。
定義
用語「遺伝的バリアント」は、本明細書において、被験体の核酸試料またはゲノムにおける変更、バリアントまたは多型を一般に指す。かかる変更、バリアントまたは多型は、被験体または他の個体の参照ゲノムであり得る参照ゲノムに関するものであり得る。一塩基多型(SNP)は、多型の一形態である。一部の例では、1個または複数の多型は、1個または複数の一塩基変異(SNV)、挿入、欠失、反復、小規模な挿入、小規模な欠失、小規模な反復、構造的バリアント接合部、可変長タンデム反復および/または隣接配列を含む。コピー数バリアント(CNV)、トランスバージョンおよび他の再編成も、遺伝的変異の形態である。ゲノム変更(alternation)は、塩基変化、挿入、欠失、反復、コピー数変異またはトランスバージョンであり得る。
用語「ポリヌクレオチド」は、本明細書において、1個または複数の核酸サブユニットを含む分子を一般に指す。ポリヌクレオチドは、アデノシン(A)、シトシン(C)、グアニン(G)、チミン(T)およびウラシル(U)またはこれらのバリアントから選択される1個または複数のサブユニットを含むことができる。ヌクレオチドは、A、C、G、TもしくはUまたはこれらのバリアントを含むことができる。ヌクレオチドは、伸びている核酸鎖に取り込まれ得るいずれかのサブユニットを含むことができる。かかるサブユニットは、A、C、G、TまたはU、あるいは1個もしくは複数の相補的A、C、G、TもしくはUに特異的な、またはプリン(すなわち、AもしくはGまたはこれらのバリアント)もしくはピリミジン(すなわち、C、TもしくはUまたはこれらのバリアント)に相補的な、他のいずれかのサブユニットであり得る。サブユニットは、個々の核酸塩基または塩基群(例えば、AA、TA、AT、GC、CG、CT、TC、GT、TG、AC、CAまたはそれらのウラシル対応物)を分解することを可能にすることができる。一部の例では、ポリヌクレオチドは、デオキシリボ核酸(DNA)もしくはリボ核酸(RNA)またはこれらの誘導体である。ポリヌクレオチドは、一本鎖または二本鎖であり得る。
用語「被験体」は、本明細書にいて、哺乳動物種(例えば、ヒト)もしくは鳥類(例えば、トリ)種等の動物、または植物等の他の生物を一般に指す。より具体的には、被験体は、脊椎動物、哺乳動物、マウス、霊長類、サルまたはヒトであり得る。動物として、家畜、競技用動物(sport animal)およびペットが挙げられるがこれらに限定されない。被験体は、健康個体、疾患もしくは疾患素因を有するもしくはこれを有すると疑われる個体、または治療を必要とするもしくは治療を必要とすると疑われる個体であり得る。被験体は、患者であり得る。
用語「ゲノム」は、生物の遺伝情報の全体を一般に指す。ゲノムは、DNAまたはRNAのいずれかにおいてコードされ得る。ゲノムは、タンパク質をコードするコード領域と共に非コード領域を含むことができる。ゲノムは、生物における全染色体の配列を一体に含むことができる。例えば、ヒトゲノムは、総計46本の染色体を有する。これら全ての配列が一体に、ヒトゲノムを構成する。
用語「アダプター(複数可)」、「アダプター(複数可)」および「タグ(複数可)」は、本明細書を通して同義に使用されている。アダプターまたはタグは、ライゲーション、ハイブリダイゼーションまたは他のアプローチを含むいずれかのアプローチによって「タグ付け」されるように、ポリヌクレオチド配列にカップリングすることができる。
用語「ライブラリーアダプター」または「ライブラリーアダプター」は、本明細書において、その正体(例えば、配列)を使用して、生体試料(本明細書において同様に「試料」)におけるポリヌクレオチドを区別することができる分子(例えば、ポリヌクレオチド)を一般に指す。
用語「配列決定アダプター」は、本明細書において、配列決定機器が、配列決定を可能にするよう標的ポリヌクレオチドと相互作用すること等によって、標的ポリヌクレオチドを配列決定することを可能にするように適応された分子(例えば、ポリヌクレオチド)を一般に指す。配列決定アダプターは、標的ポリヌクレオチドが、配列決定機器によって配列決定されることを可能にする。一例では、配列決定アダプターは、フローセル等、配列決定システムの固体支持体に取り付けられた捕捉ポリヌクレオチドにハイブリダイズまたは結合するヌクレオチド配列を含む。別の例では、配列決定アダプターは、ポリヌクレオチドにハイブリダイズまたは結合して、標的ポリヌクレオチドが、配列決定システムによって配列決定されることを可能にするヘアピンループを生成するヌクレオチド配列を含む。配列決定アダプターは、他の分子(例えば、ポリヌクレオチド)のフローセル配列に相補的で、配列決定システムによる標的ポリヌクレオチドの配列決定に使用可能なヌクレオチド配列であり得るシーケンサーモチーフを含むことができる。シーケンサーモチーフは、合成による配列決定等、配列決定における使用のためのプライマー配列を含むこともできる。シーケンサーモチーフは、配列決定システムへのライブラリーアダプターのカップリングおよび標的ポリヌクレオチドの配列決定に必要とされる配列(複数可)を含むことができる。
本明細書において、用語「少なくとも」、「多くても」または「約」は、他のことが特定されていなければ、あるシリーズに先行する場合、このシリーズの各メンバーを指す。
参照数値に関する用語「約」およびその文法上の等価物は、該値から最大プラスまたはマイナス10%の値の範囲を含むことができる。例えば、「約10」の量は、9〜11の量を含むことができる。他の実施形態では、参照数値に関する用語「約」は、該値からプラスまたはマイナス10%、9%、8%、7%、6%、5%、4%、3%、2%または1%の値の範囲を含むことができる。
参照数値に関する用語「少なくとも」およびその文法上の等価物は、参照数値および該値を超えるものを含むことができる。例えば、「少なくとも10」の量は、10の値、ならびに11、100および1,000等、10を上回るいずれかの数値を含むことができる。
参照数値に関する用語「多くても」およびその文法上の等価物は、参照数値および該値に満たないものを含むことができる。例えば、「多くても10」の量は、10の値、ならびに9、8、5、1、0.5および0.1等、10を下回るいずれかの数値を含むことができる。
用語「定量的尺度」は、絶対および相対尺度を含む、量のいずれかの尺度を指す。定量的尺度は、例えば、数(例えば、計数)、パーセンテージ、程度または閾値であり得る。
用語「リードカバレッジ」は、生の配列リードから推論される特有の分子計数等、生の配列リードまたは加工済の配列リードによるカバレッジを指す。
用語「ベースラインリードカバレッジ」は、GC含量、プローブ効率、ライゲーション効率またはプルダウン効率等、所与のプローブパラメータに基づく二倍体ゲノム環境を含む試料におけるプローブの予想されるリードカバレッジを指す。
「プローブ」は、本明細書において、機能性を含むポリヌクレオチドを指す。機能性は、検出可能標識(蛍光)、結合部分(ビオチン)または固体支持体(磁気により誘引可能な粒子またはチップ)であり得る。
「相補性」は、伝統的ワトソン・クリックまたは他の非伝統的な型のいずれかにより別の核酸配列と水素結合(複数可)を形成する核酸の能力を指す。パーセント相補性は、第2の核酸配列と水素結合を形成(ワトソン・クリック塩基対形成)し得る核酸分子における残基のパーセンテージを示す(10のうち5、6、7、8、9、10は、それぞれ50%、60%、70%、80%、90%および100%相補的である)。「完全に相補的」は、核酸配列の近接残基が全て、第2の核酸配列における同数の近接残基と水素結合するであろうことを意味する。
「実質的に相補的」は、本明細書において、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50個もしくはそれよりも多いヌクレオチドの領域にわたり少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%もしくは100%である相補性の程度を指す、またはストリンジェントな条件下でハイブリダイズする2種の核酸を指す。パーセント相補性を評価する目的のため等、配列同一性は、Needleman−Wunschアルゴリズム(例えば、任意選択でデフォルト設定による、ワールド・ワイド・ウェブサイト:ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.htmlで入手できるEMBOSS Needleアライナ(aligner)を参照)、BLASTアルゴリズム(例えば、任意選択でデフォルト設定による、blast.ncbi.nlm.nih.gov/Blast.cgiで入手できるBLASTアラインメントツールを参照)またはSmith−Watermanアルゴリズム(例えば、任意選択でデフォルト設定による、ワールド・ワイド・ウェブサイト:ebi.ac.uk/Tools/psa/emboss_water/nucleotide.htmlで入手できるEMBOSS Waterアライナを参照)が挙げられるがこれらに限定されない、いずれか適したアラインメントアルゴリズムによって測定することができる。最適なアラインメントは、デフォルトパラメータを含む、選択されたアルゴリズムのいずれか適したパラメータを使用して評価することができる。
「ハイブリダイゼーション」は、1個または複数のポリヌクレオチドが反応して、ヌクレオチド残基の塩基間の水素結合により安定化される複合体を形成する反応を指す。水素結合は、ワトソン・クリック塩基対形成、フーグスティーン(Hoogstein)結合によって、または塩基相補性に従った他のいずれかの配列特異的様式で生じ得る。複合体は、二重鎖構造を形成する2本の鎖、多重鎖複合体を形成する3本またはそれよりも多い鎖、単一の自己ハイブリダイズする鎖、またはこれらのいずれかの組合せを含むことができる。ハイブリダイゼーション反応は、PCRの開始またはエンドヌクレアーゼによるポリヌクレオチドの酵素切断等、より大規模なプロセスにおけるステップを構成することができる。第1の配列に相補的な第2の配列は、第1の配列の「相補体」と称される。ポリヌクレオチドに適用される用語「ハイブリダイズ可能」は、ハイブリダイゼーション反応におけるヌクレオチド残基の塩基間の水素結合により安定化される複合体を形成するポリヌクレオチドの能力を指す。
用語「ストリンジェントなハイブリダイゼーション条件」は、ポリヌクレオチドが、その標的部分配列(subsequence)に優先的にハイブリダイズし、他の配列により少ない程度でハイブリダイズするまたは全くハイブリダイズしないであろう条件を指す。核酸ハイブリダイゼーション実験の文脈における「ストリンジェントなハイブリダイゼーション」は、配列依存性であり、異なる環境パラメータ下で異なる。核酸のハイブリダイゼーションに対する広範なガイドは、Tijssen(1993年)Laboratory Techniques in Biochemistry and Molecular Biology−−Hybridization with Nucleic Acid Probes、第I部、第2章「Overview of principles of hybridization and the strategy of nucleic acid probe assays」、Elsevier、New Yorkに見出される。
一般に、高度にストリンジェントなハイブリダイゼーションおよび洗浄条件は、規定のイオン強度およびpHにおける特異的配列のための熱の融点(Tm)よりも約5℃低くなるように選択される。Tmは、標的配列の50%が、完全にマッチしたプローブにハイブリダイズする温度(規定のイオン強度およびpH下における)である。非常にストリンジェントな条件は、特定のプローブのためのTmに等しくなるように選択される。
ストリンジェントなハイブリダイゼーション条件は、水、バッファー(pH6〜9またはpH7〜8におけるリン酸、tris、SSPEまたはSSCバッファー)、塩(ナトリウムまたはカリウム)および変性剤(SDS、ホルムアミドまたはtween)を含むバッファー、ならびに37℃〜70℃、60℃〜65℃の温度を含む。
サザンまたはノーザンブロットのフィルターにおける100個を超える相補的残基を有する相補的核酸のハイブリダイゼーションのためのストリンジェントなハイブリダイゼーション条件の例は、42℃における50%ホルマリンと1mgのヘパリンであり、ハイブリダイゼーションは一晩行われる。高度にストリンジェントな洗浄条件の例は、72℃における約15分間の0.15M NaClである。ストリンジェントな洗浄条件の例は、65℃における15分間の0.2×SSC洗浄である(SSCバッファーの記載についてはSambrookらを参照)。多くの場合、高ストリンジェンシー洗浄に先行して低ストリンジェンシー洗浄が行われて、バックグラウンドプローブシグナルを除去する。100個を超えるヌクレオチドの二重鎖のための中間ストリンジェンシー洗浄の例は、45℃における15分間の1×SSCである。例えば、100個を超えるヌクレオチドの二重鎖のための低ストリンジェンシー洗浄の例は、40℃における15分間の4〜6×SSCである。一般に、特定のハイブリダイゼーションアッセイにおける無関係のプローブに観察されるものの2×(またはそれよりも高い)のシグナル・ノイズ比は、特異的ハイブリダイゼーションの検出を示す。
一態様では、本開示は、(a)被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子に由来する配列決定リードを得るステップと、(b)複数の遺伝子座における遺伝子座毎に、(i)遺伝子座のグアニン−シトシン含量に関連する定量的尺度および(ii)配列決定リード由来の遺伝子座の配列決定リードカバレッジに関連する定量的尺度を含む第1のデータセットを生成するステップと、(c)(i)第1のデータセットから、配列決定リードカバレッジに関連する定量的尺度に関する高変動遺伝子座である遺伝子座を除去し、これにより、残っている遺伝子座の第1のセットを提供し、(ii)残っている遺伝子座の第1のセット由来の遺伝子座毎に、遺伝子座に由来する試料由来のDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度を決定し、(iii)残っている遺伝子座の第1のセットの配列決定リードカバレッジに関連する定量的尺度を、残っている遺伝子座の第1のセットのGC含量に関連する定量的尺度および残っている遺伝子座の第1のセットにおける各座位に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度の両方に関連付けることにより、配列決定リードカバレッジに関連する定量的尺度のための第1の変換を決定し、(iv)残っている遺伝子座の第1のセット由来の各遺伝子座の配列リードカバレッジに第1の変換を適用して、残っている遺伝子座の第1のセットの配列決定リードカバレッジの変換された定量的尺度の第1のセットを含む、第2のデータセットを提供することによって、第1のデータセットを第2のデータセットへと変換するステップとを含む方法を提供する。
一部の実施形態では、本方法は、(d)第2のデータセットから、配列決定リードカバレッジの変換された定量的尺度の第1のセットに関して高変動遺伝子座である遺伝子座を除去し、これにより、残っている遺伝子座の第2のセットを提供し、(e)残っている遺伝子座の第2のセットの効率に関連する配列決定リードカバレッジの変換された定量的尺度の第1のセットのための第2の変換を決定し、(f)第2の変換を用いて、残っている遺伝子座の第2のセットの配列決定リードカバレッジの変換された定量的尺度の第1のセットを変換し、これにより、(d、i)の残っている遺伝子座の第2のセットの配列決定リードカバレッジに関連する変換された定量的尺度の第2のセットを含む、第3のデータセットを提供することにより、第2のデータセットを第3のデータセットへと変換するステップをさらに含む。
被験体由来の無細胞体液のDNA分子から配列決定リードを得るステップ
被験体の無細胞体液のDNA分子から配列決定リードを得るステップは、無細胞体液を得るステップを含むことができる。例示的な無細胞体液は、血清、血漿、血液、唾液、尿、滑液、全血、リンパ液、腹水、間質液もしくは細胞外液、歯肉溝滲出液(gingival crevicular fluid)、骨髄、脳脊髄液、唾液、粘液、痰、精液、汗、尿を含む細胞間の空間における流体、または他のいずれかの体液であるまたはこれに由来し得る。無細胞体液は、血漿、尿または脳脊髄液からなる群より選択され得る。無細胞体液は、血漿であり得る。無細胞体液は、尿であり得る。無細胞体液は、脳脊髄液であり得る。
DNA分子を含む核酸分子は、無細胞体液から抽出することができる。DNA分子は、ゲノムDNAであり得る。DNA分子は、被験体の健康組織の細胞に由来し得る。DNA分子は、体細胞突然変異を起こした非がん性細胞に由来し得る。DNA分子は、母体試料における胎児に由来し得る。当業者は、DNA分子が母体試料における胎児に由来する実施形態では、被験体は、試料が母体であっても胎児を指すことができることを理解するであろう。DNA分子は、被験体の前がん性細胞に由来し得る。DNA分子は、被験体のがん性細胞に由来し得る。DNA分子は、被験体の原発性腫瘍内の細胞に由来し得る。DNA分子は、被験体の続発性腫瘍に由来し得る。DNA分子は、循環DNAであり得る。循環DNAは、循環腫瘍DNA(ctDNA)を含むことができる。DNA分子は、二本鎖または一本鎖であり得る。あるいは、DNA分子は、二本鎖部分および一本鎖部分の組合せを含むことができる。DNA分子は、無細胞である必要はない。一部の事例では、DNA分子は、試料から単離することができる。例えば、DNA分子は、体液、例えば、血清または血漿から単離された無細胞DNAであり得る。
試料は、様々な量のゲノム当量の核酸分子を含むことができる。例えば、約30ng DNAの試料は、約10,000一倍体ヒトゲノム当量を含有することができ、cfDNAの場合、約2千億個の個々のポリヌクレオチド分子を含有することができる。同様に、約100ngのDNAの試料は、約30,000一倍体ヒトゲノム当量を含有することができ、cfDNAの場合、約6千億個の個々の分子を含有することができる。
無細胞DNA分子は、本技術分野で公知の種々の技法を使用して、体液から単離および抽出することができる。一部の事例では、無細胞核酸は、Qiagen Qiamp(登録商標)循環核酸キットプロトコール等、市販のキットを使用して、単離、抽出および調製することができる。他の例では、Qiagen Qubit(商標)dsDNA HSアッセイキットプロトコール、Agilent(商標)DNA 1000キットまたはTruSeq(商標)配列決定ライブラリー調製物;ロースループット(LT)プロトコールを使用して、核酸を定量化することができる。無細胞核酸は、起源が胎児であり得る(妊娠中の被験体から採取された流体を介して)、または被験体自身の組織に由来することができる。無細胞核酸は、新生物(例えば、腫瘍または腺腫)に由来することができる。
一般に、無細胞核酸は、溶液中に存在する無細胞核酸が、細胞および体液の他の不溶性構成成分から分離される、分配ステップにより体液から抽出および単離される。分配として、遠心分離または濾過等の技法を挙げることができるがこれらに限定されない。他の事例では、細胞は、先ず無細胞核酸から分配されるのではなく、溶解される。一例では、インタクト細胞のゲノムDNAは、選択的沈殿により分配される。DNAを含む無細胞核酸は、可溶性のまま残ることができ、不溶性ゲノムDNAから分離し、抽出することができる。一般に、異なるキットに特異的なバッファーの添加および他の洗浄ステップ後に、イソプロパノール沈殿を使用して核酸を沈殿することができる。シリカベースのカラム等、さらに別の浄化ステップを使用して、夾雑物または塩を除去することができる。一般ステップは、特異的な適用のために最適化することができる。例えば、収量等、手順のある特定の態様を最適化するための反応を通して、非特異的バルク担体核酸を添加することができる。
無細胞DNA分子は、多くても500ヌクレオチドの長さ、多くても400ヌクレオチドの長さ、多くても300ヌクレオチドの長さ、多くても250ヌクレオチドの長さ、多くても225ヌクレオチドの長さ、多くても200ヌクレオチドの長さ、多くても190ヌクレオチドの長さ、多くても180ヌクレオチドの長さ、多くても170ヌクレオチドの長さ、多くても160ヌクレオチドの長さ、多くても150ヌクレオチドの長さ、多くても140ヌクレオチドの長さ、多くても130ヌクレオチドの長さ、多くても120ヌクレオチドの長さ、多くても110ヌクレオチドの長さまたは多くても100ヌクレオチドの長さであり得る。
無細胞DNA分子は、少なくとも500ヌクレオチドの長さ、少なくとも400ヌクレオチドの長さ、少なくとも300ヌクレオチドの長さ、少なくとも250ヌクレオチドの長さ、少なくとも225ヌクレオチドの長さ、少なくとも200ヌクレオチドの長さ、少なくとも190ヌクレオチドの長さ、少なくとも180ヌクレオチドの長さ、少なくとも170ヌクレオチドの長さ、少なくとも160ヌクレオチドの長さ、少なくとも150ヌクレオチドの長さ、少なくとも140ヌクレオチドの長さ、少なくとも130ヌクレオチドの長さ、少なくとも120ヌクレオチドの長さ、少なくとも110ヌクレオチドの長さまたは少なくとも100ヌクレオチドの長さであり得る。特に、無細胞核酸は、140〜180の間のヌクレオチドの長さであり得る。
無細胞DNAは、様々な量の健康組織および腫瘍由来のDNA分子を含むことができる。腫瘍由来無細胞DNAは、試料における無細胞DNAの総量の少なくとも0.1%、試料における無細胞DNAの総量の少なくとも0.2%、試料における無細胞DNAの総量の少なくとも0.5%、試料における無細胞DNAの総量の少なくとも0.7%、試料における無細胞DNAの総量の少なくとも1%、試料における無細胞DNAの総量の少なくとも2%、試料における無細胞DNAの総量の少なくとも3%、試料における無細胞DNAの総量の少なくとも4%、試料における無細胞DNAの総量の少なくとも5%、試料における無細胞DNAの総量の少なくとも10%、試料における無細胞DNAの総量の少なくとも15%、試料における無細胞DNAの総量の少なくとも20%、試料における無細胞DNAの総量の少なくとも25%もしくは試料における無細胞DNAの総量の少なくとも30%、またはそれよりも多くなり得る。
一部の事例では、DNA分子は、抽出プロセスの際に剪断されてよく、100〜400の間のヌクレオチドの長さの断片を含む。一部の事例では、核酸は、抽出後に剪断されてよく、100〜400の間のヌクレオチドの長さのヌクレオチドを含むことができる。一部の事例では、DNA分子は既に100〜400の間のヌクレオチドの長さであり、追加的な剪断は意図的に実施されない。
被験体は、動物であり得る。被験体は、イヌ、ウマ、ネコ、マウス、ラットまたはヒト等、哺乳動物であり得る。被験体は、ヒトであり得る。被験体は、がんを有すると疑われ得る。被験体は、がん診断を以前に受けていてよい。被験体のがん状態は、不明であり得る。被験体は、雄または雌であり得る。被験体は、少なくとも20歳、少なくとも30歳、少なくとも40歳、少なくとも50歳、少なくとも60歳または少なくとも70歳であり得る。
配列決定は、本技術分野で公知のいずれかの方法によって為すことができる。例えば、配列決定技法は、古典的技法(例えば、標識されたターミネーターまたはプライマーおよびスラブまたはキャピラリーにおけるゲル分離を使用した、ジデオキシ配列決定反応(サンガーの方法))および次世代技法を含む。例示的な技法は、可逆的に終結された標識されたヌクレオチドを使用した合成による配列決定、パイロシークエンシング、454配列決定、Illumina/Solexa配列決定、標識されたオリゴヌクレオチドプローブのライブラリーへのアレル特異的ハイブリダイゼーション、標識されたクローンのライブラリーへのアレル特異的ハイブリダイゼーションに続くライゲーションを使用した合成による配列決定、重合ステップにおける標識されたヌクレオチドの取り込みのリアルタイムモニタリング、ポロニー配列決定、SOLiD配列決定 標的化配列決定、単一分子リアルタイム配列決定、エクソン配列決定、電子顕微鏡に基づく配列決定、パネル配列決定、トランジスタ媒介性配列決定、直接的配列決定、ランダムショットガン配列決定、全ゲノム配列決定、ハイブリダイゼーションによる配列決定、キャピラリー電気泳動、ゲル電気泳動、二重鎖配列決定、サイクル配列決定、単一塩基伸長配列決定、固相配列決定、ハイスループット配列決定、超並列シグネチャー配列決定、エマルションPCR、低変性温度−PCR(COLD−PCR)における同時増幅、マルチプレックスPCR、可逆的ダイターミネーターによる配列決定、ペアードエンド配列決定、ニアターム(near−term)配列決定、エキソヌクレアーゼ配列決定、ライゲーションによる配列決定、ショートリード(short−read)配列決定、単一分子配列決定、リアルタイム配列決定、リバースターミネーター配列決定、ナノポア配列決定、MS−PET配列決定およびこれらの組合せを含む。一部の実施形態では、配列決定方法は、超並列配列決定である、すなわち、少なくとも100、1000、10,000、100,000、百万、1千万、1億または十億個のポリヌクレオチド分子のいずれかを同時に(または素早く連続して)配列決定する。一部の実施形態では、配列決定は、例えば、IlluminaまたはApplied Biosystemsから市販されている遺伝子分析器等、遺伝子分析器によって遂行することができる。分離された分子の配列決定は、ポリメラーゼまたはリガーゼを使用した逐次または単一の伸長反応や、プローブのライブラリーとの単一または逐次の差次的ハイブリダイゼーションによって、つい最近になって実証された。配列決定は、DNAシーケンサー(例えば、配列決定反応を遂行するように設計された機械)によって遂行することができる。一部の実施形態では、DNAシーケンサーは、例えば、DNA配列データを含有するデータベースを含むことができる、またはこれに接続されてよい。
使用することができる配列決定技法は、例えば、合成による配列決定システムの使用を含む。第1のステップにおいて、DNAは、ほぼ300〜800塩基対の断片へと剪断され、断片は、平滑末端にされる。次に、オリゴヌクレオチドアダプターが、断片の末端にライゲーションされる。アダプターは、断片の増幅および配列決定のためのプライマーとして機能する。断片は、例えば、5’−ビオチンタグを含有するアダプターBを使用して、DNA捕捉ビーズ、例えば、ストレプトアビジンコーティングされたビーズに取り付けることができる。ビーズに取り付けられた断片は、油−水エマルションの液滴内でPCR増幅される。その結果は、各ビーズにおける、複数コピーのクローン的に増幅されたDNA断片である。第2のステップにおいて、ビーズは、ウェル(ピコリットルサイズの)内に捕捉される。パイロシークエンシングは、各DNA断片において並行して遂行される。1個または複数のヌクレオチドの付加は、光シグナルを生成し、これは、配列決定機器におけるCCDカメラによって記録される。シグナル強度は、取り込まれたヌクレオチドの数に比例する。パイロシークエンシングは、ヌクレオチド付加により放出されるピロホスフェート(PPi)を活用する。PPiは、アデノシン5’ホスホスルフェートの存在下において、ATPスルフリラーゼによってATPに変換される。ルシフェラーゼは、ルシフェリンからオキシルシフェリンへの変換にATPを使用し、この反応は光を生成し、この光が検出および分析される。
使用することができるDNA配列決定技法の別の例は、Life Technologies Corporation(Carlsbad、Calif.)のApplied BiosystemsによるSOLiD技術である。SOLiD配列決定において、ゲノムDNAは、断片へと剪断され、アダプターが、断片の5’および3’端に取り付けられて、断片ライブラリーを生成する。あるいは、断片の5’および3’端にアダプターをライゲーションし、断片を環状化し、環状化された断片を消化して、内部アダプターを生成し、得られた断片の5’および3’端にアダプターを取り付けることにより、内部アダプターを導入することができ、メイトペアのライブラリーを生成する。次に、ビーズ、プライマー、鋳型およびPCR構成成分を含有するマイクロリアクタにおいてクローンのビーズ集団が調製される。PCR後に、鋳型が変性され、ビーズが濃縮されて、伸長した鋳型を有するビーズを分離する。選択されたビーズにおける鋳型は、スライドグラスへの結合を可能にする3’修飾に付される。特異的フルオロフォアによって同定される中心決定塩基(または塩基のペア)を有する部分的にランダムなオリゴヌクレオチドの逐次ハイブリダイゼーションおよびライゲーションによって、配列を決定することができる。色が記録された後に、ライゲーションされたオリゴヌクレオチドが除去され、次いでこのプロセスが反復される。
使用することができるDNA配列決定技法の別の例は、例えば、Life Technologies(South San Francisco、Calif.)のIon TorrentによってION TORRENTの商標で売られているシステムを使用したイオン半導体配列決定である。イオン半導体配列決定は、例えば、これらそれぞれの内容がその全体が参照により本明細書に組み込まれる、Rothbergら、An integrated semiconductor device enabling non−optical genome sequencing、Nature 475巻:348〜352頁(2011年);米国特許出願公開第2010/0304982号;米国特許出願公開第2010/0301398号;米国特許出願公開第2010/0300895号;米国特許出願公開第2010/0300559号;および米国特許出願公開第2009/0026082号に記載されている。
使用することができる配列決定技術の別の例は、Illumina配列決定である。Illumina配列決定は、フォールドバック(fold−back)PCRおよび係留プライマーを使用した、固体表面におけるDNAの増幅に基づく。ゲノムDNAが断片化され、断片の5’および3’端にアダプタが付加される。フローセルチャネルの表面に取り付けられたDNA断片は、伸長および架橋増幅される。断片は二本鎖になり、二本鎖分子は変性される。複数サイクルの固相増幅と続く変性は、フローセルの各チャネルにおける同じ鋳型の、数百万クラスターのほぼ1,000コピーの一本鎖DNA分子を作製することができる。プライマー、DNAポリメラーゼおよび4種のフルオロフォア標識された可逆的に終結するヌクレオチドが使用されて、逐次配列決定を遂行する。ヌクレオチド取り込み後に、レーザーが使用されてフルオロフォアを励起し、画像が捕捉され、第1の塩基の正体が記録される。3’ターミネーターおよび各取り込まれた塩基のフルオロフォアが除去され、取り込み、検出および同定ステップが反復される。本技術に従った配列決定は、これらそれぞれがその全体が参照により本明細書に組み込まれる、米国特許第7,960,120号;米国特許第7,835,871号;米国特許第7,232,656号;米国特許第7,598,035号;米国特許第6,911,345号;米国特許第6,833,246号;米国特許第6,828,100号;米国特許第6,306,597号;米国特許第6,210,891号;米国特許出願公開第2011/0009278号;米国特許出願公開第2007/0114362号;米国特許出願公開第2006/0292611号;および米国特許出願公開第2006/0024681号に記載されている。
使用することができる配列決定技術の別の例は、Pacific Biosciences(Menlo Park、Calif.)の単一分子、リアルタイム(SMRT)技術を含む。SMRTにおいて、4種のDNA塩基のそれぞれは、4種の異なる蛍光色素のうちの1種に取り付けられる。これらの色素は、リン酸連結されている。単一のDNAポリメラーゼが、ゼロ・モード導波管(ZMW)の底における鋳型一本鎖DNAの単一分子により固定化される。伸びている鎖にヌクレオチドを取り込むには数ミリ秒を要する。この時間において、蛍光標識が励起され、蛍光シグナルを産生し、蛍光タグが切断除去される。色素の対応する蛍光の検出は、どの塩基が取り込まれたかを示す。このプロセスが反復される。
使用することができる配列決定技法の別の例は、ナノポア配列決定である(SoniおよびMeller、2007年、Progress toward ultrafast DNA sequence using solid−state nanopores、Clin Chem 53巻(11号):1996〜2001年)。ナノポアは、直径が1ナノメートルのオーダーの小孔である。伝導流体へのナノポアの浸漬およびこれを横切る電位の印加は、ナノポアを通したイオンの伝導による僅かな電流をもたらす。流れる電流の量は、ナノポアのサイズに対して感受性である。DNA分子が、ナノポアを通過する際に、DNA分子における各ヌクレオチドが、異なる程度までナノポアを閉塞する。よって、DNA分子がナノポアを通過する際の、ナノポアを通過する電流の変化は、DNA配列の読み取りを表す。
使用することができる配列決定技法の別の例は、DNAを配列決定するための化学的感受性電界効果トランジスタ(chemFET)アレイの使用が関与する(例えば、米国特許出願公開第2009/0026082号に記載の通り)。本技法の一例では、DNA分子は、反応チャンバ内に置くことができ、鋳型分子は、ポリメラーゼに結合した配列決定プライマーにハイブリダイズさせることができる。配列決定プライマーの3’端における新たな核酸鎖への1個または複数のトリホスフェートの取り込みは、chemFETによる電流の変化によって検出することができる。アレイは、複数のchemFETセンサを有することができる。別の例では、単一の核酸は、ビーズに取り付けることができ、核酸は、ビーズにおいて増幅することができ、個々のビーズは、chemFETアレイにおける個々の反応チャンバに移すことができ、各チャンバは、chemFETセンサを有し、核酸を配列決定することができる。
使用することができる配列決定技法の別の例は、例えば、Moudrianakis, E. N.およびBeer M.、Base sequence determination in nucleic acids with the electron microscope, III内、Chemistry and microscopy of guanine−labeled DNA、PNAS 53巻:564〜71頁(1965年)によって記載されている通り、電子顕微鏡の使用が関与する。本技法の一例では、個々のDNA分子は、電子顕微鏡を使用して区別可能な金属性標識を使用して標識される。次いで、これらの分子は、平坦な表面上に伸展され、電子顕微鏡を使用して撮像されて、配列を測定する。
配列決定に先立ち、アダプター配列は、核酸分子に取り付けることができ、核酸は、特定の目的の配列を濃縮させることができる。配列濃縮は、アダプター配列の取り付けの前または後に行うことができる。
核酸分子または濃縮された核酸分子は、本明細書に開示されているいずれかの配列決定プラットフォームにおける使用に適したいずれかの配列決定アダプターに取り付けることができる。例えば、配列アダプターは、フローセル配列、試料バーコードまたはその両方を含むことができる。別の例では、配列アダプターは、ヘアピン形のアダプター、Y字形のアダプター、フォーク形のアダプターであり得る、および/または試料バーコードを含み得る。一部の事例では、アダプターは、配列決定プライマー領域を含まない。一部の事例では、アダプターが取り付けられたDNA分子は増幅され、増幅産物は、本明細書に記載されている特異的配列について濃縮される。一部の事例では、DNA分子は、配列決定ライブラリーの調製後に特異的配列について濃縮される。アダプターは、バーコード配列を含むことができる。異なるバーコードは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25個またはそれよりも多い(本明細書を通して記載されているまたはいずれかの長さ)核酸塩基、例えば、7塩基であり得る。バーコードは、ランダム配列、縮重配列、半縮重(semi−degenerate)配列または規定の配列であり得る。一部の事例では、実質的に各核酸分子(例えば、その少なくとも70%、少なくとも80%、少なくとも90%または少なくとも99%)が異なるバーコード配列によりタグ付けされる、バーコードの十分な多様性が存在する。一部の事例では、特定の遺伝子座由来の実質的に各核酸分子(例えば、その少なくとも70%、少なくとも80%、少なくとも90%または少なくとも99%)が異なるバーコード配列によりタグ付けされる、バーコードの十分な多様性が存在する。
配列決定アダプターは、1種または複数の配列決定プライマーにハイブリダイズすることができる配列を含むことができる。配列決定アダプターは、固体支持体にハイブリダイズする配列、例えば、フローセル配列をさらに含むことができる。例えば、配列決定アダプターは、フローセルアダプターであり得る。配列決定アダプターは、ポリヌクレオチド断片の一端または両端に取り付けることができる。別の例では、配列決定アダプターは、ヘアピン形であり得る。例えば、ヘアピン形のアダプターは、相補的二本鎖部分およびループ部分を含むことができ、二本鎖部分は、二本鎖ポリヌクレオチドに取り付ける(例えば、ライゲーションする)ことができる。ヘアピン形の配列決定アダプターは、ポリヌクレオチド断片の両端に取り付けて、複数回配列決定され得る環状分子を生成することができる。
一部の事例では、ライブラリーアダプターのうち、試料同定モチーフ(または試料分子バーコード)を含有するものはない。かかる試料同定モチーフは、配列決定アダプターを介して提供することができる。試料同定モチーフは、他の試料由来のポリヌクレオチド分子から、所与の試料由来のポリヌクレオチド分子の同定を可能にする、少なくとも4、5、6、7、8、9、10、20、30または40ヌクレオチド塩基のシーケンサーを含むことができる。例えば、これは、2つの被験体由来のポリヌクレオチド分子が、同じプールにおいて配列決定され、被験体の配列リードがその後に同定されることを可能にすることができる。
シーケンサーモチーフは、配列決定システムへのライブラリーアダプターのカップリングおよびライブラリーアダプターにカップリングされた標的ポリヌクレオチドの配列決定に必要とされるヌクレオチド配列(複数可)を含む。シーケンサーモチーフは、フローセル配列に相補的な配列と、配列決定における使用のためのプライマー(またはプライミング配列)に選択的にハイブリダイズされ得る配列(配列決定開始配列)とを含むことができる。例えば、かかる配列決定開始配列は、合成による配列決定(例えば、Illumina)における使用に用いられるプライマーに相補的であり得る。かかるプライマーは、配列決定アダプターに含まれてよい。配列決定開始配列は、プライマーハイブリダイゼーション部位であり得る。
一部の事例では、ライブラリーアダプターのうち、完全シーケンサーモチーフを含有するものはない。ライブラリーアダプターは、部分的シーケンサーモチーフを含有することができるまたはシーケンサーモチーフを含有しない。一部の事例では、ライブラリーアダプターは、配列決定開始配列を含む。ライブラリーアダプターは、配列決定開始配列を含むことができるが、フローセル配列は含まない。配列開始配列は、配列決定のためのプライマーに相補的であり得る。プライマーは、配列特異的プライマーまたはユニバーサルプライマーであり得る。かかる配列決定開始配列は、ライブラリーアダプターの一本鎖部分に位置することができる。代案として、かかる配列決定開始配列は、ポリメラーゼが、配列決定の際にライブラリーアダプターにカップリングすることを可能にする、プライミング部位(例えば、キンク(kink)またはニック)であり得る。
アダプターは、ライゲーションによってDNA分子に取り付けることができる。一部の事例では、アダプターは、各アダプターが、DNA分子の相補鎖を異なる形でタグ付けするように、二重鎖DNA分子にライゲーションすることができる。一部の事例では、アダプター配列は、PCRによって取り付けることができ、一本鎖DNAの第1の部分は、標的配列に相補的であり、第2の部分は、アダプター配列を含む。
特定の目的の配列の濃縮は、配列捕捉方法によって遂行することができる。配列捕捉は、目的の標的にハイブリダイズする、固定化されたプローブを使用して遂行することができる。配列捕捉は、特異的配列にハイブリダイズされたプローブが、プルダウンによって試料から濃縮されることを可能にする、官能基、例えば、ビオチンに取り付けられたプローブを使用して遂行することができる。一部の事例では、官能化されたプローブへのハイブリダイゼーションに先立ち、非特異的またはオフターゲット結合を低下させるために、相補的な、官能化されていないポリヌクレオチド配列を断片にアニールすることにより、ライブラリー断片由来のアダプター配列等、特異的配列をマスクすることができる。配列プローブは、特異的遺伝子を標的とすることができる。配列捕捉プローブは、特異的遺伝子座または遺伝子を標的とすることができる。かかる遺伝子は、癌遺伝子であり得る。捕捉プローブによって標的化される例示的な遺伝子は、図1に示す遺伝子を含む。点突然変異(SNV)を有する例示的な遺伝子として、AKT1、ATM、CCNE1、CTNNB1、FGFR1、GNAS、JAK3、MLH1、NPM1、PTPN11、RIT1、TERT、ALK、BRAF、CDH1、EGFR、FGFR2、HNF1A、KIT MPL、NRAS、RAF1、ROS1、TP53、APC、BRCA1、CDK4、ERBB2、FGFR3、HRAS、KRAS、MYC、NTRK1、RB1、SMAD4、TSC1、AR、BRCA2、CDK6、ESR1、GATA3、IDH2、MAP2K2、NFE2L2、PIK3CA、RHEB、SRC、ARID1A、CCND2、CDKN2B、FBXW7、GNAQ、JAK2、MET、NOTCH1、PTEN、RHOAおよびSTK11が挙げられるがこれらに限定されない。コピー数変異を有する例示的な遺伝子として、AR、CCNE1、CDK6、ERBB2、FGFR2、KRAS、MYC、PIK3CA、BRAF、CDK4、EGFR、FGFR1、KIT、MET、PDGFRAおよびRAF1が挙げられるがこれらに限定されない。遺伝子融合を有する例示的な遺伝子として、ALK、FGFR2、FGFR3、NTRK1、RETおよびROS1が挙げられるがこれらに限定されない。インデルを有する例示的な遺伝子として、EGFR(例えば、エクソン19および20における)、ERBB2(例えば、エクソン19および20における)およびMET(例えば、エクソン14のスキッピング)が挙げられるがこれらに限定されない。例示的な標的は、CCND1およびCCND2を含むことができる。配列捕捉プローブは、遺伝子にわたり敷き詰める(tile)ことができる(例えば、プローブは、重複領域を標的とすることができる)。配列プローブは、非重複領域を標的とすることができる。配列プローブは、長さ、融解温度および二次構造に関して最適化され得る。
グアニン−シトシン(GC)含量の定量的尺度
グアニン−シトシン含量は、グアニンまたはシトシンのいずれかである、DNA分子の窒素含有塩基のパーセンテージである。遺伝子座のGC含量に関連する定量的尺度は、遺伝子座全体のGC含量であり得る。遺伝子座のGC含量に関連する定量的尺度は、遺伝子のエクソン領域のGC含量であり得る。遺伝子座のGC含量に関連する定量的尺度は、遺伝子座にマッピングするリードによって被覆される領域のGC含量であり得る。GC含量に関連する定量的尺度は、遺伝子座に対応する配列捕捉プローブのGC含量であり得る。遺伝子座のGC含量に関連する定量的尺度は、遺伝子座に対応する配列捕捉プローブのGC含量の中心傾向に関連する尺度であり得る。中心傾向に関連する尺度は、平均、中央値またはモード等、中心傾向のいずれかの尺度であり得る。中心傾向に関連する尺度は、中央値であり得る。所与の領域のGC含量は、該領域にわたるグアノシンおよびシトシン塩基の数を塩基の総数で割ることにより測定することができる。
配列決定リードカバレッジの定量的尺度
配列決定リードカバレッジに関連する定量的尺度は、遺伝子座に対応するDNA分子に由来するリードの数を示す尺度である(例えば、参照ゲノム由来の特定の位置、塩基、領域、遺伝子または染色体)。リードを遺伝子座に関連付けるために、リードは、参照にマッピングまたは整列することができる。マッピングまたは整列を遂行するためのソフトウェア(例えば、Bowtie、BWA、mrsFAST、BLAST、BLAT)は、配列決定リードを遺伝子座と関連付けることができる。マッピングプロセスにおいて、特定のパラメータを最適化することができる。マッピングプロセスの最適化の非限定例は、反復領域のマスク;マッピング品質(例えば、MAPQ)スコアカットオフの利用;アラインメントを生成するための異なるシード長の使用;およびゲノムの位置間の編集距離の限定を含むことができる。
配列決定リードカバレッジに関連した定量的尺度は、遺伝子座に関連したリードの計数を含むことができる。一部の事例では、計数は、新たな測定基準へと変換されて、異なる配列決定深度、ライブラリー複雑性または遺伝子座のサイズの効果を軽減する。例示的な測定基準は、百万単位当たりのキロベース当たりのリード(Read Per Kilobase per Million)、百万単位当たりのキロベース当たりの断片(Fragments Per Kilobase per Million)(FPKM)、M値のトリム平均(TMM)(Trimmed Mean of M values)、変動安定化された生の計数(variance stabilized raw counts)、および対数変換された生の計数である。特定の適用に使用することができる他の変換も、当業者にとって公知である。
定量的尺度は、折り畳まれたリードを使用して決定することができ、各折り畳まれたリードは、初期鋳型DNA分子に対応する。リードファミリーを折り畳むおよび定量化するための方法は、これらそれぞれがその全体が参照により本明細書に組み込まれる、PCT/US2013/058061およびPCT/US2014/000048に見出される。特に、バーコードおよび配列決定リードからの配列情報を使用する折り畳み方法を用いて、各ファミリーが、バーコード配列、および配列決定リード配列の少なくとも一部分を共有するように、リードをファミリーへと折り畳むことができる。次いで、各ファミリーは、ファミリーの大部分に関して、単一の初期鋳型DNA分子から導出される。ファミリー由来の配列のマッピングに由来する計数は、「特有の分子計数」(UMC)と称することができる。一部の事例では、配列決定リードカバレッジに関連する定量的尺度を決定するステップは、ライブラリーサイズに関連する測定基準によってUMCを正規化して、正規化されたUMC(「正規化されたUMC」)を提供するステップを含む。例示的な方法は、遺伝子座のUMCを全UMCの和で割ること;遺伝子座のUMCを全常染色体UMCの和で割ることである。複数の配列決定リードのデータセットを比較する場合、UMCは、例えば、2個の配列決定リードのデータセットの遺伝子座の中央値UMCによって正規化することができる。一部の事例では、配列決定リードカバレッジに関連する定量的尺度は、次の通りにさらに正規化される正規化されたUMCであり得る:(i)正規化されたUMCは、トレーニング試料に由来する配列決定リード由来の対応する遺伝子座について決定される;(ii)遺伝子座毎に、試料の正規化されたUMCは、対応する座位におけるトレーニング試料の正規化されたUMCの中央値によって正規化され、これにより、遺伝子座の相対的存在量(RA)を提供する。
コンセンサス配列は、例えば、最初の5、10、15、20または25塩基内の同一配列に基づき配列決定リードを折り畳むことにより、その配列に基づき同定することができる。一部の事例では、折り畳みは、それ以外は同一であるリードにおける1個の差、2個の差、3個の差、4個の差または5個の差を可能にする。一部の事例では、折り畳みは、リードのマッピング位置、例えば、配列決定リードの初期塩基のマッピング位置を使用する。一部の事例では、折り畳みは、バーコードを使用し、バーコード配列を共有する配列決定リードは、コンセンサス配列へと折り畳まれる。一部の事例では、折り畳みは、バーコードおよび初期鋳型分子の配列の両方を使用する。例えば、バーコードを共有し、参照ゲノムにおける同じ位置にマッピングする全リードを折り畳むことができる。別の例では、バーコードおよび初期鋳型分子の配列(または初期鋳型分子の配列に対するパーセンテージ同一性)を共有する全リードを折り畳むことができる。
一部の事例では、配列決定リードカバレッジの定量的尺度は、ゲノムの特異的な部分領域について決定される。領域は、ビン、目的の遺伝子、エクソン、配列プローブに対応する領域、プライマー増幅産物に対応する領域、またはプライマー結合部位に対応する領域であり得る。一部の事例では、ゲノムの部分領域は、配列捕捉プローブに対応する領域である。リードの少なくとも一部分が、配列捕捉プローブに対応する領域の少なくとも一部分をマッピングする場合、リードは、配列捕捉プローブに対応する領域にマッピングすることができる。リードの少なくとも一部分が、配列捕捉プローブに対応する領域の大部分にマッピングする場合、リードは、配列捕捉プローブに対応する領域にマッピングすることができる。リードの少なくとも一部分が、配列捕捉プローブに対応する領域の中心点にわたってマッピングする場合、リードは、配列捕捉プローブに対応する領域にマッピングすることができる。一部の事例では、遺伝子座の配列決定リードカバレッジに関連する定量的尺度は、遺伝子座内のゲノム位置に対応するプローブのRAの中央値である。例えば、KRASが、2、3および5のRAを有する3種のプローブによって被覆される場合、遺伝子座のRAは、3となるであろう。
「飽和平衡」補正
一般に、本明細書に記載されている方法を使用して、核酸試料におけるバリアントコール(variant calling)(例えば、コピー数バリアントの検出)の特異性および感度を増加させることができる。例えば、本方法は、データ試料におけるノイズまたは歪みの量を減少させ、検出される偽陽性バリアントの数を低下させることができる。ノイズおよび/または歪みが減少するにつれて、特異性および感度が増加する。ノイズは、シグナルへの望まれないランダムな付加であると考えることができる。歪みは、シグナルまたはシグナルの一部の大きさの変更であると考えることができる。
ノイズは、ポリヌクレオチドのコピーおよび/または読み取りにおけるエラーにより導入され得る。例えば、配列決定プロセスにおいて、単一のポリヌクレオチドを先ず、増幅に付すことができる。増幅されたポリヌクレオチドのサブセットが、特定の座位に、該座位における本来の塩基と同じではない塩基を含有し得るように、増幅は、エラーを導入し得る。さらに、読み取りプロセスにおいて、いずれか特定の座位における塩基は、不正確に読み取られることがある。結果として、配列リードの収集物は、本来の塩基と同じではない、ある一定のパーセンテージの塩基コールを座位に含むことができる。典型的な配列決定技術において、このエラー率は、1桁、例えば、2%〜3%となり得る。全て同じ配列を有すると推定される分子の収集物が配列決定される場合、このノイズは、十分に小さいため、本来の塩基を高い信頼度で同定することができる。
しかし、親ポリヌクレオチドの収集物が、特定の座位に配列バリアントを有するポリヌクレオチドのサブセットを含む場合、ノイズは、著しい問題となり得る。例えば、無細胞DNAが、生殖系列DNAのみならず、胎児DNAまたはがん細胞由来のDNA等、別の供給源由来のDNAも含む場合、これが現実のものとなり得る。この場合、配列バリアントを有する分子の頻度が、配列決定プロセスによって導入されるエラーの頻度と同じ範囲内である場合、真の配列バリアントは、ノイズから区別不能である場合がある。このことは、例えば、試料における配列バリアントの検出に干渉し得る。
歪みは、配列決定プロセスにおいて、シグナル強度の差として、例えば、同じ頻度における親集団における分子によって産生される配列リードの総数として、顕在化され得る。歪みは、例えば、増幅バイアス、GCバイアスまたは配列決定バイアスにより導入され得る。これは、試料におけるコピー数変異の検出に干渉し得る。GCバイアスは、配列読み取りにおいてGC含量が豊富なまたは乏しい区域の不均等な表示をもたらす。
本明細書に開示されている方法は、データセットから、配列決定リードカバレッジに関連する定量的尺度または配列決定リードカバレッジに関連する変換された定量的尺度が、予測モデルとは最も異なる遺伝子座を除去し(本明細書において、高変動遺伝子座の除去と称することができる)、これにより、残っている遺伝子座の第1のセットを提供することにより、ベースラインの決定における使用のための遺伝子座の初期セットを決定するステップを含む。一部の実例では、これらの遺伝子座の除去は、配列決定リードカバレッジに関連する定量的尺度を、遺伝子座のGC含量に関連する定量的尺度に関連付けるモデルの適合を含む。例えば、予測モデルは、遺伝子座のRAを、座位のGC含量に関連付けることができる。一部の事例では、予測モデルは、LOESSおよびLOWESS回帰モデル等、ノンパラメトリック回帰モデルを含む回帰モデルである。一部の事例では、ベースライン化は、予測モデルから最も逸脱する遺伝子座の5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%または70%を除去することにより遂行される。一部の事例では、ベースライン化は、予測モデルから最も逸脱する遺伝子座の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%または少なくとも70%を除去することにより遂行される。一部の事例では、逸脱は、モデルと比べた遺伝子座の残部を測定することにより決定される。正確なカットオフを選択して、残っている遺伝子座からの特異的な量の変動の除外を提供することができる。
遺伝子座に由来する試料由来のDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度を決定するための方法は、その全体が参照により本明細書に組み込まれる、PCT/US2014/072383に開示されている。定量的尺度の決定は、試料に存在した座位に由来する初期鋳型DNA分子の数の推定を含むことができる。二本鎖ポリヌクレオチドが配列リードを生成しない確率は、初期鋳型DNA分子の両方の鎖を表すリードおよび初期鋳型DNA分子の一本鎖のみを表すリードの相対数に基づき決定することができる。
試料における検出されない初期鋳型DNA分子の数は、初期鋳型DNA分子の両方の鎖を表すリードおよび初期鋳型DNA分子の一本鎖のみを表すリードの相対数に基づき推定することができる。例として、特定の遺伝子座、座位Aの計数が記録され、そこでは、1000分子が対になり(例えば、両方の鎖が検出される)、1000分子が対にならない(例えば、一本鎖のみが検出される)。用語「対になった」および「対にならない」が、本明細書において、分子の両端が配列決定されたかまたは分子の単一端が配列決定されたかを示すように配列決定リードに適用されることがある用語とは異なることに留意されたい。個々のワトソン・クリック鎖が、変換に引き続くプロセスを成し遂げる一様な確率pを仮定すると、次の通りに、プロセスを成し遂げることができない(見出されない)分子の比率を計算することができる:R、対になった分子の対にならない分子に対する比=1000/1000=1、したがって、R=1=p/(2p(1−p))。これは、p=2/3であり、失われた分子の量が、(1−p)=1/9に等しいことを暗示する。よって、この例において、変換された分子のほぼ11%が失われており、検出されない。二項分布の使用に加えて、見出されない分子の数を推定する他の方法は、観察される配列リードの冗長性に基づく、指数関数、ベータ、ガンマまたは経験的分布を含む。後者の場合、対になったおよび対にならない分子のリード計数の分布は、かかる冗長性に由来して、特定の座位における本来のポリヌクレオチド分子の根底にある分布を推論することができる。これは多くの場合、見出されない分子の数のより優れた推定をもたらし得る。一部の事例では、pは、遺伝子座に由来する試料由来のDNAの鎖が、配列決定リードにおいて表される確率に関連する定量的尺度である。一部の事例では、pは、同様に導き出されるが、リード分布の異なるモデルが使用される(例えば、二項、ポアソン、ベータ、ガンマおよび負の二項分布)。
配列決定リードカバレッジに関連する定量的尺度のための変換は、除去された高変動遺伝子座を有する遺伝子座のセット由来の定量的尺度または変換された配列決定リードカバレッジを、GC含量に関連する定量的尺度および遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度に関連付けることにより決定することができる。一部の事例では、残っている遺伝子座は、二倍体である、および/または同じコピー数で存在すると仮定される。一部の実例では、変換は、GC含量に関連する定量的尺度および遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度によって、残っている遺伝子座の配列決定リードカバレッジに関連する定量的尺度の中心傾向に関連する尺度を適合させることにより決定される。変換は、例えば、(i)GC含量に関連する定量的尺度および遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度の両方によって、高変動遺伝子座の除去後に残っている遺伝子座の配列決定リードカバレッジの定量的尺度の中心傾向を適合させることができる。一部の実例では、残っている座位の配列決定リードカバレッジの定量的尺度の中心傾向に関連する尺度は、残っている遺伝子座のUMCの中心傾向である。一部の実例では、表面近似が使用されて、(i)GC含量に関連する定量的尺度および(ii)遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度によって、残っている遺伝子座のUMCの表面または残っている遺伝子座のUMCの中心傾向を適合させる。例えば、表面近似は、GC含量およびpの定量的尺度による、初期鋳型DNA分子に関連する尺度(例えば、UMC)の二次元二次多項式表面適合であり得る。一部の事例では、配列決定カバレッジに関連する変換された定量的尺度は、(i)GC含量に関連する定量的尺度および(ii)遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度から計算される、上で決定された変換に基づき予想される値である。一部の事例では、配列決定カバレッジに関連する変換された定量的尺度は、各遺伝子座の残部である(例えば、試料における表面近似および遺伝子座の配列決定リードカバレッジに関連する観察される定量的尺度に基づく、座位の配列決定リードカバレッジに関連する予想される定量的尺度の差または商)。任意選択で、配列決定カバレッジに関連する変換された定量的尺度が決定された後で、上に記載されている通り、配列決定リードカバレッジの新たな変換された定量的尺度に基づき、高変動遺伝子座を再度除去することができる。
「プローブ効率」補正
参照試料を使用して遺伝子座のバイアスを決定および除去する方法が、本明細書に開示されている。一部の事例では、参照試料は、がんを有しない被験体由来の無細胞DNA由来の配列決定リードである。一部の事例では、参照試料は、目的の遺伝子座にコピー数変異を実質的に欠くがん細胞を有する被験体由来の無細胞DNA由来の配列決定リードである。一部の事例では、参照試料は、がんを有する被験体由来の無細胞DNA由来の配列決定リードであり、この場合、コピー数変異を起こしたと疑われる領域が、分析から除外されている。一部の事例では、参照試料は、がんを有しない被験体由来の血漿試料である。一部の事例では、参照試料は、がんを有する被験体由来の血漿試料である。
参照試料の遺伝子座のそれぞれは、上の「飽和平衡補正」に記載されている通りに処理して、配列決定リードカバレッジの変換された定量的尺度を提供することができる。一部の事例では、配列決定カバレッジに関連する変換された定量的尺度は、(i)GC含量に関連する定量的尺度および(ii)参照遺伝子座由来の遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度から計算される、上で決定された変換に基づき予想される値である。一部の事例では、配列決定カバレッジに関連する変換された定量的尺度は、各参照遺伝子座の残部である(例えば、参照試料における表面近似および遺伝子座の配列決定リードカバレッジに関連する観察される定量的尺度に基づく、座位の配列決定リードカバレッジに関連する予想される定量的尺度の差または商)。参照試料における遺伝子座の配列決定リードカバレッジに関連する変換された定量的尺度は、遺伝子座の「効率」であると考えることができる。例えば、非効率的に増幅された遺伝子座は、非常に効率的に増幅された遺伝子座(試料において同じコピー数で存在)よりも低いUMCを有するであろう。
試料の配列決定リードカバレッジに関連する変換された定量的尺度は、参照試料(複数可)由来の遺伝子座の決定された効率に基づき補正することができる。この補正は、ライゲーション効率、プルダウン効率、PCR効率、フローセルクラスタリング損失、逆多重化(demultiplexing)損失、折り畳み損失およびアラインメント損失に関係し得る、試料から配列決定リードを産生するプロセスによって、試料に導入された変動を低下させることができる。一実施形態では、補正は、試料の配列決定カバレッジの飽和後変換された定量的尺度を、配列決定カバレッジに関連する予測される飽和後変換された定量的尺度で割るまたは引くことを含む。一部の実例では、遺伝子座の配列決定カバレッジに関連する予測される飽和後変換された定量的尺度は、試料由来の遺伝子座の配列決定カバレッジに関連する飽和後変換された定量的尺度および参照の配列決定リードカバレッジに関連する飽和後変換された定量的尺度の間の関係性を適合させることにより決定される。一部の事例では、適合は、参照の配列決定リードカバレッジに関連する飽和後変換された定量的尺度における、試料由来の遺伝子座の配列決定カバレッジに関連する飽和後変換された定量的尺度の局所回帰(例えば、LOESSまたはLOWESS)またはロバスト線形回帰の遂行を含む。一部の事例では、適合は、線形回帰、非線形回帰またはノンパラメトリック回帰であり得る。
任意選択で、プローブ効率補正由来の変換された定量的尺度は、低下された変動を有する配列決定リードカバレッジに関連する第3のさらに変換された定量的尺度を産生するための「飽和平衡補正」変換への入力となり得る。一般に、配列決定リードカバレッジの変換された定量的尺度内の変動をさらに低下させるために、配列決定カバレッジの変換された定量的尺度は、本明細書に開示されている方法のいずれかを追加的な回数使用して変換され得る。
遺伝子レベル概要
推論されるコピー数の遺伝子レベル概要は、本明細書に開示されている通りに決定される、配列決定リードカバレッジの変換された定量的尺度に基づき決定することができる。コピー数は、高変動遺伝子座を破棄することにより上述の操作において選択されたベースラインと比べて推論することができる。例えば、残っている遺伝子座が、試料において二倍体であると推論される場合、配列決定カバレッジに関連する変換された定量的尺度が、ベースラインとは異なる遺伝子座は、腫瘍細胞においてコピー数変更を起こしたと推論される。一部の実例では、遺伝子レベルz−スコアは、プローブシグナルの観察される遺伝子レベル中央値、ならびに遺伝子および全ゲノム正常二倍体プローブシグナル標準偏差における観察されるプローブレベル標準偏差推定値を使用して計算される推定標準偏差を使用して計算される。
マイナーアレル頻度ベースライン最適化
配列決定リードにおけるバリアントのマイナーアレル頻度を使用して、本明細書に記載されているコピー数の遺伝子レベル概要におけるエラーを検出し、エラーを補正する方法が、本明細書に提供される。無細胞体液由来の核酸由来の配列決定リードの10%〜90%の間、20%〜80%の間、30%〜70%の間、40%〜60%の間またはほぼ50%で存在する配列バリアントは、被験体の生殖系列配列に存在するヘテロ接合性バリアントであり得る。一部の実例では、遺伝子座は、上に記載されている通り、増幅を起こしたと決定された。バリアントの量は、推論されるコピー数と比較されて、バリアント頻度が、推論されるコピー数と一致しないかどうかを決定する。一例では、ヘテロ接合性遺伝子座は、ベースラインコピー数の決定に使用された遺伝子座(例えば、高変動遺伝子座の除外後に残っている遺伝子座)において試験することができる。一部の事例では、試料における多数の遺伝子座が増幅されており、このベースラインは誤同定され得る。このような場合、ヘテロ接合性は、1:1比から逸脱することがあり、不正確なベースライン化が検出および補正される。第2の例では、遺伝子座は、配列決定リードカバレッジに関連する変換された定量的尺度に基づき三倍体コピー数で存在すると推論することができる。被験体の生殖系列ゲノムが、遺伝子座の第1のアレルを有する一方の染色体を有し、第2の染色体が、第2のアレルを有した場合、第1または第2のアレルは、がん細胞において重複した可能性がある。
ラングミュア様飽和モデル
理論に制約されないが、歴史的臨床データの探索および合成スパイクインモデルシステムが関与する標的化実験に基づき、ベイト−cfDNA相互作用の支配機構であると仮定されるラングミュア様飽和モデルが、本明細書に開示されている。したがって、干渉するアッセイ効果(例えば、ライゲーション効率、PCR増幅バイアス、配列決定アーティファクト等)の非存在下で、ベイトプルダウンプロセスは、次の通りに表すことができる。
この記載におけるKは、ベイト配列特徴、および標的化ベイト位置のゲノム近傍におけるDNA断片とのその相互作用に依存するベイト効率である。Isatは、総ベイトプール濃度および複製計数の関数である、プルダウン反応における限定された初期ベイト計数によって駆動される飽和パラメータである。複製計数は、本明細書において、存在する配列捕捉プローブの相対量または絶対量を指す。例えば、配列捕捉アレイは、アレイにおける異なるモル量のプローブを提供して、異なるプローブ効率を説明することができる。図8は、ベイト効率Kおよび飽和パラメータIsatに基づく、真のコピー数および特有の分子計数に関連するモデルを例示する。
ベイト効率Kは、大部分は、GC含量によって駆動される一方、Isatは、特有の分子計数 対 総リード計数の相互作用を研究することによって大雑把に調べられ得る、より複雑なベイト消耗機構およびRNA二次構造相互作用によって駆動される。非線形プルダウン反応とは別に、プローブシグナルは、次の仮定が関与する乗法モデルによってさらにモデル化することができる:ナイーブモデル(naive model)の下で、cfDNA断片は、ゲノム位置によって均一に分布され、確率的標本抽出プロセスは、カバレッジ変異に寄与する優勢な因子である。次いで、コピー数シグナル(例えば、UMC)は、観察されるUMCを試料における真の分子計数に関連付けることによりモデル化することができ、根底にある位置的cfDNAプロファイル、ライゲーション効率、プルダウン効率、PCR効率、フローセルクラスタリング損失、逆多重化損失、折り畳み損失およびアラインメント損失の効果を考慮に入れる。
非線形プルダウン反応とは別に、プローブシグナルは、次の仮定が関与する単純乗法モデルによってさらにモデル化することができる。ナイーブモデルの下で、cfDNA断片は、ゲノム位置によって均一に分布され、確率的標本抽出プロセスは、カバレッジ変異に寄与する優勢な因子である。次いで、コピー数シグナル、すなわち、所与のプローブに関連するリード計数は、次の通りにモデル化することができる:
観察されるUMC=真のUMC×根底にある位置的cfDNAプロファイル(ベイト、cfDNA断片)×ライゲーション効率(位置、サイズ、cfDNA断片)×プルダウン効率(プローブ、cfDNA断片)×PCR効率(DNA断片)×フローセルクラスタリング損失×逆多重化損失および折り畳み損失×アラインメント損失(cfDNA断片配列)。
このモデルは、上述のモデルの乗法性質を仮定する。根底にあるベイト特異的コピー数シグナルは、本明細書に開示されているベースライン決定方法等、一連のステップによる確立されたベースラインに関して、観察されるUMC(例えば、所与の配列捕捉プローブのUMC)から推論することができる。
本明細書に開示されている方法は、試料およびトレーニングセットからプローブ効率およびベイト飽和を推定するためのアプローチを提供する。代わりに、かかるパラメータは、UMCに対する、変動する標的配列濃度の効果がプローブ毎に観察される、1セットのベイトタイトレーション実験を遂行することにより推論することができる。K、IsatおよびUMCが既知の場合、コピー数変異を起こしていない腫瘍細胞に対応するUMC値または範囲を決定することが可能である。例えば、遺伝子座の大部分が、コピー数変更を起こしていないという仮定において、観察されるUMCは、大部分は、二倍体試料に由来するであろう。コピー数変異を起こした試料は、UMCが、その対応するKおよびIsat値を有するプローブの予想される範囲から外れる遺伝子座となるであろう。一部の事例では、例えば、UMC値または範囲は、各プローブのKおよびIsatに依存した関数となるであろう。例えば、二倍体コピー数に対応するUMCは、2種のプローブ間で異なる場合がある。
コンピュータ制御システム
本開示は、本開示の方法を実施するようにプログラムされたコンピュータ制御システムを提供する。図12は、本開示の方法を実施するようにプログラムされたまたは他の仕方で構成されたコンピュータシステム1201を示す。コンピュータシステム1201は、シングルコアもしくはマルチコアプロセッサ、または並列処理のための複数のプロセッサとなり得る、中央処理装置(CPU、本明細書において同様に「プロセッサ」および「コンピュータプロセッサ」)1205を含む。コンピュータシステム1201は、メモリまたはメモリ位置1210(例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ)、電子記憶装置1215(例えば、ハードディスク)、1個または複数の他のシステムと通信するための通信インターフェース1220(例えば、ネットワークアダプタ)、ならびにキャッシュ、他のメモリ、データ記憶および/または電子ディスプレイアダプタ等の周辺機器1225も含む。メモリ1210、記憶装置1215、インターフェース1220および周辺機器1225は、マザーボード等、通信バス(実線)を介してCPU 1205と通信している。記憶装置1215は、データを記憶するためのデータ記憶装置(またはデータレポジトリ)であり得る。コンピュータシステム1201は、通信インターフェース1220を活用してコンピュータネットワーク(「ネットワーク」)1230に作動可能にカップリングされ得る。ネットワーク1230は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信したイントラネットおよび/もしくはエクストラネットであり得る。ネットワーク1230は、一部の事例では、遠隔通信および/またはデータネットワークである。ネットワーク1230は、ローカルエリアネットワークを含むことができる。ネットワーク1230は、クラウドコンピューティング等、分散型コンピューティングを可能にすることができる1個または複数のコンピュータサーバーを含むことができる。ネットワーク1230は、一部の事例では、コンピュータシステム1201を活用して、コンピュータシステム1201にカップリングされたデバイスが、クライアントまたはサーバーとして運転することを可能にし得るピアツーピア(peer−to−peer)ネットワークを実施することができる。
CPU 1205は、プログラムまたはソフトウェアにおいて具体化され得る機械可読指示のシーケンスを実行することができる。指示は、メモリ1210等、メモリ位置において記憶され得る。指示は、CPU 1205に方向づけることができ、これはその後に、本開示の方法を実施するようにCPU 1205をプログラムするまたは他の仕方で構成することができる。CPU 1205によって遂行される操作の例は、フェッチ、デコード、実行およびライトバックを含むことができる。
CPU 1205は、集積回路等、回路の一部となり得る。システム1201の1個または複数の他の構成成分が、回路に含まれてよい。一部の事例では、回路は、特定用途向け集積回路(ASIC)である。
記憶装置1215は、ドライバ、ライブラリーおよび保存されたプログラム等、ファイルを記憶することができる。記憶装置1215は、ユーザーデータ、例えば、ユーザー嗜好およびユーザープログラムを記憶することができる。コンピュータシステム1201は、一部の事例では、イントラネットまたはインターネットを介してコンピュータシステム1201と通信するリモートサーバーに位置する等、コンピュータシステム1201に対して外部である1個または複数の追加的なデータ記憶装置を含むことができる。
コンピュータシステム1201は、ネットワーク1230を介して1個または複数のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム1201は、ユーザーのリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例として、パーソナルコンピュータ(例えば、ポータブルPC)、スレートもしくはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android対応デバイス、Blackberry(登録商標))または携帯情報端末が挙げられる。ユーザーは、ネットワーク1230経由でコンピュータシステム1201にアクセスすることができる。
本明細書に記載されている方法は、例えば、メモリ1210または電子記憶装置1215等、コンピュータシステム1201の電子記憶位置に記憶された機械(例えば、コンピュータプロセッサ)実行可能なコードとして実施することができる。機械実行可能または機械可読コードは、ソフトウェアの形態で提供され得る。使用の際に、コードは、プロセッサ1205によって実行することができる。一部の事例では、プロセッサ1205による容易なアクセスのため、コードは、記憶装置1215から読み出し、メモリ1210に記憶することができる。場合によっては、電子記憶装置1215が排除されることがあり、機械実行可能な指示はメモリ1210に記憶される。
コードは、コードを実行するように適応されたプロセッサ(processer)を有する機械による使用のために事前にコンパイルおよび構成され得る、またはランタイムにおいてコンパイルされ得る。コードは、コードが、事前にコンパイルされたまたはその場でコンパイルされる(as−compiled)様式で実行することを可能にするように選択され得るプログラミング言語で供給され得る。
コンピュータシステム1201等、本明細書に提供されるシステムおよび方法の態様は、プログラミングにおいて具体化することができる。本技術の様々な態様は、典型的には、ある種の機械可読媒体において保持されるまたは具体化される、機械(またはプロセッサ)実行可能なコードおよび/または関連するデータの形態の「製品」または「製造品」であると考えることができる。機械実行可能なコードは、メモリ(例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスク等、電子記憶装置において記憶され得る。「記憶」型の媒体は、ソフトウェアプログラミングのいかなる時点においても非一過性記憶を提供し得る、様々な半導体メモリ、テープドライブ、ディスクドライブ等、コンピュータ、プロセッサその他の有形メモリまたはその関連するモジュールのいずれかまたは全てを含むことができる。ソフトウェアの全体または部分は、時には、インターネットまたは様々な他の遠隔通信ネットワークを介して通信することができる。かかる通信は、例えば、あるコンピュータまたはプロセッサから別のコンピュータまたはプロセッサへの、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームへのソフトウェアのローディングを可能にすることができる。よって、ソフトウェアエレメントを有することができる別の種類の媒体は、有線および光地上通信線(landline)ネットワークを介してならびに様々なエアリンク(air−link)にわたってローカルデバイス間の物理インターフェースを越えて使用される等、光波、電波および電磁波を含む。有線または無線リンク、光リンク等、かかる波を運ぶ物理的エレメントは、ソフトウェアを有する媒体として考慮することもできる。本明細書において、非一過性、有形「記憶」媒体に制限されない限り、コンピュータまたは機械「可読媒体」等の用語は、実行のためのプロセッサへの指示の提供に関与するいずれかの媒体を指す。
したがって、コンピュータ実行可能なコード等、機械可読媒体は、有形記憶媒体、搬送波媒体または物理的伝送媒体が挙げられるがこれらに限定されない、多くの形態を採ることができる。不揮発性記憶媒体は、例えば、図面に示す通り、データベース等の実施に使用され得るもの等、いずれかのコンピュータ(複数可)等における記憶デバイスのいずれか等、光または磁気ディスクを含む。揮発性記憶媒体は、かかるコンピュータプラットフォームのメインメモリ等、ダイナミックメモリを含む。有形伝送媒体は、コンピュータシステム内にバスを含むワイヤを含む、同軸ケーブル;銅線および光ファイバを含む。搬送波伝送媒体は、ラジオ周波数(RF)および赤外(IR)データ通信において生成されるもの等、電気もしくは電磁シグナルまたは音もしくは光の波の形態を採ることができる。したがって、コンピュータ可読媒体の共通形態は、例えば:フロッピーディスク(登録商標)、フレキシブルディスク、ハードディスク、磁気テープ、他のいずれかの磁気媒体、CD−ROM、DVDもしくはDVD−ROM、他のいずれかの光学媒体、パンチカード穿孔テープ(paper tape)、孔のパターンによる他のいずれかの物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH−EPROM、他のいずれかのメモリチップもしくはカートリッジ、搬送波輸送データもしくは指示、かかる搬送波を輸送するケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび/もしくはデータを読み取ることができる他のいずれかの媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、1個または複数の指示の1個または複数のシーケンスを、実行のためのプロセッサに運ぶことに関与することができる。
コンピュータシステム1201は、例えば、報告を提供するためのユーザーインターフェース(UI)1240を含む電子ディスプレイ1235を含むことができるまたはこれと通信することができる。UIの例は、グラフィカルユーザーインターフェース(GUI)およびウェブに基づくユーザーインターフェースを、限定することなく含む。
本開示の方法およびシステムは、1種または複数のアルゴリズムによって実施することができる。アルゴリズムは、中央処理装置1205による実行の際にソフトウェアによって実施することができる。
(実施例1)
以前に生成されたコピー数変異スパイクインデータの試験は、生のリード計数およびUMC、ならびに根底にあるコピー数変化に対するプローブ/遺伝子レベルコピー数シグナル応答の両方における有意なプローブ間のシグナル変異を明らかにした。図2を参照されたい。図3は、試料におけるベイトの量に対する正規化カバレッジの非線形応答を実証する、3種の遺伝子(CCND1、CCND2およびERBB2)の推論的コピー数 対 理論的コピー数を例示する。これらの結果は、プルダウンにおけるベイト枯渇を示唆し、これは、特有の分子計数に相当に大きい差を有する同じ遺伝子内の隣接するプローブにおける次のベイトタイトレーション効果によって確認された(これにより、高い初期UMCを有するプローブに対するより速い特有の分子計数飽和を観察する)。
図4Aは、各プローブに関連するUMCが、プローブpに関する非線形応答を有することを例示する。図4Bは、各プローブに関連するUMCが、プローブGC含量に関する非線形応答を有することを例示する。
図5は、飽和補正もプローブ効率補正も遂行しない、プローブのUMCを例示する。図6は、飽和補正後の同じ試料を示す。図7は、プローブ効率補正後の同じ試料を示す。ゲノム位置内の変動は、各ステージにおいて低下され、現れる腫瘍細胞の根底にあるコピー数変異のより明らかな像をもたらす。中央値のプローブのプローブ効率補正後シグナルが1.2を上回る図7における遺伝子は、コピー数変異を起こしたとコールされる。プローブ効率補正後シグナルの異なるレベルは、腫瘍不均一性または続発性腫瘍によるものである可能性がある。
図9は、飽和補正およびプローブ効率補正後の、ベースライン化遺伝子座プローブシグナルノイズ低下の典型的進行を示す。
図10Aは、x軸における参照試料(複数可)のプローブ効率および腫瘍細胞にコピー数変異を有しない被験体由来の試料の飽和補正後のシグナルのプロットを例示する。関係性はほぼ線形である。図10Bは、腫瘍細胞にコピー数変異を有する被験体由来の同様のプロットを例示する。応答は、図10Aほど線形ではない。参照試料(複数可)由来のプローブ効率およびベースライン化遺伝子座の飽和補正後のUMC(黒色で示す)の間の関係性の決定によって推論される予測される効率による補正は、腫瘍細胞においてコピー数増幅を起こしたと推定される遺伝子座(灰色のドット)における異なるプローブ効率による変異を低下させるであろう。図11は、飽和およびプローブ効率補正後のUMCおよびMAF最適化されたベースライン化に基づく患者試料由来のコピー数変異の例示的な報告を例示する。星印は、被験体の腫瘍細胞にコピー数変異を起こした遺伝子座に属すると示されるポイントを示す。
(実施例2)
無細胞DNAを、がんを有する被験体から得、バーコード化配列決定ライブラリーを調製し、プローブセットによる配列捕捉によって癌遺伝子のパネルを濃縮し、バーコード化配列決定ライブラリーを配列決定する。配列決定リードを、参照ゲノムにマッピングし、そのバーコード配列およびマッピング位置に基づきファミリーへと折り畳む。プローブセット由来のプローブの中点に対応するゲノム座標毎に、該中点に及ぶリードファミリーの数を計数して、プローブ当たりのUMCを得る。中央値のプローブ当たりのUMCを遺伝子毎に決定する。「飽和平衡補正」を遂行するために、遺伝子をその中央値のプローブ当たりのGC含量によってグループ化する。中央値のプローブ当たりのUMCが、同様の中央値のプローブ当たりのGC含量を有する遺伝子と有意に異なる遺伝子を除去する。
プローブ毎に、本明細書に記載されている通りに、pおよびGC含量を決定する。以前のステップ由来の残っている遺伝子を使用して、プローブpおよびGC含量に対する中央値の遺伝子レベルUMCの二次元二次多項式表面適合を遂行する。pおよびGC含量を予想されるUMCに関連付ける関数を使用して、予想されるプローブ当たりのUMCを決定する。観察されるプローブ当たりのUMCを予想されるプローブ当たりのUMCで割ることにより、データセットの残部を決定する。各プローブの残部UMCは、配列決定カバレッジの変換された定量的尺度である。
遺伝子をその中央値のプローブ当たりのGC含量によって再度グループ化し、その中央値のプローブ当たりの残部UMCが、同様の中央値のプローブ当たりのGC含量を有する遺伝子とは有意に異なる遺伝子を除去する。次いで、先行する段落に記載されている通り、参照試料(複数可)の残部UMCを得ることにより、「プローブ効率」補正を遂行する。次いで、試料由来の各プローブの残部UMCを、参照(複数可)由来の各対応するプローブの残部UMCで割って、プローブ効率補正後のUMCを得る。
上述の飽和平衡補正と同様に、残っている遺伝子を使用して、プローブpおよびGC含量に対するプローブ効率補正後のUMCの二次元二次多項式表面適合を遂行する。pおよびGC含量を予想されるプローブ効率補正後のUMCに関連付ける関数を使用して、予想されるプローブ当たりのプローブ効率補正後のUMCを決定する。観察されるプローブ当たりのプローブ効率補正後のUMCを予想されるプローブ当たりのプローブ効率補正後のUMCで割ることにより、データセットの残部を決定する。各プローブの残部のプローブ効率補正後のUMCは、プローブGC補正後のシグナル(post−probe GC−corrected signal)である。
残っている遺伝子をその中央値のプローブ当たりのGC含量によってグループ化し、その中央値のプローブGC補正後のシグナルが、同様の中央値のプローブ当たりのGC含量を有する遺伝子とは有意に異なる遺伝子を除去する。
初期UMCの代わりに開始入力としてのプローブGC補正後のシグナルにより、本実施例のプロセスを反復する。
遺伝子毎に、プローブGC補正後のシグナルの中央値を使用して、各遺伝子を要約する。その中央値のプローブGC補正後のシグナルが、他の遺伝子とは有意に異なる遺伝子は、腫瘍細胞に遺伝子増幅または欠失を起こした候補とみなされる。
遺伝子毎に、生殖系列ヘテロ接合性アレルを決定し、各アレルの相対頻度を定量化する。ベースライン化に使用する遺伝子座は、ほぼ1:1比のアレルを有することが判明し、ベースライン化遺伝子座の選択を検証する。
全ゲノム正常二倍体プローブシグナル由来の遺伝子レベルでの中央値のプローブGC補正後のシグナルおよび推定標準偏差に基づき、Z−スコアを遺伝子毎に決定する。カットオフよりも高いZ−スコアを有する遺伝子が、腫瘍細胞に遺伝子増幅を起こしたと報告される。
(実施例3)
本明細書に記載されている方法は、対照方法に対する本開示の方法において、ERBB2コピー数を測定することにより検証された。本開示の方法は、観察されるコピー数(CN) 対 理論的コピー数の線形応答を産生し、偽陽性CNV結果は、正常(健康)コホートで観察されない。図13を参照されたい。図13は、推論される遺伝子コピー数 対 理論的コピー数推定値を示し、黒塗りのドットは、ほぼ2の観察されるコピー数を表し(二倍体試料)、白抜きのドットは、検出される増幅事象を表し、太い水平破線は、平均遺伝子CNカットオフをマークする。図14も参照されたい。図14は、四角形によって対照データが表された、図13のデータを描写する。全CNVは、2.15コピーに下落する予想されるタイトレーション傾向に従った。さらに、本開示の方法は、変動の低下により、データにおける観察される「ノイズ」を減少させ、対照方法と比較してCNVが容易に識別されることを可能にした。図15の最も右側を参照されたい;三角形が本開示の方法を表す一方、Xは対照方法を表す。
本発明の好まれる実施形態を本明細書に示し記載してきたが、当業者であれば、かかる実施形態が、単なる例として提供されていることが明らかであろう。本発明が、本明細書内に提供される具体例によって限定されることを意図しない。上述の明細書を参照しつつ本発明を記載してきたが、本明細書における実施形態の記載および例示は、限定的な意味で解釈されることを目的としない。ここで、当業者であれば、本発明から逸脱することなく、多数の変異、変化および代用を思い付く。さらに、本発明のあらゆる態様が、種々の条件および変数に依存する、本明細書に明記されている特異的な描写、構成または相対比率に限定されないことが理解されるものとする。本明細書に記載されている本発明の実施形態の様々な代替を本発明の実施に用いることができることを理解されたい。したがって、本発明が、いかなるかかる代替、修飾、変異または均等物も網羅するべきであることが企図される。次の特許請求の範囲が、本発明の範囲を規定し、これにより、特許請求の範囲内の方法および構造ならびにこれらの均等物が網羅されることが意図される。

Claims (41)

  1. (a)被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子の配列決定リードを得るステップと、
    (b)前記配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、
    (c)飽和平衡補正およびプローブ効率補正を遂行することにより、前記第1のデータセットを補正するステップと、
    (d)前記第1のデータセットについてベースラインリードカバレッジを決定するステップであって、前記ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、
    (e)前記ベースラインリードカバレッジと比べた前記複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップと
    を含む、方法。
  2. 前記第1のデータセットが、複数の遺伝子座における遺伝子座毎に、前記遺伝子座のグアニン−シトシン含量(「GC含量」)に関連する定量的尺度を含む、請求項1に記載の方法。
  3. (c)に先立ち、前記第1のデータセットから、高変動遺伝子座である遺伝子座を除去するステップを含み、除去するステップが、
    (i)グアニン−シトシン含量に関連する前記定量的尺度および前記遺伝子座の配列決定リードカバレッジの前記定量的尺度に関連するモデルを適合させるステップと、
    (ii)前記第1のデータセットから、前記遺伝子座の少なくとも10%を除去するステップであって、前記モデルと最も異なる前記遺伝子座の少なくとも10%を除去し、これにより、ベースライン化遺伝子座の前記第1のデータセットを提供するステップを含む、ステップと
    を含む、請求項2に記載の方法。
  4. 前記遺伝子座の少なくとも45%を除去するステップを含む、請求項3に記載の方法。
  5. 飽和平衡補正を遂行するステップが、
    (i)ベースライン化遺伝子座の前記第1のデータセット由来の遺伝子座毎に、前記遺伝子座に由来する前記試料由来のDNA分子の鎖が、前記配列決定リード内に表される確率に関連する定量的尺度を決定し、
    (ii)ベースライン化遺伝子座の前記第1のデータセットにおける前記リードカバレッジを、ベースライン化遺伝子座の前記第1のデータセットの前記GC含量、およびベースライン化遺伝子座の前記第1のデータセットにおける各座位に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度の両方に関連付けることにより前記リードカバレッジのための第1の変換を決定し、
    (iii)前記第1の変換を、ベースライン化遺伝子座の前記第1のデータセット由来の各遺伝子座の前記リードカバレッジに適用して、ベースライン化遺伝子座の前記第1のデータセットの変換されたリードカバレッジの第1のセットを含む、飽和補正されたデータセットを提供する
    ことにより、ベースライン化遺伝子座の前記第1のデータセットを前記飽和補正されたデータセットへと変換するステップを含む、請求項3に記載の方法。
  6. 前記第1の変換を決定するステップが、(i)ベースライン化遺伝子座の前記第1のデータセットの前記リードカバレッジの中心傾向に関連する尺度を決定するステップと、(ii)前記遺伝子座の前記GC含量、および前記遺伝子座に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度に基づき、ベースライン化遺伝子座の前記第1のデータセットの前記リードカバレッジの前記中心傾向に関連する尺度を適合させる関数を決定するステップと、(iii)ベースライン化遺伝子座の前記第1のデータセットの遺伝子座毎に、前記関数によって予測されるリードカバレッジおよび前記リードカバレッジの間の差を決定するステップであって、前記差が、前記変換されたリードカバレッジである、ステップとを含む、請求項5に記載の方法。
  7. 前記関数が、表面近似である、請求項6に記載の方法。
  8. 前記表面近似が、二次元二次多項式である、請求項7に記載の方法。
  9. プローブ効率補正を遂行するステップが、
    (i)前記飽和補正されたデータセットから、変換されたリードカバレッジの前記第1のセットに関して高変動遺伝子座である遺伝子座を除去し、これにより、ベースライン化遺伝子座の第2のデータセットを提供し、
    (ii)ベースライン化遺伝子座の前記第2のデータセットの前記プローブ効率に関連する変換されたリードカバレッジの前記第1のセットのための第2の変換を決定し、
    (iii)前記第2の変換を用いて、ベースライン化遺伝子座の前記第2のデータセットの変換されたリードカバレッジの前記第1のセットを変換し、これにより、ベースライン化遺伝子座の前記第2のデータセットの変換されたリードカバレッジの第2のセットを含む、プローブ効率補正されたデータセットを提供する
    ことにより、前記飽和補正されたデータセットを前記プローブ効率補正されたデータセットへと変換するステップを含む、請求項5に記載の方法。
  10. 前記第1のデータセットから、高変動遺伝子座である遺伝子座を除去するステップが、
    (i)前記GC含量および前記飽和補正されたデータセットの変換されたリードカバレッジの前記第1のセットに関連するモデルを適合させるステップと、
    (ii)飽和補正されたデータセットから、前記遺伝子座の少なくとも10%を除去するステップであって、前記モデルと最も異なる遺伝子座を除去し、これにより、ベースライン化遺伝子座の前記第2のデータセットを提供するステップを含む、ステップと
    を含む、請求項9に記載の方法。
  11. 前記遺伝子座の少なくとも45%を除去するステップを含む、請求項10に記載の方法。
  12. 前記プローブ効率が、1種または複数の参照試料において前記飽和平衡補正を遂行することにより決定され、前記プローブ効率が、前記飽和平衡補正を遂行することにより得られる前記変換されたリードカバレッジである、請求項9に記載の方法。
  13. 前記1種または複数の参照試料が、がんを有しない被験体由来の無細胞体液試料である、請求項12に記載の方法。
  14. 前記1種または複数の参照試料が、がんを有する被験体由来の無細胞体液試料であり、対応する遺伝子座が、コピー数変更を起こしていない、請求項12に記載の方法。
  15. 前記第2の変換を決定するステップが、(i)前記1種または複数の参照試料由来の前記遺伝子座について決定された前記プローブ効率を、ベースライン化遺伝子座の前記第2のデータセット由来のリードカバレッジの前記第1のセットに適合させるステップと、(ii)ベースライン化遺伝子座の前記第2のデータセットの各遺伝子座の前記変換されたリードカバレッジを、(i)の前記適合に基づき予測されるプローブ効率で割るステップとを含む、請求項12に記載の方法。
  16. (g)ベースライン化遺伝子座の前記第2のデータセットの前記変換されたリードカバレッジを、ベースライン化遺伝子座の前記第2のデータセットの前記GC含量、およびベースライン化遺伝子座の前記第2のデータセットにおける前記各座位に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度の両方に関連付けることにより、変換されたリードカバレッジの前記第2のセットのための第3の変換を決定するステップと、
    (h)前記第3の変換を、変換されたリードカバレッジの前記第2のセットに適用して、変換された定量的リードカバレッジの第3のセットを含む、第4のデータセットを提供するステップと
    をさらに含む、請求項5に記載の方法。
  17. 前記無細胞体液試料の前記DNAが、遺伝子座の前記セット由来の前記遺伝子座の少なくとも一部分に相補的な1種または複数のオリゴヌクレオチドプローブを使用して、遺伝子座の前記セットについて濃縮される、請求項1に記載の方法。
  18. 遺伝子座の前記セット由来の各遺伝子座の前記GC含量が、遺伝子座の前記セット由来の前記遺伝子座の少なくとも一部分に相補的な前記1種または複数のオリゴヌクレオチドプローブのグアニン−シトシン含量の中心傾向に関連する尺度である、請求項17に記載の方法。
  19. 前記遺伝子座の前記リードカバレッジが、前記1種または複数のオリゴヌクレオチドプローブに対応する前記遺伝子座の領域の前記リードカバレッジの中心傾向に関連する尺度である、請求項17に記載の方法。
  20. 飽和平衡補正を遂行する前記ステップおよびプローブ効率補正を遂行する前記ステップが、ラングミュアモデルを適合させるステップを含み、前記ラングミュアモデルが、プローブ効率(K)および飽和平衡定数(Isat)を含む、請求項17に記載の方法。
  21. KおよびIsatが、前記1種または複数のオリゴヌクレオチドプローブにおけるオリゴヌクレオチドプローブ毎に経験的に決定される、請求項20に記載の方法。
  22. 飽和平衡補正を遂行するステップおよびプローブ補正を遂行するステップが、前記遺伝子座の前記リードカバレッジを、前記遺伝子座が同一コピー数状態で存在することを仮定して前記ラングミュアモデルに適合させ、これにより、ベースラインリードカバレッジを提供するステップを含む、請求項21に記載の方法。
  23. 前記同一コピー数状態が、二倍体である、請求項22に記載の方法。
  24. 前記ベースラインリードカバレッジが、前記プローブ効率および前記飽和平衡に依存する関数である、請求項22に記載の方法。
  25. コピー数状態を決定するステップが、前記遺伝子座の前記リードカバレッジを前記ベースラインリードカバレッジと比較するステップを含む、請求項22に記載の方法。
  26. 前記無細胞体液が、血清、血漿、尿および脳脊髄液からなる群より選択される、先行する請求項のいずれか一項に記載の方法。
  27. 前記リードカバレッジが、前記配列決定リードを参照ゲノムにマッピングすることにより決定される、先行する請求項のいずれか一項に記載の方法。
  28. 前記配列決定リードを得るステップが、アダプターを、前記被験体由来の前記無細胞体液由来の前記DNA分子にライゲーションするステップを含む、先行する請求項のいずれか一項に記載の方法。
  29. 前記DNA分子が、二重鎖DNA分子であり、各アダプターが、前記DNA分子の相補鎖を異なる形でタグ付けして、タグ付けされた鎖を提供するように、前記アダプターが、前記二重鎖DNA分子にライゲーションされる、請求項28に記載の方法。
  30. 前記遺伝子座に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度を決定するステップが、配列決定リードを対になったリードおよび対にならないリードへと選別するステップを含み、(i)各対になったリードが、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なる形でタグ付けされた相補鎖から生成される配列リードに対応し、(ii)各対にならないリードが、配列リードの前記セットにおける前記配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なる形でタグ付けされた相補鎖を有しない第1のタグ付けされた鎖を表す、請求項29に記載の方法。
  31. 1種または複数の遺伝子座のそれぞれにマッピングする、(i)前記対になったリードおよび(ii)前記対にならないリードの定量的尺度を決定して、各座位にマッピングする対になったリードおよび対にならないリードに関連する前記定量的尺度に基づき、前記1種または複数の遺伝子座のそれぞれにマッピングする、前記試料における総二本鎖DNA分子に関連する定量的尺度を決定するステップをさらに含む、請求項30に記載の方法。
  32. 前記アダプターが、バーコード配列を含む、請求項28に記載の方法。
  33. 前記リードカバレッジを決定するステップが、前記参照ゲノムへの前記配列決定リードの前記マッピングの位置および前記バーコード配列に基づき、前記配列決定リードを折り畳むステップを含む、請求項32に記載の方法。
  34. 前記遺伝子座が、1種または複数の癌遺伝子を含む、先行する請求項のいずれか一項に記載の方法。
  35. 前記被験体の生殖系列ゲノムがヘテロ接合性である前記ベースライン化遺伝子座内におけるバリアントの相対量を決定することにより、前記ベースライン化遺伝子座の少なくともサブセットが、前記被験体の前記腫瘍細胞においてコピー数変更を起こしたことを決定するステップをさらに含む、先行する請求項のいずれか一項に記載の方法。
  36. 前記バリアントの前記相対量が、ほぼ等しいわけではない、請求項35に記載の方法。
  37. 前記バリアントの前記相対量がほぼ等しいわけではない前記ベースライン化遺伝子座が、前記ベースライン化遺伝子座から除去され、これにより、アレル頻度補正されたベースライン化遺伝子座を提供する、請求項36に記載の方法。
  38. 前記アレル頻度補正されたベースライン化遺伝子座が、先行する請求項のいずれか一項に記載の方法において前記ベースライン化座位として使用される、請求項37に記載の方法。
  39. (a)メモリに、被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子の配列決定リードを受け取るステップと、
    (b)コンピュータプロセッサを用いてコードを実行して、次のステップ:
    (i)前記配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、
    (ii)飽和平衡補正およびプローブ効率補正を遂行することにより、前記第1のデータセットを補正するステップと、
    (iii)前記第1のデータセットについてベースラインリードカバレッジを決定するステップであって、前記ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、
    (iv)前記ベースラインリードカバレッジと比べた前記複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップと
    を遂行するステップと
    を含む、方法。
  40. (a)ネットワークと、
    (b)前記ネットワークに接続された、核酸配列データを記憶するように構成されたコンピュータメモリを含むデータベースと、
    (c)前記ネットワークに接続された、コンピュータメモリおよび1個または複数のコンピュータプロセッサを含むバイオインフォマティクスコンピュータと
    を含むシステムであって、
    前記コンピュータが、前記1個または複数のコンピュータプロセッサによって実行されると、前記データベースに記憶された前記核酸配列データをコピーし、前記コピーされたデータを前記バイオインフォマティクスコンピュータにおけるメモリに書き出し、以下:
    (i)前記核酸配列データから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、
    (ii)飽和平衡補正およびプローブ効率補正を遂行することにより、前記第1のデータセットを補正するステップと、
    (iii)前記第1のデータセットについてベースラインリードカバレッジを決定するステップであって、前記ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、
    (iv)前記ベースラインリードカバレッジと比べた前記複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップと
    を含むステップを遂行する、機械実行可能なコードをさらに含む、システム。
  41. 前記データベースが、核酸シーケンサーに接続されている、請求項40に記載のシステム。
JP2018531350A 2015-12-17 2016-12-16 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 Withdrawn JP2019507585A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021064099A JP2021101732A (ja) 2015-12-17 2021-04-05 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法
JP2023108348A JP2023126874A (ja) 2015-12-17 2023-06-30 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562269051P 2015-12-17 2015-12-17
US62/269,051 2015-12-17
PCT/US2016/067356 WO2017106768A1 (en) 2015-12-17 2016-12-16 Methods to determine tumor gene copy number by analysis of cell-free dna

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2021064099A Division JP2021101732A (ja) 2015-12-17 2021-04-05 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法
JP2023108348A Division JP2023126874A (ja) 2015-12-17 2023-06-30 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法

Publications (2)

Publication Number Publication Date
JP2019507585A true JP2019507585A (ja) 2019-03-22
JP2019507585A5 JP2019507585A5 (ja) 2020-01-30

Family

ID=59057742

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2018531350A Withdrawn JP2019507585A (ja) 2015-12-17 2016-12-16 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法
JP2021064099A Pending JP2021101732A (ja) 2015-12-17 2021-04-05 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法
JP2023108348A Pending JP2023126874A (ja) 2015-12-17 2023-06-30 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2021064099A Pending JP2021101732A (ja) 2015-12-17 2021-04-05 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法
JP2023108348A Pending JP2023126874A (ja) 2015-12-17 2023-06-30 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法

Country Status (7)

Country Link
US (3) US20170240973A1 (ja)
EP (1) EP3390668A4 (ja)
JP (3) JP2019507585A (ja)
CN (2) CN117174167A (ja)
CA (1) CA3008651A1 (ja)
SG (1) SG11201805119QA (ja)
WO (1) WO2017106768A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9476095B2 (en) 2011-04-15 2016-10-25 The Johns Hopkins University Safe sequencing system
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
CN104956225B (zh) 2012-10-29 2018-10-02 约翰·霍普金斯大学 卵巢和子宫内膜癌的帕帕尼科拉乌测试
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
US20190287645A1 (en) * 2016-07-06 2019-09-19 Guardant Health, Inc. Methods for fragmentome profiling of cell-free nucleic acids
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
KR20210158870A (ko) 2016-09-30 2021-12-31 가던트 헬쓰, 인크. 무세포 핵산의 다중-해상도 분석 방법
US20180225413A1 (en) * 2016-12-22 2018-08-09 Grail, Inc. Base Coverage Normalization and Use Thereof in Detecting Copy Number Variation
EP3665308A1 (en) 2017-08-07 2020-06-17 The Johns Hopkins University Methods and materials for assessing and treating cancer
WO2019055835A1 (en) * 2017-09-15 2019-03-21 The Regents Of The University Of California DETECTION OF SOMATIC MONONUCLEOTIDE VARIANTS FROM ACELLULAR NUCLEIC ACID WITH APPLICATION TO MINIMUM RESIDUAL DISEASE SURVEILLANCE
CA3098321A1 (en) 2018-06-01 2019-12-05 Grail, Inc. Convolutional neural network systems and methods for data classification
AU2019351130A1 (en) 2018-09-27 2021-04-08 Grail, Llc Methylation markers and targeted methylation probe panel
WO2020092807A1 (en) * 2018-10-31 2020-05-07 Guardant Health, Inc. Methods, compositions and systems for calibrating epigenetic partitioning assays
CN110232951B (zh) * 2018-12-06 2023-08-01 苏州金唯智生物科技有限公司 判断测序数据饱和的方法、计算机可读介质和应用
US11581062B2 (en) 2018-12-10 2023-02-14 Grail, Llc Systems and methods for classifying patients with respect to multiple cancer classes
JP2022519045A (ja) 2019-01-31 2022-03-18 ガーダント ヘルス, インコーポレイテッド 無細胞dnaを単離するための組成物および方法
WO2020186024A1 (en) * 2019-03-13 2020-09-17 Grail, Inc. Systems and methods for enriching for cancer-derived fragments using fragment size
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
WO2023282916A1 (en) 2021-07-09 2023-01-12 Guardant Health, Inc. Methods of detecting genomic rearrangements using cell free nucleic acids
WO2022046947A1 (en) 2020-08-25 2022-03-03 Guardant Health, Inc. Methods and systems for predicting an origin of a variant
EP4305200A1 (en) 2021-03-09 2024-01-17 Guardant Health, Inc. Detecting the presence of a tumor based on off-target polynucleotide sequencing data
WO2023023402A2 (en) 2021-08-20 2023-02-23 Guardant Health, Inc. Methods for simultaneous molecular and sample barcoding
WO2023150633A2 (en) 2022-02-02 2023-08-10 Guardant Health, Inc. Multifunctional primers for paired sequencing reads
US20240052419A1 (en) * 2022-08-10 2024-02-15 Guardant Health, Inc. Methods and systems for detecting genetic variants

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014039556A1 (en) * 2012-09-04 2014-03-13 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
WO2015100427A1 (en) * 2013-12-28 2015-07-02 Guardant Health, Inc. Methods and systems for detecting genetic variants

Family Cites Families (285)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4725536A (en) 1985-09-19 1988-02-16 Genetics Institute, Inc. Reagent polynucleotide complex with multiple target binding regions, and kit and methods
US6150517A (en) 1986-11-24 2000-11-21 Gen-Probe Methods for making oligonucleotide probes for the detection and/or quantitation of non-viral organisms
US4942124A (en) 1987-08-11 1990-07-17 President And Fellows Of Harvard College Multiplex sequencing
US5149625A (en) 1987-08-11 1992-09-22 President And Fellows Of Harvard College Multiplex analysis of DNA
US5124246A (en) 1987-10-15 1992-06-23 Chiron Corporation Nucleic acid multimers and amplified nucleic acid hybridization assays using same
US5656731A (en) 1987-10-15 1997-08-12 Chiron Corporation Nucleic acid-amplified immunoassay probes
US5925525A (en) 1989-06-07 1999-07-20 Affymetrix, Inc. Method of identifying nucleotide differences
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US6551784B2 (en) 1989-06-07 2003-04-22 Affymetrix Inc Method of comparing nucleic acid sequences
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5871928A (en) 1989-06-07 1999-02-16 Fodor; Stephen P. A. Methods for nucleic acid analysis
US6309822B1 (en) 1989-06-07 2001-10-30 Affymetrix, Inc. Method for comparing copy number of nucleic acid sequences
US5424186A (en) 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5200314A (en) 1990-03-23 1993-04-06 Chiron Corporation Polynucleotide capture assay employing in vitro amplification
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
WO1992010588A1 (en) 1990-12-06 1992-06-25 Affymax Technologies N.V. Sequencing by hybridization of a target nucleic acid to a matrix of defined oligonucleotides
US5981179A (en) 1991-11-14 1999-11-09 Digene Diagnostics, Inc. Continuous amplification reaction
US5424413A (en) 1992-01-22 1995-06-13 Gen-Probe Incorporated Branched nucleic acid probes
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
US6020124A (en) 1992-04-27 2000-02-01 Trustees Of Dartmouth College Detection of soluble gene sequences in biological fluids
US5981176A (en) 1992-06-17 1999-11-09 City Of Hope Method of detecting and discriminating between nucleic acid sequences
WO1995000530A1 (en) 1993-06-25 1995-01-05 Affymax Technologies N.V. Hybridization and sequencing of nucleic acids
US5500356A (en) 1993-08-10 1996-03-19 Life Technologies, Inc. Method of nucleic acid sequence selection
US6309823B1 (en) 1993-10-26 2001-10-30 Affymetrix, Inc. Arrays of nucleic acid probes for analyzing biotransformation genes and methods of using the same
US5681697A (en) 1993-12-08 1997-10-28 Chiron Corporation Solution phase nucleic acid sandwich assays having reduced background noise and kits therefor
CH686982A5 (fr) 1993-12-16 1996-08-15 Maurice Stroun Méthode pour le diagnostic de cancers.
US20030017081A1 (en) 1994-02-10 2003-01-23 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
US5714330A (en) 1994-04-04 1998-02-03 Lynx Therapeutics, Inc. DNA sequencing by stepwise ligation and cleavage
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
WO1998053300A2 (en) 1997-05-23 1998-11-26 Lynx Therapeutics, Inc. System and apparaus for sequential processing of analytes
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US6600996B2 (en) 1994-10-21 2003-07-29 Affymetrix, Inc. Computer-aided techniques for analyzing biological sequences
ATE340866T1 (de) 1994-10-28 2006-10-15 Gen Probe Inc Zusammensetzungen und verfahren für die gleichzeitige detektion und quantifizierung von einer mehrheit spezifischer nuklein säure sequenzen
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5648245A (en) 1995-05-09 1997-07-15 Carnegie Institution Of Washington Method for constructing an oligonucleotide concatamer library by rolling circle replication
US5968740A (en) 1995-07-24 1999-10-19 Affymetrix, Inc. Method of Identifying a Base in a Nucleic Acid
GB9516636D0 (en) 1995-08-14 1995-10-18 Univ London In-situ nucleic acid amplification and detection
US5763175A (en) 1995-11-17 1998-06-09 Lynx Therapeutics, Inc. Simultaneous sequencing of tagged polynucleotides
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US6156504A (en) 1996-03-15 2000-12-05 The Penn State Research Foundation Detection of extracellular tumor-associated nucleic acid in blood plasma or serum using nucleic acid amplification assays
DK0938320T3 (da) 1996-03-26 2010-10-18 Michael S Kopreski Metode til at ud af plasma eller serum tilvejebringe ekstraheret ekstracellulært RNA for at detektere, overvåge eller vurdere cancer
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
US6300077B1 (en) 1996-08-14 2001-10-09 Exact Sciences Corporation Methods for the detection of nucleic acids
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
WO1998015644A2 (en) 1996-09-27 1998-04-16 The Chinese University Of Hong Kong Parallel polynucleotide sequencing method
US6124092A (en) 1996-10-04 2000-09-26 The Perkin-Elmer Corporation Multiplex polynucleotide capture methods and compositions
US6117631A (en) 1996-10-29 2000-09-12 Polyprobe, Inc. Detection of antigens via oligonucleotide antibody conjugates
US6046005A (en) 1997-01-15 2000-04-04 Incyte Pharmaceuticals, Inc. Nucleic acid sequencing with solid phase capturable terminators comprising a cleavable linking group
WO1999028505A1 (en) 1997-12-03 1999-06-10 Curagen Corporation Methods and devices for measuring differential gene expression
US6054276A (en) 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
WO2000012687A1 (en) 1998-08-28 2000-03-09 Invitrogen Corporation System for the rapid manipulation of nucleic acid sequences
US6653077B1 (en) 1998-09-04 2003-11-25 Lynx Therapeutics, Inc. Method of screening for genetic polymorphism
US6503718B2 (en) 1999-01-10 2003-01-07 Exact Sciences Corporation Methods for detecting mutations using primer extension for detecting disease
GB9901475D0 (en) 1999-01-22 1999-03-17 Pyrosequencing Ab A method of DNA sequencing
WO2000046402A1 (en) 1999-02-05 2000-08-10 Amersham Pharmacia Biotech Uk Limited Genomic analysis method
US6629040B1 (en) 1999-03-19 2003-09-30 University Of Washington Isotope distribution encoded tags for protein identification
WO2000058516A2 (en) 1999-03-26 2000-10-05 Whitehead Institute For Biomedical Research Universal arrays
WO2000061808A2 (en) 1999-04-09 2000-10-19 Exact Laboratories, Inc. Methods for detecting nucleic acids indicative of cancer
CA2644688C (en) 1999-04-20 2012-11-13 Kankyo Engineering Co., Ltd. Method for determining a concentration of target nucleic acid molecules, nucleic acid probes for the method, and method for analysing data obtained by the method
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6242186B1 (en) 1999-06-01 2001-06-05 Oy Jurilab Ltd. Method for detecting a risk of cancer and coronary heart disease and kit therefor
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US6326148B1 (en) 1999-07-12 2001-12-04 The Regents Of The University Of California Detection of copy number changes in colon cancer
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
US6849403B1 (en) 1999-09-08 2005-02-01 Exact Sciences Corporation Apparatus and method for drug screening
US6586177B1 (en) 1999-09-08 2003-07-01 Exact Sciences Corporation Methods for disease detection
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
ATE458831T1 (de) 1999-12-07 2010-03-15 Exact Sciences Corp Verfahren zum nachweis von lungenneoplasmen in fäkalen proben
US6489114B2 (en) 1999-12-17 2002-12-03 Bio Merieux Process for labeling a ribonucleic acid, and labeled RNA fragments which are obtained thereby
AU2001238068A1 (en) 2000-02-07 2001-08-14 Illumina, Inc. Nucleic acid detection methods using universal priming
US20020072058A1 (en) 2000-03-24 2002-06-13 Voelker Leroy L. Method for amplifying quinolone-resistance-determining-regions and identifying polymorphic variants thereof
US20030207300A1 (en) 2000-04-28 2003-11-06 Matray Tracy J. Multiplex analytical platform using molecular tags
EP1158055A1 (fr) 2000-05-26 2001-11-28 Xu Qi University of Teaxs Laboratoire de Leucémie Chen Méthode pour le diagnostic de cancers
AU2002246612B2 (en) 2000-10-24 2007-11-01 The Board Of Trustees Of The Leland Stanford Junior University Direct multiplex characterization of genomic DNA
US20020142345A1 (en) 2000-12-22 2002-10-03 Nelsen Anita J. Methods for encoding and decoding complex mixtures in arrayed assays
US20030049616A1 (en) 2001-01-08 2003-03-13 Sydney Brenner Enzymatic synthesis of oligonucleotide tags
JP5073888B2 (ja) 2001-03-28 2012-11-14 花王株式会社 静電荷像現像用トナー
CA2344599C (en) 2001-05-07 2011-07-12 Bioneer Corporation Selective polymerase chain reaction of dna of which base sequence is completely unknown
US7406385B2 (en) 2001-10-25 2008-07-29 Applera Corporation System and method for consensus-calling with per-base quality values for sample assemblies
ES2253461T3 (es) 2002-03-05 2006-06-01 Epigenomics Ag Procedimiento y dispositivo para la determinacion de la especificidad del tejido y del adn que flota libre en tejidos corporales.
US20030186251A1 (en) 2002-04-01 2003-10-02 Brookhaven Science Associates, Llc Genome sequence tags
US7727720B2 (en) 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
US7822555B2 (en) 2002-11-11 2010-10-26 Affymetrix, Inc. Methods for identifying DNA copy number changes
CA2505472A1 (en) 2002-11-11 2004-05-27 Affymetrix, Inc. Methods for identifying dna copy number changes
US10229244B2 (en) 2002-11-11 2019-03-12 Affymetrix, Inc. Methods for identifying DNA copy number changes using hidden markov model based estimations
US7704687B2 (en) 2002-11-15 2010-04-27 The Johns Hopkins University Digital karyotyping
US20040209299A1 (en) 2003-03-07 2004-10-21 Rubicon Genomics, Inc. In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA
WO2006102264A1 (en) 2005-03-18 2006-09-28 Fluidigm Corporation Thermal reaction device and method for using the same
US20040259118A1 (en) 2003-06-23 2004-12-23 Macevicz Stephen C. Methods and compositions for nucleic acid sequence analysis
EP1641809B2 (en) 2003-07-05 2018-10-03 The Johns Hopkins University Method and compositions for detection and enumeration of genetic variations
DE60328193D1 (de) 2003-10-16 2009-08-13 Sequenom Inc Nicht invasiver Nachweis fötaler genetischer Merkmale
DE10348407A1 (de) 2003-10-17 2005-05-19 Widschwendter, Martin, Prof. Prognostische und diagnostische Marker für Zell-proliferative Erkrankungen von Brustgeweben
US20070111233A1 (en) 2003-10-30 2007-05-17 Bianchi Diana W Prenatal diagnosis using cell-free fetal DNA in amniotic fluid
EP2202322A1 (en) 2003-10-31 2010-06-30 AB Advanced Genetic Analysis Corporation Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
JP2007524410A (ja) 2004-01-23 2007-08-30 リングヴィテ エーエス ポリヌクレオチドライゲーション反応の改良
US7217522B2 (en) 2004-02-12 2007-05-15 Campass Genetics Llc Genetic analysis by sequence-specific sorting
US20100216153A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US20060046258A1 (en) 2004-02-27 2006-03-02 Lapidus Stanley N Applications of single molecule sequencing
US20050250147A1 (en) 2004-05-10 2005-11-10 Macevicz Stephen C Digital profiling of polynucleotide populations
US7276720B2 (en) 2004-07-19 2007-10-02 Helicos Biosciences Corporation Apparatus and methods for analyzing samples
US20060035258A1 (en) 2004-08-06 2006-02-16 Affymetrix, Inc. Methods for identifying DNA copy number changes
US7937225B2 (en) 2004-09-03 2011-05-03 New York University Systems, methods and software arrangements for detection of genome copy number variation
EP1647600A3 (en) 2004-09-17 2006-06-28 Affymetrix, Inc. (A US Entity) Methods for identifying biological samples by addition of nucleic acid bar-code tags
US9109256B2 (en) 2004-10-27 2015-08-18 Esoterix Genetic Laboratories, Llc Method for monitoring disease progression or recurrence
US7424371B2 (en) 2004-12-21 2008-09-09 Helicos Biosciences Corporation Nucleic acid analysis
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
ITRM20050068A1 (it) 2005-02-17 2006-08-18 Istituto Naz Per Le Malattie I Metodo per la rivelazione di acidi nucleici di agenti patogeni batterici o di parassiti nelle urine.
WO2006099604A2 (en) 2005-03-16 2006-09-21 Compass Genetics, Llc Methods and compositions for assay readouts on multiple analytical platforms
EP1712639B1 (en) 2005-04-06 2008-08-27 Maurice Stroun Method for the diagnosis of cancer by detecting circulating DNA and RNA
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
EP1929039B2 (en) 2005-09-29 2013-11-20 Keygene N.V. High throughput screening of mutagenized populations
US7329860B2 (en) 2005-11-23 2008-02-12 Illumina, Inc. Confocal imaging methods and apparatus
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
US20070172839A1 (en) 2006-01-24 2007-07-26 Smith Douglas R Asymmetrical adapters and methods of use thereof
US8383338B2 (en) 2006-04-24 2013-02-26 Roche Nimblegen, Inc. Methods and systems for uniform enrichment of genomic regions
US7702468B2 (en) 2006-05-03 2010-04-20 Population Diagnostics, Inc. Evaluating genetic disorders
WO2007137187A2 (en) 2006-05-18 2007-11-29 Molecular Profiling Institute, Inc. System and method for determining individualized medical intervention for a disease state
WO2008111990A1 (en) 2006-06-14 2008-09-18 Cellpoint Diagnostics, Inc. Rare cell analysis using sample splitting and dna tags
FR2904833A1 (fr) 2006-08-11 2008-02-15 Bioquanta Sarl Procede de dosage d'acide nuclieque par fluorescence
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
EP2518162B1 (en) 2006-11-15 2018-03-07 Biospherex LLC Multitag sequencing and ecogenomics analysis
US20110014607A1 (en) 2006-12-06 2011-01-20 Jirtle Randy L Imprinted genes and disease
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
MX2009007987A (es) 2007-01-25 2010-03-01 Dana Farber Cancer Inst Inc Uso de anticuerpos anti-egfr en el tratamiento de enfermedad mediada por egfr mutante.
WO2008092150A1 (en) 2007-01-26 2008-07-31 Illumina, Inc. Nucleic acid sequencing system and method
AR065687A1 (es) 2007-03-13 2009-06-24 Amgen Inc Metodo para determinar la presencia o no de una mutacion k-ras y terapia con anticuerpos anti-egfr
WO2008148072A2 (en) 2007-05-24 2008-12-04 The Brigham And Women's Hospital, Inc. Disease-associated genetic variations and methods for obtaining and using same
CA2689356A1 (en) 2007-06-01 2008-12-11 454 Life Sciences Corporation System and meth0d for identification of individual samples from a multiplex mixture
CA2689626C (en) 2007-06-06 2016-10-25 Pacific Biosciences Of California, Inc. Methods and processes for calling bases in sequence by incorporation methods
US20090029377A1 (en) 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
US20090053719A1 (en) 2007-08-03 2009-02-26 The Chinese University Of Hong Kong Analysis of nucleic acids by digital pcr
JP5707132B2 (ja) 2007-09-07 2015-04-22 フルイダイム コーポレイション コピー数変動の決定、方法およびシステム
EP3144672B1 (en) 2007-11-21 2018-08-22 Cosmosid Inc. Genome identification system
US20110171640A1 (en) 2008-02-12 2011-07-14 Novartis Vaccines And Diagnostics, Inc. Method for isolating cell free apoptotic or fetal nucleic acids
US8216789B2 (en) 2008-02-27 2012-07-10 University Of Washington Diagnostic panel of cancer antibodies and methods for use
AU2009228312B2 (en) 2008-03-26 2015-05-21 Sequenom, Inc. Restriction endonuclease enhanced polymorphic sequence detection
JP2011515102A (ja) 2008-03-28 2011-05-19 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 核酸シーケンシング用組成物及び方法
US20110160290A1 (en) 2008-05-21 2011-06-30 Muneesh Tewari Use of extracellular rna to measure disease
DE102008025656B4 (de) 2008-05-28 2016-07-28 Genxpro Gmbh Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung
US20090298709A1 (en) 2008-05-28 2009-12-03 Affymetrix, Inc. Assays for determining telomere length and repeated sequence copy number
US20100041048A1 (en) 2008-07-31 2010-02-18 The Johns Hopkins University Circulating Mutant DNA to Assess Tumor Dynamics
US20100062494A1 (en) 2008-08-08 2010-03-11 President And Fellows Of Harvard College Enzymatic oligonucleotide pre-adenylation
WO2010021936A1 (en) 2008-08-16 2010-02-25 The Board Of Trustees Of The Leland Stanford Junior University Digital pcr calibration for high throughput sequencing
US8583380B2 (en) 2008-09-05 2013-11-12 Aueon, Inc. Methods for stratifying and annotating cancer drug treatment options
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
CA3069081C (en) 2008-09-20 2023-05-23 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US8236532B2 (en) 2008-12-23 2012-08-07 Illumina, Inc. Multibase delivery for long reads in sequencing by synthesis protocols
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
US20120165202A1 (en) 2009-04-30 2012-06-28 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
US20130143747A1 (en) 2011-12-05 2013-06-06 Myriad Genetics, Incorporated Methods of detecting cancer
US9524369B2 (en) 2009-06-15 2016-12-20 Complete Genomics, Inc. Processing and analysis of complex nucleic acid sequence data
KR20120044941A (ko) 2009-06-25 2012-05-08 프레드 헛친슨 켄서 리서치 센터 적응 면역의 측정방법
WO2011011426A2 (en) 2009-07-20 2011-01-27 Bar Harbor Biotechnology, Inc. Methods for assessing disease risk
EP2494065B1 (en) 2009-10-26 2015-12-23 Lifecodexx AG Means and methods for non-invasive diagnosis of chromosomal aneuploidy
EP2499262A4 (en) 2009-11-12 2015-01-07 Esoterix Genetic Lab Llc ANALYSIS OF THE NUMBER OF COPIES OF GENETIC LOCUS
US9023769B2 (en) 2009-11-30 2015-05-05 Complete Genomics, Inc. cDNA library for nucleic acid sequencing
US9752187B2 (en) 2009-12-11 2017-09-05 Nucleix Categorization of DNA samples
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
EP3660165B1 (en) 2009-12-22 2023-01-04 Sequenom, Inc. Processes and kits for identifying aneuploidy
US20110177512A1 (en) 2010-01-19 2011-07-21 Predictive Biosciences, Inc. Method for assuring amplification of an abnormal nucleic acid in a sample
CA2786564A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
US20120100548A1 (en) * 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
ES2534758T3 (es) 2010-01-19 2015-04-28 Verinata Health, Inc. Métodos de secuenciación en diagnósticos prenatales
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
WO2011090556A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acid in maternal samples
EP2536854B1 (en) 2010-02-18 2017-07-19 The Johns Hopkins University Personalized tumor biomarkers
WO2011115937A1 (en) 2010-03-14 2011-09-22 The Translational Genomics Research Institute Methods of determining susceptibility of tumors to tyrosine kinase inhibitors
CN101967517B (zh) 2010-03-19 2012-11-07 黄乐群 一种无需借助pcr的基因检测方法
ES2703769T3 (es) 2010-04-16 2019-03-12 Chronix Biomedical Biomarcadores de ácidos nucleicos en circulación asociados al cáncer de mama
US9255291B2 (en) 2010-05-06 2016-02-09 Bioo Scientific Corporation Oligonucleotide ligation methods for improving data quality and throughput using massively parallel sequencing
EP2576837B1 (en) 2010-06-04 2017-09-06 Chronix Biomedical Prostate cancer associated circulating nucleic acid biomarkers
DK3425062T3 (da) 2010-06-09 2023-09-04 Keygene Nv Stregkoder med kombinatorisk sekvens til høj gennemløbsscreening
EP2400035A1 (en) 2010-06-28 2011-12-28 Technische Universität München Methods and compositions for diagnosing gastrointestinal stromal tumors
EP2591433A4 (en) 2010-07-06 2017-05-17 Life Technologies Corporation Systems and methods to detect copy number variation
MX361944B (es) 2010-07-23 2018-12-19 President And Fellows Of Harvard College Star Metodos para detectar firmas de enfermedad o condiciones en fluidos corporales.
JP5835219B2 (ja) 2010-07-29 2015-12-24 Toto株式会社 光触媒塗装体および光触媒コーティング液
US8862410B2 (en) 2010-08-02 2014-10-14 Population Diagnostics, Inc. Compositions and methods for discovery of causative mutations in genetic disorders
US11031095B2 (en) 2010-08-06 2021-06-08 Ariosa Diagnostics, Inc. Assay systems for determination of fetal copy number variation
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
EP2426217A1 (en) 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
US20120231479A1 (en) 2010-09-09 2012-09-13 Robert Puskas Combination methods of diagnosing cancer in a patient
DK2623613T3 (en) 2010-09-21 2016-10-03 Population Genetics Tech Ltd Increasing the reliability of the allele-indications by molecular counting
WO2012042374A2 (en) 2010-10-01 2012-04-05 Anssi Jussi Nikolai Taipale Method of determining number or concentration of molecules
EP3561159B1 (en) 2010-10-08 2023-09-20 President and Fellows of Harvard College High-throughput single cell barcoding
US8725422B2 (en) 2010-10-13 2014-05-13 Complete Genomics, Inc. Methods for estimating genome-wide copy number variations
TR201810530T4 (tr) 2010-10-22 2018-08-27 Cold Spring Harbor Laboratory Genomik kopya sayısı bilgisi elde etmek için nükleik asitlerin varyete sayımı.
WO2012066451A1 (en) 2010-11-15 2012-05-24 Pfizer Inc. Prognostic and predictive gene signature for colon cancer
CN105243295B (zh) 2010-11-30 2018-08-17 香港中文大学 与癌症相关的遗传或分子畸变的检测
AU2011348267A1 (en) 2010-12-23 2013-08-01 Sequenom, Inc. Fetal genetic variation detection
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
KR20230141927A (ko) 2010-12-30 2023-10-10 파운데이션 메디신 인코포레이티드 종양 샘플의 다유전자 분석의 최적화
WO2012097053A1 (en) 2011-01-11 2012-07-19 Via Genomes, Inc. Methods, systems, databases, kits and arrays for screening for and predicting the risk of and identifying the presence of tumors and cancers
US20120190021A1 (en) 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Detection of genetic abnormalities
WO2012106559A1 (en) 2011-02-02 2012-08-09 Translational Genomics Research Institute Biomarkers and methods of use thereof
CA2824387C (en) 2011-02-09 2019-09-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
WO2012109500A2 (en) * 2011-02-09 2012-08-16 Bio-Rad Laboratories, Inc. Analysis of nucleic acids
US20120238464A1 (en) 2011-03-18 2012-09-20 Baylor Research Institute Biomarkers for Predicting the Recurrence of Colorectal Cancer Metastasis
US9260753B2 (en) 2011-03-24 2016-02-16 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
US20150065358A1 (en) 2011-03-30 2015-03-05 Verinata Health, Inc. Method for verifying bioassay samples
US9476095B2 (en) 2011-04-15 2016-10-25 The Johns Hopkins University Safe sequencing system
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
WO2012149042A2 (en) 2011-04-25 2012-11-01 Bio-Rad Laboratories, Inc. Methods and compositions for nucleic acid analysis
US8697408B2 (en) 2011-05-06 2014-04-15 New England Biolabs, Inc. Ligation enhancement
US9074204B2 (en) 2011-05-20 2015-07-07 Fluidigm Corporation Nucleic acid encoding reactions
US9752176B2 (en) 2011-06-15 2017-09-05 Ginkgo Bioworks, Inc. Methods for preparative in vitro cloning
US9340826B2 (en) 2011-08-01 2016-05-17 Celemics, Inc. Method of preparing nucleic acid molecules
US10704164B2 (en) 2011-08-31 2020-07-07 Life Technologies Corporation Methods, systems, computer readable media, and kits for sample identification
US9834766B2 (en) 2011-09-02 2017-12-05 Atreca, Inc. DNA barcodes for multiplexed sequencing
US8712697B2 (en) 2011-09-07 2014-04-29 Ariosa Diagnostics, Inc. Determination of copy number variations using binomial probability calculations
US20130079241A1 (en) 2011-09-15 2013-03-28 Jianhua Luo Methods for Diagnosing Prostate Cancer and Predicting Prostate Cancer Relapse
CA2850785C (en) 2011-10-06 2022-12-13 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20130102485A1 (en) 2011-10-19 2013-04-25 Inhan Lee Method of Determining a Diseased State in a Subject
NO3051026T3 (ja) 2011-10-21 2018-07-28
US20140303008A1 (en) 2011-10-21 2014-10-09 Chronix Biomedical Colorectal cancer associated circulating nucleic acid biomarkers
US20130122499A1 (en) 2011-11-14 2013-05-16 Viomics, Inc. System and method of detecting local copy number variation in dna samples
US10214775B2 (en) 2011-12-07 2019-02-26 Chronix Biomedical Prostate cancer associated circulating nucleic acid biomarkers
AU2012347522B2 (en) 2011-12-08 2015-07-30 Five3 Genomics, Llc MDM2-containing double minute chromosomes and methods therefore
WO2013106737A1 (en) 2012-01-13 2013-07-18 Data2Bio Genotyping by next-generation sequencing
PL3363901T3 (pl) 2012-02-17 2021-07-05 Fred Hutchinson Cancer Research Center Kompozycje i sposoby dokładnej identyfikacji mutacji
US11177020B2 (en) 2012-02-27 2021-11-16 The University Of North Carolina At Chapel Hill Methods and uses for molecular tags
SG11201405274WA (en) 2012-02-27 2014-10-30 Cellular Res Inc Compositions and kits for molecular counting
ES2741099T3 (es) 2012-02-28 2020-02-10 Agilent Technologies Inc Método de fijación de una secuencia de recuento para una muestra de ácido nucleico
US9890429B2 (en) 2012-02-29 2018-02-13 Dana-Farber Cancer Institute, Inc. Compositions, kits, and methods for the identification, assessment, prevention, and therapy of cancer
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
US9862995B2 (en) 2012-03-13 2018-01-09 Abhijit Ajit Patel Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
WO2013142213A1 (en) 2012-03-20 2013-09-26 Wake Forest University Health Sciences Methods, systems, and computer readable media for tracking and verifying receipt of contents of a delivery within an organization
WO2013142389A1 (en) 2012-03-20 2013-09-26 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
CA2868836C (en) 2012-03-26 2019-08-06 The Johns Hopkins University Rapid aneuploidy detection
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
CN107435070A (zh) * 2012-04-12 2017-12-05 维里纳塔健康公司 拷贝数变异的检测和分类
CA3209140A1 (en) 2012-04-19 2013-10-24 The Medical College Of Wisconsin, Inc. Highly sensitive surveillance using detection of cell free dna
WO2013166517A1 (en) * 2012-05-04 2013-11-07 Complete Genomics, Inc. Methods for determining absolute genome-wide copy number variations of complex tumors
WO2013173394A2 (en) 2012-05-14 2013-11-21 Cb Biotechnologies, Inc. Method for increasing accuracy in quantitative detection of polynucleotides
WO2013181170A1 (en) 2012-05-31 2013-12-05 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
CA2875542A1 (en) 2012-06-11 2013-12-19 Sequenta, Inc. Method of sequence determination using sequence tags
US11261494B2 (en) 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
WO2014004726A1 (en) 2012-06-26 2014-01-03 Caifu Chen Methods, compositions and kits for the diagnosis, prognosis and monitoring of cancer
AU2013204615A1 (en) 2012-07-20 2014-02-06 Verinata Health, Inc. Detecting and classifying copy number variation in a fetal genome
US20140066317A1 (en) * 2012-09-04 2014-03-06 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
CA2892646A1 (en) 2012-12-10 2014-06-19 Resolution Bioscience, Inc. Methods for targeted genomic analysis
US20140336943A1 (en) 2013-01-05 2014-11-13 Foundation Medicine, Inc. System and method for managing genomic testing results
EP2945652B1 (en) 2013-01-18 2021-07-07 Foundation Medicine, Inc. Methods of treating cholangiocarcinoma
US20160034638A1 (en) 2013-03-14 2016-02-04 University Of Rochester System and Method for Detecting Population Variation from Nucleic Acid Sequencing Data
CN105518151B (zh) 2013-03-15 2021-05-25 莱兰斯坦福初级大学评议会 循环核酸肿瘤标志物的鉴别和用途
US9816088B2 (en) 2013-03-15 2017-11-14 Abvitro Llc Single cell bar-coding for antibody discovery
WO2014145078A1 (en) 2013-03-15 2014-09-18 Verinata Health, Inc. Generating cell-free dna libraries directly from blood
EP3882362B1 (en) 2013-03-15 2024-05-08 Guardant Health, Inc. Methods for sequencing of cell free polynucleotides
CA2905410A1 (en) 2013-03-15 2014-09-25 Abbott Molecular Inc. Systems and methods for detection of genomic copy number changes
EP2977464A4 (en) 2013-03-19 2016-10-19 Toppan Printing Co Ltd PROCEDURE FOR PREDICTING SENSITIVITY TO EGFR HEMMER
PL2981921T3 (pl) * 2013-04-03 2023-05-08 Sequenom, Inc. Metody i procesy nieinwazyjnej oceny zmienności genetycznych
WO2014189957A2 (en) 2013-05-23 2014-11-27 The Board Of Trustees Of The Leland Stanford Junior University Transposition into native chromatin for personal epigenomics
JP2015096049A (ja) 2013-11-15 2015-05-21 凸版印刷株式会社 Vegf阻害剤長期奏功性予測方法
PT4026917T (pt) 2014-04-14 2024-02-12 Yissum Research And Development Company Of The Hebrew Univ Of Jerusalem Ltd Método e kit para determinar a morte de células ou de tecido ou a origem de tecidos ou de células de dna por análise de metilação do dna
WO2015175705A1 (en) 2014-05-13 2015-11-19 Board Of Regents, The University Of Texas System Gene mutations and copy number alterations of egfr, kras and met
CA2950596C (en) * 2014-05-30 2023-10-31 Verinata Health, Inc. Detecting fetal sub-chromosomal aneuploidies and copy number variations
RS62803B1 (sr) 2014-07-25 2022-02-28 Bgi Genomics Co Limited Postupak za određivanje frakcije slobodnih fetalnih nukleinskih kiselina u uzorku periferne krvi trudnice i njihova upotreba
EP4358097A1 (en) 2014-07-25 2024-04-24 University of Washington Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same
US20160053301A1 (en) 2014-08-22 2016-02-25 Clearfork Bioscience, Inc. Methods for quantitative genetic analysis of cell free dna
CN106716425A (zh) 2014-09-10 2017-05-24 百思威基因公司 健康和保健管理方法及用于其实践的系统
US11085084B2 (en) 2014-09-12 2021-08-10 The Board Of Trustees Of The Leland Stanford Junior University Identification and use of circulating nucleic acids
EP3502273B1 (en) 2014-12-12 2020-07-08 Verinata Health, Inc. Cell-free dna fragment
EP3240911B1 (en) 2014-12-31 2020-08-26 Guardant Health, Inc. Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
PT3256605T (pt) 2015-02-10 2022-03-17 Univ Hong Kong Chinese Deteção de mutações para rastreio de cancro e análise fetal
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
PT3387152T (pt) 2015-12-08 2022-04-19 Twinstrand Biosciences Inc Adaptadores, métodos e composições melhorados para sequenciamento duplex
EP3443066A4 (en) 2016-04-14 2019-12-11 Guardant Health, Inc. EARLY DETECTION METHODS FOR CANCER

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014039556A1 (en) * 2012-09-04 2014-03-13 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
WO2015100427A1 (en) * 2013-12-28 2015-07-02 Guardant Health, Inc. Methods and systems for detecting genetic variants

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PLOS ONE, 2014, VOL.9, NO.3, E91295, PP.1-10, SUPPLEMENTARY MATERIAL, JPN6020037234, ISSN: 0004802168 *

Also Published As

Publication number Publication date
CA3008651A1 (en) 2017-06-22
US20170240973A1 (en) 2017-08-24
CN117174167A (zh) 2023-12-05
JP2023126874A (ja) 2023-09-12
CN108603228B (zh) 2023-09-01
US20200140960A1 (en) 2020-05-07
CN108603228A (zh) 2018-09-28
US11242569B2 (en) 2022-02-08
SG11201805119QA (en) 2018-07-30
EP3390668A1 (en) 2018-10-24
EP3390668A4 (en) 2020-04-01
JP2021101732A (ja) 2021-07-15
US20220356527A1 (en) 2022-11-10
WO2017106768A1 (en) 2017-06-22

Similar Documents

Publication Publication Date Title
US11242569B2 (en) Methods to determine tumor gene copy number by analysis of cell-free DNA
US20180230530A1 (en) Methods and systems for detecting genetic variants
KR102028375B1 (ko) 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
JP7242644B2 (ja) 体細胞および生殖細胞系統バリアントを鑑別するための方法およびシステム
CN114574581A (zh) 检测稀有突变和拷贝数变异的系统和方法
CN110914450A (zh) 无细胞dna的体细胞来源或种系来源的鉴定
US20240076720A1 (en) Methods for analyzing nucleic acids
JP2024056984A (ja) エピジェネティック区画アッセイを較正するための方法、組成物およびシステム
JP2024057050A (ja) 対立遺伝子頻度に基づく機能喪失のコンピューターモデリング
JP2024056939A (ja) 生体試料のフィンガープリンティングのための方法
EP4219763A2 (en) Method for quantifying gene fusion dna
JP2023060046A (ja) 脱アミノ化に誘導される配列エラーの補正
US20220068433A1 (en) Computational detection of copy number variation at a locus in the absence of direct measurement of the locus
US20200075124A1 (en) Methods and systems for detecting allelic imbalance in cell-free nucleic acid samples
Uziela Making microarray and RNA-seq gene expression data comparable

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201005

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20201224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210916

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211215

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220620

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220920

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221118

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230630

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230707

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20230712