JP2020072737A - 変異の検出および染色体分節の倍数性 - Google Patents

変異の検出および染色体分節の倍数性 Download PDF

Info

Publication number
JP2020072737A
JP2020072737A JP2020010659A JP2020010659A JP2020072737A JP 2020072737 A JP2020072737 A JP 2020072737A JP 2020010659 A JP2020010659 A JP 2020010659A JP 2020010659 A JP2020010659 A JP 2020010659A JP 2020072737 A JP2020072737 A JP 2020072737A
Authority
JP
Japan
Prior art keywords
allele
sample
individual
locus
polymorphic loci
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020010659A
Other languages
English (en)
Other versions
JP6994059B2 (ja
Inventor
バビアーツ ジョシュア
Babiarz Joshua
バビアーツ ジョシュア
ポンピリウ コンスタンティン チューダー
Pompiliu Constantin Tudor
ポンピリウ コンスタンティン チューダー
エー.ユーバンク レーン
A Eubank Lane
エー.ユーバンク レーン
ゲメロス ジョージ
Gemelos George
ゲメロス ジョージ
ミカー ヒル マシュー
Micah Hill Matthew
ミカー ヒル マシュー
エサー キルキツラー フセイン
Eser Kirkizlar Huseyin
エサー キルキツラー フセイン
ラビノビッツ マシュー
Matthew Rabinowitz
ラビノビッツ マシュー
サカリヤ オヌール
Sakarya Onur
サカリヤ オヌール
シグルヨンソン スティルミル
Sigurjonsson Styrmir
シグルヨンソン スティルミル
ジンマーマン ベルンハルト
Zimmerman Bernhard
ジンマーマン ベルンハルト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Natera Inc
Original Assignee
Natera Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=57221528&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2020072737(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Natera Inc filed Critical Natera Inc
Publication of JP2020072737A publication Critical patent/JP2020072737A/ja
Priority to JP2021199357A priority Critical patent/JP2022028950A/ja
Application granted granted Critical
Publication of JP6994059B2 publication Critical patent/JP6994059B2/ja
Priority to JP2023189080A priority patent/JP2024001359A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2539/00Reactions characterised by analysis of gene expression or genome comparison
    • C12Q2539/10The purpose being sequence identification by analysis of gene expression or genome comparison characterised by
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation

Abstract

【課題】本発明は、アレルの相決定と、個別及び同時確率並びに最適合モデルの決定とに基づいて、染色体文節又は全長染色体の倍数性を検出するための、方法、システム、及びコンピュータ可読媒体を提供する。【解決手段】本発明は、妊娠中の胎児における癌又は染色体異常を検出するための、方法、システム、及びコンピュータ可読媒体を提供する。また、本発明は、倍数性決定により見いだされる多型座位のアレル不均衡率に基づいて、循環腫瘍核酸を検出するための方法を提供する。また、本発明は、増幅効率及びエラー率の推定値に基づいて一塩基多様体を検出するための方法と、複数の個体由来の対照試料の多様性アレル頻度の中央値に基づいて一塩基多様体を検出するための方法を提供する。【選択図】図20A−20B

Description

関連する出願の参照
本願は、2014年4月21日に提出された米国仮特許出願第61/982,245号、2014年5月1日に提出された米国仮特許出願第61/987,407号、2014年10月21日に提出された米国仮特許出願第62/066,514号、2015年4月10日に提出された米国仮特許出願第62/146,188号、2015年4月14日に提出された米国仮特許出願第62/147,377号、および2015年4月15日に提出された米国仮特許出願第62/148,173号の優先権を主張するものであり、これら出願の教示についてその全内容を参照により本明細書に組み込む。
本発明は、主に染色体分節の倍数性を検出する方法およびシステム、および一塩基多様体を検出する方法およびシステムに関する。
コピー数多様性(CNV)は、典型的には1,000塩基対(1kb)から20メガ塩基対(mb)の長さの配列の重複および欠失を含むゲノムの構造多様性の主因として認識されている。染色体分節または染色体全体の欠失および重複は、病気に対する感受性または耐性等、様々な条件と関連づけられる。
CNVは、影響を受ける配列の長さに基づいて主に2つの型の内の1つに分類されることが多い。1つ目の型はコピー数多型(CNP)を含む。CNPは、一般的な集団に共通して見られ、1%超の全頻度で発生する。CNPは、通常は小さく(ほとんどは10キロ塩基対未満の長さ)、薬物解毒および免疫に重要なタンパク質をコードする遺伝子に多い。これらCNPの下位集合ではコピー数が大きく異なる。その結果、遺伝子の特定の集合について染色体のコピー数が、個人間で大きく異なる(例えば、2、3、4、5等)可能性がある。免疫応答遺伝子に関連したCNPは、近年、遺伝性の難病(乾癬、クローン病、および糸球体腎炎を含む)に対する感受性と関連づけられている。
もう一方のCNVは、長さが約10万塩基対から100万超の塩基対まで、CNPよりもかなり長い比較的希な多様体を含む。いくつかの場合では、これらCNVは、特定の個体を発生させた精子または卵子ができる過程で生じた可能性、あるいはある家族の数世代間でのみ受け継がれた可能性がある。このような希な大型構造多様体は、精神遅滞、発達遅滞、統合失調症、および自閉症を有する対象者において偏って観察されている。このような対象者の様子から、神経認知疾患においては遺伝した変異の他の形態(一塩基置換を含む)に比べてこのような希な大型CNVがより重要であるかもしれないと推測されている。
遺伝子のコピー数は癌細胞では変化している可能性がある。例えば、Chr1pの重複は乳癌で共通して見られる。また、EGFRのコピー数は、正常な細胞に比べて非小細胞肺癌では多くなり得る。癌は、主要死亡原因の1つであり、癌の早期診断および治療が重要である。というのは、早期診断および治療は(例えば、沈静の確率やその持続を向上させることによって)患者の転帰を向上させることができるからである。早期診断はまた、患者が受ける治療法の量または数を低減させることができる。癌性細胞を破壊する現在の治療法の多くは正常細胞にも影響を及ぼし、その結果、様々な副作用(吐き気、嘔吐、血球数の低下、感染リスクの増加、抜け毛、および粘膜の潰瘍等)を起こす可能性がある。よって、癌の早期検出は、治療法(化学療法薬または放射線等)の数および/または量を低減させることができるため望ましい。
コピー数変異はまた、数種の精神障害、身体障害、および特発性学習障害と関連づけられている。無細胞DNAを用いた非侵襲性出生前検査(NIPT)により異常(例えば、胎児の13番染色体、18番染色体、および21番染色体の三染色体性、三倍体性、および性染色体の異数性等)を検出することができる。亜染色体の微小欠失もまた、数種の精神障害および身体障害を引き起こし得るが、より小さいものであるためにその検出はより困難である。微小欠失症候群のうち、8つは凝集発生率が1000分の1を超えており、胎児の常染色体の三染色体性と同程度見られる。
また、CCL3L1の高コピー数がHIV感染への低感受性と関連づけられている。FCGR3B(CD16細胞表面免疫グロブリン受容体)のコピー数が少ないと、全身性エリテマトーデスおよび類似の炎症性自己免疫疾患に対する感受性を増加させ得る。
このように、染色体分節または染色体全体の欠失および重複を検出する改良された方法が求められている。これら方法を用いて、癌等の病気の診断や病気の発症リスクの増加、あるいは胎児のCNVを正確に診断することができるが好ましい。
本明細書の例示的態様では、個体の試料に含まれる染色体分節の倍数性を決定するための方法が提供される。該方法は以下の工程を含む。
a.該試料中の該染色体分節にある多型座位の集合のうちの各座位に存在する各アレルの量を含むアレル頻度データを受け、
b.該アレル頻度データの相を推定することによって該多型座位の集合に関する相決定済み(phased)アレル情報を作成し、
c.該アレル頻度データを用いて、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、
d.該個別確率と該相決定済みアレル情報を用いて該多型座位の集合に関する同時確率を作成し、
e.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、該染色体分節の倍数性を決定すること。
前記倍数性を決定するための方法の例示的な一態様では、前記データが核酸配列データ、特に高処理核酸配列データを用いて作成される。前記倍数性を決定するための方法のある例では、前記アレル頻度データが個別確率の作成に用いられる前に、エラーが修正される。特定の例示的な態様では、修正されるエラーがアレル増幅効率の偏りを含む。他の態様では、修正されるエラーが、環境不純物および遺伝型解析による不純物を含む。いくつかの態様では、修正されるエラーが、アレル増幅の偏り、環境不純物、および遺伝型解析による不純物を含む。
前記倍数性を決定するための方法の特定の態様では、前記個別確率が、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて作成される。これらの態様および他の態様では、前記同時確率が、前記染色体分節にある多型座位間の連鎖を考慮することによって作成される。
したがって、本明細書では、これら態様のいくつかを組み合わせた例示的一態様において、個体の試料の染色体倍数性を検出するための方法が提供される。該方法は以下の工程を含む。
a.該個体の染色体分節にある多型座位の集合に存在するアレルに関する核酸配列データを受け、
b.該核酸配列データを用いて該多型座位の集合におけるアレル頻度を検出し、
c.検出された該アレル頻度のアレル増幅効率の偏りを修正することによって、該多型座位の集合に関する修正済みアレル頻度を作成し、
d.該核酸配列データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、
e.該修正済みアレル頻度を該多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、
f.該個別確率を該染色体分節にある多型座位間の連鎖を考慮しながら組み合わせることにより、該多型座位の集合に関する同時確率を作成し、
g.該同時確率に基づき、染色体異数性を示す最適合モデルを選択すること。
本明細書において他の側面では、個体の試料の染色体倍数性を検出するためのシステムであって、該システムは、
a.該試料中の該染色体分節にある多型座位の集合のうちの各座位に存在する各アレルの量を含むアレル頻度データを受けるよう構成された入力プロセッサと、
b.モデラーであって、
i.該アレル頻度データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、
ii.該アレル頻度データを用いて、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、
iii.該個別確率と該相決定済みアレル情報を用いて該多型座位の集合に関する同時確率を作成するよう構成されたモデラーと、
c.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、該染色体分節の倍数性を決定するよう構成された、仮説管理部(hypothesis manager)とを含む。
このシステムの態様の特定の態様では、前記アレル頻度データが核酸配列決定システムによって作成されるデータである。特定の態様では、前記システムはさらに、前記アレル頻度データのエラーを修正するよう構成されたエラー修正部を含み、修正済みアレル頻度データが前記モデラーによって用いられて個別確率を作成する。特定の態様では、前記エラー修正部がアレル増幅効率の偏りを修正する。特定の態様では、前記モデラーが、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて前記個別確率を作成する。特定の例示的な態様では、前記モデラーが前記染色体分節にある多型座位間の連鎖を考慮することによって前記同時確率を作成する。
本明細書において、例示的一態様では、個体の試料の染色体倍数性を検出するためのシステムが提供される。該システムは、
a.該個体の染色体分節にある多型座位の集合に存在するアレルに関する核酸配列データを受け、該核酸配列データを用いて該多型座位の集合におけるアレル頻度を検出するよう構成された入力プロセッサと、
b.検出された該アレル頻度のエラーを修正し、該多型座位の集合に関する修正済みアレル頻度を作成するよう構成されたエラー修正部と、
c.モデラーであって、
i.該核酸配列データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、
ii.該相決定済みアレル情報を該多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、
iii.該個別確率を該染色体分節にある多型座位間の相対的距離を考慮しながら組み合わせることにより、該多型座位の集合に関する同時確率を作成するよう構成されたモデラーと、
d.該同時確率に基づき、染色体異数性を示す最適合モデルを選択するよう構成された仮説管理部とを含む。
ある側面では、本発明は循環腫瘍核酸が個体の試料中に存在するかを決定するための方法を提供する。該方法は、
a.該試料を分析して該個体の染色体分節にある多型座位の集合の倍数性を決定し、
b.該多型座位に存在するアレル不均衡のレベルを該倍数性決定に基づいて決定することを含み、ここで、0.4%、0.45%、または0.5%以上のアレル不均衡率は該試料に循環腫瘍核酸が存在することを示す。
特定の態様では、前記循環腫瘍核酸が存在するかを決定するための方法が、一塩基多様性位置の集合に含まれる一塩基多様性位置の一塩基多様体を検出することをさらに含み、ここで、45%以上のアレル不均衡率の検出および/または一塩基多様体の検出は前記試料に循環腫瘍核酸が存在することを示す。
特定の態様では、前記循環腫瘍核酸が存在するかを決定するための方法の分析工程は、癌で異数性を示すことが知られている染色体分節の集合を分析することを含む。特定の態様では、前記循環腫瘍核酸が存在するかを決定するための方法の分析工程は、倍数性について1,000個から50,000個、または100個から1000個の多型座位を分析することを含む。
本明細書において、ある側面では、試料の一塩基多様体を検出する方法が提供される。したがって、本明細書において個体の試料に含まれるゲノム位置の集合に一塩基多様体が存在するかを決定するための方法が提供される。該方法は、
a.各ゲノム位置に関して、訓練データセットを用いてそのゲノム位置にわたる増幅産物に関する効率およびサイクル当たりのエラー率の推定値を作成し、
b.該試料に含まれる各ゲノム位置に関する観測ヌクレオチド同一性情報を受け、
c.各ゲノム位置に関する増幅効率およびサイクル当たりのエラー率の該推定値を個別に用いて、各ゲノム位置に関する該観測ヌクレオチド同一性情報を異なる多様体率のモデルと比較することにより、各ゲノム位置における1つ以上の実際の変異によって生じる一塩基多様体率の確率のセットを決定し、
d.各ゲノム位置に関する該確率のセットから、最も可能性の高い実多様体率と信頼度を決定することとを含む。
前記一塩基多様体が存在するかを決定するための方法の例示的態様では、効率およびサイクル当たりのエラー率の前記推定値が、前記ゲノム位置にわたる一連の増幅産物に関して作成される。例えば、前記ゲノム位置にわたる2、3、4、5、10、15、20、25、50、100個以上の増幅産物が含まれる可能性がある。特定の態様では、前記1つ以上のSNVを検出する方法における検出限界は0.015%、0.017%、または0.02%である。
前記一塩基多様体が存在するかを決定するための方法の例示的態様では、前記観測ヌクレオチド同一性情報が、各ゲノム位置に関する全リード数の観測値と各ゲノム位置に関する多様性アレルのリード数の観測値を含む。
前記一塩基多様体が存在するかを決定するための方法の例示的態様では、前記試料が血漿試料であり前記一塩基多様体が該試料の循環腫瘍DNAに存在する。
本明細書において、他の態様では、個体の試験試料中に存在する1つ以上の一塩基多様体を検出するための方法が提供される。この態様による方法は、以下の工程を含む。
a.配列決定の実行時に作成された結果に基づき、複数の正常な個体の各々から得た複数の対照試料の多様性アレル頻度の中央値を、一塩基多様性位置の集合に含まれる各一塩基多様性位置について決定することにより、閾値未満である正常試料の多様性アレル頻度の中央値を有する、選定された一塩基多様性位置を確認し、該一塩基多様性位置の各々について異常値試料を除外した後、該一塩基多様性位置の各々に関する背景エラーを決定し、
b.該試験試料に関する配列決定の実行時に作成されたデータに基づき、該試験試料について、選定された該一塩基多様性位置に関して観測リード深度による加重平均と分散を決定し、
c.コンピュータを用いて、リード深度による加重平均が背景エラーに比べて統計的に有意である1つ以上の一塩基多様性位置を確認することによって、該1つ以上の一塩基多様体を検出すること。
特定の態様では、前記1つ以上のSNVを検出する方法において、前記試料が血漿試料であり、前記対照試料が血漿試料であり、検出された前記1つ以上の一塩基多様体が該試料の循環腫瘍DNAに存在する。特定の態様では、前記1つ以上のSNVを検出する方法において、前記複数の対照試料が少なくとも25個の試料を含む。特定の態様では、前記1つ以上のSNVを検出する方法において、高処理配列決定の実行時に作成されたデータから異常値を除外することによって前記観測リード深度による加重平均と観測分散が算出される。特定の態様では、前記1つ以上のSNVを検出する方法において、前記試験試料の各一塩基多様性位置に関する前記リード深度が少なくとも100リードである。
特定の態様では、前記1つ以上のSNVを検出する方法において、前記配列決定の実行が、制限的なプライマー反応条件で実行される多重増幅反応を含む。特定の態様では、前記1つ以上のSNVを検出する方法において、前記検出限界が0.015%、0.017%、または0.02%である。
一側面において、本発明は、ある個体に由来する1個以上の細胞のゲノム中の第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定する方法を特徴とする。いくつかの態様では、前記方法は、前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第一の相同染色体分節にあるその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、前記多型座位の集合のうちの各座位に存在する各アレルについて、前記個体に由来する1個以上の細胞に由来するDNAまたはRNAの試料に存在する各アレルの量を含む、測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記個体に由来する1個以上の細胞のゲノムにおける前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙し、得られた前記試料の遺伝子データおよび相決定済み遺伝子データに基づいて前記1つ以上の仮説の尤度を(コンピュータ等で)算出し、最も可能性が高い仮説を選択して、前記個体に由来する1個以上の細胞のゲノムにおける第一の相同染色体分節のコピー数の過剰出現度を決定することを含む。いくつかの態様では、前記相決定済みデータは、集団に基づくハプロタイプ頻度および/または測定された相決定済みデータ(例えば、前記個体または前記個体の血縁者に由来するDNAまたはRNAを含む試料を測定することによって得られた相決定済みデータ)を用いて推論された相決定済みデータを含む。
一側面において、本発明は、ある個体に由来する1個以上の細胞のゲノム中の第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定する方法を提供する。いくつかの態様では、前記方法は、前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに第一の相同染色体分節についてその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるにその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、前記多型座位の集合のうちの各座位に存在する各アレルについて、前記個体に由来する1個以上の細胞に由来するDNAまたはRNAの試料に存在する各アレルの量を含む、測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙し、前記仮説のそれぞれについて得られた相決定済み遺伝子データから前記試料の複数の座位について期待遺伝子データを算出し、前記試料について得られた該試料の遺伝子データと期待遺伝子データとのデータ適合を(コンピュータ等で)算出し、前記データ適合に応じて前記仮説の1つ以上をランク付けし、最高ランクの仮説を選択して、前記個体に由来する1個以上の細胞のゲノム中の前記第一の相同染色体分節のコピー数の過剰出現度を決定することを含む。
一側面において、本発明は、ある個体の1個以上の細胞のゲノム中の第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定する方法を特徴とする。いくつかの態様では、前記方法は、前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに第一の相同染色体分節についてその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、前記多型座位の集合のうちの各座位に存在する各アレルについて前記個体に由来する1個以上の目的細胞および1個以上の目的でない細胞に由来するDNAまたはRNAの試料に存在する各アレルの量を含む、測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙し、前記仮説のそれぞれについて、得られた相決定済み遺伝子データから、前記1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する1つ以上の可能な比率について前記試料中の前記複数の座位に関する期待遺伝子データを(コンピュータ等で)算出し、DNAまたはRNAの可能な比率および仮説ごとに、前記試料の得られた遺伝子データと前記試料の期待遺伝子データとのデータ適合を(コンピュータ等で)算出し、前記データ適合に応じて前記仮説の1つ以上をランク付けし、最高ランクの仮説を選択して、前記個体に由来する1個以上の細胞のゲノムの第一の相同染色体分節のコピー数の過剰出現度を決定することを含む。
一側面において、本発明は、ある個体に由来する1個以上の細胞のゲノム中の第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定する方法を特徴とする。いくつかの態様では、前記方法は、前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに第一の相同染色体分節についてその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、前記多型座位の集合のうちの各座位に存在する各アレルについて、前記個体に由来する1個以上の目的細胞および1個以上の目的でない細胞に由来するDNAまたはRNAの試料に存在する各アレルの量を含む、測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙し、前記仮説のそれぞれについて、得られた相決定済み遺伝子データから、前記1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する1つ以上の可能な比率について前記試料中の前記複数の座位に関する期待遺伝子データを(コンピュータ等で)算出し、前記複数の座位の各座位、DNAまたはRNAの可能な比率および仮説ごとに、その仮説が正しい尤度を、その座位について得られた前記試料の遺伝子データと、そのDNAまたはRNAの可能な比率およびその仮説でのその座位の期待遺伝子データとの比較を(コンピュータ等で)算出し、各座位および可能な比率ごとに仮説の各座位の確率を組み合わせることによって各仮説の複合確率を決定し、最も高い複合確率を有する仮説を選択して、前記第一の相同染色体分節のコピー数の過剰出現度を決定することを含む。いくつかの態様では、すべての多型座位が同時に考慮されて特定の仮説の確率が算出され、最も高い確率を有する仮説が選択される。
一側面において、本発明は、胎児のゲノム中の目的の染色体分節のコピー数を決定するための方法を特徴とする。いくつかの態様では、前記方法は、前記胎児の少なくとも一方の生物学上の親の相決定済み遺伝子データを得ることを含み、ここで、前記相決定済み遺伝子データは、前記目的の染色体分節を含む相同染色体分節対中に、第一の相同染色体分節および第二の相同染色体分節にある多型座位の集合のうちの各座位に存在するアレルの同一性を含む。いくつかの態様では、前記方法は、胎児のDNAまたはRNAおよびその胎児の母親に由来する母親のDNAまたはRNAを含むDNAまたはRNA混合試料中の、各座位に存在する各アレルの量を測定することにより目的の染色体分節にある多型座位の集合の遺伝子データを得ることを含む。いくつかの態様では、前記方法は、胎児のゲノムに存在する目的の染色体分節のコピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、一方または両方の親について、胎児のゲノム中のその親に由来する第一の相同染色体分節またはその部分のコピー数と、胎児のゲノム中のその親に由来する第二の相同染色体分節またはその部分のコピー数と、その胎児のゲノムに存在する目的の染色体分節の総コピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、前記仮説のそれぞれについて、得られた前記(両)親由来の相決定済み遺伝子データから前記混合試料中の複数の座位の期待遺伝子データを(コンピュータ等で)算出し、得られた混合試料の遺伝子データとその混合試料の期待遺伝子データとのデータ適合を(コンピュータで等で)算出し、前記データ適合により前記仮説の1つ以上をランク付けし、最高ランクの仮説を選択して、胎児のゲノムにおける目的の染色体分節のコピー数を決定することとを含む。
一側面において、本発明は、胎児のゲノム中の目的の染色体または染色体分節のコピー数を決定するための方法を特徴とする。いくつかの態様では、前記方法は、前記胎児の生物学上の少なくとも一方の親について相決定済み遺伝子データを得ることを含み、ここで前記相決定済み遺伝子データは、前記親の第一の相同染色体分節および第二の相同染色体分節にある多型座位の集合のうちの各座位に存在するアレルの同一性を含む。いくつかの態様では、前記方法は、胎児のDNAまたはRNAおよび前記胎児の母親由来の母親DNAまたはRNAを含むDNAまたはRNA混合試料において、各座位に存在する各アレルの量を測定することにより染色体または染色体分節にある多型座位の集合の遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記胎児のゲノムに存在する目的の染色体または染色体分節のコピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、前記仮説のそれぞれについて、(i)得られた前記(両)親由来の相決定済み遺伝子データと任意で(ii)前記胎児に目的の染色体または染色体分節のコピーをもたらした配偶子形成時に発生した可能性がある1つ以上の交差の確率から混合試料中の前記複数の座位の各座位に存在する各アレルの期待量の確率分布を(例えば、コンピュータ上で作成する等)作成し、前記仮説のそれぞれについて、(1)前記得られた混合試料の遺伝子データと(2)その仮説に対する混合試料中の複数の座位の各座位における各アレルの期待量の確率分布との適合を(コンピュータ等で)算出し、前記データ適合によって前記仮説の1つ以上をランク付けし、最高ランクの仮説を選択して、前記胎児のゲノムにおける目的の染色体分節のコピー数を決定することとを含む。
いくつかの態様では、前記方法は、前記胎児の母親の相決定済み遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記胎児のゲノム中の母親由来の第一の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の母親由来の第二の相同染色体分節またはその部分のコピー数と、前記胎児のゲノムに存在する目的の染色体分節の総コピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、前記仮説のそれぞれについて、得られた母親由来の相決定済み遺伝子データから前記混合試料中の複数の座位について期待遺伝子データを算出することを含む。
いくつかの態様では、前記仮説のそれぞれについての期待遺伝子データは、前記混合試料中の母親のDNAまたはRNAおよび胎児のDNAまたはRNAの複数の座位の各座位に存在する1つ以上のアレルの同一性および量を含む。いくつかの態様では、前記方法は、前記混合試料中の胎児のDNAまたはRNA分画および母親のDNAまたはRNA分画を決定することによって期待遺伝子データを(コンピュータ等で)算出することを含む。いくつかの態様では、前記方法は、複数の座位の各座位について、得られた母親の相決定済み遺伝子データ中のその座位に存在するアレルの同一性および前記混合試料中の母親のDNAまたはRNA分画を用いて、前記混合試料中の母親のDNAまたはRNAのその座位に対する1つ以上のアレルの期待量を算出することを含む。いくつかの態様では、前記方法は、仮説ごとに前記複数の座位の各座位について、前記胎児によって受け継がれたと前記仮説によって規定された母親由来の第一または第二の相同染色体分節のその座位に存在するアレルの同一性と、前記胎児によって受け継がれたと前記仮説により規定された母親由来の第一または第二の相同染色体分節のコピー数と、前記混合試料中の胎児のDNAまたはRNAの分画を用いて、前記混合試料中の母親から譲り受けた胎児のDNAまたはRNAにおけるその座位に対する1つ以上のアレルの期待量を(コンピュータ等で)算出することを含む。
いくつかの態様では、前記仮説のそれぞれについての期待遺伝子データは、前記混合試料中の母親のDNAまたはRNAおよび胎児のDNAまたはRNAの複数の座位の各座位に存在する1つ以上のアレルの同一性および量を含む。いくつかの態様では、前記方法は、前記混合試料の胎児のDNAまたはRNAの分画および母親のDNAまたはRNAの分画を決定することによって期待遺伝子データを算出することを含む。いくつかの態様では、前記方法は、前記複数の座位の各座位について、得られた母親の相決定済み遺伝子データ中のその座位に存在するアレルの同一性および前記混合試料中の母親のDNAまたはRNA分画を用いて、前記混合試料中の母親のDNAまたはRNAのその座位に対する1つ以上のアレルの期待量を(コンピュータ等で)算出することを含む。いくつかの態様では、前記方法は、仮説ごとに前記複数の座位のうちの各座位について、前記胎児によって受け継がれたと仮説によって規定された母親由来の第一または第二の相同染色体分節に存在するアレルの同一性と、前記胎児によって受け継がれたと仮説によって規定された母親由来の第一または第二の相同染色体分節のコピー数と、前記胎児によって受け継がれたと仮説によって規定された父親由来の第一または第二の相同染色体分節におけるその座位に存在し得る1つ以上のアレルの同一性と、前記胎児によって受け継がれたと仮説によって規定された父親由来の第一または第二の相同染色体分節のコピー数と、前記混合試料中の胎児のDNAまたはRNAの分画を用いて、前記混合試料中の母親から譲り受けた胎児のDNAまたはRNAにおけるその座位に対する1つ以上のアレルの期待量(コンピュータ等で)算出することを含む。いくつかの態様では、集団頻度を用いて父親由来の第一または第二の相同染色体分節のアレルの同一性を予測する。いくつかの態様では、前記父親由来の第一または第二の相同染色体分節の各座位に存在し得るアレルのそれぞれについてその確率が同じであると見なす。
いくつかの態様では、前記方法は、前記胎児の母親および父親の両方の相決定済み遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記胎児のゲノム中の母親由来の第一の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の母親由来の第二の相同染色体分節のコピー数と、前記胎児のゲノム中の父親由来の第一の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の父親由来の第二の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中に存在する目的の染色体分節の総コピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、前記仮説のそれぞれについて、得られた母親由来の相決定済み遺伝子データおよび父親由来の相決定済み遺伝子データから前記混合試料中の複数の座位の期待遺伝子データを(コンピュータ等で)算出することを含む。
いくつかの態様では、前記仮説のそれぞれについて、前記期待遺伝子データは、前記混合試料中の前記母親のDNAまたはRNAおよび胎児のDNAまたはRNAの複数の座位において各座位に存在する1つ以上のアレルの同一性と量を含む。いくつかの態様では、前記方法は、前記混合試料のDNAまたはRNAの分画と胎児の母親のDNAまたはRNAの分画を決定することによって期待遺伝子データを算出することを含む。いくつかの態様では、前記方法は、前記複数の座位の各座位について、得られた母親の相決定済み遺伝子データ中のその座位に存在するアレルの同一性および前記混合試料中の母親のDNAまたはRNA分画を用いて、前記混合試料中の母親のDNAまたはRNAのその座位に対する1つ以上のアレルの期待量を(コンピュータ等で)算出することを含む。いくつかの態様では、前記方法は、仮説ごとに前記複数の座位の各座位について、前記胎児によって受け継がれたと仮説によって規定された母親由来の第一または第二の相同染色体分節のアレルの同一性と、前記胎児によって受け継がれたと仮説によって規定された母親由来の第一または第二の相同染色体分節のコピー数と、前記胎児によって受け継がれたと仮説によって規定された父親由来の第一または第二の相同染色体分節のその座位に存在するアレルの同一性と、前記胎児によって受け継がれたと仮説によって規定された父親由来の第一または第二の相同染色体分節のコピー数と、前記混合試料中の胎児のDNAまたはRNAの分画を用いて前記混合試料中の胎児のDNAまたはRNAの座位について1つ以上のアレルの期待量を(コンピュータ等で)算出することを含む。
いくつかの態様では、前記方法は、前記仮説のそれぞれについて、得られた前記(両)親由来の相決定済み遺伝子データから前記混合試料中の前記複数の座位の期待遺伝子データの確率分布を(コンピュータ等で)算出することを含む。いくつかの態様では、前記方法は、前記混合試料の第一の座位に存在する特定のアレルが前記親の第一の相同分節に存在し、かつ前記親の第一の相同分節の近隣した座位に存在するアレルが前記混合試料の得られた遺伝子データに観察される場合にその特定のアレルの確率分布における確率を増加させること、あるいは前記混合試料の第一の座位に存在する特定のアレルが前記親の第一の相同分節に存在し、かつ前記親の第一の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データにおいて観察されない場合にその特定のアレルの確率分布の確率を低減させることを含む。いくつかの態様では、前記方法は、前記混合試料の第二の座位に存在する特定のアレルが前記親の第二の相同分節に存在し、かつ前記親の第二の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察される場合にその特定のアレルの確率分布の確率を増加させること、あるいは前記混合試料の第二の座位に存在する特定のアレルが前記親の第二の相同分節に存在し、かつ前記親の第二の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察されない場合にその特定のアレルの確率分布の確率を低減させることを含む。
いくつかの態様では、前記方法は、前記胎児の母親および父親両方の相決定済み遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記胎児のゲノム中の前記母親由来の第一の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の前記母親由来の第二の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の前記父親由来の第一の相同染色体分節またはその部分のコピー数と、前記胎児のゲノム中の前記父親由来の第二の相同染色体分節またはその部分のコピー数と、前記胎児のゲノムに存在する目的の染色体分節の総コピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、前記仮説のそれぞれについて、前記母親および父親から得られた相決定済み遺伝子データから前記混合試料の複数の座位の期待遺伝子データの確率分布を(コンピュータ等で)算出することを含む。いくつかの態様では、前記方法は、前記混合試料の第一の座位に存在する特定のアレルが前記母親または父親の第一の相同分節に存在し、かつその親の第一の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察される場合にその特定のアレルの確率分布の確率を増加させること、あるいは前記混合試料の第一の座位に存在する特定のアレルが前記母親または父親の第一の相同分節に存在し、かつその親の第一の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察されない場合にはその特定のアレルの確率分布の確率を低減させることを含む。いくつかの態様では、前記方法は、前記混合試料の第二の座位に存在する特定のアレルが前記母親または父親の第二の相同分節に存在し、かつその親の第二の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察される場合にその特定のアレルの確率分布の確率を増加させること、あるいは前記混合試料の第二の座位に存在する特定のアレルが前記母親または父親の第二の相同分節に存在し、かつその親の第二の相同分節の近隣した座位に存在するアレルが前記得られた混合試料の遺伝子データに観察されない場合にその特定のアレルの確率分布の確率を低減させることを含む。
いくつかの態様では、前記第一の座位と第一の座位に近接した座位が共分離している。いくつかの態様では、前記第二の座位と第二の座位に近接した座位が共分離している。いくつかの態様では、前記第一の座位と第一の座位に近接した座位との間では、交差は起こらないと予測される。いくつかの態様では、前記第二の座位と第二の座位に近接した座位との間では、交差は起こらないと予測される。いくつかの態様では、前記第一の座位と第一の座位に近接した座位との距離は、5mb未満、1mb未満、100kb未満、10kb未満、1kb未満、0.1kb未満、または0.01kb未満である。いくつかの態様では、前記第二の座位と第二の座位に近接した座位との距離は、5mb未満、1mb未満、100kb未満、10kb未満、1kb未満、0.1kb未満、または0.01kb未満である。
いくつかの態様では、目的の染色体分節のコピーを前記胎児にもたらす配偶子の形成時に1つ以上の交差が起こり、その交差によって前記親由来の第一の相同分節の部分および第二の相同分節の部分を含む前記胎児のゲノム中の目的の染色体分節が生じる。いくつかの態様では、前記仮説の集合は、前記親に由来する第一の相同分節の部分および第二の相同分節の部分を含む前記胎児のゲノム中の目的の染色体分節のコピー数を規定する1つ以上の仮説を含む。
いくつかの態様では、前記混合試料の期待遺伝子データは、前記仮説のそれぞれについて、前記混合試料の複数の座位の各座位に存在する1つ以上のアレルの期待量を含む。
一側面において、本発明は、ある個体のゲノム(例えば、1個以上の細胞、無細胞DNA、無細胞RNA、癌が疑われる個体、胎児、または胚のゲノム)において第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを、相決定済み遺伝子データを用いて決定する方法を特徴とする。いくつかの態様では、前記方法は、同時にまたは任意の順序で順に(i)前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに第一の相同染色体分節についてその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、(ii)前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、(iii)前記個体に由来する1個以上の細胞に由来するDNAまたはRNAの試料または前記個体の遺伝的に異なる2個以上の細胞に由来する無細胞DNAまたはRNAの混合試料中の、前記多型座位の集合のうちの各座位に存在する各アレルの量を含む測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記試料が由来する少なくとも1個の細胞においてヘテロ接合である前記多型座位の集合の1箇所以上の座位についてアレル比率を算出することを含む。いくつかの態様では、特定の座位の算出済みアレル比率は、前記アレルの1つの測定量をその座位のすべてのアレルの総測定量で除したものである。いくつかの態様では、前記方法は、ある座位の1つ以上の算出済みアレル比率を期待アレル比率(例えば、第一および第二の相同染色体分節が等しい割合で存在する場合にその座位に期待される比率)と比較することで第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定することを含む。いくつかの態様では、期待比率は2アレル座位について0.5である。
出生前検査に関するいくつかの態様では、前記方法は、同時にまたは任意の順序で順に(i)胎児(例えば、妊娠している母親の胎内の胎児)のゲノムの第一の相同染色体分節について、前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第一の相同染色体分節にある各座位に存在するアレルの同一性を含む相決定済み遺伝子データを得ることと、(ii)前記胎児のゲノムの第二の相同染色体分節について、前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にある各座位に存在するアレルの同一性を含む相決定済み遺伝子データを得ることと、(iii)胎児のDNAまたはRNAおよび母親のDNAまたはRNAを含む前記胎児の母親由来のDNAまたはRNAの混合試料(例えば、母親由来の血液試料に由来する、胎児の無細胞DNAまたはRNAと母親の無細胞DNAまたはRNAを含む無細胞DNAまたはRNAの混合試料)において、前記多型座位の集合の各座位に存在する各アレルの量を含む測定されたアレルの遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記胎児においてヘテロ接合であり、かつ/または前記母親においてヘテロ接合である多型座位の集合の1箇所以上の座位についてアレル比率を算出することを含む。いくつかの態様では、特定の座位の算出済みアレル比率は、前記アレルの1つの測定量を前記座位のすべてのアレルの総測定量で除したものである。いくつかの態様では、前記方法は、ある座位の1つ以上の算出済みアレル比率を期待アレル比率(例えば、第一および第二の相同染色体分節が等しい割合で存在する場合にその座位に期待される比率)と比較することで前記第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定することを含む。
いくつかの態様では、(i)ある座位のすべてのアレルの総測定量で除した、前記第一の相同染色体にあるその座位に存在するアレルの測定量のアレル比率が、その座位の期待アレル比率より大きい場合、または(ii)ある座位のすべてのアレルの総測定量で除した、前記第二の相同染色体にあるその座位に存在するアレルの測定量のアレル比率がその座位の期待アレル比率より小さい場合のいずれかであれば、算出済みアレル比率は前記第一の相同染色体分節のコピー数過剰出現を示す。いくつかの態様では、(i)ある座位のすべてのアレルの総測定量で除した、前記第一の相同染色体にあるその座位に存在するアレルの測定量のアレル比率がその座位の期待アレル比率以下である場合、または(ii)ある座位のすべてのアレルの総測定量で除した、前記第二の相同染色体にあるその座位に存在するアレルの測定量のアレル比率がその座位の期待アレル比率以上である場合のいずれかであれば、算出済みアレル比率は前記第一の相同染色体分節のコピー数過剰出現でないことを示す。
いくつかの態様では、前記第一の相同染色体分節のコピー数の過剰出現があるかどうかの決定が、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)の予測アレル比率は、仮説ごとにその仮説によって過剰出現度が規定されたと仮定して推定される。いくつかの態様では、前記算出済みアレル比率と予測アレル比率を比較することで、仮説が正しい尤度が算出され、最も可能性が高い仮説が選択される。いくつかの態様では、仮説ごとに予測アレル比率を用いて検定統計量の期待分布が算出される。いくつかの態様では、前記算出済みアレル比率を用いて算出された検定統計量を、前記予測アレル比率を用いて算出された検定統計量の期待分布と比較することで、仮説が正しい尤度が算出され、最も可能性が高い仮説が選択される。いくつかの態様では、少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)の予測アレル比率に、前記第一の相同染色体分節の相決定済み遺伝子データ、前記第二の相同染色体分節の相決定済み遺伝子データ、および過剰出現度がその仮説によって規定されたと仮定して推定される。いくつかの態様では、前記算出済みアレル比率を前記予測アレル比率と比較することで、仮説が正しい尤度が算出され、最も可能性が高い仮説が選択される。
いくつかの態様では、1個以上の目的細胞に由来するDNA(またはRNA)の前記試料中の総DNA(またはRNA)に対する比率が算出される。典型的な比率は、胎児のDNA(またはRNA)の前記試料中の総DNA(またはRNA)に対する比率である。いくつかの態様では、胎児のDNAの前記試料中の総DNAに対する比率は、前記胎児がアレルを有するがその母親はアレルを有していない1箇所以上の座位でアレルの量を測定することにより求められる。いくつかの態様では、胎児のDNAの前記試料中の総DNAに対する比率は、1つ以上の母親のアレルと胎児のアレルのメチル化の違いを測定することで求められる。いくつかの態様では、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合が列挙される。いくつかの態様では、少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)の予測アレル比率は、DNAまたはRNAの算出済み比率を仮定して推定され、その仮説によって規定された過剰出現度が仮説ごとに推定される。いくつかの態様では、前記算出済みアレル比率を前記予測アレル比率と比較することで、仮説が正しい尤度が算出され、最も可能性が高い仮説が選択される。いくつかの態様では、前記予測アレル比率およびDNAまたはRNAの算出済み比率を用いて算出された検定統計量の期待分布は、仮説ごとに推定される。いくつかの態様では、前記算出済みアレル比率とDNAまたはRNAの算出済み比率を用いて算出された検定統計量を、前記予測アレル比率とDNAまたはRNAの算出済み比率を用いて算出された検定統計量の期待分布と比較することで、仮説が正しい尤度が求められ、最も可能性が高い仮説が選択される。
いくつかの態様では、前記方法は、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、仮説ごとに、(i)過剰出現度がその仮説によって規定されたと仮定して少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)の予測アレル比率、または(ii)DNAまたはRNAの1つ以上の起こりうる比率(例えば、胎児のDNAまたはRNAの前記試料中の総DNAまたはRNAに対する比率)について、前記予測アレル比率および前記試料中の総DNAまたはRNAに対する1個以上の目的細胞(例えば、胎児の細胞)に由来するDNAまたはRNAの起こりうる比率を用いて算出された検定統計量の期待分布のいずれかを推定することを含む。いくつかの態様では、(i)前記予測アレル比率に対する算出済みアレル比率または(ii)前記算出済みアレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量のいずれかと、前記予測アレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量の期待分布とを比較することでデータ適合が算出される。いくつかの態様では、前記データ適合によって1つ以上の仮説がランク付けされ、最高ランクの仮説が選択される。いくつかの態様では、前記データ適合を算出する工程、前記仮説をランク付けする工程、最高ランクの仮説を選択する工程の1つ以上において技術またはアルゴリズム(例えば、検索アルゴリズム等)が用いられる。いくつかの態様では、前記データ適合は、ベータ二項分布に対する適合または二項分布への適合である。いくつかの態様では、前記技術またはアルゴリズムは、最尤推定、最大事後確率推定、ベイズ推定、動的推定(例えば、動的ベイズ推定等)、および期待値最大化推定からなる群から選択される。いくつかの態様では、前記方法は、前記技術またはアルゴリズムを前記得られた遺伝子データおよび前記期待遺伝子データに適用することを含む。
いくつかの態様では、前記方法は、1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する比率について下限から上限までの範囲の起こりうる比率(例えば、胎児のDNAまたはRNAの前記試料中の総DNAまたはRNAに対する比率)の区分を作成することを含む。いくつかの態様では、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合が列挙される。いくつかの態様では、前記方法は、前記区分におけるDNAまたはRNAの起こりうる比率の各比率と各仮説について、(i)前記DNAまたはRNAの起こりうる比率およびその仮説によって規定された過剰出現度が与えられた場合は少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)の予測アレル比率、または(ii)前記予測アレル比率と前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量の期待分布のいずれかを推定することを含む。いくつかの態様では、前記方法は、(i)前記予測アレル比率に対する算出済みアレル比率または(ii)前記算出済みアレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量のいずれかと、前記予測アレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量の期待分布とを比較することで前記区分における前記DNAまたはRNAの起こりうる比率の各比率と各仮説について、前記仮説が正しい尤度を算出することを含む。いくつかの態様では、前記区分において前記起こりうる比率の比率ごとにその仮説の確率を組み合わせることによって各仮説の複合確率が決定され、最も高い複合確率を有する仮説が選択される。いくつかの態様では、各仮説の複合確率は、前記起こりうる比率が正しい比率であるという尤度に基づいて特定の起こりうる比率について仮説の確率を加重平均することで各仮説が決定される。
一側面において、本発明は、相決定済み遺伝子データまたは相未決定(unphased)遺伝子データを用いてある個体由来の1個以上の細胞のゲノムの染色体または染色体分節のコピー数を決定するための方法を特徴とする。いくつかの態様では、前記方法は、各座位に存在する各アレルの量を測定することで試料中の前記染色体または染色体分節にある多型座位の集合の遺伝子データを得ることを含む。いくつかの態様では、前記試料は、前記個体に由来する1個以上の細胞に由来するDNAまたはRNAの試料、または2個以上の遺伝的に異なる細胞に由来する無細胞DNAを含む、前記個体由来の無細胞DNAの混合試料である。いくつかの態様では、前記試料が由来している少なくとも1個の細胞中のヘテロ接合である座位についてアレル比率が算出される。いくつかの態様では、特定の座位の算出済みアレル比率は、そのアレルの1つの測定量を、前記座位のすべてのアレルの総測定量で除したものである。いくつかの態様では、特定の座位の算出済みアレル比率は、アレル(例えば、第一の相同染色体分節のアレル)の1つの測定量を、その座位の1つ以上の他のアレル(例えば、第二の相同染色体分節のアレル)の測定量で除したものである。いくつかの態様では、前記細胞の1つ以上のゲノムの染色体または染色体分節のコピー数を規定する1つ以上の仮説の集合が列挙される。いくつかの態様では、前記検定統計量に基づいて最も可能性が高い仮説が選択され、これにより前記細胞の1つ以上のゲノムの染色体または染色体分節のコピー数が決定される。
一側面において、本発明は、相決定済みまたは相未決定遺伝子データを用いて胎児(例えば、妊娠している母親の胎内の胎児)のゲノムの染色体または染色体分節のコピー数を決定する方法を特徴とする。いくつかの態様では、前記方法は、各座位に存在する各アレルの量を測定することで試料中の前記染色体または染色体分節にある多型座位の集合の遺伝子データを得ることに関する。いくつかの態様では、前記試料は、胎児のDNAまたはRNAおよびその胎児の母親に由来する母親のDNAまたはRNA(例えば、母親由来の血液試料に由来する、胎児の無細胞DNAまたはRNAおよび母親の無細胞DNAまたはRNAを含む無細胞DNAまたはRNAの混合試料)を含むDNAの混合試料である。いくつかの態様では、前記胎児のヘテロ接合である座位および/または前記母親のヘテロ接合である座位についてアレル比率が算出される。いくつかの態様では、特定の座位の算出済みアレル比率は、前記アレルの1つの測定量を、その座位のすべてのアレルの総測定量で除したものである。いくつかの態様では、特定の座位の算出済みアレル比率が前記アレル(例えば、前記第一の相同染色体分節にあるアレル等)の1つの測定量を、その座位の1つ以上の他のアレル(例えば、第二の相同染色体分節にあるアレル等)の測定量で除したものである。いくつかの態様では、胎児のゲノムの染色体または染色体分節のコピー数を規定する1つ以上の仮説の集合が列挙される。いくつかの態様では、前記検定統計量に基づいて最も可能性が高い仮説が選択され、これによって前記胎児のゲノムの染色体または染色体分節のコピー数が決定される。
いくつかの態様では、前記検定統計量がある仮説の検定統計量分布に属する確率が上限閾値を超える場合にその仮説が選択され、前記検定統計量が1つ以上の仮説の検定統計量分布に属する確率が下限閾値未満である場合にそれら1つ以上の仮説が棄却される。あるいは、前記検定統計量ある仮説の検定統計量分布に属する確率が下限閾値と上限閾値の間である場合、またはその確率が十分に高い信頼度を持って決定されない場合には、その仮説は選択も棄却もされない。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現は、前記第一の相同染色体分節の重複または前記第二の相同染色体分節の欠失によるものである。いくつかの態様では、1箇所以上の座位についてすべてのアレルの総測定量が、基準量と比較されて、前記第一の相同染色体分節のコピー数過剰出現が前記第一の相同染色体分節の重複または前記第二の相同染色体分節の欠失によるものであるかどうかが決定される。いくつかの態様では、1箇所以上の座位について前記算出済みアレル比率と前記期待アレル比率との差異の大きさを用いて前記第一の相同染色体分節のコピー数過剰出現が前記第一の相同染色体分節の重複または前記第二の相同染色体分節の欠失によるものかどうかが決定される。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現がなく、かつ(例えば、細胞、無細胞DNA、無細胞RNA、個体、胎児、または胚のゲノム中の)第二の相同染色体分節の過剰出現がない場合に前記第一および第二の相同染色体分節が等しい割合で存在すると決定される。
いくつかの態様では、対象細胞の遺伝型が非対象細胞の遺伝型と異なっており、かつ対象細胞および非対象細胞が二染色体であると予測される1箇所以上の座位に存在する1つ以上のアレルの総量または相対量に基づき、1個以上の目的細胞に由来するDNAの前記試料中の総DNAに対する比率が決定される。いくつかの態様では、この比率を用いて、前記第一の相同染色体分節のコピー数過剰出現が前記第一の相同染色体分節の重複または前記第二の相同染色体分節の欠失によるものかどうかが決定される。いくつかの態様では、この比率を用いて、重複している染色体分節または染色体の余剰コピー数が決定される。いくつかの態様では、前記相決定済み遺伝子データは確率データを含む。いくつかの態様では、前記胎児のゲノム中の第一の相同染色体分節および/または第二の相同染色体分節の相決定済み遺伝子データを得ることは、前記胎児の生物学上の親の一方または両方のゲノム中の第一の相同染色体分節および/または第二の相同染色体分節の相決定済み遺伝子データを得ることと、前記胎児がどの相同染色体分節をその生物学上の親のどちらから受け継いでいるかを推論することを含む。いくつかの態様では、胎児個体に前記第一の相同染色体分節または第二の相同染色体分節のコピーをもたらした配偶子の形成時に発生した可能性がある1つ以上の交差(例えば1つ、2つ、3つ、または4つの交差)の確率を用いて、前記胎児がどの相同染色体分節を生物学上の親のどちらから受け継いでいるかが推論される。いくつかの態様では、デジタルPCR、集団に基づくハプロタイプ頻度を用いたハプロタイプの推論、半数体細胞(例えば、精子または卵子)を用いたハプロタイプ決定、1つ以上の第一度親近に由来する遺伝子データを用いたハプロタイプ決定、およびこれらの組み合わせからなる群から選択される技術を用いて胎児の母親および/または父親の相決定済み遺伝子データが得られる。いくつかの態様では、前記個体に由来する試料中の欠失または重複に対応する領域の一部またはすべてについて相決定することで前記個体の相決定済み遺伝子データが得られる。いくつかの態様では、胎児または胎児の母親に由来する試料中の欠失または重複に対応する領域の一部またはすべてについて相決定することで胎児の相決定済み遺伝子データが得られる。いくつかの態様では、前記第一および第二の相同染色体分節の相決定済み遺伝子データを得ることは、これら染色体分節の一方に存在するアレルの同一性と、他方の染色体分節に存在するアレルの同一性を推論によって求めることを含む。いくつかの態様では、相未決定遺伝子データに由来する、第一の相同染色体分節に存在しないアレルは、第二の相同染色体分節に割り当てられる。例えば、ある個体の遺伝型が(AB,AB)であり、その個体の相決定済みデータが第一のハプロタイプが(A,A)であることを示している場合、もう一方のハプロタイプは(B,B)であると推論することができる。いくつかの態様では、ある座位でアレルが1つのみ測定されると、そのアレルは第一および第二の相同染色体分節の両方の一部であると決定される(例えば、ある座位で遺伝型がAAである場合、両方のハプロタイプはアレルAを有する)。いくつかの態様では、前記個体の相決定済み遺伝子データは、例えば、組換えの起こりやすい箇所の配列と、任意で組換えの起こりやすい箇所に隣接する領域の配列を決定することで1つ以上の起こり得る染色体交差が起こったどうかの決定を含む。いくつかの態様では、本発明のプライマーライブラリーのいずれかを用いて組換え事象を検出して、ある個体のゲノムにどのハプロタイプブロックが存在するかが決定される。
いくつかの態様では、前記方法は、同時分布モデル(例えば、座位間の連鎖を考慮した同時分布モデル等)を用いること、連鎖分析を行うこと、二項分布モデルを用いること、ベータ二項分布モデルを用いること、および/または胎児になった胚を形成した配偶子を発生させた減数分裂時に起こった交差の尤度を用いること(例えば、染色体の異なる位置で染色体が交差する確率を用いて目的の染色体または染色体分節にある多型アレル間の依存度をモデル化すること等)を含む。
いくつかの態様では、無細胞DNAまたは無細胞RNAに関する1つ以上の算出済みアレル比率は、その無細胞DNAまたは無細胞RNAが由来している細胞における対応するDNAまたはRNAのアレル比率を示している。いくつかの態様では、無細胞DNAまたは無細胞RNAに関する1つ以上の算出済みアレル比率は、前記個体のゲノムにおける対応するアレル比率を示している。いくつかの態様では、測定された遺伝子データが2つ以上の異なるアレルが前記試料中(例えば、無細胞DNAまたは無細胞RNA試料中)のその座位に存在することを示している場合には、アレル比率が算出されるのみ、あるいは期待アレル比率と比較されるのみである。いくつかの態様では、前記座位が、前記試料が由来している細胞の少なくとも1個においてヘテロ接合である(例えば、胎児においてヘテロ接合である座位および/またはその母親においてヘテロ接合である座位等)場合には、アレル比率が算出されるのみ、あるいは期待アレル比率と比較されるのみである。いくつかの態様では、前記座位が胎児においてヘテロ接合である場合には、アレル比率が算出されるのみ、あるいは期待アレル比率と比較されるのみである。いくつかの態様では、アレル比率が算出されて、ホモ接合座位の期待アレル比率と比較される。例えば、検査される特定の個体(または胎児および妊娠している母親の両方)についてホモ接合が予測される座位のアレル比率を分析して、システムのノイズまたはエラーの量を決定してもよい。
いくつかの態様では、目的の染色体または染色体分節について少なくとも10個、50個、100個、200個、300個、500個、750個、1,000個、2,000個、3,000個、4,000個以上の(例えばSNP)座位が分析される。いくつかの態様では、目的の染色体または染色体分節のメガ塩基対(mb)当たりの(例えばSNP)座位の平均数は、メガ塩基対あたり少なくとも1個、10個、25個、50個、100個、150個、200個、300個、500個、750個、1,000個以上である。いくつかの態様では、目的の染色体または染色体分節のメガ塩基対当たりの座位(例えばSNP)の平均数は、メガ塩基対当たり1個と500個の間(例えば、メガ塩基対当たり1個と50個の間、50個と100個の間、100個と200個の間、200個と400個の間、200個と300個の間、または300個と400個、各両端の数値を含む)である。いくつかの態様では、起こり得る欠失または重複の複数の部分の座位が分析されて、1座位のみの分析や隣接するいくつかの座位のみの分析に比べてCNV決定の感度および/または特異性が高められる。いくつかの態様では、各座位に存在する最も共通する2つのアレルのみが測定される、あるいはこれらアレルのみが用いられて算出済みアレル比率が決定される。いくつかの態様では、5’→3’エキソヌクレアーゼ活性および/または低鎖置換活性を有するポリメラーゼ(例えば、DNAポリメラーゼ、RNAポリメラーゼ、または逆転写酵素等)を用いて座位の増幅が行われる。いくつかの態様では、(i)前記試料中のDNAまたはRNAの配列決定を行うこと、(ii)前記試料中のDNAまたはRNAを増幅して、増幅されたDNAを配列決定すること、または(iii)前記試料中のDNAまたはRNAを増幅して、PCR生成物をライゲートして、ライゲートした生成物を配列決定することで前記測定されたアレルの遺伝子データが得られる。いくつかの態様では、前記試料に由来するDNAまたはRNAを複数の分画に分割して、(例えば、特定の分画のすべてのDNAまたはRNAは同じバーコードを有する等)各分画のDNAまたはRNAに異なるバーコードを付加して、任意でバーコード付きDNAまたはRNAを増幅して、分画を結合させ、結合させた分画のバーコード付きDNAまたはRNAを配列決定することで測定されたアレルの遺伝子データが得られる。いくつかの態様では、配列決定(例えば、ナノポア配列決定、Halcyon Molecular配列決定等)、SNPアレイ、リアルタイムPCR、TaqMan、Nanostring nCounter(登録商標)分析装置、差別的DNAポリメラーゼおよびリガーゼを用いたIllumina GoldenGate Genotyping Assay、ライゲーション媒介PCR、連結逆方向プローブ(LIP、環状化済みプローブ、予備環状化型プローブ、環状化型プローブ、パドロックプローブ、または分子反転プローブ(MIP)と呼ばれることもある)のうちの1つ以上の方法を用いて、多型座位(例えばSNP)のアレルが同定される。いくつかの態様では、2つ以上(例えば、3または4)の対象増幅産物がライゲーションで結合されて、ライゲート生成物の配列決定が行われる。いくつかの態様では、同じ座位について異なるアレルの測定は、これらアレル間の代謝、アポトーシス、ヒストン、不活性、および/または増幅の違い(例えば、同じ座位の異なるアレル間の増幅効率の違い等)についての調整が行われる。いくつかの態様では、この調整は、得られた遺伝子データのアレル比率を算出する前、あるいは測定遺伝子データを期待遺伝子データと比較する前に行われる。
いくつかの態様では、前記方法はまた、病気または障害の1種以上の危険因子の有無を決定することを含む。いくつかの態様では、前記方法はまた、病気または障害あるいはその病気または障害の危険性の増加に関連づけられた1種以上の多型または変異の有無を決定することを含む。いくつかの態様では、前記方法はまた、無細胞DNA、無細胞ミトコンドリアDNA、無細胞核内DNA、無細胞RNA、miRNA、またはこれらの任意の組み合わせの総量を決定することを含む。いくつかの態様では、前記方法は、1つ以上の目的の無細胞DNA、無細胞ミトコンドリアDNA、無細胞核内DNA、無細胞RNA、および/またはmiRNA分子(例えば、病気または障害あるいはその病気または障害の危険性の増加に関連づけられた多型または変異を有する分子等)の量を決定することを含む。いくつかの態様では、総DNA中の腫瘍DNA分画(例えば、総無細胞DNA中の腫瘍無細胞DNA分画、総無細胞DNA中の特定の変異を有する腫瘍無細胞DNA分画等)が決定される。いくつかの態様では、この腫瘍分画を用いて癌の段階が決定される(腫瘍分画が高い程、癌のより進行した段階と関連づけることができるため)。いくつかの態様では、前記方法はまた、DNAまたはRNAの総量を決定することを含む。いくつかの態様では、前記方法は、メチル化された1種以上の目的のDNAまたはRNA分子(例えば、病気または障害あるいはその病気または障害の危険性の増加に関連づけられた多型または変異を有する分子等)の量を決定することを含む。いくつかの態様では、前記方法は、DNAの完全性における変化の有無を決定することを含む。いくつかの態様では、前記方法はまた、mRNAスプライシングの総量を決定することを含む。いくつかの態様では、前記方法は、mRNAスプライシングの量を決定すること、または目的の1つ以上のRNA分子(例えば、病気または障害あるいはその病気または障害の危険性の増加に関連づけられた多型または変異を有する分子)に対応するもう1つのmRNAスプライシングを検出することを含む。
いくつかの態様では、本発明は、個体において癌の表現型を検出するための方法であって、前記癌の表現型が変異の集合のうちの少なくとも1つの変異の存在によって定義されることを特徴とする。いくつかの態様では、前記方法は、前記細胞の1つ以上が癌の表現型を有すると疑われる場合に前記個体に由来する1個以上の細胞に由来するDNAまたはRNAの試料についてDNAまたはRNA測定を得ることと、前記DNAまたはRNA測定を分析して前記変異の集合のうちの変異ごとに前記細胞の少なくとも1つがその変異を有する尤度を決定することを含む。いくつかの態様では、前記方法は、(i)前記変異の少なくとも1つについて、前記細胞の少なくとも1つがその変異を含む尤度が閾値よりも大きい場合、または(ii)前記変異の少なくとも1つの変異について、前記細胞の少なくとも1つがその変異を有する尤度が前記閾値未満である場合のいずれかであり、かつ複数の変異について、前記細胞の少なくとも1つが前記変異の少なくとも1つを有する尤度の組み合わせが前記閾値より大きい場合に前記個体が前記癌の表現型を有していると決定することを含む。いくつかの態様では、1個以上の細胞は、前記変異の集合内に下位集合または変異のすべてを有する。いくつかの態様では、前記変異の下位集合は、癌または癌の危険性の増加と関連づけられる。いくつかの態様では、前記試料は、無細胞DNAまたはRNAを含む。いくつかの態様では、前記DNAまたはRNA測定は、1つ以上の染色体または染色体分節にある多型座位の集合における測定(例えば、各座位に存在する各アレルの量等)を含む。
一側面において、本発明は、哺乳類の病気または障害の治療、安定化、または予防のための治療法を選択する方法を特徴とする。いくつかの態様では、前記方法は、本明細書で開示した方法のいずれかを用いて、第二の相同染色体分節に比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定することを含む。いくつかの態様では、前記哺乳類に対して治療法(例えば、第一の相同染色体分節の過剰出現と関連づけられた病気または障害の治療法等)が選択される。
一側面において、本発明は、哺乳類の病気または障害を防止、遅延、安定化、または治療するための方法を特徴とする。いくつかの態様では、前記方法は、本明細書で開示した方法のいずれかを用いて、第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定することを含む。いくつかの態様では、治療法(例えば、第一の相同染色体分節の過剰出現と関連づけられた病気または障害の治療法)が選択されて、前記哺乳類に施される。
いくつかの態様では、病気または障害を治療、安定化、または防止することは、病気または障害の初期の発生またはそれに続いて起こる事象を防止または遅延すること、状態の消失からその再発までの無病生存時間を増加させること、状態に関連づけられた有害な症状を安定化または低下させること、あるいは状態の進行を阻害または安定化させることを含む。いくつかの態様では、治療された対象者の少なくとも20、40、60、80、90、または95%が、前記状態のすべての兆候が消え完全に沈静している。いくつかの態様では、ある状態と診断されて治療された後の対象者の生存時間は、(i)未治療の対象者の平均生存時間または(ii)他の治療法で治療された対象者の平均生存時間の少なくとも20、40、60、80、100、200、または500%延長されている。
いくつかの態様では、癌を治療、安定化、または防止することは、腫瘍(例えば、良性腫瘍または悪性腫瘍)の大きさを縮小する、あるいは安定化させること、腫瘍の増大を遅延または防止させること、腫瘍細胞数を低減または安定化させること、腫瘍の消失からその再発までの無病生存時間を増加させること、腫瘍の初期の発生またはそれに続く発生を防止すること、あるいは腫瘍と関連づけられた有害状態を低減または安定化させることを含む。一態様では、任意の標準的なアッセイを用いた測定において、治療後に残った癌性細胞数は、癌性細胞の初期数に比べて少なくとも10、20、40、60、80、または100%低減している。いくつかの態様では、本発明の治療法を施すことによって誘発された癌性細胞数は、非癌細胞数に比べて少なくとも2、5、10、20、または50倍超、低減している。いくつかの態様では、治療法を施した後に存在する癌性細胞数は、対照(例えば、生理食塩水または緩衝剤の投与等)の投与後に存在する癌性細胞数に比べて少なくとも2、5、10、20、または50倍低減している。いくつかの態様では、本発明の方法によって、標準的な方法を用いて決定した腫瘍の大きさが10、20、40、60、80、または100%縮小した。いくつかの態様では、治療された対象者の少なくとも10、20、40、60、80、90、または95%が癌性細胞の検出されない完全な沈静を示した。いくつかの態様では、癌が全く再発しない、あるいは少なくとも2、5、10、15、または20年間は再発しない。いくつかの態様では、癌と診断されて、本発明の治療法で治療された対象者の生存時間は、(i)未治療の対象者の平均生存時間または(ii)他の治療法で治療された対象者の平均生存時間の少なくとも10、20、40、60、80、100、200、または500%延長されている。
一側面において、本発明は、哺乳類の病気または障害を治療、安定化、または予防するための臨床試験に含まれる対象者を層別化するための方法を特徴とする。いくつかの態様では、前記方法は、本明細書で開示した方法のいずれかを用いて、前記臨床試験の前、最中、または後に第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかを決定することを含む。いくつかの態様では、前記対象者のゲノムにおける第一の相同染色体分節の過剰出現の有無によって前記対象者が臨床試験のための下位群に振り分けられる。
いくつかの態様では、前記病気または障害は、癌、精神障害、学習障害(例えば、特発性学習障害)、精神遅滞、発達遅滞、自閉症、神経変性病または障害、統合失調症、身体障害、自己免疫疾患または障害、全身性エリテマトーデス、乾癬、クローン病、糸球体腎炎、HIV感染、AIDS、およびこれらの組み合わせからなる群から選択される。いくつかの態様では、前記病気または障害は、ディ・ジョージ(DiGeorge)症候群、ディ・ジョージ2症候群、ディ・ジョージ/口蓋帆・心臓・顔(VCFS)症候群、プラダー・ウィリー(Prader-Willi)症候群、アンジェルマン(Angelman)症候群、ベックウィズ-ヴィーデマン(Beckwith-Wiedemann)症候群、1p36欠失症候群、2q37欠失症候群、3q29欠失症候群、9q34欠失症候群、17q21.31欠失症候群、猫鳴き(Cri-du-chat)症候群、ヤコブセン(Jacobsen)症候群、ミラー・ディッカー(Miller Dieker)症候群、フェラン-マクダーミド(Phelan-McDermid)症候群、スミス・マゲニス(Smith-Magenis)症候群、腫瘍-無虹彩症-泌尿生殖器奇形-精神遅滞(WAGR)症候群、ウォルフ・ヒルシュホーン(Wolf-Hirschhorn)症候群、ウィリアムズ(Williams)症候群、ウィリアムズ・ボイレン(Williams-Beuren)症候群、ミラー・ディッカー(Miller-Dieker)症候群、フェラン-マクダーミド(Phelan-McDermid)症候群、スミス・マゲニス(Smith-Magenis)症候群、ダウン症候群、エドワーズ(Edward)症候群、パトウ(Patau)症候群、クラインフェルター(Klinefelter)症候群、ターナー(Turner)症候群、47,XXX症候群、47,XYY症候群、ソトス(Sotos)症候群、およびこれらの組み合わせからなる群から選択される。いくつかの態様では、前記方法は、以下の染色体異常の1種以上の有無を決定する:零染色体性、一染色体性、片親性二染色体性、三染色体性、一致型三染色体性、部分一致型三染色体性、母親性三染色体性、親性三染色体性、三杯体性、モザイク型四染色体性、一致型四染色体性、部分一致型四染色体性、他の異数性、非均衡型転座、均衡型転座、挿入、欠失、組換え、およびこれらの組み合わせ。いくつかの態様では、前記染色体異常は、特定の染色体または染色体分節の最も一般的なコピー数との任意のズレであり、例えばヒト体細胞では、2コピーからずれているものはいずれも染色体異常と見なすことができる。いくつかの態様では、前記方法は、正倍数性の有無を決定する。いくつかの態様では、前記コピー数仮説は、単胎妊娠に関する1つ以上のコピー数仮説を含む。いくつかの態様では、前記コピー数仮説は、多胎妊娠、例えば双胎妊娠(例えば、同一性双生児、兄弟性双生児、消失性双生児)に関する1つ以上のコピー数仮説を含む。いくつかの態様では、前記コピー数仮説は、多胎妊娠の正倍数体であるすべての胎児、多胎妊娠の異数体(例えば、本明細書において開示される任意の異数性)であるすべての胎児、および/または多胎妊娠の正倍数体である1体以上の胎児、および多胎妊娠の異数性である1体以上の胎児を含む。いくつかの態様では、前記コピー数仮説は、同一性双生児(一卵性双生児ともいう)または兄弟性双生児(二卵性双生児ともいう)を含む。いくつかの態様では、前記コピー数仮説は、奇胎妊娠(例えば、完全奇胎妊娠、部分奇胎妊娠等)を含む。いくつかの態様では、前記目的の染色体分節は1本の染色体全体である。いくつかの態様では、前記染色体または染色体分節は、13番染色体、18番染色体、21番染色体、X染色体、Y染色体、これらの分節、およびこれらの組み合わせからなる群から選択される。いくつかの態様では、前記第一の相同染色体分節および前記第二の相同染色体分節は、前記目的の染色体分節を含む相同染色体分節の対である。いくつかの態様では、前記第一の相同染色体分節および前記第二の相同染色体分節は目的の相同染色体の対である。いくつかの態様では、信頼度は、CNVの決定または病気または障害の診断について算出される。
いくつかの態様では、前記欠失は、少なくとも0.01kb、0.1kb、1kb、10kb、100kb、1mb、2mb、3mb、5mb、10mb、15mb、20mb、30mb、または40mbの欠失である。いくつかの態様では、前記欠失は、1kb〜40mb、例えば1kb〜100kb、100kb〜1mb、1〜5mb、5〜10mb、10〜15mb、15〜20mb、20〜25mb、25〜30mb、または30〜40mb(数値を含む)の欠失である。いくつかの態様では、前記染色体分節の1コピーが欠失しており、1コピーは存在する。いくつかの態様では、前記染色体分節の2コピーが欠失している。いくつかの態様では、1本の染色体全体が欠失している。
いくつかの態様では、前記重複は、少なくとも0.01kb、0.1kb、1kb、10kb、100kb、1mb、2mb、3mb、5mb、10mb、15mb、20mb、30mb、または40mbの重複である。いくつかの態様では、前記重複は、1kb〜40mb、例えば1kb〜100kb、100kb〜1mb、1〜5mb、5〜10mb、10〜15mb、15〜20mb、20〜25mb、25〜30mb、30〜40mb(数値を含む)の重複である。いくつかの態様では、前記染色体分節の重複は1回である。いくつかの態様では、前記染色体分節の重複は2回以上(例えば、2、3、4、5回)である。いくつかの態様では、1本の染色体全体が重複している。いくつかの態様では、第一の相同分節のある領域が欠失しており、第二の相同分節の同じ領域または他の領域が重複している。いくつかの態様では、検査したSNVの少なくとも50、60、70、80、90、95、96、98、99、100%は転換型変異であり、転移型変異ではない。
いくつかの態様では、前記試料は、(i)1個以上の目的細胞または(ii)1個以上の目的でない細胞に由来するDNAおよび/またはRNAを含む。いくつかの態様では、前記試料は、1個以上の目的細胞および1個以上の目的でない細胞に由来するDNAおよび/またはRNAを含む混合試料である。いくつかの態様では、前記対象細胞はCNV(例えば、目的の欠失または重複)を有する細胞であり、前記非対象細胞は目的のコピー数多様性を有しない細胞である。前記1個以上の目的細胞が癌細胞であり、前記1個以上の目的でない細胞が非癌細胞であるいくつかの態様では、前記方法は、前記癌細胞のうちの1個以上の癌細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。前記1個以上の目的細胞が遺伝的に同一の癌細胞であり、前記1個以上の目的でない細胞が非癌細胞であるいくつかの態様では、前記方法は、前記癌細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。前記1個以上の目的細胞が遺伝的に非同一の癌細胞であり、前記1個以上の目的でない細胞が非癌細胞であるいくつかの態様では、前記方法は、前記遺伝的に非同一の癌細胞のうちの1個以上の癌細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。前記試料が1個以上の癌細胞および1つ以上の非癌細胞の混合物に由来する無細胞DNAを含むいくつかの態様では、前記方法は、前記癌細胞のうちの1個以上の癌細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。前記1個以上の目的細胞が遺伝的に同一の胎児の細胞であり、前記1個以上の目的でない細胞が母親の細胞であるいくつかの態様では、前記方法は、前記胎児の細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。前記1個以上の目的細胞が遺伝的に非同一の胎児の細胞であり、前記1個以上の目的でない細胞が母親の細胞であるいくつかの態様において、前記方法は、前記遺伝的に非同一の胎児の細胞のうちの1個以上の細胞のゲノム中の前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することを含む。大部分の個体の細胞は細胞核DNAのほぼ同一の集合を含むので、いくつかの態様では用語「対象細胞」は、用語「個体」とは区別なく用いてもよい。癌性細胞は、宿主である個体とは異なる遺伝型を有する。この場合、その癌自体を個体と見なしてもよい。また、多くの癌は異種性であるが、これはある腫瘍の各細胞が同じ腫瘍の他の細胞と遺伝的に異なっていることを意味する。この場合、遺伝的に同一の領域をそれぞれ異なる個体と見なすことができる。あるいは、その癌を、異なるゲノムを有する細胞の混合物を含む単一の個体を見なしてもよい。非対象細胞は、通常、正倍数体であるが、必ずしもそうでない場合がある。
いくつかの態様では、前記試料は、母親の全血液試料またはその分画、母親の血液試料から単離した細胞、羊水穿刺試料、受胎試料の生成物、胎盤組織試料、絨毛膜絨毛試料、胎盤膜試料、頸管粘液試料、または胎児由来の試料から得られる。いくつかの態様では、前記試料は、前記母親由来の血液試料またはその分画から得られた無細胞DNAを含む。いくつかの態様では、前記試料は、胎児の細胞および母親の細胞の混合物から得られた細胞核DNAを含む。いくつかの態様では、前記試料は、胎児の細胞が富化された、有核細胞を含む母親の血液の分画から得られる。いくつかの態様では、前記試料は、複数個の分画(例えば、2、3、4、5個以上の分画)に分割されて、本発明の方法を用いてそれぞれ分析される。各分画が同じ結果(例えば、目的の1つ以上のCNVの有無)を示す場合は、その結果の信頼度が増す。各分画が異なる結果を示す場合は、その試料が再分析される、あるいは同じ対象者から他の試料が採取されて分析されることがある。
対象者の例としては、哺乳類(例えば、ヒトおよび獣医学の目的の哺乳類)等が挙げられる。いくつかの態様では、前記哺乳類は霊長類(例えば、ヒト、サル、ゴリラ、類人猿、キツネザル等)、ウシ、ウマ、ブタ、イヌ、またはネコである。
いくつかの態様では、前記方法のいずれかは、本発明の前記方法の結果(例えば、欠失または重複の有無)を開示する報告書(例えば、文書による報告書、または電子報告書)を作成することを含む。
いくつかの態様では、前記方法のいずれかは、本発明の前記方法の結果(例えば、欠失または重複の有無)に基づいて臨床行為を行うことを含む。本発明の前記方法の結果に基づき、胚または胎児が1つ以上の目的の多型または変異(例えば、CNV)を有するいくつかの態様では、前記臨床行為は、追加試験(例えば、多型または変異の存在を確認するための試験等)を行うことを含むが、体外受精のための前記胚を移植すること、体外受精のための別の胚を移植すること、妊娠状態を終了させること、特別支援が必要な子供に備えること、あるいは遺伝性疾患の表現型提示の重症度を低減するように設計された介入を行うことは含まない。いくつかの態様では、前記臨床行為は、超音波診断、胎児の羊水穿刺、母親および/または父親に由来する遺伝子材料を受け継いだ胎児の羊水穿刺、胎児の絨毛膜絨毛生検、母親および/または父親に由来する遺伝子材料を受け継いた胎児の絨毛膜絨毛生検、体外受精、母親および/または父親に由来する遺伝子材料を受け継いだ1個以上の胚の着床前遺伝子診断、母親の染色体分析、父親の染色体分析、胎児の心エコー図検査(例えば、三染色体性21、18、または13、一染色体性X、または微少欠失を有する胎児の心エコー図検査等)、およびこれらの組み合わせからなる群から選択される。いくつかの態様では、前記臨床行為は、一染色体性Xを有する生まれた子供への成長ホルモンの投与(例えば、約9ヶ月での投与開始)、22q欠失(例えば、ディ・ジョージ症候群)を持って生まれた子供へのカルシウム投与、47,XXYを有する生まれた子供へのテストステロン等のアンドロゲンの投与(例えば、3ヶ月間、乳児または幼児への1ヶ月あたり25mgのエナント酸テストステロンの注射)、(例えば、三倍体胎児等の)完全奇胎妊娠または部分奇胎妊娠の女性に対する癌検査の実施、(例えば、三倍体胎児等の)完全奇胎妊娠または部分奇胎妊娠の女性に対する(化学療法薬等による)癌治療の実施、男子と判定された胎児(例えば、本発明の方法を用いて男子と判定された胎児)に対する1種以上のX関連遺伝性疾患(例えば、デュシェンヌ型筋ジストロフィー(DMD)、副腎白質ジストロフィー、血友病等)についてのスクリーニング検査、X関連疾患の危険性がある男子の胎児の羊水穿刺の実施、先天性副腎過形成の危険性がある女子の胎児(例えば、本発明の方法を用いて女子と判定された胎児)を妊娠している女性へのデキサメタゾンの投与、先天性副腎過形成の危険性がある男子の胎児について羊水穿刺の実施、(生ワクチンの代わりに)死菌ワクチンの投与または22q11.2欠失による免疫不全(または、免疫不全の疑いがある)生まれた子供へのある種のワクチン投与の回避、作業療法および/または物理治療の実施、教育への早期介入、新生児集中治療室および/または出産時に対応可能な小児専門医を有する三次医療センターへの赤ん坊の搬送、生まれた子供(例えば、XXX、XXY、またはXYYを有する子供)への行動介入、およびこれらの組み合わせからなる群から選択される。
いくつかの態様では、多胎妊娠(例えば、双生児)であると判定された女性に対して超音波または他のスクリーニング検査が行われて、胎児の2体以上が単一絨毛膜性であるかどうかが決定される。一卵性双生児は、単一の卵母細胞の排卵および受精と、それに続く受精卵の細胞分裂から発生する。胎盤形成は二絨毛膜性または単一絨毛膜性である可能性がある。二卵性双生児は、2つの卵母細胞の排卵および受精から発生するが、通常、二絨毛膜性胎盤が形成される。単一絨毛膜性双生児は双胎児間輸血症候群の危険性を有する。これら症候群によって胎児間の血液分布が不均衡になる可能性があり、その結果、双生児の成長や発達に差が生じ、場合によっては死産となる。よって、本発明の方法を用いて一卵性双生児と判定された双生児は、(例えば、超音波等によって)検査されて、単一絨毛膜性双生児であるかどうかが判定され、単一絨毛膜性双生児である場合は双胎児間輸血症候群の兆候についてこれらの双生児を(例えば、16週目から隔週で超音波等により)監視することができることが望ましい。
本発明の前記方法の結果に基づいて胚または胎児が1つ以上の目的の多型または変異(例えば、CNV)を有していないいくつかの態様では、前記臨床行為は、体外受精のための前記胚を移植すること、または妊娠状態を継続することを含む。いくつかの態様では、前記臨床行為は、超音波、羊水穿刺、絨毛膜絨毛生検、およびこれらの組み合わせからなる群から選択される行為を行って前記多型または変異がないことを確認するための追加検査である。
本発明の前記方法の結果に基づいてある個体が1つ以上の多型または変異(例えば、(癌等の)病気または障害または(癌等の)病気または障害の危険性の増加に関連づけられた多型または変異)を有するいくつかの態様では、前記臨床行為は、追加検査を行うこと、または病気または障害に対する1つ以上の治療法(例えば、癌の治療法、前記個体が診断された特定の種類の癌または特定の種類の変異に対する治療法、または本明細書で開示された治療法のいずれか)を施すことを含む。いくつかの態様では、前記臨床行為は、生検、手術、医療画像診断(例えば、マンモグラム、超音波等)、およびこれらの組み合わせからなる群から選択される、多型または変異の有無を確認するための追加検査である。
いくつかの態様では、前記追加検査は、多型または変異(例えば、CNV)の有無を確認するための同じまたは異なる方法(例えば、本明細書で開示した方法のいずれか)を行うこと(例えば、検査された同じ試料の第二の分画、または同じ個体(例えば、癌の危険性が増加している同じ妊娠している母親、胎児、胚、または個体)に由来する異なる試料を検査する等)を含む。いくつかの態様では、多型または変異(例えば、CNV)の確率が閾値を超えている個体に対して前記追加検査(例えば、可能性の高い多型または変異の存在を確認するための追加検査等)が行われる。いくつかの態様では、多型または変異(例えば、CNV)の決定の信頼度またはZ値が閾値を超えている個体に対して前記追加検査(例えば、可能性の高い多型または変異の存在を確認するための追加検査等)が行われる。いくつかの態様では、多型または変異(例えば、CNV)の決定のための信頼度またはZ値が最少閾値と最大閾値の間である個体について、前記追加検査(例えば、初期の結果が正しいことの信頼度を高めるための追加検査等)が行われる。いくつかの態様では、多型または変異(例えば、CNV)の有無の決定のための信頼度が閾値未満(例えば、CNVの有無を十分な信頼度でもって決定できなかった結果である「呼び出しなし」等)である個体について、前記追加検査が行われる。Z値は例えばChiu et al. BMJ 2011;342:c7401(参照によりその全体が本明細書に組み込まれる)で算出される。ここでは、一例として21番染色体が用いられているが、検査試料中のいずれか他の染色体または染色体分節と置換されてもよい。
検査ケースの21番染色体の百分率に対するZ値=((検査ケースの21番染色体の百分率)−(基準対照の21番染色体の百分率の平均値))/(基準対照の21番染色体の百分率の標準偏差)
いくつかの態様では、最初の試料が品質管理ガイドラインを満たしてなかった、あるいは閾値未満の胎児の分画または腫瘍分画を含んでいた個体について、前記追加検査が行われる。いくつかの態様では、前記方法は、本発明の前記方法の結果、その結果の確率、その結果の信頼度、またはZ値に基づいて追加検査を行う個体を選択し、前記個体(例えば、同じまたは別の試料)に前記追加検査を行うことを含む。いくつかの態様では、(例えば、癌等の)病気または障害と診断された対象者は、本発明の方法または前記病気または障害を検査するための周知の検査方法を用いて複数の時点で反復検査を受けて、前記病気または障害の進行、沈静、または再発が監視される。
一側面において、本発明は、本発明の方法の結果(例えば、欠失または重複の有無)を開示する報告書(例えば、文書による報告書、または電子報告書)を特徴とする。
様々な態様では、前記プライマー伸長反応すなわち前記ポリメラーゼ連鎖反応は、ポリメラーゼで1個以上のヌクレオチドを付加させることを含む。いくつかの態様では、前記プライマーは溶液中にある。いくつかの態様では、前記プライマーは溶液中にあり、固体の支持体に固定化されていない。いくつかの態様では、前記プライマーはマイクロアレイの一部ではない。様々な態様では、前記プライマー伸長反応すなわち前記ポリメラーゼ連鎖反応は、ライゲーション媒介PCRを含まない。様々な態様では、前記プライマー伸長反応すなわち前記ポリメラーゼ連鎖反応は、リガーゼで2本のプライマーを結合させることを含まない。様々な態様では、前記プライマーは、連結逆方向プローブ(LIP、環状化済みプローブ、予備環状化型プローブ、環状化型プローブ、パドロックプローブ、または分子反転プローブ(MIP)と呼ばれることもある)を含まない。
本明細書で記載された本発明の側面および態様は、本発明の側面または態様のうち、いずれか2つ以上の組み合わせを含む。
定義
「一塩基多型(SNP)」は、同じ種の2個体間のゲノムで異なる場合がある1つのヌクレオチドを指す。この用語の使用は、各変異体が発生する頻度に関するいかなる限定も意味する意図はない。
「配列」は、DNA配列または遺伝子配列を指す。この用語は、個体のDNA分子またはDNA鎖の一次的物理構造を指す場合がある。この用語は、DNA分子に見られるヌクレオチド配列、またはこのDNA分子の相補鎖を指す場合がある。この用語は、コンピュータでの表示として、このDNA分子に含まれる情報を指す場合がある。
「座位」は、個体のDNAに関する目的の特定の領域を指し、SNP、挿入または欠失の可能性がある部位、あるいはその他のなんらかの関連する遺伝的多様性の部位を指す場合がある。疾病関連SNPはまた、疾病関連座位という場合がある。
「多型アレル」および「多型座位」はそれぞれ、ある種の個体間で遺伝型が異なるアレル、座位を指す。多型アレルのいくつかの例として、一塩基多型、短縦列型反復、欠失、重複、および逆位等が挙げられる。
「多型部位」は、多型領域に見られる、個体間で異なる特定のヌクレオチドを指す。
「変異」は、天然の核酸配列または基準核酸配列の変化を指し、挿入、欠失、重複、転座、置換、読み枠シフト変異、サイレント変異、ナンセンス変異、ミスセンス変異、点変異、塩基転位変異、塩基転換変異、復帰変異、マイクロサテライト変更等が挙げられる。いくつかの態様では、核酸配列によってコードされるアミノ酸配列は、天然の配列から少なくとも1つのアミノ酸変更を有する。
「アレル」は、特定の座位を占める遺伝子群を指す。
「遺伝子データ」、「遺伝型データ」はいずれも、1つ以上の個体のゲノムの側面を記述したものを指す。この用語は、座位または座位の集合、配列の部分または配列全体、染色体の部分または染色体全体、あるいはゲノム全体を指す場合がある。この用語は、1個または複数のヌクレオチドの同一性を指す場合がある。また、ヌクレオチド配列、ゲノム中の異なる位置にあるヌクレオチド、またはこれらの組み合わせを指す場合がある。しかしながら、遺伝型データは典型的にはコンピュータ内のものであり、ある配列の物理的ヌクレオチドを、化学的にコードされた遺伝子データとして考慮することも可能である。遺伝型データは、個体「上」、「の」、「で」、「から」、または「に関する」遺伝型データという場合がある。遺伝型データは、遺伝子材料を測定する遺伝型決定プラットフォームから得られる測定出力を指す場合がある。
「遺伝子材料」および「遺伝子試料」は、DNAまたはRNAを含む1つ以上の個体由来の物質(組織または血液等)を指す。
「信頼度」は、呼び出されたSNP、アレル、アレルの集合、染色体または染色体分節の決定されたコピー数、あるいは病気の有無の診断が、その個体の実際の遺伝子状態を正しく表していることについての統計尤度を指す。
「倍数性呼び出し」、および「染色体コピー数呼び出し」あるいは「コピー数呼び出し」(CNC)は、ある細胞に存在する1つ以上の染色体または染色体分節の量および/または染色体同一性を決定する動作を指す場合がある。
「異数性」は、ある細胞に染色体数の誤り(例えば、完全な染色体の数の誤り、染色体分節の数の誤り(染色体分節の欠失または重複の存在等)が存在する状態を指す。ヒト体細胞の場合、この用語は、ある細胞が22対の常染色体と1対の性染色体を含まない場合を指すことがある。ヒト配偶子の場合、この用語は、ある細胞が23本の染色体のいずれか1つを含まない場合を指すことがある。単一染色体型の場合、この用語は、3つ以上または1つ以下の相同ではあるが同一ではない染色体コピーが存在する場合、あるいは同じ親由来の染色体コピーが2つ存在する場合を指すことがある。いくつかの態様では、染色体分節の欠失は微少欠失である。
「倍数性状態」は、ある細胞の1つ以上の染色体または染色体分節の量および/または染色体同一性を指す。
「染色体」は、単一染色体コピーを指す場合がある。この用語は、正常な体細胞には46個存在するDNAの単一分子(例えば「母親由来の18番染色体」等)を意味する。染色体はまた、正常なヒト体細胞には23個存在する染色体型(例えば「18番染色体」等)を指すことがある。
「染色体同一性」は、染色体参照番号、すなわち染色体型を指す場合がある。正常なヒトは、番号付けされた常染色体の22種の染色体型と、2種類の性染色体を有する。この用語は、染色体の親の起源を指すこともある。この用語は、親から受け継いだ特定の染色体を指すこともある。この用語は、染色体のその他の同定に用いられる特徴を指すこともある。
「アレルデータ」は、1つ以上のアレルの集合に関する遺伝型データの集合を指す。この用語は、相決定済みハプロタイプデータを指す場合がある。この用語は、SNP同一性を指す場合がある。また、挿入、欠失、反復、および変異を含むDNAの配列データを指す場合がある。この用語は、各アレルの親起源を含むことがある。
「アレル状態」は、1つ以上のアレルの集合における遺伝子の実際の状態を指す。この用語は、アレルデータによって記載された遺伝子の実際の状態を指す場合がある。
「アレル数」は、特定の座位にマッピングされる配列の数を指し、その座位が多型である場合は各アレルにマッピングされる配列の数を指す。各アレルが二進数で計測される場合、アレルの数は整数になる。アレルが確率で計測される場合、アレルの数は分数であってもよい。
「アレル数確率」は、特定の座位または多型座位にあるアレルの集合にマッピングされると思われる配列の数を、マッピングの確率と合わせたものを指す。各計測された配列のマッピング確率が二値(0または1)である場合は、アレル数は、アレル数確率に相当する。いくつかの態様では、アレル数確率は二値である場合がある。いくつかの態様では、アレル数確率はDNA測定と等しくなるように設定されていることがある。
「アレル分布」または「アレル数分布」は、座位の集合における各座位に存在する各アレルの相対量を指す。アレル分布は、個体、試料、または試料に対して行った測定の集合を指し得る。配列決定等のデジタルアレル測定の文脈では、このアレル分布は、多型座位の集合における各アレルについて特定のアレルにマッピングされるリードの数または確数を指す。SNPアレイ等、アナログアレル測定の文脈では、このアレル分布は、アレル強度および/またはアレル比率を指す。アレル測定は、確率として、すなわち、あるアレルがある配列リードに存在する尤度が0と1の間の分数として処理されてもよく、または二進法、すなわち、ある任意のリードがある特定のアレルのコピーとして0または1のいずれかと見なされるような方法で処理されてもよい。
「アレル分布パターン」は、文脈(親の文脈等)ごとに異なるアレル分布の集合を指す。あるアレル分布パターンは、ある倍数性状態を指す場合がある。
「アレルの偏り」は、ヘテロ接合座位に存在するアレルの測定比率がDNAまたはRNAの元の試料の比率と異なっている程度を指す。特定の座位に存在するアレルの偏りの程度は、測定されたその座位に存在する観察されたアレルの比率を元のDNAまたはRNA試料のその座位に存在するアレルの比率で除したものに等しい。アレルの偏りは、増幅による偏り、精製による偏り、または異なるアレルに様々な影響を及ぼすいくつかのその他の現象による場合がある。
「アレル不均衡率」は、SNVの場合、異常なDNAの割合を指す。この割合は、典型的には多様性アレル頻度(ある座位に存在する多様性アレル数/その座位に存在する総アレル数)を用いて計測される。腫瘍における2つの相同体の量の差は類似しているので、CNVについて異常なDNAの割合を平均アレル不均衡率(AAI)を用いて測定する。平均アレル不均衡率は|(H1−H2)|/(H1+H2)として定義され、ここでHiは試料中の相同体iの平均コピー数であり、Hi/(H1+H2)は相同体iの分数の量、すなわち相同体比率である。最大相同体比率は、もっとも量が多い相同体の相同体比率である。
「試験脱落率」は、すべてのSNPを用いて推定した、リードのないSNPの百分率である。
「単一アレル脱落(ADO)率」は、ヘテロ接合SNPのみを用いて推定した、アレルが1つのみ存在するSNPの百分率である。
「プライマー」および「PCRプローブ」は、単一核酸分子(DNA分子、DNAオリゴマー等)、あるいは同一またはほぼ同一の核酸分子(DNA分子、DNAオリゴマー等)の集合体を指す。プライマーは、対象とする座位(例えば、対象とする多型座位または非多型座位)または汎用プライミング配列にハイブリダイズされるように設計された領域を含む。プライマーは、PCR増幅を可能にするように設計されたプライミング配列を含んでいてもよい。プライマーはまた、分子バーコードを含んでいてもよい。プライマーは、個体分子ごとに異なるランダム領域を含んでいてもよい。
「プライマーのライブラリー」は、2個以上のプライマーの集団を指す。様々な態様において、このライブラリーは、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なるプライマーを含む。様々な態様において、このライブラリーは、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なるプライマー対を含み、各プライマー対は、フォワード試験プライマーおよびリバース試験プライマーを含み、各試験プライマー対は対象座位にハイブリダイズされる。いくつかの態様では、プライマーのライブラリーは、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる個別のプライマーを含む。個別のプライマーはそれぞれ異なる対象座位にハイブリダイズされ、これら個別のプライマーはプライマー対の一部ではない。いくつかの態様では、ライブラリーは、(i)プライマー対および(ii)プライマー対の一部ではない個別のプライマー(汎用プライマー等)の両方を含む。
「異なるプライマー」とは、同一ではないプライマーを指す。
「異なるプール」とは、同一ではないプールを指す。
「異なる対象座位」とは、同一ではない対象座位を指す。
「異なる増幅産物」とは、同一ではない増幅産物を指す。
「ハイブリッドキャプチャー用プローブ」は、試料中の特定の目的DNA配列の一本鎖と相補であることを意図してPCR、直接合成等の様々な方法で作成された、修飾可能な任意の核酸配列を指す。用意した試料に外来性のハイブリッドキャプチャー用プローブを添加して、変性再アニール法でハイブリダイズさせて、外来性−内在性断片の二本鎖を形成してもよい。これら二本鎖を様々な手段で試料から物理的に分離してもよい。
「配列リード」は、例えば、クローン配列決定法を用いて測定したヌクレオチドの塩基配列を表すデータを指す。クローン配列決定法により、元の1つのDNA分子、そのクローン、またはそのクラスターを表す配列データが作成されてもよい。配列リードはまた、ヌクレオチドが正しく呼び出された確率を示す、関連づけられた質スコアを配列の各塩基位置に有していてもよい。
「配列リードのマッピング」とは、特定の器官のゲノム配列における配列リードの元の位置を決定する方法である。配列リードの元の位置は、そのリードのヌクレオチド配列およびゲノム配列の類似性に基づいている。
「一致型コピー誤り」および「一致型染色体異数性(MCA)」は、1個の細胞が2つの同一、またはほぼ同一の染色体を含む異数性状態を指す。この種の異数性は、減数分裂時に配偶子が形成されるときに生じる場合があり、減数分裂不分離誤りとも言う場合がある。この種の誤りは有糸分裂時に生じる場合がある。一致型三染色体性は、ある染色体のコピーが3つ、1個体に存在し、そのうちの2つが同一である場合を指すことがある。
「部分一致型コピー誤り」および「非同一染色体異数性(UCA)」は、1個の細胞が、相同ではあるが同一ではない可能性がある、同じ親由来の2つの染色体を含む異数性状態を指す。この種の異数性は、減数分裂時に生じることがあり、減数分裂誤りと言う場合がある。部分一致型三染色体性は、ある染色体のコピーが3つ、1個体に存在し、そのうちの2つが同じ親由来であり、相同であるが同一ではない場合を指すことがある。部分一致型三染色体性は、一方の親由来の2つの相同染色体が存在し、その染色体分節のある部分は同一であるが他の分節は単に相同である場合を指すことがある。
「相同染色体」は、減数分裂に正常に対をなす遺伝子の同じ集合を含む染色体コピーを指す。
「同一染色体」は、同じ遺伝子の集合を含み、各遺伝子が同一、またはほぼ同一のアレルの同じ集合を有する染色体コピーを指す。
「アレル脱落(ADO)」は、あるアレルの相同染色体の塩基対の集合のうち、少なくとも塩基対の一方が検出されない状況を指す。
「座位脱落(LDO)」は、あるアレルの相同染色体の塩基対の集合のうち、塩基対の両方が検出されない状況を指す。
「ホモ接合」は、対応する染色体座位として類似のアレルを有することを指す。
「ヘテロ接合」は、対応する染色体座位として類似しないアレルを有することを指す。
「ヘテロ接合性率」は、集団におけるある座位にヘテロ接合アレルを有する個体の率を指す。ヘテロ接合性率はまた、個体あるいはDNAまたはRNA試料におけるある座位に存在するアレルの期待比率または測定比率を指すことがある。
「染色体領域」は染色体の分節、または完全な染色体を指す。
「染色体の分節」は、染色体の部分を指し、1塩基対から完全な染色体までの大きさである可能性がある。
「染色体」は、完全な染色体、または染色体の分節すなわち部分を指す。
「コピー」は、染色体分節のコピー数を指す。この用語は、染色体分節の同一コピー、同一ではないが相同であるコピーを指す場合がある。同一ではないが相同であるコピーでは、染色体分節の各コピーが実質的に類似した座位集合を含み、1つ以上のアレルが異なっている。M2コピー誤り等、異数性のいくつかの場合では、ある染色体分節のコピーのうち、一部が同一コピーであり、一部が同一ではないコピーである可能性がある。
「ハプロタイプ」は、典型的には同じ染色体に受け継がれる複数の座位に存在するアレルの組み合わせを指す。ハプロタイプは、座位の所定の集合間で起こった組換え事象の数に応じて少なくとも2つの座位から完全な染色体までを指すことがある。ハプロタイプはまた、統計的に関連づけられる単一の染色分体上にあるSNPの集合を指し得る。
「ハプロタイプデータ」、および「相決定済みデータ」、「順序付け遺伝子データ」は、二倍体または倍数体における単一の染色体または染色体分節に由来するデータを指し、例えば、二倍体ゲノムにおける分離した母親または父親の染色体コピー等である。
「相決定」は、ある順序づけされていない二倍体(または倍数性)遺伝子データにおいて個体のハプロタイプ遺伝子データを決定する動作を指す。この用語は、1つの染色体に見られるアレルの集合に関して、あるアレルの2つの遺伝子のうちのどちらと、個体の2つの相同染色体のいずれと関連づけられるかを決定する動作を指す場合がある。
「相決定済みデータ」は、1つ以上のハプロタイプが決定された遺伝子データを指す。
「仮説」は、起こりうる状態を指す(例えば、第一の相同染色体または染色体分節が第二の相同染色体または染色体分節と比較してコピー数過剰出現が起こりうる度合い、起こりうる欠失、起こりうる重複、1つ以上の染色体または染色体分節の集合で起こりうる倍数性状態、1箇所以上の座位の集合で起こりうるアレルの状態、起こりうる父系性関係、1つ以上の染色体または染色体分節の集合で起こりうるDNA、RNA、胎児の分画、座位の集合に由来する遺伝子材料の量の集合等)。遺伝子状態が、仮説の各要素が仮説の他の要素との関係で真であるという相対的尤度、あるいは仮説が全体として真であるという相対的尤度を示す確率と結びつけられてもよい。この可能性の集合は1つ以上の要素を含んでいてもよい。
「コピー数仮説」および「倍数性状態仮説」は、個体の染色体または染色体分節のコピー数に関する仮説を指す。この用語はまた、各染色体の同一性(各染色体の元の親、およびその親の2つの染色体のうち、どちらがその個体に存在しているかを含む)に関する仮説を指す場合がある。この用語はまた、関係がある個体が存在する場合、その個体由来の染色体または染色体分節が、ある個体のある染色体と遺伝的に対応するということについての仮説を指す場合がある。
「関係がある個体」は、対象の個体と遺伝的に関係があり、かつ対象の個体とハプロタイプブロックを共有する任意の個体を指す。ある文脈では、関係がある個体は、対象の個体の遺伝学上の親、または親に由来した任意の遺伝子材料(精子、極体、胚、胎児、または子供)であってもよい。この用語はまた、同胞、親、または祖父母を指す場合がある。
「同胞」は、遺伝学上の親が対象の個体と同じである任意の個体を指す。いくつかの態様では、この用語は、生まれた子供、胚、胎児、あるいは生まれた子供、胚、または胎児に由来する1個以上の細胞を指す場合がある。同胞はまた、どちらかの親に由来する半数体個体(例えば、精子、極体、またはハプロタイプ遺伝物質のその他の集合)を指す場合がある。ある個体が、それ自身の同胞と見なされる場合がある。
「子供」は、胚、卵割球、または胎児を指す場合がある。本明細書で開示された態様では、記述した概念は、生まれた子供、胎児、胚、またはそれらに由来する細胞の集合である個体にも等しく適用される。用語「子供」を用いた場合、単に、子供として言及された個体はその親からの遺伝的子孫であることを含意することを意味することがある。
「胎児の」は、「その胎児の」または「その胎児に遺伝的に類似した胎盤領域」を指す。妊婦の胎盤のある部分は、胎児に遺伝的に類似しており、母親の血液中に見られる自由浮遊胎児DNAは、その胎児と一致する遺伝型を有する胎盤の一部に由来する場合がある。胎児の染色体の半分の遺伝子情報は、胎児の母親から受け継がれる。いくつかの態様では、胎児の細胞から得た、母親から受け継がれた染色体に由来するDNAは、「母親由来」ではなく「胎児由来」と見なされる。
「胎児由来のDNA」は、本来、その遺伝型が胎児のものと本質的に同じであった細胞の一部であったDNAを指す。
「母親由来のDNA」は、本来、その遺伝型が母親のものと本質的に同じであった細胞の一部であったDNAを指す。
「親」は、個体の遺伝学上の母親または父親を指す。個体は、典型的には二親、母親と父親を有するが、遺伝子キメラ現象または染色体キメラ現象の場合は必ずしも当てはまらないことがある。親は個体と見なされる場合がある。
「親の文脈」は、対象の二親のうち、一方または両方の関連する2つの染色体のそれぞれについて、あるSNPの遺伝子状態を指す。
「母親の血漿」は、妊婦由来の血液の血漿部分を指す。
「臨床判断」は、個体の健康または生存に影響を及ぼす結果を有する行動を取るか否かという任意の判断を指す。臨床判断はまた、さらなる試験を行う、中絶すること、妊娠状態を維持する、望ましくない表現型を緩和するための行動を取る、またはある表現型に備えるための行動を取ることを指す場合がある。
「診断ボックス」は、本明細書で開示される方法の一側面あるいは複数の側面を行うように設計された1つの機械、またはそのような機械の組み合わせを指す。一態様では、診断ボックスは患者治療の点で設けられている場合がある。一態様では、診断ボックスは、目的の増幅と、その後の配列決定を行う場合がある。一態様では、診断ボックスは独立して、あるいは技術者の助けにより機能する場合がある。
「インフォマティックスに基づく方法」は、大量のデータを解明するために統計学に大きく依存する方法を指す。出生前診断の文脈では、この用語は、(例えば、分子アレイや配列決定からの)大量の遺伝子データがある場合に、直接物理的にその状態を測定するのはなく、統計的に最も可能性のある状態を推測することにより、1つ以上の染色体または染色体分節の倍数性状態、1つ以上のアレルのアレル状態、または父系性を決定するように設計された方法を指す。本開示の一態様では、インフォマティックスに基づく技術は、本特許出願で開示されるものであることがある。本開示の一態様では、インフォマティックスに基づく技術は、PARENTAL SUPPORT(商標:Gen Security Network, Inc.で開発された染色体異数性のスクリーニング技術)である場合がある。
「一次遺伝子データ」は、遺伝型決定プラットフォームによって出力されたアナログ強度信号を指す。SNPアレイの文脈では、一次遺伝子データは、任意の遺伝型呼び出しが行われる前の強度信号を指す。配列決定の文脈では、一次遺伝子データは、任意の塩基対の同一性が決定される前、および配列がゲノムにマッピングされる前に配列決定装置から出力される、クロマトグラムに類似したアナログ測定を指す。
「二次遺伝子データ」は、遺伝型決定プラットフォームによって出力された処理済み遺伝子データを指す。SNPアレイの文脈では、二次遺伝子データは、SNPアレイ読取り器に関連づけられたソフトウェアによってなされるアレル呼び出しを指し、このソフトウェアは、あるアレルが試料中に存在するか否かを呼び出す。配列決定の文脈では、二次遺伝子データは、決定された配列の塩基対の同一性を指す。また、配列がゲノムにマッピングされた場合の塩基対の同一性を指し得る。
「ある座位に対応するDNAの優先富化またはある座位に存在するDNAの優先富化」は、富化後のDNA混合物中のその座位に対応するDNA分子の百分率を、富化前のDNA混合物中のその座位に対応するDNA分子の百分率よりも高くする任意の方法を指す。この方法は、ある座位に対応するDNA分子の選択的増幅を含む場合がある。この方法は、その座位に対応しないDNA分子を除去することを含む場合がある。この方法は、複数の方法の組み合わせを含む場合がある。富化度は、富化後の混合物中のその座位に対応するDNA分子の百分率を、富化前の混合物中のその座位に対応するDNA分子の百分率で除したものとして定義される。優先富化が複数の座位について行われる場合がある。本開示のいくつかの態様では、富化度は、20、200、または2,000より大きい。優先富化が複数の座位について行われる場合、富化度は、座位の集合におけるすべての座位の平均富化度を指すことがある。
「増幅」は、DNA分子またはRNA分子のコピー数を増加させる方法を指す。
「選択的増幅」は、特定のDNA(またはRNA)分子のコピー数、またはDNA(またはRNA)の特定の領域に対応するDNA(またはRNA)分子のコピー数を増加させる方法を指す場合がある。この用語はまた、非対象DNA(またはRNA)分子または領域の増加以上に特定の対象DNA(またはRNA)分子または対象DNA(またはRNA)領域のコピー数を増加させる方法を指す場合がある。選択的増幅は優先富化の方法であってもよい。
「汎用プライミング配列」は、例えば、ライゲーション、PCR、またはライゲーション媒介PCRによって対象DNA(またはRNA)分子の集団に付加されてもよいDNA(またはRNA)配列を指す。一旦、汎用プライミング配列が対象分子の集団に付加されると、この汎用プライミング配列に特異的なプライマーを用いて、この対象集団を1対の増幅プライマーにより増幅させることができる。汎用プライミング配列は、通常、対象配列と関係がない。
「汎用接着体」、「ライゲーション接着体」、または「ライブラリー標識」は、対象の二本鎖核酸分子の集団の5’末端および3’末端に共有結合することができる汎用プライミング配列を含む核酸分子である。接着体の付加により、PCR増幅を開始させることができる対象集団の5’末端および3’末端に汎用プライミング配列が供給され、1対の増幅プライマーを用いてこの対象集団からすべての分子を増幅させる。
「対象化」は、DNA(またはRNA)混合物中の座位の集合に対応するDNA(またはRNA)分子を選択的に増幅または優先的に富化するために用いられる方法を指す。
「同時分布モデル」は、変数の確率が結合される同じ確率空間で定義された複数のランダム変数を仮定していくつかのランダム変数で定義される事象の確率を定義するモデルを指す。いくつかの態様では、変数の確率が結合されない縮退した場合が用いられることがある。
「癌関連遺伝子」は、癌の危険性の変化または予後の変化に関連した遺伝子を指す。癌を促進する癌関連遺伝子の例としては、癌遺伝子、細胞増殖、浸潤、または転移を高める遺伝子、アポトーシスを阻害する遺伝子、および血管形成促進遺伝子等が挙げられる。癌を阻害する癌関連遺伝子の例としては、腫瘍抑制遺伝子、細胞増殖、浸潤、または転移を阻害する遺伝子、アポトーシスを促進する遺伝子、および血管形成阻害遺伝子等が挙げられるが、これらに限定されない。
「エストロゲン関連癌」は、エストロゲンによって調節される癌を指す。エストロゲン関連癌の例としては、乳癌および卵巣癌が挙げられるが、これらに限定されない。Her2は多くのエストロゲン関連癌で過剰発現する(米国特許第6,165,464号、参照によりその全体が本明細書に組み込まれる)。
「アンドロゲン関連癌」は、アンドロゲンによって調節される癌を指す。アンドロゲン関連癌の例としては、前立腺癌がある。
「正常な発現量より高い」とは、対照としての対象者(例えば、癌等の病気や疾患がない対象者)のmRNAまたはタンパク質の平均発現量よりも高いことを指す。様々な態様では、この正常な発現量より高い発現量は、対照としての対象者における発現量に対して少なくとも20、40、50、75、90、100、200、500,あるいは1000%、多くなっている。
「正常な発現量より低い」とは、対照としての対象者(例えば、癌等の病気や疾患がない対象者)のmRNAまたはタンパク質の平均発現量よりも低いことを指す。様々な態様では、この正常な発現量より高い発現量は、対照としての対象者における発現量に対して少なくとも20、40、50、75、90、95、または100%、低くなっている。いくつかの態様では、mRNAまたはタンパク質の発現が検出不能である。
「発現または活性を調節する」とは、例えば、対照条件に対してタンパク質または核酸配列の発現または活性を増加あるいは低減させることを指す。いくつかの態様では、発現または活性における調節は、少なくとも10、20、40、50、75、90、100、200、500、または1000%の増加あるいは低減である。様々な態様では、転写、翻訳、mRNAまたはタンパク質の安定性、あるいは生体内の他の分子へのmRNAまたはタンパク質の結合が治療によって調節される。いくつかの態様では、mRNAの量が標準的なノーザンブロット解析によって求められ、タンパク質の量が標準的なウエスタンブロット解析(例えば、本明細書において記載する解析や、例えばAusubel et al. (Current Protocols in Molecular Biology(分子生物学における最新のプロトコル), John Wiley & Sons, New York, July 11, 2013, 参照によりその全体が本明細書に組み込まれる)で記述された解析)によって求められる。一態様では、タンパク質の量は、標準的な方法を用いて酵素活性の量を測定することにより求められる。他の好ましい態様では、mRNA、タンパク質、または酵素活性の量は、タンパク質の機能型を発現していない対照細胞(例えば、ノンセンス変異の場合ホモ接合である細胞等)のそれらの量より多いが、20倍、10倍、5倍、または2倍以下である。さらに他の態様において、mRNA、タンパク質、または酵素活性の量は、対照細胞(例えば、非癌細胞、異常細胞増殖を誘発する条件、またはアポトーシスを阻害する条件にさらされなかった細胞、目的の病気または疾患を有しない対象者由来の細胞等)の基礎量より多いが、20倍、10倍、5倍、または2倍以下である。
「mRNAまたはタンパク質の発現または活性を調節するのに十分な投与量」は、対象者に投与するとmRNAまたはタンパク質の発現または活性が増加あるいは低減する治療法の量を指す。いくつかの態様では、発現または活性を低減させる化合物の場合、調節は、治療を受けた対象者において、阻害薬を投与される前の同じ対象者と比べて、あるいは治療を受けていない対照としての対象者と比べて少なくとも10%、30%、40%、50%、75%、または90%、発現または活性を低減させることである。また、いくつかの態様では、発現または活性を増加させる化合物の場合、治療を受けた対象者のmRNAまたはタンパク質の発現量または活性量は、調節薬を投与する前の同じ対象者あるいは治療を受けていない対照としての対象者の発現量または活性量に比べて1.5倍、2倍、3倍、5倍、10倍、または20倍多くなっている。
いくつかの態様では、化合物はRNAまたはタンパク質の発現または活性を直接または間接に調節することがある。例えば、ある化合物は、目的mRNAまたはタンパク質の発現または活性に直接または間接に影響を及ぼす分子(例えば、核酸、タンパク質、シグナル伝達分子、成長因子、サイトカイン、またはケモカイン)の発現または活性を調節することで目的のmRNAまたはタンパク質の発現または活性を間接的に調節することがある。いくつかの態様では、前記化合物は、細胞分裂を阻害する、あるいはアポトーシスを誘発する。前記治療法におけるこれらの化合物の例としては、非精製タンパク質または精製タンパク質、抗体、合成有機分子、天然有機分子、核酸分子、およびこれらの成分等が挙げられる。併用療法においてこれらの化合物は同時または順次に投与されてもよい。これらの化合物としては、例えば、シグナル伝達抑制分子が挙げられる。
「精製」は、天然に伴っている他の成分から分離することを指す。通常、ある因子の少なくとも50重量%が天然の状態で関連づけられたタンパク質、抗体、および天然有機分子を含まなければ、その因子は実質的に純粋である。いくつかの態様では、前記因子は少なくとも75重量%、90重量%、または99重量%純粋である。実質的に純粋な因子は、化学合成、天然源からのその因子の分離、または天然にはその因子を生成しない組み換え宿主細胞におけるその因子の生成によって得られることがある。タンパク質および小分子は、例えば、Ausubel et al.(Current Protocols in Molecular Biology, John Wiley & Sons, New York, July 11, 2013, 参照によりその全体が本明細書に組み込まれる)に記載された標準的な技術を用いて当業者によって精製されることがある。いくつかの態様では、ポリアクリルアミドゲル電気泳動法、カラムクロマトグラフィー、光学濃度、HPLC分析、またはウエスタン分析(Ausubel et al., supra)を用いた測定において前記因子は開始材料の少なくとも2倍、5倍、または10倍純粋である。精製の方法としては、例えば、免疫沈殿、カラムクロマトグラフィー(例えば、免疫親和性クロマトグラフィー)、磁性ビーズ免疫親和性精製、およびプレート結合抗体によるパニング等が挙げられる。
本発明の他の特徴および利点は、以下の詳細な説明および請求項から明らかである。
本特許すなわち出願書類は、少なくとも1つのカラー図面を含む。カラー図面付きの本特許あるいは特許出願公報の複製は、請求と必要手数料の支払いががあれば特許庁より提供される。
本明細書において開示される態様は、添付の図面を参照してさらに説明される。いくつかの図面で、同様の構造には同様の参照符号が付けられている。ここに示めす図面は必ずしも縮尺通りではなく、むしろ本明細書において開示される態様の原則の説明に強調が置かれている。
SNP数の増加に対し、リード深度(DOR)が500、腫瘍分画が1%の検定統計量SをT(SNP数)で除した(「S/T」)異なるコピー数仮説に関する分布を示すグラフである。
SNP数の増加に対し、DORが500、腫瘍分画が2%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
SNP数の増加に対し、DORが500、腫瘍分画が3%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
SNP数の増加に対し、DORが500、腫瘍分画が4%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
SNP数の増加に対し、DORが500、腫瘍分画が5%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
SNP数の増加に対し、DORが500、腫瘍分画が6%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
SNP数の増加に対し、DORが1000、腫瘍分画が0.5%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
SNP数の増加に対し、DORが1000、腫瘍分画が1%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
SNP数の増加に対し、DORが1000、腫瘍分画が2%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
SNP数の増加に対し、DORが1000、腫瘍分画が3%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
SNP数の増加に対し、DORが1000、腫瘍分画が4%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
SNP数の増加に対し、DORが3000、腫瘍分画が0.5%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
SNP数の増加に対し、DORが3000、腫瘍分画が1%の場合の、異なるコピー数仮説に関するS/T分布を示すグラフである。
6種の微少欠失症候群を検出するための感度および特異性を示す表である。
正倍数性をグラフ表示したものである。x軸は染色体に沿った個体の多型座位の直線位置を表し、y軸はアレルの総リード数(A+B)の分画としてアレルAのリード数を表す。母親の遺伝型および胎児の遺伝型は、プロットの右側に示されている。各プロットは母親の遺伝型に応じて色づけされている。例えば、赤色は母親の遺伝型AA、青色は母親の遺伝型BB、緑色は母親の遺伝型ABを表す。図15Aは、2本の染色体が存在し、胎児の無細胞DNA分画が0%であるときのプロットである。このプロットは、妊娠していない女性由来のものであり、よってその遺伝型はすべて母親のものであるパターンを表す。したがって、アレル群は1(AAのアレル)、0.5(ABのアレル)、および0(BBのアレル)に集中している。図15Bは、2本の染色体が存在し胎児の分画が12%であるときのプロットである。アレルAのリードの分画に含まれる胎児のアレルによって、アレルの点の位置がy軸に沿って上または下にシフトしている。図15Cは2本の染色体が存在し胎児の分画が26%である時のプロットである。このパターンには、2本の赤い周辺バンドと2本の青い周辺バンドを含み、3本の緑色の中のバンドが容易に見える。
22q11.2欠失症候群をグラフ表示したものである。図16Aは、母親の22q11.2欠失の保有者についての図である(緑色のABのSNPがないことによって示されている)。図16Bは、親から受け継がれた胎児の22q11欠失についての図である(1本の赤い周辺バンドと1本の青い周辺バンドで示されている)。x軸はSNPの直線位置を表し、y軸は総リード数におけるアレルAのリードの分画を表す。各点は、単一のSNP座位を表す。
母親から受け継がれた猫鳴き欠失症候群のグラフ表示である(3本の緑色のバンドの代わりに2本の中央の緑色のバンドの存在によって示されている)。x軸はSNPの直線位置を表し、y軸は総リード数におけるアレルAのリードの分画を表す。各点は、単一のSNP座位を表す。
ウォルフ・ヒルシュホーン欠失症候群のグラフ表示である(1本の赤い周辺バンドと1本の青い周辺バンドによって示されている)。x軸はSNPの直線位置を表し、y軸は総リード数におけるアレルAのリードの分画を表す。各点は、単一のSNP座位を表す。
染色体または染色体分節の余剰コピーを表す、X染色体スパイク・イン(spike-in)実験のグラフ表示である。これらのプロットは、異なる量の父親由来のDNAを娘由来のDNAと混合したものを示しており、それぞれ、父親由来のDNAが16%(図19A)、10%(図19B)、1%(図19C)、および0.1%(図19D)である。x軸はX染色体にあるSNPの直線位置を表し、y軸は総リード数(M+R)におけるアレルMのリードの分画を表す。各点は、アレルMまたはRを有する単一のSNP座位を示す。 同上。 同上。 同上。
ハプロタイプデータを用いた偽陰性率のグラフ(図20A)、およびハプロタイプデータを用いない偽陰性率のグラフ(図20B)である。
ハプロタイプデータを用いたp=1%での偽陽性率のグラフ(図21A)、およびハプロタイプデータを用いないp=1%での偽陽性率のグラフ(図21B)である。
ハプロタイプデータを用いたp=1.5%での偽陽性率のグラフ(図22A)、およびハプロタイプデータを用いないp=1.5%での偽陽性率のグラフ(図22B)である。
ハプロタイプデータを用いたp=2%での偽陽性率のグラフ(図23A)、およびハプロタイプデータを用いないp=2%での偽陽性率のグラフ(図23B)である。
ハプロタイプデータを用いたp=2.5%での偽陽性率のグラフ(図24A)、およびハプロタイプデータを用いないp=2.5%での偽陽性率のグラフ(図24B)である。
ハプロタイプデータを用いたp=3%での偽陽性率のグラフ(図25A)、およびハプロタイプデータを用いないp=3%での偽陽性率のグラフ(図25B)である。
第一のシミュレーション用の偽陽性率表である。
第一のシミュレーション用の偽陰性率表である。
図28Aは、正常な(非癌性)細胞株について、その座位の総数で除した基準数(1つのアレル(例えば、アレル「A」)の数)のグラフである。図28Bは、欠失を有する癌細胞株について、総数で除した基準数のグラフである。図28Cは、上記正常細胞株と癌細胞株に由来するDNAの混合物について、基準計数を総計数で除したグラフである。
腫瘍分画が4.33%と推定された(DNAの4.33%が腫瘍細胞である)段階IIaの乳癌の患者に由来する血漿試料について、基準計数を総計数で除したグラフである。このグラフの緑色の部分は、CNVが存在しない領域を表す。このグラフの青色部分および赤色部分は、CNVが存在し、かつ期待アレル比率0.5から測定アレル比率が明らかに分離している領域を表す。青色はあるハプロタイプを示し、赤色は他のハプロタイプを示す。CNVの領域では、約636個のヘテロ接合SNPが分析された。
腫瘍分画が0.58%と推定された段階IIbの乳癌の患者に由来する血漿試料について、基準計数を総計数で除したグラフである。このグラフの緑色の部分は、CNVが存在しない領域を表す。このグラフの青色部分および赤色部分は、CNVが存在するが、測定アレル比率が期待アレル比率0.5からはっきりとは分離していない領域を示す。この分析では、CNVの領域で86個のヘテロ接合SNPが分析された。
腫瘍分画の最尤推定を示すグラフである。最尤推定値はグラフのピークで示され、図31Aでは4.33%、図31Bでは0.58%である。
図32Aは、高腫瘍分画試料(4.33%)および低腫瘍分画試料(0.58%)について、様々な起こりうる腫瘍分画の対数オッズ比を比較したグラフである。対数オッズ比が0未満の場合、正倍数体仮説が最も可能性が高い。対数オッズ比が0超の場合、CNVの存在が最も可能性が高い。図32Bは、低腫瘍分画試料(0.58%)について、様々な起こりうる腫瘍分画で欠失の確率を欠失がない確率で除したもののグラフである。
低腫瘍分画試料(0.58%)について、様々な起こりうる腫瘍分画の対数オッズ比を示すグラフである。図33は、図32Aの低腫瘍分画試料のグラフを拡大したものである。
実施例6に記載する3つの異なる方法を用いた腫瘍生検材料中の一塩基多様体の検出限界を示すグラフである。
実施例6に記載する3つの異なる方法を用いた血漿試料中の一塩基多様体の検出限界を示すグラフである。
CNVを検出するように設計された約28,000本のプライマーのライブラリーを用いてゲノムDNA(図36A)または単一の細胞に由来するDNA(図36B)を分析したグラフである。中央に存在する1本ではなく2本のバンドがCNVの存在を示している。x軸はSNPの直線位置を表し、y軸は総リード数におけるアレルAのリードの分画を表す。
CNVを検出するように設計された約3,000本のプライマーのライブラリーを用いてゲノムDNA(図37A)または単一の細胞に由来するDNA(図37B)を分析したグラフである。中央に存在する1本ではなく2本のバンドがCNVの存在を示している。x軸はSNPの直線位置を表し、y軸は総リード数におけるアレルAのリードの分画を表す。
約3,000座位のDORにおける均一性を示すグラフである。
ゲノムDNAおよび単一の細胞に由来するDNAについて、誤り呼び出しの評価基準を比較した表である。
転移型変異および転換型変異の誤り率を示すグラフである。
PlasmArtで決定したCoNVERGeの感度を示すグラフである。(a)は、22q11.2欠失および一致型正常細胞株に由来するDNAを含むPlasmArt試料のCoNVERGeで算出された平均アレル不均衡率(AAI)と実際の入力分画との相関関係である。(b)は、0〜9.09%の腫瘍DNA分画を含む、染色体2pおよび2qのCNVおよび一致型正常HCC2218BL細胞を含むHCC2218乳癌細胞に由来するDNAを含むPlasmArt試料の算出されたAAIと実際の腫瘍DNA入力との相関関係である。(c)は、0〜5.66%の腫瘍DNA分画を含む、染色体1pおよび1qのCNVおよび一致型正常HCC1954BL細胞を含むHCC1954乳癌細胞に由来するDNAを含むPlasmArt試料の算出されたAAIと実際の腫瘍DNA入力の相関関係である。(d)は、(c)で用いたHCC1954細胞のアレル頻度のプロットである。(a)、(b)、および(c)では、データ点および誤差範囲(エラーバー)は、それぞれ3〜8個の反復の平均値および標準偏差(SD)を示す。
PlasmArt基準に関する詳細の一例を示しており、下部には断片の寸法分布を示すグラフを含む。
左は、微少欠失および癌パネルの妥当性のためのPlasmArt合成ctDNA標準試料から得た結果の希釈曲線である。右のパネルは、オッズ比のプロットとして、DNA分画の腫瘍の最尤推定を示す。 図43Bは、転換事象が検出されたプロットである。図43Cは、転移事象が検出されたプロットである。
ctDNAの%が異なる様々な試料について、異なる染色体領域のCNVを示すプロットである。
ctDNA量(%)が異なる様々な卵巣癌試料について、異なる染色体領域のCNVを示すプロットである。
ctDNA中のSNV、またはSNVおよび/またはCNVの組み合わせを有する乳癌または肺癌の患者のパーセントを示す表である。
異なる段階の乳癌における、血漿試料中に含まれる腫瘍に特異的なSNVおよび/またはCNV(%)を示すグラフと、その右側のデータ関連表である。
異なる下位段階の乳癌における、血漿試料中に含まれる腫瘍に特異的なSNVおよび/またはCNV(%)を示すグラフと、その右側のデータ関連表である。
異なる段階の肺癌における、血漿試料中に含まれる腫瘍に特異的なSNVおよび/またはCNV(%)を示すグラフと、その右側のデータ関連表である。
異なる下位段階の肺癌における、血漿試料中に含まれる腫瘍に特異的なSNVおよび/またはCNV(%)を示すグラフと、その右側のデータ関連表である。
腫瘍のクローンおよび準クローンの不均一性について分析された一次肺腫瘍の組織学的所見/履歴を示す。 全ゲノムの配列決定およびAmpliSEQによるアッセイによる生検された肺腫瘍の多様性アレル頻度(VAF)の同一性を示す表である。
血漿に由来するctDNAを用いて、腫瘍の不均一性を克服するための一塩基付加(SNA)変異のクローンおよび準クローンの両方の同定を示す。
AmpliSeqで見逃されたが、血漿由来のctDNA中で同定されたSNV変異である一次腫瘍のSNVを検出するための、AmpliSeqおよびmmPCR−NGSによるVAF呼び出しを比較した表である。
図54Aは、一次肺腫瘍におけるVAF(%)を示すプロットである。図54Bは、AmpliSeqによるVAFとNateraによるVAFを比較した直線回帰プロットである。
プライマー濃度が限定された場合のSNVの84プレックスPCRプライマー反応のプール1/4のグラフである。
プライマー濃度が限定された場合のSNVの84プレックスPCRプライマー反応のプール2/4のグラフである。
プライマー濃度が限定された場合のSNVの84プレックスPCRプライマー反応のプール3/4グラフである。
プライマー濃度が限定された場合のSNVの84プレックスPCRプライマー反応のプール4/4のグラフである。
15PCRサイクルの84プレックスPCR反応においてSNV転移および転換変異を検出した場合の検出限界(LOD)とリード深度(DOR)のプロットである。
20PCRサイクルの84プレックスPCR反応においてSNV転移および転換変異を検出した場合の検出限界(LOD)とリード深度(DOR)のプロットである。
25PCRサイクルの84プレックスPCR反応においてSNV転移および転換変異を検出した場合の検出限界(LOD)とリード深度(DOR)のプロットである。
腫瘍細胞のゲノムDNAと単一細胞のゲノムDNAの感度を比較したプロットである。上部は腫瘍細胞のゲノムDNAを示す。下部は単一細胞のゲノムDNAを示す。
図63aのSNPを対象とした大多重PCR(mmPCR)アッセイにおける各種癌試料中のCNVの分析の作業フローを示す。図63b〜図63fは、乳癌細胞株と一致型正常細胞株についてCoNVERGeアッセイとマイクロアレイアッセイでの比較を示す。
生の冷凍(FF)乳癌試料およびホルマリン固定パラフィン埋め込み(FFPE)乳癌試料と一致型対照との比較を示す。図a〜hは、乳癌細胞株と一致型軟膜gDNA対照試料に対するCoNVERGeアッセイとマイクロアレイアッセイを比較したものである。
CoNVERGeアッセイを用いて染色体コピー数を反映させて、単一細胞中のCNVを検出したアレル頻度のプロットである。図65a〜65cは乳癌単一細胞の3つの反復の分析である。図65dは、注目領域でのCNVがないBリンパ球細胞株の分析である。
CoNVERGeアッセイを用いて染色体コピー数を反映させて、実際の血漿試料中のCNVを検出したアレル頻度のプロットである。図66aは、段階IIの乳癌の血漿無細胞DNA試料およびその一致型腫瘍生検材料gDNAである。図66bは、末期の卵巣癌の血漿無細胞DNA試料およびその一致型腫瘍生検材料gDNAである。図66cは、5つの末期の卵巣癌血漿および一致型組織試料におけるCNV検出により求められた腫瘍の不均一性を示す表である。
乳癌の染色体位置および変異による変化を示す。 同上。 同上。 同上。
3168mmPCR反応に用いられたSNPの多数アレル頻度(図68A)および少数アレル頻度(図68B)を示す。
本発明の態様を行うのに有用なシステム設計X00の一例を示す。
本発明の態様を行うためのコンピュータシステムの一例を示す。 記載したこれらの図面に態様が開示されているが、考察で述べたように、他の態様もまた企図されている。本開示は、典型として例示的な態様を示したものであり、限定ではない。当業者であれば、本明細書において開示される態様の原則の範囲と主旨を逸脱しない範囲で、多くの他の修正および態様を工夫することが可能である。
一側面において、本発明は一般に、少なくとも特に染色体分節または完全な染色体の欠失または重複等のコピー数多様性の有無を決定する改良された方法に関する。前記方法は、小さい欠失または重複の検出に特に有用である。このような小さい欠失または重複は、関連する染色体分節から入手可能なデータ量が少ないために従来の方法を用いて高い特異性と感度で検出することが困難な可能性がある。前記方法は、改良された分析方法、改良されたバイオアッセイ方法、および改良された分析方法と改良されたバイオアッセイ方法の組み合わせを含む。本発明の方法はまた、検査される細胞または核酸分子に存在する百分率が小さい欠失または重複を検出するのに用いることができる。これにより、病気の発症前(例えば、前癌性段階等)あるいは病気の初期段階(例えば、多数の病気の細胞(例えば、癌細胞)に欠失または重複が蓄積する前等)に欠失または重複を検出することができる。病気または障害と関連づけられた欠失または重複をより正確検出することにより、その病気または障害の診断、予知、防止、遅延、安定化、または治療を行うための改良された方法を提供することができる。数種の欠失または重複は、癌あるいはいくつかの精神障害または身体障害と関連づけられることが知られている。
他の側面では、本発明は一般に、少なくとも特に一塩基多様性(SNV)を検出する改良された方法に関する。これらの改良された方法は、改良された分析方法、改良されたバイオアッセイ方法、および改良された分析方法と改良されたバイオアッセイ方法の組み合わせを用いた改良された方法を含む。特定の例示的な態様において、前記方法を用いて、例えば、SNVが非常に低濃度(例えば、循環遊離DNA試料等のSNV座位の正常なコピーの総数の10%、5%、4%、3%、2.5%、2%、1%、0.5%、0.25%、または0.1%未満等)で存在する試料において癌の検出、診断、監視、または病期分類が行われる。すなわち、特定の例示的な態様において、これらの方法は、遺伝子座位に存在する正常な多型アレルに対して比較的低い百分率の変異または多様体が存在する試料に特に好適である。最後に、コピー数多様性を検出するための改良された方法と一塩基多様性を検出するための改良された方法を組み合わせた方法が本明細書において開示される。
癌等の病気の治療の成功は、初期診断、疾患の正しい病期分類、有効治療投薬計画の選択、および再発を防止または検出するための緊密な監視に依存することが多い。癌診断の場合、組織生検から得られた腫瘍材料の組織学的評価が、最も信頼性の高い方法であると考えられがちである。しかしながら、生検に基づく試料化が有する侵襲性のため、集団検診および定期検診の場合にはこのような試料化の実行が困難である。したがって、本発明の方法は、希望すれば、比較的低コストで短い所要時間で非侵襲的な方法で行えるという利点を有する。本発明の方法により用いられてもよい標的配列決定は、必要なリードがショットガン配列決定よりも少なく(例えば、4000万リードではなく、数百万リード)、これによりコストが低減する。用いられてもよい多重PCRおよび次世代配列決定により、処理能力が増加し、コストが低下する。
いくつかの態様では、前記方法を用いて個体中の欠失、重複、または一塩基多様体が検出される。欠失、重複、または一塩基多様体を有すると疑われる細胞または核酸を含む個体に由来する試料が分析されてもよい。いくつかの態様では、この試料は、欠失、重複、または一塩基多様体を有することが疑われる組織または器官(癌性が疑われる細胞または腫瘤等)に由来する。本発明の方法を用いて、欠失、重複、または一塩基多様体を有する細胞と欠失、重複、または一塩基多様体を有しない細胞の混合物中の1個の細胞または少数の細胞にのみ存在する欠失、重複、または一塩基多様体を検出することができる。いくつかの態様では、前記個体に由来する血液試料に由来する無細胞DNAまたは無細胞RNAが分析される。いくつかの態様では、無細胞DNAまたは無細胞RNAは、癌細胞等の細胞によって分泌される。いくつかの態様では、無細胞DNAまたは無細胞RNAは、癌細胞等、壊死またはアポトーシスを起こしている細胞によって放出される。本発明の方法を用いて、無細胞DNAまたは無細胞RNAに低い百分率でのみ存在する欠失、重複、または一塩基多様体を検出することができる。いくつかの態様では、胚に由来する1個以上の細胞が検査される。
いくつかの態様では、前記方法は、胎児の非侵襲性または侵襲性出生前検査に用いられる。これらの方法は、染色体分節または染色体全体の欠失または重複(例えば、いくつかの精神障害または身体障害、学習障害、または癌に関連づけられることが知られている欠失または重複等)の有無を決定するのに用いることができる。いくつかの態様では、非侵襲出生前検査(NIPT)で妊娠している母親に由来する血液試料に由来する細胞、無細胞DNA、または無細胞RNAが検査される。前記方法により、妊娠している母親由来の細胞、無細胞DNA、または無細胞RNAの量が多くても、胎児に由来する細胞、無細胞DNA、または無細胞RNAの欠失または重複を検出することができる。いくつかの態様では、侵襲性出生前検査で胎児に由来する試料(例えば、CVSまたは羊水穿刺試料)に由来するDNAまたはRNAが検査される。前記試料が妊娠している母親由来のDNAまたはRNAで汚染されている場合は、前記方法を用いて胎児のDNAまたはRNAの欠失または重複を検出することができる。
コピー数多様性の有無の決定に加えて、必要に応じて1種以上の他の因子を分析することができる。これらの因子を用いて、診断(例えば癌の有無または癌の危険性の増加の決定、癌の分類、または癌の病期分類)あるいは予後の正確度を高めることができる。これらの因子を用いて、対象者に有効と思われる特定の治療法または治療計画を選択することもできる。このような因子の例としては、多型または変異の有無、無細胞DNA、無細胞RNA、ミクロRNA(miRNA)の総量あるいは特定のどれかの変化(増加または低下)量、変化した(増加または低下した)腫瘍分画、メチル化の変化(増加または低下)量、変化した(増加または低下した)DNAの完全性、変化した(増加または低下した)あるいは別のmRNAスプライシング等が挙げられる。
以下に、相決定済みデータ(例えば、推定または測定された相決定済みデータ)または相未決定データを用いて欠失または重複を検出するための方法、検査可能な試料、試料を調製、増幅、および定量するための方法、遺伝子データの相決定法、検出可能な多型,変異、核酸の変化、mRNAスプライシングの変化、および核酸の量の変化、前記方法に由来する結果のデータベース、他の危険因子およびスクリーニング方法、診断または治療可能な癌、癌治療、治療法を検査するための癌モデル、および治療法を処方および実施するための方法について記載する。
相決定済みデータを用いて倍数性を決定するための方法の例
本発明の前記方法のいくつかは、CNVの検出に相未決定データを用いた場合に比べて、相決定済みデータを用いた場合に擬似陰性率および偽陽性率が低下するという発見に一部基づいている(図20A〜図27)。この改良は、少ない量で存在するCNVを含む試料にとって恩恵が多い。よって、(例えば、異なる座位のアレル比率が、同じまたは異なるハプロタイプが異常な量で存在している可能性を示すことを考慮せずに、ある染色体または染色体分節の1箇所以上の座位に存在するアレルの比率または集計値(例えば、平均値)を与えるための集計アレル比率を算出する方法等)相未決定データを用いた場合に比べて、相決定済みデータはCNV検出の正確度を高める。相決定済みデータを用いることにより、測定アレル比率と期待アレル比率との差がノイズによるものなのか、あるいはCNVの存在によるものなのかをより正確に決定することができる。例えば、ある領域の大部分またはすべての座位の測定アレル比率と期待アレル比率との差が同じハプロタイプの過剰出現を示している場合、CNVが存在する可能性がより高い。あるハプロタイプのアレルの連鎖を用いると、測定済み遺伝子データが、(ランダムノイズではなく)同じハプロタイプの過剰出現と一致するかどうかを決定することができる。これに対して、測定アレル比率と期待アレル比率との差がノイズ(例えば、実験誤差)のみによるものである場合、いくつかの態様では、約半分の時間は第一のハプロタイプが過剰出現しており、残りの約半分の時間は第二のハプロタイプが過剰出現しているようである。
SNP間の連鎖、および胎児に成長した胚を形成した配偶子を発生させた減数分裂時に発生した交差の尤度を考慮することで正確度を高めることができる。1つ以上の仮説についてアレル測定の期待分布を作成する際に連鎖を用いると、連鎖を用いない場合に比べてより実際のものに一致したアレル測定の期待分布を作成することができる。例えば、互いに近接する2つのSNP1および2があり、母親の一方の相同体1にあるSNP1がA、SNP2がA、他方の相同体2にあるSNP1がB、SNP2がBであるとする。父親の両方の相同体にあるSNPがどちらもAであり、胎児のSNP1でBが測定された場合、相同体2が胎児によって受け継がれたこと、したがって、胎児のSNP2にBが存在する尤度がより高いことを示している。連鎖を考慮するモデルではこれを予測することができるが、連鎖を考慮しないモデルでは予測できない。あるいは、母親のSNP1がAB、近隣のSNP2がABである場合、この位置での母親の三染色体性に一致する2つの仮説、すなわち、一致型コピー誤り(胎児の初期の発達時の減数分裂IIまたは有糸分裂での不分離)を含むという仮説および部分一致型コピー誤り(減数分裂Iでの不分離)を含むという仮説を用いることができる。一致型コピー誤りの三染色体性であれば、胎児が母親からSNP1にAAを受け継いだ場合、この胎児は、SNP2にABではなくAAまたはBBのいずれかを受け継いでいる可能性がより高い。部分一致型コピー誤りであれば、胎児は母親からSNP1および2の両方にABを受け継いでいる。連鎖を考慮したCNV呼び出し法で作成したアレル分布仮説はこれらの予測を行うことができる。したがって、連鎖を考慮しないCNV呼び出し法よりも、より実際のアレル測定に一致させることができる。
いくつかの態様では、相決定済み遺伝子データを用いて、(例えば、1個以上の細胞のゲノム中、あるいは無細胞DNAまたは無細胞RNA中の)個体のゲノム中の第二の相同染色体分節に比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかが決定される。過剰出現の例としては、第一の相同染色体分節の重複、または第二の相同染色体分節の欠失が挙げられる。いくつかの態様では過剰出現はない、というのは第一および第二の相同染色体分節が等しい割合(例えば、二倍体試料中に各分節のコピーが1つ)で存在するからである。いくつかの態様では、核酸試料の算出済みアレル比率を期待アレル比率と比較し、以下でさらに説明するように過剰出現があるかどうかが決定される。本明細書において、用語「第二の相同染色体分節と比較しての第一の相同染色体分節」は、ある染色体分節の第一の相同体とその染色体分節の第二の相同体を意味する。
いくつかの態様では、前記方法は、前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに第一の相同染色体分節についてその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、前記多型座位の集合のうちの各座位に存在する各アレルについて、前記個体由来の1個以上の目的細胞および1個以上の目的でない細胞に由来するDNAまたはRNA試料中に存在する各アレルの量を含む測定されたアレルの遺伝子データを得ることとを含む。いくつかの態様では、前記方法は、第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙し、前記仮説のそれぞれについて、前記1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する1つ以上の起こりうる比率について、得られた相決定済み遺伝子データから前記試料中の複数の座位の期待遺伝子データを算出し、DNAまたはRNAの可能な比率ごと、および仮説ごとに、そのDNAまたはRNAの起こりうる比率とその仮説について得られた試料の遺伝子データと前記試料の期待遺伝子データのデータ適合を(コンピュータ等で)算出し、前記データ適合に応じて1つ以上の仮説をランク付けし、最高ランクの仮説を選択して、前記個体に由来する1個以上の細胞のゲノム中の第一の相同染色体分節のコピー数の過剰出現度を決定することとを含む。
一側面において、本発明は、胎児のゲノム中の目的の染色体または染色体分節のコピー数を決定する方法を特徴とする。いくつかの態様では、前記方法は、前記胎児の少なくとも一方の生物学上の親の相決定済み遺伝子データを得ることを含み、ここで、前記相決定済み遺伝子データが前記親の第一の相同染色体分節および第二の相同染色体分節にある多型座位の集合のうちの各座位に存在するアレルの同一性を含む。いくつかの態様では、前記方法は、各座位に存在する各アレルの量を測定することで、胎児のDNAまたはRNAおよびその胎児の母親に由来する母親のDNAまたはRNAを含むDNAまたはRNAの混合試料中の染色体または染色体分節にある多型座位の集合について遺伝子データを得ることを含む。いくつかの態様では、前記方法は、前記胎児のゲノムに存在する前記目的の染色体または染色体分節のコピー数を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、前記仮説のそれぞれについて、(i)得られた前記(両)親由来の相決定済み遺伝子データと任意で(ii)前記胎児に目的の染色体または染色体分節のコピーをもたらした配偶子の形成時に発生した可能性がある1つ以上の交差の確率から混合試料中の複数の座位の各座位に存在する各アレルの期待量の確率分布を(例えば、コンピュータ上等で)作成し、前記仮説のそれぞれについて、(1)前記得られた混合試料の遺伝子データと(2)その仮説ごとに混合試料中の複数の座位の各座位における各アレルの期待量の確率分布の適合を(コンピュータ等で)算出し、前記データ適合に応じて1つ以上の仮説をランク付けし、最高ランクの仮説を選択して、前記胎児のゲノム中の目的の染色体分節のコピー数を決定することとを含む。
いくつかの態様では、前記方法は、本明細書で開示した方法のいずれか、または任意の周知の方法を用いて相決定済み遺伝子データを得ることを含む。いくつかの態様では、前記方法は、同時にまたは任意の順序で順に(i)前記第一の相同染色体分節にある多型座位の集合のうちの座位ごとに第一の相同染色体分節についてその座位に存在するアレルの同一性を含む第一の相同染色体分節の相決定済み遺伝子データを得ることと、(ii)前記第二の相同染色体分節にある多型座位の集合のうちの座位ごとに前記第二の相同染色体分節にあるその座位に存在するアレルの同一性を含む第二の相同染色体分節の相決定済み遺伝子データを得ることと、(iii)前記個体に由来する1個以上の細胞に由来するDNAの試料中の前記多型座位の集合のうちの各座位に存在する各アレルの量を含む測定されたアレルの遺伝子データを得ることとを含む。
いくつかの態様では、前記方法は、前記試料が由来している少なくとも1個の細胞でヘテロ接合である(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)多型座位の集合のうちの1箇所以上の座位についてアレル比率を算出することを含む。いくつかの態様では、特定の座位の算出済みアレル比率は、前記アレルの1つの測定量をその座位のすべてのアレルの総測定量で除したものである。いくつかの態様では、特定の座位の算出済みアレル比率は、前記アレル(例えば、前記第一の相同染色体分節にあるアレル等)の1つの測定量を、その座位の1つ以上の他のアレル(例えば、第二の相同染色体分節にあるアレル等)の測定量で除したものである。前記算出済みアレル比率は、本明細書で開示した方法のいずれかを用いて、あるいは任意の標準的な方法(例えば、本明細書に記載の算出済みアレル比率の任意の数学的変換等)で算出されてもよい。
いくつかの態様では、前記方法は、ある座位の1つ以上の算出済みアレル比率を第一および第二の相同染色体分節が等しい割合で存在する場合にその座位に期待されるアレル比率と比較して前記第一の相同染色体分節のコピー数過剰があるかどうかを決定することを含む。いくつかの態様では、前記期待アレル比率は、ある座位に起こりうるアレルが存在について等しい尤度を有していると仮定する。特定の座位の算出済みアレル比率が前記アレルの1つの測定量をその座位のすべてのアレルの総測定量で除したものであるいくつかの態様では、対応する期待アレル比率は二対立遺伝子座位で0.5、三対立遺伝子座位で1/3である。いくつかの態様では、前記期待アレル比率は、すべての座位で0.5等、同じである。いくつかの態様では、前記期待アレル比率は、ある座位に起こりうるアレルが存在について異なる尤度(例えば、例えば、対象者が属する特定の集団における前記アレルのそれぞれの頻度に基づいた尤度(例えば、対象者の祖先に基づいた集団等))を有する可能性があると仮定する。このようなアレル頻度は公的に利用可能である(例えば、以下を参照のこと。ハップマップ計画、Perlegen Human Haplotype Project(パーレジェン・ヒトハプロタイプ・プロジェクト)、ウェブページ(ncbi.nlm.nih.gov/projects/SNP/)、Sherry ST, Ward MH, Kholodov M, et al. dbSNP、NCBI遺伝的変異データベース、Nucleic Acids Res. 2001 Jan 1;29(1):308-11、それぞれは参照により本明細書に組み込まれる)。いくつかの態様では、前記期待アレル比率は、前記第一の相同染色体分節の過剰出現度を規定する特定の仮説について検査される特定の個体に期待されるアレル比率である。例えば、特定の個体の期待アレル比率は、(例えば、非癌性試料等の欠失または重複を有していないと思われる個体に由来する試料等)前記個体に由来する相決定済みまたは相未決定遺伝子データ、あるいは前記個体のひとり以上の親近者に由来するデータに基づいて決定されてもよい。いくつかの態様では、出生前検査の場合、前記期待アレル比率は、第一の相同染色体分節の過剰出現度を規定する特定の仮説について、妊娠している母親および胎児に由来するDNAまたはRNAを含む混合試料(例えば、母親の血漿、または母親由来の無細胞DNAおよび胎児由来の無細胞DNAを含む血清試料等)に期待されるアレル比率である。例えば、前記混合試料の期待アレル比率は、母親由来の遺伝子データおよび胎児について予測される遺伝子データ(例えば、母親および/または父親から受け継がれると思われるアレルについての予測等)に基づいて決定されてもよい。いくつかの態様では、母親のみに由来するDNAまたはRNA試料に由来する相決定済みまたは相未決定遺伝子データ(例えば、母親の血液試料由来の軟膜等)を用いて、混合試料中の母親のDNAまたはRNA由来のアレル、および胎児が母親から受け継いだ可能性がある(したがって、混合試料中の胎児のDNAまたはRNAに存在する可能性がある)アレルが決定される。いくつかの態様では、父親にのみ由来するDNAまたはRNA試料に由来する相決定済みまたは相未決定遺伝子データを用いて、胎児が父親から受け継いだ可能性がある(したがって、混合試料中の胎児のDNAまたはRNAに存在する可能性がある)アレルが決定される。前記期待アレル比率は、本明細書で開示した方法のいずれか、または任意の標準的な方法(例えば、本明細書に記載の期待アレル比率の任意の数学的変換等)(2011年11月18日に提出された米国特許公開第2012/0270212号、参照によりその全体が本明細書に組み込まれる)を用いて算出されてもよい。
いくつかの態様では、(i)前記第一の相同染色体にあるその座位に存在するアレルの測定量をその座位のすべてのアレルの総測定量で除したアレル比率がその座位の期待アレル比率より大きい場合、または(ii)前記第二の相同染色体にあるその座位に存在するアレルの測定量をその座位のすべてのアレルの総測定量で除したアレル比率がその座位の期待アレル比率未満である場合のいずれかの場合、算出済みアレル比率は前記第一の相同染色体分節のコピー数過剰出現を示す。いくつかの態様では、算出済みアレル比率がその座位の期待比率よりも有意に大きい、または小さい場合は、その算出済みアレル比率は過剰出現を示すと見なされるのみである。いくつかの態様では、(i)前記第一の相同染色体にあるその座位に存在するアレルの測定量をその座位のすべてのアレルの総測定量で除したアレル比率がその座位の期待アレル比率以下である場合、または(ii)前記第二の相同染色体にあるその座位に存在するアレルの測定量をその座位のすべてのアレルの総測定量で除したアレル比率がその座位の期待アレル比率以上である場合のいずれかの場合には、算出済みアレル比率は前記第一の相同染色体分節のコピー数過剰出現がないことを示す。いくつかの態様では、対応する期待比率と等しい算出済み比率は(過剰出現がないことを示すため)無視される。
様々な態様では、以下の方法の1つ以上を用いて算出済みアレル比率の1つ以上が対応する期待アレル比率と比較される。いくつかの態様では、特定の座位について、差異の大きさにかかわらず前記算出済みアレル比率が期待アレル比率より大きいか、小さいかが決定される。いくつかの態様では、特定の座位について、算出済みアレル比率が期待アレル比率より大きいか小さいかにかかわらず算出済みアレル比率と期待アレル比率との差異の大きさが決定される。いくつかの態様では、特定の座位について、算出済みアレル比率が期待アレル比率より大きいか、小さいかとその差異の大きさが決定される。いくつかの態様では、差異の大きさにかかわらず、算出済みアレル比率の平均値または加重平均値が期待アレル比率の平均値または加重平均値より大きいか、小さいかが決定される。いくつかの態様では、算出済みアレル比率の平均値または加重平均値が期待アレル比率の平均値または加重平均値より大きいか、小さいかにかかわらず、算出済みアレル比率の平均値または加重平均値と期待アレル比率の平均値または加重平均値との差異の大きさが決定される。いくつかの態様では、算出済みアレル比率の平均値または加重平均値が期待アレル比率の平均値または加重平均値より大きいか、小さいかとその差異の大きさが決定される。いくつかの態様では、算出済みアレル比率と期待アレル比率の差異の大きさの平均値または加重平均値が決定される。
いくつかの態様では、1箇所以上の座位の算出済みアレル比率と期待アレル比率の差異の大きさを用いて、前記第一の相同染色体分節のコピー数過剰出現が前記細胞の1つ以上のゲノムにおける前記第一の相同染色体分節の重複または前記第二の相同染色体分節の欠失によるものであるかどうかが決定される。
いくつかの態様では、以下の条件の1つ以上が満たされる場合は、前記第一の相同染色体分節のコピー数過剰出現が決定される。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現を示す算出済みアレル比率の数が閾値より大きい。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現でないことを示す算出済みアレル比率の数が閾値より小さい。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現を示す算出済みアレル比率と対応する期待アレル比率との差異の大きさが閾値より大きい。いくつかの態様では、過剰出現を示すすべての算出済みアレル比率と対応する期待アレル比率との差異の大きさの和が閾値より大きい。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現ではないことを示す算出済みアレル比率と対応する期待アレル比率との差異の大きさが閾値未満である。いくつかの態様では、前記第一の相同染色体に存在するアレルの測定量をその座位のすべてのアレルの総測定量で除した算出済みアレル比率の平均値または加重平均値が、少なくとも閾値で除した前記期待アレル比率の平均値または加重平均値より大きい。いくつかの態様では、前記第二の相同染色体に存在するアレルの測定量をその座位のすべてのアレルの総測定量で除した算出済みアレル比率の平均値または加重平均値が、少なくとも閾値で除した前記期待アレル比率の平均値または加重平均値未満である。いくつかの態様では、算出済みアレル比率と前記第一の相同染色体分節のコピー数過剰出現を予測するアレル比率とのデータ適合が閾値より小さい(データ適合が良好なことを示している)。いくつかの態様では、算出済みアレル比率と前記第一の相同染色体分節のコピー数過剰出現でないことを示すアレル比率とのデータ適合が閾値より大きい(データ適合がよくないことを示している)。
いくつかの態様では、以下の条件の1つ以上が満たされる場合は、前記第一の相同染色体分節のコピー数過剰出現が決定される。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現を示す算出済みアレル比率の数が閾値より小さい。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現でないことを示す算出済みアレル比率の数が閾値より大きい。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現を示す算出済みアレル比率と対応する期待アレル比率との差異の大きさが閾値より小さい。いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現でないことを示す算出済みアレル比率と対応する期待アレル比率との差異の大きさが閾値より大きい。いくつかの態様では、第一の相同染色体に存在するアレルの測定量をその座位のすべてのアレルの総測定量で除した算出済みアレル比率の平均値または加重平均値から期待アレル比率の平均値または加重平均値を引いたものが閾値より小さい。いくつかの態様では、期待アレル比率の平均値または加重平均値から前記第二の相同染色体に存在するアレルの測定量をその座位のすべてのアレルの総測定量で除した算出済みアレル比率の平均値または加重平均値を引いたものが、閾値より小さい。いくつかの態様では、算出済みアレル比率と前記第一の相同染色体分節のコピー数過剰出現を予測するアレル比率とのデータ適合が、閾値より大きい。いくつかの態様では、算出済みアレル比率と前記第一の相同染色体分節のコピー数過剰出現でないことを示すアレル比率とのデータ適合が、閾値より小さい。いくつかの態様では、前記閾値は、目的のCNVを有することがわかっている試料および/またはCNVがないことがわかっている試料を試験して決定される。
いくつかの態様では、前記第一の相同染色体分節のコピー数過剰出現があるかどうかを決定することは、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙することを含む。仮説の一例は、第一および第二の相同染色体分節が等しい割合(例えば、二倍体試料中、各分節のコピーが1つずつ)で存在する場合は過剰出現がないというものである。仮説の別の例は、1回以上重複された(例えば、第二の相同染色体分節のコピー数に比べて第一の相同染色体の余剰コピーが1つ、2つ、3つ、4つ、5つ、またはそれ以上ある)第一の相同染色体分節を含む。仮説の他の例は、第二の相同染色体分節の欠失を含む。他の例示的仮説は、第一および第二の相同染色体分節の両方の欠失である。いくつかの態様では、少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位))の予測アレル比率は、仮説ごとに、過剰出現度が仮説によって規定されたと仮定して推定される。いくつかの態様では、前記算出済みアレル比率を前記予測アレル比率と比較して仮説が正しい尤度が算出され、最も可能性が高い仮説が選択される。
いくつかの態様では、検定統計量の期待分布は、仮説ごとに前記予測アレル比率を用いて算出される。いくつかの態様では、前記算出済みアレル比率を用いて算出された検定統計量と前記予測アレル比率を用いて算出された検定統計量の期待分布を比較して仮説が正しい尤度が算出されて、最も可能性が高い仮説が選択される。
いくつかの態様では、少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位))の予測アレル比率は、第一の相同染色体分節の相決定済み遺伝子データ、第二の相同染色体分節の相決定済み遺伝子データ、および過剰出現度が仮説によって規定されたと仮定して推定される。いくつかの態様では、前記算出済みアレル比率と前記予測アレル比率を比較して仮説が正しい尤度が算出されて、最も可能性が高い仮説が選択される。
混合試料の使用
なお、多くの態様で、試料は1個以上の目的細胞および1個以上の目的でない細胞に由来するDNAまたはRNAを含む混合試料である。いくつかの態様では、対象細胞は、目的の欠失または重複等、CNVを有する細胞であり、非対象細胞は、目的のコピー数多様性を有しない細胞(例えば、目的の欠失または重複を有する細胞および検査対象の欠失または重複のいずれも有しない細胞の混合物)である。いくつかの態様では、前記対象細胞は、病気または障害あるいは病気または障害の危険性の増加に関連づけられた細胞(例えば、癌細胞等)であり、前記非対象細胞は、病気または障害あるいは病気または障害の危険性の増加に関連づけられていない細胞(例えば、非癌性細胞等)である。いくつかの態様では、前記対象細胞はすべて、同じCNVを有する。いくつかの態様では、2個以上の対象細胞は異なるCNVを有する。いくつかの態様では、前記対象細胞の1個以上は、少なくとも他の1個の対象細胞には見られない病気または障害あるいは病気または障害の危険性の増加に関連づけられたCNV、多型、または変異を有する。そのようないくつかの態様では、ある試料に由来する総細胞のうちの、病気または障害あるいは病気または障害の危険性の増加に関連づけられた細胞の分画は、その試料でこれらCNV、多型、または変異のうち最も高い頻度の分画と同じかそれ以上であると仮定される。例えば、細胞の6%がK−ras変異を有し、8%がBRAF変異を有する場合は、細胞の少なくとも8%が癌性であると仮定される。
いくつかの態様では、前記試料中の前記1個以上の目的細胞に由来するDNA(またはRNA)の総DNA(またはRNA)に対する比率が算出される。いくつかの態様では、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合が列挙される。いくつかの態様では、少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位))の予測アレル比率は、DNAまたはRNAの算出済み比率および過剰出現度が仮説によって規定されたと仮定して仮説ごとに推定される。いくつかの態様では、前記算出済みアレル比率と前記予測アレル比率を比較して仮説が正しい尤度が算出されて、最も可能性が高い仮説が選択される。
いくつかの態様では、前記予測アレル比率およびDNAまたはRNAの算出済み比率を用いて算出された検定統計量の期待分布が、仮説ごとに推定される。いくつかの態様では、前記算出済みアレル比率とDNAまたはRNAの算出済み比率を用いて算出された検定統計量を前記予測アレル比率とDNAまたはRNAの算出済み比率を用いて算出された検定統計量の期待分布と比較して仮説が正しい尤度が決定され、最も可能性が高い仮説が選択される。
いくつかの態様では、前記方法は、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合を列挙することを含む。いくつかの態様では、前記方法は、仮説ごとに、(i)その仮説によって規定された過剰出現度が与えられた場合は少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位))の予測アレル比率、または(ii)DNAまたはRNAの1つ以上の起こりうる比率について、前記予測アレル比率、および前記1個以上の目的細胞に由来する前記DNAまたはRNAの、前記試料中の総DNAまたはRNAに対する起こりうる比率を用いて算出された検定統計量の期待分布のいずれかを推定することを含む。いくつかの態様では、(i)前記予測アレル比率に対する算出済みアレル比率、または(ii)前記算出済みアレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量のいずれかと、前記予測アレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量の期待分布とを比較して、データ適合が算出される。いくつかの態様では、前記データ適合に応じて1つ以上の仮説がランク付けされて、最高ランクの仮説が選択される。いくつかの態様では、前記データ適合を算出する工程、前記仮説をランク付けする工程、最高ランクの仮説を選択する工程の1つ以上において技術またはアルゴリズム(例えば、検索アルゴリズム等)が用いられる。いくつかの態様では、前記データ適合はベータ二項分布に対する適合または二項分布への適合である。いくつかの態様では、前記技術またはアルゴリズムが、最尤推定、最大事後確率推定、ベイズ推定、動的推定(例えば、動的ベイズ推定等)、および期待値最大化推定からなる群から選択される。いくつかの態様では、前記方法は、前記技術またはアルゴリズムを前記得られた遺伝子データおよび前記期待遺伝子データに適用することを含む。
いくつかの態様では、前記方法は、前記1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する比率について、下限から上限までの範囲の起こりうる比率の区分を作成することを含む。いくつかの態様では、前記第一の相同染色体分節の過剰出現度を規定する1つ以上の仮説の集合が列挙される。いくつかの態様では、前記方法は、前記区分におけるDNAまたはRNAの起こりうる比率の各比率と各仮説について、(i)前記DNAまたはRNAの起こりうる比率およびその仮説によって規定された過剰出現度が与えられた場合は少なくとも1個の細胞中でヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)の予測アレル比率、または(ii)前記予測アレル比率と前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量の期待分布のいずれかを推定することを含む。いくつかの態様では、前記方法は、(i)前記予測アレル比率に対する算出済みアレル比率または(ii)前記算出済みアレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量のいずれかと、前記予測アレル比率および前記DNAまたはRNAの起こりうる比率を用いて算出された検定統計量の期待分布とを比較することで前記区分における前記DNAまたはRNAの起こりうる比率の各比率と各仮説について、前記仮説が正しい尤度を算出することを含む。いくつかの態様では、前記区分の中で起こりうる比率の比率ごとにその仮説の確率を組み合わせて各仮説の複合確率が決定され、最も高い複合確率を有する仮説が選択される。いくつかの態様では、各仮説の複合確率は、前記起こりうる比率が正しい比率であるという尤度に基づいて特定の起こりうる比率について仮説の確率を加重平均することで各仮説が決定される。
いくつかの態様では、最尤推定、最大事後確率推定、ベイズ推定、動的推定(例えば、動的ベイズ推定等)、および期待値最大化推定からなる群から選択される技術を用いて、前記1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する比率が推定される。いくつかの態様では、前記1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する比率は、目的のCNVの2つ以上(または、すべて)について同じであると仮定される。いくつかの態様では、前記1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する比率は、目的のCNVごとに算出される。
不十分な相決定済みデータを用いる方法の例
当然のことだが、多くの態様で、不十分な相決定済みデータが用いられている。例えば、第一の相同染色体分節および/または第二の相同染色体分節にある1箇所以上の座位にどのアレルが存在するかについて、100%確実に分かっていない場合がある。いくつかの態様では、個体の起こりうるハプロタイプ(例えば、集団に基づいたハプロタイプ頻度に基づくハプロタイプ等)の優先順位が各仮説の確率の算出に用いられる。いくつかの態様では、起こりうるハプロタイプの優先順位は、遺伝子データの相決定を行う他の方法または他の対象者(例えば、優先順位の高い対象者等)に由来する相決定済みデータを用いて調整されて、前記個体の相決定に基づいたインフォマティックスに用いられた集団データが改良される。
いくつかの態様では、前記相決定済み遺伝子データは、相決定済み遺伝子データの2つ以上の起こりうる集合に関する確率データを含み、相決定済みデータの起こりうる集合のそれぞれは、前記第一の相同染色体分節にある多型座位の集合のうちの各座位に存在するアレルの起こりうる同一性と、前記第二の相同染色体分節にある多型座位の集合のうちの各座位に存在するアレルの起こりうる同一性を含む。いくつかの態様では、前記仮説の少なくとも1つの確率は、相決定済み遺伝子データの起こりうる集合のそれぞれについて決定される。いくつかの態様では、前記仮説の複合確率は、相決定済み遺伝子データの起こりうる集合のそれぞれについて仮説の確率を組み合わせて決定され、最も高い複合確率を有する仮説が選択される。
本明細書で開示された前記方法のいずれかまたは任意の周知の方法を用いて、(例えば、集団に基づくハプロタイプ頻度を用いて最も可能性の高い相を推論する等)本発明の方法に用いるための不十分な相決定済みデータが作成されてもよい。いくつかの態様では、より小さい分節のハプロタイプを確率的に組み合わせて相決定済みデータが得られる。例えば、第一の領域のあるハプロタイプと同じ染色体の他の領域の他のハプロタイプの起こりうる組み合わせに基づいて起こりうるハプロタイプを決定することができる。異なる領域にある特定のハプロタイプが同じ染色体にある同じ、より大きいハプロタイプブロックの一部である確率は、例えば、集団に基づくハプロタイプ頻度および/または異なる領域間の周知の組換え率を用いて決定することができる。
いくつかの態様では、二染色体性の帰無仮説に単一仮説棄却試験が用いられる。いくつかの態様では、二染色体性仮説の確率が算出されて、その確率が所定の閾値未満(例えば、1,000分の1未満)である場合には二染色体性の仮説が棄却される。帰無仮説が棄却される場合は、不十分な相決定済みデータのエラーによるもの、あるいはCNVの存在によるものである可能性がある。いくつかの態様では、(例えば、バイオインフォマティックスに基づいて推論された相決定済みデータではなく、実際の相決定済みデータを得るための本明細書に開示された分子相決定法のいずれかから得られた相決定済みデータ等)より正確な相決定済みデータが得られる。いくつかの態様では、前記のより正確な相決定済みデータを用いて二染色体性仮説の確率が再算出されて、それでも二染色体性仮説が棄却されるかどうかが決定される。この仮説の棄却は、前記染色体分節の重複または欠失が存在することを示す。必要であれば、閾値を調整することで偽陽性率を変更することができる。
相決定済みデータを用いて倍数性を決定する実施形態の別の例
本明細書の例示的態様では、個体の試料中の染色体分節の倍数性を決定する方法が提供される。前記方法は、以下の工程を含む。
a.前記試料中の前記染色体分節にある多型座位の集合のうちの各座位に存在する各アレルの量を含むアレル頻度データを受け、
b.前記アレル頻度データの相を推定することによって前記多型座位の集合に関する相決定済みアレル情報を作成し、
c.前記アレル頻度データを用いて、異なる倍数性状態に関する前記多型座位のアレル頻度の個別確率を作成し、
d.前記個別確率と前記相決定済みアレル情報を用いて前記多型座位の集合に関する同時確率を作成し、
e.前記同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、前記染色体分節の倍数性を決定すること。
本明細書で開示されるように、当該分野で周知の方法によりアレル頻度データ(本明細書では測定されたアレルの遺伝子データともいう)を作成することができる。例えば、定量PCRまたはマイクロアレイを用いて前記データを作成することができる。例示的一態様では、前記データは、核酸配列データ、特に高処理核酸配列データを用いて作成される。
ある具体例では、前記アレル頻度データを用いて個別確率が作成される前に前記アレル頻度データのエラーが修正される。例示的の特定の態様では、前記修正されたエラーはアレル増幅効率の偏りを含む。他の態様では、前記修正されたエラーは、環境不純物および遺伝型解析による不純物を含む。いくつかの態様では、修正されたエラーは、アレル増幅による偏り、環境不純物、および遺伝型解析による不純物を含む。
特定の態様では、前記個別確率は、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて作成される。これらの態様および他の態様では、前記同時確率は、前記染色体分節にある多型座位間の連鎖を考慮することによって作成される。
したがって、これらの態様のいくつかを組み合わせた本明細書の例示的一態様では、個体の試料中の染色体倍数性を検出する方法が提供される。前記方法は以下の工程を含む。
a.前記個体の染色体分節にある多型座位の集合に存在するアレルに関する核酸配列データを受け、
b.前記核酸配列データを用いて前記多型座位の集合におけるアレル頻度を検出し、
c.検出された前記アレル頻度のアレル増幅効率の偏りを修正することによって、前記多型座位の集合に関する修正済みアレル頻度を作成し、
d.前記核酸配列データの相を推定することによって前記多型座位の集合に関する相決定済みアレル情報を作成し、
e.前記修正済みアレル頻度を前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する前記多型座位のアレル頻度の個別確率を作成し、
f.前記個別確率を前記染色体分節にある多型座位間の連鎖を考慮しながら組み合わせることにより、前記多型座位の集合に関する同時確率を作成し、
g.前記同時確率に基づき、染色体異数性を示す最適合モデルを選択すること。
本明細書に開示されるように、前記多型座位の集合に関する異なる倍数性状態と平均アレル不均衡率の両方のモデルまたは仮説の集合を用いて前記個別確率を生成することができる。例えば、特定の例では、前記染色体分節の第一の相同体および前記染色体分節の第二の相同体の倍数性状態をモデル化することで個別確率が生成される。モデル化される倍数性状態は以下のものを含む。
(1)すべての細胞は、前記染色体分節の第一の相同体または第二の相同体に欠失あるいは増幅がない。
(2)少なくともいくつかの細胞は、前記染色体分節の第一の相同体の欠失、または第二の相同体の増幅を有する。
(3)少なくともいくつかの細胞は、前記染色体分節の第二の相同体の欠失、または第一の相同体の増幅を有する。
なお、上記モデルはまた、あるモデルを抑制するのに用いられる仮説と言うこともできる。したがって、上に示されたのは、用いることができる3つの仮説である。
モデル化された平均アレル不均衡率は、前記染色体分節の実際の平均アレル不均衡率を含む平均アレル不均衡率の任意の範囲を含む。例えば、特定の例示的態様では、モデル化された平均アレル不均衡率の範囲は、下限が0、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.75、1、2、2.5、3、4、および5%、上限が1、2、2.5、3、4、5、10、15、20、25、30、40、50、60、70、80、90、95、および99%の範囲であってもよい。この範囲のモデル化の間隔は、用いる計算能力と分析に使える時間に応じて任意の間隔であってもよい。例えば、間隔を0.01、0.05、0.02、または0.1としてモデル化することができる。
特定の例示的態様では、前記試料は、染色体分節の平均アレル不均衡率が0.4%〜5%である。特定の態様では、前記平均アレル不均衡率は小さい。これら態様では、平均アレル不均衡率は通常10%未満である。特定の例示的態様では、前記アレル不均衡率は、下限が0.25、0.3、0.4、0.5、0.6、0.75、1、2、2.5、3、4、および5%、上限が1、2、2.5、3、4、および5%である。他の例示的態様では、前記平均アレル不均衡率は、下限が0.4、0.45、0.5、0.6、0.7、0.8、0.9、または1.0%、上限が0.5、0.6、0.7、0.8、0.9、1.0、1.5、2.0、3.0、4.0、または5.0%である。例えば、ある例では、前記試料の平均アレル不均衡率は、0.45〜2.5%である。他の例では、前記平均アレル不均衡率は0.45、0.5、0.6、0.8、0.8、0.9、または1.0の感度で検出される。本発明の方法に用いる低アレル不均衡率の試料の例としては、循環腫瘍DNAを有する癌を有する個体に由来する血漿試料、または循環胎児DNAを有する妊婦に由来する血漿試料が挙げられる。
なお、SNVの場合、異常なDNAの割合は、通常、変異体アレル頻度(ある座位に存在する変異体アレル数/その座位に存在する総アレル数)を用いて測定される。腫瘍における2つの相同体の量の差は類似しているので、CNVについて異常なDNAの割合を平均アレル不均衡率(AAI)を用いて測定する。平均アレル不均衡率は|(H1−H2)|/(H1+H2)で定義され、ここでHiは試料中の相同体iの平均コピー数であり、Hi/(H1+H2)は相同体iの分数の量、すなわち相同体比率である。最大相同体比率は、最も量が多い相同体の相同体比率である。
試験脱落率は、すべてのSNPを用いて推定された、リードのないSNPの百分率である。単一アレル脱落(ADO)率は、ヘテロ接合SNPのみを用いて推定された、アレルが1つだけ存在するSNPの百分率である。遺伝型信頼度は、Bアレルリードであった各SNPに存在するリード数に対する二項分布を適合させて、そのSNPの注目領域の倍数性状態を用いて各遺伝型の確率を推定して決定することができる。
腫瘍組織試料の場合、染色体異数性(この段落ではCNVとして例示されている)は、アレル頻度分布間の遷移によって示すことができる。血漿試料では、前記腫瘍試料から推定されたハプロタイプ情報を用いて、同じ個体に由来する腫瘍試料もCNVを有する領域で血漿CNVを探す最尤アルゴリズムによりCNVを同定することができる。このアルゴリズムは、(1)すべての細胞は正常である(アレル不均衡率がない)、(2)いくつか/すべての細胞は相同体1の欠失または相同体2の増幅を有する、または(3)いくつか/すべての細胞は相同体2の欠失または相同体1の増幅を有するという3つの仮説集合について、すべてのアレル不均衡率にわたって期待アレル頻度を0.025%の間隔でモデル化することができる。本明細書において例示されるように、SNP座位の連鎖を考慮した特定の例示的態様では、すべてのヘテロ接合SNPのアレル頻度の期待値と観測値のベータ二項モデルに基づき、ベイズ分類器を用いてSNPごとに各仮説の尤度を決定することができ、次いで、複数のSNPの同時尤度を算出することができる。次に、最も可能性の高い仮説を選択することができる。
腫瘍の平均N個のコピーを有する染色体領域について考える。ここで、cは、ある二染色体の領域における正常な細胞および腫瘍細胞の混合物に由来する血漿中のDNA分画を示す。以下のようにAAIが算出される。
特定の例では、前記アレル頻度データを用いて個別確率を作成する前に、前記アレル頻度データのエラーが修正される。本明細書ではエラーの異なる種類および/または偏りの補正が開示される。特定の例示的態様では、修正されたエラーはアレル増幅効率の偏りである。他の態様では、修正されたエラーは、環境不純物および遺伝型解析による不純物を含む。いくつかの態様では、修正されたエラーは、アレル増幅による偏り、環境不純物、および遺伝型解析による不純物を含む。
当然ではあるが、アレル増幅効率の偏りは、検査試料を含む実験による決定の一部としてアレルに対して決定することができる、あるいは効率が算出されているアレルを含む試料群を用いて異なる時点で決定することができる。環境不純物および遺伝型解析による不純物は、通常、検査試料の分析と同じ一操作で決定される。
特定の態様では、環境不純物および遺伝型解析による不純物は、試料中のホモ接合のアレルについて決定される。当然ではあるが、ある座位が集団の中で比較的高いヘテロ接合性を有しているために分析に選択されたとしても、ある個体に由来する任意の試料中のいくつかの座位はヘテロ接合であり、他の座位はホモ接合である。いくつかの態様では、ある個体のヘテロ接合座位を用いて染色体分節の倍数性が決定されてもよいが、ホモ接合座位を用いて環境不純物および遺伝型解析による不純物を算出することができるので有益である。
特定の例では、前記選択は、前記モデルに関して相決定済みアレル情報と推定アレル頻度との差異の大きさを分析することで行われる。
ある例では、アレル頻度の個別確率は、前記多型座位の集合のアレル頻度の期待値と観測値のベータ二項モデルに基づいて作成される。ある例では、前記個別確率はベイズ分類器を用いて作成される。
特定の例示的態様では、前記核酸配列データは、多重増幅反応によって生成された一連の増幅産物の複数のコピーの高処理DNA配列決定を実行することによって作成され、ここで、前記一連の増幅産物のうちの各増幅産物は、前記多型座位の集合のうちの少なくとも1つの多型座位にわたり、前記多型座位の集合のうちの各多型座位が増幅される特定の態様では、前記多重増幅反応は、反応の少なくとも1/2が制限的なプライマー条件で実行される。いくつかの態様では、多重反応の1/10、1/5、1/4、1/3、1/2、またはすべての反応で制限的なプライマー濃度が用いられる。本明細書では、PCR等、増幅反応で制限的なプライマー条件を得られると思われる因子が提供される。
特定の態様では、本明細書で提供される方法は、複数の染色体にわたって複数の染色体分節の倍数性を検出する。したがって、これらの態様における染色体倍数性は、前記試料中の染色体分節の集合について決定される。これらの態様では、より多くの多重増幅反応が必要である。したがって、これらの態様での多重増幅反応は、例えば、2,500〜50,000回の多重反応を含む可能性がある。特定の態様では、多重反応は、下限が100、200、250、500、1,000、2,500、5,000、10,000、20,000、25,000、50,000個、上限が200、250、500、1,000、2,500、5,000、10,000、20,000、25,000、50,000、および100,000個の範囲で行われる。
例示的態様では、前記多型座位の集合は、高いヘテロ接合性を示すことが知られている座位の集合である。しかしながら、任意の個体のこれら座位のいくつかはホモ接合であることが期待される。特定の例示的態様では、本発明の方法は、ある個体のホモ接合座位とヘテロ接合座位の両方の核酸配列情報を利用する。例えば、ある個体のホモ接合座位が誤り補正に用いられて、ヘテロ接合座位が試料のアレル不均衡率の決定に用いられる。特定の態様では、前記多型座位の少なくとも10%は、前記個体のヘテロ接合座位である。
本明細書で開示されるように、集団においてヘテロ接合であることがわかっている対象SNP座位の分析が優先される。したがって、特定の態様では、前記多型座位の少なくとも10、20、25、50、75、80、90、95、99、または100%が集団でヘテロ接合であることがわかっている多型座位が選択される。
本明細書で開示されるように、特定の態様では、前記試料は妊婦に由来する血漿試料である。
いくつかの例では、前記方法は、既知の平均アレル不均衡比を有する対照試料に前記方法を行うことをさらに含む。前記対照は、前記染色体分節の異数性を示す特定のアレル状態の平均アレル不均衡比が0.4〜10%として、胎児または腫瘍に由来する循環遊離DNAに予測されるような低濃度で存在する試料中のアレルの平均アレル不均衡率を再現することができる。
本明細書で開示されるように、いくつかの態様では、前記対照としてPlasmArt対照が用いられる。したがって、ある側面では、前記対照は、染色体異数性を示すことがわかっている核酸試料を断片化して前記個体の血漿中を循環するDNA断片の大きさにすることを含む方法で作成された試料である。ある側面では、染色体分節に異数性がない対照が用いられる。
例示的態様では、1つ以上の対照に由来するデータは、検査試料と共に前記方法で分析することができる。前記対照の例としては、染色体異数性を含むと疑われていない個体に由来する別の試料、あるいはCNVまたは染色体異数性を含むことが疑われる試料が挙げられる。例えば、検査試料が循環遊離腫瘍DNAを含むと疑われる血漿試料である場合、この血漿試料と共に前記対象者の腫瘍に由来する対照試料にも前記方法を実行することができる。本明細書で開示されるように、前記対照試料は、染色体異数性を示すことがわかっているDNA試料を断片化して調製することができる。特に前記試料が癌に苦しむ個体に由来する場合、このような断片化により、アポトーシス細胞のDNA組成物を再現したDNA試料を得ることができる。前記対照試料に由来するデータは、染色体異数性の検出の信頼度を高める。
倍数性を決定する方法の特定の態様では、前記試料は、癌を有すると疑われる個体に由来する血漿試料である。これらの態様では、前記方法は、前記個体の腫瘍細胞にコピー数多様性が存在するかどうかを前記選択に基づいて決定することをさらに含む。これらの態様では、前記試料はある個体に由来する血漿試料であってもよい。これらの態様では、前記方法は、前記個体に癌が存在するかどうかを前記選択に基づいて決定することをさらに含んでいてもよい。
染色体分節の倍数性を決定するこれらの態様は、一連の一塩基多様性位置に含まれる一塩基多様性位置の一塩基多様体を検出することをさらに含んでいてもよく、ここで、染色体異数性および/または前記一塩基変異の検出は前記試料中に循環腫瘍核酸が存在することを示す。
これらの態様は、前記個体の腫瘍に関する前記染色体分節のハプロタイプ情報を受け、前記ハプロタイプ情報を用いて、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の前記モデルのセットを作成することをさらに含んでいてもよい。
本明細書で開示されるように、倍数性を決定する方法の特定の態様は、初期または修正済みアレル頻度を前記モデルのセットと比較する前に前記初期または修正済みアレル頻度のデータから異常値を除外することをさらに含んでいてもよい。例えば、特定の態様では、前記染色体分節の他の座位の平均値より少なくとも2または3標準偏差大きい、あるいは小さい座位アレル頻度は、モデル化に用いられる前にデータから除外される。
本明細書の記載から明らかなように、本明細書で提供される態様の多くは、染色体分節の倍数性を決定する方法を含むが、不十分相決定済みデータまたは完全な相決定済みデータを用いることが好ましい。また、当然だが、本明細書で提供される方法は、倍数性を検出する従来の方法に比べて改良された多くの特徴を有し、これら特徴の多くの様々な組み合わせを用いることができる。
本明細書の特定の態様では、図69〜図70に示すように、本発明の任意の方法を実行するコンピュータシステムおよびコンピュータ可読媒体が提供される。これらは、倍数性を決定する方法を実行するためのシステムおよびコンピュータ可読媒体を含む。したがって、システムの非限定的な例である態様では、本明細書で提供される方法のいずれかが本開示内容を用いたシステムとコンピュータ可読媒体を用いて実行できることとが示される。本明細書の他の側面では、個体の試料の染色体倍数性を検出するためのシステムが提供される。前記システムは、以下のものを含む。
a.前記試料中の前記染色体分節にある多型座位の集合のうちの各座位に存在する各アレルの量を含むアレル頻度データを受けるよう構成された入力プロセッサと、
b.モデラーであって、
i.前記アレル頻度データの相を推定することによって前記多型座位の集合に関する相決定済みアレル情報を作成し、
ii.前記アレル頻度データを用いて、異なる倍数性状態に関する前記多型座位のアレル頻度の個別確率を作成し、
iii.前記個別確率と前記相決定済みアレル情報を用いて前記多型座位の集合に関する同時確率を作成するよう構成されたモデラーと、
c.前記同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、前記染色体分節の倍数性を決定するよう構成された、仮説管理部とを含む。
このシステムの態様の特定の態様では、前記アレル頻度データは核酸配列決定システムにより作成されたデータである。特定の態様では、前記システムはさらに、前記アレル頻度データのエラーを修正するように構成されたエラー修正部を含み、修正済みアレル頻度データが前記モデラーによって用いられて個別確率を作成する。特定の態様では、前記エラー修正部はアレル増幅効率の偏りを修正する。特定の態様では、前記モデラーが、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて前記個別確率を作成する。特定の例示的態様では、前記モデラーは、前記染色体分節にある多型座位間の連鎖を考慮することによって前記同時確率を作成する。
本明細書の例示的一態様では、以下のものを含む、個体の試料の染色体倍数性を検出するシステムが提供される。
a.前記個体の染色体分節にある多型座位の集合に存在するアレルに関する核酸配列データを受け、前記核酸配列データを用いて前記多型座位の集合におけるアレル頻度を検出するよう構成された入力プロセッサと、
b.検出された前記アレル頻度のエラーを修正し、前記多型座位の集合に関する修正済みアレル頻度を作成するよう構成されたエラー修正部と、
c.モデラーであって、
i.前記核酸配列データの相を推定することによって前記多型座位の集合に関する相決定済みアレル情報を作成し、
ii.前記相決定済みアレル情報を前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する前記多型座位のアレル頻度の個別確率を作成し、
iii.前記個別確率を前記染色体分節にある多型座位間の相対的距離を考慮しながら組み合わせることにより、前記多型座位の集合に関する同時確率を作成するよう構成されたモデラーと、
d.前記同時確率に基づき、染色体異数性を示す最適合モデルを選択するよう構成された仮説管理部。
本明細書で提供される特定の例示的なシステムの態様では、前記多型座位の集合は、1000個から50,000個の多型座位を含む。本明細書で提供される特定の例示的なシステムの態様では、前記多型座位の集合は、ヘテロ接合が起こりやすい箇所座位として知られている100座位を含む。本明細書で提供される特定の例示的なシステムの態様では、前記多型座位の集合は、組換え起こりやすい箇所の0.5kb以内の100座位を含む。
本明細書で提供される特定の例示的なシステムの態様では、前記最適合モデルは、前記染色体分節の第一の相同体と前記染色体分節の第二の相同体の以下の倍数性状態を分析する。
(1)いずれの細胞も前記染色体分節の前記第一の相同体または前記第二の相同体の欠失または増幅を有していない状態、
(2)一部またはすべての細胞が前記染色体分節の前記第一の相同体の欠失、または前記第二の相同体の増幅を有する状態、および
(3)一部またはすべての細胞が前記染色体分節の前記第二の相同体の欠失、または前記第一の相同体の増幅を有する状態。
本明細書で提供される特定の例示的なシステムの態様では、前記修正されたエラーは、アレル増幅効率の偏り、不純物、および/または配列決定エラーを含む。本明細書で提供される特定の例示的なシステムの態様では、前記不純物は、環境不純物、および遺伝型解析による不純物を含む。本明細書で提供される特定の例示的なシステムの態様では、前記環境不純物および遺伝型解析による不純物はホモ接合アレルについて決定される。
本明細書で提供される特定の例示的なシステムの態様では、前記仮説管理部は、前記モデルに関して作成された前記相決定済みアレル情報と推定アレル頻度との差異の大きさを分析するように構成される。本明細書で提供される特定の例示的なシステムの態様では、前記モデラーは、前記多型座位の集合におけるアレル頻度の期待値と観測値のベータ二項モデルに基づいてアレル頻度の個別確率を作成する。本明細書で提供される特定の例示的なシステムの態様では、前記モデラーは、ベイズ分類器を用いて個別確率を作成する。
本明細書で提供される特定の例示的なシステムの態様では、前記核酸配列データは、多重増幅反応によって生成された一連の増幅産物の複数のコピーの高処理DNA配列決定を実行することで作成され、ここで、前記一連の増幅産物のうちの各増幅産物は、前記多型座位の集合のうちの少なくとも1つの多型座位にわたり、前記多型座位の集合のうちの各多型座位が増幅される。本明細書で提供される特定の例示的なシステムの態様では、前記多重増幅反応は、これら反応の少なくとも1/2で制限的なプライマー条件で実行される。本明細書で提供される特定の例示的なシステムの態様では、前記試料は平均アレル不均衡率が0.4%〜5%である。
本明細書で提供される特定の例示的なシステムの態様では、前記試料は癌を有すると疑われる個体に由来する血漿試料であり、前記仮説管理部はさらに、前記個体の腫瘍細胞にコピー数多様性が存在するかどうかを前記最適合モデルに基づいて決定するように構成される。
本明細書で提供される特定の例示的なシステムの態様では、前記試料はある個体に由来する血漿試料であり、前記仮説管理部はさらに、前記個体に癌があるかどうかを前記最適合モデルに基づいて決定するように構成される。これらの態様では、前記仮説管理部はさらに、一塩基多様性位置の集合のうちのある一塩基多様性位置に存在する一塩基多様体を検出するように構成されてもよく、染色体異数性、一塩基多様体の一方または両方の検出は前記試料中に循環腫瘍核酸が存在することを示す。
本明細書で提供される特定の例示的なシステムの態様では、前記入力プロセッサはさらに、前記個体の腫瘍に関する前記染色体分節のハプロタイプ情報を受けるように構成され、前記モデラーは前記ハプロタイプ情報を用いて前記多型座位の集合の異なる倍数性状態とアレル不均衡率のモデルのセットを作成するように構成される。
本明細書で提供される特定の例示的なシステムの態様では、前記モデラーは0%〜25%のアレル不均衡率にわたってモデルを作成する。
本明細書で提供される方法のいずれかが、非一過性のコンピュータ可読媒体に記憶されたコンピュータ可読コードにより実行することができることは明らかである。したがって、本明細書で提供される一態様は、個体の試料中の染色体倍数性を検出する非一過性のコンピュータ可読媒体であって、処理装置によって実行されると、前記処理装置は以下のことを実行する。
a.前記染色体分節にある多型座位の集合のうちの各座位で前記試料中に存在する各アレルの量を含むアレル頻度データを受け、
b.前記アレル頻度データの相を推定することによって前記多型座位の集合に関する相決定済み立遺伝子情報を作成し、
c.前記アレル頻度データを用いて、異なる倍数性状態に関する前記多型座位のアレル頻度の個別確率を作成し、
d.前記個別確率と前記相決定済みアレル情報を用いて前記多型座位の集合に関する同時確率を作成し、
e.前記同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、前記染色体分節の倍数性を決定する。
コンピュータ可読媒体の特定の態様では、前記アレル頻度データは核酸配列データから作成される。コンピュータ可読媒体の特定の態様はさらに、アレル頻度データのエラーを修正し、個別確率の作成工程ごとに修正済みアレル頻度データを用いることを含む。コンピュータ可読媒体の特定の態様では、前記修正されたエラーはアレル増幅効率の偏りである。コンピュータ可読媒体の特定の態様では、前記個別確率は、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて作成される。コンピュータ可読媒体の特定の態様では、前記前記同時確率は、前記染色体分節にある多型座位間の連鎖を考慮することによって作成される。
本明細書で提供される特定の一態様は、個体の試料中の染色体倍数性を検出する非一過性のコンピュータ可読媒体であって、処理装置により実行されると、前記処理装置は以下のことを実行する。
a.前記個体の染色体分節にある多型座位の集合に存在するアレルに関する核酸配列データを受け、
b.前記核酸配列データを用いて前記多型座位の集合におけるアレル頻度を検出し、
c.検出された前記アレル頻度のアレル増幅効率の偏りを修正することによって、前記多型座位の集合に関する修正済みアレル頻度を作成し、
d.前記核酸配列データの相を推定することによって前記多型座位の集合に関する相決定済みアレル情報を作成し、
e.前記修正済みアレル頻度を前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する前記多型座位のアレル頻度の個別確率を作成し、
f.前記個別確率を前記染色体分節にある多型座位間の連鎖を考慮しながら組み合わせることにより、前記多型座位の集合に関する同時確率を作成し、
g.前記同時確率に基づき、染色体異数性を示す最適合モデルを選択する。
コンピュータ可読媒体の特定の例示的態様では、前記選択は、前記モデルに関して作成された前記相決定済みアレル情報と推定アレル頻度との差異の大きさを分析することで実行される。
コンピュータ可読媒体の特定の例示的態様では、前記アレル頻度の個別確率は、前記多型座位の集合におけるアレル頻度の期待値と観測値のベータ二項モデルに基づいて決定される。
なお、本明細書で提供される態様の方法のいずれかは、非一過性のコンピュータ可読媒体に記憶されたコードを実行することで実行することができる。
癌を検出する実施形態の例
特定の側面では、本発明は癌を検出する方法を提供する。なお、前記試料は、癌を有すると疑われる個体に由来する腫瘍試料または液体試料例えば、血漿等)であってもよい。前記方法は、試料中の総DNAの分画として少ない量のこれら遺伝子変化を有する試料中の、一塩基変化(例えばSNV等)やコピー数変化(例えば、CNV等)等の遺伝子変異を検出するのに特に有効である。したがって、試料中の癌に由来するDNAまたはRNAを検出する感度が格別に高い。前記方法は、本明細書で提供されるCNVおよびSNVを検出するための改良のいずれかまたはすべてを組み合わせて、この格別に高い感度を達成することができる。
したがって、本明細書の特定の態様では、循環腫瘍核酸が個体の試料中に存在するかを決定するための方法、および処理装置によって実行されると前記処理装置が前記方法を実行するコンピュータ可読コードを含む非一過性のコンピュータ可読媒体が提供される。前記方法は、以下の工程を含む。
c.前記試料を分析して前記個体の染色体分節にある多型座位の集合の倍数性を決定し、
d.前記倍数性の決定に基づいて前記多型座位に存在する平均アレル不均衡率を決定し、0.4%、0.45%、0.5%、0.6%、0.7%、0.75%、0.8%、0.9%、または1%以上の平均アレル不均衡率は、前記試料中の循環腫瘍核酸(例えば、ctDNA等)の存在を示す。
ある例では、0.4、0.45、または0.5%超の平均アレル不均衡率は、ctDNAの存在を示す。特定の態様では、前記循環腫瘍核酸が存在するかを決定するための方法は、一塩基多様性位置の集合に含まれるある一塩基多様性位置の一塩基多様体を検出することをさらに含み、0.5%以上のアレル不均衡率を検出すること、および前記一塩基多様体を検出することの一方または両方は前記試料に循環腫瘍核酸が存在することを示す。当然ではあるが、染色体倍数性またはCNVを検出するために提供される前記方法のいずれかを用いて、アレル不均衡率、通常は平均アレル不均衡率を決定することができる。なお、SNVを検出するために本明細書で提供される前記方法のいずれかを用いて、本発明のこの側面に係る単一のヌクレオチドを検出することができる。
特定の態様では、前記循環腫瘍核酸が存在するかを決定するための方法はさらに、既知の平均アレル不均衡比を有する対照試料に前記方法を実行することを含む。例えば、前記対照は、前記個体の腫瘍に由来する試料であってもよい。いくつかの態様では、前記対照は分析中の試料に期待される平均アレル不均衡率を有する。例えば、AAIが0.5%〜5%、または平均アレル不均衡比が0.5%である。
特定の態様では、前記循環腫瘍核酸が存在するかを決定する方法の分析工程は、癌で異数性を示すことが知られている染色体分節の集合を分析することを含む。特定の態様では、前記循環腫瘍核酸が存在するかを決定する方法の分析工程は、倍数性について1,000〜50,000個、または100〜1,000個の多型座位を分析することを含む。特定の態様では、前記循環腫瘍核酸が存在するかを決定するための方法の分析工程は、100〜1,000個の一塩基多様性位置を分析することを含む。例えば、これらの態様では、前記分析工程は、多重PCRを行って、1,000〜50,000個の同義座位および100〜1,000個の一塩基多様性位置にわたる増幅産物を増幅することを含んでいてもよい。この多重反応は、単一の反応、あるいは様々な多重下位反応のプールとして設定することができる。本明細書で提供される多重反応法(例えば、本明細書に開示される大多重PCR等)は、増幅反応を実行して多重化、したがって感度の向上を補助する例示的プロセスを提供する。
特定の態様では、前記多重PCR反応の少なくとも10%、20%、25%、50%、75%、90%、95%、98%、99%、または100%で、前記反応は制限的なプライマー条件で実行される。本明細書で提供される大多重反応を実行するための改良された条件を用いることができる。
特定の側面では、前記循環腫瘍核酸が個体の試料中に存在するかを決定する方法、およびそのすべての態様は、システムを用いて実行することができる。本開示は、前記方法を実行するための特定の機能および構造的特徴に関する教示を提供する。非限定的な例として、前記システムは以下を含む。
a.前記試料に由来するデータを分析して、前記個体中の染色体分節にある多型座位の集合の倍数性を決定する入力プロセッサと、
b.前記倍数性の決定に基づいて前記多型座位に存在するアレル不均衡率を決定するモデラーであって、0.5%以上のアレル不均衡率は循環の存在を示す。
一塩基多様体を検出する実施形態の例
本明細書の特定の側面では、試料中の一塩基多様体を検出する方法が提供される。本明細書で提供される改良された方法は、試料中のSNVを検出限界0.015、0.017、0.02、0.05、0.1、0.2、0.3、0.4、または0.5パーセントで検出することができる。SNVを検出するすべての態様は、システムを用いて実行することができる。本開示は、前記方法を実行するための特定の機能および構造的特徴に関する教示を提供する。さらに、処理装置により実行されると前記処理装置が本明細書で提供されるSNVを検出する方法を実行するコンピュータ可読コードを含む非一過性のコンピュータ可読媒体を含む態様が本明細書で提供される。
したがって、本明細書で提供される一態様は、個体の試料に含まれるゲノム位置の集合に一塩基多様体が存在するかを決定する方法であって、前記方法は、
a.各ゲノム位置に関して、訓練データセットを用いてそのゲノム位置にわたる増幅産物に関する効率およびサイクル当たりのエラー率の推定値を作成し、
b.前記試料に含まれる各ゲノム位置に関する観測ヌクレオチド同一性情報を受け、
c.各ゲノム位置に関する増幅効率およびサイクル当たりのエラー率の前記推定値を個別に用いて、各ゲノム位置に関する前記観測ヌクレオチド同一性情報を異なる変異率のモデルと比較することにより、各ゲノム位置における1つ以上の実際の変異によって生じる一塩基多様体率の確率のセットを決定し、
d.各ゲノム位置に関する前記確率のセットから、最も可能性の高い実変異率と信頼度を決定することとを含む。
前記一塩基多様体が存在するかを決定する方法の例示的態様では、効率およびサイクル当たりのエラー率の前記推定値は、前記ゲノム位置にわたる一連の増幅産物に関して作成される。例えば、前記ゲノム位置にわたる2、3、4、5、10、15、20、25、50、100個、またはそれ以上の増幅産物が含まれていてもよい。
前記一塩基多様体が存在するかを決定する方法の例示的態様では、前記観測ヌクレオチド同一性情報は、各ゲノム位置に関する全リード数の観測値と各ゲノム位置に関する多様性アレルのリード数の観測値を含む。
前記一塩基多様体が存在するかを決定する方法の例示的態様では、前記試料は血漿試料であり前記一塩基多様体が前記試料の循環腫瘍DNAに存在する。
本明細書の他の態様では、ある個体に由来する試料中に存在する一塩基多様体のパーセントを推定する方法が提供される。前記方法は、以下の工程を含む。
a.ゲノム位置の集合において、訓練データセットを用いてそれらのゲノム位置にわたる1個以上の増幅産物に関する効率およびサイクル当たりのエラー率の推定値を作成し、
b.前記試料に含まれる各ゲノム位置に関する観測ヌクレオチド同一性情報を受け、
c.前記増幅産物の増幅効率とサイクル当たりのエラー率の前記推定値を用いて、ある初期の実変異分子率を有する調査領域の全分子数と、背景エラー分子と、実変異分子とに関する平均と分散の推定値を作成し、
d.平均および分散の前記推定値を用いた分布を前記試料の観測ヌクレオチド同一性情報に適合させることによって最も可能性の高い実際の一塩基多様体率を決定することにより、実際の変異によって生じる前記試料の一塩基多様体率を決定すること。
ある個体に由来する試料中に存在する一塩基多様体のパーセントを推定する方法の一例では、前記試料は血漿試料であり、前記一塩基多様体が前記試料の循環腫瘍DNAに存在する。
本発明のこの態様の訓練データセットは、典型的には健康な個体、好ましくは健康な個体群に由来する試料を含む。ある例示的態様では、前記訓練データセットは、1つ以上の検査試料の分析と同じ日に、または同じ一操作で分析される。例えば、2、3、4、5、10、15、20、25、30、36、48、96、100、192、200、250、500、1000人、またはそれ以上の健康な個体に由来する試料を用いて訓練データセットを作成することができる。多数(例えば96人以上)の健康な個体がデータに利用可能である場合、検査試料に前記方法を実行する前に検査を行った場合でも増幅効率推定値の信頼度が高まる。PCRエラー率は増幅産物ごとにあるので、SNVの塩基位置について作成された核酸配列情報だけでなく、SNVの周辺の増幅領域全体について作成された核酸配列データを用いることができる。例えば、50個体に由来する試料と前記SNV周辺の20塩基対の増幅産物の配列決定を用いて、1000塩基のリードに由来するエラー頻度データを用いてエラー頻度率を決定することができる。
通常、増幅効率は、増幅された分節の増幅効率について平均値と標準偏差を推定して、それを分布モデル(例えば、二項分布またはベータ二項分布等)に適合させて推定される。既知のサイクル数のPCR反応についてエラー率が決定されて、サイクル当たりのエラー率が推定される。
特定の例示的態様では、検査データ集合の開始分子を推定することはさらに、リード観察数がリード推定数よりも大きく異なる場合は工程(b)で推定された分子の開始数を用いて前記検査データ集合の効率推定値を更新することを含む。前記推定値は新しい効率および/または開始分子ごとに更新されてもよい。
分子、背景エラー分子、および実際の変異分子の総数を推定するのに用いられる検索空間は、あるSNV位置の塩基のコピーの0.1%、0.2%、0.25%、0.5%、1%、2.5%、5%、10%、15%、20%、または25%(下限)から1%、2%、2.5%、5%、10%、12.5%、15%、20%、25%、50%、75%、90%、または95%(上限)がSNV塩基である検索空間を含んでいてもよい。前記方法が循環腫瘍DNAを検出するある例では、より低い範囲として、下限が0.1%、0.2%、0.25%、0.5%、また1%、上限が1%、2%、2.5%、5%、10%、12.5%、または15%の範囲を血漿試料に用いることができる。腫瘍試料にはより高い範囲が用いられる。
分布では、総分子中の誤り分子(背景エラーおよび実際の変異)の総数を適合させて、検索空間における起こりうる実際の変異のそれぞれの尤度すなわち確率が算出される。この分布は二項分布またはベータ二項分布であってもよい。
最も可能性の高い実際の変異は、最も可能性の高い実際の変異の百分率を決定し、前記分布の適合に由来するデータを用いて信頼度を算出して決定される。本明細書で提供される前記方法の臨床解釈の限定を意図しない具体例として、中央変異率が高いと、SNVを陽性と決定するのに必要な信頼度(パーセント)は低くなる。例えば、最も可能性の高い仮説を用いたある試料中のSNVの中央変異率が5%であり、信頼度(パーセント)が99%である場合、陽性のSNV呼び出しが実行されることがある。一方、この例で、最も可能性の高い仮説を用いたある試料中のSNVの中央変異率が1%であり、信頼度(パーセント)が50%である場合、特定の状況では、陽性のSNV呼び出しは実行されないことがある。当然ではあるが、データの臨床解釈は、感度、特異性、有病率、および代替え品の利用可能性に応じたものである。
例示的一態様では、前記試料は、循環DNA試料(例えば、循環腫瘍DNA試料等)である。
本明細書の他の態様では、個体の試験試料中に存在する1つ以上の一塩基多様体を検出する方法が提供される。この態様による方法は以下の工程を含む。
d.配列決定の実行時に作成された結果に基づき、複数の正常な個体の各々から得た複数の対照試料の多様性アレル頻度の中央値を、一塩基多様性位置の集合に含まれる各一塩基多様性位置について決定することにより、閾値未満である正常試料の多様性アレル頻度の中央値を有する、選定された一塩基多様性位置を確認し、前記一塩基多様性位置の各々について異常値試料を除外した後、前記一塩基多様性位置の各々に関する背景エラーを決定し、
e.該試験試料に関する配列決定の実行時に作成されたデータに基づき、該試験試料について、選定された該一塩基多様性位置に関して観測リード深度による加重平均と分散を決定し、
f.コンピュータを用いて、リード深度による加重平均が背景エラーに比べて統計的に有意である1つ以上の一塩基多様性位置を確認することによって、前記1つ以上の一塩基多様体を検出すること。
特定の態様では、前記1つ以上のSNVを検出する方法において、前記試料は血漿試料であり、前記対照試料は血漿試料であり、検出された前記1つ以上の一塩基多様体は前記試料の循環腫瘍DNAに存在する。特定の態様では、前記1つ以上のSNVを検出する方法において、前記複数の対照試料は少なくとも25個の試料を含む。ある例示的態様では、前記複数の対照試料は、下限が少なくとも5、10、15、20、25、50、75、100、200、または250個の試料であり、上限が10、15、20、25、50、75、100、200、250、500、および1000個の試料である。
特定の態様では、前記1つ以上のSNVを検出する方法において、高処理配列決定の実行時に作成されたデータから異常値を除外することによって前記観測リード深度による加重平均と観測分散が算出される。特定の態様では、前記1つ以上のSNVを検出する方法において、前記試験試料の各一塩基多様性位置に関する前記リード深度は少なくとも100リードである。
特定の態様では、前記1つ以上のSNVを検出する方法において、前記配列決定の実行が、制限的なプライマー反応条件で実行される多重増幅反応を含む。本明細書で提供される多重増幅反応を実行する改良された方法を用いて、例示のこれら態様が実行される。
理論により限定するものではないが、本実施形態の方法は、実行に特定の人工産物を説明するため、検査試料と同じ配列決定の一操作で配列決定された正常な血漿試料を用いた背景エラーモデルを利用している。閾値より大きい(例えば、0.1%、0.2%、0.25%、0.5%、0.75%、および1.0%より大きい)正常な中心多様性アレル頻度を有するノイズと思われる位置は除外される。
ノイズおよび不純物を説明するため、異常値を有する試料は前記モデルから繰り返し除外される。各遺伝子座位の各塩基置換について、前記エラーのリード深度による加重平均と標準偏差が算出される。特定の例示的態様では、少なくとも閾値数のリード(例えば、少なくとも2、3、4、5、6、7、8、9、10、15、20、25、50、100、250、500、または1000個の変異体リード)を有し、特定の態様の背景エラーモデルに対するZ値が2.5、5、7.5、または10より大きい一塩基多様性位置を有する試料(例えば、腫瘍または無細胞血漿試料等)は、変異の候補として計測される。
特定の態様では、前記一塩基多様性位置の各一塩基多様性位置の配列決定の実行において、下限が100、250、500、1,000、2000、2500、5000、10,000、20,000、25,0000、50,000、または100,000リード超、上限が2000、2500、5,000、7,500、10,000、25,000、50,000、100,000、250,000、または500,000リード超のリード深度が達成される。前記配列決定の一操作は、通常、高処理配列決定の一操作である。例示的態様で、前記検査試料について生成された平均値または中央値は、リード深度により加重平均される。したがって、ある多様性アレルの決定が1000リード中1個の多様性アレルが検出される試料中に実際に起きる尤度は、10,000リード中1個の多様性アレルが検出される試料よりも高く加重平均される。ある多様性アレル(すなわち変異)の決定は100%の信頼度で行えないので、同定された一塩基多様体は候補の多様体または候補の変異と見なすことができる。
相決定済みデータの分析の検定統計量の例
以下に、遺伝的に同一ではない2個以上の細胞に由来するDNAまたはRNAを含む混合試料であると分かっているか、疑わしい試料に由来する相決定済みデータの分析について、検定統計量の例が記載される。目的DNAまたはRNAの分画(例えば、目的のCNVを有するDNAまたはRNA分画、あるいは癌細胞等の目的の細胞に由来するDNAまたはRNAの分画)をfとする。いくつかの態様では、出生前検査の場合、fは、胎児と母親のDNA、RNA、または細胞の混合物中の胎児のDNA、RNA、または細胞の分画を指す。DNAの2つのコピーが目的細胞のそれぞれによって生じたと仮定すると、fは目的細胞に由来するDNAの分画を指す。fは、欠失または重複した分節に存在する目的細胞に由来するDNA分画とは異なる。
各SNPの起こりうるアレル値をAおよびBとする。AA、AB、BA、およびBBを用いて、起こりうるすべての順序付けられたアレル対を示す。いくつかの態様では、順序付けられたアレルABまたはBAを有するSNPが分析される。Nをi番目のSNPの配列リード数、AおよびBをそれぞれアレルAおよびBを示すi番目のSNPのリード数とする。以下のように仮定する。
=A+B
アレル比率Rは以下のように定義される。
Tを対象のSNP数とする。
一般性を失うことなく、いくつかの態様は、単一の染色体分節に注目する。さらなる透明性のために、本明細書では、用語「第二の相同染色体分節と比較される第一の相同染色体分節」は、ある染色体分節の第一の相同体およびその染色体分節の第二の相同体を意味する。このようないくつかの態様では、対象SNPのすべてが目的の分節染色体に含まれる。他の態様では、起こりうるコピー数多様性について複数の染色体分節が分析される。
マップ推定
この方法は、順序づけられたアレルを介して相決定の知識を利用して、対象分節の欠失または重複を検出する。各SNPiについて、以下の通り定義する。
よって、以下のように定義される。
様々なコピー数仮説(例えば、二染色体性の仮説、第一または第二の相同体の欠失の仮説、あるいは第一または第二の相同体の重複の仮説等)におけるXおよびSの分布を以下で記載する。
二染色体性仮説
対象分節は欠失も重複もしていないというこの仮説では、
ここで
リード深度定数Nを仮定すると、パラメータを有する二項分布Sが得られる。
欠失仮説
第一の相同体が欠失している(すなわち、ABのSNPがBになり、BAのSNPがAになっている)という仮説では、Rは、ABのSNPについてパラメータ{1−(1/(2−f))}およびT、BAのSNPについて(1/(2−f))およびTを有する二項分布を有する。したがって、
リード深度定数Nを仮定すると、以下のパラメータを有する二項分布Sが得られる。
第二の相同体が欠失している(すなわち、ABのSNPがAになり、BAのSNPがBになっている)という仮説では、Rは、ABのSNPについてパラメータ(1/(2−f))およびT、BAのSNPについて{1−(1/(2−f))}およびTを有する二項分布を有する。したがって、
リード深度定数Nを仮定すると、以下のパラメータを有する二項分布Sが得られる。
重複仮説
第一の相同体が重複している(すなわち、ABのSNPがAABとなり、BAのSNPがBBAとなっている)という仮説では、Rは、ABのSNPについてパラメータ(1+f)/(2+f)およびT、BAのSNPについて{1−((1+f)/(2+f))}およびTを有する二項分布を有する。したがって、
リード深度定数Nを仮定すると、以下のパラメータを有する二項分布Sが得られる。
第二の相同体が重複している(すなわち、ABのSNPがABBとなり、BAのSNPがBAAとなっている)という仮説では、Rは、ABのSNPについてパラメータ{1−((1+f)/(2+f))}およびT、BAのSNPについて(1+f)/(2+f)およびTを有する二項分布を有する。したがって、
リード深度定数Nを仮定すると、以下のパラメータを有する二項分布Sが得られる。
分類
上の項で示したように、Xは、以下の二項ランダム変数である。
これにより、各仮説での検定統計量Sの確率を算出することができる。測定されたデータを仮定して各仮説の確率を算出することができる。いくつかの態様では、最も高い確率を有する仮説が選択される。必要に応じて、リード深度定数Nで各Nを近似する、またはリード深度を定数Nまで切り捨てることで、Sの分布を簡略化することができる。この簡略化によって以下が得られる。
測定されたデータを仮定して、例えば、最尤推定、最大事後確率推定、またはベイズ推定等のアルゴリズム(例えば、検索アルゴリズム)を用いてデータの最適合を生成する値のf等、最も可能性の高い値のfを選択することで、fの値を推定することができる。いくつかの態様では、複数の染色体分節が分析されて、各分節のデータに基づいてfの値が推定される。対象細胞のすべてがこれら重複または欠失を有する場合、これらの異なる分節のデータに基づくfの推定値は類似している。いくつかの態様では、癌と非癌性DNAまたはRNAのメチル化の違い(低メチル化または高メチル化)に基づいて癌細胞由来のDNAまたはRNA分画を決定することで、fは実験的に測定される。
いくつかの態様では、胎児の核酸と母親の核酸の混合試料の場合、fの値は胎児の分画、すなわち、前記試料中のDNA(またはRNA)の総量に対する胎児のDNA(またはRNA)の分画である。いくつかの態様では、母親および胎児の両方で二染色体性が予測される少なくとも1本の染色体にある多型座位の集合について母親の血液試料(またはその分画)由来の遺伝型データを得ることと、前記染色体について異なる起こりうる胎児の分画にそれぞれ対応する複数の仮説を作成し、起こりうる胎児の分画について前記染色体にある多型座位の集合で前記血液試料中の期待アレル測定に関するモデルを構築し、前記モデルと前記血液試料またはその分画に由来するアレル測定を用いて胎児の分画に関する各仮説の相対確率を算出し、最も高い確率を有する仮説に対応する胎児の分画を選択することで前記血液試料中の胎児の分画を決定することにより、前記胎児の分画は決定される。いくつかの態様では、母親のある多型座位の第一のアレルがホモ接合であり、父親のその多型座位の(i)第一のアレルと第二のアレルがヘテロ接合である、または(ii)第二のアレルがホモ接合である多型座位を同定し、同定された多型座位のそれぞれについて前記血液試料中に検出された第二のアレルの量を用いて前記血液試料中の胎児の分画を決定することにより、前記胎児の分画は決定される(例えば、2012年3月29日に提供された米国特許公開第2012/0185176号および2013年3月13日に提出された米国特許公開第2014/0065621号を参照のこと。これらはそれぞれ、参照によりその全内容が本明細書に組み込まれる)。
胎児の分画を決定する他の方法は、高処理DNA配列決定装置を用いて多数の多型(例えば、SNP)遺伝子座位に存在するアレルを計測して、可能性のある胎児の分画をモデル化することを含む(例えば、米国特許公開第2012/0264121号を参照のこと。その全内容が参照により本明細書に組み込まれる)。胎児の分画を算出する他の方法は、Sparks et al.," Noninvasive prenatal detection and selective analysis of cell-free DNA obtained from maternal blood: evaluation for trisomy 21 and trisomy 18(母親の血液から得た無細胞DNAの非侵襲性出生前検査および選択的分析:三染色体21および18の評価)" Am J Obstet Gynecol 2012;206:319.e1-9にも見られ、その全内容が参照により本明細書に組み込まれる。いくつかの態様では、胎児の分画は、胎児において特定の座位がメチル化される、あるいは優先的にメチル化され、これらの同じ座位は母親では非メチル化される、優先的に非メチル化されると仮定するメチル化アッセイを用いて決定される(例えば、米国特許第7,754,428号、第7,901,884号、および第8,166,382号を参照のこと。その全内容が参照により本明細書に組み込まれる)。
図1A〜13Dは、SNP数の増加に対し、各種リード深度および腫瘍分画の場合の異なるコピー数仮説に関する検定統計量SをT(SNP数)で除した(「S/T」)分布)(ここでfは総DNA中の腫瘍DNA分画である)を示すグラフである。
単一仮説の棄却
前記二染色体性仮説のSの分布はfに依存しない。よって、測定されたデータの確率は、fを算出せずに二染色体性仮説について算出することができる。二染色体性の帰無仮説に単一仮説棄却試験を用いることができる。いくつかの態様では、二染色体性仮説でのSの確率が算出されて、その確率が所定の閾値未満(例えば、1,000分の1未満)であると、この二染色体性仮説は棄却される。これは、前記染色体分節の重複または欠失が存在することを示す。必要に応じて、閾値を調整して偽陽性率を変更することができる。
相決定済みデータ分析法の例
以下に、遺伝的に同一ではない2個以上の細胞に由来するDNAまたはRNAを含む混合試料であるとわかっているか疑わしい試料に由来するデータを分析する例示的方法が記載される。いくつかの態様では、相決定済みデータが用いられる。いくつかの態様では、前記方法は、算出済みアレル比率ごとに、前記算出済みアレル比率が前記期待アレル比率より大きいか小さいかを決定し、かつ特定の座位でのその差異の大きさを決定することを含む。いくつかの態様では、尤度分布は、特定の仮説に関してある座位に存在するアレル比率について決定され、算出済みアレル比率が尤度分布の中央に近いほど、その仮説が正しい可能性はより高くなる。いくつかの態様では、前記方法は、各座位で仮説が正しい尤度を決定することを含む。いくつかの態様では、前記方法は、各座位で仮説が正しい尤度を決定し、各座位の仮説の確率とその仮説を組み合わせることを含み、最も高い複合確率が選択される。いくつかの態様では、前記方法は、座位ごとに、および1個以上の目的細胞に由来するDNAまたはRNAの前記試料中の総DNAまたはRNAに対する可能な比率ごとに、仮説が正しい尤度を決定することを含む。いくつかの態様では、各仮説の複合確率は、各座位の仮説の確率と各可能な比率を組み合わせて決定され、最も高い複合確率を有する仮説が選択される。
一態様では、以下の仮説が考えられる。H11(すべての細胞は正常)、H10(相同体1のみを有する、相同体2の欠失の細胞が存在する)、H01(相同体2のみを有する相同体1の細胞が存在する)、H21(相同体1の重複を有する細胞が存在する)、H12(相同体2の重複を有する細胞が存在する)。癌細胞またはモザイク細胞(または、対象細胞に由来するDNAまたはRNA分画)等の対象細胞の分画fについて、ヘテロ接合(ABまたはBA)SNPの期待アレル比率は以下のように得られる。
式(1)
偏り、不純物、および配列決定誤りの修正
前記SNPでの観察Dは、各アレルが存在する元のマッピングリードn およびn からなる。よって、アレルAおよびBの増幅での予測偏りを用いた修正リードnおよびnを求めることができる。
を環境不純物(例えば、空気または環境中のDNAに由来する不純物等)とし、r(c)を環境不純物に対するアレル比率(ここでは始めは0.5とする)とする。また、cを遺伝型解析による不純物率(例えば、他の試料に由来する不純物)とし、r(c)を不純物のアレル比率とする。s(A,B)およびs(B,A)は、(例えば、アレルBが存在する場合に誤ってアレルAを検出することにより)あるアレルを別のアレルとして呼び出した配列決定エラーとする。
環境不純物、遺伝型解析による不純物、および配列決定誤りを修正して、ある期待アレル比率rに対する観察アレル比率q(r,c,r(c),c,r(c),s(A,B),s(B,A))を求めることができる。
不純物の遺伝型はわからないので、集団頻度を用いてP(r(c))を求めることができる。より具体的には、pをアレルの1つ(基準アレルと言う場合もある)に対する集団頻度とする。すると、P(r(c)=0)=(1−p)、P(r(c)=0)=2p(1−p)、およびP(r(cg)=0)=pである。r(c)に対する条件付き期待値を用いてE[q(r,c,r(c),c,r(c),s(A,B),s(B,A))]を決定することができる。なお、環境不純物および遺伝型解析による不純物はホモ接合SNPを用いて決定されるので、欠失または重複の有無によって影響されない。また、必要に応じて、基準染色体を用いて環境不純物および遺伝型解析による不純物を測定することができる。
各SNPの可能性
以下の式により、アレル比率rを仮定して、nおよびnを観察する確率が求められる。
式(2):
をSNPのデータとする。各仮説h∈{H11,H01,H10,H21,H12}について、式(1)でr=r(AB,h)またはr=r(BA,h)と仮定して、r(c)に対する条件付き期待値を求めて、観察アレル比率E[q(r,c,r(c),c,r(c))]を決定することができる。よって、式(2)でr=E[q(r,c,r(c),c,r(c),s(A,B),s(B,A))]と仮定して、P(D|h,f)を求めることができる。
検索アルゴリズム
いくつかの態様では、(例えば、平均値より少なくとも2または3標準偏差大きい、または小さいアレル比率を有するSNPを無視あるいは除外することで)異常値と思われるアレル比率を有するSNPは無視される。この方法の利点は、モザイクが存在する百分率が高い場合に前記アレル比率の可変性が高くてもよいので、モザイクによるこのSNPの削除が確実に起こらないようにする。
F={f,….,f}を、モザイクの百分率(例えば、腫瘍分画等)の検索空間とする。各SNPのP(D|h,f)およびf∈Fを求めて、すべてのSNPの尤度を組み合わせることができる。
前記アルゴリズムは、各仮説の各fについて調べる。ある検索方法を用いて、fの範囲F*(ここで欠失または重複の仮説の信頼度が欠失および重複がない仮説の信頼度よりも高い)がある場合、モザイクが存在すると結論づけられる。いくつかの態様では、F*でのP(D|h,f)の最尤推定値が決定される。必要に応じて、f∈F*の条件付き期待値が決定されてもよい。必要に応じて、各仮説の信頼度が決定されてもよい。
さらなる態様
いくつかの態様では、二項分布の代わりにベータ二項分布が用いられる。いくつかの態様では、基準染色体または染色体分節を用いて試料のベータ二項分布の特定のパラメータが決定される。
シミュレーションを用いた理論的性能
必要に応じて、所定のリード深度(DOR)で基準リード数をSNPに無作為に割り当てて、アルゴリズムの理論的性能を評価してもよい。正常な場合、二項確率パラメータにp=0.5が用いられ、欠失または重複についてpはそれに応じて改訂される。各シミュレーションの入力パラメータの例としては、(1)SNP(S)の数、(2)SNPごとの定数DOR(D)、(3)p、および(4)実験数である。
第1のシミュレーション実験
この実験ではS∈{500,1000}、D∈{500,1000}、およびp∈{0%,1%,2%,3%,4%,5%}に注目した。各設定で1,000回のシミュレーション実験を行った(相を用いた24,000回の実験と、相を用いない24,000回の実験)。二項分布(必要に応じて他の分布を用いることができる)からリード数のシミュレーションを行った。偽陽性率(この場合はp=0%)と偽陰性率(この場合はp>0%)は、相情報を用いて、および相情報を用いずに決定された。偽陽性率が図26に示されている。特にS=1000、D=1000の場合に相情報は非常に有益である。S=500、D=500でも、前記アルゴリズムは、試験条件から相のある最も高い偽陽性率、または相のない最も高い偽陽性率を有する。偽陰性率は図27に示されている。
相情報は、モザイク百分率が低い(≦3%)場合に特に有用である。相情報がない場合、p=1%では偽陰性が多く観察された。というのは、欠失に関する信頼度は、H10とH01に等しく機会を割り当てて決定され、ある仮説を支持する小さな偏差は、他の仮説からの低尤度を補償するには不十分だからである。これは重複にも適用される。前記アルゴリズムは、SNP数に比べてリード深度の感度がより高いと思われる。相情報を用いた結果では、連続した多くのヘテロ接合SNPで完全な相情報が利用可能であると仮定する。必要に応じて、より小さい分節にあるハプロタイプを確率的に組み合わせてハプロタイプ情報を得ることができる。
第2のシミュレーション実験
この実験では、S∈{100,200,300,400,500}、D∈{1000,2000,3000,4000,5000}、およびp∈{0%,1%,1.5%,2%,2.5%,3%}注目して、各設定で10,000回のランダム実験を行った。偽陽性率(この場合はp=0%)と偽陰性率(この場合はp>0%)は、相情報を用いて、および相情報を用いずに決定された。偽陰性率は、ハプロタイプ情報を用いてD≧3000およびN≧200の場合は10%未満であるが、D=5000およびN≧400の場合に同じ性能が得られる(図20Aおよび20B)。偽陰性率間の差は、モザイクの百分率が小さい場合に特に顕著であった(図21A〜25B)。例えば、p=1%では、ハプロタイプデータを用いなければ20%未満の偽陰性率は得られないが、N≧300およびD≧3000では偽陰性率は0%に近づく。p=3%では、ハプロタイプデータを用いて0%の偽陰性率が観察されるが、ハプロタイプデータを用いなければ同じ性能を得るのにN≧300およびD≧3000が必要である。
相決定済みデータを用いずに欠失および重複を検出する方法の例
いくつかの態様では、相未決定の遺伝子データを用いて、個体のゲノム(例えば、1個以上の細胞、あるいは無細胞DNAまたは無細胞RNAのゲノム)中の第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現があるかどうかが決定される。いくつかの態様では、相決定済み遺伝子データが用いられるが、相決定は無視される。いくつかの態様では、前記DNAまたはRNA試料は、2個以上の遺伝的に異なる細胞を含む個体に由来する無細胞DNAまたは無細胞RNAを含む無細胞DNAまたは無細胞RNAの混合試料である。いくつかの態様では、前記方法は、前記座位のそれぞれについて算出済みアレル比率と期待アレル比率の差異の大きさを用いる。
いくつかの態様では、前記方法は、各座位に存在する各アレルの量を測定して、前記個体に由来する1個以上の細胞に由来するDNAまたはRNAの試料中の染色体または染色体分節にある多型座位の集合の遺伝子データを得ることを含む。いくつかの態様では、前記試料が由来する少なくとも1個の細胞においてヘテロ接合である座位(例えば、前記胎児においてヘテロ接合である座位および/または前記母親においてヘテロ接合である座位)についてアレル比率が算出される。いくつかの態様では、特定の座位の算出済みアレル比率は、前記アレルの1つの測定量をその座位のすべてのアレルの総測定量で除したものである。いくつかの態様では、特定の座位の算出済みアレル比率は、前記アレル(例えば、前記第一の相同染色体分節にあるアレル等)の1つの測定量を、その座位の1つ以上の他のアレル(例えば、第二の相同染色体分節にあるアレル等)の測定量で除したものである。前記算出済みアレル比率と前記期待アレル比率は、本明細書で開示した方法のいずれかを用いて、または任意の標準的な方法(例えば、本明細書に記載した算出済みアレル比率または期待アレル比率の任意の数学的変換等)を用いて算出されてもよい。
いくつかの態様では、検定統計量は、前記座位のそれぞれについて算出済みアレル比率と期待アレル比率の差異の大きさに基づいて算出される。いくつかの態様では、前記検定統計量Δは下記式を用いて算出される。
ここで、δは、i番目の座位の算出済みアレル比率と期待アレル比率の差異の大きさであり、
μはδの平均値であり、
σ はδの標準偏差である。
例えば、期待アレル比率が0.5であるとき、δを次のように定義することができる。
が二項ランダム変数であるという事実を用いて、μおよびσの値を計算することができる。いくつかの態様では、前記標準偏差はすべての座位で同じと仮定される。いくつかの態様では、前記標準偏差の平均値または加重平均値、あるいは前記標準偏差の推定値はσ の値に用いられる。いくつかの態様では、前記検定統計量は正常な分布を有すると仮定される。例えば、中心極限定理は、座位数(例えば、SNP数T)が増加するにつれてΔの分布は標準正規偏差に近づくことを示す。
いくつかの態様では、前記細胞の1つ以上のゲノム中の染色体または染色体分節のコピー数を規定する1つ以上の仮説の集合が列挙される。いくつかの態様では、前記検定統計量に基づいて最も可能性の高い仮説が選択されて、前記細胞の1つ以上のゲノム中の染色体または染色体分節のコピー数が決定される。いくつかの態様では、その仮説について前記検定統計量がその検定統計量の分布に属している確率が上限閾値より大きい場合は仮説が選択され、その仮説について前記検定統計量がその検定統計量の分布に属している確率が下限閾値より小さい場合は前記仮説の1つ以上の仮説が棄却される。あるいは、その仮説について前記検定統計量がその検定統計量の分布に属している確率が下限閾値と上限閾値の間である、または前記確率が十分に高い信頼度で決定されていない場合は仮説は選択も棄却もされない。いくつかの態様では、実験的分布(例えば、訓練データ(例えば、二倍体試料等のコピー数が既知である試料、または特定の欠失または重複を有することが既知の試料等)に由来する分布等)から上限閾値および/または下限閾値が決定される。このような実験的分布を用いて単一仮説棄却試験の閾値を選択することができる。
なお、検定統計量ΔはSから独立しており、よって、いずれも必要に応じて独立して用いることができる。
アレル分布またはパターンを用いた欠失および重複を検出する方法の例
この項は、第二の相同染色体分節と比較して第一の相同染色体分節のコピー数過剰出現があるかどうかを決定する方法を含む。いくつかの態様では、前記方法は、(i)前記個体の1個以上の細胞(例えば、癌細胞)のゲノムに存在する染色体または染色体分節のコピー数を指定する複数の仮説、または(ii)前記個体の1個以上の細胞のゲノム中の第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現度を規定する複数の仮説を列挙することを含む。いくつかの態様では、前記方法は、前記染色体または染色体分節にある複数の多型座位(例えば、SNP座位)について前記個体に由来する遺伝子データを得ることを含む。いくつかの態様では、前記仮説のそれぞれについて、前記個体の期待される遺伝型の確率分布が作成される。いくつかの態様では、前記個体の得られた遺伝子データと前記個体の期待される遺伝型の確率分布のデータ適合が算出される。いくつかの態様では、前記データ適合に応じて1つ以上の仮説がランク付けされて、最高ランクの仮説が選択される。いくつかの態様では、前記データ適合を算出する工程、前記仮説をランク付けする工程、最高ランクの仮説を選択する工程の1つ以上において技術またはアルゴリズム(例えば、検索アルゴリズム等)が用いられる。いくつかの態様では、前記データ適合が、ベータ二項分布に対する適合または二項分布への適合である。いくつかの態様では、前記技術またはアルゴリズムが、最尤推定、最大事後確率推定、ベイズ推定、動的推定(例えば、動的ベイズ推定等)、および期待値最大化推定からなる群から選択される。いくつかの態様では、前記方法は、前記技術またはアルゴリズムを前記得られた遺伝子データおよび前記期待遺伝子データに適用することを含む。
いくつかの態様では、前記方法は、(i)前記個体の1個以上の細胞(例えば、癌細胞)のゲノムに存在する染色体または染色体分節のコピー数を指定する複数の仮説、またはまたは(ii)前記個体の1個以上の細胞のゲノム中の第二の相同染色体分節と比較して第一の相同染色体分節のコピー数の過剰出現度を規定する複数の仮説を列挙することを含む。いくつかの態様では、前記方法は、前記染色体または染色体分節にある複数の多型座位(例えば、SNP座位)について前記個体に由来する遺伝子データを得ることを含む。いくつかの態様では、前記遺伝子データは、前記複数の多型座位のアレル数を含む。いくつかの態様では、仮説ごとに、前記染色体または染色体分節にある前記複数の多型座位にある期待アレル数について同時分布モデルが作成される。いくつかの態様では、前記同時分布モデルと前記試料で測定されたアレル数を用いて前記仮説の1つ以上の仮説の相対確率が決定されて、最も高い確率を有する仮説が選択される。
いくつかの態様では、アレルの分布またはパターン(例えば、算出済みアレル比率のパターン等)を用いてCNV(例えば、欠失または重複)の有無が決定される。必要に応じて、このパターンに基づいて前記CNVの親起源が決定されてもよい。母親から受け継がれた重複は母親由来の染色体分節の余剰コピーであり、母親から受け継がれた欠失は母親由来の染色体分節コピーが欠けており、存在する染色体分節の唯一のコピーが父親に由来するものである。パターンの例が図15A〜19Dに示されており、以下でさらに説明される。
目的の染色体分節の欠失の有無を決定するため、前記アルゴリズムは、1本の染色体につき多数のSNPについて2つの起こりうるアレルのそれぞれに由来する配列計測の分布を考慮する。なお、重要なことだが、前記アルゴリズムのいくつかの態様は視覚化に適さない手法を用いている。よって、例示のために、関連する傾向をよりわかりやすく視覚化することができるように、そのデータを2つの最も可能性の高いアレルAおよびBの比率として簡単に図15A〜図18に示す。この簡単な例示は、前記アルゴリズムの起こりうる特徴のいくつかを考慮していない。例えば、アレル比率を表示するなんらかの視覚化方法でデータを表示できない前記アルゴリズムの2つの態様は、1)連鎖不平衡、すなわち1個のSNPの測定が近隣のSNPの同一性の可能性に及ぼす影響を利用する能力、および2)プラットフォーム特性と増幅偏りを仮定したSNPのアレル測定の期待分布を説明する非ガウスデータモデルの使用である。また、前記アルゴリズムの簡易版は、各SNPで最も共通するアレルを考慮するのみで、他の起こりうるアレルは無視される。
ゲノム試料および母親の血液試料で目的の欠失が検出された。いくつかの態様では、実施例1の多重PCRと配列決定方法を用いてゲノム試料および母親の血漿試料が分析される。検査されたゲノムDNA症候群試料は、対象領域ではヘテロ接合SNPがなく、このアッセイが一染色体性(発症)と二染色体性(非発症)を区別することができることが確認された。母親の血液試料の無細胞DNAの分析は、22q11.2欠失症候群、猫鳴き欠失症候群、ウォルフ・ヒルシュホーン欠失症候群、および図14の胎児の他の欠失症候群を検出することができた。
図15A〜15Cは、前記試料が完全に母親由来である(胎児の無細胞DNAは存在しない)場合(図15A)、中濃度(12%)の胎児の無細胞DNA分画を含む場合(図15B)、高濃度(26%)の胎児の無細胞DNA分画を含む場合(図15C)の2本の染色体の有無を示すデータを示す。x軸は、染色体に沿った個体の多型座位の直線位置を表し、y軸はアレルの総リード数(A+B)の分画としてアレルAのリード数を表す。母親の遺伝型および胎児の遺伝型は、プロットの右側に示されている。各プロットは母親の遺伝型に応じて色づけされている。例えば、赤は母親の遺伝型AA、青は母親の遺伝型BB、緑は母親の遺伝型ABを表す。測定は母親の血液から単離された総無細胞DNAに対して行われ、前記無細胞DNAは母親と胎児両方の無細胞DNAを含む。よって、各点は、そのSNPをもたらした胎児と母親のDNAの組み合わせを示している。したがって、母親の無細胞DNAの割合が0%から100%に増加すると、母親の遺伝型および胎児の遺伝型に応じてプロット内でいくつかの点は多少上下する。
すべての場合で、母親と胎児の両方でアレルAがホモ接合である(AA)のSNPが、プロットの上限と密接に関連づけられることがわかる。というのは、アレルBが存在しないためアレルAのリードの分画が高いからである。逆に、母親と胎児の両方でアレルBがホモ接合であるSNPは、プロットの下限と密接に関連づけられることがわかる。というのは、アレルBのみが存在するため、アレルAのリードの分画が低いからである。プロットの上限および下限に密接に関連づけられない点は、母親、胎児、または両方がヘテロ接合であるSNPを表す。これらの点は、胎児の欠失または重複を同定するのに有益であるが、両親の遺伝と母親の遺伝を決定するのにも有益な可能性がある。これらの点は、母親の遺伝型と胎児の遺伝型の両方および胎児の分画に基づいて分かれており、y軸に沿った各点の正確な位置は化学量論と胎児の分画の両方に依存する。例えば、母親がAAで胎児がABである座位は、アレルAのリードの分画が異なっていると予測され、したがって、胎児の分画によってy軸の位置が異なる。
図15Aは、妊娠していない女性のデータであり、遺伝型が完全に母親のものであるパターンを示す。このパターンは、点の「集合」を含む。赤色の集合はプロットの上部(ここでは母親の遺伝型がAAであるSNP)と密接に関連づけられて、青い色の集合はプロットの底部(ここでは母親の遺伝型がBBのSNP)と密接に関連づけられて、単一の中央の緑色の集合(ここでは母親の遺伝型がABのSNP)と密接に関連づけられている。図15Bでは、胎児のアレルがアレルAのリードの分画に含まれているのでいくつかのアレルの点の位置がy軸に沿って上下に移動している。図15Cでは、2本の赤色の周辺バンドと2本の青色の周辺バンド、3本の緑色の中のバンドを含むパターンが容易に見える。これら3本の緑色の中のバンドは、母親においてヘテロ接合であるSNPに対応しており、プロットの上部(赤色)と底部(青色)の両方にある2本の「周辺」バンドは、それぞれ母親においてホモ接合であるSNPに対応している。
図16Aに22q11.2欠失の保有者(この欠失を有する母親)の分析を示す。この欠失の保有者は、この領域にヘテロ接合SNPを有していない。というのは、この保有者のみがこの領域の1コピーを有するからである。よって、この欠失は緑色のABのSNPがないことにより示される。図16Bに、両親から受け継がれた胎児の22q11欠失の分析を示す。この胎児のみが染色体分節の単一コピーを受け継ぎ(両親から受け継がれた欠失の場合、胎児に存在するコピーは母親に由来する)、よってこの分節の各座位に単一アレルを受け継いでいる場合、この胎児のヘテロ接合性は起こりえない。したがって、唯一起こりうる胎児のSNPの同一性はAまたはBである。なお、周辺バンドの内側がなくなっている。両親から受け継がれた欠失の場合、特徴的なパターンは、母親ではヘテロ接合であるSNPを示す2本の中の緑色のバンドを含み、母親ではホモ接合であり、それぞれプロットの上限および下限(1および0)と密接に関連づけられているSNPを示す単一の赤色のバンドと青色のバンドを有する。
図17に母親から受け継がれた猫鳴き欠失症候群の分析を示す。3本の緑色のバンドの代わりに2本の中の緑色のバンドと、2本の赤色の周辺バンドと2本の青色の周辺バンドがある。母親と胎児の両方が欠失を有しているため、母親から受け継がれた欠失(例えば、デュシェンヌ型筋ジストロフィーの母親の保有者)もまた、母親と胎児のDNA混合試料(例えば、血漿試料)中の欠失領域において少量の信号に基づいて検出することができる。
図18は、両親から受け継がれたウォルフ・ヒルシュホーン欠失症候群のプロットであり、1本の赤い周辺バンドと1本の青い周辺バンドによって示されている。
必要に応じて、欠失または重複(例えば、癌と関連づけられたCNV等)を有すると疑われる個体に由来する試料について同様のプロットを作成することができる。このようなプロットでは、CNVを有しない細胞の遺伝型に基づいて以下の色コードを用いることができる。赤色はAAの遺伝型を示し、青色はBBの遺伝型を示し、緑色はABの遺伝型を示す。いくつかの態様では、欠失の場合、そのパターンは、前記個体ではヘテロ接合である(緑色の上のバンドは欠失のない細胞に由来するABおよび欠失がある細胞に由来するAを示し、緑色の下のバンドは欠失がない細胞に由来するABおよび欠失がある細胞に由来するBを示す)SNPを表す2本の中の緑色のバンドを含み、前記個体ではホモ接合であり、それぞれプロットの上限および下限(1および0)と密接に関連づけられているSNPを示す単一の赤色のバンドと青色のバンドを有する。いくつかの態様では、欠失を有する細胞、DNA、またはRNAの分画が増加するにつれて、2本の緑色のバンドの分離も増加する。
多胎妊娠を同定および分析する方法の例
いくつかの態様では、本発明の方法のいずれかを用いて双胎妊娠等の多胎妊娠の存在が検出されるが、胎児のうちの少なくとも一方は、少なくとももう一方の胎児と遺伝的に異なっている。いくつかの態様では、検査した座位のいくつか(またはすべて)で異なるアレル、異なるアレル比率、または異なるアレル分布を有する2体の胎児の存在に基づいて二卵性双生児が同定される。いくつかの態様では、試料(例えば、血漿試料)中に同じまたは異なる胎児の分画を有する可能性がある2体の胎児について各座位(例えば、SNP座位)の期待アレル比率を決定することで二卵性双生児が同定される。いくつかの態様では、母親の遺伝型と遺伝型集団頻度を条件として、特定の対の胎児の起こりうる遺伝型のいくつか、あるいはすべてを考慮して特定の対の胎児の分画(ここでf1は胎児1の胎児の分画であり、f2は胎児2の胎児の分画)の尤度が算出される。2体の胎児の遺伝型と一人の母親の遺伝型の混合物を胎児の分画と組み合わせて、あるSNPの期待アレル比率が決定される。例えば、母親がAAで、胎児1がAAで、胎児2がABである場合、このSNPのアレルBの総分画は、f2の半分である。尤度の算出では、胎児の遺伝型の起こりうる組み合わせのすべてに基づいてすべてのSNPが期待アレル比率とどの程度適合するかが算出される。データに最も適合する1対の胎児の分画(f1、f2)が選択される。胎児の特定の遺伝型を算出することは必要ではない。その代わり、例えば、統計的組み合わせで起こりうる遺伝型のすべてを考慮することができる。いくつかの態様では、前記方法が単生児と同一性双生児を区別しない場合、超音波を用いて単生児か同一性双胎妊娠であるかを決定することができる。超音波により双胎妊娠が検出されると、同一性双胎妊娠であると仮定することができる。というのは、兄弟性双胎妊娠であれば上述のSNP分析に基づいて検出されるはずであるからである。
いくつかの態様では、事前検査(例えば、超音波等)に基づいて妊娠している母親が多胎妊娠(例えば、双胎妊娠)であると分かっている。本発明の方法のいずれかを用いて、多胎妊娠が同一性双生児または兄弟性双生児を含むかどうかを決定することができる。例えば、同一性双生児(単胎妊娠としての同じアレル比率)または二卵性双生児(例えば、上述のアレル比率の算出)に期待されることと測定されたアレル比率とを比較することができる。いくつかの同一性双生児は単一絨毛膜性双生児であり、双胎児間輸血症候群を有する危険性がある。よって、本発明の方法を用いて、同一性双生児であると判定された双生児は、(例えば、超音波等によって)検査されて、単一絨毛膜性双生児であるかどうかが判定され、単一絨毛膜性双生児である場合はこれらの双生児を(例えば、16週目から隔週で超音波等により)監視できることが望ましい。
いくつかの態様では、本発明の方法のいずれかを用いて、多胎妊娠(例えば、双胎妊娠等)の胎児のいずれかが異数体であるかどうかが決定される。双生児の異数性検査は、胎児の分画の推定値から始まる。いくつかの態様では、上述のようにデータに最も適合する1対の胎児の分画(f1、f2)が選択される。いくつかの態様では、起こりうる胎児の分画の範囲にわたり、パラメータ対(f1、f2)について最尤推定が行われる。いくつかの態様では、f2の範囲は、0からf1である。というのは、f2は小さい方の胎児分画として定義されるからである。(f1、f2)の対を仮定して、SNP座位等の座位の集合で観察されたアレル比率からデータの尤度が算出される。いくつかの態様では、前記データ尤度は母親の遺伝型、入手可能であれば父親の遺伝型、集団頻度、得られた胎児の遺伝型の確率を反映する。いくつかの態様では、SNPは独立して仮定される。胎児の推定分画対は、最も高いデータ尤度を生成するものである。f2が0である場合、このデータは、同一性双生児を示す胎児の遺伝型の1集合のみによって最もよく説明される。この場合、f1は組み合わされた胎児の分画である。そうでなければ、f1とf2は、個々の双生児の胎児の分画の推定値である。(f1、f2)の最適推定値が確立されると、必要に応じて母親の遺伝型と胎児の遺伝型の任意の組み合わせについて血漿中のアレルBの総分画を予測することができる。個々の配列リードを個々の胎児に割り当てる必要はない。2つの仮説のデータ尤度を比較する他の最尤推定値を用いて倍数性検査が行われる。いくつかの態様では、同一性双生児の場合、(i)双生児の両方が正倍数体であるという仮説、および(ii)双生児の両方が三染色体であるという仮説が考慮される。いくつかの態様では、二卵性双生児の場合、(i)双生児の両方が正倍数体であるとい仮説、および(ii)双生児の少なくとも一方が三染色体であるという仮説が考慮される。二卵性双生児に対する三染色体性仮説は、低い胎児の分画に基づいている。というのは、高い胎児の分画を有する双生児の三染色体性も検出されるからである。二染色体性仮説または三染色体性仮説のいずれかで条件付けられた各対象ゲノム座位でのリード期待数を予測する方法を用いて倍数性尤度が算出される。二染色体性基準染色体の要件は存在しない。リード期待数の分散モデルは、個々の対象座位の性能と、座位間の相関関係を考慮する(例えば、2014年6月5日に提出された米国シリアル第62/008,235号、および2014年8月4日日に提出された米国シリアル第62/032,785号、それぞれ参照にその全内容が本明細書に組み込まれる)。小さい双生児が胎児の分画f1を有する場合、その双生児の三染色体性を検出する能力は、同じ胎児の分画で単胎妊娠における三染色体性を検出する能力と同等である。これは、いくつかの態様において三染色体性を検出する前記方法の一部が遺伝型に依存しておらず、多胎妊娠か単胎妊娠かを区別しないためである。単に決定された胎児の分画に応じてリード数の増加を検索するのみである。
いくつかの態様では、前記方法は、(例えば、上述のように)SNP座位に基づいて双生児の存在を検出することを含む。双生児が検出された場合、SNPを用いて、上述のように各胎児(f1、f2)の胎児の分画が決定される。いくつかの態様では、高い信頼度二染色体性呼び出しを有する試料を用いてSNPあたりの増幅偏りが決定される。いくつかの態様では、高い信頼度二染色体性呼び出しを有するこれら試料は、1つ以上の目的の試料と同一操作で分析される。いくつかの態様では、前記SNPあたりの増幅偏りを用いて、2体の双生児の胎児の分画の低い方を仮定して1つ以上の目的の染色体または染色体分節(例えば、21番染色体等)、あるいは二染色体性仮説と三染色体性仮説に関するリード分布がモデル化される。2つのモデルと目的の染色体または染色体分節の測定量を仮定して二染色体性または三染色体性の尤度すなわち確率が算出される。
いくつかの態様では、陽性の異数性呼び出し(例えば、三染色体性呼び出し)の閾値は、低いほうの胎児の分画を有する双生児に基づいて設定される。この場合、他の双生児が陽性である、または両方が陽性である場合は、総染色体出現数は明らかに前記閾値より大きい。
計測方法/定量方法の例
いくつかの態様では、1つ以上の計測方法(定量方法ともいう)を用いて1つ以上のCNS(例えば、染色体分節または染色体全体の欠失または重複等)が検出される。いくつかの態様では、1つ以上の計測方法を用いて、前記第一の相同染色体分節のコピー数過剰出現が前記第一の相同染色体分節の重複または前記第二の相同染色体分節の欠失によるものであるかどうかが決定される。いくつかの態様では、1つ以上の計測方法を用いて、(例えば、1個、2個、3個、4個、あるいはそれ以上の余剰コピーがあるかどうか等)重複している染色体分節または染色体の余剰コピー数が決定される。いくつかの態様では、1つ以上の計測方法を用いて、多くの重複と小さい方の腫瘍分画を有する試料と、少ない方の重複と大きい方の腫瘍分画を有する試料が区別される。例えば、1つ以上の計測方法を用いて、染色体の4つの余剰コピーと10%の腫瘍分画を有する試料と、染色体の2つの余剰コピーと20%の腫瘍分画を有する試料が区別されてもよい。例示的な方法は、例えば米国公開第2007/0184467号、第2013/0172211号、および第2012/0003637号、米国特許第8,467,976号、第7,888,017号、第8,008,018号、第8,296,076号、および第8,195,415号、2014年6月5日に提出された米国シリアル第62/008,235号、および2014年8月4日に提出された米国シリアル第62/032,785号に開示されており、それぞれ参照によりその全内容が本明細書に組み込まれる。
いくつかの態様では、前記計測方法は、1つ以上の所定の染色体または染色体分節をマッピングするDNA配列に基づくリード数を計測することを含む。このようないくつかの方法は、特定の染色体または染色体分節にマッピングされるDNA配列リード数の基準値(カットオフ値)の作成を含み、前記基準値を超えるリード数は特定の遺伝的異常を示す。
いくつかの態様では、1箇所以上の座位のすべてのアレルの総測定量(例えば、多型座位または非多型座位の総量等)が基準量と比較される。いくつかの態様では、前記基準量は、特定のコピー数仮説の(i)閾値または(ii)期待量である。いくつかの態様では、前記基準量(CNVが存在しない場合)は、欠失または重複がないと分かっている、あるいは期待される1つ以上の染色体または染色体分節について1箇所以上の座位のすべてのアレルの総測定量である。いくつかの態様では、前記基準量(CNVが存在する場合)は、欠失または重複を有すると分かっている、あるいは期待される1つ以上の染色体または染色体分節について1箇所以上の座位のすべてのアレルの総測定量である。いくつかの態様では、前記基準量は、1つ以上の基準染色体または染色体分節について1箇所以上の座位のすべてのアレルの総測定量である。いくつかの態様では、前記基準量は、2つ以上の異なる染色体、染色体分節、または異なる試料について決定された値の平均値または中央値である。いくつかの態様では、ランダム(例えば、大量並行ショットガン配列決定)または標識化配列決定を用いて、1つ以上の多型座位または非多型座位の量が決定される。
いくつかの態様では、前記方法は、基準量を用いて、(a)目的の染色体または染色体分節にある遺伝子材料の量を測定し、(b)工程(a)で得た量と基準量を比較し、(c)前記比較に基づいて欠失または重複の有無を同定することを含む。
いくつかの態様では、前記方法は、基準染色体または染色体分節を用いて、試料に由来するDNAまたはRNAの配列決定を行って、対象座位に対して並べる複数の配列タグを得ることを含む。いくつかの態様では、前記配列タグは、特定の対象座位(例えば、長さが15〜100個のヌクレオチド)に割り当てるのに十分な長さである。前記対象座位は、前記試料中で異常な分布を有すると疑われる少なくとも1つの第一の染色体または染色体分節および前記試料中に正常に分散していると仮定される少なくとも1つの第二の染色体または染色体分節を含む複数の異なる染色体または染色体分節に由来する。いくつかの態様では、前記複数の配列タグは、対応する対象座位に割り当てられる。いくつかの態様では、前記第一の染色体または染色体分節の対象座位に並べる配列タグ数と、前記第二の染色体または染色体分節の対象座位に並べる配列タグ数が決定される。いくつかの態様では、これらの配列タグ数を比較して、前記第一の染色体または染色体分節の異常な分布(例えば、欠失または重複)の有無が決定される。
いくつかの態様では、CNVの決定にfの値(例えば、胎児の分画または腫瘍分画等)を用いて、2本の染色体または染色体分節の量の観察された差異と、特定のタイプのCNVについてfの値を仮定して期待される差異を比較する(例えば、米国公開第2012/0190020号、米国公開第2012/0190021号、米国公開第2012/0190557号、米国公開第2012/0191358号、それぞれ参照によりその全内容が本明細書に組み込まれる)。例えば、胎児の分画が増加するにつれて、前記胎児を宿している母親由来の血液試料中の二染色体の基準染色体分節の量と前記胎児で重複している染色体分節の量の差も増加する。また、腫瘍分画が増加するにつれて、二染色体の基準染色体分節の量と腫瘍で重複している染色体分節の量の差が増加する。いくつかの態様では、前記方法は、基準染色体または染色体分節(例えば、二染色体であると期待される、あるいは分かっている染色体または染色体分節)に対する目的の染色体または染色体分節の相対頻度と、fの値を比較して、前記CNVの尤度を決定することを含む。例えば、前記第一の染色体または染色体分節と前記基準染色体または染色体分節の量の差が、起こりうるそれぞれのCNV(例えば、目的の染色体分節の1つまたは2つの余剰コピー等)についてfの値を仮定して期待されるものと比較することができる。
以下の予測例では、計測方法/定量方法を用いて前記第一の相同染色体分節の重複と前記第二の相同染色体分節の欠失を区別することが例示される。宿主の正常な二染色体のゲノムを基準値と見なすと、正常な細胞と癌細胞の混合物の分析により混合物中の基準値と癌DNAの平均差が得られる。例えば、アッセイの対象である染色体領域で欠失を有する細胞に由来する試料中のDNAが10%であるとする。いくつかの態様では、定量法により、その領域に対応するリードの量が、正常試料に期待される量の95%であると期待されることが分かる。これは、対象領域の欠失を有する腫瘍細胞のそれぞれで2つの対象の染色体領域の1つが失われており、その領域にマッピングされるDNAの総量が{90%(正常細胞の場合)+(1/2×10%)(腫瘍細胞の場合)=95%}であるからである。あるいは、いくつかの態様では、アレル法により、ヘテロ接合座位に存在するアレルの比率が平均で19:20であることが分かる。ここで、アッセイの対象である染色体領域を5倍局所増幅した細胞に由来する試料中のDNAが10%とする。いくつかの態様では、定量法により、その領域に対応するリードの量が、正常試料に期待される量の125%であると期待されることが分かる。これは、5倍の局所増幅を有する腫瘍細胞のそれぞれで2つの対象の染色体領域の1つがその対象領域にわたって5回余分にコピーされており、その領域にマッピングされるDNAの総量が{90%(正常細胞の場合)+((2+5)×10%/2)(腫瘍細胞の場合)=125%}であるからである。また、いくつかの態様では、アレル法により、ヘテロ接合座位に存在するアレルの比率が平均で25:20であることが分かる。なお、アレル法のみを用いて、10%の無細胞DNAを有する試料中の染色体領域を5倍局所増幅したものは、40%の無細胞DNAを有する試料中の同じ領域の欠失と同じように見える。これら2つの場合では、欠失の場合に過小出現したハプロタイプは、局所重複を有する場合ではCNVがないハプロタイプであると思われる。また、欠失の場合でCNVがないハプロタイプは、局所重複がある場合では過剰出現したハプロタイプと思われる。このアレル法によって作成された尤度と定量法により作成された尤度を組み合わせて、2つの可能性が区別される。
基準試料を用いた計測方法/定量方法の例
1つ以上の基準試料を用いる定量方法の例が、2014年6月5日に提出された米国シリアル第62/008,235号、および2014年8月4日に提出された米国シリアル第62/032,785号に記載されており、参照によりその全体が本明細書に組み込まれる。いくつかの態様では、腫瘍DNAの最も高い分画を有する試料を選択する、ゼロ最も近いZ値を有する試料を選択する、最も高い信頼度または尤度を有するCNVがないに対応する仮説とデータが適合する試料を選択する、正常であることが既知の試料を選択する、癌を有する尤度が最も低い個体(例えば、低年齢、乳癌のスクリーニングにおける男性、家族歴がない等の個体)に由来する試料を選択する、DNAの入力量が最も高い試料を選択する、ノイズ比率に対して最も高い信号を有する試料を選択する、癌を有する尤度と相関関係があると思われる他の基準に基づいて試料を選択する、あるいはいくつかの基準の組み合わせを用いて試料を選択することのいずれかにより、1つ以上の染色体または目的の染色体(例えば、正常試料等)にCNVを有していない可能性が最も高い1つ以上の基準試料が同定される。基準集合が一旦選択されると、これらの場合が二染色体であると仮定して、各座位について、SNPあたりの偏り、すなわち、実験に特異的な増幅および他の処理による偏りを推定することができる。次いで、この実験に特異的な偏り推定値を用いて、目的の染色体(例えば、21番染色体の座位等)や、必要に応じて他の染色体座位、二染色体性が21番染色体と仮定される下位集合の一部ではない試料の測定での偏り修正することができる。一旦、倍数性が未知であるこれら試料で偏りが修正されると、同じまたは異なる方法を用いてこれら試料のデータに対して2回目の分析が行われて、前記個体(例えば、胎児)が三染色体性21を患っているかどうかを決定することができる。例えば、倍数性が未知の残りの試料に定量方法を用いることができ、21番染色体に関する修正された測定遺伝子データを用いてZ値を算出することができる。また、21番染色体の倍数性状態の予備推定値の一部として、胎児の分画(または癌を有すると疑われる個体に由来する試料の腫瘍分画)を算出することができる。この胎児の分画の場合に対して、二染色体性(二染色体性仮説)の場合に期待される修正済みリードの割合と、三染色体性(三染色体性仮説)の場合に期待される修正済みリードの割合を算出することができる。また、胎児の分画が前もって測定されなかった場合、それぞれの胎児の分画について二染色体性仮説と三染色体性仮説の集合を作成することができる。各場合に、種々のDNA座位の選択と測定における期待統計分散を仮定して、修正済みリードの割合の期待分布を算出することができる。修正済みリードの観察割合と、修正済みリードの期待割合の分布と比較して、倍数性が未知の試料のそれぞれについて二染色体性仮説と三染色体性仮説の尤度比率を算出することができる。修正済み倍数性状態として最も高い算出済み尤度を有する仮説に関連づけられた倍数性状態を選択することができる。
いくつかの態様では、癌を有する尤度が十分に低い試料の下位集合を選択して、試料の対照集合として作用させてもよい。この下位集合は固定数であってもよく、閾値未満の試料のみを選択することに基づく変数であってもよい。試料の下位集合に由来する定量的データを組み合わせ、平均、あるいは加重平均を用いて組み合わせてもよい。加重平均は、正常試料の尤度に基づいている。前記定量的データを用いて、対照試料の即席バッチで試料の配列決定で増幅対象の座位あたりの偏りを決定してもよい。前記座位あたりの偏りはまた、試料の他のバッチに由来するデータを含んでいてもよい。前記試料の下位集合がCNVを含んでおらず、観察されたいずれかの過剰増幅または過小増幅が増幅および/または配列決定、あるいは他の偏りによるものと仮定すると、前記座位あたりの偏りは、他の座位と比べてその座位で観察される相対的な過剰増幅または過小増幅を示してもよい。前記座位あたりの偏りは、増幅産物のGC含量を考慮してもよい。座位あたりの偏りを算出するために、座位を座位群に分けてもよい。一旦、前記複数の座位の各座位について座位あたりの偏りが算出されると、各座位の定量測定を調整してその座位の偏り効果を除去して前記試料の下位集合に含まれない1つ以上の試料についての配列決定データと、任意で前記試料の下位集合に含まれる1つ以上の試料を修正してもよい。例えば、患者の下位集合で平均の2倍のリード深度を有するSNP1が観察された場合、前記調整はSNP1に対応するリード数を半分の数に置き換えることを含んでいてもよい。目的の座位がSNPである場合は、前記調整は、その座位に存在するアレルのそれぞれに対応するリード数を半分にすることを含んでいてもよい。一旦、1つ以上の試料中のそれぞれで配列決定データが調節されると、1つ以上の染色体領域でCNVを検出するための方法を用いてそのデータを分析してもよい。
ある例では、試料Aは、定量方法を用いて分析される正常な細胞と癌性細胞の混合物に由来する増幅されたDNAの混合物である。以下に、起こりうるデータの例を示す。22番染色体にある長腕(q-arm)領域は、その領域にマッピングされると期待されるDNAの90%のみを有することが分かっている。HER2遺伝子に対応する局所領域は、その領域にマッピングされると期待されるDNAの150%を有することが分かっている。5番染色体の短腕(p-arm)は、そこにマッピングされると期待されるDNAの105%を有することが分かっている。臨床医は、前記試料が22番染色体にある長腕領域の欠失とHER2遺伝子の重複を有すると推論することが可能である。前記臨床医は、22q欠失は乳癌に共通すること、および両方の染色体の22q領域の欠失を有する細胞は通常、生き残らないことから、前記試料中のDNAの約20%は2本の染色体の1本で22q欠失を有する細胞に由来すると推論することが可能である。前記臨床医はまた、腫瘍細胞に由来する混合試料に由来するDNAが、HER2領域および22q領域が同質である遺伝的腫瘍細胞の集合に由来する場合、これらの細胞はHER2領域の5倍の重複を含むと推論することが可能である。
ある例では、試料Aはまた、アレル法を用いて分析される。以下に、起こりうるデータの例を示す。22番染色体の長腕の同じ領域にある2つのハプロタイプは、4:5の比率で存在する。HER2遺伝子に対応する局所領域の2つのハプロタイプは1:2の比率で存在する。5番染色体の短腕にある2つのハプロタイプは、20:21の比率で存在する。ゲノムのすべての他のアッセイ領域は、いずれのハプロタイプでも統計的に有意な過剰を有していない。臨床医は、前記試料が、22q領域、HER2領域、および5短腕にCNVを有する腫瘍に由来するDNAを含むと推論することが可能である。22q欠失が乳癌で非常に一般的であるという知識および/またはゲノムの22q領域にマッピングされるDNA量の過小出現を示す定量分析に基づいて、前記臨床医は22q欠失を有する腫瘍の存在を推論することが可能である。HER2増幅が乳癌で非常に一般的であるという知識および/またはゲノムのHER2領域にマッピングされるDNA量の過剰出現を示す定量分析に基づいて、前記臨床医はHER2増幅を有する腫瘍の存在を推論することが可能である。
基準の染色体または染色体分節の例
一部の態様では、本明細書に記載の方法のいずれかを、基準となる1つ以上の染色体または染色体分節に対しても実行し、その結果を対象である1つ以上の染色体または染色体分節の結果と比較する。
一部の態様では、基準の染色体または染色体分節をCNVが存在しないと期待される内容に関する対照として用いる。一部の態様では、基準は、対象と同一の染色体または染色体分節に欠失または重複がないことがわかっているないしは期待される1つ以上の別の試料から得られた、対象と同一の染色体または染色体分節である。一部の態様では、基準は、試験対象試料から得られ二染色体性であると期待される、別の染色体または染色体分節である。一部の態様では、基準は、試験対象である同一の試料に含まれる目的の染色体のうちの1つから得られた別の分節である。たとえば、基準は欠失または重複の可能性のある領域の外側にある1つ以上の分節であってもよい。試験対象である同一の染色体に基準があることによって、異なる染色体間で見られる可変性(染色体間で見られる代謝、アポトーシス、ヒストン、不活化、および/または増幅の違いなど)を避けることができる。試験対象の染色体と同一の染色体に存在しCNVを含まない分節を分析することによって相同体間で見られる代謝、アポトーシス、ヒストン、不活化、および/または増幅の違いを確認することもでき、CNVを含まない相同体間での可変性のレベルを、可能性のあるCNVによる結果と比較するために確認することが可能である。一部の態様では、可能性のあるCNVについてのアレル比の算出値と期待値との差異の大きさは、基準についての対応する大きさよりも大きく、それによってCNVが存在することが確認される。
一部の態様では、基準となる染色体または染色体分節を、対象である特定の欠失または重複などのCNVが存在すると期待される内容に関する対照として用いる。一部の態様では、基準は、対象と同一の染色体または染色体分節に欠失または重複があることがわかっているか期待される1つ以上の別の試料から得られた、対象と同一の染色体または染色体分節である。一部の態様では、基準は、試験対象試料から得られCNVが存在することがわかっているか期待される、別の染色体または染色体分節である。一部の態様では、可能性のあるCNVについてのアレル比の算出値と期待値との差異の大きさは、そのCNVに関する基準についての対応する大きさと類似し(たとえば、有意差はない)、それによってCNVが存在することが確認される。一部の態様では、可能性のあるCNVについてのアレル比の算出値と期待値との差異の大きさは、そのCNVに関する基準についての対応する大きさよりも小さく(たとえば有意に小さい)、それによってCNVが存在しないことが確認される。一部の態様では、癌細胞(あるいは癌細胞に由来する無細胞DNAまたは無細胞RNAなどのDNAまたはRNA)の遺伝型が非癌性細胞(あるいは非癌性細胞に由来する無細胞DNAまたは無細胞RNAなどのDNAまたはRNA)の遺伝型とは異なる1つ以上の座位を用いて腫瘍率を決定する。腫瘍率を用いて、第一の相同染色体分節のコピー数過剰出現の原因が第一の相同染色体分節の重複であるか第二の相同染色体分節の欠失であるかを決定することができる。腫瘍率を用いて、重複した染色体分節または染色体の余分なコピー数(たとえば1個、2個、3個、4個、またはそれ以上の余分なコピーがあるか)を決定し、たとえば染色体の余剰コピー数が4個であり腫瘍率が10%の試料を、染色体の余剰コピー数が2個であり腫瘍率が20%である試料と区別することもできる。腫瘍率を用いて、可能性のあるCNVについて観測されたデータが期待されたデータにどの程度適合しているかを決定することもできる。一部の態様では、CNVによる過剰出現の程度を利用して、個体に対し特定の治療または治療計画を選択する。たとえば、一部の治療薬は、染色体分節のコピーが少なくとも4個、6個、またはそれ以上である場合にのみ有効である。
一部の態様では、腫瘍率の決定に用いられる1つ以上の座位は基準の染色体または染色体分節に存在する。基準の染色体または染色体分節は、たとえば、二染色体性であることがわかっているか期待される染色体または染色体分節、一般的な癌細胞またはある個体が有していることがわかっているか有している可能性の高い特定の種類の癌では重複または欠失が起こることが稀な染色体または染色体分節、あるいは異数性であるとは考えられない染色体または染色体分節(欠失または重複した場合、細胞死につながると期待される分節)などである。一部の態様では、本発明の方法のいずれかを用いて、基準の染色体または染色体分節が癌細胞と非癌性細胞の両方で二染色体性であることを確認する。一部の態様では、二染色体性検出の信頼度が高い1つ以上の染色体または染色体分節を用いる。
腫瘍率の決定に用いることのできる例示の座位は、個体の癌細胞(あるいは癌細胞に由来する無細胞DNAまたは無細胞RNAなどのDNAまたはRNA)には存在するが非癌性細胞(あるいは非癌性細胞に由来するDNAまたはRNA)には存在しない多型または変異(SNPなど)を含む。一部の態様では、個体から採取した試料(血漿試料または腫瘍生検など)に含まれる、癌細胞(または癌細胞に由来するDNAまたはRNA)が非癌性細胞(あるいは非癌性細胞に由来するDNAまたはRNA)には存在しないアレルを有する多型座位を特定し;特定した多型座位のうちの少なくとも1つ以上の座位における癌細胞特有のアレルの量を用いて試料の腫瘍率を決定することにより、腫瘍率を決定する。一部の態様では、非癌性細胞ではその多型座位が第一のアレルのホモ接合型であり、癌細胞ではその多型座位が(i)第一のアレルと第二のアレルのヘテロ接合型または(ii)第二のアレルのホモ接合型である。一部の態様では、非癌性細胞ではその多型座位が第一のアレルと第二のアレルのヘテロ接合型であり、癌細胞は(i)その多型座位に1個または2個の第三のアレルのコピーを有する。一部の態様では、癌細胞は非癌性細胞には存在しないアレルのコピーを1個のみ有することが推測されるか知られている。たとえば、非癌性細胞の遺伝型がAAで癌細胞がABであり、ある試料においてその座位のシグナルのうち5%がBアレルに由来し95%がAアレルに由来する場合、その試料の腫瘍率は10%である。一部の態様では、癌細胞は非癌性細胞には存在しないアレルのコピーを2個有することが推測されるか知られている。たとえば、非癌性細胞の遺伝型がAAで癌細胞がBBであり、ある試料においてその座位のシグナルのうち5%がBアレルに由来し95%がAアレルに由来する場合、その試料の腫瘍率は5%である。一部の態様では、癌細胞が非癌性細胞に存在しないアレルを有する複数の座位を分析し、その癌細胞ではそれらの座位のうちのどの座位がヘテロ接合型でありどの座位がホモ接合型であるかを決定する。たとえば、非癌性細胞がAAである座位の場合、Bアレルに由来するシグナルが一部の座位では約5%であり一部の座位では約10%である場合、その癌細胞は、Bアレルが約5%である座位ではヘテロ接合型であり、Bアレルが約10%である座位ではホモ接合型であると推測される(腫瘍率が約10%であることが示される)。
腫瘍率の決定に用いることのできる座位の例としては、癌細胞と非癌性細胞が1種類のアレルを共有する座位(癌細胞がABであり非癌性細胞がBBであるか、癌細胞がBBであり非癌性細胞がABである座位など)が挙げられる。混合試料(癌細胞と非癌性細胞に由来するDNAまたはRNAを含有する)におけるAシグナルの量、Bシグナルの量、またはAシグナルのBシグナルに対する比を(i)癌細胞のみに由来するDNAまたはRNAを含有する試料、あるいは(ii)非癌性細胞のみに由来するDNAまたはRNAを含有する試料の対応する値と比較し、値の差を用いてその混合試料の腫瘍率を決定する。
一部の態様では、腫瘍率の決定に用いることのできる座位は、(i)癌細胞のみに由来するDNAまたはRNAを含有する試料、および/あるいは(ii)非癌性細胞のみに由来するDNAまたはRNAを含有する試料の遺伝型に基づいて選択される。一部の態様では、混合試料の分析に基づいて座位を選択する(各アレルの絶対量または相対量が、ある特定の座位において癌細胞も非癌性細胞も同一の遺伝型を有する場合に期待される量と異なる座位など)。たとえば、癌細胞と非癌性細胞が同一の遺伝型を有する場合、その座位は、全細胞がAAであれば0%のBシグナル、全細胞がABであれば50%のBシグナル、あるいは全細胞がBBであれば100%のBシグナルを発生すると期待される。Bシグナルの値が他の値であった場合、癌細胞と非癌性細胞の遺伝型がその座位では異なり、したがってその座位を腫瘍率の決定に用いることができることがわかる。
一部の態様では、1つ以上の座位のアレルに基づいて算出した腫瘍率を、本明細書に開示する計測方法のうちの1つ以上を用いて算出した腫瘍率と比較する。
表現型の検出または複数の変異の分析のための方法の例
一部の態様では、前記方法は、疾患または障害(癌など)あるいは疾患または障害のリスク増加に関連する変異の集合について試料を分析することを含む。ある方法のシグナル対ノイズ比を改善するのに使用でき、腫瘍を異なる臨床的部分集合に分類することができるクラス(MまたはCなどの癌のクラス)間の事象には強い相関がある。たとえば、1つ以上の染色体または染色体分節の数個の変異(数個のCNVなど)に関する境界の結果を複合的に考慮すると、非常に強いシグナルとなるかも知れない。一部の態様では、対象とする複数(たとえば2個、3個、4個、5個、8個、10個、12個、15個、またはそれ以上)の多型または変異の有無を決定することによって、癌などの疾患または障害、あるいは癌などの疾患または障害のリスク増加の有無の決定の感度および/または特異度が高くなる。一部の態様では、複数の染色体にわたる事象間の相関を利用し、各染色体を個別に調べるよりも有効にシグナルを調べる。腫瘍の分類を最善に行うため、方法自体の設計を最適化することができる。このことは、1つの特定の変異/CNVに対する感度が最も高いと考えられる、再発の早期発見・検診に非常に有用となり得る。一部の態様では、事象は常に相関するのではなく、相関確率を有する。一部の態様では、非対角項を有するノイズ共分散行列を用いる行列による推定の構築が行われる。
一部の態様では、本発明は個体の表現型(癌の表現型など)を検出するための方法を特徴とし、ここで、表現型は変異の集合のうちの少なくとも1つの変異の存在によって定義される。一部の態様では、前記方法は、個体から採取した1つ以上の細胞から得たDNAまたはRNAの試料に関するDNA測定値またはRNA測定値を得ること(ここで、前記細胞のうちの1つ以上は前記表現型を有すると考えられる)と;該DNA測定値またはRNA測定値を分析することによって、前記変異の集合のうちの各変異について、該細胞のうちの少なくとも1つがその変異を有する尤度を決定することとを含む。一部の態様では、前記方法は、(i)前記変異のうちの少なくとも1つについて、前記細胞のうちの少なくとも1つがその変異を有する尤度が閾値よりも高い場合、または(ii)該変異のうちの少なくとも1つについて、該細胞のうちの少なくとも1つがその変異を有する尤度が閾値よりも低く、複数の変異について、該細胞のうちの少なくとも1つが該変異のうちの少なくとも1つを有する結合尤度が閾値よりも高い場合に、前記個体が前記表現型を有すると決定することを含む。一部の態様では、1つ以上の細胞は、変異の集合に含まれる変異の部分集合またはすべての変異を有する。一部の態様では、変異の部分集合は癌または癌のリスク増加に関連する。一部の態様では、変異の集合は癌変異のMクラスに含まれる変異の部分集合またはすべての変異を含む(Ciriello, Nat Genet. 45(10):1127-1133, 2013, doi: 10.1038/ng.2762(この文献の全内容は参照によって本明細書に組み込まれる))。一部の態様では、変異の集合は、癌変異のCクラスに含まれる変異の部分集合またはすべての変異を含む(Cirielloによる上記文献)。一部の態様では、試料は無細胞DNAまたは無細胞RNAを含む。一部の態様では、DNA測定値またはRNA測定値は、対象とする1つ以上の染色体または染色体分節に存在する多型座位の集合での測定値(各座位の各アレルの量など)を含む。
実父確定検査または遺伝的関連性検査のための方法の例
本発明の方法は、実父確定検査またはその他の遺伝的関連性検査の精度を改善するために利用可能である(たとえば、2011年12月22日出願の米国特許出願公開第2012/0122701号明細書を参照;この文献の全内容は参照によって本明細書に組み込まれる)。たとえば多重PCR法によって、本明細書に記載の、擬父が胎児の実父であるかを判定するPARENTAL SUPPORTアルゴリズムに使用するために数千の多型座位(SNPなど)を分析することが可能である。一部の態様では、本発明は、擬父が、妊娠中の母親が懐胎している胎児の実父であるかを確証する方法を特徴とする。一部の態様では、前記方法は、擬父に関する相決定済み遺伝データを得ることを含む(たとえば、本明細書に記載の別の方法を用いて遺伝データを相決定することによって)。ここで、相決定済み遺伝データは、擬父の第一の相同染色体分節と第二の相同染色体分節にある多型座位の集合の各座位に存在するアレルの同一性を含む。一部の態様では、前記方法は、胎児の母親から採取した、胎児のDNAと母親のDNAを含有するDNAの混合試料に含まれる染色体または染色体分節にある多型座位の集合の遺伝データを、各座位での各アレルの量を測定することによって得ることを含む。一部の態様では、前記方法は、擬父に関する相決定済み遺伝データから、DNAの混合試料の期待遺伝データをコンピュータで算出することと;DNAの混合試料に関して得られた遺伝データをDNAの混合試料の期待遺伝データと比較することによって、擬父が胎児の実父である確率をコンピュータで決定することと;決定された、擬父が胎児の実父である確率を用いて、擬父が胎児の実父であるか否かを確証することとを含む。一部の態様では、前記方法は、胎児の実母の相決定済み遺伝データを得ることを含む(たとえば本明細書に記載の別の方法を用いて遺伝データを相決定することによって)。ここで、相決定済み遺伝データは、母親の第一の相同染色体分節と第二の相同染色体分節にある多型座位の集合の各座位に存在するアレルの同一性を含む。一部の態様では、前記方法は、胎児に関する相決定済み遺伝データを得ることを含む(たとえば本明細書に記載の別の方法を用いて遺伝データを相決定することによって)。ここで、相決定済み遺伝データは、胎児の第一の相同染色体分節と第二の相同染色体分節にある多型座位の集合の各座位に存在するアレルの同一性を含む。一部の態様では、前記方法は、擬父に関する相決定済み遺伝データを用い、かつ母親に関する相決定済み遺伝データおよび/または胎児に関する相決定済み遺伝データを用いて、DNAの混合試料の期待される遺伝データをコンピュータで算出することを含む。
一部の態様では、本発明は、擬父が、妊娠中の母親が懐胎している胎児の実父であるかを確証する方法を特徴とする。一部の態様では、前記方法は、擬父に関する相決定済み遺伝データを得ることを含む(たとえば本明細書に記載の別の方法を用いて遺伝データを相決定することによって)。ここで、相決定済み遺伝データは、擬父の第一の相同染色体分節と第二の相同染色体分節にある多型座位の集合の各座位に存在するアレルの同一性を含む。一部の態様では、前記方法は、胎児の母親から採取した、胎児のDNAと母親のDNAを含有するDNAの混合試料に含まれる染色体または染色体分節にある多型座位の集合の遺伝データを、各座位での各アレルの量を測定することによって得ることを含む。一部の態様では、前記方法は、(i)多型座位において胎児のDNAには存在するが母親のDNAには存在しないアレルを確認すること、および/または(i)多型座位において胎児のDNAにも母親のDNAにも存在しないアレルを確認することを含む。一部の態様では、前記方法は擬父が胎児の実父である確率をコンピュータで決定することであって、該決定は(1)(i)多型座位において胎児のDNAには存在するが母親のDNAには存在しないアレルを(ii)擬父から得た遺伝物質中の対応する多型座位に存在するアレルと比較すること、および/または(2)(i)多型座位において胎児のDNAにも母親のDNAにも存在しないアレルを(ii)擬父から得た遺伝物質中の対応する多型座位に存在するアレルと比較し、擬父が胎児の実父である決定された確率を用いて擬父が胎児の実父であるかどうかを確認することを含む。
一部の態様では、擬父が胎児の実父であるかどうかを決定するための上記方法を用いて、胎児の血縁者(祖父母、兄弟姉妹、おじまたはおばなど)とされる者が実際に胎児の実の血縁者であるかを決定する(たとえば擬父の遺伝データの代わりに血縁者とされる者の遺伝データを用いることによって)。
方法の組み合わせの例
結果の精度を上げるため、CNVの有無を検出するための2つ以上の方法(本発明の方法のうちの任意の方法または任意の既知の方法など)を実行する。一部の態様では、疾患または障害あるいは疾患または障害のリスク増加の有無を示す因子を分析するための1つ以上の方法(本明細書に記載の方法のうちの任意の方法または任意の既知の方法など)を実行する。
一部の態様では、標準の数学的手法を用いて2つ以上の方法の間の共分散および/または相関を算出する。標準の数学的手法を用いて2つ以上の試験に基づく特定の仮説の複合確率を決定してもよい。手法の例としては、メタ解析、独立な検定に関するFisherの複合確率検定、既知の共分散を用いて非独立なp値を統合するBrownの方法、未知の共分散を用いて非独立なp値を統合するKostの方法が挙げられる。第一の方法によって決定した尤度が第二の方法に関して決定した尤度と直交する、すなわち非関連である場合、尤度の結合は単に乗算と正規化によって、すなわち以下のような式を用いることによって可能である:
comb=R/[R+(1−R)(1−R)]
combは結合尤度であり、RおよびRは個別尤度である。たとえば、方法1による三染色体性の尤度が90%であり、方法2による三染色体性の尤度が95%である場合、この2つの方法の結果を組み合わせることにより、臨床医は、胎児が(0.90)(0.95)/[(0.90)(0.95)+(1−0.90)(1−0.95)]=99.42%の尤度で三染色体性であると結論付けることができる。第一の方法と第二の方法が直交でない場合、すなわち2つの方法間に相関がある場合も尤度を結合することができる。
複数の因子または変数を分析する方法の例は、2011年9月20日発行の米国特許第8,024,128号明細書;2006年7月31日出願の米国特許出願公開第2007/0027636号明細書;2006年12月6日出願の米国特許出願公開第2007/0178501号明細書(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる)に開示されている。
様々な態様では、特定の仮説または診断の複合確率は80%超、85%超、90%超、92%超、94%超、96%超、98%超、99%超、または99.9%超であるか、その他の何らかの閾値よりも高い。
検出限界
一部の態様では、本発明の方法の変異(SNVまたはCNVなど)の検出限界は、10%以下、5%以下、2%以下、1%以下、0.5%以下、0.1%以下、0.05%以下、0.01%以下、または0.005%以下である。一部の態様では、本発明の方法の変異(SNVまたはCNVなど)の検出限界は15%〜0.005%であり、たとえば10%〜0.005%、10%〜0.01%、10%〜0.1%、5%〜0.005%、5%〜0.01%、5%〜0.1%、1%〜0.005%、1%〜0.01%、1%〜0.1%、0.5%〜0.005%、0.5%〜0.01%、0.5%〜0.1%、または0.1〜0.01(それぞれ、範囲の上限値と下限値を含む)。一部の態様では、検出限界は、試料(無細胞DNAまたは無細胞RNAの試料など)に含まれる、その座位を有するDNA分子またはRNA分子のうち10%以下、5%以下、2%以下、1%以下、0.5%以下、0.1%以下、0.05%以下、0.01%以下、または0.005%以下に存在する変異(SNVまたはCNVなど)が検出される(または検出可能である)ような検出限界である。たとえば、その座位を有するDNA分子またはRNA分子のうち10%以下、5%以下、2%以下、1%以下、0.5%以下、0.1%以下、0.05%以下、0.01%以下、または0.005%以下が座位に変異を有する場合でも、(たとえばその座位の野生型すなわち非変異型またはその座位にある別の変異ではなく)その変異を検出することができる。一部の態様では、検出限界は、試料(無細胞DNAまたは無細胞RNAの試料など)に含まれるDNA分子またはRNA分子のうち10%以下、5%以下、2%以下、1%以下、0.5%以下、0.1%以下、0.05%以下、0.01%以下、または0.005%以下に存在する変異(SNVまたはCNVなど)が検出される(または検出可能である)ような検出限界である。CNVが欠失である一部の態様では、試料に含まれる、欠失を含むか含まないかわからない対象領域を有するDNA分子またはRNA分子のうち10%以下、5%以下、2%以下、1%以下、0.5%以下、0.1%以下、0.05%以下、0.01%以下、または0.005%以下にしか欠失が存在しない場合でも、その欠失を検出することができる。CNVが欠失である一部の態様では、試料に含まれるDNA分子またはRNA分子のうち10%以下、5%以下、2%以下、1%以下、0.5%以下、0.1%以下、0.05%以下、0.01%以下、または0.005%以下にしか欠失が存在しない場合でも、その欠失を検出することができる。CNVが重複である一部の態様では、存在する余分な重複DNAまたはRNAが、試料に含まれる、重複があるかないかわからない対象領域を有するDNA分子またはRNA分子のうち10%以下、5%以下、2%以下、1%以下、0.5%以下、0.1%以下、0.05%以下、0.01%以下、または0.005%以下である場合でも、その重複を検出することができる。CNVが重複である一部の態様では、存在する余分な重複DNAまたはRNAが、試料に含まれるDNA分子またはRNA分子のうち10%以下、5%以下、2%以下、1%以下、0.5%以下、0.1%以下、0.05%以下、0.01%以下、または0.005%以下である場合でも、その重複を検出することができる。実施例6に検出限界の算出方法の例を示す。一部の態様では、実施例6の「LOD−zs5.0−mr5」の方法を用いる。
試料の例
本発明のいずれかの側面の態様では、試料は欠失または重複を有すると考えられる細胞(癌細胞だと考えられる細胞など)に由来する細胞内および/または細胞外の遺伝物質を含む。一部の態様では、試料は、欠失または重複を有する細胞、DNA、またはRNA(癌の細胞、DNA、またはRNAなど)を含むと考えられる任意の組織または体液を含む。DNAまたはRNAを含む任意の試料について、これらの方法の一部として用いる遺伝学的測定を行うことができる。試料の例としては、たとえば、組織、血液、血清、血漿、尿、毛髪、涙、唾液、皮膚、指の爪、糞便、胆汁、リンパ液、頸管粘液、精液、あるいは、核酸を含むその他の細胞または物質が挙げられるが、これらに限定されるものではない。試料は任意の細胞型を含んでもよく、任意の細胞型に由来するDNAまたはRNAを用いてもよい(癌を有すると考えられる任意の器官または組織の細胞、あるいはニューロンなど)。一部の態様では、試料は核内DNAおよび/またはミトコンドリアDNAを含む。一部の態様では、試料は本明細書に開示された任意の対象個体から得られる。一部の態様では、対象個体は生後の個体、懐胎中の胎児、受胎産物試料などの懐胎中でない胎児、胎芽、またはその他の任意の個体である。
試料の例としては、無細胞DNAまたは無細胞RNAを含有するものが挙げられる。一部の態様では、細胞を破砕する工程を必要とせずに分析するために無細胞DNAを利用することができる。無細胞DNAは多様な組織(たとえば血液、血漿、リンパ液、腹水、脳脊髄液などの液状組織)から入手可能である。無細胞DNAは胎児の細胞に由来するDNAで構成される場合があり、胎児の細胞に由来するDNAと母親の細胞に由来するDNAで構成される場合もある。全血から遠心分離によって細胞物質を除去して単離した血漿から無細胞DNAを単離する場合もある。無細胞DNAは、標的細胞(癌細胞など)に由来するDNAと非標的細胞(非癌性細胞など)に由来するDNAの混合物であってもよい。
一部の態様では、試料は、たとえば癌のDNA(またはRNA)と非癌性のDNA(またはRNA)の混合物などのDNA(またはRNA)の混合物を含有するないしは含有すると考えられる。一部の態様では、試料に含まれる細胞の少なくとも0.5%、1%、3%、5%、7%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、92%、94%、95%、96%、98%、99%、または100%が癌細胞である。一部の態様では、試料に含まれるDNA(無細胞DNAなど)またはRNA(無細胞RNAなど)の少なくとも0.5%、1%、3%、5%、7%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、92%、94%、95%、96%、98%、99%、または100%が癌細胞に由来する。様々な態様では、試料に含まれる癌細胞の割合は0.5%〜99%であり、たとえば、1%〜95%、5%〜95%、10%〜90%、5%〜70%、10%〜70%、20%〜90%、または20%〜70%である(それぞれ、範囲の上限値と下限値を含む)。一部の態様では、試料中の癌細胞あるいは癌細胞由来のDNAまたはRNAを濃縮する。試料中の癌細胞を濃縮する一部の態様では、濃縮した試料に含まれる細胞の少なくとも0.5%、1%、2%、3%、4%、5%、6%、7%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、92%、94%、95%、96%、98%、99%、または100%が癌細胞である。試料中の癌細胞由来のDNAまたはRNAを濃縮する一部の態様では、濃縮した試料に含まれるDNAまたはRNAの少なくとも0.5%、1%、2%、3%、4%、5%、6%、7%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、92%、94%、95%、96%、98%、99%、または100%が癌細胞に由来する。一部の態様では、細胞選別(蛍光活性化細胞選別(Fluorescent Activated Cell Sorting; FACS)など)によって癌細胞を濃縮する(Barteneva et. al., Biochim Biophys Acta., 1836(1):105-22, Aug 2013. doi: 10.1016/j.bbcan.2013.02.004. Epub 2013 Feb 24;およびIbrahim et al., Adv Biochem Eng Biotechnol. 106:19-39, 2007(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる))。
本発明のいずれかの側面の一部の態様では、試料は少なくとも部分的に胎児に由来すると考えられる任意の組織を含む。一部の態様では、試料は胎児に由来する細胞内および/または細胞外の遺伝物質、不純物である細胞内および/または細胞外の遺伝物質(胎児の母親に由来する遺伝物質など)、またはその組み合わせを含む。一部の態様では、試料は胎児に由来する細胞内遺伝物質、不純物である細胞内遺伝物質、またはその組み合わせを含む。
一部の態様では、試料は懐胎中の胎児に由来する。一部の態様では、試料は、受胎産物試料、または胎児の死亡後に任意の胎児の組織から得た試料など、懐胎中でない胎児に由来する試料である。一部の態様では、試料は母親の全血試料、母親の血液試料から単離した細胞、母親の血漿試料、母親の血清試料、羊水穿刺による試料、胎盤組織試料(たとえば絨毛、脱落膜、または胎盤膜)、頸管粘液試料、あるいは胎児に由来するその他の試料である。一部の態様では、試料に含まれる細胞の少なくとも3%、5%、7%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、92%、94%、95%、96%、98%、99%、または100%が母親の細胞である。様々な態様では、試料に含まれる母親の細胞の割合は5%〜99%であり、たとえば10%〜95%、20%〜95%、30%〜90%、30%〜70%、40%〜90%、40%〜70%、50%〜90%、または50%〜80%である(それぞれ、範囲の上限値と下限値を含む)。
一部の態様では、試料中の胎児の細胞を濃縮する。試料中の胎児の細胞を濃縮する一部の態様では、濃縮した試料に含まれる細胞の少なくとも0.5%、1%、2%、3%、4%、5%、6%、7%、またはそれ以上が胎児の細胞である。一部の態様では、試料に含まれる胎児の細胞の割合は0.5%〜100%であり、たとえば1%〜99%、5%〜95%、10%〜95%、10%〜95%、20%〜90%、または30%〜70%である(それぞれ、範囲の上限値と下限値を含む)。一部の態様では、試料中の胎児のDNAを濃縮する。試料中の胎児のDNAを濃縮する一部の態様では、濃縮した試料に含まれるDNAの少なくとも0.5%、1%、2%、3%、4%、5%、6%、7%、またはそれ以上が胎児のDNAである。一部の態様では、試料に含まれる胎児のDNAの割合は0.5%〜100%であり、たとえば1%〜99%、5%〜95%、10%〜95%、10%〜95%、20%〜90%、または30%〜70%である(それぞれ、範囲の上限値と下限値を含む)。
一部の態様では、試料は単一細胞を含むか、単一細胞に由来するDNAおよび/またはRNAを含む。一部の態様では、複数の個体細胞(たとえば同一の対象または異なる対象から得た少なくとも5個、10個、20個、30個、40個、または50個の細胞)を並行して分析する。一部の態様では、同一の個体から採取した複数の試料から得た細胞を組み合わせる。それによって、試料を個々に分析するのに比べて作業量が減る。複数の試料を組み合わせることにより、複数の組織の癌検査を同時に行うこともできる(これを利用して、より徹底的な癌検診を提供したり、癌が他の組織に転移した可能性があるかどうかを決定したりすることができる)。
一部の態様では、試料は単一細胞または少数の細胞を含む(たとえば2個、3個、5個、6個、7個、8個、9個、または10個)。一部の態様では、試料は1個〜100個、100個〜500個、または500個〜1,000個の細胞を含む(それぞれ、範囲の上限値と下限値を含む)。一部の態様では、試料は1ピコグラム〜10ピコグラム、10ピコグラム〜100ピコグラム、100ピコグラム〜1ナノグラム、1ナノグラム〜10ナノグラム、10ナノグラム〜100ナノグラム、または100ナノグラム〜1マイクログラムのRNAおよび/またはDNAを含む(それぞれ、範囲の上限値と下限値を含む)。
一部の態様では、試料をパラフィンフィルムに包埋する。一部の態様では、試料をホルムアルデヒドなどの防腐剤と共に保存し、必要に応じてパラフィンに包んでもよいが、DNAの架橋を起こし、PCRに利用できるDNAが減る場合がある。一部の態様では、試料はホルムアルデヒド固定パラフィン包埋(formaldehyde fixed-paraffin embedded; FFPE)試料である。一部の態様では、試料は新たに採取した試料(たとえば分析の1日〜2日前に採取した試料)である。一部の態様では、試料を分析まで凍結しておいてもよい。一部の態様では、試料は過去に採取した試料である。
上記の試料を本発明の任意の方法に用いることができる。
試料調製方法の例
一部の態様では、前記方法は、DNAおよび/またはRNAの単離または精製を含む。この目的は当技術分野で公知の複数の標準的な方法によって達成される。一部の態様では、試料を遠心分離して様々な層を分離してもよい。一部の態様では、DNAまたはRNAを濾過によって単離してもよい。一部の態様では、DNAまたはRNAの調製は、増幅、分離、クロマトグラフィーによる精製、液液分離、単離、選択的濃縮、選択的増幅、標的化増幅、あるいは当技術分野で公知ないしは本明細書に記載の複数のその他の技術のいずれかを含んでもよい。DNAの単離に関する一部の態様では、RNA分解酵素を用いてRNAを分解する。RNAの単離に関する一部の態様では、DNA分解酵素(Invitrogen(Carlsbad, CA, USA)のDNAse Iなど)を用いてDNAを分解する。一部の態様では、RNeasy Mini Kit(Qiagen)を用いて、製造者のプロトコルに従いRNAを単離する。一部の態様では、低分子RNAをmirVana(商標)PARIS(商標) Kit(Ambion(Austin, TX, USA))を用いて、製造者のプロトコルに従い単離する(Gu et al., J. Neurochem. 122:641-649, 2012;この文献の全内容は参照によって本明細書に組み込まれる))。必要に応じてRNAの濃度および純度をNanoVue(商標)(GE Healthcare(Piscataway, NJ, USA)で決定してもよく、必要に応じてRNAの完全性を2100 Bioanalyzer(Agilent Technologies(Santa Clara, CA, USA))で測定してもよい(Gu et al., J. Neurochem. 122:641-649, 2012;この文献の全内容は参照によって本明細書に組み込まれる)。一部の態様では、TRIzol(商標)またはRNAlater(登録商標)(Ambion)を用いて保存中のRNAを安定化する。
一部の態様では、汎用タグを付けたアダプターを付加してライブラリを作製する。ライゲーションの前に試料DNAを平滑末端化してもよく、次いで1個のアデノシン塩基を3’末端に付加する。ライゲーションの前にDNAを制限酵素またはその他の何らかの切断方法によって切断してもよい。ライゲーションの際、試料断片の3’末端のアデノシンと、アダプターの相補的な3’末端のチロシンの突出により、ライゲーション効率を高めることができる。一部の態様では、Agilent SureSelectのライゲーションキットを用いてアダプターのライゲーションを行う。一部の態様では、汎用プライマーを用いてライブラリを増幅する。ある態様では、サイズ分離によって、あるいはAGENCOURT(登録商標)AMPURE(登録商標)ビーズなどの製品またはその他の類似の方法によって、増幅したライブラリを分画する。一部の態様では、PCR増幅によって標的座位を増幅する。一部の態様では、増幅したDNAを配列決定する(たとえばILLUMINA(登録商標)のGAIIXシーケンサまたはHiSeq(商標)シーケンサを用いる配列決定など)。一部の態様では、配列決定エラーを低減するため、増幅後のDNAの両末端から配列決定を行う。増幅後のDNAの一方の末端から配列決定を行ったときに特定の塩基に配列エラーがある場合、(増幅後のDNAの配列決定を同じ末端から複数回行う場合に比べて)増幅後のDNAのもう一方の末端から配列決定を行った場合に相補性の塩基に配列エラーが起こる可能性がより低くなる。
一部の態様では、全ゲノム増幅(WGA)によって核酸試料を増幅する。WGAに利用可能な方法は複数ある:ライゲーションを介したPCR(ligation-mediated PCR(LM-PCR))、縮重オリゴヌクレオチドプライマーPCR(degenerate oligonucleotide primer PCR(DOP-PCR))、多重置換増幅(multiple displacement amplification(MDA))である。LM−PCRでは、アダプターと呼ばれる短いDNA配列をライゲートすることにより、DNAの末端を平滑化する。これらのアダプターは、汎用的な増幅配列を含み、これを用いてPCRによりDNAを増幅する。DOP−PCRでは、同じく汎用的な増幅配列を含むランダムプライマーをアニーリングと初回のPCRで用いる。次いで第2回のPCRにより、汎用プライマー配列をさらに用いて配列を増幅する。MDAではphi−29ポリメラーゼを用いる。phi−29ポリメラーゼはDNAを複製し、単一細胞の分析に用いられてきた、加工性が高く非特異的な酵素である。一部の態様では、WGAを行わない。
一部の態様では、選択的な増幅または濃縮により、標的座位を増幅または濃縮する。一部の態様では、増幅および/または選択的濃縮技術は、ライゲーションを介したPCRなどのPCR、ハイブリダイゼーションや分子反転プローブまたはその他の環状化プローブによる断片の捕捉を含んでもよい。一部の態様では、リアルタイム定量PCR(real-time quantitative PCR = RT-qPCR)、デジタルPCR、またはエマルジョンPCR、単一アレルの塩基伸長反応(single allele base extension reaction)の後に質量分析を行う(Hung et al., J Clin Pathol 62:308-313, 2009;この文献の全内容は参照によって本明細書に組み込まれる)。一部の態様では、DNAの選択的濃縮にハイブリッド捕捉プローブとのハイブリダイゼーションによる捕捉を用いる。一部の態様では、増幅または選択的濃縮のための方法は、標的配列と正しくハイブリダイズした際に少数のヌクレオチドによってヌクレオチドプローブの3’末端または5’末端が多型アレルの多型部位から隔離されるようなプローブを使用することを含んでもよい。この隔離により、一方のアレルの優先的増幅(アレルの偏りという)が減少する。これは、正しくハイブリダイズしたプローブの3’末端または5’末端がアレルの多型部位と直接隣接するか非常に近くなるようなプローブを使用することを含む方法に対する改善点である。一態様では、ハイブリダイズする領域が多型部位を含む可能性があるか、含むことが確実であるプローブを排除する。ハイブリダイゼーションの部位に多型部位があることにより、一部のアレルで不均等なハイブリダイゼーションが起こるか、全体のハイブリダイゼーションが阻害され、結果としてあるアレルが優先的に増幅される可能性がある。これらの態様は、試料が単一の個体から得た純粋なゲノム試料であっても個体の混合物であっても、試料の各多型座位での元のアレル頻度をより良好に保つ点で、標的化増幅および/または選択的濃縮を含むその他の方法に対する改善である。
一部の態様では、PCR(ミニPCRという)を用いて非常に短い増幅産物を生成する(2012年11月21日出願の米国特許出願第13/683,604号(米国特許出願公開第2013/0123120号)明細書、2011年11月18日出願の米国特許出願第13/300,235号(米国特許出願公開第2012/0270212号)明細書、2014年5月16日出願の米国特許出願第61/994,791号明細書(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる))。無細胞DNA(母親の血清中の胎児の無細胞DNA、壊死またはアポトーシスによって放出された癌の無細胞DNAなど)は高度に断片化される。胎児の無細胞DNAの場合、断片のサイズは概ねガウス関数的に分布する(平均160bp、標準偏差15bp、最小サイズ約100bp、最大サイズ約220bp)。1つの特定の標的座位の多型部位は、その座位に由来する多様な断片の開始位置から終位置までの任意の位置を占め得る。無細胞DNA断片は短いため、両方のプライマー部位が存在する尤度、すなわち順方向プライマー部位と逆方向プライマー部位両方を含む長さLの断片の尤度は、増幅産物の長さと断片の長さの比である。理想的な条件では、増幅産物が45bp、50bp、55bp、60bp、65bp、または70bpである試験法は、それぞれ、利用可能な鋳型断片分子の72%、69%、66%、63%、59%、56%からの増幅に成功する。癌を有すると考えらえる個体から採取した試料から得た無細胞DNAの場合に最も好ましいある態様では、無細胞DNAは、最大の増幅産物長が85bp、80bp、75bp、または70bp(ある好ましい態様では75bp)であり、かつ、融解温度が50℃〜65℃(ある好ましい態様では54℃〜60.5℃)であるプライマーを用いて増幅される。増幅産物長は順方向プライミング部位の5’末端と逆方向プライミング部位の5’末端の間の距離である。当業者が一般的に用いるものよりも増幅産物長が短いことにより、短い配列リードで済むため、所望の多型座位の測定をより効率的にすることができる。一態様では、増幅産物の実質的な画分は100bp未満、90bp未満、80bp未満、70bp未満、65bp未満、60bp未満、55bp未満、50bp未満、または45bp未満である。
一部の態様では、直接多重PCR、逐次PCR、入れ子PCR、二重入れ子PCR(doubly nested PCR)、片側入れ子・片側半入れ子PCR(one-and-a-half sided nested PCR)、完全入れ子PCR(fully nested PCR)、片側完全入れ子PCR(one sided fully nested PCR)、片側入れ子PCR(one-sided nested PCR)、半入れ子PCR(hemi-nested PCR)、半入れ子PCR、三重半入れ子PCR(triply hemi-nested PCR)、準入れ子PCR(semi-nested PCR)、片側準入れ子PCR(one sided semi-nested PCR)、逆方向準入れ子PCR(reverse semi-nested PCR)法、または片側PCRを用いて増幅を行う。これらのPCR法は以下の文献に記載されている:2012年11月21日出願の米国特許出願第13/683,604号(米国特許出願公開第2013/0123120号)明細書;2011年11月18日出願の米国特許出願第13/300,235号(米国特許出願公開第2012/0270212号)明細書;2014年5月16日出願の米国特許出願第61/994,791号明細書(これらの文献の全内容は参照によって組み込まれる)。必要に応じて、これらの方法のいずれかをミニPCRに用いることができる。
必要に応じ、時間の観点から、長さが200ヌクレオチド超、300ヌクレオチド超、400ヌクレオチド超、500ヌクレオチド超、または1,000ヌクレオチド超の断片からの増幅を減らすようにPCR増幅の伸長工程を制限してもよい。このことによって、断片化されたDNAまたはより短いDNA(胎児のDNA、あるいはアポトーシスまたは壊死を経た癌細胞から得たDNAなど)を濃縮でき、試験性能を改善することができる。
一部の態様では多重PCRを用いる。一部の態様では、核酸試料中の標的座位を増幅する方法は、(i)核酸試料を、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる標的座位と同時にハイブリダイズするプライマーのライブラリと接触させて反応混合物を生成することと;(ii)反応混合物をプライマー伸長反応条件(たとえばPCR条件)に供して標的増幅産物を含む増幅産物を生成することを含む。一部の態様では、標的座位の少なくとも50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、または99.5%を増幅する。様々な態様では、増幅産物の60%未満、50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.5%未満、0.25%未満、0.1%未満、または0.05%未満がプライマー二量体である。一部の態様では、プライマーは溶液状である(たとえば固相でなく液相に溶解している)。一部の態様では、プライマーは溶液状であり、固体担体に固定されない。一部の態様では、プライマーはマイクロアレイの一部ではない。一部の態様では、プライマーは分子反転プローブ(MIP)を含まない。
一部の態様では、2個以上(たとえば3個〜4個)の標的増幅産物(たとえば本明細書に開示したミニPCR法で得た増幅産物)を共にライゲートし、次いでライゲーション後の産物を配列決定する。複数の増幅産物を組み合わせて1つのライゲーション産物を得ることにより、後の配列決定工程の効率が向上する。一部の態様では、標的増幅産物の長さはライゲーション前で150塩基対未満、100塩基対未満、90塩基対未満、75塩基対未満、または50塩基対未満である。選択的濃縮および/または増幅は、各個体分子に異なるタグ、分子バーコード、増幅用タグ、および/または配列決定用タグをつけることを含んでもよい。一部の態様では、増幅産物を配列決定(たとえば高処理配列決定による)、またはSNPアレイ、ILLUMINA(登録商標)INFINIUM(登録商標)アレイ、AFFIMETRIX GeneChip(登録商標)などのアレイにハイブリダイズすることによって分析する。一部の態様では、Genia社が開発したナノポア配列決定技術(たとえばワールドワイドウェブのgeniachip.com/technologyを参照;この全内容は参照によって本明細書に組み込まれる)などのナノポア配列決定を用いる。一部の態様では二重鎖配列決定を用いる(Schmitt et al., "Detection of ultra-rare mutations by next-generation sequencing,” Proc Natl Acad Sci U S A. 109(36): 14508-14513, 2012;この文献の全内容は参照によって本明細書に組み込まれる)。この方法により、DNA二重鎖の二本鎖の各々を個々にタグを付けて配列決定することによるエラーが大きく低減される。二本鎖は相補的であるため、実変異は両方の鎖の同じ位置に見られる。これに対し、PCRまたは配列決定のエラーの場合、一方の鎖のみに変異があることになるため、技術的なエラーとして無視することができる。一部の態様では、方法は、ランダムであるが相補的な二本鎖ヌクレオチド配列(Duplex Tagという)で二本鎖DNAの両方の鎖を標識付けすることを伴う。まずランダム化された一本鎖ヌクレオチド配列を1つのアダプター鎖に導入し、次いで反対の鎖をDNAポリメラーゼで伸長して相補的な二本鎖タグを生成することによって、二本鎖タグ配列を標準的な配列決定アダプターに組み込む。タグを付けたアダプターを、切断されたDNAにライゲートした後、個々に標識を付けた鎖をアダプターの両端の非対称プライマー部位からPCR増幅し、ペアエンド配列決定を行う。一部の態様では、試料(DNA試料またはRNA試料など)を異なるウェル(たとえばWaferGen SmartChip(商標))などの複数の画分に分ける。試料を異なる画分(たとえば少なくとも5個、10個、20個、50個、75個、100個、150個、200個、または300個の画分)に分けることにより、変異を有する分子の割合が、一部のウェルでは試料全体に比べて高くなるため、分析の感度を向上することができる。一部の態様では、各画分は500個未満、400個未満、200個未満、100個未満、50個未満、20個未満、10個未満、5個未満、2個未満、または1個未満のDNA分子またはRNA分子を有する。一部の態様では、各画分に含まれる分子を個別に配列決定する。一部の態様では、同じバーコード(ランダムな配列またはヒト以外の配列など)を同じ画分のすべての分子に付加し(たとえばそのバーコードを含むプライマーを用いた増幅、あるいはバーコードをライゲートすることによって)、異なる画分の分子には異なるバーコードを付加する。バーコードを付けた分子をプールしておき、まとめて配列決定することができる。一部の態様では、分子を入れ子PCRなどによって増幅してからプールし、配列決定する。一部の態様では、1個の順方向プライマーと2個の逆方向プライマー、または2個の順方向プライマーと1個の逆方向プライマーを用いる。
一部の態様では、試料(無細胞DNAまたは無細胞RNAの試料など)に含まれるDNA分子またはRNA分子の10%未満、5%未満、2%未満、1%未満、0.5%未満、0.1%未満、0.05%未満、0.01%未満、または0.005%未満に存在する変異(SNVまたはCNVなど)が検出される(ないしは検出可能である)。一部の態様では、試料(たとえば血液試料から得た無細胞DNAまたは無細胞RNAの試料など)に含まれる1,000個未満、500個未満、100個未満、50個未満、20個未満、10個未満、5個未満、4個未満、3個未満、または2個未満の元のDNA分子またはRNA分子(増幅前)に存在する変異(SNVまたはCNV)が検出される(ないしは検出可能である)。一部の態様では、試料(たとえば血液試料から得た無細胞DNAまたは無細胞RNAなど)に含まれる元のDNA分子またはRNA分子(増幅前)1個のみに存在する変異(SNVまたはCNVなど)が検出される(ないしは検出可能である)。
たとえば、変異(一塩基多様体(SNV)など)の検出限界が0.1%である場合、0.01%に存在する変異は、画分を100個のウェルなどの複数の画分に分けることによって検出可能である。ほとんどのウェルは変異のコピーを有していない。変異を有するわずかなウェルでは、リードのうちのはるかに高い割合で変異が存在する。一例では、標的座位のDNAの初期のコピーは20,000個あり、これらのコピーのうち2個が対象のSNVを含む。試料を100個のウェルに分けた場合、98個のウェルがSNVを有し、2個のウェルが0.5%でSNVを有する。各ウェル内のDNAにバーコードを付け、増幅し、他のウェルのDNAと共にプールし、配列決定することができる。SNVを有していないウェルを用いて、背景の増幅/配列決定エラーの割合を測定して異常値ウェルからのシグナルがノイズの背景レベルを超えているかどうか決定することができる。
一部の態様では、1つ以上の対象染色体(たとえば13番染色体、18番染色体、21番染色体、X染色体、Y染色体、またはそれらの任意の組み合わせ)に対するプローブを有するアレイ(特にマイクロアレイ)などのアレイを用いて増幅産物を検出する。当然のことながら、たとえば、市販のSNP検出マイクロアレイ(たとえば、Illumina社(San Diego, CA)のGoldenGate(登録商標)、DASL(登録商標)、Infinium(登録商標)、またはCytoSNP-12の遺伝型決定試験法、あるいはAffymetrix社のSNP検出マイクロアレイ製品(OncoScan(商標)マイクロアレイなど)が利用可能である。一部の態様では、単一細胞からのアレイデータ分析の精度を向上するため、胎芽または胎児の実親のうち一方または両方に関する相決定済み遺伝データを用いる。
配列決定を含む一部の態様では、リード深度は所与の座位にマッピングされる配列決定リードの数である。リード深度を総リード数に対して正規化してもよい。試料のリード深度に関して一部の態様では、リード深度は標的座位に対する平均リード深度である。座位のリード深度に関して一部の態様では、リード深度はシーケンサが測定した、その座位にマッピングされるリード数である。一般的に、座位のリード深度が深いほど、その座位でのアレル比は元のDNA試料のアレル比に近くなる傾向にある。リード深度は多様な異なる形で表現可能であり、百分率または比が挙げられるがこれらに限定するものではない。このように、たとえば、Illumina(登録商標)HiSeqなどの超並列型DNAシーケンサ(highly parallel DNA sequencer)(たとえば100万クローンの配列を作製する)では、1つの座位の配列決定を3,000回行うと、その座位のリード深度は3,000リードになる。その座位でのリードの割合は、3,000を総リードの100万で割り、すなわち総リードの0.3%である。
一部の態様ではアレルデータを得る。ここで、アレルデータは、多型座位の特定のアレルのコピー数を示す定量的測定値を含む。一部の態様では、アレルデータは、多型座位で観測されるアレルの各々のコピー数を示す定量的測定値を含む。一般的に、対象多型座位の、可能性のあるすべてのアレルについて定量的測定値を得る。たとえば、先の段落に記載したSNP座位またはSNV座位のアレルの決定方法(たとえば、マイクロアレイ、定量PCR、DNA配列決定(高処理DNA配列決定など)のいずれかを用いて、多型座位の特定のアレルのコピー数の定量的測定値を作成することができる。この定量的測定値を、本明細書ではアレル頻度データまたは測定された遺伝アレルデータという。アレルデータを用いる方法を定量的アレル方法ということもある。このような方法は、アレル同一性を考慮せずに非多型座位の定量的データまたは多型座位の定量的データのみを用いる定量的方法と対照的である。高処理配列決定によってアレルデータを測定する場合、アレルデータは一般的に、対象座位にマッピングされる各アレルのリード数を含む。
一部の態様では、非アレルデータを得る。ここで、非アレルデータは特定の座位のコピー数を示す定量的測定値を含む。座位は多型であっても非多型であってもよい。座位が非多型である一部の態様では、非アレルデータはその座位に存在し得る個々のアレルの相対量または絶対量に関する情報を含まない。非アレルデータのみを用いる(すなわち、各断片のアレル同一性を考慮せずに非多型のアレルの定量データまたは多型座位の定量データを用いる)方法を定量的方法と呼ぶ。一般的に、対象多型座位の、可能性のあるすべてのアレルについて定量的測定値を得、全体として1つの値をその座位のすべてのアレルに関する測定量と関連づける。ある多型座位に関する非アレルデータを、その座位の各アレルに関する定量的アレルデータを合計することによって得てもよい。高処理配列決定によってアレルデータを測定する場合、非アレルデータは一般的に、対象座位にマッピングされるリード数を含む。配列決定測定値は、アレルの同一性にかかわらず、その座位に存在するアレルの各々の相対数および/または絶対数を示す可能性があり、非アレルデータは、その座位にマッピングされるリードの合計を含む。一部の態様では、配列決定測定値の同一の集合を用いてアレルデータと非アレルデータの両方を作成できる。一部の態様では、対象染色体でのコピー数を決定する方法の一部としてアレルデータを用い、作成された非アレルデータを、対象染色体でのコピー数を決定する別の方法の一部として用いることができる。一部の態様では、この2つの方法は統計的に直交であり、これらを組み合わせることにより、対象染色体でのコピー数をより高精度に決定できる。
一部の態様では、遺伝データを得ることは、(i)実験技術によってDNA配列情報を取得すること(たとえば自動高処理DNAシーケンサの使用によって)または(ii)以前に実験技術によって得た情報を取得することを含み、ここで、情報は、たとえばコンピュータを用いてインターネットを通じて、あるいは配列決定装置からの電子送信によって、電子送信される。
試料調製、増幅、および定量の方法のさらなる例が2012年11月21日出願の米国特許出願第13/683,604号(米国特許出願公開第2013/0123120号)明細書、および2014年5月16日出願の米国特許出願第61/994,791号明細書(これらの文献の全内容は参照によって本明細書に組み込まれる)に記載されている。本明細書に開示した任意の試料の分析にこれらの方法を用いることができる。
無細胞DNAの定量方法の例
必要に応じ、無細胞DNAまたは無細胞RNAの量または濃度を標準の方法で測定することができる。一部の態様では、無細胞ミトコンドリアDNAの量または濃度を決定する。一部の態様では、核内DNAに由来する無細胞DNA(無細胞核内DNA)の量または濃度を決定する。一部の態様では、無細胞ミトコンドリアDNAと無細胞nDNAの量または濃度を同時に決定する。
一部の態様では、定量PCRを用いて無細胞核内DNAおよび/または無細胞ミトコンドリアDNAを測定する(Kohler et al. “Levels of plasma circulating cell free nuclear and mitochondrial DNA as potential biomarkers for breast tumors.” Mol Cancer 8:105, 2009, 8:doi:10.1186/1476-4598-8-105;この文献の全内容は参照によって本明細書に組み込まれる)。たとえば、無細胞核内DNAの1つ以上の座位(たとえばグリセルアルデヒド−3−リン酸デヒドロゲナーゼ(GAPDH)など)と無細胞ミトコンドリアDNAの1つ以上の座位(ATPアーゼ8(MTATP 8))を多重定量PCRで測定することができる。一部の態様では、蛍光標識PCRを用いて無細胞核内DNAおよび/または無細胞ミトコンドリアDNAを測定する(Schwarzenbach et al., “Evaluation of cell-free tumour DNA and RNA in patients with breast cancer and benign breast disease.” Mol Biosys 7:2848-2854, 2011;この文献の全内容は参照によって組み込まれる)。必要に応じ、データの正規性分布をシャピロ−ウィルク検定などの標準の方法で決定することができる。必要に応じ、マン−ホイットニーのU検定などの標準の方法で無細胞核内DNAおよび無細胞ミトコンドリアDNAの濃度を比較することができる。一部の態様では、マン−ホイットニーのU検定またはクラスカル−ワリス検定などの標準の方法で無細胞核内DNAおよび/または無細胞ミトコンドリアDNAの濃度を他の確立された予後因子と比較する。
RNAの増幅、定量、分析方法の例
以下の方法例のいずれかを用いて、無細胞RNA、細胞内RNA、細胞質RNA、コーディング細胞質RNA、非コーディング細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNAなどのRNAを増幅し、必要に応じて定量してもよい。一部の態様では、miRNAはワールドワイドウェブのmirbase.orgで利用できるmiRBaseデータベース(その全内容は参照によって本明細書に組み込まれる)に掲載されている任意のmiRNA分子である。miRNA分子の例としては、miR−509、miR−21、miR−146aが挙げられる。
一部の態様では、逆転写酵素を用いる多重ライゲーション依存性プローブ増幅(reverse-transcriptase multiplex ligation-dependent probe amplification = RT-MLPA)を用いてRNAを増幅する。一部の態様では、ハイブリダイズするプローブの各セットはSNPにわたる2つの短い合成オリゴヌクレオチドと1つの長いオリゴヌクレオチドで構成される(Li et al., Arch Gynecol Obstet. “Development of noninvasive prenatal diagnosis of trisomy 21 by RT-MLPA with a new set of SNP markers,” July 5, 2013, DOI 10.1007/s00404-013-2926-5; Schouten et al. “Relative quantification of 40 nucleic acid sequences by multiplex ligation-dependent probe amplification.” Nucleic Acids Res 30:e57, 2002; Deng et al. (2011) “Non-invasive prenatal diagnosis of trisomy 21 by reverse transcriptase multiplex ligation-dependent probe amplification,” Clin, Chem. Lab Med. 49:641-646, 2011(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる))。
一部の態様では、逆転写酵素PCRによってRNAを増幅する。一部の態様では、先に述べたように、SYBR GREEN Iを用いた一段階リアルタイム逆転写酵素PCRのようなリアルタイム逆転写酵素PCRによってRNAを増幅する(Li et al., Arch Gynecol Obstet. “Development of noninvasive prenatal diagnosis of trisomy 21 by RT-MLPA with a new set of SNP markers,” July 5, 2013, DOI 10.1007/s00404-013-2926-5; Lo et al., “Plasma placental RNA allelic ratio permits noninvasive prenatal chromosomal aneuploidy detection,” Nat Med 13:218-223, 2007; Tsui et al., Systematic micro-array based identification of placental mRNA in maternal plasma: towards non-invasive prenatal gene expression profiling. J Med Genet 41:461-467, 2004; Gu et al., J. Neurochem. 122:641-649, 2012(これらの文献のそれぞれの全内容は参照によって本明細書に組み込まれる))。
一部の態様では、マイクロアレイを用いてRNAを検出する。たとえば、Agilent TechnologiesのヒトmiRNAマイクロアレイを製造者のプロトコルに従って使用することができる。簡潔に述べると、単離したRNAを脱リン酸化し、pCp−Cy3とライゲートする。Sanger miRBase release 14.0に基づき、標識を付けたRNAを精製し、ヒトの成熟miRNAに対するプローブを含むmiRNAアレイにハイブリダイズさせる。このアレイを洗浄し、マイクロアレイスキャナ(Agilent TechnologiesのG2565BA)を用いてスキャンする。各ハイブリダイゼーションシグナルの強度をAgilent extraction software v9.5.3で評価する。標識付け、ハイブリダイゼーション、およびスキャニングは、Agilent miRNA Microarray Systemのプロトコルに従って実行可能である(Gu et al., J. Neurochem. 122:641-649, 2012;この文献の全内容は参照によって本明細書に組み込まれる)。
一部の態様では、TaqMan(登録商標)試験法を用いてRNAを検出する。試験法の一例は157種類のTaqMan(登録商標)MicroRNA Assayを含むTaqMan(登録商標) Array Human MicroRNA Panel v1.0 (Early Access)(Applied Biosystems(商標))であり、各逆転写プライマーとPCR用プライマーとTaqMan(登録商標)プローブとを含む。(Chim et al., “Detection and characterization of placental microRNAs in maternal plasma,” Clin Chem. 54(3):482-90, 2008(この文献の全内容は参照によって組み込まれる))。
必要に応じ、1つ以上のmRNAのmRNAスプライシングパターンを標準の方法で決定できる(Fackenthal1 and Godley, Disease Models & Mechanisms 1: 37-42, 2008, doi:10.1242/dmm.000331(この文献の全内容は参照によって組み込まれる)。たとえば、高密度マイクロアレイおよび/または高処理DNA配列決定を用いてmRNAスプライス多様体を検出できる。
一部の態様では、全トランスクリプトームショットガン配列決定またはアレイを用いてトランスクリプトームを測定する。
増幅方法の例
同一反応容量(たとえば、すべての標的座位を同時に増幅する試料多重PCR反応の一部)内での近接または隣接する標的座位の増幅による干渉を最小限にするか防止する改良型PCR増幅法も開発されている。これらの方法を用いて近接または隣接する標的座位を同時に増幅することができ、干渉を避けるために近接する標的座位を個別に増幅できるように別の反応容量に分離する必要がある場合に比べて時間とコストを低減できる。
一部の態様では、5’→3’エキソヌクレアーゼ活性および/または鎖置換活性の低いポリメラーゼ(たとえばDNAポリメラーゼ、RNAポリメラーゼ、または逆転写酵素)を用いて標的座位の増幅を行う。一部の態様では、5’→3’エキソヌクレアーゼ活性のレベルを低くすることにより、近接するプライマーの分解(たとえばプライマー伸長時に伸張されなかったプライマーや1個以上のヌクレオチドが付加されたプライマーが生じること)を低減または防止する。一部の態様では、鎖置換活性を低くすることにより、近接するプライマーの置換(たとえばプライマー伸長時に伸張されなかったプライマーや1個以上のヌクレオチドが付加されたプライマーが生じること)を低減または防止する。一部の態様では、互いに隣接する標的座位(たとえば標的座位間に塩基が存在しない場合)または近接する標的座位(たとえば座位が互いに50塩基以内、40塩基以内、30塩基以内、20塩基以内、15塩基以内、10塩基以内、9塩基以内、8塩基以内、7塩基以内、6塩基以内、5塩基以内、4塩基以内、3塩基以内、2塩基以内、または1塩基以内の位置に存在する場合)を増幅する。一部の態様では、1つの座位の3’末端は次の下流側座位の5’末端から50塩基以内、40塩基以内、30塩基以内、20塩基以内、15塩基以内、10塩基以内、9塩基以内、8塩基以内、7塩基以内、6塩基以内、5塩基以内、4塩基以内、3塩基以内、2塩基以内、または1塩基以内の位置に存在する。
一部の態様では、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる標的座位を同時増幅などによって1つの反応容量で増幅する。一部の態様では、増幅産物の少なくとも50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、または99.5%が標的増幅産物である。様々な態様では、標的増幅産物である増幅産物の量は50%〜99.5%であり、たとえば60%〜99%、70%〜98%、80%〜98%、90%〜99.5%、または95%〜99.5%(それぞれ、範囲の上限値と下限値を含む)。一部の態様では、標的座位の少なくとも50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、または99.5%を同時増幅などによって1つの反応容量で増幅する(たとえば、増幅前の量に比べて少なくとも5倍、10倍、20倍、30倍、50倍、または100倍に増幅する)。様々な態様では、増幅される標的座位の量は50%〜99.5%であり、たとえば、60%〜99%、70%〜98%、80%〜99%、90%〜99.5%、95%〜99.9%、または98%〜99.99%(それぞれ、範囲の上限値と下限値を含む)である(たとえば増幅前に比べて少なくとも5倍、10倍、20倍、30倍、50倍、または100倍に増幅される)。一部の態様では、非標的増幅産物の生成をさらに少なくすることができる(たとえば、第一のプライマー対のうち順方向プライマーと第二のプライマー対のうち逆方向プライマーから形成される増幅産物がより少ない)。このような望ましくない非標的増幅産物は、従来の増幅方法によって、たとえば第一のプライマー対のうち逆方向プライマーおよび/または第二のプライマー対のうち順方向プライマーが分解かつ/または置換された場合に生成される可能性がある。
一部の態様では、これらの方法により、ポリメラーゼの5’→3’エキソヌクレアーゼ活性および/または鎖置換活性が低いため、伸長されるプライマーに結合したポリメラーゼが近接するプライマー(次の下流プライマーなど)を分解かつ/または置換する可能性がより低くなり、使われる伸長時間がより長くなる。様々な態様では、伸長されるプライマーに付加されるヌクレオチドの数が、同一鎖上にあるプライマー結合部位の3’末端と次の下流プライマー結合部位の5’末端との間に存在するヌクレオチドの数の80%以上、90%以上、95%以上、100%以上、110%以上、120%以上、130%以上、140%以上、150%以上、175%以上、または200%以上になるようなポリメラーゼ伸長率が得られる反応条件(伸長時間・温度など)を用いる。
一部の態様では、DNAポリメラーゼを用い、DNAを鋳型としてDNA増幅産物を生成する。一部の態様では、RNAポリメラーゼを用いてDNAを鋳型としてRNA増幅産物を生成する。一部の態様では、逆転写酵素を用いてRNAを鋳型としてcDNA増幅産物を生成する。
一部の態様では、ポリメラーゼの5’→3’エキソヌクレアーゼ活性のレベルが低いことは、同じ条件下、同じ量のテルムス・アクウァーティクス(テルムス属)ポリメラーゼ(一般に使用される好熱性細菌由来のDNAポリメラーゼである「Taq」ポリメラーゼ(PDB 1BGX, EC 2.7.7.7))(Murali et al., “Crystal structure of Taq DNA polymerase in complex with an inhibitory Fab: the Fab is directed against an intermediate in the helix-coil dynamics of the enzyme,” Proc. Natl. Acad. Sci. USA 95:12562-12567, 1998(この文献の全内容は参照によって本明細書に組み込まれる))の活性の80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、1%未満、または0.1%未満であるということである。一部の態様では、ポリメラーゼの鎖置換活性が低いということは、同じ条件下、同じ量のTaqポリメラーゼの活性の80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、1%未満、または0.1%未満であるということである。
一部の態様では、ポリメラーゼはPHUSION(登録商標)DNA Polymeraseであり、たとえばPHUSION(登録商標)High Fidelity DNA Polymerase(M0530S, New England BioLabs, Inc.)またはPHUSION(登録商標)Hot Start Flex DNA Polymerase(M0535S, New England BioLabs, Inc.;Frey and Suppman BioChemica. 2:34-35, 1995; Chester and Marshak Analytical Biochemistry. 209:284-290, 1993(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる))である。PHUSION(登録商標)DNA Polymeraseは、処理能力を高めるドメインを融合した、ピロコックス属に類似の酵素である。PHUSION(登録商標)DNA Polymeraseは5’→3’ポリメラーゼ活性と3’→5’エキソヌクレアーゼ活性を有し、末端が平滑な産物を生成する。PHUSION(登録商標)DNA Polymeraseには、5’→3’エキソヌクレアーゼ活性および鎖置換活性はない。
一部の態様では、ポリメラーゼはQ5(登録商標)DNA Polymeraseであり、たとえばQ5(登録商標)High-Fidelity DNA Polymerase(M0491S, New England BioLabs, Inc.)またはQ5(登録商標)Hot Start High-Fidelity DNA Polymerase(M0493S, New England BioLabs, Inc.)である。Q5(登録商標)High-Fidelity DNA Polymeraseは処理能力を高めるSso7dドメインを融合した、3’→5’エキソヌクレアーゼ活性を有し正確性が高い耐熱性DNAポリメラーゼである。Q5(登録商標)High-Fidelity DNA Polymeraseには5’→3’エキソヌクレアーゼ活性と鎖置換活性はない。
一部の態様では、ポリメラーゼはT4 DNA Polymerase(M0203S, New England BioLabs, Inc.;Tabor and Struh. (1989). “DNA-Dependent DNA Polymerases,”(Ausebel et al. (Ed.), Current Protocols in Molecular Biology. 3.5.10-3.5.12. New York: John Wiley & Sons, Inc., 1989に記載);およびSambrook et al. Molecular Cloning: A Laboratory Manual. (2nd ed.), 5.44-5.47. Cold Spring Harbor: Cold Spring Harbor Laboratory Press, 1989(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる))。T4 DNA Polymeraseは5’→3’方向のDNA合成を触媒し、鋳型とプライマーを必要とする。この酵素は、DNA Polymerase Iに見られる活性に比べてはるかに高い3’→5’エキソヌクレアーゼ活性を有する。T4 DNA Polymeraseには5’→3’エキソヌクレアーゼ活性と鎖置換活性はない。
一部の態様では、ポリメラーゼはSulfolobus DNA Polymerase IV (M0327S, New England BioLabs, Inc.;(Boudsocq,. et al. (2001). Nucleic Acids Res., 29:4607-4616, 2001;およびMcDonald, et al. (2006). Nucleic Acids Res., 34:1102-1111, 2006(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる))である。Sulfolobus DNA Polymerase IVはYファミリーに属する耐熱性の損傷バイパス型DNAポリメラーゼであり、多様なDNA鋳型の損傷を越えて効率的にDNAを合成する(McDonald, J.P. et al. (2006). Nucleic Acids Res.,. 34, 1102-1111(この文献の全内容は参照によって本明細書に組み込まれる))。Sulfolobus DNA Polymerase IVには5’→3’エキソヌクレアーゼ活性と鎖置換活性はない。
一部の態様では、SNPのある領域にプライマーが結合する場合、異なるアレルに対し異なる効率で結合かつ増幅してもよく、1個のアレルのみに対して結合かつ増幅してもよい。ヘテロ接合型の対象者の場合、アレルのうち1つをプライマーによって増幅しなくてもよい。一部の態様では、各アレルに対してプライマーを設計する。たとえば、2つのアレルが存在する場合(たとえば2アレルのSNP)、標的座位の同じ位置に結合する2個のプライマー(たとえば「A」アレルに結合する順方向プライマーと「B」アレルに結合する順方向プライマー)を用いることができる。dbSNPデータベースなどの標準の方法を用いて、ヘテロ接合体率の高いSNPホットスポットなどの既知のSNPの位置を決定することができる。
一部の態様では、増幅産物はサイズが類似している。一部の態様では、標的増幅産物の長さの範囲は100ヌクレオチド未満、75ヌクレオチド未満、50ヌクレオチド未満、25ヌクレオチド未満、15ヌクレオチド未満、10ヌクレオチド未満、または5ヌクレオチド未満である。一部の態様(断片化したDNAまたはRNAの標的座位の増幅など)では、標的増幅産物の長さは50ヌクレオチド〜100ヌクレオチドであり、たとえば60ヌクレオチド〜80ヌクレオチド、または60ヌクレオチド〜75ヌクレオチド(それぞれ、範囲の上限と下限を含む)である。一部の態様(エキソン全体または遺伝子全体の複数の標的座位の増幅など)では、標的増幅産物の長さは100ヌクレオチド〜500ヌクレオチドであり、たとえば150ヌクレオチド〜450ヌクレオチド、200ヌクレオチド〜400ヌクレオチド、200ヌクレオチド〜300ヌクレオチド、または300ヌクレオチド〜400ヌクレオチド(それぞれ、範囲の上限値と下限値を含む)である。
一部の態様では、複数の標的座位を、各標的座位に対する順方向プライマーと逆方向プライマーを含むプライマー対を用いてその反応容量で増幅されるよう同時に増幅する。一部の態様では、標的座位ごとに1個のプライマーを用いて一回のPCRを実行し、次いで標的座位ごとにプライマー対を用いて二回目のPCRを実行する。たとえば、すべてのプライマーが同じ鎖に結合するように標的座位ごとに1個のプライマーを用いて一回目のPCRを実行してもよい(たとえば各標的座位に対して順方向プライマーを用いる)。このことにより、PCRによって直線的な増幅が行われ、配列や長さの違いによる増幅産物間の増幅の偏りを低減または排除することができる。一部の態様では、次いで増幅産物を各標的座位に対する順方向プライマーと逆方向プライマーを用いて増幅する。
プライマー設計方法の例
必要に応じ、プライマー二量体を形成する尤度の低いプライマーを用いて多重PCRを実行してもよい。特に、高度多重化PCRを行うと、プライマー二量体形成などの非生産的な副反応によるDNA産物の割合が非常に高くなる場合が多い。一態様では、非生産的な副反応を起こす尤度が最も高い特定のプライマーをプライマーライブラリから除外し、ゲノムにマッピングされる増幅DNAの割合をより高くするプライマーライブラリを得てもよい。問題のあるプライマー、すなわち二量体を形成する尤度が特に高いプライマーを除外する工程により、予想外にも、その後の配列決定による分析のために非常に高度に多重化したPCRが可能になった。
マッピングされないプライマー二量体または他の悪影響を及ぼすプライマー産物の量を最小限にしたライブラリを得るためにプライマーを選択する方法は複数存在する。経験的なデータにより、少数の「悪い」プライマーはマッピングされないプライマー二量体副反応の大量発生の原因となることが示されている。これらの「悪い」プライマーを除外することにより、標的座位にマッピングされる配列リードの割合を上げることができる。「悪い」プライマーを特定する1つの方法は、標的化増幅によって増幅したDNAの配列決定データを調べることであり、最も高頻度で認められるプライマー二量体を除外して、ゲノムにマッピングされない副産物DNAをもたらす可能性が極めて低いプライマーライブラリを得ることができる。プライマーの様々な組み合わせの結合エネルギーを算出できる公的に入手可能なプログラムも存在し、結合エネルギーが最も高いプライマーの組み合わせを除外することによっても、ゲノムにマッピングされない副産物DNAをもたらす可能性が極めて低いプライマーライブラリが得られる。
プライマーの選択に関する一部の態様では、候補標的座位に対し1個以上のプライマーまたはプライマー対を設計することにより、候補プライマーの初期ライブラリを作製する。候補標的座位(SNPなど)の集合は、その標的座位に関する所望のパラメータ(標的母集団内のSNPの頻度、またはSNPのヘテロ接合体率)についての公的に入手可能な情報に基づいて選択可能である。一態様では、Primer3プログラム(ワールドワイドウェブのprimer3.sourceforge.net; libprimer3 release 2.2.3(その全内容は参照によって本明細書に組み込まれる))を用いてPCRプライマーを設計してもよい。必要であれば、特定のアニーリング温度範囲内でアニーリングし、特定の範囲のGC含量を有し、特定のサイズ範囲を有し、特定のサイズ範囲の標的増幅産物を生成し、かつ/またはその他のパラメータ特性を有するようにプライマーを設計することができる。候補標的座位ごとに複数のプライマーまたはプライマー対から出発することによって、大多数またはすべての標的座位についてプライマーまたはプライマー対がライブラリに残る可能性が高くなる。一態様では、選択基準は標的座位ごとに少なくとも1個のプライマー対がライブラリに残ることを前提としてもよい。このようにして、最終プライマーライブラリを用いて大多数またはすべての標的座位を増幅する。このことは、ゲノム上の多数の位置の欠失または重複のスクリーニング、あるいは疾患または疾患のリスク増加に関与する多数の配列(多型またはその他の変異など)のスクリーニングなどの用途にとって望ましい。ライブラリのプライマー対が、別のプライマー対によって生成された標的増幅産物と重複する標的増幅産物を生成する場合、それらのプライマー対のうちの1つを、干渉を防止するためにライブラリから除外してもよい。
一部の態様では、候補プライマーのライブラリから、考えられる2個のプライマーの組み合わせの大部分またはすべてについて、「不適切度スコア」(スコアが高いほど適切度が低いことを示す)を計算する(コンピュータによる計算など)。様々な態様では、ライブラリに含まれる候補プライマーの考えられる組み合わせのうち少なくとも80%、90%、95%、98%、99%、または99.5%について不適切度スコアを計算する。各不適切度スコアは、少なくとも部分的に2個の候補プライマーが二量体を形成する尤度に基づいている。必要に応じ、不適切度スコアはさらに、標的座位のヘテロ接合体率、標的座位での配列(たとえば多型)に関連する疾患罹患率、標的座位での配列(たとえば多型)に関連する疾患浸透度、標的座位に対する候補プライマーの特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、標的増幅産物のサイズ、および組換えホットスポットの中心からの距離からなる群より選択される、他の1つ以上のパラメータに基づいてもよい。一部の態様では、標的座位に対する候補プライマーの特異性は、候補プライマーの設計上の増幅対象である標的座位以外の座位に対して結合・増幅することによってミスプライムする尤度を含む。一部の態様では、ミスプライムする1個以上またはすべての候補プライマーをライブラリから除外する。一部の態様では、選択する候補プライマーの数を増加させるため、ミスプライムする可能性のある候補プライマーをライブラリから除外しない。複数の因子について考慮する場合、不適切度スコアを多様なパラメータの加重平均に基づいて計算してもよい。パラメータには、プライマーを使用する特定の用途にとっての重要性に基づいて異なる重みを割り当てることができる。一部の態様では、不適切度スコアの最も高いプライマーをライブラリから除外する。除外したプライマーが、1つの標的座位にハイブリダイズするプライマー対を構成するプライマーである場合、そのプライマー対を構成するもう一方のプライマーをライブラリから除外してもよい。必要に応じて、プライマーを除外する工程を繰り返してもよい。一部の態様では、ライブラリに残っているプライマーの組み合わせ候補の不適切度スコアがすべて最小閾値以下になるまで選択方法を実行する。一部の態様では、ライブラリに残っている候補プライマーの数が所望の数に減少するまで選択方法を実行する。
様々な態様では、不適切度スコアを計算した後、2個の候補プライマーの最大数の組み合わせの一部である、不適切度スコアが第一の最小閾値を超える候補プライマーをライブラリから除外する。この工程では、第一の最小閾値以下の相互作用は重要性が低いため、このような相互作用を無視する。除外したプライマーが、1つの標的座位にハイブリダイズするプライマー対を構成するプライマーである場合、そのプライマー対を構成するもう一方のプライマーをライブラリから除外してもよい。必要に応じて、プライマーを除外する工程を繰り返してもよい。一部の態様では、ライブラリに残っているプライマーの組み合わせ候補の不適切度スコアがすべて第一の最小閾値以下になるまで選択方法を実行する。ライブラリに残っている候補プライマーの数が所望の数よりも多い場合、第一の最小閾値をより低い第二の最小閾値まで下げ、プライマーを除外する工程を繰り返すことによってプライマーの数を減少させてもよい。ライブラリに残っている候補プライマーの数が所望の数よりも少ない場合には、第一の最小閾値をより高い第二の最小閾値まで上げ、元の候補プライマーライブラリでプライマーを除外する工程を繰り返すことによって方法を続けることが可能であり、このようにしてより多くの候補プライマーをライブラリに残すことができる。一部の態様では、ライブラリに残っているプライマーの組み合わせ候補の不適切度スコアがすべて第二の最小閾値以下になるか、ライブラリに残っている候補プライマーの数が所望の数に減少するまで選択方法を実行する。
必要に応じて、別のプライマー対が生成する標的増幅配列と重複する標的増幅産物を生成するプライマー対を別の増幅反応に分けることができる。(標的増幅産物が重複しているため候補標的座位を分析から外すのではなく)候補標的座位をすべて分析することが望ましい用途では、複数のPCR増幅反応を行うことが望ましくなる場合がある。
これらの選択方法により、所望されるプライマー二量体低減を達成するためにライブラリから除外する必要のある候補プライマーの数が最小限になる。ライブラリから除外する候補プライマーの数がより少ないことによって、得られたプライマーライブラリを用いてより多くの(またはすべての)標的座位を増幅することができる。
多数のプライマーを複合することにより、含まれ得る試験法には相当な制約が課される。意図せず相互作用する試験法では、偽の増幅産物が発生する。ミニPCRのサイズ制約によってさらに制約が生じる可能性がある。一態様では、可能性のある非常に多数(約500〜100万超)のSNP標的から出発し、各SNPを増幅するためのプライマーの設計を試みることが可能である。プライマーを設計することが可能な場合、DNA二重鎖の形成について公開されている熱力学的パラメータを使用し、考えられるすべてのプライマー対の偽プライマー二本鎖形成の尤度を評価することによって、偽の生成物を形成する可能性のあるプライマー対の特定を試みることが可能である。相互作用に関連するスコアリング機能によってプライマー相互作用をランク付けしてもよく、相互作用スコアが最も悪いプライマーを、所望のプライマー数が得られるまで排除する。ヘテロ接合性である可能性の高いSNPが最も有用である場合、試験法のリストをランク付けし、最もヘテロ接合性に適合する試験法を選択することも可能である。相互作用スコアの高いプライマーはプライマー二量体を形成する可能性が最も高いことが実験によって実証されている。高度多重化では、偽相互作用をすべて排除することは不可能であるが、相互作用スコアが最も高いプライマーまたはプライマー対は反応全体を支配して目的の標的からの増幅を大きく制限する可能性があるため、これらをコンピュータで除外することが必須である。発明者らはこの手順を実行し、最大10,000個、場合によってはそれを超えるプライマーの多重プライマーセットを作製した。この手順による改善は大きく、PCR産物をすべて配列決定で確認すると、最も悪いプライマーを除外しない反応では10%の増幅率であったのに対し、標的産物は80%超、90%超、95%超、98%超、さらには99%の増幅率である。前述の部分的に準入れ子の方法と組み合わせると、増幅産物の90%以上、さらには95%以上が標的配列にマッピングされ得る。
当然ながら、どのPCRプローブが二量体を形成する可能性が高いかを決定する方法は他にもある。一態様では、最適化されていないプライマーセットを用いて増幅したDNAのプールを分析すれば、問題のあるプライマーを決定するのに十分である場合がある。たとえば、配列決定によって分析を行ってもよく、最も多く存在する二量体を、二量体を結成する可能性が最も高いプライマーと判断し、そのプライマーを除外してもよい。一態様では、プライマー設計の方法を本明細書に記載のミニPCR法と組み合わせて使用してもよい。
プライマー上にタグを使用することにより、プライマー二量体生成物の増幅および配列決定を低減できる。一部の態様では、プライマーは、タグと共にループ構造を形成する内部領域を含む。特定の態様では、プライマーは、標的座位に特異的な5’領域と、標的座位に非特異的かつループ構造を形成する内部領域と、標的座位に特異的な3’領域とを含む。一部の態様では、ループ領域は、鋳型DNAの連続領域または隣接領域に結合するように設計された2つの結合領域の間に位置してもよい。様々な態様では、3’領域は少なくとも7ヌクレオチド長である。一部の態様では、3’領域は7〜20ヌクレオチド長であり、たとえば7〜15ヌクレオチド長、または7〜10ヌクレオチド長(それぞれ、範囲の上限と下限を含む)。様々な態様では、プライマーは、標的座位に非特異的な5’領域(タグまたは汎用プライマー結合部位など)に続いて、標的座位に特異的な領域と、標的座位に非特異的かつループ構造を形成する内部領域と、標的座位に特異的な3’領域を含む。必要な標的特異的配列を20塩基対未満、15塩基対未満、12塩基対未満、さらには10塩基対未満に短縮するためにタグプライマーを利用することができる。これは、標準的なプライマー設計を用いても標的配列をプライマー結合部位で断片化するときに偶然起こる可能性もあるし、プライマーの構造として設計することもできる。この方法の利点としては、ある最大の増幅産物長に関して設計可能な試験法の数が増えることと、プライマー配列の「情報として無益な」配列決定を短縮することが挙げられる。この方法を内部標識法と組み合わせて用いてもよい。
一態様では、多重標的化PCR増幅における非生産的な産物の相対量を、アニーリング温度を上げることによって低減できる。標的特異性プライマーと同じタグを用いてライブラリを増幅する場合、タグがプライマー結合に役立つため、アニーリング温度をゲノムDNAの場合に比べて高くすることができる。一部の態様では、必要に応じて、アニーリング時間を長くすると共にプライマー濃度を低くする。一部の態様では、アニーリング時間は3分超、5分超、8分超、10分超、15分超、20分超、30分超、60分超、120分超、240分超、480分超、さらには960分超であってもよい。ある例示の態様では、プライマー濃度を低くすると共にアニーリング時間を長くする。様々な態様では、伸長時間を通常よりも長くする(たとえば3分超、5分超、8分超、10分超、または15分超)。一部の態様では、プライマー濃度はわずか50nM、20nM、10nM、5nM、1nM、および1nM未満である。こうすることにより、意外なことに、高度多重化(マルチプレックス)反応(たとえば、1,000プレックス反応、2,000プレックス反応、5,000プレックス反応、10,000プレックス反応、20,000プレックス反応、50,000プレックス反応、さらには100,000プレックス反応)のための堅牢な性能が得られる。一態様では、アニーリング時間を長くして増幅を1サイクル、2サイクル、3サイクル、4サイクル、または5サイクル実行し、続いて、より一般的なアニーリング時間でタグ付きプライマーを用いたPCRサイクルを行う。
標的位置を選択するには、候補プライマー対設計のプールから出発し、プライマー対の間で起こる可能性のある有害な相互作用の熱力学的モデルを作成し、次いでこのモデルを用いて、プールに含まれる他の設計と適合しない設計を排除することができる。
一態様では、本発明は、標的座位(たとえば、疾患または障害、あるいは癌などの疾患または障害のリスク増加に関連する多型または変異を含む可能性のある座位)の数を減少させ、かつ/または検出される疾患負荷を増加させる(たとえば、検出される多型または変異の数を増加させる)方法を特徴とする。一部の態様では、前記方法は、癌などの疾患または障害を有する対象者の各座位を多型または変異(一塩基の多様性、挿入、または欠失、あるいは本明細書に記載のそれ以外の任意の多様性)の頻度すなわち反復性によってランク付けする(たとえば降順にランク付けする)ことを含む。一部の態様では、PCRプライマーを一部の座位またはすべての座位に対して設計する。プライマーライブラリ用のPCRプライマーの選択では、頻度すなわち反復性の高い座位(より高いランクの座位)に対するプライマーは頻度すなわち反復性の低い座位(より低いランクの座位)に対するプライマーよりも有利である。一部の態様では、このパラメータを、本明細書に記載の不適切度スコアの計算におけるパラメータの1つとして含む。必要に応じて、ライブラリに含まれる、他の設計とは適合しないプライマー(ランクの高い座位に対するプライマーなど)を別のPCRライブラリ/プールに含めることができる。一部の態様では、複数(たとえば2個、3個、4個、5個、またはそれ以上)のライブラリ/プールを別のPCR反応に用いて、すべてのライブラリ/プールで表されるすべて(または大部分)の座位を増幅することができる。一部の態様では、1つ以上のライブラリ/プールに十分なプライマーが含まれるまでこの方法を継続することにより、プライマー全体によって疾患または障害について所望の疾患負荷を(たとえば、疾患負荷の少なくとも80%、85%、90%、95%、または99%の検出によって)とらえることができる。
プライマーライブラリの例
一側面では、本発明はプライマー(本発明の任意の方法によって候補プライマーのライブラリから選択されるプライマーなど)のライブラリを特徴とする。一部の態様では、ライブラリは、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる標的座位と1つの反応容量で同時にハイブリダイズする(または同時にハイブリダイズ可能である)、あるいはこれらを同時に増幅する(または同時に増幅できる)プライマーを含む。様々な態様では、ライブラリは100個〜500個、500個〜1,000個、1,000個〜2,000個、2,000個〜5,000個、5,000個〜7,500個、7,500個〜10,000個、10,000個〜20,000個、20,000個〜25,000個、25,000個〜30,000個、30,000個〜40,000個、40,000個〜50,000個、50,000個〜75,000個、または75,000個〜100,000個(それぞれ、範囲の上限と下限を含む)の異なる標的座位を1つの反応容量で同時に増幅する(または同時に増幅できる)プライマーを含む。様々な態様では、ライブラリは、1,000個〜100,000個(たとえば、1,000個〜50,000個、1,000個〜30,000個、1,000個〜20,000個、1,000個〜10,000個、2,000個〜30,000個、2,000個〜20,000個、2,000個〜10,000個、5,000個〜30,000個、5,000個〜20,000個、または5,000個〜10,000個(それぞれ、範囲の上限と下限を含む))の異なる標的座位を1つの反応容量で同時に増幅する(または同時に増幅できる)プライマーを含む。一部の態様では、ライブラリは、増幅産物のうちプライマー二量体が60%未満、40%未満、30%未満、20%未満、10%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.5%未満、0.25%未満、0.1%未満、または0.5%になるように標的座位を1つの反応容量で同時に増幅する(または同時に増幅できる)プライマーを含む。様々な態様では、プライマー二量体である増幅産物の量は0.5%〜60%であり、たとえば、0.1%〜40%、0.1%〜20%、0.25%〜20%、0.25%〜10%、0.5%〜20%、0.5%〜10%、1%〜20%、または1%〜10%(それぞれ、範囲の上限と下限を含む)である。一部の態様では、プライマーは、増幅産物のうち少なくとも50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、または99.5%が標的増幅産物となるように標的座位を1つの反応容量で同時に増幅する(または同時に増幅できる)。様々な態様では、標的増幅産物である増幅産物の量は50%〜99.5%であり、たとえば60%〜99%、70%〜98%、80%〜98%、90%〜99.5%、または95%〜99.5%(それぞれ、範囲の上限と下限を含む)である。一部の態様では、プライマーは、標的座位のうち少なくとも50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、または99.5%が増幅される(たとえば、増幅前の量に比べて少なくとも5倍、10倍、20倍、30倍、50倍、または100倍に増幅される)ように標的座位を1つの反応容量で同時に増幅する(または同時に増幅できる)。様々な態様では、増幅される(たとえば、増幅前の量に比べて少なくとも5倍、10倍、20倍、30倍、50倍、または100倍に増幅される)標的座位の量は50%〜99.5%であり、たとえば60%〜99%、70%〜98%、80%〜99%、90%〜99.5%、95%〜99.9%、または98%〜99.99%(それぞれ、範囲の上限と下限を含む)である。一部の態様では、プライマーライブラリは、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個のプライマー対を含み、ここで、各プライマー対は、順方向試験プライマーと逆方向試験プライマーを含み、各試験プライマー対が標的座位にハイブリダイズする。一部の態様では、プライマーライブラリは、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000の個別のプライマーを含み、プライマーはそれぞれ異なる標的座位にハイブリダイズする。ここで、個別のプライマーはプライマー対の一部ではない。
様々な態様では、各プライマーの濃度は、100nM未満、75nM未満、50nM未満、25nM未満、20nM未満、10nM未満、5nM未満、2nM未満、または1nM未満、あるいは500μM未満、100μM未満、10μM未満、または1μM未満である。様々な態様では、各プライマーの濃度は1μM〜100nMであり、たとえば1μM〜1nM、1nM〜75nM、2nM〜50nM、または5nM〜50nM(それぞれ、範囲の上限と下限を含む)である。様々な態様では、プライマーのGC含量は30%〜80%であり、たとえば、40%〜70%、または50%〜60%(それぞれ、範囲の上限と下限を含む)である。一部の態様では、プライマーのGC含量の範囲は、30%未満、20%未満、10%未満、または5%未満である。一部の態様では、プライマーのGC含量の範囲は5%〜30%であり、たとえば5%〜20%、または5%〜10%(それぞれ、範囲の上限と下限を含む)である。一部の態様では、試験プライマーの融解温度(T)は40℃〜80℃であり、たとえば50℃〜70℃、55℃〜65℃、または57℃〜60.5℃(それぞれ、範囲の上限と下限を含む)である。一部の態様では、Primer3プログラム(libprimer3 release 2.2.3)を用いて、組み込まれているSantaLuciaパラメータを用いてT値を計算する(ワールドワイドウェブのprimer3.sourceforge.net)。一部の態様では、プライマーの融解温度の範囲は15℃未満、10℃未満、5℃未満、3℃未満、または1℃未満である。一部の態様では、プライマーの融解温度の範囲は1℃〜15℃であり、たとえば、1℃〜10℃、1℃〜5℃、または1℃〜3℃(それぞれ、範囲の上限と下限を含む)である。一部の態様では、プライマーの長さは15〜100ヌクレオチドであり、たとえば、15〜75ヌクレオチド、15〜40ヌクレオチド、17〜35ヌクレオチド、18〜30ヌクレオチド、または20〜65ヌクレオチド(それぞれ、範囲の上限と下限を含む)である。一部の態様では、プライマーの長さの範囲は、50ヌクレオチド未満、40ヌクレオチド未満、30ヌクレオチド未満、20ヌクレオチド未満、10ヌクレオチド未満、または5ヌクレオチド未満である。一部の態様では、プライマーの長さの範囲は5〜50ヌクレオチドであり、たとえば、5〜40ヌクレオチド、5〜20ヌクレオチド、または5〜10ヌクレオチド(それぞれ、範囲の上限と下限を含む)である。一部の態様では、標的増幅産物の長さは50〜100ヌクレオチドであり、たとえば、60〜80ヌクレオチド、または60〜75ヌクレオチド長(それぞれ、範囲の上限と下限を含む)である。一部の態様では、標的増幅産物の長さの範囲は、50ヌクレオチド未満、25ヌクレオチド未満、15ヌクレオチド未満、10ヌクレオチド未満、または5ヌクレオチド未満である。一部の態様では、標的増幅産物の長さの範囲は、5〜50ヌクレオチドであり、たとえば、5〜25ヌクレオチド、5〜15ヌクレオチド、または5〜10ヌクレオチド(それぞれ、範囲の上限と下限を含む)である。一部の態様では、ライブラリはマイクロアレイを含まない。一部の態様では、ライブラリはマイクロアレイを含む。
一部の態様では、一部(たとえば、少なくとも80%、90%、または95%)またはすべてのアダプターまたはプライマーは、隣接するヌクレオチド間に天然のホスホジエステル結合以外の1つ以上の結合を有する。このような結合の例としては、ホスホルアミド結合、ホスホロチオアート結合、ホスホロジチオアート結合が挙げられる。一部の態様では、一部(少なくとも80%、90%、または95%)またはすべてのアダプターまたはプライマーは、チオホスファート(モノチオホスファートなど)を3’末端のヌクレオチドと3’末端から二番目のヌクレオチドとの間に有する。一部の態様では、一部(たとえば、少なくとも80%、90%、または95%)またはすべてのアダプターまたはプライマーは、チオホスファート(モノチオホスファートなど)を3’末端の最後の2個、3個、4個、または5個のヌクレオチドの間に有する。一部の態様では、一部(たとえば、少なくとも80%、90%、または95%)またはすべてのアダプターまたはプライマーは、チオホスファート(モノチオホスファートなど)を、3’末端の最後の10個のヌクレオチドのうち少なくとも1個、2個、3個、4個、または5個のヌクレオチドの間に有する。一部の態様では、このようなプライマーは切断または分解される可能性がより低い。一部の態様では、プライマーは酵素切断部位(プロテアーゼ切断部位など)を含まない。
多重PCR法とライブラリのさらなる例は、2012年11月21日出願の米国特許出願第13/683,604号(米国特許出願公開第2013/0123120号)明細書、および2014年5月16日出願の米国特許出願第61/994,791号明細書(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる)。これらの方法およびライブラリは、本明細書に開示の任意の試料の分析に利用可能であり、本発明の任意の方法に利用可能である。
組換え検出用ライブラリのプライマーの例
一部の態様では、プライマーライブラリに含まれるプライマーを、1つ以上の既知の組換えホットスポットで組換え(ヒトの相同染色体間の交叉など)が起こっているかどうかを決定するよう設計する。染色体間でどのような交叉が起こったかを知ることで、個体に関するより正確な相決定済み遺伝データを決定できる。組換えホットスポットは、組換え事象が集中しやすい染色体局所領域である。組換えホットスポットは、平均よりも組換え頻度が低い領域である「コールドスポット」に隣接している場合が多い。組換えホットスポットは類似の形態を共有する傾向があり、約1kb〜2kbの長さである。ホットスポットの分布は、GC含量および反復要素の分布と正の相関を有する。一部のホットスポット活性には、部分的に縮重した13マーのモチーフであるCCNCCNTNNCCNCが関与する。PRDM9と呼ばれる亜鉛フィンガータンパク質がこのモチーフに結合し、その位置で組換えを開始することがわかっている。複数の組換えホットスポットの中心間の距離の平均は約80kbであると報告されている。一部の態様では、複数の組換えホットスポットの中心間の距離は約3kb〜約100kbの範囲である。公知のデータベースにはヒトの既知の組換えホットスポットが多数含まれている(HUMHOTデータベース、International HapMap Projectデータベースなど(たとえば、以下を参照:Nishant et al., “HUMHOT: a database of human meiotic recombination hot spots,” Nucleic Acids Research, 34: D25-D28, 2006, Database issue;Mackiewicz et al., “Distribution of Recombination Hotspots in the Human Genome - A Comparison of Computer Simulations with Real Data” PLoS ONE 8(6): e65272, doi:10.1371/journal.pone.0065272;およびワールドワイドウェブのhapmap.ncbi.nlm.nih.gov/downloads/index.html.en(それぞれの全内容は参照によって本明細書に組み込まれる))。
一部の態様では、プライマーライブラリに含まれるプライマーを組換えホットスポット(たとえばヒトの既知の組換えホットスポット)またはその付近に集中させる。一部の態様では、対応する増幅産物を用いて組換えホットスポット内またはその付近の配列を決定し、組換えがその特定のホットスポットで起こったかどうか(たとえば、その増幅産物の配列が、組換えが起こった場合に期待される配列であるか、組換えが起こらなかった場合に期待される配列であるか)を決定できる。一部の態様では、プライマーを、組換えホットスポット(と、必要に応じ、組換えホットスポットに隣接する配列)の一部または全体を増幅するように設計する。一部の態様では、ロングリード配列決定(Illumina社が開発したMoleculo Technologyを用いて約10kb以下の配列を決定する配列決定など)またはペアエンド配列決定を用いて組換えホットスポットの一部または全体を配列決定する。組換え事象が起こったかどうかの認識を用いて、どのハプロタイプブロックがホットスポットに隣接しているかを決定する。必要であれば、特定のハプロタイプブロックの存在を、そのハプロタイプブロック内の領域に特異的なプライマーを用いて確認できる。一部の態様では、既知の組換えホットスポットの間に交叉がないことが推測される。一部の態様では、プライマーライブラリに含まれるプライマーを染色体の末端またはその付近に集中させる。たとえば、このようなプライマーを用いて、染色体の末端の特定のアームまたはセクションが存在するかどうかを決定することができる。一部の態様では、プライマーライブラリに含まれるプライマーを組換えホットスポットまたはその付近と染色体の末端またはその付近に集中させる。
一部の態様では、プライマーライブラリは、組換えホットスポット(たとえばヒトの既知の組換えホットスポット)に特異的かつ/または組換えホットスポットの付近(たとえば組換えホットスポットの5’末端または3’末端から10kb以内、8kb以内、5kb以内、3kb以内、2kb以内、1kb以内、または0.5kb以内)の領域に特異的な1個以上のプライマー(たとえば、少なくとも5個、10個、50個、100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、または50,000個の異なるプライマーまたは異なるプライマー対)を含む。一部の態様では、少なくとも1個、5個、10個、20個、40個、60個、80個、100個、または150個の異なるプライマー(またはプライマー対)が、同じ組換えホットスポットに特異的であるか、同じ組換えホットスポットまたはその付近の領域に特異的である。一部の態様では、少なくとも1個、5個、10個、20個、40個、60個、80個、100個、または150個の異なるプライマー(またはプライマー対)が組換えホットスポットの間の領域(たとえば組換えが起こった可能性の低い領域)に特異的であり、これらのプライマーを用いてハプロタイプブロック(たとえば、組換えが起こったかどうかに応じて期待されるハプロタイプブロック)の存在を確認できる。一部の態様では、プライマーライブラリに含まれるプライマーのうち少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%が組換えホットスポットに特異的かつ/または組換えホットスポットの付近(たとえば組換えホットスポットの5’末端または3’末端から10kb以内、8kb以内、5kb以内、3kb以内、2kb以内、1kb以内、または0.5kb以内)の領域に特異的である。一部の態様では、プライマーライブラリを用いて、5個以上、10個以上、50個以上、100個以上、200個以上、500個以上、750個以上、1,000個以上、2,000個以上、5,000個以上、7,500個以上、10,000個以上、20,000個以上、25,000個以上、30,000個以上、40,000個以上、または50,000個以上の異なる組換えホットスポット(たとえばヒトの既知の組換えホットスポット)で組換えが起こったかどうかを決定する。一部の態様では、組換えホットスポットまたはその付近の領域に対するプライマーが標的とする領域は、ゲノム上のその部分に概ね均等に広がる。一部の態様では、少なくとも1個、5個、10個、20個、40個、60個、80個、100個、または150個の異なるプライマー(またはプライマー対)が、染色体の末端またはその付近の領域(たとえば、染色体の末端から20mb以内、10mb以内、5mb以内、1mb以内、0.5mb以内、0.1mb以内、0.01mb以内、または0.001mb以内の領域)に特異的である。一部の態様では、プライマーライブラリに含まれるプライマーのうち少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%が染色体の末端またはその付近の領域(たとえば、染色体の末端から20mb以内、10mb以内、5mb以内、1mb以内、0.5mb以内、0.1mb以内、0.01mb以内、または0.001mb以内の領域)に特異的である。一部の態様では、少なくとも1個、5個、10個、20個、40個、60個、80個、100個、または150個の異なるプライマー(またはプライマー対)が、染色体内の微小欠失である可能性のある部分に含まれる領域に特異的である。一部の態様では、プライマーライブラリに含まれるプライマーのうち少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%が、染色体内の微小欠失である可能性のある部分に含まれる領域に特異的である。一部の態様では、プライマーライブラリに含まれるプライマーのうちの少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%が、染色体内の組換えホットスポット、組換えホットスポットの付近の領域、染色体の末端またはその付近の領域、あるいは微小欠失である可能性のある部分に含まれる領域に特異的である。
キットの例
一側面では、本発明はキット(たとえば、本明細書に記載の任意の方法によって染色体分節または染色体全体の欠失および/または重複を検出するために核酸試料中の標的座位を増幅するためのキット)を特徴とする。一部の態様では、キットは本発明の任意のプライマーライブラリを含むことができる。一態様では、キットは複数の内側順方向プライマー、必要に応じて複数の内側逆方向プライマー、必要に応じて外側順方向プライマーおよび外側逆方向プライマーを含む。ここで、プライマーの各々は、標的である染色体または染色体分節(必要に応じて、追加の染色体または染色体分節)の標的部位(たとえば多型部位)の1つに接する上流および/または下流のDNA領域にハイブリダイズするよう設計される。一部の態様では、キットは、たとえば本明細書に記載の任意の方法によって1つ以上の染色体分節または染色体全体の1つ以上の欠失および/または重複を検出するためにプライマーライブラリを用いて標的座位を増幅するための説明書を含む。
ある態様では、本発明のキットは、染色体異数性およびCNV決定を検出するためのプライマー対(たとえば、CNVの検出(CoNVERGe = Copy Number Variant Events Revealed Genotypically)および/またはSNVなどの染色体異数性の検出のための超多重化反応用のプライマー対)を提供する。これらの態様では、キットは、同送される少なくとも100個、200個、250個、300個、500個、1000個、2000個、2500個、3000個、5000個、10,000個、20,000個、25,000個、28,000個、50,000個、または75,000個、かつ最大で200個、250個、300個、500個、1000個、2000個、2500個、3000個、5000個、10,000個、20,000個、25,000個、28,000個、50,000個、75,000個、または100,000個の範囲のプライマー対を含むことができる。1つの容器(1つの管または箱など)あるいは複数の管または箱などにプライマー対を入れることができる。ある態様では、販売者がプライマー対をあらかじめ限定して共に販売し、他の態様では、顧客が注文する遺伝子標的および/またはプライマーを選択して販売者がプライマープールを作製し、1つの管や複数の管に入れずに顧客に発送する。ある例示の態様では、キットは、CNVおよびSNV、特に少なくとも1種の癌と相関することが知られているCNVおよびSNVを検出するためのプライマーを含む。
本発明の一部の態様による循環DNA検出用キットは、循環DNA検出のための標準および/または対照を含む。たとえば、ある態様では、標準および/または対照を、増幅反応を実行するのに用いる本明細書に記載のプライマー(CoNVERGeを実行するためのプライマーなど)と併せて販売、必要に応じて発送・梱包する。ある態様では、対照はDNAなどのポリヌクレオチドを含む。ポリヌクレオチドとしては、CNVなどの1つ以上の染色体異数性を示し、かつ/または1つ以上のSNVを含む単離ゲノムDNAが挙げられる。ある態様では、標準および/または対照はPlasmArt標準と呼ばれ、CNVを示す(特に、特定の遺伝性疾患、および癌などの特定の病状において)ことがわかっているゲノムの領域と同一の配列と、血漿に本来見られる無細胞DNA断片のサイズ分布を反映するサイズ分布とを有するポリヌクレオチドを含む。PlasmArt標準を作製するための方法の例を、本明細書に記載の実施例に示す。一般的には、染色体異数性を有することがわかっている起源から得たゲノムDNAを単離し、断片化し、精製してサイズ選択する。
したがって、上に要約した方法で調製した単離ポリヌクレオチド試料を、染色体異数性および/またはSNVを示さないことがわかっているDNA試料に、生体内の無細胞DNAにみられる濃度と類似の濃度(たとえば、DNAが液体中、0.01%〜20%、0.1%〜15%、または4%〜10%)で添加することにより、人工無細胞DNAポリヌクレオチド標準および/または対照を作製できる。これらの標準/対照は、試験法の設計、特性評価、開発、および/または検証のための対照として、また、試験(CLIA(Clinical Laboratory Improvement Amendment;臨床検査改善修正法案)認定された研究所で実施される癌試験など)の際の品質管理標準として、および/あるいは研究用試験キットまたは診断試験キットに含まれる標準として使用可能である。
正規化/修正方法の例
一部の態様では、異なる座位、染色体分節、または染色体に関する測定値を、偏り(GC含量の違いによる偏り、または増幅効率におけるその他の違いによる偏りなど)や配列決定エラーに応じて調整する。一部の態様では、同じ座位の異なるアレルに関する測定値を、アレル間で見られる代謝、アポトーシス、ヒストン、不活化、および/または増幅の違いに応じて調整する。一部の態様では、RNA内の同じ座位の異なるアレルに関する測定値を、異なるRNAアレル間で見られる転写速度または安定性の違いに応じて調整する。
遺伝データの相決定方法の例
一部の態様では、遺伝データを相決定するための本明細書に記載の方法または任意の既知の方法で遺伝データを相決定する(たとえば、2009年2月9日出願の国際公開第2009/105531号パンフレット、および2009年8月4日出願の国際公開第2010/017214号パンフレット;2012年11月21日出願の米国特許出願公開第2013/0123120号明細書;2010年10月7日出願の米国特許出願公開第2011/0033862号明細書;2010年8月19日出願の米国特許出願公開第2011/0033862号明細書;2011年2月3日出願の米国特許出願公開第2011/0178719号明細書;2008年3月17日出願の米国特許第8,515,679号明細書;2006年11月22日出願の米国特許出願公開第2007/0184467号明細書;2008年3月17日出願の米国特許出願公開第2008/0243398号明細書;および2014年5月16日出願の米国特許出願第61/994,791号明細書を参照;これらの文献それぞれの全内容は参照によって本明細書に組み込まれる)。一部の態様では、対象CNVを含むとわかっているか、考えられる1つ以上の領域について相を決定する。一部の態様では、CNV領域に隣接する1つ以上の領域および/または1つ以上の基準領域についても相を決定する。一態様では、個体(たとえば、本発明の方法による試験の対象である個体、あるいは懐胎中の胎児または胎芽の親などの血縁者)の遺伝データを、その個体から採取した半数体組織を測定することにより(たとえば1個以上の精子または卵子を測定することにより)、推測によって相を決定する。一態様では、1人以上の第一度近親者(個体の両親(たとえば個体の父親の精子を用いる)または兄弟姉妹など)の測定遺伝型データを用いた推測によって個体の遺伝データを相決定する。
一態様では、希釈(DNAまたはRNAを1つ以上のウェルに希釈して入れる)によって、たとえばデジタルPCRを用いて個体の遺伝データを相決定する。一部の態様では、各ウェルに存在する各ハプロタイプのコピーが約1個のみだと期待されるようになるまでDNAまたはRNAを希釈し、次いで1つ以上のウェルに含まれるDNAまたはRNAを測定する。一部の態様では、染色体が緊密な束になる有糸分裂期に細胞を停止させ、微小流体工学を用いて個々の染色体を別個のウェルに入れる。DNAまたはRNAは希釈されているため、2個以上のハプロタイプが同じ画分(または管)に入っている可能性はない。したがって、事実上、管には単一のDNA分子が入っているため、単一のDNA分子またはRNA分子のハプロタイプを決定できる。一部の態様では、前記方法は、DNAまたはRNAの試料を複数の画分に分割する(それらの画分のうち少なくとも1つが染色体対のうちの1つの染色体または1つの染色体分節を含むように)ことと、少なくとも1つの画分に含まれるDNA試料またはRNA試料の遺伝型を解析する(たとえば2個以上の多型座位の存在を決定する)ことによってハプロタイプを決定することとを含む。一部の態様では、遺伝型解析は、配列決定(ショットガン配列決定または単分子配列決定など)、多型座位を検出するSNPアレイ、または多重PCRを含む。一部の態様では、遺伝型解析は、SNPアレイを用いて多型座位(たとえば、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる多型座位)を検出することを含む。一部の態様では、遺伝型解析は多重PCRの利用を含む。一部の態様では、前記方法は、画分に含まれる試料を、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる多型座位(SNPなど)と同時にハイブリダイズするプライマーのライブラリと接触させて反応混合物を生成することと;反応混合物をプライマー伸長反応条件に供して増幅産物を生成し、この増幅産物を高処理シーケンサで測定して配列決定データを作成する。一部の態様では、RNA(たとえばmRNA)を配列決定する。mRNAはエキソンのみを含むため、mRNAを配列決定することにより、ゲノム内の長い距離(たとえば数メガベース)にわたって多型座位(SNPなど)のアレルを決定できる。一部の態様では、個体のハプロタイプを染色体選別によって決定する。例示の染色体選別方法は、染色体が緊密な束になる有糸分裂期に細胞を停止させ、微小流体工学を利用して個々の染色体を別個のウェルに入れることを含む。別の方法は、蛍光活性化細胞選別(FACS)を介した単一の染色体の選別によって単一の染色体を収集することを含む。標準の方法(配列決定またはアレイなど)を用いて単一の染色体上のアレルを特定し、個体のハプロタイプを決定することができる。
一部の態様では、たとえばIllumina社の開発したMoleculo Technologyを利用して、ロングリード配列決定によって個体のハプロタイプを決定する。一部の態様では、ライブラリ調製工程は、DNAを切断して約10kbのサイズなどの断片に断片化し、断片を希釈してウェルに入れる(1つのウェルに約3,000個の断片が入るように)ことと、各ウェル内の断片を長距離PCR(long-range PCR)によって増幅し、短い断片に切断してその断片にバーコードを付けることと、各ウェルのバーコードを付けた断片を共にプールし、すべてを配列決定することとを含む。配列決定後、計算工程は、断片に付けたバーコードに基づいて各ウェルのリードを分けて断片に分類し、重複するヘテロ接合性のSNVの断片を集めてハプロタイプブロックを得ることと、相決定済みの基準パネルに基づいてそのブロックを統計的に相決定して長いハプロタイプコンティグを作製することとを含む。
一部の態様では、個体の血縁者から得たデータを用いて個体のハプロタイプを決定する。一部の態様では、SNPアレイを用いて、個体と個体の血縁者のDNAまたはRNAの試料に少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる多型座位が存在することを決定する。一部の態様では、前記方法は、個体および/または個体の血縁者から採取したDNA試料を、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる多型座位(SNPなど)と同時にハイブリダイズするプライマーのライブラリと接触させて反応混合物を得ることと;反応混合物をプライマー伸長反応条件に供して増幅産物を生成し、この増幅産物を高処理シーケンサで測定して配列決定データを作成することを含む。
一態様では、集団に基づくハプロタイプ頻度を用いて最も尤度の高い相を推測するコンピュータプログラムを利用して個体の遺伝データを相決定する(HapMapに基づく相決定など)。たとえば、母集団における既知のハプロタイプブロック(たとえば公知のHapMap ProjectとPerlegen Human Haplotype Projectについて作成したもの)を利用する統計学的手法により、二倍体データから半数体データの集合を直接的に演繹することができる。ハプロタイプブロックは、本質的には、多様な集団において反復的に見られる相関するアレルである。これらのハプロタイプブロックの多くは古く一般的であるため、これらを用いて二倍体の遺伝型からハプロタイプを予測してもよい。この課題を達成する公的に利用可能なアルゴリズムには、不完全な系統樹の方法、共役事前確率に基づくベイズの方法、集団遺伝学による事前確率が含まれる。このようなアルゴリズムの一部では隠れマルコフモデルを用いる。
一態様では、遺伝型データからハプロタイプを推定するアルゴリズム(たとえば局在性ハプロタイプのクラスタリングを用いたアルゴリズム)を用いて個体の遺伝データを相決定する(たとえば、Browning and Browning, “Rapid and Accurate Haplotype Phasing and Missing-Data Inference for Whole-Genome Association Studies By Use of Localized Haplotype Clustering” Am J Hum Genet. Nov 2007; 81(5): 1084-1097を参照;この文献の全内容は参照によって本明細書に組み込まれる)である。例示のプログラムは、Beagle version: 3.3.2またはversion 4(ワールドワイドウェブのhfaculty.washington.edu/browning/beagle/beagle.htmlから利用可能であり、その全内容は参照によって本明細書に組み込まれる)である。
一態様では、遺伝型データからハプロタイプを推定するアルゴリズム(距離に伴う連鎖不平衡の減衰、遺伝型解析済みのマーカーの順序と間隔、欠落したデータの補完、組換え率の推定、またはそれらの組み合わせを用いるアルゴリズムなど)を用いて個体の遺伝データを相決定する(たとえば、Stephens and Scheet, “Accounting for Decay of Linkage Disequilibrium in Haplotype Inference and Missing-Data Imputation” Am. J. Hum. Genet. 76:449-462, 2005を参照;この文献の全内容は参照によって本明細書に組み込まれる)。例示のプログラムは、PHASE v.2.1またはv2.1.1.(ワールドワイドウェブのstephenslab.uchicago.edu/software.htmlから入手可能;この全内容は参照によって本明細書に組み込まれる)。
一態様では、集団の遺伝型データからハプロタイプを推定するアルゴリズム(たとえば、隠れマルコフモデルに従いクラスターの構成要素を染色体に沿って継続的に変更できるアルゴリズム)を用いて個体の遺伝データを相決定する。この手法は柔軟であり、連鎖不平衡の「ブロックのような」パターンと、距離に伴う連鎖不均衡の減少を考慮する(たとえば、Scheet and Stephens, “A fast and flexible statistical model for large-scale population genotype data: applications to inferring missing genotypes and haplotypic phase.” Am J Hum Genet, 78:629-644, 2006を参照;この文献の全内容は参照によって本明細書に組み込まれる)。例示のプログラムはfastPHASE(ワールドワイドウェブのstephenslab.uchicago.edu/software.htmlより入手可能であり、全内容が参照によって本明細書に組み込まれる)である。
一態様では、たとえば以下の参考データセットのうち1つ以上を用いる方法などの遺伝型補完方法によって個体の遺伝データを相決定する:HapMapデータセット、複数のSNPチップで遺伝型解析した対照のデータセット、1000人ゲノムプロジェクト(1,000 Genomes Project)による密に分類された試料。例示の手法は、複数の基準パネルに及ぶ情報を組み合わせて精度を高める柔軟なモデリングフレームワークである(たとえば、Howie, Donnelly, and Marchini (2009) “A flexible and accurate genotype imputation method for the next generation of genome-wide association studies.” PLoS Genetics 5(6): e1000529, 2009を参照;この文献の全内容は参照によって本明細書に組み込まれる)。例示のプログラムはIMPUTEまたはIMPUTE version 2(IMPUTE2とも呼ばれる)(ワールドワイドウェブのmathgen.stats.ox.ac.uk/impute/impute_v2.htmlで入手可能であり、全内容が参照によって本明細書に組み込まれる)である。
一態様では、ハプロタイプを推測するアルゴリズム(たとえば、StephensがPHASE v2.1で開発したアルゴリズムなど、組換えを含む合祖の遺伝モデルに基づきハプロタイプを推測するアルゴリズム)を用いて個体の遺伝データを相決定する。アルゴリズムの主な改善点は、二分木を用いて各個体に関する候補ハプロタイプの集合を表現することによるものである。これらの二分木による表現は、(1)PHASE v2.1で行われた冗長演算を避けることによってハプロタイプの事後確率の計算が高速化し、(2)最も尤度の高い経路(すなわちハプロタイプ)を迅速に探索することによってハプロタイプ推測問題における指数関数の面を克服する(たとえば、Delaneau, Coulonges and Zagury, “Shape-IT: new rapid and accurate algorithm for haplotype inference,” BMC Bioinformatics 9:540, 2008 doi:10.1186/1471-2105-9-540を参照;この文献の全内容は参照により本明細書に組み込まれる)。例示のプログラムはSHAPEIT(ワールドワイドウェブのmathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.htmlで入手可能であり、全内容が参照により本明細書に組み込まれる)。
一態様では、集団の遺伝型データからハプロタイプを推定するアルゴリズム(たとえばハプロタイプ断片の頻度を使用してより長いハプロタイプについて経験に基づく確率を得るアルゴリズム)を用いて個体の遺伝データを相決定する。一部の態様では、アルゴリズムは、ハプロタイプの局所的一貫性が最大になるようにハプロタイプを再構築する(例えば、Eronen, Geerts, and Toivonen, “HaploRec: Efficient and accurate large-scale reconstruction of haplotypes,” BMC Bioinformatics 7:542, 2006を参照;この文献の全内容は参照によって本明細書に組み込まれる)。例示のプログラムはHaploRec(たとえばHaploRec version 2.3.(ワールドワイドウェブのcs.helsinki.fi/group/genetics/haplotyping.htmlより入手可能;その全内容は参照によって本明細書に組み込まれる)。
一態様では、集団の遺伝型データからハプロタイプを推定するアルゴリズム(たとえば、分割・結合(partition-ligation)法と期待値最大化に基づくアルゴリズムを使用するアルゴリズムなど)を用いて個体の遺伝データを相決定する(たとえば、Qin, Niu, and Liu, “Partition-Ligation-Expectation-Maximization Algorithm for Haplotype Inference with Single-Nucleotide Polymorphisms,” Am J Hum Genet. 71(5): 1242-1247, 2002を参照;この文献の全内容は参照により本明細書に組み込まれる)。例示的なプログラムは、PL-EM(ワールドワイドウェブのpeople.fas.harvard.edu/~junliu/plem/click.htmlで入手可能であり、全内容が参照により本明細書に組み込まれる)。
一態様では、集団の遺伝型データからハプロタイプを推定するアルゴリズム(たとえば遺伝型を相決定してハプロタイプを得ることとブロック分割とを同時に行うためのアルゴリズムなど)を用いて個体の遺伝データを相決定する。一部の態様では、期待値最大化アルゴリズムを用いる(たとえば、Kimmel and Shamir, “GERBIL: Genotype Resolution and Block Identification Using Likelihood,” Proceedings of the National Academy of Sciences of the United States of America (PNAS) 102: 158-162, 2005を参照;この文献の全内容は参照により本明細書に組み込まれる)。例示的なプログラムはGERBILであり、GEVALT version 2 program(ワールドワイドウェブのacgt.cs.tau.ac.il/gevalt/で入手可能であり、全内容が参照によって本明細書に組み込まれる)の一部として入手可能である。
一態様では、集団の遺伝型データからハプロタイプを推定するアルゴリズム(たとえば、EMアルゴリズムを用い、相を特定しない遺伝型測定値に基づいてハプロタイプ頻度のML推定値を算出するアルゴリズム)を用いて個体の遺伝子データを相決定する。このアルゴリズムでは、一部の遺伝型の測定値が(たとえばPCRの不具合によって)欠落することを考慮している。このアルゴリズムによって、個々のハプロタイプの多重補完が可能である(たとえば、Clayton, D. (2002), "SNPHAP: A Program for Estimating Frequencies of Large Haplotypes of SNPs"を参照;この文献の全内容は参照によって本明細書に組み込まれる)。例示的なプログラムはSNPHAP(ワールドワイドウェブのgene.cimr.cam.ac.uk/clayton/software/snphap.txtで入手可能であり、全内容が参照により本明細書に組み込まれる)である。
一態様では、集団の遺伝型データからハプロタイプを推定するアルゴリズム(たとえば、SNP対について収集した遺伝型統計値に基づいてハプロタイプを推測するためのアルゴリズム)を用いて個体の遺伝データを相決定する。このソフトウェアを用いて、多数の長いゲノム配列(たとえばDNAアレイから得たもの)を比較的正確に相決定できる。例示のプログラムは、入力された遺伝型の行列を受け、対応するハプロタイプの行列を出力する(たとえば、Brinza and Zelikovsky, “2SNP: scalable phasing based on 2-SNP haplotypes,” Bioinformatics.22(3):371-3, 2006を参照;この文献の全内容は参照によって本明細書に組み込まれる)。例示のプログラムは、2SNPである(ワールドワイドウェブのalla.cs.gsu.edu/~software/2SNPより入手可能であり、全内容が参照によって本明細書に組み込まれる)。
様々な態様では、染色体または染色体分節の様々な位置で染色体が交叉する確率に関するデータを用いて(たとえば、HapMapデータベースで見ることができるような組換えデータを用いて、任意の間隔について組換えリスクスコアを作成することによって)個体の遺伝データを相決定し、その染色体または染色体分節に存在する多型アレル間の従属性をモデル化する。一部の態様では、それぞれ染色体または染色体分節の有し得る異なる状態に関する複数の仮説(たとえば、個体に由来する1個以上の細胞のゲノムにおいて、第一の相同染色体分節のコピー数が第二の相同染色体分節のコピー数に比べて過剰出現している;第一の相同染色体分節が重複している;第二の相同染色体分節が欠失している;あるいは第一と第二の相同染色体分節が均等に出現している、など)を(コンピュータなどで)作成し;染色体上の多型座位におけるアレル数の期待値のモデル(たとえば同時分布モデル)を各仮説について(コンピュータなどで)構築し;前記の同時分布モデルおよびアレル数を用いて各仮説の条件付き確率を(コンピュータなどで)決定し;最も確率の高い仮説を選択する。一部の態様では、アレル数に関する同時分布モデルの構築と、各仮説が正しい相対的確率を決定する工程を、基準染色体の使用を必要としない方法で実行する。
一態様では、個体の1人以上の血縁者(1人以上の親、兄弟姉妹、子、胎児、胎芽、祖父母、おじ、おば、いとこなど)の遺伝データを用いて個体の遺伝データを相決定する。一態様では、個体の1人以上(たとえば1人、2人、3人、またはそれ以上)の遺伝的子孫(胎芽、胎児、生後の子、または流産物試料など)の遺伝データを用いて個体の遺伝データを相決定する。一態様では、親(懐胎中の胎児または胎芽の親など)の遺伝データを、もう一方の親に関する相決定済みのハプロタイプデータと、両方の親の1人以上の遺伝的子孫の相決定前の遺伝データを用いて相決定する。
一部の態様では、個体(癌を有すると考えられる個体、胎児、または胎芽)から採取した試料(たとえば腫瘍生検などの生検、血液試料、血漿試料、血清試料、あるいは、大部分または全体が、対象CNVを有する細胞、DNA、またはRNAである可能性の高い別の試料)を分析し、対象CNV(欠失または重複など)を含むとわかっているないしは考えられる1つ以上の領域について、相を決定する。一部の態様では、試料は高い腫瘍率(たとえば30%、40%、50%、60%、70%、80%、90%、95%、98%、99%、または100%)を有する。一部の態様では、胎児またはその妊娠中の母親から採取した試料(たとえば母親の全血試料、母親の血液試料から単離した細胞、母親の血漿試料、母親の血清試料、羊水穿刺による試料、胎盤組織試料、胎児死亡後の胎児の組織、胎児に由来するその他の試料、あるいは、大部分または全体が、対象CNVを有する細胞、DNA、またはRNAである可能性の高い別の試料)を分析し、対象CNV(欠失または重複など)を含むとわかっているないしは考えられる1つ以上の領域について、相を決定する。一部の態様では、試料は胎児画分が多い(たとえば25%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%、または100%)。
一部の態様では、試料はハプロタイプ不均衡またはいずれかの異数性を有する。一部の態様では、試料は2種のDNAの任意の混合物を含む。ここで、この2種は、2つのハプロタイプの比が異なり、かつ少なくとも1つのハプロタイプを共有する。たとえば、胎児と母親の場合、母親が1:1、胎児が1:0(これに加えて父親のハプロタイプを有する)である。たとえば、腫瘍の場合、正常組織が1:1、腫瘍組織が1:0または1:2、1:3、1:4などである。一部の態様では、少なくとも10個、100個、500個、1,000個、2,000個、3,000個、5,000個、8,000個、または10,000個の多型座位を分析し、一部またはすべての座位のアレルの相を決定する。一部の態様では、試料は異数性になるような処理(たとえば長期間の細胞培養による異数性誘発など)を施した細胞または組織に由来する。
一部の態様では、試料中のDNAまたはRNAの大部分または全体が対象CNVを有する。一部の態様では、対象CNVを有する1つ以上の標的細胞に由来するDNAまたはRNAの、試料中の全DNAまたはRNAに対する比が、少なくとも80%、85%、90%、95%、または100%である。欠失を有する試料に関して、欠失を有する細胞(あるいはDNAまたはRNA)に存在するハプロタイプは1つのみである。この第一のハプロタイプは、標準の方法で欠失の領域に存在するアレルの同一性を決定することによって決定可能である。その欠失を有する細胞(あるいはDNAまたはRNA)のみを含む試料では、これらの細胞に存在する第一のハプロタイプに由来するシグナルのみが存在する。欠失を有さない少量の細胞(少量の非癌性細胞など)(あるいはDNAまたはRNA)では、これらの細胞(あるいはDNAまたはRNA)に見られる第二のハプロタイプに由来するシグナルを無視することができる。欠失を有さない個体に由来するその他の細胞、DNA、またはRNAに存在する第二のハプロタイプは、推測によって決定可能である。たとえば、欠失を有さない個体に由来する細胞の遺伝型が(AB、AB)であり、その個体に関する相決定済みデータによって第一のハプロタイプは(A、A)であると示されている場合、もう一方のハプロタイプは(B、B)であると推測できる。
欠失を有する細胞(あるいはDNAまたはRNA)と欠失を有さない細胞(あるいはDNAまたはRNA)の両方が存在する試料の場合も相を決定できる。たとえば、図18または図29に似た図を作成できる。図18または図29では、横軸は染色体に沿った個々の座位の線形位置を表し、縦軸はAアレルのリード数をアレル全体(A+B)のリードにおける比率として表す。欠失に関する一部の態様では、パターンは、個体がヘテロ接合性であるSNPを表す2つの中央バンドを含む(上のバンドは欠失のない細胞に由来するABと欠失を有する細胞に由来するAを表し、下のバンドは欠失のない細胞に由来するABと欠失を有する細胞に由来するBを表す)。一部の態様では、これらの2つのバンドの分離は、欠失を有する細胞、DNAまたはRNAの比率が増加するほど大きくなる。したがって、Aアレルの同一性を用いて第一のハプロタイプを決定し、Bアレルの同一性を用いて第二のハプロタイプを決定することができる。
重複を有する試料の場合、重複を有する細胞(あるいはDNAまたはRNA)に関するハプロタイプの余分なコピーが存在する。重複領域のこのハプロタイプを標準の方法で決定し、重複領域での存在量がより多いアレルの同一性を決定することができる。あるいは、重複していない領域のハプロタイプを標準の方法で決定し、存在量がより少ないアレルの同一性を決定することができる。1つのハプロタイプを決定すると、それ以外のハプロタイプを推測によって決定することができる。
重複を有する細胞(あるいはDNAまたはRNA)と重複のない細胞(あるいはDNAまたはRNA)の両方が存在する試料の場合にも、欠失について上記した方法と類似の方法を用いて相を決定できる。たとえば、図18および図29と似た図を作成することができる。図18または図29では、横軸は染色体に沿った個々の座位の線形位置を表し、縦軸はAアレルのリード数をアレル全体(A+B)のリードにおける比率として表す。欠失に関する一部の態様では、パターンは、個体がヘテロ接合性であるSNPを表す2つの中央バンドを含む(上のバンドは重複のない細胞に由来するABと重複を有する細胞に由来するAABを表し、下のバンドは重複のない細胞に由来するABと欠失を有する細胞に由来するABBを表す)。一部の態様では、これらの2つのバンドの分離は、重複を有する細胞、DNAまたはRNAの比率が増加するにつれて大きくなる。したがって、Aアレルの同一性を用いて第一のハプロタイプを決定し、Bアレルの同一性を用いて第二のハプロタイプを決定することができる。一部の態様では、1つ以上のCNV領域の相(たとえば、測定した領域に含まれる多型座位の少なくとも50%、60%、70%、80%、90%、95%、または100%の相)を、癌を有することがわかっている個体から採取した試料(たとえば腫瘍生検または血漿試料)について決定し、癌の進行を監視する(たとえば寛解または再発を監視する)ために同じ個体のその後の試料の分析に使用する。一部の態様では、腫瘍率の高い試料(たとえば腫瘍負荷の高い個体から採取した腫瘍生検または血漿試料)を用いて、腫瘍率がより低いその後の試料(癌の治療を受けている個体または寛解中の個体から採取した血漿試料など)の分析に使用する相決定済みデータを得る。
出生前診断に関する別の態様では、親の相決定済みのハプロタイプデータによって、父親に由来する複数の相同体の存在が検出される。これは、複数の胎児に由来する遺伝物質が母親の血液試料中に存在することを意味する。胎児において正倍数性であると期待される染色体に注目することによって、胎児が三染色体性を有する可能性を排除できる。また、胎児のDNAが現在の父親に由来しないかどうかを決定することもできる。
一部の態様では、本明細書に記載の方法のうち2つ以上を用いて個体の遺伝データを相決定する。一部の態様では、生物情報学的手法(たとえば、母集団に基づくハプロタイプ頻度を用いて最も尤度の高い相を推測すること)と分子生物学的手法(たとえば、分子の相決定方法であって、生物情報学に基づく推測の相決定済みデータではなく実際の相決定済みデータを得る、本明細書に記載のいずれかの方法)の両方を用いる。一部の態様では、対象者(以前の対象者など)から得た相決定済みデータを用いて、母集団データを精緻化する。たとえば、他の対象者から得た相決定済みデータを母集団データに加え、別の対象者について考えられるハプロタイプに関する事前確率を計算することができる。一部の態様では、他の対象者(以前の対象者など)から得た相決定済みデータを用いて、別の対象者について考えられるハプロタイプに関する事前確率を計算する。
一部の態様では、確率的データを使用してもよい。たとえば、試料中のDNA分子の表現には確率的性質があることや、増幅や測定の様々な差があることから、2個の異なる座位、または所与の座位に存在する異なるアレルから測定したDNA分子の相対数は、混合物または個体に含まれる分子の相対数を表すとは限らない。常染色体上の所与の座位において正常な二倍体性の個体の遺伝型を、その個体の血漿に由来するDNAの配列決定によって決定しようとした場合、1種類のアレルのみが確認される(ホモ接合性)か、ほぼ同数の2種類のアレルが確認される(ヘテロ接合性)ことが期待される。そのアレルにおいて10個のAアレル分子が確認され2個のBアレル分子が確認された場合、その個体がその座位においてホモ接合性で2個のBアレル分子はノイズまたは不純物によるものであるのかどうか、あるいは、その個体がヘテロ接合性でBアレルの分子数がより少ないのは血漿中のDNA分子数のランダムな統計的変動、増幅の差、不純物、またはあらゆる他の原因によるものであるのかどうかは明らかではない。この場合、個体がホモ接合性である確率と、それに対応する、その個体がヘテロ接合性である確率を計算することができ、これらの確率的遺伝型をさらに計算に使用できる。
当然ながら、所与のアレル比について、その比が個体におけるDNA分子の比を厳密に表す尤度は、観測した分子の数が多いほど大きくなる。たとえば、100個のA分子と100個のB分子を測定した場合、実際の比が50%である尤度は、10個のA分子と10個のB分子を測定した場合よりも相当高い。一態様では、ベイズの理論をデータの詳細なモデルと併用し、ある観測値に基づいて特定の仮説が正しいという尤度を決定する。たとえば、2つの仮説、すなわち三染色体性である個体に対応する仮説と二染色体性である個体に対応する仮説を検討する場合、二染色体性の仮説が正しいという確率は、2種類のアレル分子をそれぞれ100個観測した場合には、その2種類のアレル分子をそれぞれ10個観測した場合に比べて相当高くなる。差、不純物または他の何らかのノイズ源によってデータにノイズが多くなるか、所与の座位での観測数が少なければ、観測データに基づいて最尤仮説が真である確率は低くなる。実際には、多くの座位にわたる確率を集約し、最尤仮説が正しい仮説であると決定する信頼度を高めることができる。一部の態様では、確率を組換えとは無関係に単純に集約する。一部の態様では、交叉を考慮して計算する。
一態様では、確率的に相決定したデータを用いてコピー数多様性を決定する。一部の態様では、確率的に相決定したデータは、HapMapデータベースなどのデータ源から得た、集団に基づくハプロタイプブロック頻度データである。一部の態様では、確率的に相決定したデータは、分子的方法(たとえば、染色体の個々の分節を一反応あたり一分子になるまで希釈する、希釈による相決定)で相決定したハプロタイプデータであるが、確率論的ノイズのため、ハプロタイプの同一性を絶対的に知ることはできない。一部の態様では、確率的に相決定したデータは、ハプロタイプの同一性を高い確度で知ることができる、分子的方法で得たハプロタイプデータである。
特定の染色体分節に欠失を有する細胞を個体が有するかどうかを個体から採取した血漿DNAを測定することによって判断することを医師が望むような、仮定の事例について考える。医師は、血漿DNAの由来する細胞がすべて二倍体であり同一の遺伝型である場合にヘテロ接合性の座位では2種類のアレルの各々について観測されるDNA分子の相対数はAアレル50%、Bアレル50%に集中する1つの分布になるという知識を利用できる。しかし、血漿DNAの由来する細胞の画分が特定の染色体分節に欠失を有する場合、ヘテロ接合性の座位では2種類のアレルの各々について観測されるDNA分子の相対数は2つの分布に分かれると期待される。すなわち、1つは染色体分節のうちBアレルを含む座位が欠失している場合で、Aアレルは50%超に集中し、もう1つは染色体分節のうちAアレルを含む座位が欠失している場合で、Aアレルは50%未満に集中する。血漿DNAが由来する細胞が欠失を含む割合が大きいほど、これらの2つの分布は50%から遠くなる。
次の仮定の事例では、個体の体内細胞の一部に染色体領域の欠失があるかどうかを決定したい臨床医を想定する。臨床医はその個体からバキュテナー(真空採血管)または他の種類の採決管に血液を採取し、その血液を遠心分離して血漿層を単離することができる。臨床医は、DNAを血漿から単離し、おそらく標的化増幅またはその他の増幅、座位の捕捉(locus capture)による方法、サイズに基づく選択的濃縮(size enrichment)、または他の濃縮法によってDNAの標的座位を濃縮することができる。臨床医は、SNPの集合におけるアレル数の測定などにより、すなわちアレル頻度データの作成により、定量PCR、配列決定、マイクロアレイ、または試料中のDNA量を測定するその他の方法などの試験法を用いて、濃縮かつ/または増幅されたDNAを分析することができる。臨床医が無細胞血漿DNAを標的化増幅法で増幅して増幅後のDNAを配列決定し、染色体分節で確認され癌を示す6種類のSNPにおいて以下の考えられるデータ例を得、個体がこれらのSNPにおいてヘテロ接合性であった場合のデータ分析について、考察する。
SNP1:Aアレルが460リード;Bアレルが540リード(Aが46%)
SNP2:Aアレルが530リード;Bアレルが470リード(Aが53%)
SNP3:Aアレルが40リード;Bアレルが60リード(Aが40%)
SNP4:Aアレルが46リード;Bアレルが54リード(Aが46%)
SNP5:Aアレルが520リード;Bアレルが480リード(Aが52%)
SNP6:Aアレルが200リード;Bアレルが200リード(Aが50%)
このデータのセットからは、全ての細胞が二染色体性であり個体が正常である場合と、細胞(血漿中の無細胞DNAはこの細胞のDNAから得られる)の一部が染色体に欠失または重複を有し、DNA個体が癌を有し得る場合とを区別するのは難しいかもしれない。たとえば、最も尤度の高い2つの仮説は、個体がこの染色体分節に欠失を有し腫瘍率が6%であるということと、欠失した染色体分節がSNPの集合について遺伝型(A、B、A、A、B、B)または(A、B、A、A、B、A)を有するということである。SNPの集合に関する個体の遺伝型をこのように表現する場合、括弧内の最初の文字はSNP1のハプロタイプの遺伝型に対応し、二番目以降の文字はSNP2以降のハプロタイプの遺伝型にそれぞれ対応する。
個体のその染色体分節におけるハプロタイプを決定する方法を用いて、2つの染色体分節のうちの1つのハプロタイプが(A、B、A、A、B、B)であることがわかった場合、このことは最尤仮説に合致し、その個体がその分節に欠失を有しており癌または前癌性の細胞を有するという尤度の算出値は、相当増加する。一方、その個体がハプロタイプ(A、A、A、A、A、A)を有することがわかった場合、その個体がその染色体分節に欠失を有する尤度は相当減少し、欠失を有さないという仮説の尤度がより高くなるかもしれない(実際の尤度の値は、特にシステムのノイズの測定値など、他のパラメータに依存する)。
個体のハプロタイプを決定する方法は多数存在し、その多くを本明細書の他の箇所に記載する。一部をここに列挙するが、これが網羅的であるということではない。1つの方法は、任意の所定の反応容量中に存在する各染色体領域由来の分子が約1個になるまで個体のDNA分子を希釈し、次いで配列決定などの方法で遺伝型を測定する、生物学的方法である。別の方法は情報科学に基づく方法で、様々なハプロタイプの頻度に関連する母集団データを確率的な方法で使用することができる。別の方法は、個体と、その個体とハプロタイプブロックを共有すると期待される、関連する1人以上の個体の二倍体データを測定し、ハプロタイプブロックを推測する方法である。別の方法は、欠失した分節または重複した分節を高濃度に有する組織試料を採取し、アレル不均衡に基づいてハプロタイプを決定することであり、たとえば、欠失を有する腫瘍組織の試料から得た遺伝型測定値を使用してその欠失領域の相決定済みデータを決定することができ、このデータを使用して、癌が切除後に再増殖したかどうかを判定することができる。
実際には、所定の染色体分節上で一般的に20個超、50個超、100個超、500個超、1,000個超、または5,000個超のSNPを測定する。
相の決定、アレル比の予測、胎児の遺伝データ再構築の方法の例
一側面では、本発明は胎児の1つ以上のハプロタイプを決定するための方法を特徴とする。様々な態様では、この方法により、どの多型座位(SNPなど)が胎児に遺伝したかを決定し、どの相同体(組換え事象を含む)が胎児に存在するかを再現する(ことによって多型座位間の配列を推定する)。必要に応じ、本質的には胎児の全ゲノムを再現できる。胎児のゲノムに曖昧さ(交叉の間隔など)が残る場合、必要に応じて別の多型座位を分析することにより、この曖昧さを最小限にすることができる。様々な態様では、あらゆる曖昧さを所望のレベルまで低減するような密度で染色体の1つ以上を含むよう、多型座位を選択する。この方法は、胎児の対象となる多型またはその他の変異(欠失または重複など)の検出に有用性が高い、というのも、この方法によって、対象となる多型またはその他の変異を胎児のゲノムで検出するのではなく、連鎖(たとえば、胎児のゲノムにおける連鎖した多型座位の存在)に基づいた検出が可能になるためである。たとえば、親が嚢胞性線維症(CF)に関連する変異を保有している場合、胎児の母親に由来する母親のDNAと胎児に由来する胎児のDNAとを含む核酸試料を分析し、そのCF変異を有するハプロタイプを胎児のDNAが有するかどうかを決定できる。特に、多型座位を分析して、CF変異を含むハプロタイプを胎児のDNAが有するかどうかを、胎児のDNA中のCF変異自体を検出する必要なく決定することができる。従って、変異を直接検出する必要なく1つ以上の変異(疾患関連変異など)について検査するのに役立つ。
一部の態様では、前記方法は、たとえば本明細書に記載の任意の方法で親のハプロタイプ(たとえば胎児の母親または父親のハプロタイプ)を決定することを含む。一部の態様では、母親または父親の血縁者からのデータを使用せずにこの決定を行う。一部の態様では、希釈による方法の後に本明細書に記載のSNP遺伝型解析または配列決定を行うことによって親のハプロタイプを決定する。一部の態様では、母親(または父親)の血縁者から得たデータを用いて、本明細書に記載の任意の方法で母親(または父親)のハプロタイプを決定する。一部の態様では、父親と母親両方についてハプロタイプを決定する。
この親のハプロタイプデータを用いて、親のハプロタイプが胎児に遺伝したかどうかを決定できる。一部の態様では、胎児の母親に由来する母親のDNAと胎児に由来する胎児のDNAとを含む核酸試料を、SNPアレイを用いて分析し、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる多型座位)を検出する。一部の態様では、胎児の母親に由来する母親のDNAと胎児に由来する胎児のDNAとを含む核酸試料を、少なくとも100個、200個、500個、750個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる多型座位(SNPなど)と同時にハイブリダイズするプライマーのライブラリと接触させて反応混合物を生成することによって分析する。一部の態様では、反応混合物をプライマー伸長反応条件に供して増幅産物を生成する。一部の態様では、増幅産物を高処理シーケンサで測定し、配列決定データを作成する。
様々な態様では、先に述べたように、染色体または染色体分節の異なる位置における、染色体の交叉確率に関するデータを用いて(たとえば、HapMapデータベースで見ることができるような組換えデータを用いて任意の間隔について組換えリスクスコアを作成することで)、胎児のハプロタイプを決定し、その染色体または染色体分節に存在する多型アレル間の従属性をモデル化する。一部の態様では、前記方法は、SNP(対象とする遺伝子または変異に隣接するSNPなど)の物理的距離と、各位置固有の組換えの尤度および母親の血漿の遺伝学的測定の観測データを基に得た組換えデータとを考慮し、胎児の最も尤度の高い遺伝型を得る。次いで、これらのSNPから得た標的化配列決定データまたはSPNアレイデータに対してPARENTAL SUPPORT(商標)を実行し、どの相同体が両親から胎児に遺伝したのかを決定してもよい(たとえば、米国特許出願第11/603,406号(米国特許出願公開第2007/0184467号)明細書、米国特許出願第12/076,348号(米国特許出願公開第2008/0243398号)明細書、米国特許出願第13/110,685号(米国特許出願公開第2011/0288780号)明細書、国際出願PCT/US09/52730号明細書(国際公開第2010/017214号パンフレット)、国際出願PCT/US10/050824号明細書(国際公開第2011/041485号パンフレット)、米国特許出願第13/300,235号(米国特許出願公開第2012/0270212号)明細書、米国特許出願第13/335,043号(米国特許出願公開第2012/0122701号)明細書、米国特許出願第13/683,604号明細書、米国特許出願第13/780,022号明細書を参照;これらの文献それぞれの全内容は参照によって本明細書に組み込まれる)。
1つの座位において可能性のあるアレルがAとBである一般的な例を想定する。特定のアレルを任意にAまたはBと識別する。特定のSNPに関する親の遺伝型(遺伝的背景という)は、母親の遺伝型|父親の遺伝型として表される。つまり、母親がホモ接合性であり父親がヘテロ接合性である場合、遺伝的背景はAA|ABである。同様に、同一のアレルについて両親ともホモ接合性である場合、親の遺伝型はAA|AAと表される。また、胎児がABまたはBBの状態を有することは決してなく、Bアレルの配列リード数は少ないため、これを用いて、微量のDNA不純物や配列決定エラーなど、試験法と遺伝型解析プラットフォームのノイズ応答を決定できる。これらのノイズ応答は、期待される遺伝データプロファイルをモデル化するのに有用である。可能性のある遺伝的背景(母親|父親)はAA|AA、AA|AB、AB|AA、AB|AB、AA|BBの5種類のみである。他の遺伝的背景も、対称であるため同等である。同一のアレルについて両親がホモ接合性であるSNPは、ノイズや汚染のレベルを決定するためにのみ情報的価値を有する。同一のアレルについて両親がホモ接合性でないSNPは、胎児画分およびコピー数の数値を決定するうえで情報的価値を有する。
SNPiにおける各アレルのリード数をNA,iおよびNB,iとし、その座位における親の遺伝的背景をCとすると、特定の染色体に関するデータセットはNAB={NA,i,NB,i}(i=1...N)およびC={C}(i=1...N)で表される。胎児のゲノムの一部または全体を再現するため、必要に応じて、胎児が異数性(たとえば、染色体または染色体分節の欠失または余分なコピーなど)を有するかどうかを決定することができる。試験対象である個々の染色体または染色体分節それぞれについて、染色体の総数、各染色体の親起源、受精して子を形成した配偶子の形成中に組換えが起こった親の染色体上の位置に関する1つ以上の仮説の集合をHとする。仮説P(H)の確率は、HapMapデータベースのデータや、倍数性状態のそれぞれに関連する事前の情報を用いて計算することができる。
さらに、試料に含まれる胎児の無細胞DNA画分をFとする。可能性のあるH、C、Fの集合が与えられれば、分子試験法および配列決定プラットフォームのノイズ源のモデル化に基づき、NABとP(NAB|H,F,C)を計算できる。目的はP(H,F|NAB)が最大となる仮説Hと胎児画分Fを得ることである。標準的なベイズの統計的手法を用い、Fが0〜1の場合の一様な確率分布を想定し、HおよびFに関してP(NAB|H,F,C)P(H)の確率を最大化するという観点で、これを再計算することができる。現在ではこれらはすべてコンピュータで計算可能である。特定のコピー数と胎児の比率(たとえば、三染色体性かつF=10%)に関連し、可能なすべての親起源と交叉位置を含む、すべての仮説の確率を集約する。最も確率の高いコピー数仮説を試験結果として選択し、その仮説に関連する胎児画分を胎児画分とする。その仮説に関連する確率は結果の精度の計算値である。
一部の態様では、アルゴリズムはコンピュータシミュレーションで、可能性のある胎児の遺伝パターン、試料のパラメータ、方法における増幅や測定の人為的結果によって生じ得る、非常に多数の仮説的配列決定データセットを作成する。より具体的には、このアルゴリズムは、まず、多数のSNPにおける親の遺伝型と、HapMapデータベースから得た交叉頻度データを利用し、可能性のある胎児の遺伝型を予測する。次いで、可能性のある胎児の遺伝型の各々を用い、多様なパラメータ(胎児画分、リード深度プロファイルの期待値、試料中に存在する胎児のゲノム等価物、各SNPにおける増幅の偏りの期待値、複数のノイズパラメータなど)を考慮して、胎児を懐胎している母親から採取した混合試料から測定される配列決定データについて、期待されるデータプロファイルを予測する。データモデルは、これらの仮説のそれぞれについて特定のパラメータのセットに基づいて期待される配列決定データまたはSNPアレイデータを表す。モデル化したデータと測定データとの間のデータ適合性が最も良い仮説を選択する。
必要に応じて、どのハプロタイプが胎児に遺伝したかについての結果を用いて、胎児に由来するDNAまたはRNAについてアレル比の期待値を計算できる。アレル比の期待値は、母親に由来する核酸と胎児に由来する核酸の両方を含む混合試料についても計算可能である(これらのアレル比は、各アレルの総量(試料中の母親の核酸と胎児の核酸に由来するアレルの量を含む)の測定に関して期待される値を示す。第一の相同染色体分節の過剰出現の程度を特定する異なる仮説についてアレル比の期待値を計算することができる。
一部の態様では、本方法は、胎児が以下の状態の1つ以上を有するかどうかを決定することを含む:嚢胞性線維症、ハンチントン病、脆弱X症候群、サラセミア、筋ジストロフィー(例えば、デュシェンヌ型筋ジストロフィー)、アルツハイマー、ファンコニー貧血、ゴーシェ病、ムコ脂質症IV型、ニーマン・ピック病、テイ・サックス病、鎌状赤血球貧血、パーキンソン病、捻転ジストニア、および癌。一部の態様では、胎児のハプロタイプを、13番染色体、18番染色体、21番染色体、X染色体、およびY染色体からなる群より選択される1つ以上の染色体について決定する。一部の態様では、胎児のハプロタイプを胎児の染色体すべてについて決定する。様々な態様では、前記方法によって本質的には胎児の全ゲノムを決定する。一部の態様では、胎児のゲノムの少なくとも30%、40%、50%、60%、70%、80%、90%、または95%についてハプロタイプを決定する。一部の態様では、胎児のハプロタイプの決定は、少なくとも100個;200個;500個;750個;1,000個;2,000個;5,000個;7,500個;10,000個;20,000個;25,000個;30,000個;40,000個;50,000個;75,000個;または100,000個の異なる多型座位にどのアレルが存在するかに関する情報を含む。一部の態様では、この方法を用いて胎芽のハプロタイプまたはアレル比を決定する。
アレル比の予測方法の例
試料についてアレル比の期待値を計算する方法の例を以下に説明する。表1は、母親と胎児の核酸を含む混合試料(母親の血液試料など)のアレル比の期待値である。これらのアレル比の期待値は、混合試料中の母親の核酸と胎児の核酸のアレルの量を含む、各アレルの総量の測定値について期待される値を示す。一態様では、共分離すると期待される2個の近接座位(たとえば、染色体の交叉がないと期待される2個の座位)において母親はヘテロ接合性である。したがって、母親は(AB、AB)である。ここで、1つのハプロタイプについて母親が(A、A)であると母親の相決定済みデータが示していると仮定する。したがって、他方のハプロタイプについて、母親は(B、B)であることが推測できる。表1は、胎児画分が20%である場合の異なる仮説に関するアレル比の期待値を示す。この例では、父親のデータに関する知識を全く想定せず、ヘテロ接合体率を50%と仮定する。2個のSNPの各々について、アレル比の期待値を(Aのリードの割合/総リード数)として表す。母親の相決定済みデータ(1つのハプロタイプが(A、A)であり1つが(B、B)であるという知識)を用いた場合と、母親の相決定済みデータを用いない場合の両方について、これらの比を計算する。表1は、それぞれの親からの胎児の染色体分節のコピー数に関する様々な仮説を含む。
相決定済みデータを用いることで、可能性のあるアレル比の期待値の数を減らすうえ、アレル比の期待値の各々の事前確率を、最尤の結果が正しい可能性を高めるように変更する。可能性のないアレル比の期待値または仮説を排除することにより、正しい仮説が選択される可能性が高くなる。一例として、アレル比の測定値が(0.41、0.59)だとする。相決定済みデータを用いない場合、最も尤度の高い仮説は二染色体性仮説(アレル比の測定値が、二染色体性の場合のアレル比の期待値(0.40、0.60)に近いため)だと推測されると考えられる。しかし、相決定済みデータを用いた場合、二染色体性仮説に関するアレル比の期待値(0.40、0.60)を排除し、三染色体性仮説をより尤度の高いものとして選択できる。
アレル比の測定値が(0.4、0.4)だと仮定する。ハプロタイプ情報がなければ、各SNPにおける母親の欠失の確率は0.5×P(Aの欠失)+0.5×P(Bの欠失)である。したがって、Aが欠失しているように見えるが(胎児における欠失)、欠失の尤度は2つの平均値である。胎児画分が十分に高い場合、最尤仮説を決定することができる。胎児画分が非常に低い場合、平均化は欠失仮説を排除するかもしれないが、ハプロタイプ情報があれば、相同体1が欠失している確率P(Aの欠失)がより高くなり、測定データとの適合がより良好になる。必要に応じ、2個の座位の間の交叉の確率も考慮できる。
相決定済みデータを用いて尤度を組み合わせる別の説明例では、2個の連続するSNP1とSNP2について検討し、DとDをこれらのSNPにおけるアレルデータとする。これらの2個のSNPに関する尤度を組み合わせる方法の例を以下に示す。2個の連続するヘテロ接合性のSNPが、同一の相同体において同一のアレルを有する(すなわち、SNPが両方ともABであるか、SNPが両方ともBAである)確率をcで表す。したがって、1−cはSNPの一方がABで他方がBAである確率である。たとえば、仮説H10とアレル不均衡値fを考慮する。まず、SNPがすべてABまたはBAであると想定してすべての尤度を計算すると仮定する。次に、2個の連続するSNPの尤度を以下のように組み合わせることができる:
これを再帰的に行い、すべてのSNPに関する結合尤度
を決定できる。
変異の例
癌などの疾患または障害、あるいは癌などの疾患または障害のリスク増加(たとえば正常のリスクレベルを超える)に関連する変異の例としては、一塩基多様体(SNV)、複数塩基の変異、欠失(2〜3000万塩基対の領域の欠失など)、重複、または縦列反復が挙げられる。一部の態様では、変異は、無細胞DNA、無細胞ミトコンドリアDNA、核内DNAに由来する無細胞DNA(無細胞核内DNA)、細胞内DNA、ミトコンドリアDNAなどのDNAに存在する。一部の態様では、無細胞RNA、細胞内RNA、細胞質RNA、コーディング細胞質RNA、非コーディング細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNAなどのRNAに存在する。一部の態様では、疾患または障害(癌など)を有する対象者では、疾患または障害(癌など)を有さない対象者に比べて高頻度で変異が存在する。一部の態様では、変異(原因変異など)は癌を示す。一部の態様では、変異は疾患または障害に原因として関与するドライバー変異である。一部の態様では、変異は原因変異ではない。たとえば、一部の癌では複数の変異が蓄積するが、その一部は原因変異ではない。原因変異ではない変異(たとえば、疾患または障害を有する対象者において、疾患または障害を有さない対象者に比べて高頻度で存在する変異など)も、疾患または障害の診断に有用となり得る。一部の態様では、変異は1つ以上のマイクロサテライトにおけるヘテロ接合性の消失(LOH)である。
一部の態様では、対象者が有することがわかっている1つ以上の多型または変異について対象者をスクリーニングする(たとえば、その多型または変異の存在、それらの多型または変異を有する細胞、DNA、またはRNAの量の変化、あるいは癌の寛解または再発について試験するため)。一部の態様では、対象者がリスクを有することがわかっている1つ以上の多型または変異について対象者(たとえばその多型または変異を有する血縁者がいる対象者)をスクリーニングする。一部の態様では、癌などの疾患または障害に関連する多型または変異のパネル(たとえば、少なくとも5個、10個、50個、100個、200個、300個、500個、750個、1,000個、1,500個、2,000個、または5,000個の多型または変異)について対象者をスクリーニングする。
Abaan et al., "The Exomes of the NCI-60 Panel: A Genomic Resource for Cancer Biology and Systems Pharmacology", Cancer Research, July 15, 2013およびワールドワイドウェブのdtp.nci.nih.gov/branches/btb/characterizationNCI60.html(それぞれの全内容は参照によって本明細書に組み込まれる)には、癌に関連する多くのコード化多様体が記載されている。ヒト癌細胞株パネルNCI−60は肺癌、肺癌、大腸癌、脳癌、卵巣癌、乳癌、前立腺癌、腎癌、白血病、および黒色腫を代表する60種の異なる細胞株からなる。これらの細胞株に認められた遺伝的多様性は2種類である:正常な集団に見られるI型多様体;および癌に特異的なII型多様体。
多型または変異(欠失または重複など)の例は、以下の遺伝子のうち1つ以上のものである:TP53, PTEN, PIK3CA, APC, EGFR, NRAS, NF2, FBXW7, ERBBs, ATAD5, KRAS, BRAF, VEGF, EGFR, HER2, ALK, p53, BRCA, BRCA1, BRCA2, SETD2, LRP1B, PBRM, SPTA1, DNMT3A, ARID1A, GRIN2A, TRRAP, STAG2, EPHA3/5/7, POLE, SYNE1, C20orf80, CSMD1, CTNNB1, ERBB2. FBXW7, KIT, MUC4, ATM, CDH1, DDX11, DDX12, DSPP, EPPK1, FAM186A, GNAS, HRNR, KRTAP4-11, MAP2K4, MLL3, NRAS, RB1, SMAD4, TTN, ABCC9, ACVR1B, ADAM29, ADAMTS19, AGAP10, AKT1, AMBN, AMPD2, ANKRD30A, ANKRD40, APOBR, AR, BIRC6, BMP2, BRAT1, BTNL8, C12orf4, C1QTNF7, C20orf186, CAPRIN2, CBWD1, CCDC30, CCDC93, CD5L, CDC27, CDC42BPA, CDH9, CDKN2A, CHD8, CHEK2, CHRNA9, CIZ1, CLSPN, CNTN6, COL14A1, CREBBP, CROCC, CTSF, CYP1A2, DCLK1, DHDDS, DHX32, DKK2, DLEC1, DNAH14, DNAH5, DNAH9, DNASE1L3, DUSP16, DYNC2H1, ECT2, EFHB, RRN3P2, TRIM49B, TUBB8P5, EPHA7, ERBB3, ERCC6, FAM21A, FAM21C, FCGBP, FGFR2, FLG2, FLT1, FOLR2, FRYL, FSCB, GAB1, GABRA4, GABRP, GH2, GOLGA6L1, GPHB5, GPR32, GPX5, GTF3C3, HECW1, HIST1H3B, HLA-A, HRAS, HS3ST1, HS6ST1, HSPD1, IDH1, JAK2, KDM5B, KIAA0528, KRT15, KRT38, KRTAP21-1, KRTAP4-5, KRTAP4-7, KRTAP5-4, KRTAP5-5, LAMA4, LATS1, LMF1, LPAR4, LPPR4, LRRFIP1, LUM, LYST, MAP2K1, MARCH1, MARCO, MB21D2, MEGF10, MMP16, MORC1, MRE11A, MTMR3, MUC12, MUC17, MUC2, MUC20, NBPF10, NBPF20, NEK1, NFE2L2, NLRP4, NOTCH2, NRK, NUP93, OBSCN, OR11H1, OR2B11, OR2M4, OR4Q3, OR5D13, OR8I2, OXSM, PIK3R1, PPP2R5C, PRAME, PRF1, PRG4, PRPF19, PTH2, PTPRC, PTPRJ, RAC1, RAD50, RBM12, RGPD3, RGS22, ROR1, RP11-671M22.1, RP13-996F3.4, RP1L1, RSBN1L, RYR3, SAMD3, SCN3A, SEC31A, SF1, SF3B1, SLC25A2, SLC44A1, SLC4A11, SMAD2, SPTA1, ST6GAL2, STK11, SZT2, TAF1L, TAX1BP1, TBP, TGFBI, TIF1, TMEM14B, TMEM74, TPTE, TRAPPC8, TRPS1, TXNDC6, USP32, UTP20, VASN, VPS72, WASH3P, WWTR1, XPO1, ZFHX4, ZMIZ1, ZNF167, ZNF436, ZNF492, ZNF598, ZRSR2, ABL1, AKT2, AKT3, ARAF, ARFRP1, ARID2, ASXL1, ATR, ATRX, AURKA, AURKB, AXL, BAP1, BARD1, BCL2, BCL2L2, BCL6, BCOR, BCORL1, BLM, BRIP1, BTK, CARD11, CBFB, CBL, CCND1, CCND2, CCND3, CCNE1, CD79A, CD79B, CDC73, CDK12, CDK4, CDK6, CDK8, CDKN1B, CDKN2B, CDKN2C, CEBPA, CHEK1, CIC, CRKL, CRLF2, CSF1R, CTCF, CTNNA1, DAXX, DDR2, DOT1L, EMSY (C11orf30), EP300, EPHA3, EPHA5, EPHB1, ERBB4, ERG, ESR1, EZH2, FAM123B (WTX), FAM46C, FANCA, FANCC, FANCD2, FANCE, FANCF, FANCG, FANCL, FGF10, FGF14, FGF19, FGF23, FGF3, FGF4, FGF6, FGFR1, FGFR2, FGFR3, FGFR4, FLT3, FLT4, FOXL2, GATA1, GATA2, GATA3, GID4 (C17orf39), GNA11, GNA13, GNAQ, GNAS, GPR124, GSK3B, HGF, IDH1, IDH2, IGF1R, IKBKE, IKZF1, IL7R, INHBA, IRF4, IRS2, JAK1, JAK3, JUN, KAT6A (MYST3), KDM5A, KDM5C, KDM6A, KDR, KEAP1, KLHL6, MAP2K2, MAP2K4, MAP3K1, MCL1, MDM2, MDM4, MED12, MEF2B, MEN1, MET, MITF, MLH1, MLL, MLL2, MPL, MSH2, MSH6, MTOR, MUTYH, MYC, MYCL1, MYCN, MYD88, NF1, NFKBIA, NKX2-1, NOTCH1, NPM1, NRAS, NTRK1, NTRK2, NTRK3, PAK3, PALB2, PAX5, PBRM1, PDGFRA, PDGFRB, PDK1, PIK3CG, PIK3R2, PPP2R1A, PRDM1, PRKAR1A, PRKDC, PTCH1, PTPN11, RAD51, RAF1, RARA, RET, RICTOR, RNF43, RPTOR, RUNX1, SMARCA4, SMARCB1, SMO, SOCS1, SOX10, SOX2, SPEN, SPOP, SRC, STAT4, SUFU, TET2, TGFBR2, TNFAIP3, TNFRSF14, TOP1, TP53, TSC1, TSC2, TSHR, VHL, WISP3, WT1, ZNF217, ZNF703、およびその組み合わせ(Su et al., J Mol Diagn 2011, 13:74-84; DOI:10.1016/j.jmoldx.2010.11.010; and Abaan et al., "The Exomes of the NCI-60 Panel: A Genomic Resource for Cancer Biology and Systems Pharmacology", Cancer Research, July 15, 2013;この文献の全内容は参照によって本明細書に組み込まれる)。一部の態様では、重複は乳癌に関連する染色体1p(「Chr1p」)の重複である。一部の態様では、1つ以上の多型または変異はBRAFに存在する(V600E変異など)。一部の態様では、1つ以上の多型または変異はK−rasに存在する。一部の態様では、K−rasとAPCに1つ以上の多型または変異の組み合わせが存在する。一部の態様では、K−rasとp53に1つ以上の多型または変異の組み合わせが存在する。一部の態様では、APCとp53に1つ以上の多型または変異の組み合わせが存在する。一部の態様では、K−ras、APC、p53に1つ以上の多型または変異の組み合わせが存在する。一部の態様では、K−rasとEGFRに1つ以上の多型または変異の組み合わせが存在する。例示の多型または変異は、以下のマイクロRNAのうち1つ以上に存在する:miR-15a, miR-16-1, miR-23a, miR-23b, miR-24-1, miR-24-2, miR-27a, miR-27b, miR-29b-2, miR-29c, miR-146, miR-155, miR-221, miR-222, and miR-223(Calin et al. “A microRNA signature associated with prognosis and progression in chronic lymphocytic leukemia.” N Engl J Med 353:1793- 801, 2005;この文献の全内容は参照によって本明細書に組み込まれる)。
一部の態様では、欠失は少なくとも0.01kb、0.1kb、1kb、10kb、100kb、1mb、2mb、3mb、5mb、10mb、15mb、20mb、30mb、または40mbの欠失である。一部の態様では、欠失は、1kb〜40mb(たとえば1kb〜100kb、100kb〜1mb、1mb〜5mb、5mb〜10mb、10mb〜15mb、15mb〜20mb、20mb〜25mb、25mb〜30mb、または30mb〜40mb)(それぞれ、範囲の上限と下限を含む)の欠失である。
一部の態様では、重複は少なくとも0.01kb、0.1kb、1kb、10kb、100kb、1mb、2mb、3mb、5mb、10mb、15mb、20mb、30mb、または40mbの重複である。一部の態様では、重複は、1kb〜40mb(たとえば1kb〜100kb、100kb〜1mb、1mb〜5mb、5mb〜10mb、10mb〜15mb、15mb〜20mb、20mb〜25mb、25mb〜30mb、または30mb〜40mb)(それぞれ、範囲の上限と下限を含む)である。
一部の態様では、縦列反復は2個〜60個のヌクレオチドの反復であり、たとえば2個〜6個、7個〜10個、10個〜20個、20個〜30、30個〜40個、40個〜50個、または50個〜60個(それぞれ、範囲の上限と下限を含む)のヌクレオチドの反復である。一部の態様では、縦列反復は2個のヌクレオチドの反復(ジヌクレオチド反復)である。一部の態様では、縦列反復は3個のヌクレオチドの反復(トリヌクレオチド反復)である。
一部の態様では、多型または変異は予後のものである。予後変異の例としてはK−ras変異(たとえば大腸癌の手術後の疾患再発の標識であるK−ras変異)(Ryan et al.” A prospective study of circulating mutant KRAS2 in the serum of patients with colorectal neoplasia: strong prognostic indicator in postoperative follow up,” Gut 52:101-108, 2003;およびLecomte T et al. Detection of free-circulating tumor-associated DNA in plasma of colorectal cancer patients and its association with prognosis,” Int J Cancer 100:542-548, 2002;これらの文献それぞれの全内容は参照によって本明細書に組み込まれる)が挙げられる。
一部の態様では、多型または変異は特定の治療に対する反応の変化(たとえば有効性または副作用の増加または減少)に関連する。例としては、EGFRに基づく非小細胞肺癌治療に対する反応の低下に関するK−ras変異が挙げられる(Wang et al. “Potential clinical significance of a plasma-based KRAS mutation analysis in patients with advanced non-small cell lung cancer,” Clin Canc Res16:1324-1330, 2010;この文献の全内容は参照によって本明細書に組み込まれる)。
K−rasは多くの癌において活性化される癌遺伝子である。K−ras変異の例としては、コドン12、13、および61の変異である。無細胞DNAのK−ras変異は、膵臓癌、肺癌、結腸直腸癌、膀胱癌および胃癌において確認されている(Fleischhacker & Schmidt “Circulating nucleic acids (CNAs) and caner - a survey,” Biochim Biophys Acta 1775:181-232, 2007;この文献の全内容は参照によって本明細書に組み込まれる)。
p53は多くの癌において変異し腫瘍の進行に寄与する腫瘍抑制因子である(Levine & Oren “The first 30 years of p53: growing ever more complex. Nature Rev Cancer,” 9:749-758, 2009;この文献の全内容は参照によって本明細書に組み込まれる)。Ser249など多くの異なるコドンが変異し得る。無細胞DNAのp53変異は、乳癌、肺癌、卵巣癌、膀胱癌、胃癌、膵臓癌、結腸直腸癌、腸癌および肝細胞癌において確認されている(Fleischhacker & Schmidt “Circulating nucleic acids (CNAs) and caner - a survey,” Biochim Biophys Acta 1775:181-232, 2007;この文献の全内容は参照によって本明細書に組み込まれる)。
BRAFはRasの下流の癌遺伝子である。BRAF変異は膠細胞腫瘍、黒色腫、甲状腺癌および肺癌で確認されている(Dias-Santagata et al. BRAF V600E mutations are common in pleomorphic xanthoastrocytoma: diagnostic and therapeutic implications. PLOS ONE 2011;6:e17948, 2011; Shinozaki et al. Utility of circulating B-RAF DNA mutation in serum for monitoring melanoma patients receiving biochemotherapy. Clin Canc Res 13:2068-2074, 2007;およびBoard et al. Detection of BRAF mutations in the tumor and serum of patients enrolled in the AZD6244 (ARRY-142886) advanced melanoma phase II study. Brit J Canc 2009;101:1724-1730;これらの文献それぞれの全内容は参照によって本明細書に組み込まれる)。BRAFのV600E変異は、たとえば黒色腫腫瘍で発生し、進行期により多くみられる。V600E変異は無細胞DNAに検出されている。
EGFRは細胞増殖に寄与し、多くの癌で誤制御される(Downward J. Targeting RAS signalling pathways in cancer therapy. Nature Rev Cancer 3:11-22, 2003;およびLevine & Oren “The first 30 years of p53: growing ever more complex. Nature Rev Cancer,” 9:749-758, 2009(これらの文献の全内容は参照によって本明細書に組み込まれる))。EGFR変異の例としては、肺癌患者に確認されたエキソン18〜21の変異が挙げられる。無細胞DNAのEGFR変異が肺癌患者に確認されている(Jia et al. “Prediction of epidermal growth factor receptor mutations in the plasma/pleural effusion to efficacy of gefitinib treatment in advanced non-small cell lung cancer,” J Canc Res Clin Oncol 2010;136:1341-1347, 2010;この文献の全内容は参照によって本明細書に組み込まれる)。
乳癌に関連する多型または変異の例としては以下が挙げられる:マイクロサテライトのヘテロ接合性の消失(LOH)(Kohler et al. ”Levels of plasma circulating cell free nuclear and mitochondrial DNA as potential biomarkers for breast tumors,” Mol Cancer 8:doi:10.1186/1476-4598-8-105, 2009;この文献の全内容は参照によって本明細書に組み込まれる);p53変異(例えば、エキソン5〜8における変異)(Garcia et al.” Extracellular tumor DNA in plasma and overall survival in breast cancer patients,” Genes, Chromosomes & Cancer 45:692-701, 2006;この文献の全内容は参照によって本明細書に組み込まれる);HER2変異(Sorensen et al. “Circulating HER2 DNA after trastuzumab treatment predicts survival and response in breast cancer,” Anticancer Res30:2463-2468, 2010;この文献の全内容は参照によって本明細書に組み込まれる);PIK3CA、MED1、およびGAS6の多型または変異(Murtaza et al. “Non-invasive analysis of acquired resistance to cancer therapy by sequencing of plasma DNA,” Nature 2013;doi:10.1038/nature12065, 2013;この文献の全内容は参照によって本明細書に組み込まれる)。
無細胞DNAレベルとLOHの増加は、全生存期間および無病生存期間の減少に関連する。p53変異(エキソン5〜8)は全生存期間の減少に関連する。循環HER2無細胞DNAレベルの減少は、HER2陽性乳房腫瘍患者のHER2標的治療に対する、より良好な応答と関連する。PIK3CAの活性化変異、MED1の切断、およびGAS6のスプライシング変異は、治療に対する耐性をもたらす。
結腸直腸癌に関連する多型または変異の例としては、p53、APC、K−ras、およびチミジル酸合成酵素の変異、ならびにp16遺伝子のメチル化が挙げられる(Wang et al. “Molecular detection of APC, K-ras, and p53 mutations in the serum of colorectal cancer patients as circulating biomarkers,” World J Surg 28:721-726, 2004;Ryan et al. “A prospective study of circulating mutant KRAS2 in the serum of patients with colorectal neoplasia: strong prognostic indicator in postoperative follow up,” Gut 52:101-108, 2003;Lecomte et al. “Detection of free-circulating tumor-associated DNA in plasma of colorectal cancer patients and its association with prognosis,” Int J Cancer 100:542-548, 2002;Schwarzenbach et al. “Molecular analysis of the polymorphisms of thymidylate synthase on cell-free circulating DNA in blood of patients with advanced colorectal carcinoma,” Int J Cancer 127:881-888, 2009(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる))。術後の血清中でのK−ras変異の検出は疾患の再発の強力な予測因子である。K−ras変異およびp16遺伝子のメチル化の検出は、生存率の低下および疾患の再発率の増加に関連する。K−ras、APC、および/またはp53の変異の検出は、再発および/または転移と関連する。無細胞DNAを用いるチミジル酸合成酵素(フルオロピリミジンに基づく化学療法の標的)遺伝子における多型(LOH、SNP、縦列反復数の変動性、欠失など)は、治療反応と関連している可能性がある。
肺癌(非小細胞肺癌など)に関連する多型または変異の例としてはK−ras(コドン12の変異など)およびEGFRの変異が挙げられる。予後変異の例としては、全生存期間および無増悪生存期間の延長に関連するEGFR変異(エキソン19の欠失またはエキソン21の変異)が挙げられ、K−ras変異(コドン12および13)は、無増悪生存期間の延長に関連する(Jian et al. “Prediction of epidermal growth factor receptor mutations in the plasma/pleural effusion to efficacy of gefitinib treatment in advanced non-small cell lung cancer,” J Canc Res Clin Oncol 136:1341-1347, 2010;Wang et al. “Potential clinical significance of a plasma-based KRAS mutation analysis in patients with advanced non-small cell lung cancer,” Clin Canc Res 16:1324-1330, 2010(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる)。治療への応答を示す多型または変異の例としては、治療への応答を改善するEGFR変異(エキソン19の欠失またはエキソン21の変異)と、治療への応答を低下させるK−ras変異(コドン12および13)が挙げられる。抵抗性を付与するEFGR変異が確認されている(Murtaza et al. “Non-invasive analysis of acquired resistance to cancer therapy by sequencing of plasma DNA,” Nature doi:10.1038/nature12065, 2013;この文献の全内容は参照によって本明細書に組み込まれる)。
黒色腫(ブドウ膜黒色腫など)に関連する多型または変異の例としては、GNAQ、GNA11、BRAF、およびp53の変異が挙げられる。GNAQおよびGNA11の変異の例はR183変異およびQ209変異である。GNAQまたはGNA11のQ209変異は骨への転移に関連する。転移期/進行期の黒色腫患者ではBRAFのV600E変異を検出できる。BRAFのV600E変異は黒色腫の標識である。化学療法後のBRAFのV600E変異の存在は、治療反応がないことと関連する。
膵癌に関連する多型または変異の例としては、K−rasおよびp53の変異(たとえばp53Ser249)が挙げられる。p53Ser249はB型肝炎感染症および肝細胞癌、卵巣癌、非ホジキンリンパ腫にも関連する。
本発明の方法を用いれば、試料中に低頻度で存在する多型または変異も検出可能である。たとえば、100万分の1の頻度で存在する多型または変異を、1000万リードの配列決定を行うことで観測できる。必要に応じて、所望の感度のレベルに応じて配列決定リード数を変更できる。一部の態様では、配列決定リード数を増やして試料を再分析するか、対象者の別の試料を分析することによって感度を高めることができる。たとえば、癌または癌のリスク増加に関連する多型または変異が検出されないか少数(たとえば1個、2個、3個、4個、または5個)しか検出されない場合、その試料を再分析するか、別の試料を試験する。
一部の態様では、複数の多型または変異は癌または転移性癌の必要条件である。このような場合、複数の多型または変異についてスクリーニングすることにより、癌または転移性癌をより正確に診断できる。癌または転移性癌の必要条件である複数の多型の部分集合を対象者が有するような一部の態様では、対象者を後に再検査し、新たな変異が起こっていないかを確認できる。
複数の多型または変異が癌または転移性癌の必要条件であるような一部の態様では、それぞれの多型または変異の頻度を比較し、それらが同様の頻度で起こっているかを確認できる。たとえば、2つの変異(「A」および「B」とする)が癌の必要条件である場合、一部の細胞はいずれも有さず、一部の細胞はAを有し、一部はBを有し、一部はAとBを有する。AとBが同様の頻度で観測される場合、対象者はAもBも含む細胞を有する可能性がより高い。AとBが異なる頻度で観測される場合、対象者は異なる細胞集団を有する可能性がより高い。
複数の多型または変異が癌または転移性癌の必要条件であるような一部の態様では、対象者に存在するこのような多型または変異の数または同一性を用いて、その対象者が疾患または障害を有する尤度またはそれらを近いうちに有する尤度を予測できる。多型または変異が所定の順序で発生する傾向にあるような一部の態様では、対象者を定期的にスクリーニングし、他の多型または変異が起こったかどうかを確認してもよい。
一部の態様では、複数(たとえば2個、3個、4個、5個、8個、10個、12個、15個、またはそれ以上)の多型または変異の有無を決定することによって、癌などの疾患または障害、あるいは癌などの疾患または障害のリスク増加の有無の決定の感度および/または特異度が高くなる。
一部の態様では、多型または変異を直接検出する。一部の態様では、多型または変異を、その多型または変異に結合している1つ以上の配列(たとえばSNPなどの多型座位)を検出することにより、間接的に検出する。
核酸変化の例
一部の態様では、癌などの疾患または障害あるいは癌などの疾患または障害のリスク増加に関連するような、RNAまたはDNAの完全性の変化(断片化した無細胞RNAまたは無細胞DNAのサイズの変化、あるいはヌクレオソーム構成の変化)がある。一部の態様では、癌などの疾患または障害あるいは癌などの疾患または障害のリスク増加に関連するような、RNAまたはDNAのメチル化パターンの変化(たとえば腫瘍抑制遺伝子の過剰メチル化)がある。たとえば、腫瘍抑制遺伝子のプロモーター領域のCpG島のメチル化が局所的な遺伝子発現抑制を誘発すると示唆されている。肝臓癌、肺癌、乳癌の患者ではp16腫瘍抑制遺伝子の異常なメチル化が起こる。メチル化が起こりやすいその他の腫瘍抑制遺伝子(APC、Ras結合ドメインファミリータンパク質(RASSF1A)、グルタチオンS−転移酵素P1(GSTP1)、DAPKなど)は多様な種類の癌(たとえば、上咽頭癌、結腸直腸癌、肺癌、食道癌、前立腺癌、膀胱癌、黒色腫、急性白血病)で検出されている。p16などの特定の腫瘍抑制遺伝子のメチル化は、癌形成における初期事象と言われており、したがって早期癌検診に有用である。
一部の態様では、メチル化感受性制限酵素による消化を用いる亜硫酸水素塩変換または亜硫酸水素塩に基づかない手法でメチル化パターンを決定する(Hung et al., J Clin Pathol 62:308-313, 2009;この文献の全内容は参照によって本明細書に組み込まれる)。亜硫酸水素塩変換では、メチル化シトシンはシトシンのままであり、非メチル化シトシンはウラシルに変換される。メチル化配列は未変化のままであるが、メチル化感受性制限酵素(たとえばBstUI)は非メチル化DNA配列を特定の認識部位(たとえば、BstUIの場合は5’−CGVCG−3’)で切断する。一部の態様では、未変化のメチル化配列を検出する。一部の態様では、ステムループプライマーを用いて、制限酵素消化した非メチル化断片を選択的に増幅し、酵素消化していないメチル化DNAは共増幅しない。
mRNAスプライシングの変化の例
一部の態様では、mRNAスプライシングの変化は癌などの疾患または障害、あるいは癌などの疾患または障害のリスク増加に関連する。一部の態様では、mRNAスプライシングの変化は、癌または癌のリスク増加に関連する以下の核酸のうちの1つ以上に見られる:DNMT3B、BRCA1、KLF6、Ron、およびGemin5。一部の態様では、検出されたmRNAスプライス多様体は癌などの疾患または障害に関連する。一部の態様では、複数のmRNAスプライス多様体が健常細胞(非癌性細胞など)によって生成されるが、mRNAスプライス多様体の相対量の変化が癌などの疾患または障害に関連する。一部の態様では、mRNAスプライシングの変化はmRNA配列の変化(スプライス部位の変異など)、スプライシング因子のレベルの変化、利用できるスプライシング因子の量の変化(たとえば、スプライシング因子が反復配列に結合することによって利用可能なスプライシング因子の量が減少する)、スプライシング制御の変化、または腫瘍微小環境などに起因する。
スプライシング反応は、スプライソソームと呼ばれる、複数のタンパク質とRNAとの複合体によって行われる。(Fackenthal1 and Godley, Disease Models & Mechanisms 1: 37-42, 2008, doi:10.1242/dmm.000331;この文献の全内容は参照によって本明細書に組み込まれる)。スプライソソームは、イントロンとエキソンとの境界を認識し、介在するイントロンを2回のエステル転移反応で除去する。その結果、2個の隣接するエキソンは結合する。結合が正しく行われなければ、正常なタンパク質コード能力が損なわれるため、この反応の忠実度は精巧でなければならない。たとえば、翻訳中のアミノ酸の同一性や順序を指定する三塩基コドンの読み枠がエキソンの読み飛ばしによって保存された場合、選択的にスプライスされたmRNAは重要なアミノ酸残基を欠失したタンパク質を特定する可能性がある。より一般的には、エキソンを読み飛ばすと翻訳読み枠が中断され、未成熟終止コドンが生じる。これらのmRNAは、ナンセンス変異依存mRNA分解として知られる処理によって、一般的には少なくとも90%分解される。その結果、このような欠陥のあるメッセージが蓄積して切断型タンパク質産物を生成する可能性が低減される。ミススプライスされたmRNAがこの経路を回避すると、切断型、変異型、または不安定なタンパク質が生成される。
選択的スプライシングは、同じゲノムDNAから数種または多種の異なる転写物を発現する手段であり、特定のタンパク質について利用可能なエキソンの一部が含まれるため生じる。1つ以上のエキソンが排除されると、コードされたタンパク質からは特定のタンパク質ドメインが失われることになり、タンパク質機能の消失または獲得が起こることがある。数種類の選択的スプライシングが開示されている:エキソンの読み飛ばし;選択的5’スプライシング部位または選択的3’スプライス部位;相互排他的エキソン;イントロン保持(他に比べてはるかに珍しい)。他の研究者は、生物情報学的手法を用いて癌細胞と正常細胞における選択的スプライシングのレベルを比較し、癌が正常細胞よりも低レベルの選択的スプライシングを示すと決定した。さらに、選択的スプライシング事象の種類の分布は、癌細胞と正常細胞で異なった。癌細胞では正常細胞に比べてエキソンの読み飛ばしは少ないが選択的5’スプライス部位および選択的3’スプライス部位やイントロン保持は多いことが実証されている。エキソン化現象(他の組織によって主にイントロンとして使用される配列がエキソンとして使用されること)を試験すると、癌細胞におけるエキソン化に関連する遺伝子は、mRNAプロセシングと優先的に関連しており、癌細胞と異常mRNAスプライス形態の発生との間に直接的関係があることが示された。
DNAまたはRNAの濃度変化の例
一部の態様では、1種以上のDNA(無細胞DNA、無細胞ミトコンドリアDNA、無細胞核内DNA、細胞内DNA、ミトコンドリアDNAなど)またはRNA(無細胞RNA、細胞内RNA、細胞質RNA、コーディング細胞質RNA、非コーディング細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNAなど)の総量または総濃度に変化が見られる。一部の態様では1種以上の特定のDNA(無細胞DNA、無細胞ミトコンドリアDNA、無細胞核内DNA、細胞内DNA、ミトコンドリアDNAなど)またはRNA(無細胞RNA、細胞内RNA、細胞質RNA、コーディング細胞質RNA、非コーディング細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNAなど)の分子の量または濃度に変化が見られる。一部の態様では、1個のアレルは、対象座位にある別のアレルよりも多く発現する。例示のmiRNAは、遺伝子発現を制御する20〜22ヌクレオチドの短いRNA分子である。一部の態様では、トランスクリプトームに変化(1つ以上のRNA分子の同一性または量の変化など)が見られる。
一部の態様では、無細胞DNAまたは無細胞RNAの総量または濃度の増加は癌などの疾患または障害、あるいは癌などの疾患または障害のリスク増加に関連する。一部の態様では、ある種類のDNA(無細胞DNA、無細胞ミトコンドリアDNA、無細胞核内DNA、細胞内DNA、またはミトコンドリアDNAなど)またはRNA(無細胞RNA、細胞内RNA、細胞質RNA、コーディング細胞質RNA、非コーディング細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNAなど)の総濃度は、健常な(癌を有していない)対象者のその種類のDNAまたはRNAの総濃度に比べて少なくとも2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、またはそれ以上に増加する。一部の態様では、無細胞DNAの総濃度が75ng/mL〜100ng/mL、100ng/mL〜150ng/mL、150ng/mL〜200ng/mL、200ng/mL〜300ng/mL、300ng/mL〜400ng/mgL、400ng/mL〜600ng/mL、600ng/mL〜800ng/mL、800ng/mL〜1,000ng/mL(それぞれ、範囲の上限と下限を含む)、あるいは100ng/mL超であり、たとえば200ng/mL超、300ng/mL超、400ng/mL超、500ng/mL超、600ng/mL超、700ng/mL超、800ng/mL超、900ng/mL超、または1,000ng/mL超であることは、癌、癌のリスク増加、良性でなく悪性である腫瘍のリスク増加、癌が寛解する可能性の低下、あるいは癌の予後の悪化を示す。一部の態様では、癌などの疾患または障害、あるいは癌などの疾患または障害のリスク増加に関連する1つ以上の多型/変異(欠失または重複)を有するある種類のDNA(無細胞DNA、無細胞ミトコンドリアDNA、無細胞核内DNA、細胞内DNA、またはミトコンドリアDNAなど)またはRNA(無細胞RNA、細胞内RNA、細胞質RNA、コーディング細胞質RNA、非コーディング細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNAなど)の量は、その種類のDNAまたはRNAの総量の少なくとも2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、14%、16%、18%、20%、または25%である。一部の態様では、ある種類のDNA(無細胞DNA、無細胞ミトコンドリアDNA、無細胞核内DNA、細胞内DNA、またはミトコンドリアDNAなど)またはRNA(無細胞RNA、細胞内RNA、細胞質RNA、コーディング細胞質RNA、非コーディング細胞質RNA、mRNA、miRNA、ミトコンドリアRNA、rRNA、またはtRNAなど)の総量の少なくとも2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、14%、16%、18%、20%、または25%が、癌などの疾患または障害、あるいは癌などの疾患または障害のリスク増加に関連する特定の多型または変異(欠失または重複など)を有する。
一部の態様では、無細胞DNAを内包する。一部の態様では、無細胞DNAを内包しない。
一部の態様では、腫瘍DNAのDNA全体に対する比率(たとえば腫瘍の無細胞DNAの無細胞DNA全体に対する比率、または特定の変異を有する腫瘍の無細胞DNAの無細胞DNA全体に対する比率など)を決定する。一部の態様では、変異が一塩基多様体、コピー数多様体、示差的メチル化、またはそれらの組み合わせである可能性のある場合に、複数の変異について腫瘍DNAの比率を決定してもよい。一部の態様では、腫瘍率の計算値が最も高い1つの変異または変異の集合について計算した平均腫瘍率を、試料中の実際の腫瘍率とする。一部の態様では、すべての変異について計算した平均腫瘍率を試料中の実際の腫瘍率とする。一部の態様では、(腫瘍率が高いほど、進行した癌の段階と関連づけることができるため)この腫瘍率を用いて癌を病期分類する。一部の態様では、大きな腫瘍ほど血漿中の腫瘍DNA率と相関し得るため、腫瘍率を用いて癌をサイズ分類する。一部の態様では、腫瘍率を用いて1つ以上の変異を有する腫瘍の割合をサイズ分類する、というのは血漿中の腫瘍率の測定値と所定の変異遺伝型を有する組織のサイズとの間には相関があるかもしれないからである。たとえば、所定の変異遺伝型を有する組織のサイズは、特定の変異に着目して計算できる腫瘍DNAの比率と相関しているかも知れない。
データベースの例
本発明はさらに、本発明の方法から得た1つ以上の結果を含むデータベースを特徴とする。たとえば、データベースは、1人以上の対象者に関する以下のいずれかの情報を含む記録を有してもよい:確認された任意の多型/変異(CNVなど);多型/変異と疾患または障害、あるいは疾患または障害のリスク増加との任意の既知の関連性;コードされたmRNAまたはタンパク質の発現または活性レベルに対する多型/変異の影響;疾患または障害に関連するDNA、RNA、または細胞(たとえば、疾患または障害に関連する多型/変異を有するDNA、RNA、または細胞)の、試料中のDNA、RNA、または細胞全体に対する比率;多型/変異の確認に使用した試料(血液試料または特定の組織から得た試料など)の入手源;疾患細胞数;後の反復試験(たとえば疾患または障害の進行や寛解を監視するために試験を繰り返すこと)の結果;疾患または障害に関する他の試験の結果;対象者が診断された疾患または障害の種類;施される治療;その治療に対する反応;その治療の副作用;症状(疾患または障害に関連する症状など);寛解の長さと数;生存期間の長さ(最初の試験から死亡までの時間の長さ、または診断から死亡までの時間の長さなど);死因;およびそれらの組み合わせ。
一部の態様では、データベースは、1人以上の対象者に関する以下のいずれかの情報を含む記録を有する:確認された任意の多型/変異;多型/変異と癌または癌のリスク増加との任意の既知の関連性;コードされたmRNAまたはタンパク質の発現または活性レベルに対する多型/変異の影響;癌のDNA、RNA、または細胞の、試料中のDNA、RNA、または細胞全体に対する比率;多型/変異の確認に使用した試料(血液試料または特定の組織から得た試料など)の入手源;癌細胞数;腫瘍のサイズ;後の反復試験(たとえば癌の進行や寛解を監視するために試験を繰り返すこと)の結果;癌に関する他の試験の結果;対象者が診断された癌の種類;施される治療;その治療に対する反応;その治療の副作用;症状(癌に関連する症状など);寛解の長さと数;生存期間の長さ(最初の試験から死亡までの時間の長さ、または癌の診断から死亡までの時間の長さなど);死因;およびそれらの組み合わせ。一部の態様では、治療反応は以下のいずれかを含む:腫瘍(たとえば、良性腫瘍または癌性腫瘍)のサイズの縮小または安定;腫瘍のサイズ増大の遅れまたは防止;腫瘍細胞数の低下または安定;腫瘍の消失から再発までの無病生存期間の延長;最初または後の腫瘍発生の予防;腫瘍に関連する有害な症状の低減または安定化;またはそれらの組み合わせ。一部の態様では、癌などの疾患または障害に関する1つ以上の他の試験の結果(たとえば、スクリーニング検査、医用画像、または組織試料の顕微鏡検査の結果)が含まれる。
このような一側面では、本発明は、少なくとも5個、10個、10個、10個、10個、10個、10個、10個、10個、またはそれ以上の記録を含む電子データベースを特徴とする。一部の態様では、データベースは少なくとも5人、10人、10人、10人、10人、10人、10人、10人、10人、またはそれ以上の異なる対象者に関する記録を含む。
別の態様では、本発明は、本発明のデータベースとユーザインタフェースとを含むコンピュータを特徴とする。一部の態様では、ユーザインタフェースは、1つ以上の記録に含まれている情報の一部またはすべてを表示可能である。一部の態様では、ユーザインタフェースは、以下を表示できる:(i)コンピュータに記録が保存されている多型または変異を含むと確認された1つ以上の癌の種類;(ii)コンピュータに記録が保存されている特定の種類の癌において確認された1つ以上の多型または変異;(iii)コンピュータに記録が保存されている特定の種類の癌あるいは特定の多型または変異に関する予後情報;(iv)コンピュータに記録が保存されている多型または変異を有する癌に対して有用な1つ以上の化合物またはその他の治療法;(v)コンピュータに記録が保存されているmRNAまたはタンパク質の発現または活性を調節する1つ以上の化合物;ならびに(vi)コンピュータに記憶された化合物によって発現または活性が調節される1つ以上のmRNA分子またはタンパク質。コンピュータの内部構成要素としては、一般的に、メモリに接続されたプロセッサが挙げられる。外部構成要素としては、通常、大容量記憶装置(たとえばハードディスクドライブ)と;ユーザ入力装置(たとえば、キーボードおよびマウス)と;ディスプレイ(たとえばモニター)と;コンピュータシステムを他のコンピュータに接続してデータの共有およびタスク処理を可能にするネットワークリンクとを含む。操作中、プログラムをこのシステムのメモリにロードしてもよい。
別の態様では、本発明は本発明のいずれかの方法の1つ以上の工程を含む、コンピュータで実行される処理を特徴とする。
リスク因子の例
一部の態様では、癌などの疾患または障害に関する1つ以上のリスク因子についても対象者を評価する。リスク因子の例としては、その疾患または障害に関する家族歴、生活習慣(喫煙、発癌性物質への暴露など)、1種以上のホルモンまたは血清タンパク質(肝癌ではα胎児性タンパク質(AFP)、結腸直腸癌では癌胎児性抗原(CEA)、あるいは前立腺癌では前立腺特異抗原(PSA))のレベルが挙げられる。一部の態様では、腫瘍のサイズおよび/または数を測定し、対象者の予後の決定または対象者への治療の選択に用いる。
スクリーニング方法の例
必要に応じ、癌などの疾患または障害の有無を確認でき、あるいは、癌などの疾患または障害を任意の標準の方法で分類できる。たとえば、癌などの疾患または障害は、特定の徴候と症状の存在、腫瘍生検、スクリーニング検査、または医用画像(乳房X線像または超音波画像など)などの複数の方法で検出可能である。可能性のある癌が検出されると、それを組織試料の顕微鏡検査で診断してもよい。一部の態様では、診断を受けた対象者は、その疾患または障害の進行あるいは寛解または再発を監視するために、その疾患または障害について本発明の方法または既知の試験による反復試験を複数の時点で受ける。
癌の例
本発明のいずれかの方法で診断、予知、安定化、治療、または予防できる癌の例としては、固形腫瘍、癌腫、肉腫、リンパ腫、白血病、胚細胞腫瘍、または芽細胞腫が挙げられる。様々な態様では、癌は、急性リンパ性白血病、急性骨髄性白血病、副腎皮質癌、AIDS関連癌、AIDS関連リンパ腫、肛門癌、虫垂癌、星細胞腫(小児小脳星細胞腫または小児大脳星細胞腫)、基底細胞癌、胆管癌(肝外胆管癌など)、膀胱癌、骨腫瘍(骨肉腫または悪性線維性組織球腫など)、脳幹神経膠腫、脳癌(小脳星細胞腫、大脳星細胞腫/悪性神経膠腫、上衣腫、髄芽腫、テント上原始神経外胚葉性腫瘍、または視経路および視床下部神経膠腫(visual pathway and hypothalamic glioma)など)、膠芽腫、乳癌、気管支腺腫または気管支カルチノイド、バーキットリンパ腫、カルチノイド腫瘍(小児カルチノイド腫瘍または消化管カルチノイド腫瘍など)、癌腫、中枢神経系リンパ腫、小脳星細胞腫または小脳悪性神経膠腫(小児小脳星細胞腫または小児小脳悪性神経膠腫など)、子宮頚癌、小児癌、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖性疾患、直腸癌、皮膚T細胞性リンパ腫、線維形成性小円形細胞腫瘍、子宮内膜癌、上衣腫、食道癌、ユーイング肉腫、ユーイング腫瘍ファミリーの腫瘍、頭蓋外胚細胞腫瘍(小児頭蓋外胚細胞腫瘍など)、性腺外生殖細胞腫瘍、眼癌(眼球内黒色腫または網膜芽細胞腫、眼癌など)、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胚細胞腫瘍(頭蓋外胚細胞腫瘍、性腺外生殖細胞腫瘍、または卵巣胚細胞腫瘍など)、妊娠性絨毛性疾患腫瘍、神経膠腫(脳幹神経膠腫、小児大脳星細胞腫、または小児視経路および視床下部神経膠腫など)、胃カルチノイド、有毛細胞白血病、頭頚部癌、悪性心臓腫瘍(heart cancer)、肝細胞(肝臓)癌、ホジキンリンパ腫、下咽頭癌、視床下部および視経路神経膠腫(小児視経路神経膠腫)、島細胞癌(内分泌島細胞癌または膵島細胞癌など)、カポジ肉腫、腎癌、咽頭癌、白血病(たとえば急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、または有毛細胞白血病)、口唇癌または口腔癌、脂肪肉腫、肝癌(非小細胞癌または小細胞癌など)、肺癌、リンパ腫(AIDS関連リンパ腫、バーキットリンパ腫、皮膚T細胞性リンパ腫、ホジキンリンパ腫、非ホジキンリンパ腫、または中枢神経系リンパ腫など)、マクログロブリン血症(ワルデンシュトレーム・マクログロブリン血症、骨悪性線維性組織球腫または骨肉腫、髄芽腫(小児髄芽腫など)、黒色腫、メルケル細胞癌、中皮腫(成人または小児中皮腫)、潜伏性口腔癌を伴う転移頚部扁平上皮癌、多発性内分泌腫瘍症候群(小児多発性内分泌腫瘍症候群など)、多発性骨髄腫または形質細胞腫瘍、菌状息肉症、骨髄異形成症候群、骨髄異形成または骨髄増殖性疾患、骨髄性白血病(慢性骨髄性白血病など)、骨髄性白血病(成人急性骨髄性白血病または小児急性骨髄性白血病など)、骨髄増殖性疾患(慢性骨髄増殖性疾患など)、鼻腔癌または副鼻腔癌、上咽頭癌、神経芽腫、口腔癌、中咽頭癌、骨肉腫または骨悪性線維性組織球腫、卵巣癌、卵巣上皮癌、卵巣胚細胞腫瘍、卵巣低悪性度腫瘍、膵癌(膵島細胞癌など)、副鼻腔癌または鼻腔癌、副甲状腺癌、陰茎癌、咽頭癌、褐色細胞腫、松果体星細胞腫、松果体胚細胞腫、松果体芽腫またはテント上原始神経外胚葉性腫瘍(小児松果体芽腫または小児テント上原始神経外胚葉性腫瘍など)、下垂体腺腫、形質細胞腫、胸膜肺芽腫、原発性中枢神経系リンパ腫、癌、直腸癌、腎細胞癌、尿管癌(腎盂移行上皮癌または尿管移行上皮癌など)、網膜神経膠腫、横紋筋肉腫(小児横紋筋肉腫など)、唾液腺癌、肉腫(ユーイング腫瘍ファミリーの肉腫、カポジ肉腫、軟部肉腫、または子宮肉腫など)、セザリー症候群、皮膚癌(非黒色腫皮膚癌、黒色腫、またはメルケル細胞皮膚癌など)、小腸癌、扁平上皮癌、テント上原始神経外胚葉性腫瘍(小児テント上原始神経外胚葉性腫瘍など)、T細胞リンパ腫(皮膚T細胞リンパ腫など)、精巣癌、咽頭癌、胸腺腫(小児胸腺腫など)、胸腺腫または胸腺癌、甲状腺癌(小児甲状腺癌など)、絨毛性腫瘍(妊娠性絨毛性腫瘍など)、原発不明癌(成人または小児の原発不明癌など)、尿道癌(子宮内膜癌、子宮癌など)、子宮肉腫、腟癌、視経路および視床下部神経膠腫(小児視経路および視床下部神経膠腫など)、外陰癌、ワルデンシュトレーム・マクログロブリン血症、あるいはウィルムス腫瘍(小児ウィルムス腫瘍など)である。様々な態様では、癌は転移した癌または転移していない癌である。
癌は、ホルモン関連癌またはホルモン依存性癌(たとえば、エストロゲン関連癌またはアンドロゲン関連癌)であってもなくてもよい。本発明の方法および/または組成物を使用して良性腫瘍または悪性腫瘍を診断、予知、安定化、治療、または予防してもよい。
一部の態様では、対象者は癌症候群を有する。癌症候群は1つ以上の遺伝子における遺伝的変異により、影響を受けた個体が癌を発症しやすくなる遺伝的障害であり、これらの癌の発症を早めることもある。癌症候群は多くの場合、癌の発症だけでなく複数の独立した原発腫瘍の生涯の発症リスクを高める。これらの症候群の多くは、細胞の癌細胞化の予防に関与する腫瘍抑制遺伝子の変異によって引き起こされる。影響を受ける可能性のある他の遺伝子はDNA修復遺伝子、癌遺伝子、および血管の生成(血管新生)に関与する遺伝子である。遺伝性癌症候群の一般例は、遺伝性乳癌・卵巣癌症候群、および遺伝性非ポリポーシス大腸癌(リンチ症候群)である。
一部の態様では、1つ以上の多型または変異をK−ras、p53、BRA、EGFR、またはHER2に有する対象者に、それぞれK−ras、p53、BRA、EGFR、またはHER2を標的とする治療を施す。
本発明の方法は、任意の種類の細胞、組織、または器官の悪性または良性の腫瘍の治療に一般的に応用できる。
治療法の例
必要に応じ、癌などの疾患または障害、あるいは癌などの疾患または障害のリスク増加を安定化、治療、または予防するための任意の治療法を対象者(たとえば、本発明のいずれかの方法で癌または癌のリスクを有すると確認された対象者)に施すことができる。様々な態様では、治療法は癌などの疾患または障害に対する既知の治療法または併用療法(細胞毒性薬、標的治療、免疫療法、ホルモン治療、放射線治療、癌細胞または癌細胞になる可能性のある細胞の除去手術、幹細胞移植、骨髄移植、光線力学治療、対症療法、またはそれらの組み合わせなど)である。一部の態様では、治療(予防的薬物療法など)によって、癌などの疾患または障害のリスクの高い対象者の癌などの疾患または障害を予防し、その進行を遅らせ、あるいは重症度を低下させる。
一部の態様では、標的治療は、癌の増殖と生存に寄与する、癌の特異的な遺伝子、タンパク質、または組織環境を標的とする治療法である。この種の治療は、癌細胞の増殖と拡散を阻害しつつ正常細胞の損傷を制限し、通常、他の癌薬物療法よりも副作用が少なくなる。
より多く成功している方法の1つは、腫瘍周辺の血管新生(新しい血管の増殖)を標的とすることであった。ベバシズマブ(アバスチン(登録商標))、レナリドミド(レブラミド(登録商標))、ソラフェニブ(ネクサバール(登録商標))、スニチニブ(スーテント(登録商標))、サリドマイド(サロミド(登録商標))などの標的治療は血管新生を妨害する。別の例は、HER2を過剰発現する癌(一部の乳癌など)に対するHER2標的治療(トラスツズマブまたはラパチニブなど)の利用である。一部の態様では、モノクローナル抗体を用いて癌細胞外部で特定の標的を阻害する。その例は、アレムツズマブ(キャンパス−1H(登録商標))、ベバシズマブ、セツキシマブ(アービタックス(登録商標))、パニツムマブ(ベクティビックス(登録商標))、ペルツズマブ(オムニターグ(登録商標))、リツキシマブ(リツキサン(登録商標))、およびトラスツズマブである。一部の態様では、モノクローナル抗体トシツモマブ(ベキサール(登録商標))を用いて腫瘍を放射線照射する。一部の態様では、経口小分子が癌細胞内部の癌の過程を阻害する。例としては、ダサチニブ(スプリセル(登録商標))、エルロチニブ(タルセバ(登録商標))、ゲフィチニブ(イレッサ(登録商標))、イマチニブ(グリベック(登録商標))、ラパチニブ(タイカーブ(登録商標))、ニロチニブ(タシグナ(登録商標))、ソラフェニブ、スニチニブ、テムシロリムス(トーリセル(登録商標))が挙げられる。一部の態様では、プロテアソーム阻害剤(多発性骨髄腫薬ボルテゾミブ(ベルケイド(登録商標)))は、細胞内の他のタンパク質を分解する酵素と呼ばれる特殊なタンパク質を妨害する。
一部の態様では、癌と闘うために本来の生体防御力を高めるように免疫療法を設計する。例示の免疫療法の種類では、体内で産生された物質または研究室で生成された物質を用いて免疫系機能を増強、標的化、または回復する。
一部の態様では、ホルモン治療によって体内のホルモン量を低下させて癌を治療する。一部の乳癌や前立腺癌などの数種類の癌は、ホルモンと呼ばれる生体内の天然化学物質の存在下で増殖し拡散する。様々な態様では、ホルモン療法によって前立腺癌、乳癌、甲状腺癌、および生殖器系の癌を治療する。
一部の態様では、治療は、罹患した骨髄を造血幹細胞と呼ばれる非常に特殊な細胞で置き換える幹細胞移植を含む。造血幹細胞は血流中と骨髄に見られる。
一部の態様では、治療は、光増感剤と呼ばれる特殊な薬剤を光と共に用いて癌細胞を殺す光線力学療法を含む。これらの薬剤は、ある種の光で活性化されると作用する。
一部の態様では、治療は、癌細胞または癌細胞になる可能性のある細胞の除去手術(腫瘍摘出術または乳房切除術など)を含む。たとえば、乳癌感受性遺伝子の変異(BRCA1またはBRCA2遺伝子変異)を有する女性は、リスク低減卵管卵巣摘出術(卵管および卵巣の除去)および/またはリスク低減両側乳房切除(両乳房の除去)によって乳癌および卵巣癌のリスクを低減することができる。一部の癌の治療を含む非常に慎重な外科手術には、非常に強力で精密な光線であるレーザーを刃(メス)の代わりに用いることができる。
癌の進行を遅らせる、阻止する、または除去する治療(疾患標的治療ともいう)に加え、癌治療の重要な部分は、対象者の症状と疼痛や嘔気などの副作用を軽減することである。これには、対象者の身体的、感情的、社会的な欲求を支援すること、すなわち緩和ケアまたは支持療法と呼ばれる方法が含まれる。多くの場合、患者は疾患標的治療と症状を緩和するための治療を同時に受ける。
例示の治療には以下が含まれる:アクチノマイシンD、アドセトリス(登録商標)、アドリアマイシン、アルデスロイキン、アレムツズマブ、アリムタ(登録商標)、Amsidine(登録商標)、アムサクリン、アナストロゾール、アレジア(登録商標)、アリミデックス(登録商標)、アロマシン(登録商標)、アスパラギナーゼ、アバスチン(登録商標)、ベバシズマブ、ビカルタミド、ブレオマイシン、Bondronat(登録商標)、Bonefos(登録商標)、ボルテゾミブ、Busilvex(登録商標)、ブスルファン、カンプト(登録商標)、カペシタビン、カルボプラチン、カルムスチン、カソデックス(登録商標)、セツキシマブ、Chimax(登録商標)、クロランブシル、シメチジン、シスプラチン、クラドリビン、クロドロン酸、クロファラビン、クリサンタスパーゼ、シクロホスファミド、酢酸シプロテロン、Cyprostat(登録商標)、シタラビン、シトキサン(登録商標)、Dacarbozine、ダクチノマイシン、ダサチニブ、ダウノルビシン、デキサメタゾン、ジエチルスチルベストロール、ドセタキセル、ドキソルビシン、Drogenil(登録商標)、Emcyt(登録商標)、エピルビシン、Eposin(登録商標)、アービタックス(登録商標)、エルロチニブ、Estracyte(登録商標)、エストラムスチン、Etopophos(登録商標)、エトポシド、Evoltra(登録商標)、エキセメスタン、フェアストン(登録商標)、フェマーラ(登録商標)、フィルグラスチム、フルダラ(登録商標)、フルダラビン、フルオロウラシル、フルタミド、ゲフィチニブ、ゲムシタビン、ジェムザール(登録商標)、グリベック(Gleevec, Glivec)(登録商標)、Gonapeptyl Depot(登録商標)、ゴセレリン、ハラベン(登録商標)、ハーセプチン(登録商標)、Hycamptin(登録商標)、ヒドロキシカルバミド、イバンドロン酸、イブリツモマブ、イダルビシン、イフォスファミド、インターフェロン、メシル酸イマチニブ、イレッサ(登録商標)、イリノテカン、ジェブタナ(登録商標)、Lanvis(登録商標)、ラパチニブ、レトロゾール、リューケラン(登録商標)、リュープリン(登録商標)、Leustat(登録商標)、ロムスチン、マブキャンパス(登録商標)、マブセラ(登録商標)、Megace(登録商標)、メゲストロール、メトトレキサート、ミトキサントロン、マイトマイシン、Mutulane、ミレラン(登録商標)、ナベルビン(登録商標)、Neulasta(登録商標)、ニューポジェン(登録商標)、ネクサバール(登録商標)、Nipent(登録商標)、ノルバデックスD(登録商標)、ノバントロン(登録商標)、オンコビン(登録商標)、パクリタキセル、パミドロン酸、PCV、ペメトレキセド、ペントスタチン、パージェタ(登録商標)、プロカルバジン、プロベンジ(登録商標)、プレドニゾロン、Prostrap(登録商標)、ラルチトレキセド、リツキシマブ、スプリセル(登録商標)、ソラフェニブ、Soltamox(登録商標)、ストレプトゾシン、スチルベストロール、Stimuvax(登録商標)、スニチニブ、スーテント(登録商標)、Tabloid(登録商標)、タガメット(登録商標)、Tamofen(登録商標)、タモキシフェン、タルセバ(登録商標)、タキソール(登録商標)、タキソテール(登録商標)、テガフール・ウラシル、テモダール(登録商標)、テモゾロミド、サリドマイド、Thioplex(登録商標)、チオテパ、チオグアニン、Tomudex(登録商標)、トポテカン、トレミフェン、トラスツズマブ、トレチノイン、トレオスルファン、トリエチレンホスホラミド、トリプトレリン、タイバーブ(登録商標)、Uftoral(登録商標)、ベルケイド(登録商標)、ベプシド(登録商標)、ベサノイド(登録商標)、ビンクリスチン、ビノレルビン、ザーコリ(登録商標)、ゼローダ(登録商標)、ヤーボイ(登録商標)、ザクティマ(登録商標)、ザノサー(登録商標)、Zavedos(登録商標)、Zevelin、ゾラデックス(登録商標)、ゾレドロン酸、ゾメタ(登録商標)(ゾレドロン酸)、およびザイティガ(登録商標)。
対象者がmRNAまたはタンパク質の変異型(たとえば癌に関連する型)と野生型(たとえば癌に関連しない型)両方を発現する場合、治療は、野生型の発現または活性の阻害に比べて変異型の発現または活性を少なくとも2倍、5倍、10倍、または20倍阻害することが好ましい。複数の治療薬を同時または逐次的に使用することによって癌の発生を著しく低減し、治療を受け治療抵抗性になる癌の数を減少させることができる。さらに、併用療法の一部として用いられる治療薬は、その治療薬を単独使用する場合の相当用量に比べて癌の治療に必要な用量が少ない。併用療法では各化合物の用量が少ないため、化合物が起こし得る有害な副作用の重症度が低減される。
一部の態様では、癌のリスク増加を有すると確認された対象者は、特定のリスク因子を回避するか生活習慣を変えることで、それ以上の何らかの癌リスクを低減することができる。
一部の態様では、多型、変異、リスク因子、またはそれらの任意の組み合わせを用いて対象者の治療計画を選択する。一部の態様では、対象者の癌のリスクが高いほど、あるいは予後が悪いほど、多い用量または多数の治療法を選択する。
単独療法または併用療法に用いるその他の化合物
必要に応じ、癌などの疾患または障害、あるいは癌などの疾患または障害のリスク増加を安定化、治療、または予防するための追加の化合物は、天然の産物と合成(または半合成)抽出物の大きなライブラリ、または化合物ライブラリから、当業者に公知の方法に従って特定することができる。創薬・医薬品開発の分野の当業者には明らかであるが、試験抽出物や化合物の正確な入手源は本発明の方法にとって決定的ではない。したがって、実質的にはあらゆる数の化学抽出物または化合物を、特定の種類の癌または特定の対象者の細胞に対する効果、あるいは癌関連分子(たとえば、特定の種類の癌で活性または発現が変化したことがわかっている癌関連分子)の活性または発現に対する効果について、スクリーニングすることができる。粗抽出物が癌関連分子の活性または発現を調節するとわかれば、当技術分野で公知の方法で陽性の先導抽出物をさらに分画し、観測された効果の原因となる化学成分を単離してもよい。
治療法を試験するための試験法および動物モデルの例
本明細書に開示する治療法のうちの1つ以上を、癌などの疾患または障害に及ぼす影響について、細胞株(たとえば、癌または癌のリスク増加を有すると診断された対象で確認された1つ以上の変異を有する細胞株)あるいはその疾患または障害の動物モデル(SCIDマウスモデルなど)を用いて試験することができる(Jain et al., Tumor Models In Cancer Research, ed. Teicher, Humana Press Inc., Totowa, N.J., pp. 647-671, 2001;この文献の全内容は参照によって本明細書に組み込まれる)。また、癌などの疾患または障害、あるいは癌などの疾患または障害のリスクの増加を安定化、治療、または予防するための特定の治療の有効性を決定するのに使用できる標準の試験法および動物モデルは多数存在する。ヒトを対象とする標準の臨床試験で治療を試験することもできる。
特定の対象者に対し好ましい治療を選択するために、対象者で変異している1つ以上の遺伝子の発現または活性に対する化合物の効果を試験することができる。たとえば、特定のmRNA分子またはタンパク質の発現を調節する化合物の能力を、標準的なノーザン分析、ウエスタン分析、またはマイクロアレイ分析を用いて検出できる。一部の態様では、(i)対象者で(たとえば対象者から採取した試料で)正常レベルよりも発現レベルまたは活性レベルの高い、癌を促進するmRNA分子またはタンパク質の発現または活性を阻害するか、(ii)対象者で正常レベルよりも発現レベルまたは活性レベルの低い、癌を阻害するmRNA分子またはタンパク質の発現または活性を促進する、1種以上の化合物を選択する。(i)対象者の、癌に関連する変異を有するmRNA分子またはタンパク質の最大数を調節し、かつ(ii)対象者の、癌に関連する変異を有さないmRNA分子またはタンパク質の最小数を調節する、単独療法または併用療法を選択する。一部の態様では、選択された単独療法または併用療法は高い薬物有効性を有し、有害な副作用を起こしたとしてもごくわずかにしか起こさない。
上記の対象者に特異的な分析の代わりに、DNAチップを用いて特定の種類の初期または後期の癌(たとえば乳癌細胞)でのmRNA分子の発現を正常組織での発現と比較することができる(Marrack et al., Current Opinion in Immunology 12, 206-209, 2000;Harkin, Oncologist. 5:501-507, 2000;およびPelizzari et al., Nucleic Acids Res. 28(22):4577-4581, 2000(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる))。この分析に基づいて、その種類の癌で発現量が変化するmRNAまたはタンパク質の発現を調節するように、この種類の癌を有する対象者に対する単独療法または併用療法を選択できる。
発現特性は、特定の対象者または対象者群の治療法の選択に使用できるだけでなく、治療中に起こるmRNAおよび/またはタンパク質発現の変化の監視にも使用できる。例えば、発現特性を用いて、癌関連遺伝子の発現が正常レベルに戻ったかどうかを決定し、戻っていない場合には、治療に含まれる1種以上の化合物の用量を、対応する癌関連遺伝子の発現レベルに対する治療の効果を増減するように変更することができる。また、この分析は、治療が他の遺伝子(たとえば、有害な副作用に関連する遺伝子)の発現に影響を及ぼすかどうかを決定するために使用できる。必要に応じて、望ましくない副作用を予防または軽減するために、治療の用量または組成を変更することができる。
製剤と投与法の例
癌などの疾患または障害、あるいは癌などの疾患または障害のリスク増加を安定化、治療、あるいは予防するために、組成物を当業者に公知の任意の方法をで製剤かつ投与できる(たとえば、米国特許第8,389,578号明細書および米国特許第8,389,557号明細書を参照;これらの文献それぞれの全内容は参照によって本明細書に組み込まれる)。製剤および投与のための一般的な技術は"Remington: The Science and Practice of Pharmacy,” 21st Edition, Ed. David Troy, 2006, Lippincott Williams & Wilkins, Philadelphia, Paに記載されている(この文献の全内容は参照によって本明細書に組み込まれる)。液剤、懸濁剤、錠剤、カプセル剤、丸剤、散剤、顆粒剤、ゲル剤、軟膏剤、坐剤、注射剤、吸入剤、および噴霧剤がこのような製剤の例である。例えば、当技術分野で公知の別の方法も用いて徐放性の経口製剤を調製することができる。たとえば、有効成分の適切な徐放性剤形は、基質錠剤(matrix tablet)またはカプセル剤組成物であってもよい。基質を形成する適切な材料としては、たとえば、ワックス類(たとえば、カルナウバロウ、ミツロウ、パラフィンワックス、セレシン、シェラックワックス、脂肪酸、脂肪アルコールなど)、油、硬化油脂(たとえば、硬化ナタネ油、硬化ヒマシ油、硬化牛脂、硬化ヤシ油、硬化ダイズ油)、および重合体(たとえばヒドロキシプロピルセルロース、ポリビニルピロリドン、ヒドロキシプロピルメチルセルロース、ポリエチレングリコールなど)などが挙げられる。他の適切な基質錠剤材料としては、微結晶性セルロース、粉末セルロース、ヒドロキシプロピルセルロース、エチルセルロースと、他の担体と賦形剤である。錠剤は顆粒、被覆粉末、またはペレットを含んでもよい。錠剤は多層型であってもよい。必要に応じ、完成した錠剤を被覆してもよいししなくてもよい。
このような組成物の一般的な投与経路としては、経口投与、舌下投与、口腔投与、局所投与、経皮投与、吸入投与、非経口投与(たとえば皮下、静脈内、筋肉内、あるいは胸骨内の注射または点滴技術)、直腸投与、膣投与、鼻腔内投与が挙げられるがこれらに限定するものではない。好ましい態様では、治療は徐放装置を用いて実行される。本発明の組成物は、組成物に含有される活性成分が組成物の投与時に生物学的に利用可能であるように処方される。組成物は、1つ以上の投与単位の形態をとってもよい。組成物は、1種、2種、3種、4種、またはそれ以上の活性成分を含有してもよく、必要に応じて1種、2種、3種、4種、またはそれ以上の不活性成分を含有してもよい。
代替的な態様
本明細書に記載の任意の方法は、物理的な形式(コンピュータ画面、または紙への印刷)のデータ出力を含んでもよい。本発明の任意の方法を、医師がそれに基づいて判断できるような形式で、すぐ使用可能なデータを出力することと組み合わせてもよい。本明細書に記載した対象個体に関する遺伝データ決定の一部の態様を、出生前診断の状況での胎児の潜在的な染色体異常(欠失または重複など)またはそれがないことを(必要に応じて、中絶するかしないかの判断と組み合わせて)医療専門家が通知することと組み合わせてもよい。本明細書に記載の態様の一部を、すぐ使用可能なデータを出力し、臨床治療を行うという臨床判断をすること、または行わないという臨床判断をすることと組み合わせてもよい。
一部の態様で、本発明の任意の方法の結果(たとえば、欠失または重複の有無)を開示する報告を作成する方法を本明細書に記載する。本発明の方法で得た結果を含む報告を作成してもよく、それを医師に電子送信してもよいし、出力装置(デジタル式の報告)に表示してもよい。あるいは、文書での報告書(たとえば報告書の印刷物)を医師に提供してもよい。また、記載した方法を、臨床治療を行うという臨床判断を実際にすること、または何もしないという臨床判断をすることと組み合わせてもよい。
特定の態様では、本発明は、本明細書に開示された多重PCR法を用いて同一の試料からCNVとSNVの両方を検出するための試薬、キット、方法、ならびにこのような方法を実行するためのコード化された命令を有するコンピュータシステムおよびコンピュータ媒体を提供する。特定の好ましい形態では、試料は、循環腫瘍DNAを含むと考えられる単一細胞試料または血漿試料である。これらの態様は、本明細書に開示された高感度多重PCR法を用いてCNVおよびSNVについて単一細胞または血漿から得たDNA試料を調べることにより、特にCNVを示す癌(乳癌、卵巣癌、肺癌など)の場合に、CNVまたはSNVのいずれかについて個々に調査する場合に比べて癌の検出を改善できるという発見を活用する。特定の例示的態様によるCNV分析法は、50個〜100,000個、50個〜10,000個、または50個〜1,000個のSNPについて調査し、SNV分析法は、50個〜1000個のSNVまたは50個〜500個のSNV、あるいは50個〜250個のSNVについて調べる。本明細書に記載の、癌(たとえば、乳癌、肺癌、卵巣癌など、CNVをおよびSNVを示すとわかっている癌)を有すると考えられる対象者の血漿でCNVおよび/またはSNVを検出する方法は、遺伝的構成の観点で不均質な癌細胞集団で構成されることの多い腫瘍のCNVおよび/またはSNVを検出するという利点を提供する。したがって、特定の腫瘍領域のみの分析に着目する従来の方法は多くの場合、他の腫瘍領域に存在するCNVまたはSNVを見落とす可能性がある。血漿試料は、任意のCNVおよび/またはSNVを検出するために調査できる液体細胞診試料として機能する。
コンピュータアーキテクチャの例
図69は、本発明の態様を実行するのに有用な例示のシステム構造X00を示す。システム構造X00は、1つ以上の研究所情報システム(「LIS」)X04に接続された分析プラットフォームX08を含む。図69に示すように、分析プラットフォームX08は、ネットワークX02を通じてLIS X04に接続されてもよい。ネットワークX02は、1つ以上のネットワークタイプ(LAN、WAN、インターネットなどの任意の組み合わせを含む)の1つ以上のネットワークを含んでもよい。ネットワークX02は、システム構造X00のいずれかまたはすべての構成要素間の接続を含んでもよい。分析プラットフォームX08は、代替的または追加的にLIS X06に直接接続されてもよい。一態様では、分析プラットフォームX08は、LIS X04からサービス型ソフトウェア(software-as-as-service)の様式で提供された遺伝データを分析し(LIS X04は第三者LISである)、また、分析プラットフォームX08は、LIS X06から完全サービス(full-service)様式または自己完結(in-house)様式で提供された遺伝データを分析する(LIS X06と分析プラットフォームX08は同じ当事者に管理される)。分析プラットフォームX08がネットワークX02を通じて情報を提供する一態様では、分析プラットフォームX08はサーバであってもよい。
一態様では、例示の研究所情報システムX04は、遺伝データを収集、管理、かつ/または保存する1つ以上の公的機関または私的機関を含む。関連技術の当業者には明らかであるが、遺伝データを保護する方法または規格は公知であり、情報セキュリティの様々な技術とポリシー(たとえばユーザ名/パスワード、トランスポート・レイヤー・セキュリティ(Transport Layer Security; TLS)、セキュア・ソケット・レイヤー(Secure Sockets Layer; SSL)、および/または通信セキュリティを提供するその他の暗号化プロトコル)を利用して実行可能である。
一態様では、例示のシステム構造X00は、サービス指向アーキテクチャとして動作し、クライアントサーバモデルを使用する。関連分野の当業者には明らかであるが、クライアントサーバモデルによってLIS X04と分析プラットフォームX08は多様な形態で相互作用できる。システムアーキテクチャX00は、多様なタイプのネットワークX02上に分散されてもよく、かつ/またはクラウド・コンピューティング・アーキテクチャとして動作してもよい。クラウド・コンピューティング・アーキテクチャは、任意のタイプの分散型ネットワークアーキテクチャを含んでもよい。一例として、クラウド・コンピューティング・アーキテクチャは、サービス型ソフトウェア(software as a service; SaaS)、サービス型インフラストラクチャ(infrastructure as a service; IaaS)、サービス型プラットフォーム(platform as a service; PaaS)、サービス型ネットワーク(network as a service; NaaS)、サービス型データ(data as a service; DaaS)、サービス型データベース(database as a service; DBaaS)、サービス型バックエンド(backend as a service; BaaS)、サービス型テスト環境(test environment as a service; TEaaS)、サービス型API(API as a service; APIaaS)、サービス型統合プラットフォーム(integration platform as a service; IPaaS)などを提供するのに有用であるが、これらに限定されるものではない。
例示の態様では、LIS X04およびX06は、それぞれコンピュータ、装置、インタフェースなど、またはそれらの任意のサブシステムを含む。LIS X04およびX06は、オペレーティングシステム(OS)、すなわち様々な機能(たとえば、ローカルアクセス、メモリへのアクセス、および/またはネットワークX02などを通じたアクセスが可能なデータへのアクセスおよび/またはナビゲーション)を実行するためにインストールされるアプリケーションを含むことができる。一態様では、LIS X04は、アプリケーション・プログラミング・インターフェイス(「API」)を介して分析プラットフォームX08にアクセスする。LIS X04はさらに、APIとは独立して動作可能な1つ以上のネイティブアプリケーション(直接実行可能なプログラム)を含んでもよい。
例示の態様では、分析プラットフォームX08は、入力プロセッサX12、仮説管理部X14、モデラーX16、誤差修正部X18、機械学習部X20、および出力プロセッサX18のうちの1つ以上を含む。入力プロセッサX12は、LIS X04および/またはX06からの入力を受け、処理する。処理は、LIS X04および/またはX06から受けた任意の入力の構文解析、コード変換、翻訳、適合、またはその他の方法での処理の動作を含むが、これらに限定されるものではない。LIS X04およびX06によってアクセス可能となる1つ以上のデータストリーム、データフィード、データベース、または他のデータソースを介して入力を受けてもよい。誤差修正部X18によって上記の誤差修正機構を実行することでデータの誤差を修正してもよい。
例示の態様では、仮説管理部X14は、モデルおよび/またはアルゴリズムとして表される遺伝的分析に関する仮説に従って処理できる状態で入力プロセッサX12から受けた入力を受けるように構成される。このようなモデルおよび/またはアルゴリズムを、たとえば、動態統計値、リアルタイム統計値、および/または履歴統計値、あるいは他の指標に基づいて確率を作成するためにモデラーX16で使用してもよい。このような手法のモデルおよび/またはアルゴリズムの導出や、そのモデルやアルゴリズムへの入力に使用されるデータは、たとえば遺伝データソースX10から仮説管理部X14取り込むことができる。遺伝データソースX10は、たとえば核酸シーケンサを含んでもよい。仮説管理部X14は、たとえば、そのモデルおよび/またはアルゴリズムに入力する必要のある変数に基づいて仮説を構築するように構成されてもよい。入力されたモデルおよび/またはアルゴリズムを、上記の1つ以上の仮説を作成するためにモデラーX16で使用してもよい。仮説管理部X14は、最も尤度の高い仮説に基づいて、特定の値、値の範囲、または推定値を上記の出力として選択することができる。モデラーX16は、機械学習部X20によって訓練されたモデルおよび/またはアルゴリズムに従って動作してもよい。たとえば、機械学習部X20は、上記のような分類アルゴリズムを訓練セットデータベース(図示せず)に適用することによってこのようなモデルおよび/またはアルゴリズムを開発してもよい。特定の態様では、機械学習部は、1つ以上の対照試料を分析し、本明細書に記載のSNV検出方法に有用な訓練データセットを作成する。
仮説管理部X14が特定の出力を確認すると、出力プロセッサX22は情報を要求している特定のLIS104または106にその出力を戻してもよい。
本開示の様々な態様は、ソフトウェア、ファームウェア、ハードウェア、またはそれらの組み合わせによってコンピュータ計算装置で実行できる。図70は、意図した態様またはその一部をコンピュータ可読コードとして実施できる例示のコンピュータシステムY00を示す。この例示のコンピュータシステムY00に関して様々な態様を説明する。
図70の態様では、タスクの処理はプロセッサY02(2台以上の場合もある、以下同じ)によって実行される。しかし、当然ながら、ここでは様々な種類の処理技術(programmable logic array; PLA)、特定用途向け集積回路(application-specific integrated circuits ; ASIC)、マルチコアプロセッサ、マルチプロセッサ、または分散型プロセッサなどの様々なタイプの処理技術など)を利用してもよい。特定の処理タスクを支援するために、画像、マルチメディア、または数学的処理能力などの追加の専用処理リソースを用いてもよい。このような処理リソースは、ハードウェア、ソフトウェア、またはそれらの適切な組み合わせであってもよい。たとえば、プロセッサY02は、画像処理ユニット(graphics-processing unit; GPU)であってもよい。一態様では、GPUは、計算の多いアプリケーションを電子装置で迅速に処理するよう設計された特殊電子回路であるプロセッサである。GPUは、計算の多いデータなどの大きなデータブロックの並列処理に効率的な、高度に並列な構造を有してもよい。これに代えるかこれに加えて、プロセッサY02は画像最適化のない特殊な並列処理を行ってもよく、このような並列プロセッサが本明細書に記載の計算の多い機能を実行する。プロセッサY02は処理アクセラレータ(たとえばDSPまたは他の専用プロセッサ)を含むことができる。
コンピュータシステムY00はさらにメインメモリY30を含み、二次メモリY40も含んでもよい。メインメモリY30は、揮発性メモリでも不揮発性メモリでもよく、複数のチャネルに分かれていてもよい。二次メモリY40は、たとえば、ハードディスクドライブY50、着脱式記憶ドライブY60、および/またはメモリスティックなどの不揮発性メモリを含んでもよい。着脱式記憶ドライブY60としては、フロッピー(登録商標)ディスクドライブ、磁気テープドライブ、光ディスクドライブ、フラッシュメモリなどを挙げることができる。着脱式記憶ドライブY60は周知の方法で着脱式記憶装置470からの読込みおよび/または着脱式記憶装置470への書込みを行う。着脱式記憶装置Y70としては、着脱式記憶ドライブY60が読込みと書込みを行うフロッピーディスク(登録商標)、磁気テープ、光ディスクなどを挙げることができる。関連技術分野の当業者には当然であるが、着脱式記憶装置Y70は、コンピュータソフトウェアおよび/またはデータを記憶したコンピュータ使用可能な記憶媒体を含む。
代替的な態様では、二次メモリY40は、コンピュータプログラムまたはその他の命令をコンピュータシステムY00にロードできるようにするその他の類似の手段を含んでもよい。このような手段は、たとえば着脱式記憶装置Y70とインタフェース(図示せず)を含んでもよい。このような手段の例としては、プログラムカートリッジとカートリッジインタフェース(ビデオゲーム装置に見られるものなど)、着脱式メモリチップ(EPROMまたはPROMなど)とそれに関連するソケット、ならびに、ソフトウェアとデータを着脱式記憶装置Y70からコンピュータシステムY00へ転送できるようにするその他の着脱式記憶装置Y70とインタフェースが挙げられる。
コンピュータシステムY00はさらに、メモリ制御装置Y75を含んでもよい。メモリ制御装置Y75は、メインメモリY30および二次メモリY40へのデータアクセスを制御する。一部の態様では、図70に示すようにメモリ制御装置Y75がプロセッサY10の外部にあってもよい。他の態様では、メモリ制御装置Y75は直接的にプロセッサY10の一部であってもよい。たとえば、多くのAMD(商標)プロセッサおよびIntel(商標)プロセッサは、プロセッサY10(図70には図示せず)と同一のチップの一部である一体型のメモリ制御装置を使用する。
コンピュータシステムY00はさらに、通信・ネットワークインタフェースY80を含んでもよい。通信・ネットワークインタフェースY80によって、ソフトウェアおよびデータをコンピュータシステムY00と外部装置との間で転送できる。通信・ネットワークインタフェースY80は、モデム、通信ポート、PCMCIAスロットおよびカードなどを含んでもよい。通信・ネットワークインタフェースY80を介して転送されるソフトウェアおよびデータは信号の形態であり、通信・ネットワークインタフェースY80が受信できる電子信号、電磁気信号、光学信号または他の信号であってよい。これらの信号は、通信経路Y85を介して通信・ネットワークインタフェースY80へ供給される。通信経路Y85はワイヤまたはケーブル、光ファイバ、電話回線、携帯電話リンク、RFリンク、またはその他の通信チャネルを用いて信号を伝達する。
通信・ネットワークインタフェースY80によって、コンピュータシステムY00はLAN、WAN、インターネットなどの通信ネットワークまたは媒体を通じて通信できる。通信・ネットワークインタフェースY80は、有線接続または無線接続によって遠隔のサイトまたはネットワークと相互作用できる。
本明細書では、「コンピュータプログラム媒体」、「コンピュータ使用可能媒体」および「非一過性媒体」という用語は、一般的に、着脱式記憶装置Y70、着脱式記憶ドライブY60、ハードディスクドライブY50にインストールされたハードディスクなどの実体のある媒体を指す。通信経路Y85を通じて伝達される信号も本明細書に記載の論理を具体化できる。コンピュータプログラム媒体およびコンピュータ使用可能媒体は、メインメモリY30および二次メモリY40などのメモリ(これらはメモリ半導体(たとえばDRAMなど)であってもよい)を指すこともできる。これらのコンピュータプログラム製品は、コンピュータシステムY00にソフトウェアを提供するための手段である。
コンピュータプログラム(コンピュータ制御論理ともいう)は、メインメモリY30および/または二次メモリY40に記憶されている。コンピュータプログラムは、通信・ネットワークインタフェースY80を介して受信されてもよい。このようなコンピュータプログラムを実行すると、コンピュータシステムY00は本明細書に記載の態様を実行できる。特に、コンピュータプログラムを実行すると、プロセッサY10は本明細書に開示した処理を実行できる。したがって、このようなコンピュータプログラムはコンピュータシステムY00の制御装置になる。ソフトウェアを使用して態様を実施する場合、ソフトウェアはコンピュータプログラム製品に保存されていてもよく、たとえば、着脱式記憶ドライブY60、インタフェース、ハードドライブY50または通信・ネットワークインタフェースY80を用いてコンピュータシステムY00にロードされる。
コンピュータシステムY00はさらに、キーボード、モニタ、ポインティング装置、タッチスクリーンなどの入力/出力/表示装置Y90を含んでもよい。
当然ながら、様々な態様のシミュレーション、合成および/または製造の一部を、一般的なプログラミング言語(CまたはC++など)、ハードウェア記述言語(hardware description language; HDL)(たとえばVerilog HDL、VHDL、Altera HDL(AHDL))、または他の利用可能なプログラミングツールなどのコンピュータ可読コードを用いて実行してもよい。このコンピュータ可読コードは、半導体、磁気ディスク、光ディスク(CD−ROM、DVD−ROMなど)などの任意の既知のコンピュータ使用可能媒体に配置できる。このように、インターネットなどの通信ネットワークを介してコードを送信することができる。
これらの態様は、任意のコンピュータ使用可能媒体に記憶されたソフトウェアを含むコンピュータプログラム製品にも関する。このようなソフトウェアを1つ以上のデータ処理装置で実行すると、データ処理装置は本明細書に記載したように動作する。態様によっては、現在公知であるか将来公知になる、任意のコンピュータ使用可能媒体またはコンピュータ可読媒体、ならびにコンピュータ使用可能記憶媒体またはコンピュータ可読記憶媒体を使用する。コンピュータ使用可能媒体またはコンピュータ可読媒体の例としては、一次記憶装置(たとえば、任意の種類のランダムアクセスメモリ)、二次記憶装置(たとえば、ハードドライブ、フロッピーディスク(登録商標)、CD−ROM、ZIPディスク、テープ、磁気記憶装置、光学記憶装置、MEMS、ナノ技術記憶装置など)、および通信媒体(たとえば、有線および無線通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク、イントラネットなど)が挙げられるが、これらに限定されるものではない。コンピュータ使用可能媒体またはコンピュータ可読媒体としては、任意の形態の一過性の(信号を含む)媒体または非一過性の(信号を含まない)媒体を挙げることができる。非一過性媒体としては、上記の物理的な記憶装置(たとえば一次記憶装置および二次記憶装置)が挙げられるが、これらに限定されるものではない。
当然ながら、本明細書に開示された態様はいずれも本明細書に開示された他の任意の態様と組み合わせて使用できる。
本明細書に開示の態様を以下の実施例で説明する。これらの実施例は本開示の理解を助けるために記載するものであり、当然ながら、後に記載する特許請求の範囲で定義する開示の範囲をいかなる形でも限定するものではない。以下の実施例は、記載した態様の実施方法を当業者に完全に開示し具体化するために記載するものであり、本開示の範囲を限定することを意図するものではなく、以下の実験のみが実施したすべての実験であることを表すことを意図するものでもない。使用する数値(たとえば量や温度など)については正確にするよう努めたが、実験誤差および偏差が考慮されるべきである。別段の指示がない限り、「部」は容量部であり、温度は摂氏温度である。当然ながら、実験が示すよう意図された基本的側面を変えることなく、記載した方法を変更してもよい。
実施例1
試料の調製および増幅の方法の例は、2012年11月21日出願の米国特許出願第13/683,604号(米国特許公開第2013/0123120号)明細書、2014年5月16日出願の米国特許出願第61/994,791号明細書に記載されている(これらの文献の全内容は参照によって本明細書に組み込まれる)。これらの方法を用いて、本明細書に開示された任意の試料を分析できる。
一実験では、血漿試料を調製し、半入れ子・19,488プレックスのプロトコルで増幅した。試料を以下の方法で調製した:最大20mLの血液を遠心分離してバフィーコート(軟膜)と血漿を単離した。このバフィーコートから血液試料のゲノムDNAを調製した。ゲノムDNAは、唾液試料からも調製できる。血漿中の無細胞DNAをQIAGEN社のCIRCULATING Nucleic Acid kitを使用して単離し、製造者の指示に従いTE緩衝液50μLで溶離した。精製した血漿DNA40μLの各分子の末端に汎用的なライゲーションアダプターを付加し、アダプターに特異的なプライマーを用いてライブラリを9サイクルにわたって増幅した。AGENCOURT(登録商標)AMPUREビーズを用いてライブラリを精製し、50μLのDNA懸濁用緩衝液で溶離した。
タグ付きの標的特異的な逆方向プライマー19,488個(プライマー濃度7.5nM)とアダプター特異的な順方向プライマーの1つのライブラリ(濃度500nM)とを用いて、6μLのDNAを15サイクルのSTAR1で増幅した(最初にポリメラーゼ活性化のために95℃で10分間;次いで96℃で30秒間、65℃で1分間、58℃で6分間、60℃で8分間、65℃で4分間および72℃で30秒間、を15サイクル;最後の伸長を72℃で2分間)。
半入れ子PCRプロトコルでは、逆方向タグ(濃度1000nM)と、19,488個の標的特異的な順方向プライマーの各々(濃度20nM)を用いて、STAR1産物の希釈物を15サイクルにわたって増幅する2回目の増幅(STAR2)を行った(最初にポリメラーゼ活性化のために95℃で10分間;次いで95℃で30秒間、65℃で1分間、60℃で5分間、65℃で5分間、72℃で30秒間、を15サイクル;最後の伸長を72℃で2分間)。
次に、タグ特異的順方向プライマーとバーコード付き逆方向プライマー(1μM)を用いて、一定分量のSTAR2産物を標準のPCRで12サイクルにわたって増幅し、バーコード付き配列のライブラリを作製した。各ライブラリの一定分量を、バーコードの異なる配列ライブラリと混合し、スピンカラムで精製した。
このように、単一ウェルでの反応に19,488個のプライマーを用いた。プライマーは、1番染色体、2番染色体、13番染色体、18番染色体、21番染色体、X染色体、およびY染色体に見られるSNPを標的とするように設計した。次いで増幅産物をILLUMINA(登録商標)GAIIXシーケンサで配列決定した。必要に応じ、配列決定リード数を増やし、増幅し配列決定する標的SNPの数を増やすことができる。
関連するゲノムDNA試料を、準入れ子にした外側順方向プライマーとタグ付き逆方向プライマー(7.5nM)19,488対を用いて、増幅した(STAR1)。STAR2の熱条件および構成とバーコーディングPCRについては、半入れ子のプロトコルと同様とした。
実施例2
プライマー選択方法の例は、2012年11月21日出願の米国特許出願第13/683,604号(米国特許公開第2013/0123120号)明細書、および2014年5月16日出願の米国特許出願第61/994,791号明細書に記載されている(これらの全内容は参照によって本明細書に組み込まれる)。これらの方法を用いて、本明細書に開示された任意の試料を分析できる。
以下の実験では、本発明の任意の多重PCR法に使用できるプライマーライブラリの設計法および選択方法の例を説明する。目的は、候補プライマーの初期ライブラリから、多数の標的座位(または標的座位の部分集合)を1つの反応容量で同時に増幅するのに使用できるプライマーを選択することである。候補標的座位の初期の集合について、プライマーを各標的座位に対して設計または選択する必要はなく、最も望ましい標的座位の大部分についてプライマーを設計・選択することが好ましい。
工程1
候補標的座位(SNPなど)の集合を、標的に関する所望のパラメータについての公的に利用可能な情報(たとえば、対象集団におけるSNPの頻度、SNPのヘテロ接合体率など)(ワールドワイドウェブのncbi.nlm.nih.gov/projects/SNP/;およびSherry ST, Ward MH, Kholodov M, et al. dbSNP: the NCBI database of genetic variation. Nucleic Acids Res. 2001 Jan 1;29(1):308-11(それぞれの全内容は参照によって本明細書に組み込まれる)に基づいて選択した。各候補座位について、1つ以上のPCRプライマー対をPrimer 3 programワールドワイドウェブのprimer3.sourceforge.net; libprimer3 release 2.2.3(全内容は参照によって本明細書に組み込まれる))で設計した。特定の標的座位に対するPCRプライマーの実現可能な設計がない場合、その標的座位を除外して検討した。
必要に応じ、標的座位の大部分またはすべてについて「標的座位スコア(スコアが高いほど適切度が高い)を計算することができる。(たとえば、その標的座位に求める多様なパラメータの加重平均に基づいて計算した標的座位スコア)。パラメータには、プライマーを使用する特定の用途にとっての重要性に基づいて異なる重みを割り当ててよい。パラメータの例としては、標的座位のヘテロ接合体率、標的座位での配列(たとえば多型)に関連する疾患罹患率、標的座位での配列(たとえば多型)に関連する疾患浸透度、標的座位の増幅に用いる候補プライマーの特異性、標的座位の増幅に用いる候補プライマーのサイズ、標的増幅産物のサイズが挙げられる。一部の態様では、標的座位に対する候補プライマーの特異性は、候補プライマーの設計上の増幅対象である標的座位以外の座位に対して結合・増幅することによってミスプライムする尤度を含む。一部の態様では、ミスプライムする1個以上またはすべての候補プライマーをライブラリから除外する。
工程2
工程1で得た他のすべての標的座位について、標的座位に対する各プライマーとすべてのプライマーでの熱力学的相互作用スコアを計算した(たとえば、以下を参照:Allawi, H. T. & SantaLucia, J., Jr. (1998), "Thermodynamics of Internal C-T Mismatches in DNA", Nucleic Acids Res. 26, 2694-2701; Peyret, N., Seneviratne, P. A., Allawi, H. T. & SantaLucia, J., Jr. (1999), "Nearest-Neighbor Thermodynamics and NMR of DNA Sequences with Internal A-A, C-C, G-G, and T-T Mismatches", Biochemistry 38, 3468-3477; Allawi, H. T. & SantaLucia, J., Jr. (1998), "Nearest-Neighbor Thermodynamics of Internal A-C Mismatches in DNA: Sequence Dependence and pH Effects", Biochemistry 37, 9435-9444.; Allawi, H. T. & SantaLucia, J., Jr. (1998), "Nearest Neighbor Thermodynamic Parameters for Internal G-A Mismatches in DNA", Biochemistry 37, 2170-2179; and Allawi, H. T. & SantaLucia, J., Jr. (1997), "Thermodynamics and NMR of Internal G-T Mismatches in DNA", Biochemistry 36, 10581-10594; MultiPLX 2.1 (Kaplinski L, Andreson R, Puurand T, Remm M. MultiPLX: automatic grouping and evaluation of PCR primers. Bioinformatics. 2005 Apr 15;21(8):1701-2(これらの文献それぞれの全内容は参照によって本明細書に組み込まれる))。この工程の結果、相互作用スコアの2次元の行列を得た。相互作用スコアにより2個の相互作用するプライマーを含むプライマー二量体の尤度を予測した。相互作用スコアは以下のように計算した:
相互作用スコア=最大(−ΔG2,0.8×(−ΔG1))
(式中、
「ΔG2」は、PCRによって両端が伸長可能な(すなわち、各プライマーの3’末端はもう一方のプライマーにアニーリングする)二量体に関するギブズのエネルギー(二量体を切断するのに必要なエネルギー)であり、
「ΔG1」は、少なくとも一方の末端がPCRで伸長可能な二量体に関するギブズのエネルギーである。)
工程3
各標的座位について、2つ以上のプライマー対設計がある場合、1つの設計を以下の方法で選択した:
1.座位に対する各プライマー対設計について、その設計に含まれる2個のプライマーと、他のすべての標的座位に対するすべての設計に含まれるすべてのプライマーとの最悪の場合の(最も高い)相互作用スコアを見つける。
2.最悪の場合の相互作用スコアが最も良い(最も低い)設計を選択する。
工程4
各節点が1つの座位とそれに関連するプライマー対設計を表すようなグラフを描いた(たとえば、最大クリーク問題)。各2つの節点の間に枝を設けた。各枝に、その枝が結ぶ2つの節点に関連するプライマーの間の最悪の場合の(最も高い)相互作用スコアと同等の重みを割り当てた。
工程5
必要に応じ、2個の異なる標的座位に関する各対の設計について、一方の設計のプライマーの1つともう一方の設計のプライマーの1つが重複する標的領域にアニールする場合、その2つの設計に関する節点の間に枝を追加する。これらの枝の重みは、工程4で割り当てた重みの最大値と等しく設定した。したがって、工程5は、多重PCR反応時に重複する標的領域にアニールして互いに干渉するプライマーがライブラリに含まれるのを防止する。
工程6
初期の相互作用スコアの閾値を以下のように計算した:
重み閾値=最大(枝重み)−0.05×(最大(枝重み)−最小(枝重み))
(式中、「最大(枝重み)」はグラフ中の枝の重みの最大値であり;
「最小(枝重み)」はグラフ中の枝の重みの最小値である。
初期の閾値範囲を以下のように設定した:
最大重み閾値=最大(枝重み)
最小重み閾値=最小(枝重み)
工程7
工程5と同じ節点の集合からなり、重み閾値を越えた重み付きの枝のみを含む新しいグラフを作成した。このように、この工程では、スコアが重み閾値以下の相互作用は無視する。
工程8
枝が残らなくなるまで節点(と、削除された節点を結ぶすべての枝)を工程7のグラフから削除した。以下の手順を繰り返すことで節点を削除した。
1.次数が最も高い(枝の数が最も多い)節点を探す。複数ある場合は任意に1つを選ぶ。
2.上で選んだ節点とその節点に接続しているすべての節点からなる節点の集合を定義する。ただし、上で選んだ節点よりも次数が低い節点は排除する。
3.その集合から、工程1で得た標的座位スコア(スコアが低いほど適切度が低い)が最も低い節点を選び、グラフから削除する。
工程9
グラフに残る節点の数が、多重PCRプールに必要な標的座位の数を(許容される公差の範囲内で)満たしていれば、工程10で方法を継続する。
グラフに残る節点の数が多すぎるか少なすぎる場合、二分探索を実行し、どのような閾値であれば所望の数の節点が残るかを決める。グラフの節点が多すぎる場合、重みの閾値の値の範囲を以下のように調節する:
最大重み閾値=重み閾値
他の場合(グラフの節点が少なすぎる場合)には、重みの閾値を以下のように調節する。
最小重み閾値=重み閾値
次に、重みの閾値を以下のように調節する:
重み閾値=(最大重み閾値+最小重み閾値)/2
工程7〜9を繰り返す。
工程10
グラフに残っている節点に関連するプライマー対設計をプライマーライブラリに選択した。このプライマーライブラリは、本発明の任意の方法に使用できる。
必要に応じて、(プライマー対でなく)1個のプライマーのみを標的座位の増幅に用いるプライマーライブラリを得るためにこのプライマー設計・選択方法を実行できる。この場合、節点は標的座位ごとに(プライマー対ではなく)1個のプライマーを表す。
実施例3
必要に応じ、本発明の方法を試験して染色体または染色体分節の欠失または重複の検出能力を評価することができる。以下の実験を実施し、父親から遺伝したX染色体またはX染色体の分節の過剰出現の検出を、母親から遺伝したX染色体またはX染色体分節の場合と比較して実証する。この試験法は、染色体または染色体分節の欠失または重複を模倣するよう設計される。異なる量の父親由来DNA(XY性染色体を有する)をその父親の娘由来のDNA(XX性染色体を有する)と混合し、父親由来のX染色体の余剰量を分析した(図19A〜図19D)。
父親と娘の細胞系からDNAを抽出し、Qubit(商標)を用いて定量した。父親の細胞系AG16782、cAG16782−2−Fおよび娘の細胞系AG16777、cAG16777−2−Pを使用した。父親のX染色体に関するハプロタイプを決定するため、X染色体には存在するがY染色体には存在しないSNPを検出した。つまり、そのSNPには父親のX染色体からのシグナルは存在するがY染色体からのシグナルは存在しないと考えられる。娘にはこのハプロタイプが父親から遺伝した。娘のもう一方のX染色体のハプロタイプは母親から遺伝したものである。母親のハプロタイプは、娘の細胞系のDNAで父親から遺伝したのではないSNPを母親のハプロタイプに割り当てることによって決定できる。
父親由来のX染色体の過剰発現が検出される可能性があるかを決定するために、異なる量の父親細胞系由来のDNAを、娘の細胞系由来のDNAと混合した。全体のDNA使用量は、約75ng(約25kコピー)のゲノムDNAであった。約3,456個のSNPを、X染色体およびY染色体の試験のために直接多重PCRで増幅した。増幅産物を、7bpのバーコードを用いて、Rapid/HTモードで50bpシングルリード配列決定によって配列決定した。リード数はSNPあたり約10Kであった。
図19A〜図19Dに示すように、父親のDNAからのモザイク現象が検出された。図から、過剰出現した染色体分節または染色体全体が検出される可能性があることがわかる。
本明細書で引用した全ての特許、特許出願、および公開されたその引用文献の全内容は参照によって本明細書に組み込まれる。本開示の方法は、その特定の態様に関連して記載されているが、当然ながら、修正を加えることができる。さらに、本願は、本開示の方法の任意の変更、使用、または適応を包含し、本開示を発展させたこれらの内容についても、本開示の方法が属する技術分野で公知または慣習的な実践の範囲内であり、添付の特許請求項の範囲にも包含することを意図する。本発明のいずれの態様も、試料中のDNAおよび/またはRNAの分析によって実施できる。たとえば、DNAに関して本明細書に開示した方法のいずれも、たとえば逆転写でRNAをDNAに変換する工程を含むことによって、RNAに適応させることができる。
実施例4
本実施例では、乳癌関連のコピー数多様性を非侵襲的に無細胞腫瘍DNAに基づいて検出するための方法の例について説明する。乳癌検診には乳房X線撮影が含まれるが、偽陽性率が高く、一部の癌は見落とされる。腫瘍由来の循環無細胞DNA(無細胞循環腫瘍DNA)の癌関連のCNVを分析することによって、より迅速、安全、かつ高精度の検診が可能である。SNPに基づく超多重PCR(massively multiplex PCR)法を用いて、乳癌患者の血漿から単離した無細胞循環腫瘍DNAをCNVについてスクリーニングした。癌でCNVが見られることの多い1番染色体、2番染色体、22番染色体(たとえば、乳癌の試料の49%は22qの欠失を有する)で3,168個のSNP超多重PCR試験法を標的化するように超多重PCR試験法を設計した。乳癌患者(IIa期1名、IIb期4名、IIIb期1名)から採取した6個の血漿試料を分析した。各試料は、標的染色体のうち1つ以上にCNVを有していた。この試験法では、0.58%の無細胞循環腫瘍DNA率で正しく検出されたIIb期の試料1個を含む6個の血漿試料すべてにCNVが確認された(図30、図31B、図32A、図32B、図33)。検出に必要なのは86個のヘテロ接合性のSNPのみであった。IIa期の試料も4.33%の無細胞循環腫瘍DNA率で、636個のヘテロ接合性のSNPを用いて正しく検出された(図29、図31A、および図32A)。このことから、染色体アームの局所的なCNVまたは全体のCNV(どちらも癌では一般的である)を容易に検出できることがわかる。
さらに感度を評価するため、3Mbの癌細胞系由来の22qCNVを有する22種類の人工混合物を、正常細胞系由来のDNAと混合し(5:95)、0.43%〜7.35%の無細胞循環腫瘍DNA率を再現した(図28A〜28C)。この方法では、これらの試料の100%でCNVが正確に検出された。このように、CNVを示すことがわかっている非無細胞DNA源(腫瘍細胞系など)によって生成された断片化ポリヌクレオチド混合物を含む単離ポリヌクレオチド試料を、他のDNA試料に、生体内の無細胞DNAにみられる濃度と類似の濃度(たとえば、DNAが液体中0.01%〜20%、0.1%〜15%、または4%〜10%)で添加することにより、人工無細胞DNAポリヌクレオチド標準/対照を作製できる。これらの標準/対照は、試験法の設計、特性評価、開発、および/または検証のための対照として、また、試験(CLIA(Clinical Laboratory Improvement Amendment;臨床検査改善修正法案)認定された研究所で実施される癌試験など)の際の品質管理標準として、および/あるいは研究用試験キットまたは診断試験キットに含まれる標準として使用可能である。重要なことであるが、乳癌と卵巣癌を含む多数の癌では点変異よりもCNVがより高頻度に見られる。総合すると、この結果により、このSNPに基づく超多重PCR法が、これらの癌を非侵襲的に検出するための、よりコスト効率の高い方法を提供することが裏付けられる。
実施例5
本実施例では、SNPを標的とする超多重PCRを使用して乳癌試料でコピー数変異を検出するための方法の例について説明する。腫瘍組織でのCNVの評価は、一般的にSNPマイクロアレイまたはaCGHを含む。これらの方法は全ゲノム分解能が高いが、大量の使用材料が必要であり、固定費が高く、ホルムアルデヒド固定パラフィン包埋(FFPE)試料ではうまく機能しない。本実施例では次世代配列決定(next generation sequencing; NGS)を用いる28,000プレックスSNP標的化PCRを使用し、1p、1q、2p、2q、4p16、5p15、7q11、15q、17p、22q11、22q13および13番染色体、18番染色体、21番染色体を乳癌試料でCNVを検出するための標的とした。異数性または微小欠失を有する96個の試料について精度を検証した。単一分子感度は単一細胞を分析することによって確立した。17個の乳癌試料(新鮮凍結腫瘍組織が15個、FFPE腫瘍組織が2個、腫瘍細胞系と正常細胞系の対応対が5対)を分析し、16個(両方のFFPE試料を含む)は、1個〜15個(平均:7.8個)の標的に完全または部分的なCNVを有することが認められた。腫瘍がヘテロ接合性である兆候を認めた。1個のCNVを有する3個の組織はすべて、乳癌で最も頻度の高い細胞遺伝学的異常である1qの重複を有していた。CNVの頻度が最も高い領域は1q、7p、および22q1であった。1つの腫瘍組織(9個のCNVを有する)のみが、LOHを含む領域を有していた。このLOHは、他の8個のCNVを有さない隣接する推定正常組織でも検出された。一方、LOHを有し全体のCNV発生率(平均:12.8)が高い領域を細胞系で5つ以上検出した。したがって、超多重化PCRは標的化による方式でCNVを調査するための経済的かつ高処理な手法を提供し、分析が困難なFFPE組織などの試料に利用できる。
実施例6
本実施例では、本発明のいずれかの方法の検出限界を計算するための方法の例について説明する。これらの方法を用いて、腫瘍生検(図34)および血漿試料(図35)における一塩基多様体(SNV)の検出限界を計算した。
第1の方法(図34および図35の「LOD−mr5」)では、配列決定データに実際にSNVが存在するという十分な確信を得るための最小のSNV観測回数として選択した最低5個のリードに基づいて検出限界を計算する。検出限界は、リード深度(DOR)の観測値がこの最小値5を超えるかどうかに基づく。図34および図35の灰色の線は、DORによって検出限界が制限されるSNVを示す。これらの場合、測定したリードの数は、試験法の誤差限界に達するのに十分ではなかった。必要に応じて、DORを上げることにより、これらのSNVの検出限界を改善できる(数値が低くなる)。
第二の方法(図34および図35の「LOD−zs5.0」)では、zスコアに基づいて検出限界を計算する。zスコアは、観測エラー率が背景平均エラーから離れている標準偏差の数である。必要に応じて、異常値を除外してzスコアを再計算し、この処理を繰り返すことができる。zスコアの計算にはエラー率の最終加重平均と標準偏差を用いる。DORが高いほど精度は高くなるため、平均値をDORで加重する。
この実施例で用いたzスコア計算例では、それぞれのゲノム座位と置換の種類について、同じ配列決定実行の他のすべての試料から、リード深度で加重した背景平均エラーおよび標準偏差を計算した。試料が背景平均から5標準偏差である場合、その試料は背景分布では考慮しなかった。図34および図35のオレンジ色の線は、検出限界がエラー率によって制限されるSNVを示す。これらのSNVについては、最小リード値5に達するのに十分なリードが得られ、検出限界はエラー率で制限された。必要に応じて、検出の限界は、試験法を最適化してエラー率を低減することによって改善できる。
第三の方法(図34および図35の「LOD−zs5.0−mr5」)では、上記の2つの計量の最大値に基づき、検出限界を算出する。
図34に示す腫瘍試料の分析の場合、平均検出限界は0.36%であり、検出限界の中央値は0.28%であった。DORで制限されたSNV(灰色の線)の数は934であった。エラー率で制限されたSNV(オレンジ色の線)の数は738であった。
図35の血漿試料中のcDNAの分析の場合、平均検出限界は0.24%であり、検出限界の中央値は0.09%であった。DORで制限されたSNV(灰色の線)の数は732であった。エラー率で制限されたSNV(オレンジ色の線)の数は921であった。
実施例7
本実施例では、同一の単一細胞からのCNVおよびSNVの検出について説明する。以下のプライマーライブラリを用いた:CNV検出用の約28,000個のプライマーのライブラリ;CNVの検出用の約3,000個のプライマーのライブラリ;およびSNVの検出用のプライマーのライブラリ。単一細胞の分析のため、細胞を一滴あたり3個または4個の細胞が存在するまで段階希釈した。個々の細胞をピペットで取り、PCR管に入れた。以下の条件で、プロテアーゼK、塩、およびDTTを用いて細胞を溶解した:56℃で20分間、95℃で10分間、次いで4℃で保持。ゲノムDNAを分析するため、分析した単一細胞と同じ細胞系由来のDNAを、購入するか、細胞を増殖させてDNAを抽出することによって得た。
約28,000個のプライマーのライブラリを用いた増幅に以下のPCR条件を用いた:反応容量40μL、各プライマー7.5nM、2×マスターミックス(MM)。一部の態様では、QIAGEN Multiplex PCR Kitをマスターミックスに用いた(QIAGEN社のカタログ番号206143;たとえばワールドワイドウェブのqiagen.com/products/catalog/assay-technologies/ end-point-pcr-and-rt-pcr-reagents/qiagen-multiplex-pcr-kitを参照(この全内容は参照によって本明細書に組み込まれる)。キットには、2×QIAGEN(登録商標)Multiplex PCR Master Mix(終濃度3mM MgCl、3×0.85mL)と、5×Q-Solution(1×2.0mL)と、RNAseを含まない遊離水(2×1.7mL)とを含む。QIAGEN(登録商標)Multiplex PCR Master Mix(MM)は、KClおよび(NHSOと、PCR添加剤と、Factor MP(鋳型での局所的プライマー濃度を上げる)の組み合わせを含む。Factor MPは特異的に結合したプライマーを安定化し、たとえばHotStarTag(登録商標)DNA Polymeraseによるプライマーの伸長効率を良くする。HotStarTaq(登録商標)DNA PolymeraseはTaq(登録商標)DNA Polymeraseの改変型であり、環境温度ではポリメラーゼ活性を有さない。以下の熱サイクル条件を用いて初回のPCRを行った:95℃で10分間;96℃で30秒間、65℃で29分間、72℃で30秒間、を25サイクル;次いで72℃で2分間、4℃で保持。二回目のPCRでは、反応容量を10μLとし、1×MMと5nMの各プライマーを用いた。以下の熱サイクル条件を用いた:95℃で15分間;94℃で30秒間、65℃で1分間、60℃で5分間、65℃で5分間、72℃で30秒間、を25サイクル;次いで72℃で2分間、4℃で保持。
約3,000個のプライマーのライブラリに関して、例示の反応条件は10μLの反応容量(2×MM、70mM TMAC、各プライマー2nM)を含む。SNVを検出するためのプライマーのライブラリの場合、例示の反応条件は、10μLの反応容量(2×MM、4mM EDTA、各プライマー7.5nM)を含む。例示の熱サイクル条件としては以下が挙げられる:95℃で15分間;94℃で30秒間、65℃で15分間、72℃で30秒間、を20サイクル;次いで72℃で2分間、4℃で保持。
増幅産物にバーコードを付加した。1回の配列決定は、試料あたり等しいリード数で行った。
図36Aおよび図36Bは、CNVを検出するよう設計した約28,000個のプライマーのライブラリを用いたゲノムDNA(図36A)または単一細胞由来のDNA(図36B)の分析結果を示す。試料あたり約400万リードを測定した。1つの中央バンドではなく2つの中央バンドが存在することから、CNVが存在することが示される。単一細胞に由来する3種類のDNA試料について、マッピングされたリードの割合はそれぞれ89.9%、94.0%、93.4%であった。2種類のゲノムDNA試料について、マッピングされたリードの割合はそれぞれ99.1%であった。
図37Aおよび図37Bは、CNVを検出するよう設計した約3,000個のプライマーのライブラリを用いたゲノムDNA(図37A)または単一細胞由来のDNA(図37B)の分析結果を示す。試料ごとに約120万リードを測定した。1つの中央バンドでなく2つの中央バンドが存在することから、CNVが存在することが示される。単一細胞に由来する3種類のDNA試料について、マッピングされたリードの割合はそれぞれ98.2%、98.2%、97.9%であった。2種類のゲノムDNA試料について、マッピングされたリードの割合はそれぞれ98.8%であった。図38は、これらの約3,000個の剤に関するDORの均一性を示す。
SNVの検出について、真陽性の変異の検出率は単一細胞由来のDNAとゲノムDNAの場合で似ていた。縦軸を単一細胞に対する真陽性の変異の検出率、横軸をゲノムDNAの真陽性の変異とするグラフでは、R=0.9834でy=1.0076x−0.3088の曲線にフィットした。図39は、ゲノムDNAと単一細胞由来のDNAの場合では検出エラーの計測値が似ていることを示す。図40は、転移変異の検出に関するエラー率が、塩基転換変異を検出する場合よりも大きかったことを示しており、可能であれば転移変異ではなく塩基転換変異を検出対象に選択することが望ましいとわかる。
実施例8
本実施例では、本明細書に開示の染色体異数性およびCNV決定のための超多重化PCR法(CoNVERGeという(Copy Number Variant Events Revealed Genotypically)をさらに検証し、無細胞腫瘍循環DNA試料のPCRに関するPlasmArt基準の開発と使用についてさらに説明する。PlasmArt基準は、CNVを示すことがわかっているゲノムの領域と同一の配列を有し、血漿中に天然に見られる無細胞DNA断片のサイズ分布を反映するサイズ分布を有する、ポリヌクレオチドを含む。
試料の採取
ヒトの乳癌細胞株(HCC38、HCC1143、HCC1395、HCC1937、HCC1954およびHCC2218)と、対応する正常細胞株(HCC38BL、HCC1143BL、HCC1395BL、HCC1937BL、HCC1954BL、およびHCC2218BL)をAmerican Type Culture Collection(ATCC)から入手した。21番染色体トリソミーのBリンパ球細胞(AG16777)と、父親と子の対になったディジョージ症候群(DGS)細胞株(それぞれ、GM10383およびGM10382)をCoriell Cell Repository(Camden, NJ)から入手した。GM10382細胞は、父親の22q11.2領域のみを有する。
16名の乳癌患者の腫瘍組織をGeneticist(Glendale, CA)から入手した11個の新鮮凍結(FF)試料と、North Shore-LIJ(Manhasset、NY)から入手した5個のホルマリン固定パラフィン包埋(FFPE)試料)。患者8名の対応するバフィーコート試料と、患者9名の一致した血漿試料を得た。5名の卵巣癌患者のFF腫瘍組織と、対応したバフィーコート試料と血漿試料をNorth Shore-LIJから入手した。8個の乳房腫瘍のFF試料に関して、組織小片を分析用に切り取った。試料採取のためにNorthshore/LIJ IRBとKharkiv National Medical University Ethics Committeeの機関審査委員会の承認書を取得し、患者全員からインフォームドコンセントを得た。
血液試料をEDTA管に採取した。QIAamp(登録商標)Circulating Nucleic Acid Kit(Qiagen, Valencia, CA)を用いて血漿1mLから循環腫瘍DNAを単離した。
一典型的方法に従いPlasmAt標準を作製するため、まず9×10個の細胞を低張溶解緩衝液(20mM Tris-Cl (pH7.5), 10mM NaCl, 3mM MgCl2)を用いて氷上で15分間かけて溶解した。次いで10%のIGEPAL(登録商標)CA-630(Sigma, St. Louis, MO)を終濃度が0.5%になるまで添加した。4℃で3分間、3,000gで遠心分離した後、ペレット化した核を1x micrococcal nuclease (MNase) Buffer(New England BioLabs, Ipswich, MA)に再懸濁した後、1000UのMNase(New England BioLabs)を添加し、次いで37℃で5分間インキュベートした。EDTAを最終濃度が15mMになるように添加することによって反応を停止させた。未消化の染色質を、2,000gで1分間の遠心分離によって除去した。断片化DNAをDNA Clean & Concentrator(登録商標)-500 kit(Zymo Research, Irvine, CA)で精製した。MNase消化によって得られたモノヌクレオソームDNAも精製し、AMPure(登録商標)XP磁気ビーズ(Beckman Coulter, Brea, CA)を用いてサイズ選別した。Bioanalyzer DNA 1000 chip(Agilent, Santa Clara, CA)でDNA断片のサイズ分類と定量を行った。
様々な濃度の無細胞循環腫瘍DNAをモデル化するために、HCC1954およびHCC2218癌細胞由来のPlasmArtの異なる画分を、対応する正常細胞株(それぞれ、HCC1954BLおよびHCC2218BL)由来のものと混合した。各濃度3個の試料を分析した。同様に、血漿DNAの3.5Mbの局所領域のアレル不均衡をモデル化するため、母親由来の22q11.2欠失を有する子のDNAと父親のDNAとの比の異なるDNA混合物からPlasmArtを作製した。父親のDNAのみを含む試料を陰性対照として使用した。各濃度8個の試料を分析した。
したがって、CoNVERGeの感度と再現性を評価するため、特にCNVに関する異常なDNAの割合または平均アレル不均衡(average allelic imbalance; AAI)が低い場合、これを、過去に特性評価した異常な試料で構成されるDNA混合物(異常な試料を対応する正常試料に用量設定したもの)に含まれるCNVを検出するために用いた。
混合物は、断片サイズ分布が天然の無細胞DNA(上記を参照)に近い人工無細胞DNA(「PlasmArt」という)で構成した。図42は、染色体アーム1p、1q、2p、および2qのCNVに着目し、染色体のアーム癌細胞株由来の例示のPlasmArtのサイズ分布と無細胞DNAのサイズ分布の比較を図示する。第一のペアでは、3Mbの局所的なCNV(22q11.2領域の欠失)を有する息子の腫瘍DNA試料を、父親由来の対応する正常な試料に、全体の無細胞DNAの割合が0%〜1.5%となるように用量設定して添加した(図41a)。CoNVERGeは、推定AAIが>0.35%(AAIが≧0.5%+/−0.2%の混合物中)の既知の異常に対応するCNVを確認し再現性を示したが、異常DNAが0.25%の場合、8個のうち6個の複製物ではCNVを検出できず、8個の陰性対照試料すべてについて≦0.05%という値を報告した。CoNVERGeによるAAI推定値は、高い直線性(R2=0.940)と再現性(誤差分散=0.087)を示した。試験法は、同一試料で異なる増幅レベルに対して高感度であった。これらのデータに基づき、AAI0.45%の保守的な検出閾値をその後の分析に用いることができた。このカットオフ値(閾値)を用いて、PlasmArt合成無細胞循環腫瘍DNAを既知の濃度で添加して約0.5%〜約3.5%の合成癌血漿を作製する、別の実験を行った。陰性血漿も対照として用いた。すべての合成癌血漿で0.45%超の推定値が得られ、陰性血漿に関する測定値は0.45%を大きく下回った(図43A〜C)。図43Aの右図は腫瘍の最尤度であり、DNA率の推定値の結果をオッズ比のグラフとして示す。図43Bは塩基転換事象の検出に関するグラフである。図43Cは転移事象の検出に関するグラフである。
さらに、対応する腫瘍細胞株と正常細胞株のペアから調製した。それぞれ1番染色体または2番染色体にCNVを有する2種類の既知濃度のPlasmArtを評価した(図41b、図41c)。陰性対照では、すべての値が<0.45%であり、既知のDNA使用量とCoNVERGeによる算出値との間には高い直線性(R2=0.952(HCC1954株、1p)、R2=0.993(HCC1954株、1q)、R2=0.977(HCC2218株、2p)、R2=0.967(HCC2218株、2q)および再現性(誤差分散=0.190(HCC1954株、1p)、0.029(HCC1954株、1q)、0.250(HCC2218株、2p)、0.350(HCC2218株、2q)が認められた。1対の試料の領域1pおよび1qに関する回帰の傾きの差は、同じ試料の領域1pおよび1qのBアレル頻度(BAF)で観察されたコピー数の相対差と相関する。このことは、CoNVERGeによって計算されたAAI推定値の相対的な正確性を示す(図41c、41d)。
試料を処理するためのワークフローを図63に示す。CoNvergeは、FFPE試料、新鮮凍結試料、単一細胞、生殖細胞系対照、無細胞循環腫瘍DNAなどの多様な試料源に応用できる。6個のヒト乳癌細胞株および対応する正常細胞株にCoNVERGeを応用し、体細胞CNVを検出できるかどうかを評価した。アームレベルでのCNVと局所的なCNVは6個の癌細胞株すべてに存在したが、それらに対応する正常細胞株には存在せず、例外としてHCC1143株の2番染色体では正常細胞株が1:1の相同体比から偏差が見られる(図63b)。これらの結果を別のプラットフォームで検証するため、CytoSNP-12マイクロアレイ分析を行い、すべての試料について一貫した結果を得た(図63d、図63e)。さらに、CoNVERGeおよびCytoSNP-12マイクロアレイで確認したCNVに関する相同体比の最大値は強い直線的相関を示した(R2=0.987、P<0.001)(図63f)。
次に、CoNVERGeを新鮮凍結(FF)(図64a)およびホルマリン固定パラフィン包埋(FFPE)乳房腫瘍組織サンプル(図64b、64d)に応用した。いずれの種類の試料でも、数個のアームレベルのCNVおよび局所的なCNVが存在したが、対応するバフィーコート試料のDNAではCNVは検出されなかった。CoNVERGeの結果は、同じ試料のマイクロアレイ分析結果と高度に相関していた(図64e〜h;R2=0.909(FF);P<0.001(CytoSNP-12);R2=0.992(FFPE);P<0.001(OncoScan))。CoNVERGeは、マイクロアレイ法が適切でないレーザーキャプチャ顕微解剖(laser capture microdissection; LCM)試料から抽出した少量のDNAについても一貫した結果を示した。
CoNVERGeを用いた単一細胞でのCNV検出
この超多重化PCR法の応用性の限界を試験するために、上記6個の癌細胞株と、標的領域にCNVを有さないBリンパ球細胞株から、単一細胞を単離した。これらの単一細胞実験から得たCNVプロファイルは3個の複製物で一貫しており、かつ細胞約20,000個の大容量の試料から抽出したゲノムDNA(gDNA)から得たCNVプロファイルとも一致していた(図65)。配列決定リードのないSNPの数を基準に、大容量試料での平均試験ドロップアウト率は0.48%(範囲:0.41%〜0.60%)であった。これは、合成上または試験法設計上の不具合による。単一細胞の場合、追加の平均試験ドロップアウト率の観測値は0.39%(範囲:0.19%〜0.67%)であった。失敗のなかった(すなわち試験ドロップアウトが起こらなかった)単一細胞試験法の場合、ヘテロ接合性のSNPのみを用いて計算した平均単一試験ドロップアウト率は、わずか0.05%(範囲:0.00〜0.43%)であった。さらに、信頼度の高い遺伝型(すなわち、少なくとも98%の信頼度で決定されたSNP遺伝型)を有するSNPの割合は、単一細胞試料および大容量試料の両方で類似し、単一細胞試料の遺伝型は大容量試料と一致した(平均99.52%、範囲:92.63%〜100.00%)。
腫瘍細胞の試料とは異なり、単一細胞では、アレル頻度は染色体コピー数を直接反映すると期待されるが、THおよび腫瘍細胞でない不純物によって誤解を招く可能性がある。Bアレル頻度1/nおよび(n−1)/nは、n個の染色体コピーが領域に存在することを示す。単一細胞試料とゲノムDNA試料について、染色体コピー数をアレル頻度のグラフ上に示す(図65)。
血液試料へのCoNVERGeの応用
実際の血漿試料でのCoNVERGeのCNV検出能力を調べるため、この手法を、2名のステージIIの乳癌患者と5名の後期卵巣癌患者のそれぞれから採取した腫瘍生検と対応対にした無細胞DNAに応用した。7名の患者全員で、FF腫瘍組織にも対応する血漿試料にもCNVが検出された(図66)。図67はSNV乳癌変異のリストである。試験した5つの領域にわたり、合計で32個のCNV(AAIレベル≧0.45%)が7個の血漿試料で検出された(範囲:0.48%〜12.99%AAI)。これはゲノムの約20%にあたる。当然ながら、他の直交方法が存在しないため、血漿中のCNVの存在は確認できない。
AAI推定値は腫瘍のBアレル頻度と相関するように見えるが、腫瘍がヘテロ接合性であるため、直接の比例関係は期待されない。たとえば、試料BC5(図66a)では、図66aの左上部の楕円は、N=11と両立するBアレル頻度を有する領域を示す。このことを血漿試料に基づくAAIの計算と組み合わせると、2つの領域に関してcが2.33%および2.67%と推定される。血漿中の他の領域を用いてcを推定することによって4.46%〜9.53%の値が得られ、腫瘍のヘテロ接合性の存在がはっきりとわかる。
これらのデータは試料のうちの大部分で血漿にCNVが検出できることを示し、腫瘍にCNVが多くみられるほどCNVが無細胞DNAで観測される可能性が高いことを示唆する。さらに、CoNVERGeは従来の腫瘍生検では発見できなかったかもしれないCNVを液体細胞診試料から検出した。
実施例9
本実施例では、様々な種類の試料をCoNVERGeで分析するために用いる試料調製方法の一例の詳細を説明する。
28,000プレックスPCRに関する単一細胞CNVプロトコル
多重化PCRは、多数の標的を1つの反応で同時に増幅できる。標的SNPを、10%の最小の集団である少数アレル頻度を持つ各ゲノム領域で確認した(1000 Genomes Projectデータ:2012年4月30日発表)。各SNPについて、準入れ子の複数のプライマーを、最大長75bpの増幅産物を生成し、かつ融解温度が54℃〜60.5℃となるように設計した。プライマーの考えられるすべての組み合わせについてプライマー相互作用スコアを計算した。スコアの高いプライマーを排除してプライマー二量体産物が形成される可能性を低減した。候補PCR試験法を、標的SNPのマイナーアレル頻度と、観測されたヘテロ接合体率と、HapMapに存在するかどうかと、増幅産物の長さとを基準にランク付けして選択した。
一実験では、単一細胞試料を調製し、超多重化PCRの28,000プレックスプロトコルを用いて増幅した。試料は以下の方法で調製した:単一細胞を分析するため、1滴あたり3個または4個の細胞が存在するように細胞を段階希釈した。個々の細胞をピペットで取り、PCR管に入れた。この細胞をプロテアーゼK、塩、DTTを用いて、以下の条件で溶解した。すなわち、56℃で20分間、95℃で10分間、次いで4℃で保持。ゲノムDNAを分析するため、分析した単一細胞と同じ細胞株由来のDNAを、購入するか、細胞を増殖させてDNAを抽出することによって得た。Qiagen(登録商標)mp-PCRマスターミックス(終濃度2×MM)とプライマー(濃度7.5nM)を含む40μLの反応容量で、半入れ子にした逆方向プライマーを含む28Kプライマー対について、以下の条件でDNAを増幅した。すなわち95℃で10分間の後、(96℃で30秒間、65℃で29分間、72℃で30秒間)を25サイクル、72℃で2分間、次いで4℃で保持。増幅産物を1:200で水に希釈し、2μLをSTAR2(反応容量10μL(1×MM、プライマー濃度5nM))に添加し、内側順方向プライマーとタグ特異的な逆方向プライマーを半入れ子にして用いてPCRを実施した。すなわち、95℃で15分間の後、(94℃で30秒間、65℃で1分間、60℃で5分間、65℃で5分間、72℃で30秒間)を25サイクル、72℃で2分間、最後に4℃で保持。
全長配列のタグとバーコードを増幅産物に付加し、アダプターに特異的なプライマーを用いて9サイクルかけて増幅した。配列決定の前にバーコードライブラリ産物をプールし、QIAquick(登録商標)PCR Purification Kit (Qiagen)を用いて精製し、Qubit(登録商標)dsDNA BR Assay Kit(Life Technologies)を用いて定量した。Illumina HiSeq 2500 sequencerを用いて増幅産物を配列決定した。
血液/血漿試料からのDNA抽出
血液試料をEDTA管に採取した。全血試料を遠心分離して3つの層に分離した:血液試料の上層55%は血漿であり無細胞DNAを含み、中間層であるバフィーコートはDNA(全体の<1%)を有する白血球を含み、また採取した血液試料の45%である下層には赤血球が含まれていたが、この画分には赤血球が除核されているためDNAは存在しなかった。QIAamp(登録商標)Circulating Nucleic Acid Kit、Qia-Amp(Qiagen, Valencia, CA)を製造元のプロトコルに従って用い、少なくとも1mLの血漿から循環腫瘍DNAを単離した。
染色体1p、1q、2p、2q、22q11の3,168プレックスに関する血漿CNVプロトコル
血漿DNAライブラリを調製し、超多重PCR3,168プレックスプロトコルを用いて増幅した。試料は以下のように調製した:最大20mLの血液を遠心分離してバフィーコートと血漿を単離した。無細胞循環腫瘍DNAを血漿から抽出し、ライブラリを調製した。DNAを50μLのTE緩衝液で溶離した。超多重PCRへの使用量は、約1200ngの使用量で増幅・精製したNatera血漿ライブラリのうち6.7μLであった。血漿DNAを、Qiagen(登録商標)mp-PCRマスターミックス(最終濃度2×MM)と3,168プレックスプライマープールのタグ付きプライマー(濃度2nM)を含む20μLの反応容量でPCR増幅した。すなわち、95℃で10分間の後、(96℃で30秒、65℃で20分間、72℃で30秒間)を25サイクル、さらに72℃で2分間、最後に4℃で保持した。増幅産物を1:2000で水に希釈し、1μLを10μLの反応容量のバーコーディングPCRに添加した。バーコードは、タグ特異的なプライマーを用いた12サイクルのPCR増幅によって付加する。複数の試料の産物をプールし、次いでQIAquick PCR Purification Kit (Qiagen)で精製し、50μLのDNA懸濁用緩衝液で溶離した。28,000プレックスPCRに関する単一細胞のCNVプロトコルについて記載したのと同様に試料を次世代配列決定で配列決定する。
血漿由来のSNVパネルの乳癌に関する実現可能性
乳癌患者の血液試料由来の無細胞DNAを調製し、4つの84プレックスプールに分けた336プライマー対を用いて増幅した。染色体1p、1q、2p、2q、22q11の3,168プレックスに関する血漿CNVプロトコルに記載したのと同様にNatera血漿ライブラリを調製した。DNAを50μLのTE緩衝液で溶離した。超多重PCRへの使用量は、使用量約600ngでは増幅・精製したNatera血漿ライブラリのうち2.5μLであった。図68A〜Bは、3168プレックスの超多重PCR反応に用いたSNPの多数アレル頻度と少数アレル頻度を示す。横軸はSNPの数(左から順に染色体1q、1p、2q、2p、22q)を示す。SNPを1000 Genomes map for Humans, Group 19とdbSNPから選択して対象を選んだが、1000 Genomesから選択したSNPのみを用いてスクリーニングし、少数アレル頻度を得た。84プレックスプライマープール(反応容量10μL、Qiagen mp-PCRマスターミックス(最終濃度2×MM)、4mM EDTA、プライマー濃度7.5nM(合計1.26μM))の4つの反応を並行して行い、血漿DNAをPCR増幅した。すなわち95℃で15分間の後、(94℃で30秒間、65℃で15分間、72℃で30秒間)を25サイクル、72℃で2分間、最後に4℃で保持した。4つのサブプールの増幅産物をそれぞれ1:200で水に希釈し、1μLを10μLの反応容量(Q5 HS HF master mix(終濃度1×)、1μMの各バーコーディングプライマーを含む)のバーコーディングPCRに加え、プールの各々を以下の条件で増幅した。すなわち98℃で1分間の後、(98℃で10秒間、70℃で10秒間、60℃で30秒間、65℃で15秒間、72℃で15秒間)を25サイクル、72℃で2分間、最後に4℃で保持した。ライブラリをQIAquick(登録商標)PCR Purification Kit(Qiagen)で精製し、50μLのDNA懸濁用緩衝液で溶離した。試料をペアエンド配列決定で配列決定した。
実施例10
本実施例では、配列決定データを分析してSNVを確認するための方法の一例に関して詳細を説明する。
SNV確認方法1:この態様では、実行回ごとの特異的な人為的結果を説明するため、同じ実行回で配列決定された正常な血漿試料を用いて背景エラーモデルを構築した。一部の態様では、5個、10個、15個、20個、25個、30個、40個、50個、100個、150個、200個、250個、または250個超の正常な血漿試料を同じ実行回の配列決定で分析した。一部の例示の態様では、20個、25個、40個、または50個の正常な血漿試料を同じ実行回の配列決定で分析する。多様体アレル頻度の中央値がカットオフ値を超える正常値である、ノイズの多い位置を除外する。たとえば、一部の態様ではこのカットオフ値は>0.1%、0.2%、0.25%、0.5%、1%、2%、5%または10%である。一部の例示の態様では、多様体アレル頻度の中央値が0.5%超の正常値である、ノイズの多い位置を除外する。異常値試料を反復的にモデルから除外し、ノイズと不純物を説明する。一部の態様では、zスコアが5超、6超、7超、8超、9超、または10超の試料をデータ分析から除外した。すべてのゲノムの座位の各塩基置換について、リード深度で加重した、エラーの平均値および標準偏差を計算した。腫瘍または無細胞血漿試料の、少なくとも5個の多様体のリードがありzスコアが背景エラーモデルに対して10であった位置を候補変異と呼んだ。
SNV確認方法2:本実施例では、血漿中の無細胞循環腫瘍DNAデータを用いて一塩基多様体(SNV)を決定することを目的とする。PCR工程を確率過程としてモデル化し、訓練セットを使用してパラメータを推定し、別個の試験セットを使用して最終SNV検出を行う。主要な考え方は、複数のPCRサイクルにわたる誤差の伝搬を決定し、背景誤差の平均と分散を計算し、背景誤差を実変異と区別することである。
各塩基について以下のパラメータを推定する:
p=効率(各リードが各サイクルで複製される確率)
=変異タイプeに関するサイクル当たりのエラー率(タイプeのエラーが起こる確率)
=最初の分子数
リードをPCR工程の過程で複製するにつれ、より多くのエラーが発生する。したがって、リードのエラーの特性は元のリードからの分離度によって決定される。k回の複製を経て生成されたリードをkth世代とする。
各塩基について以下の変数を定義する:
ij=PCRのjサイクル目で生成される世代のリード数
ij=j回目のサイクル終了時の世代iのリード数の合計
ij =PCRのjサイクル目で生成される、変異eを有する世代iのリード数
また、正常な分子分子Xの他に、変異eを有するf個の分子がPCR工程の開始時に存在する(したがってfe/(1+fe)は最初の混合物に含まれる変異分子の比率である)。j−1サイクル目の世代i−1のリード総数が与えられると、jサイクル目で生成される世代iのリード数は、試料のサイズYi−1j−1および確率パラメータpを含む二項分布を有する。したがって、E(Xij,|Yi−1,j−1,p)=pYi−1,j−1かつVar(Xij,|Yi−1,j−1,p)=p(1−p)Yi−1,j−1である。
また、
である。したがって、回帰、シミュレーション、または類似の方法によってE(Xij,)を決定することができる。同様に、Var(Xij)=E(Var(Xij,|p))+Var(E(Xij,|p))を、pの分布を用いて決定できる。最後に、E(Xij |Yi−1,j−1,p)=pi−1,j−1であり、Var(Xij |Yi−1,j−1,p)=p(1−p)Yi−1,j−1であり、これらを用いてE(Xij )とVar(Xij )を計算できる。
20.
6+.2アルゴリズム
まず、アルゴリズムはトレーニングセットを用いてサイクル当たりの効率およびエラー率を推定する。nをPCRサイクル数の合計とする。
各塩基の総リード数Rは、(1+p(式中、pは塩基bでの効率である)によって近似できる。次に(R/X1/nを用いて1+pを近似できる。次に、すべての訓練用試料にわたってpの平均および標準偏差を決定し、各塩基の確率分布のパラメータ(正規分布、ベータ分布、または類似の分布など)を推定することができる。
同様に、各塩基bでのエラーeのリードR の数を用いてpを推定できる。すべての訓練用試料のエラー率の平均と標準偏差を決定した後、この平均値と標準偏差値を使用してパラメータを推定した確率分布(正規分布、ベータ分布、または類似の分布など)を近似する。
次に、試験データについて、各塩基の最初の開始コピーを以下のように推定する:
(式中、f(.)は訓練セットから得た推定分布である)。
したがって、確率過程において使用するパラメータを推定した。次に、これらの推定値を使用して、各サイクルで生成される分子の平均と分散を推定できる(なお、推定は正常な分子、エラー分子、および変異分子について個別に行う)。
最後に、確率論的方法(最尤法または類似の方法など)を使用することによって、エラー分子、変異分子、および正常分子の分布に最も適合する最良のf値を決定できる。より具体的には、最終リードにおける様々なf値について誤差分子の全体分子に対する比の期待値を推定し、これらの値のそれぞれについてデータの尤度を決定し、次に最も尤度の高い値を選択する。
ある態様では、上記方法2を以下のように実行する:
a)サイクル当たりのPCR効率とエラー率を、訓練データセットを用いて推定し;
b)工程(a)で推定した効率の分布を用いて、各塩基の試験データセットに関する開始分子の数を推定し;
c)必要であれば、工程(b)で推定した開始分子数を用いて、試験データセットに関する効率の推定値を更新し;
d)工程(a)、(b)、(c)で推定した試験セットデータとパラメータを用いて、(ある初期の実変異分子率を有する調査領域に関する)総分子数、背景エラー分子数および実変異分子数に関する平均および分散を推定し;
e)分布を分子全体におけるエラー分子全体(背景エラー分子および実変異分子)に適合させることによって、調査領域における各実変異率に関する尤度を計算し;
f)最も尤度の高い実変異率を決定し、工程(e)で得たデータを用いて信頼度を計算する。
実施例11
本実施例では、循環DNA中のCNVを検出することによって癌を検出するための、本明細書に記載の多重化PCR・CoNVERGe法を用いた結果を記載する。本明細書に記載の染色体1p、1q、2p、2q、および22q11の3,168プレックスに関する血漿CNVプロトコルを使用した。21名の乳癌患者(ステージI〜IIIB)から採取した血漿を分析した。図44に示す結果から、AAI≧0.45%としたすべてのサンプルでCNVが検出され、わずか62個のヘテロ接合性のSNPのみが必要だったことがわかる。類似のプロトコルを用いて、卵巣癌患者から採取した血漿を分析した。図45に示すように、0.45%のカットオフ値を用いて100%の卵巣癌検出率を達成した。5個の試料のそれぞれには対応する腫瘍試料も存在した。
実施例12
本実施例では、血漿中のCNVとSNVの存在を試験することで癌検出能力が劇的に改善したことを示す。上記の実施例に記載の方法でCNVおよびSNVを検出した。試料は実施例9の適切なプロトコルに従って調製した。SNVに関する上記方法1を用いてSNVを確認した。図46に示すように、ステージI〜IIIの癌患者の血漿をCNVおよびSNVの両方について分析することによって、SNV単独について試験する場合と比較して、乳癌および肺癌の検出感度が大きく改善される。SNVを単独で分析した場合、癌の71%が血漿試料で検出されたが、SNVおよび/またはCNVの有無について分析することによって、検出率は分析対象の母集団のうち乳癌では83%、肺癌では92%に上昇した。TCGAおよびCOSMICデータセットで確認されたすべてのSNVおよびCNVについて考慮する場合、診断負荷の期待値は、乳癌では97%を超え、肺癌では98%を超える。
さらに、実施例9に記載の血漿試料調製方法と上記のSNV確認方法1を用いて、病期の異なる41名癌患者の試料を分析した。図47に示すように、乳癌患者の腫瘍DNA中のCNVとSNVについて試験した場合、SNVについては0.2%無細胞循環腫瘍DNA、CNVについては0.45%無細胞循環腫瘍DNAの定量限界を用いて、ステージIの60%、ステージIIの88%、ステージIIIの100%の乳癌が検出された。
図48に示すように、無細胞循環腫瘍DNA中のCNVとSNVについて、病期の小区分が異なる41名の乳癌患者の試料に注目して試験した場合、SNVについては0.2%無細胞循環腫瘍DNA、CNVについては0.45%無細胞循環腫瘍DNAの定量限界を用いて、ステージIの60%、ステージIIの100%、ステージIIAの90%、ステージIIBの80%、ステージIII、IIIA、IIIBの100%の乳癌が検出された。図49に示すように、24個の肺癌患者の試料から得た無細胞循環腫瘍DNAでCNVとSNVについて試験した場合、SNVについては0.2%無細胞循環腫瘍DNA、CNVについては0.45%無細胞循環腫瘍DNAの定量限界を用いて、ステージIの88%、ステージIIの100%、ステージIIIの100%の肺癌が検出された。図50に示すように、病期の小区分が異なる24個の肺癌患者の試料に着目して無細胞循環腫瘍DNAでCNVとSNVについて試験した場合、SNVについては0.2%無細胞循環腫瘍DNA、CNVについては0.45%無細胞循環腫瘍DNAの定量限界を用いて、ステージIBの肺癌患者では82%の検出率であったことを除けば、すべての病期小区分で100%の検出率が得られた。
実施例13
本実施例では、無細胞循環腫瘍DNA中のSNVの検出が、生検試料で多様体アレルを識別する際の腫瘍の異質性に起因する検出限界を克服することを実証する。3名の小細胞肺癌患者の試料のTRACERx試料と1名の線癌・肺癌患者の試料(腫瘍生検と、対応する術前血漿試料を採取した)を腫瘍の異質性の分析に使用した。試料は、Cancer Research UK Lung Cancer Centre of Excellence, University College London Cancer Institute(London WC1E 6BT, UK)から入手した。試料は、SNV変異分析用の原発性肺癌試料であった。各患者の癌を有する肺全体の様々な領域から2個〜3個の生検を採取した(図51A)。根本的なクローンの異質性を識別するため、各生検試料を全エキソン配列決定(Illumina(登録商標)HiSeq200; Illumina、San Diego、CA)した後、PGM(登録商標)の装置でAmpliSeq(登録商標) sequencing(Ion Torrent、South San Francisco、CA)することによって試験した。SNV分析の後、各生検試料について多様体アレル頻度(VAF)を決定した(図51B)。
4名の患者それぞれから採取した血漿試料を用いて無細胞循環腫瘍DNAを単離し、クローンSNV変異とサブクローンSNV変異が血漿で確認され、腫瘍の異質性が克服された(図52)。クローン集団では、試験したすべての生検試料と血漿のVAFの検出があったが、サブクローン集団では、少なくとも1個の(すべてではない)生検試料でVAFアレルの検出があった。これらの血漿を各患者の無細胞循環腫瘍DNAに見られるSNVの累積代表値とみなした。配列決定により確認したすべてのSNVについて対応するPCR試験法を設計できたわけではない。
腫瘍の異質性を確認するためのAmpliSeq(商標)(Swanton)と超多重化PCR/次世代配列決定の試験方法を比較するため、Nateraは、生検とそれに対応する血漿由来無細胞循環腫瘍DNAの両方で各SNV変異についてVAFを検出するためのPCR試験法を設計した(図53)。空欄は入手可能な生検試料を示し、値がゼロの場合、VAFが検出されなかったことを示す。以下の11個の遺伝子はAmpliSeq(商標)のFP(偽陽性)/FN(偽陰性)試験法で最初は陰性として認識された(偽のVAF検出)がNateraのTP(真陽性)/TN(真陰性)試験法と多重化PCR/次世代配列決定による分析方法で正しく検出された:L12:CYFIP1、FAT1、MLLT4、およびRASA1;L13:HERC4、JAK2、MSH2、MTOR、およびPLCG2;L15:GABRG1;L17:TRIM67。予想外にも、AmpliSeq(商標)の配列決定生データを再試験すると、これらの結果が検証された。AmpliSeq(商標)配列決定生データのファイルから、このデータがPGM(登録商標)やIllumina(登録商標)の検出可能閾値の設定に満たないことがわかった。データから、38個のうち16個の多様体が血漿で検出され、L12患者試料ではクローンSNV変異を主に有していた数個の生検試料があったことが確認できた:L12:BRIP1、CARS、FAT1、MLLT4、NFE2L2、TP53、TP53(以下でも同様:L13患者:EGFR、EGFR、TP53;およびL15患者:KDM6A、ROS1)。さらに2名の患者が合計で4個のサブクローン多様性変異を血漿中に有していることがわかった(L12:CIC、KDM6A;およびL17:NF1、TRIM67)。これらの結果が図54Aに要約されている。図54Aは、図53に記載した各試料に関する、各試験方法による平均VAF値の箱ひげ図である。図54Bは、各試験法のVAF値の試料平均の直線回帰図で表した直接比較である。
実施例14
本実施例では、次世代配列決定に続くワークフローでプライマー量が多重PCRの反応物を制限するような低いプライマー濃度を用いることによって、増幅反応のプール全体のリード深度(したがって検出限界)が改善されることを実証する。全体の反応容量を20μLでなく10μLとした以外は上記の実施例9に従い、3,168プレックスパネルを用いていくつかの実験を血漿CNVについて行った。さらに、PCRを15サイクル、20サイクル、または25サイクルかけて実施した。プライマー濃度を2nMにした以外は実施例9のプロトコルに従い、乳癌試料で4つの84プレックスプールを用いて他の実験を実施し、PCR増幅を15サイクル、20サイクル、または25サイクル実施した。
理論によって制限するものではないが、プライマーを制限した多重PCRでは、多重PCR後にマルチリード配列決定(たとえばIllumina(登録商標)のHiSeqまたはMiSeqシステム、あるいはIon Torrent PGM(登録商標)またはProton(商標)システムでの配列決定)を行う場合に、以下の考察に基づき、リード深度の均一性が改善されると考えられている。多重PCRの増幅の一部の効率が他の増幅よりも低い場合、通常の多重PCRではリード深度(depth of read;「DOR」という)の値が広範囲になる。しかし、プライマー量を制限し、かつプライマーを使い果たすのに必要なサイクル数よりも多いサイクル数で多重PCRを行う場合、増幅効率が高いほど倍増が停止し(使用するプライマーがなくなっているため)、効率が低いほど倍増が継続する。その結果、すべての増幅産物に関して増幅産物量が同様になる。このことによってDORの分布がはるかに均一になる。
以下の計算を用いて、所定量のプライマーと開始核酸鋳型を必要とすると考えられるサイクル数を決定する:
所定の開始DNA使用量を各標的100kコピー(10;これは増幅したライブラリを用いて容易に得られる)と仮定する;
例示の濃度として2nMの各プライマーを用いると仮定する(ただし、たとえば0.2nM、0.5nM、1nM、1.5nM、2nM、2.5nM、5nM、または10nMなどの他の濃度も使用できると考えらえる);
各プライマーについてプライマー分子数を計算する:2×10−9(モル濃度2nM)×10×10−6(反応容量10μL)×6×1023(モル当たりの分子数、アボガドロ数)=12×10
プライマーをすべて使うのに必要な増幅倍数を計算する:12×10(プライマー分子の数)/10(各標的のコピー数)=12×10
各サイクルの効率が100%と仮定し、この増幅倍数を達成するのに必要なサイクル数を計算する:log2(12×10)=17サイクル(各サイクルでコピー数が倍になるためlog2とする)。
したがって、この条件(使用量100kコピー、プライマー2nM、反応容量10μL、各サイクルのPCR効率は100%と仮定する)の場合、プライマーは17サイクルのPCRで消費される。
しかし、重要な前提として、産物の一部は100%の効率ではないため、効率の測定を行わない場合(いずれにせよ少数を用いる場合にしか実用的ではないが)、プライマーを使いきるのに17サイクルを超えるサイクル数が必要となる場合がある。
図55〜図58は、SNVの4つの84プレックスPCRプライマープールに関する結果を示す。各プールについて、サイクルを15サイクルから20サイクル、25サイクルへと増やすにつれDOR効率の改善が認められた。3,168プレックスパネルを用いた実験でも似た結果が得られた(図59〜図61)。リード深度を上げるにつれて検出限界は下がった(すなわち、SNV感度が高くなった)。さらに、感度は一貫して、塩基転換変異の検出の場合の方が転移変異の検出の場合よりも高かった。プライマーを制限した多重PCRをマルチリード配列決定の前に行うと追加のサイクルでDOR効率をさらに上げることができる可能性が高い。
したがって、本明細書に記載の一側面に、以下の方法が挙げられる:核酸試料中の複数の標的座位を増幅する方法であって、(i)核酸試料をプライマーのライブラリおよび他のプライマー伸長成分と接触させて反応混合物を生成すること(ここで、反応混合物中の他のプライマー伸長反応成分と比較した各プライマーの相対量によって、プライマーが限界濃度で存在するような反応が生じ、プライマーは複数の異なる標的座位とハイブリダイズする);(ii)反応混合物を、プライマーライブラリ中のプライマーが消費またはすべて使用されるのに十分なサイクル数でプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成することを含む、方法。たとえば、複数の異なる標的座位としては、少なくとも2個、3個、5個、10個、25個、50個、100個、200個、250個、500個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、または100,000個の異なる標的座位であり、最大で50個、100個、200個、250個、500個、1,000個、2,000個、5,000個、7,500個、10,000個、20,000個、25,000個、30,000個、40,000個、50,000個、75,000個、100,000個、200,000個、250,000個、500,000個、および1,000,000個の異なる標的座位を用いて反応混合物を生成することができる。
例示の態様は、プライマーの量を律速量に決定することを含む。この計算は、一般的には標的分子数の推定および/または決定を含み、実行した増幅サイクル数の分析および/または決定を含む。たとえば、例示の態様では、各プライマーの濃度は、100nM未満、75nM未満、50nM未満、25nM未満、10nM未満、5nM未満、2nM未満、1nM未満、0.5nM未満、0.25nM未満、0.2nM未満、または0.1nM未満である。様々な態様では、プライマーのGC含量は30%〜80%であり、たとえば40%〜70%または50%〜60%(それぞれ、範囲の上限と下限を含む)である。一部の態様では、プライマーのGC含量の範囲(たとえば、最大GC含量−最小GC含量(たとえば80%−60%=20%の範囲))は、30%未満、20%未満、10%未満、または5%未満である。一部の態様では、プライマーの融解温度(T)は、40℃〜80℃であり、たとえば50℃〜70℃、55℃〜65℃、または57℃〜60.5℃(それぞれ、範囲の上限と下限を含む)である。一部の態様では、プライマーの融解温度の範囲は、20℃未満、15℃未満、10℃未満、5℃未満、3℃未満、または1℃未満である。一部の態様では、プライマーの長さは、15〜100ヌクレオチドであり、たとえば、15〜75ヌクレオチド、15〜40ヌクレオチド、17〜35ヌクレオチド、18〜30ヌクレオチド、20〜65ヌクレオチド(それぞれ、範囲の上限と下限を含む)である。一部の態様では、プライマーは、内部ループ構造を形成するタグなどの、標的特異的ではないタグを含む。一部の態様では、タグは2つのDNA結合部位に存在する。様々な態様では、プライマーは標的座位に特異的な5’領域と、標的座位に特異的ではなくループ構造を形成する内部領域と、標的座位に特異的な3’領域とを含む。様々な態様では、3’領域の長さは少なくとも7ヌクレオチドである。一部の態様では、3’領域の長さは7〜20ヌクレオチドであり、たとえば、7〜15ヌクレオチド、または7〜10ヌクレオチド(それぞれ、範囲の上限と下限を含む)である。様々な態様では、試験プライマーは、標的座位に特異的ではない5’領域(タグまたは汎用プライマー結合部位など)と、それに続いて標的座位特異的な領域と、標的座位に特異的ではなくループ構造を形成する内部領域と、標的座位に特異的な3’領域とを含む。一部の態様では、プライマーの長さの範囲は50ヌクレオチド未満、40ヌクレオチド未満、30ヌクレオチド未満、20ヌクレオチド未満、10ヌクレオチド未満、または5ヌクレオチド未満である。一部の態様では、標的増幅産物の長さは50〜100ヌクレオチドであり、たとえば60〜80ヌクレオチド、または60〜75ヌクレオチド(それぞれ、範囲の上限と下限を含む)である。一部の態様では、標的増幅産物の長さの範囲は、100ヌクレオチド未満、75ヌクレオチド未満、50ヌクレオチド未満、25ヌクレオチド未満、15ヌクレオチド未満、10ヌクレオチド未満、または5ヌクレオチド未満である。
本発明のいずれかの側面の様々な態様では、プライマー伸長条件は、ポリメラーゼ連鎖反応(PCR)条件である。様々な態様では、アニーリング工程の長さは、3分超、5分超、8分超、10分超、または15分超、かつ240分未満、120分未満、60分未満、または30分未満である。様々な態様では、伸長工程の長さは、3分超、5分超、8分超、10分超、または15分超であり、240分未満、120分未満、60分未満、または30分未満である。
実施例15
本実施例では、本発明のSNV検出方法が単一細胞分析(単一分子分析ともいう)でモザイク現象を確認する能力を実証する。図62は、実施例9に記載の28Kプレックスプライマーセットを用いた28K単一細胞法に従い腫瘍細胞のゲノムDNAと単一細胞/分子を使用して得た多重PCRの結果を示す。この方法を用いて、4.7Mリード以上のリードのうち85%超をマッピングした(標的あたり約167リード)。図の下部から、細胞にモザイク現象が見られたことがわかる。

Claims (32)

  1. 個体の試料に含まれる染色体分節の倍数性を決定する方法であって、該方法は、
    a.該試料中の該染色体分節にある多型座位の集合のうちの各座位に存在する各アレルの量を含む、該試料から得られたアレル頻度データを受け、
    b.該アレル頻度データの相を推定することによって該多型座位の集合に関する相決定済み(phased)アレル情報を作成し、
    c.該アレル頻度データを用いて、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、ここで前記個別確率は、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて作成され、
    d.該個別確率と該相決定済みアレル情報を用いて該多型座位の集合に関する同時確率を作成し、ここで前記同時確率は、前記染色体分節にある多型座位間の連鎖を考慮することによって作成され、
    e.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、該染色体分節の倍数性を決定すること
    とを含み、
    ここで該試料は、癌を有すると考えられる個体から得た血液試料、血清試料、又は血漿試料であり、
    ここで該方法は、前記選択に基づき該個体の腫瘍細胞にコピー数多様性が存在するかを決定することをさらに含む、方法。
  2. 前記アレル頻度データが核酸配列データから作成される、請求項1に記載の方法。
  3. 前記アレル頻度データの誤差を修正することと、修正済みアレル頻度データを前記個別確率の作成工程に使用することとをさらに含み、修正される前記誤差がアレル増幅効率の偏りである、請求項1に記載の方法。
  4. 個体の試料の染色体倍数性を検出するための方法であって、該方法は、
    a.該個体の染色体分節にある多型座位の集合に存在するアレルに関する核酸配列データを受け、
    b.該核酸配列データを用いて該多型座位の集合におけるアレル頻度を検出し、
    c.検出された該アレル頻度のアレル増幅効率の偏りを修正することによって、該多型座位の集合に関する修正済みアレル頻度を作成し、
    d.該核酸配列データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、
    e.該修正済みアレル頻度を該多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、
    f.該個別確率を該染色体分節にある多型座位間の連鎖を考慮しながら組み合わせることにより、該多型座位の集合に関する同時確率を作成し、
    g.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択すること
    とを含み、
    ここで該試料は、癌を有すると考えられる個体から得た血液試料、血清試料、又は血漿試料であり、
    ここで該方法は、前記選択に基づき該個体の腫瘍細胞にコピー数多様性が存在するかを決定することをさらに含む、方法。
  5. 前記染色体分節の第一の相同体と該染色体分節の第二の相同体の倍数性状態をモデリングすることによって個別確率を作成する、請求項1〜4のいずれか一項に記載の方法であって、該倍数性状態が、
    (1)いずれの細胞も該染色体分節の該第一の相同体または該第二の相同体の欠失または増幅を有していない状態、
    (2)少なくとも一部の細胞が該染色体分節の該第一の相同体の欠失、または該第二の相同体の増幅を有する状態、および
    (3)少なくとも一部の細胞が該染色体分節の該第二の相同体の欠失、または該第一の相同体の増幅を有する状態
    である、方法。
  6. 修正されるエラーが環境不純物および遺伝型解析による不純物を含み、前記試料中のホモ接合アレルに関して測定される、請求項5に記載の方法。
  7. 前記選択が、前記モデルに関して作成された前記相決定済みアレル情報と推定アレル頻度との差異の大きさを分析することによって実行され、差異の大きさが最も小さいモデルが選択される、請求項5に記載の方法。
  8. アレル頻度の前記個別確率が、前記多型座位の集合におけるアレル頻度の期待値と観測値のベータ二項モデルに基づいて作成される、請求項1〜7のいずれか一項に記載の方法。
  9. 前記個別確率がベイズ分類器を用いて作成される、請求項1〜7のいずれか一項に記載の方法。
  10. 前記核酸配列データが、多重増幅反応によって生成された一連の増幅産物の複数のコピーの高処理DNA配列決定を実行することによって作成され、ここで、該一連の増幅産物のうちの各増幅産物は、前記多型座位の集合のうちの少なくとも1つの多型座位にわたり、該多型座位の集合のうちの各多型座位が増幅される、請求項2又は4に記載の方法。
  11. 前記多重増幅反応が制限的なプライマー条件で実行される、請求項10に記載の方法。
  12. 前記試料に含まれる染色体分節の集合について染色体倍数性が決定される、請求項10に記載の方法。
  13. 前記多重増幅反応が1,000〜100,000プレックスの多重反応を含む、請求項10に記載の方法。
  14. 0.45%以上の平均アレル不均衡率が、該個体の腫瘍細胞にコピー数多様性が存在することを示す、請求項1〜7のいずれか一項に記載の方法。
  15. 前記試料が、固形腫瘍を有していたことが知られている個体から得た血漿試料である、請求項1〜7のいずれか一項に記載の方法。
  16. 標的となる複数の一塩基多様体のセットのうち何れかの一塩基多様体が前記試料に存在するか否かを決定することをさらに含み、ここで、該コピー数多様性および/または該一塩基多様体の検出は前記試料中に循環腫瘍核酸が存在することを示す、請求項1〜7のいずれか一項に記載の方法。
  17. 前記個体の腫瘍に関する前記染色体分節のハプロタイプ情報を受けることと、該ハプロタイプ情報を用いて、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の前記モデルのセットを作成することをさらに含む、請求項15に記載の方法。
  18. 前記方法が、既知の平均アレル不均衡比を有する対照試料に対して該方法を実行することをさらに含む、請求項1〜7のいずれか一項に記載の方法。
  19. 前記修正済みアレル頻度を前記モデルのセットと比較する前に該修正済みアレル頻度のデータから異常値を除外することをさらに含む、請求項1〜7のいずれか一項に記載の方法。
  20. 個体の試料の染色体倍数性を検出するためのシステムであって、該システムは、
    a.該試料中の該染色体分節にある多型座位の集合のうちの各座位に存在する各アレルの量を含む、該試料から得られたアレル頻度データを受けるよう構成された入力プロセッサと、
    b.モデラーであって、
    i.該アレル頻度データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、
    ii.該アレル頻度データを用いて、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、ここで前記個別確率は、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて作成され、
    iii.該個別確率と該相決定済みアレル情報を用いて該多型座位の集合に関する同時確率を作成し、ここで前記同時確率は、前記染色体分節にある多型座位間の連鎖を考慮することによって作成される
    よう構成されたモデラーと、
    c.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、該染色体分節の倍数性を決定するよう構成された、仮説管理部(hypothesis manager)
    とを含み、
    ここで該試料は、癌を有すると考えられる個体から得た血液試料、血清試料、又は血漿試料であり、
    ここで該仮説管理部はさらに、前記選択に基づき該個体の腫瘍細胞にコピー数多様性が存在するかを決定するよう構成される、システム。
  21. 前記アレル頻度データが核酸配列決定システムによって作成される、請求項20に記載のシステム。
  22. 前記アレル頻度データの誤差を修正するよう構成された誤差修正部をさらに含み、ここで、修正済みアレル頻度データが前記個別確率の作成工程に用いられ、前記誤差修正部がアレル増幅効率の偏りを修正する、請求項21に記載のシステム。
  23. 個体の試料の染色体倍数性を検出するためのシステムであって、該システムは、
    a.該個体の染色体分節にある多型座位の集合に存在するアレルに関する、該試料から得られた核酸配列データを受け、該核酸配列データを用いて該多型座位の集合におけるアレル頻度を検出するよう構成された入力プロセッサと、
    b.検出された該アレル頻度の誤差を修正し、該多型座位の集合に関する修正済みアレル頻度を作成するよう構成された誤差修正部と、
    c.モデラーであって、
    i.該核酸配列データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、
    ii.該相決定済みアレル情報を該多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、
    iii.該個別確率を該染色体分節にある多型座位間の相対的距離を考慮しながら組み合わせることにより、該多型座位の集合に関する同時確率を作成する
    よう構成されたモデラーと、
    d.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択するよう構成された仮説管理部
    とを含み、
    ここで該試料は、癌を有すると考えられる個体から得た血液試料、血清試料、又は血漿試料であり、
    ここで該仮説管理部はさらに、前記選択に基づき該個体の腫瘍細胞にコピー数多様性が存在するかを決定するよう構成される、システム。
  24. 前記仮説管理部が、前記モデルに関して作成された前記相決定済みアレル情報と推定アレル頻度との差異の大きさを分析することによって選択を行い、差異の大きさが最も小さいモデルを選択する、請求項23に記載のシステム。
  25. 前記モデラーが、前記多型座位の集合におけるアレル頻度の期待値と観測値のベータ二項モデルに基づいてアレル頻度の前記個別確率を作成する、請求項24に記載のシステム。
  26. 個体の試料の染色体倍数性を検出するための非一過性のコンピュータ可読媒体であって、該媒体はコンピュータ可読コードを含み、該コードを処理装置で実行することにより、該処理装置が、
    a.該試料中の該染色体分節にある多型座位の集合のうちの各座位に存在する各アレルの量を含む、該試料から得られたアレル頻度データを受け、
    b.該アレル頻度データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、
    c.該アレル頻度データを用いて、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、ここで前記個別確率は、前記多型座位の集合に関する異なる倍数性状態とアレル不均衡率の両方のモデルのセットを用いて作成され、
    d.該個別確率と該相決定済みアレル情報を用いて該多型座位の集合に関する同時確率を作成し、ここで前記同時確率は、前記染色体分節にある多型座位間の連鎖を考慮することによって作成され、
    e.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択することにより、該染色体分節の倍数性を決定する、
    ように構成され、
    ここで該試料は、癌を有すると考えられる個体から得た血液試料、血清試料、又は血漿試料であり、
    ここで該コードを該処理装置で実行することにより、該処理装置がさらに、前記選択に基づき該個体の腫瘍細胞にコピー数多様性が存在するかを決定するよう構成される、コンピュータ可読媒体。
  27. 前記アレル頻度データが核酸配列データから作成される、請求項26に記載のコンピュータ可読媒体。
  28. 前記アレル頻度データの誤差を修正することと、修正済みアレル頻度データを前記個別確率の作成工程に使用することをさらに含み、修正される前記誤差がアレル増幅効率の偏りである、請求項26に記載のコンピュータ可読媒体。
  29. 個体の試料の染色体倍数性を検出するための非一過性のコンピュータ可読媒体であって、該媒体はコンピュータ可読コードを含み、該コードを処理装置で実行することにより、該処理装置が、
    a.該個体の染色体分節にある多型座位の集合に存在するアレルに関する、該試料から得られた核酸配列データを受け、
    b.該核酸配列データを用いて該多型座位の集合におけるアレル頻度を検出し、
    c.検出された該アレル頻度のアレル増幅効率の偏りを修正することによって、該多型座位の集合に関する修正済みアレル頻度を作成し、
    d.該核酸配列データの相を推定することによって該多型座位の集合に関する相決定済みアレル情報を作成し、
    e.該修正済みアレル頻度を該多型座位の集合に関する異なる倍数性状態とアレル不均衡率のモデルのセットと比較することにより、異なる倍数性状態に関する該多型座位のアレル頻度の個別確率を作成し、
    f.該個別確率を該染色体分節にある多型座位間の連鎖を考慮しながら組み合わせることにより、該多型座位の集合に関する同時確率を作成し、
    g.該同時確率に基づき、染色体倍数性を示す最適合モデルを選択する、
    ように構成され、
    ここで該試料は、癌を有すると考えられる個体から得た血液試料、血清試料、又は血漿試料であり、
    ここで該コードを該処理装置で実行することにより、該処理装置がさらに、前記選択に基づき該個体の腫瘍細胞にコピー数多様性が存在するかを決定するよう構成される、コンピュータ可読媒体。
  30. 前記選択が、前記モデルに関して作成された前記相決定済みアレル情報と推定アレル頻度との差異の大きさを分析することによって実行され、差異の大きさが最も小さいモデルが選択される、請求項29に記載のコンピュータ可読媒体。
  31. アレル頻度の前記個別確率が、前記多型座位の集合におけるアレル頻度の期待値と観測値のベータ二項モデルに基づいて作成される、請求項26〜29のいずれか一項に記載のコンピュータ可読媒体。
  32. 前記方法が、標的となる複数の一塩基多様体のセットのうち何れかの一塩基多様体が前記試料に存在するか否かを決定することをさらに含み、
    前記コピー数多様性および/または前記一塩基多様体の検出は、前記試料中に循環腫瘍核酸が存在することを示し、
    前記核酸配列データが、多重増幅反応によって生成された一連の増幅産物の複数のコピーの高処理DNA配列決定を実行することによって作成され、
    該一連の増幅産物のうちの各増幅産物は、前記多型座位の集合のうちの少なくとも1つの多型座位にわたり、
    該多型座位の集合のうちの各多型座位が増幅され、
    前記血液試料、血清試料、又は血漿試料と同一の試料を用いて、該個体の腫瘍の細胞にコピー数多様性または一塩基多様体又はその両方が存在するか否かが決定される、請求項2〜7の何れか一項に記載の方法。
JP2020010659A 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性 Active JP6994059B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021199357A JP2022028950A (ja) 2014-04-21 2021-12-08 変異の検出および染色体分節の倍数性
JP2023189080A JP2024001359A (ja) 2014-04-21 2023-11-06 変異の検出および染色体分節の倍数性

Applications Claiming Priority (14)

Application Number Priority Date Filing Date Title
US201461982245P 2014-04-21 2014-04-21
US61/982,245 2014-04-21
US201461987407P 2014-05-01 2014-05-01
US61/987,407 2014-05-01
US201461994791P 2014-05-16 2014-05-16
US61/994,791 2014-05-16
US201462066514P 2014-10-21 2014-10-21
US62/066,514 2014-10-21
US201562146188P 2015-04-10 2015-04-10
US62/146,188 2015-04-10
US201562147377P 2015-04-14 2015-04-14
US62/147,377 2015-04-14
US201562148173P 2015-04-15 2015-04-15
US62/148,173 2015-04-15

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016563812A Division JP6659575B2 (ja) 2014-04-21 2015-04-21 変異の検出および染色体分節の倍数性

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021199357A Division JP2022028950A (ja) 2014-04-21 2021-12-08 変異の検出および染色体分節の倍数性

Publications (2)

Publication Number Publication Date
JP2020072737A true JP2020072737A (ja) 2020-05-14
JP6994059B2 JP6994059B2 (ja) 2022-01-14

Family

ID=57221528

Family Applications (11)

Application Number Title Priority Date Filing Date
JP2016563812A Active JP6659575B2 (ja) 2014-04-21 2015-04-21 変異の検出および染色体分節の倍数性
JP2020010765A Pending JP2020072738A (ja) 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性
JP2020010580A Active JP7030860B2 (ja) 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性
JP2020010558A Pending JP2020072735A (ja) 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性
JP2020010542A Active JP6994058B2 (ja) 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性
JP2020010659A Active JP6994059B2 (ja) 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性
JP2020011048A Pending JP2020072739A (ja) 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性
JP2021199347A Pending JP2022028949A (ja) 2014-04-21 2021-12-08 変異の検出および染色体分節の倍数性
JP2021199357A Pending JP2022028950A (ja) 2014-04-21 2021-12-08 変異の検出および染色体分節の倍数性
JP2022025293A Active JP7362805B2 (ja) 2014-04-21 2022-02-22 変異の検出および染色体分節の倍数性
JP2023189080A Pending JP2024001359A (ja) 2014-04-21 2023-11-06 変異の検出および染色体分節の倍数性

Family Applications Before (5)

Application Number Title Priority Date Filing Date
JP2016563812A Active JP6659575B2 (ja) 2014-04-21 2015-04-21 変異の検出および染色体分節の倍数性
JP2020010765A Pending JP2020072738A (ja) 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性
JP2020010580A Active JP7030860B2 (ja) 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性
JP2020010558A Pending JP2020072735A (ja) 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性
JP2020010542A Active JP6994058B2 (ja) 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性

Family Applications After (5)

Application Number Title Priority Date Filing Date
JP2020011048A Pending JP2020072739A (ja) 2014-04-21 2020-01-27 変異の検出および染色体分節の倍数性
JP2021199347A Pending JP2022028949A (ja) 2014-04-21 2021-12-08 変異の検出および染色体分節の倍数性
JP2021199357A Pending JP2022028950A (ja) 2014-04-21 2021-12-08 変異の検出および染色体分節の倍数性
JP2022025293A Active JP7362805B2 (ja) 2014-04-21 2022-02-22 変異の検出および染色体分節の倍数性
JP2023189080A Pending JP2024001359A (ja) 2014-04-21 2023-11-06 変異の検出および染色体分節の倍数性

Country Status (8)

Country Link
US (13) US10179937B2 (ja)
EP (3) EP3957749A1 (ja)
JP (11) JP6659575B2 (ja)
CN (3) CN106460070B (ja)
AU (3) AU2015249846B2 (ja)
CA (1) CA2945962C (ja)
HK (1) HK1232260A1 (ja)
RU (1) RU2717641C2 (ja)

Families Citing this family (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US20120185176A1 (en) 2009-09-30 2012-07-19 Natera, Inc. Methods for Non-Invasive Prenatal Ploidy Calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
AU2011255641A1 (en) 2010-05-18 2012-12-06 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
AU2011348100B2 (en) 2010-12-22 2016-08-25 Natera, Inc. Methods for non-invasive prenatal paternity testing
AU2011358564B9 (en) 2011-02-09 2017-07-13 Natera, Inc Methods for non-invasive prenatal ploidy calling
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
CN105190656B (zh) 2013-01-17 2018-01-16 佩索纳里斯公司 用于遗传分析的方法和系统
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
US11062789B2 (en) 2014-07-18 2021-07-13 The Chinese University Of Hong Kong Methylation pattern analysis of tissues in a DNA mixture
JP2017522908A (ja) * 2014-07-25 2017-08-17 ユニヴァーシティ オブ ワシントン セルフリーdnaを生じる組織及び/又は細胞タイプを決定する方法、並びにそれを用いて疾患又は異常を識別する方法
EP2977912A1 (de) * 2014-07-25 2016-01-27 Franz-Peter Dr. Liebel Automatisierte Diagnostik
US10125399B2 (en) 2014-10-30 2018-11-13 Personalis, Inc. Methods for using mosaicism in nucleic acids sampled distal to their origin
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
US11302416B2 (en) * 2015-09-02 2022-04-12 Guardant Health Machine learning for somatic single nucleotide variant detection in cell-free tumor nucleic acid sequencing applications
WO2017181146A1 (en) * 2016-04-14 2017-10-19 Guardant Health, Inc. Methods for early detection of cancer
ES2913468T3 (es) * 2016-04-15 2022-06-02 Natera Inc Métodos para la detección del cáncer de pulmón.
US11299783B2 (en) 2016-05-27 2022-04-12 Personalis, Inc. Methods and systems for genetic analysis
US20200013482A1 (en) 2016-09-30 2020-01-09 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
GB201618485D0 (en) * 2016-11-02 2016-12-14 Ucl Business Plc Method of detecting tumour recurrence
KR20230062684A (ko) 2016-11-30 2023-05-09 더 차이니즈 유니버시티 오브 홍콩 소변 및 기타 샘플에서의 무세포 dna의 분석
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
CN108277267B (zh) * 2016-12-29 2019-08-13 安诺优达基因科技(北京)有限公司 检测基因突变的装置和用于对孕妇和胎儿的基因型进行分型的试剂盒
JP2020507149A (ja) * 2017-01-11 2020-03-05 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 包含基準又は除外基準の検出自動化のための方法及びシステム
EP3585889A1 (en) 2017-02-21 2020-01-01 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
US11342047B2 (en) * 2017-04-21 2022-05-24 Illumina, Inc. Using cell-free DNA fragment size to detect tumor-associated variant
CN108804876B (zh) * 2017-05-05 2022-03-15 中国科学院上海药物研究所 用于计算癌症样本纯度和染色体倍性的方法和装置
KR102145417B1 (ko) * 2017-05-24 2020-08-19 지니너스 주식회사 무세포 핵산으로부터 수득된 서열 분석 데이터에 대한 배경 대립인자의 빈도 분포를 생성하는 방법 및 이를 이용하여 무세포 핵산으로부터 변이를 검출하는 방법
CN109136355A (zh) * 2017-06-19 2019-01-04 北京大学第三医院 一种体外评估胎儿双胎输血综合征发生的snp阵列芯片
CA3067637A1 (en) 2017-06-20 2018-12-27 The Medical College Of Wisconsin, Inc. Assessing transplant complication risk with total cell-free dna
US11450121B2 (en) * 2017-06-27 2022-09-20 The Regents Of The University Of California Label-free digital brightfield analysis of nucleic acid amplification
CN107164535A (zh) * 2017-07-07 2017-09-15 沈阳宁沪科技有限公司 一种无创高通量甲基化结肠癌诊断、研究和治疗方法
US10622095B2 (en) * 2017-07-21 2020-04-14 Helix OpCo, LLC Genomic services platform supporting multiple application providers
WO2019083594A1 (en) * 2017-08-21 2019-05-02 The General Hospital Corporation COMPOSITIONS AND METHODS FOR CLASSIFYING TUMORS WITH INSTABILITY OF MICROSATELLITES
JP7029719B2 (ja) * 2017-08-31 2022-03-04 静岡県 バイオマーカー
CN110021355B (zh) * 2017-09-22 2021-05-04 深圳华大生命科学研究院 二倍体基因组测序片段的单倍体分型和变异检测方法和装置
EP3460071A1 (en) * 2017-09-22 2019-03-27 Lexogen GmbH Estimating pre-pcr fragment numbers from post-pcr frequencies of unique molecular identifiers
CN107641648A (zh) * 2017-10-19 2018-01-30 深圳华大基因股份有限公司 一种用于检测染色体畸变的标准品及其制备方法
KR20200093438A (ko) * 2017-12-01 2020-08-05 일루미나, 인코포레이티드 체성 돌연변이 클론형성능을 결정하기 위한 방법 및 시스템
CN112365927B (zh) * 2017-12-28 2023-08-25 安诺优达基因科技(北京)有限公司 Cnv检测装置
WO2019200398A1 (en) * 2018-04-13 2019-10-17 Dana-Farber Cancer Institute, Inc. Ultra-sensitive detection of cancer by algorithmic analysis
US11119035B2 (en) * 2018-04-26 2021-09-14 Ppg Industries Ohio, Inc. Systems and methods for rapid coating composition determinations
US10970879B2 (en) 2018-04-26 2021-04-06 Ppg Industries Ohio, Inc. Formulation systems and methods employing target coating data results
US11874220B2 (en) 2018-04-26 2024-01-16 Ppg Industries Ohio, Inc. Formulation systems and methods employing target coating data results
US10871888B2 (en) 2018-04-26 2020-12-22 Ppg Industries Ohio, Inc. Systems, methods, and interfaces for rapid coating generation
CN108588201B (zh) * 2018-05-11 2019-08-09 浙江省人民医院 一种结直肠癌西妥昔单抗耐药性痕量dna突变检测的方法及装置
US11814750B2 (en) 2018-05-31 2023-11-14 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US10801064B2 (en) 2018-05-31 2020-10-13 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
WO2019232435A1 (en) 2018-06-01 2019-12-05 Grail, Inc. Convolutional neural network systems and methods for data classification
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
CN109461473B (zh) * 2018-09-30 2019-12-17 北京优迅医疗器械有限公司 胎儿游离dna浓度获取方法和装置
CN109971846A (zh) * 2018-11-29 2019-07-05 时代基因检测中心有限公司 使用双等位基因snp靶向下一代测序的非侵入性产前测定非整倍体的方法
US11581062B2 (en) 2018-12-10 2023-02-14 Grail, Llc Systems and methods for classifying patients with respect to multiple cancer classes
CN109686401B (zh) * 2018-12-19 2022-08-05 上海蓝沙生物科技有限公司 一种识别异源低频基因组信号唯一性的方法及其应用
CN109801677B (zh) * 2018-12-29 2023-05-23 浙江安诺优达生物科技有限公司 测序数据自动化分析方法、装置和电子设备
EP3915118A1 (en) * 2019-01-25 2021-12-01 Pacific Biosciences Of California, Inc. Systems and methods for graph based mapping of nucleic acid fragments
CN109837344B (zh) * 2019-03-04 2022-12-27 天津医科大学 一种甲基化的EphA7核苷酸片段及其检测方法和应用
WO2020206290A1 (en) * 2019-04-03 2020-10-08 The Medical College Of Wisconsin, Inc. Methods for assessing risk using total cell-free dna
US11931674B2 (en) 2019-04-04 2024-03-19 Natera, Inc. Materials and methods for processing blood samples
CN110129439A (zh) * 2019-04-28 2019-08-16 安徽鼎晶生物科技有限公司 一种人brca1/2基因变异检测质控品及其制备方法和应用
CN110106063B (zh) * 2019-05-06 2022-07-08 臻和精准医学检验实验室无锡有限公司 基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统
EP3969622A1 (en) * 2019-05-13 2022-03-23 Grail, Inc. Model-based featurization and classification
AU2020286376A1 (en) * 2019-06-03 2021-04-22 Illumina, Inc. Limit of detection based quality control metric
CN110379465A (zh) * 2019-07-19 2019-10-25 元码基因科技(北京)股份有限公司 基于rna靶向测序和机器学习的癌症组织溯源方法
CN110452988A (zh) * 2019-08-27 2019-11-15 武汉友芝友医疗科技股份有限公司 检测esr1基因突变的引物组、试剂、试剂盒和方法
CN110648722B (zh) * 2019-09-19 2022-05-31 首都医科大学附属北京儿童医院 新生儿遗传病患病风险评估的装置
CN112634986A (zh) * 2019-09-24 2021-04-09 厦门希吉亚生物科技有限公司 一种基于孕妇外周血对双胞胎合子性质的无创鉴定方法
AU2020378435A1 (en) 2019-11-06 2022-05-26 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
CN113496769B (zh) * 2020-03-20 2023-11-07 梅傲科技(广州)有限公司 基于病理组织的三联综合肿瘤分析系统和应用
CN111370065B (zh) * 2020-03-26 2022-10-04 北京吉因加医学检验实验室有限公司 一种检测rna跨样本交叉污染率的方法和装置
CN112885406B (zh) * 2020-04-16 2023-01-31 深圳裕策生物科技有限公司 检测hla杂合性缺失的方法及系统
US20210326332A1 (en) * 2020-04-17 2021-10-21 International Business Machines Corporation Temporal directed cycle detection and pruning in transaction graphs
CN111724860B (zh) * 2020-06-18 2021-03-16 深圳吉因加医学检验实验室 一种基于测序数据识别染色质开放区域的方法及装置
US11675599B2 (en) * 2020-08-04 2023-06-13 Dell Products L.P. Systems and methods for managing system rollup of accelerator health
CN114277129A (zh) * 2020-09-28 2022-04-05 北京市神经外科研究所 一种swi/snf基因改变在辅助诊断和预后脊索瘤中的应用
CN112094911A (zh) * 2020-10-10 2020-12-18 广西医科大学 Nrk在肺癌治疗和预后诊断中的医药用途
CN112397144B (zh) * 2020-10-29 2021-06-15 无锡臻和生物科技股份有限公司 检测基因突变及表达量的方法及装置
JP2023548113A (ja) * 2020-10-30 2023-11-15 マイオーム,インコーポレイテッド Cnv検出を改善するための非誤り伝播相決定技術ならびに対立遺伝子バランスの組み合わせの使用
US11354286B1 (en) * 2020-11-02 2022-06-07 Workday, Inc. Outlier identification and removal
CN112634991B (zh) * 2020-12-18 2022-07-19 长沙都正生物科技股份有限公司 基因分型方法、装置、电子设备及存储介质
CN112592976B (zh) * 2020-12-30 2021-09-21 深圳市海普洛斯生物科技有限公司 一种检测met基因扩增的方法及装置
CN116940693A (zh) 2021-03-12 2023-10-24 富士胶片株式会社 癌症检查试剂组、癌症检查试剂组的制造方法及癌症检查方法
CN113096736B (zh) * 2021-03-26 2023-10-31 北京源生康泰基因科技有限公司 一种基于纳米孔测序的病毒实时自动分析方法及系统
EP4314398A1 (en) * 2021-03-31 2024-02-07 Predicine, Inc. Systems and methods for multi-analyte detection of cancer
US11783912B2 (en) 2021-05-05 2023-10-10 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
CN113637751A (zh) * 2021-07-16 2021-11-12 暨南大学 Tnfaip3非编码序列突变检测试剂在制备预测t细胞淋巴瘤预后试剂盒中的应用
CN113808660B (zh) * 2021-09-13 2024-02-13 复旦大学附属华山医院 基于自然选择及数据库的遗传性罕见病患病率贝叶斯计算模型及其构建方法和应用
WO2023060236A1 (en) * 2021-10-08 2023-04-13 Foundation Medicine, Inc. Methods and systems for automated calling of copy number alterations
WO2023081639A1 (en) * 2021-11-03 2023-05-11 Foundation Medicine, Inc. System and method for identifying copy number alterations
US20230162813A1 (en) 2021-11-23 2023-05-25 Eone Reference Laboratory Apparatus and method for diagnosing cancer using liquid biopsy data
CN114093417B (zh) * 2021-11-23 2022-10-04 深圳吉因加信息科技有限公司 一种鉴定染色体臂杂合性缺失的方法和装置
CN113913525A (zh) * 2021-11-24 2022-01-11 广州医科大学 Dnase1l3基因作为肝癌侵袭转移的检测和/或防治靶点的应用
US11788152B2 (en) 2022-01-28 2023-10-17 Flagship Pioneering Innovations Vi, Llc Multiple-tiered screening and second analysis
WO2023164017A2 (en) * 2022-02-22 2023-08-31 Flagship Pioneering Innovations Vi, Llc Intra-individual analysis for presence of health conditions
WO2023177901A1 (en) * 2022-03-17 2023-09-21 Delfi Diagnostics, Inc. Method of monitoring cancer using fragmentation profiles
CN114807377B (zh) * 2022-06-29 2022-09-23 南京世和基因生物技术股份有限公司 膀胱癌预后生存期标志物的应用、评估装置以及计算机可读取介质
CN116004800B (zh) * 2022-12-09 2023-09-05 中国农业科学院北京畜牧兽医研究所 一种cnv标记在绵羊肥瘦尾早期筛选中的应用
CN117334249A (zh) * 2023-05-30 2024-01-02 上海品峰医疗科技有限公司 基于扩增子测序数据检测拷贝数变异的方法、设备和介质
CN117551782B (zh) * 2023-11-24 2024-05-07 江苏省家禽科学研究所 与鸡蛋尖端蛋壳厚度相关的分子标记在鸡遗传育种中的应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010509922A (ja) * 2006-11-16 2010-04-02 ジェネンテック インコーポレイテッド 腫瘍と関連している遺伝的変異
WO2013123220A1 (en) * 2012-02-14 2013-08-22 Cornell University Method for relative quantification of nucleic acid sequence, expression, or copy changes, using combined nuclease, ligation, and polymerase reactions
JP2014507141A (ja) * 2011-02-09 2014-03-27 ナテラ, インコーポレイテッド 非侵襲的出生前倍数性呼び出しのための方法

Family Cites Families (545)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3957654A (en) 1974-02-27 1976-05-18 Becton, Dickinson And Company Plasma separator with barrier to eject sealant
US4040785A (en) 1976-10-18 1977-08-09 Technicon Instruments Corporation Lysable blood preservative composition
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4935342A (en) 1986-12-01 1990-06-19 Syngene, Inc. Method of isolating and purifying nucleic acids from biological samples
US4942124A (en) 1987-08-11 1990-07-17 President And Fellows Of Harvard College Multiplex sequencing
JP3040121B2 (ja) 1988-01-12 2000-05-08 ジェネンテク,インコーポレイテッド 増殖因子レセプターの機能を阻害することにより腫瘍細胞を処置する方法
US5153117A (en) 1990-03-27 1992-10-06 Genetype A.G. Fetal cell recovery method
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
US5262329A (en) 1991-06-13 1993-11-16 Carver Jr Edward L Method for improved multiple species blood analysis
IL103935A0 (en) 1991-12-04 1993-05-13 Du Pont Method for the identification of microorganisms by the utilization of directed and arbitrary dna amplification
US5965362A (en) 1992-03-04 1999-10-12 The Regents Of The University Of California Comparative genomic hybridization (CGH)
GB9305984D0 (en) 1993-03-23 1993-05-12 Royal Free Hosp School Med Predictive assay
ES2197168T3 (es) 1993-07-05 2004-01-01 Sheffield Teaching Hospitals National Health Service Trust Preparacion y estabilizacion de celulas.
WO1995006137A1 (en) 1993-08-27 1995-03-02 Australian Red Cross Society Detection of genes
CH686982A5 (fr) 1993-12-16 1996-08-15 Maurice Stroun Méthode pour le diagnostic de cancers.
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5716776A (en) 1994-03-04 1998-02-10 Mark H. Bogart Enrichment by preferential mitosis of fetal lymphocytes from a maternal blood sample
US5891734A (en) 1994-08-01 1999-04-06 Abbott Laboratories Method for performing automated analysis
US6025128A (en) 1994-09-29 2000-02-15 The University Of Tulsa Prediction of prostate cancer progression by analysis of selected predictive parameters
US6479235B1 (en) 1994-09-30 2002-11-12 Promega Corporation Multiplex amplification of short tandem repeat loci
US5648220A (en) 1995-02-14 1997-07-15 New England Medical Center Hospitals, Inc. Methods for labeling intracytoplasmic molecules
DE69620596T2 (de) 1995-05-19 2002-11-21 Abbott Lab Nachweis von nukleinsäuren mit breitem dynamikbereich unter verwendung von aggregat-primer-reihen
US6720140B1 (en) 1995-06-07 2004-04-13 Invitrogen Corporation Recombinational cloning using engineered recombination sites
US5733729A (en) 1995-09-14 1998-03-31 Affymetrix, Inc. Computer-aided probability base calling for arrays of nucleic acid probes on chips
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US5736033A (en) 1995-12-13 1998-04-07 Coleman; Charles M. Separator float for blood collection tubes with water swellable material
US6852487B1 (en) 1996-02-09 2005-02-08 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
AU2324997A (en) 1996-03-15 1997-10-01 Penn State Research Foundation, The Detection of extracellular tumor-associated nucleic acid in blood plasma or ser um using nucleic acid amplification assays
US6329179B1 (en) 1996-03-26 2001-12-11 Oncomedx, Inc. Method enabling use of extracellular RNA extracted from plasma or serum to detect, monitor or evaluate cancer
US6108635A (en) 1996-05-22 2000-08-22 Interleukin Genetics, Inc. Integrated disease information system
US6300077B1 (en) 1996-08-14 2001-10-09 Exact Sciences Corporation Methods for the detection of nucleic acids
US6100029A (en) * 1996-08-14 2000-08-08 Exact Laboratories, Inc. Methods for the detection of chromosomal aberrations
US6221654B1 (en) 1996-09-25 2001-04-24 California Institute Of Technology Method and apparatus for analysis and sorting of polynucleotides based on size
US5860917A (en) 1997-01-15 1999-01-19 Chiron Corporation Method and apparatus for predicting therapeutic outcomes
US5824467A (en) 1997-02-25 1998-10-20 Celtrix Pharmaceuticals Methods for predicting drug response
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
US20010051341A1 (en) 1997-03-04 2001-12-13 Isis Innovation Limited Non-invasive prenatal diagnosis
ATE280177T1 (de) 1997-03-20 2004-11-15 Hoffmann La Roche Modifizierte primer
EP1591541B1 (en) 1997-04-01 2012-02-15 Illumina Cambridge Limited Method of nucleic acid sequencing
US6143496A (en) 1997-04-17 2000-11-07 Cytonix Corporation Method of sampling, amplifying and quantifying segment of nucleic acid, polymerase chain reaction assembly having nanoliter-sized sample chambers, and method of filling assembly
US20020119478A1 (en) 1997-05-30 2002-08-29 Diagen Corporation Methods for detection of nucleic acid sequences in urine
US5994148A (en) 1997-06-23 1999-11-30 The Regents Of University Of California Method of predicting and enhancing success of IVF/ET pregnancy
US6833242B2 (en) 1997-09-23 2004-12-21 California Institute Of Technology Methods for detecting and sorting polynucleotides based on size
US6124120A (en) 1997-10-08 2000-09-26 Yale University Multiple displacement amplification
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6406671B1 (en) 1998-12-05 2002-06-18 Becton, Dickinson And Company Device and method for separating components of a fluid sample
AU4767400A (en) 1999-04-30 2000-12-28 Cyclops Genome Sciences Limited Isolation of nucleic acid
US6180349B1 (en) 1999-05-18 2001-01-30 The Regents Of The University Of California Quantitative PCR method to enumerate DNA copy number
US7058517B1 (en) 1999-06-25 2006-06-06 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data
US6964847B1 (en) 1999-07-14 2005-11-15 Packard Biosciences Company Derivative nucleic acids and uses thereof
DE60035691T2 (de) 1999-07-23 2008-04-30 Forensic Science Service Ltd. Verfahren zur Erkennung von Einzel-Nukleotid-Polymorphismen
GB9917307D0 (en) 1999-07-23 1999-09-22 Sec Dep Of The Home Department Improvements in and relating to analysis of DNA
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
US6251604B1 (en) 1999-08-13 2001-06-26 Genopsys, Inc. Random mutagenesis and amplification of nucleic acid
AU1483601A (en) 1999-11-10 2001-06-06 Ligochem, Inc. Method for isolating dna from a proteinaceous medium and kit for performing method
US6221603B1 (en) 2000-02-04 2001-04-24 Molecular Dynamics, Inc. Rolling circle amplification assay for nucleic acid analysis
EP1259643B1 (en) 2000-02-07 2008-10-15 Illumina, Inc. Nucleic acid detection methods using universal priming
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
GB0009179D0 (en) 2000-04-13 2000-05-31 Imp College Innovations Ltd Non-invasive prenatal diagnosis
US7510834B2 (en) 2000-04-13 2009-03-31 Hidetoshi Inoko Gene mapping method using microsatellite genetic polymorphism markers
WO2001090415A2 (en) 2000-05-20 2001-11-29 The Regents Of The University Of Michigan Method of producing a dna library using positional amplification
JP2004511210A (ja) 2000-05-23 2004-04-15 バリアジェニックス インコーポレーテッド 配列変動を検出する、dnaを遺伝分析するための方法
US20030009295A1 (en) 2001-03-14 2003-01-09 Victor Markowitz System and method for retrieving and using gene expression data from multiple sources
US6605451B1 (en) 2000-06-06 2003-08-12 Xtrana, Inc. Methods and devices for multiplexing amplification reactions
US7087414B2 (en) 2000-06-06 2006-08-08 Applera Corporation Methods and devices for multiplexing amplification reactions
AU2001255518A1 (en) 2000-06-07 2001-12-17 Baylor College Of Medicine Compositions and methods for array-based nucleic acid hybridization
US7058616B1 (en) 2000-06-08 2006-06-06 Virco Bvba Method and system for predicting resistance of a disease to a therapeutic agent using a neural network
GB0016742D0 (en) 2000-07-10 2000-08-30 Simeg Limited Diagnostic method
CA2426824A1 (en) 2000-10-24 2002-07-25 The Board Of Trustees Of The Leland Stanford Junior University Direct multiplex characterization of genomic dna
US20020107640A1 (en) 2000-11-14 2002-08-08 Ideker Trey E. Methods for determining the true signal of an analyte
CA2428757A1 (en) 2000-11-15 2002-07-18 Roche Diagnostics Corporation Methods and reagents for identifying rare fetal cells in the maternal circulation
WO2002044411A1 (en) 2000-12-01 2002-06-06 Rosetta Inpharmatics, Inc. Use of profiling for detecting aneuploidy
US7218764B2 (en) 2000-12-04 2007-05-15 Cytokinetics, Inc. Ploidy classification method
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
US20020182622A1 (en) 2001-02-01 2002-12-05 Yusuke Nakamura Method for SNP (single nucleotide polymorphism) typing
JP2002300894A (ja) 2001-02-01 2002-10-15 Inst Of Physical & Chemical Res 一塩基多型タイピング方法
AU2002247248B2 (en) 2001-03-02 2007-07-05 University Of Pittsburgh Of The Commonwealth System Of Higher Education PCR method
US6489135B1 (en) 2001-04-17 2002-12-03 Atairgintechnologies, Inc. Determination of biological characteristics of embryos fertilized in vitro by assaying for bioactive lipids in culture media
FR2824144B1 (fr) 2001-04-30 2004-09-17 Metagenex S A R L Methode de diagnostic prenatal sur cellule foetale isolee du sang maternel
WO2002087431A1 (en) 2001-05-01 2002-11-07 Structural Bioinformatics, Inc. Diagnosing inapparent diseases from common clinical tests using bayesian analysis
US7262030B2 (en) 2001-05-09 2007-08-28 Virginia Commonwealth University Multiple sequencible and ligatible structures for genomic analysis
US20040126760A1 (en) 2001-05-17 2004-07-01 Natalia Broude Novel compositions and methods for carrying out multple pcr reactions on a single sample
US7026121B1 (en) 2001-06-08 2006-04-11 Expression Diagnostics, Inc. Methods and compositions for diagnosing and monitoring transplant rejection
EP1397512A2 (en) 2001-06-22 2004-03-17 University of Geneva Method for detecting diseases caused by chromosomal imbalances
WO2003010537A1 (en) 2001-07-24 2003-02-06 Curagen Corporation Family based tests of association using pooled dna and snp markers
US7297778B2 (en) 2001-07-25 2007-11-20 Affymetrix, Inc. Complexity management of genomic DNA
CA2455731C (en) 2001-07-25 2012-02-07 Oncomedx, Inc. Methods for evaluating pathologic conditions using extracellular rna
US6958211B2 (en) 2001-08-08 2005-10-25 Tibotech Bvba Methods of assessing HIV integrase inhibitor therapy
CN1571634A (zh) 2001-08-23 2005-01-26 免疫公司 用于分析的细胞和生物学标本的稳定
US6807491B2 (en) 2001-08-30 2004-10-19 Hewlett-Packard Development Company, L.P. Method and apparatus for combining gene predictions using bayesian networks
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
AUPR749901A0 (en) 2001-09-06 2001-09-27 Monash University Method of identifying chromosomal abnormalities and prenatal diagnosis
US7153656B2 (en) 2001-09-11 2006-12-26 Los Alamos National Security, Llc Nucleic acid sequence detection using multiplexed oligonucleotide PCR
US8986944B2 (en) 2001-10-11 2015-03-24 Aviva Biosciences Corporation Methods and compositions for separating rare cells from fluid samples
WO2003031646A1 (en) 2001-10-12 2003-04-17 The University Of Queensland Multiple genetic marker selection and amplification
US20040014067A1 (en) 2001-10-12 2004-01-22 Third Wave Technologies, Inc. Amplification methods and compositions
US6617137B2 (en) 2001-10-15 2003-09-09 Molecular Staging Inc. Method of amplifying whole genomes without subjecting the genome to denaturing conditions
US7297485B2 (en) 2001-10-15 2007-11-20 Qiagen Gmbh Method for nucleic acid amplification that results in low amplification bias
US7511704B2 (en) 2001-11-20 2009-03-31 Illinois Tool Works Inc. Acoustic wave touch bar system and method of use
US20030119004A1 (en) 2001-12-05 2003-06-26 Wenz H. Michael Methods for quantitating nucleic acids using coupled ligation and amplification
WO2003050532A1 (fr) 2001-12-11 2003-06-19 Netech Inc. Systeme de separation de cellules sanguines
US7198897B2 (en) 2001-12-19 2007-04-03 Brandeis University Late-PCR
ES2274861T3 (es) 2001-12-24 2007-06-01 Wolfgang Prof. Holzgreve Metodo para el diagnostico no-invasivo de transplantes y transfusiones.
US20040115629A1 (en) 2002-01-09 2004-06-17 Panzer Scott R Molecules for diagnostics and therapeutics
WO2003062441A1 (en) 2002-01-18 2003-07-31 Genzyme Corporation Methods for fetal dna detection and allele quantitation
WO2003065282A1 (en) 2002-02-01 2003-08-07 Rosetta Inpharmatics Llc Computer systems and methods for identifying genes and determining pathways associated with traits
NZ535045A (en) 2002-03-01 2008-04-30 Ravgen Inc Rapid analysis of variations in a genome
US6977162B2 (en) 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
US20060229823A1 (en) 2002-03-28 2006-10-12 Affymetrix, Inc. Methods and computer software products for analyzing genotyping data
US7211191B2 (en) 2004-09-30 2007-05-01 Thermogenesis Corp. Blood component separation method and apparatus
US7241281B2 (en) 2002-04-08 2007-07-10 Thermogenesis Corporation Blood component separation method and apparatus
US20040096874A1 (en) 2002-04-11 2004-05-20 Third Wave Technologies, Inc. Characterization of CYP 2D6 genotypes
US20030235848A1 (en) 2002-04-11 2003-12-25 Matt Neville Characterization of CYP 2D6 alleles
CA2484360A1 (en) 2002-05-02 2003-11-13 The University Of North Carolina At Chapel Hill In vitro mutagenesis, phenotyping, and gene mapping
US7442506B2 (en) 2002-05-08 2008-10-28 Ravgen, Inc. Methods for detection of genetic disorders
US7727720B2 (en) 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
US20070178478A1 (en) 2002-05-08 2007-08-02 Dhallan Ravinder S Methods for detection of genetic disorders
US20040009518A1 (en) 2002-05-14 2004-01-15 The Chinese University Of Hong Kong Methods for evaluating a disease condition by nucleic acid detection and fractionation
US20040229231A1 (en) 2002-05-28 2004-11-18 Frudakis Tony N. Compositions and methods for inferring ancestry
AU2003229397B2 (en) 2002-05-31 2009-04-23 Genetic Technologies Limited Maternal antibodies as fetal cell markers to identify and enrich fetal cells from maternal blood
WO2003106623A2 (en) 2002-06-13 2003-12-24 New York University Early noninvasive prenatal test for aneuploidies and heritable conditions
US7108976B2 (en) 2002-06-17 2006-09-19 Affymetrix, Inc. Complexity management of genomic DNA by locus specific amplification
US7097976B2 (en) 2002-06-17 2006-08-29 Affymetrix, Inc. Methods of analysis of allelic imbalance
US20050009069A1 (en) 2002-06-25 2005-01-13 Affymetrix, Inc. Computer software products for analyzing genotyping
CN100354298C (zh) 2002-06-28 2007-12-12 兰华生物科技公司 使用单核苷酸多态性组分析受损样品的方法和组合物
EP1388812A1 (en) 2002-07-04 2004-02-11 Ronald E. Dr. Kates Method for training a learning-capable system
US20040117346A1 (en) 2002-09-20 2004-06-17 Kilian Stoffel Computer-based method and apparatus for repurposing an ontology
US7459273B2 (en) 2002-10-04 2008-12-02 Affymetrix, Inc. Methods for genotyping selected polymorphism
WO2004033649A2 (en) 2002-10-07 2004-04-22 University Of Medicine And Dentistry Of New Jersey High throughput multiplex dna sequence amplifications
US10229244B2 (en) 2002-11-11 2019-03-12 Affymetrix, Inc. Methods for identifying DNA copy number changes using hidden markov model based estimations
JP2006519977A (ja) 2002-11-11 2006-08-31 アフィメトリックス インコーポレイテッド Dnaコピー数変化を同定するための方法
EP2194147B1 (en) 2002-12-04 2015-07-22 Applied Biosystems, LLC Multiplex amplification of polynucleotides
JP4282605B2 (ja) 2003-01-02 2009-06-24 アロイス・ヴォベン 風力発電設備用のローターブレード
US20040224331A1 (en) 2003-01-17 2004-11-11 The Trustees Of Boston University Haplotype analysis
WO2004065628A1 (en) 2003-01-21 2004-08-05 Guoliang Fu Quantitative multiplex detection of nucleic acids
US7575865B2 (en) 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
WO2004070007A2 (en) 2003-01-29 2004-08-19 454 Corporation Method for preparing single-stranded dna libraries
US8394582B2 (en) 2003-03-05 2013-03-12 Genetic Technologies, Inc Identification of fetal DNA and fetal cell markers in maternal plasma or serum
WO2004081183A2 (en) 2003-03-07 2004-09-23 Rubicon Genomics, Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
US20040197832A1 (en) 2003-04-03 2004-10-07 Mor Research Applications Ltd. Non-invasive prenatal genetic diagnosis using transcervical cells
US20070059700A1 (en) 2003-05-09 2007-03-15 Shengce Tao Methods and compositions for optimizing multiplex pcr primers
CA2525956A1 (en) 2003-05-28 2005-01-06 Pioneer Hi-Bred International, Inc. Plant breeding method
US20040259100A1 (en) 2003-06-20 2004-12-23 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
US8003317B2 (en) 2003-07-31 2011-08-23 Sequenom, Inc. Methods for high level multiplexed polymerase chain reactions and homogeneous mass extension reactions
US8346482B2 (en) 2003-08-22 2013-01-01 Fernandez Dennis S Integrated biosensor and simulation system for diagnosis and therapy
WO2005021793A1 (en) 2003-08-29 2005-03-10 Pantarhei Bioscience B.V. Prenatal diagnosis of down syndrome by detection of fetal rna markers in maternal blood
EP2354253A3 (en) 2003-09-05 2011-11-16 Trustees of Boston University Method for non-invasive prenatal diagnosis
US20050053950A1 (en) 2003-09-08 2005-03-10 Enrique Zudaire Ubani Protocol and software for multiplex real-time PCR quantification based on the different melting temperatures of amplicons
WO2005028645A1 (ja) 2003-09-24 2005-03-31 Kyushu Tlo Company, Limited MDR1遺伝子の5’制御領域におけるSNPs
WO2005030999A1 (en) 2003-09-25 2005-04-07 Dana-Farber Cancer Institute, Inc Methods to detect lineage-specific cells
WO2005035725A2 (en) 2003-10-08 2005-04-21 The Trustees Of Boston University Methods for prenatal diagnosis of chromosomal abnormalities
CA2482097C (en) 2003-10-13 2012-02-21 F. Hoffmann-La Roche Ag Methods for isolating nucleic acids
EP1524321B2 (en) 2003-10-16 2014-07-23 Sequenom, Inc. Non-invasive detection of fetal genetic traits
WO2005039389A2 (en) 2003-10-22 2005-05-06 454 Corporation Sequence-based karyotyping
WO2005044086A2 (en) 2003-10-30 2005-05-19 Tufts-New England Medical Center Prenatal diagnosis using cell-free fetal dna in amniotic fluid
US20050164252A1 (en) 2003-12-04 2005-07-28 Yeung Wah Hin A. Methods using non-genic sequences for the detection, modification and treatment of any disease or improvement of functions of a cell
EP1706488B1 (en) 2004-01-12 2013-07-24 Roche NimbleGen, Inc. Method of performing pcr amplification on a microarray
US20060046258A1 (en) 2004-02-27 2006-03-02 Lapidus Stanley N Applications of single molecule sequencing
US20100216153A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US20100216151A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US7035740B2 (en) 2004-03-24 2006-04-25 Illumina, Inc. Artificial intelligence and global normalization methods for genotyping
JP4437050B2 (ja) 2004-03-26 2010-03-24 株式会社日立製作所 診断支援システム、診断支援方法および診断支援サービスの提供方法
WO2005094363A2 (en) 2004-03-30 2005-10-13 New York University System, method and software arrangement for bi-allele haplotype phasing
EP1732951B1 (en) 2004-03-31 2009-12-02 Adnagen AG Monoclonal antibodies with specificity for fetal erythroid cells
US7414118B1 (en) 2004-04-14 2008-08-19 Applied Biosystems Inc. Modified oligonucleotides and applications thereof
US7468249B2 (en) 2004-05-05 2008-12-23 Biocept, Inc. Detection of chromosomal disorders
US7709194B2 (en) 2004-06-04 2010-05-04 The Chinese University Of Hong Kong Marker for prenatal diagnosis and monitoring
US8026054B2 (en) 2004-06-14 2011-09-27 The Board Of Trustees Of The University Of Illinois Antibodies against cells of fetal origin
WO2006002491A1 (en) 2004-07-06 2006-01-12 Genera Biosystems Pty Ltd Method of detecting aneuploidy
DE102004036285A1 (de) 2004-07-27 2006-02-16 Advalytix Ag Verfahren zum Bestimmen der Häufigkeit von Sequenzen einer Probe
US20060040300A1 (en) 2004-08-09 2006-02-23 Generation Biotech, Llc Method for nucleic acid isolation and amplification
JP2008511058A (ja) 2004-08-18 2008-04-10 アボツト・モレキユラー・インコーポレイテツド コンピュータシステムを用いるデータ品質および/または部分異数染色体の決定
US7634808B1 (en) 2004-08-20 2009-12-15 Symantec Corporation Method and apparatus to block fast-spreading computer worms that use DNS MX record queries
JP4810164B2 (ja) 2004-09-03 2011-11-09 富士フイルム株式会社 核酸分離精製方法
US8024128B2 (en) 2004-09-07 2011-09-20 Gene Security Network, Inc. System and method for improving clinical decisions by aggregating, validating and analysing genetic and phenotypic data
US20060088574A1 (en) 2004-10-25 2006-04-27 Manning Paul B Nutritional supplements
US20060134662A1 (en) 2004-10-25 2006-06-22 Pratt Mark R Method and system for genotyping samples in a normalized allelic space
WO2006047787A2 (en) * 2004-10-27 2006-05-04 Exact Sciences Corporation Method for monitoring disease progression or recurrence
EP1828419A1 (en) 2004-11-17 2007-09-05 ReproCure, LLC Methods of determining human egg competency
EP2623099A1 (en) 2004-11-24 2013-08-07 Neuromolecular Pharmaceuticals, Inc Composition and method for treating neurological disease
US20070042384A1 (en) 2004-12-01 2007-02-22 Weiwei Li Method for isolating and modifying DNA from blood and body fluids
US20090098534A1 (en) 2005-02-25 2009-04-16 The Regents Of The University Of California Full Karyotype Single Cell Chromosome Analysis
US7618777B2 (en) 2005-03-16 2009-11-17 Agilent Technologies, Inc. Composition and method for array hybridization
CN101137761B (zh) 2005-03-18 2010-12-08 香港中文大学 产前诊断和监测的标记
US7645576B2 (en) 2005-03-18 2010-01-12 The Chinese University Of Hong Kong Method for the detection of chromosomal aneuploidies
US20060228721A1 (en) 2005-04-12 2006-10-12 Leamon John H Methods for determining sequence variants using ultra-deep sequencing
JP2008538496A (ja) 2005-04-12 2008-10-30 454 ライフ サイエンシーズ コーポレイション ウルトラディープ配列決定を用いて配列変異体を決定するための方法
WO2006128192A2 (en) 2005-05-27 2006-11-30 John Wayne Cancer Institute Use of free circulating dna for diagnosis, prognosis, and treatment of cancer
US20070077570A1 (en) 2005-05-31 2007-04-05 Applera Corporation Multiplexed amplification of short nucleic acids
US7601499B2 (en) 2005-06-06 2009-10-13 454 Life Sciences Corporation Paired end sequencing
WO2006138257A2 (en) 2005-06-15 2006-12-28 Callida Genomics, Inc. Single molecule arrays for genetic and chemical analysis
US7745122B2 (en) 2005-07-15 2010-06-29 Applied Biosystems, Llc Analyzing messenger RNA and micro RNA in the same reaction mixture
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
RU2290078C1 (ru) * 2005-07-25 2006-12-27 Евгений Владимирович Новичков Способ прогнозирования рецидива серозного рака яичников
US20070027636A1 (en) 2005-07-29 2007-02-01 Matthew Rabinowitz System and method for using genetic, phentoypic and clinical data to make predictions for clinical or lifestyle decisions
US20070178501A1 (en) 2005-12-06 2007-08-02 Matthew Rabinowitz System and method for integrating and validating genotypic, phenotypic and medical information into a database according to a standardized ontology
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US8515679B2 (en) 2005-12-06 2013-08-20 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US20070031857A1 (en) 2005-08-02 2007-02-08 Rubicon Genomics, Inc. Compositions and methods for processing and amplification of DNA, including using multiple enzymes in a single reaction
WO2007030680A2 (en) 2005-09-07 2007-03-15 Rigel Pharmaceuticals, Inc. Triazole derivatives useful as axl inhibitors
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
WO2007056601A2 (en) 2005-11-09 2007-05-18 The Regents Of The University Of California Methods and apparatus for context-sensitive telemedicine
GB0523276D0 (en) 2005-11-15 2005-12-21 London Bridge Fertility Chromosomal analysis by molecular karyotyping
AU2006318425B2 (en) 2005-11-26 2013-05-02 Natera, Inc. System and method for cleaning noisy genetic data and using data to make predictions
WO2007070280A2 (en) 2005-12-02 2007-06-21 The General Hospital Corporation Use of deletion polymorphisms to predict, prevent, and manage histoincompatibility
WO2007070482A2 (en) 2005-12-14 2007-06-21 Xueliang Xia Microarray-based preimplantation genetic diagnosis of chromosomal abnormalities
ES2394633T3 (es) 2005-12-22 2013-02-04 Keygene N.V. Estrategias mejoradas para elaboración de perfiles de transcritos usando tecnologías de secuenciación de alto rendimiento
PL1981995T5 (pl) 2006-02-02 2019-10-31 Univ Leland Stanford Junior Nieinwazyjne genetyczne badania przesiewowe płodu metodą analizy cyfrowej
WO2007092538A2 (en) 2006-02-07 2007-08-16 President And Fellows Of Harvard College Methods for making nucleotide probes for sequencing and synthesis
WO2007091064A1 (en) 2006-02-08 2007-08-16 Solexa Limited End modification to prevent over-representation of fragments
DK1996728T3 (da) 2006-02-28 2011-08-15 Univ Louisville Res Found Detektering af føtale chromosomale abnormiteter under anvendelse af tandem-enkeltnukleotid-polymorfismer
US20100184043A1 (en) 2006-02-28 2010-07-22 University Of Louisville Research Foundation Detecting Genetic Abnormalities
CA2647280A1 (en) 2006-03-13 2007-09-20 Veridex, Llc Propagation of primary cells
US20080038733A1 (en) 2006-03-28 2008-02-14 Baylor College Of Medicine Screening for down syndrome
JP2009072062A (ja) 2006-04-07 2009-04-09 Institute Of Physical & Chemical Research 核酸の5’末端を単離するための方法およびその適用
WO2007121276A2 (en) 2006-04-12 2007-10-25 Biocept, Inc. Enrichment of circulating fetal dna
US7702468B2 (en) 2006-05-03 2010-04-20 Population Diagnostics, Inc. Evaluating genetic disorders
US7754428B2 (en) 2006-05-03 2010-07-13 The Chinese University Of Hong Kong Fetal methylation markers
US7901884B2 (en) 2006-05-03 2011-03-08 The Chinese University Of Hong Kong Markers for prenatal diagnosis and monitoring
EP2029777B1 (en) 2006-05-31 2017-03-08 Sequenom, Inc. Methods and compositions for the extraction of nucleic acid from a sample
US7981609B2 (en) 2006-06-09 2011-07-19 The Brigham And Women's Hospital, Inc. Methods for identifying and using SNP panels
WO2008111990A1 (en) 2006-06-14 2008-09-18 Cellpoint Diagnostics, Inc. Rare cell analysis using sample splitting and dna tags
EP3406736B1 (en) 2006-06-14 2022-09-07 Verinata Health, Inc. Methods for the diagnosis of fetal abnormalities
EP2029778B1 (en) 2006-06-14 2018-05-02 Verinata Health, Inc Diagnosis of fetal abnormalities
EP3424598B1 (en) 2006-06-14 2022-06-08 Verinata Health, Inc. Rare cell analysis using sample splitting and dna tags
EP2589668A1 (en) 2006-06-14 2013-05-08 Verinata Health, Inc Rare cell analysis using sample splitting and DNA tags
US8137912B2 (en) 2006-06-14 2012-03-20 The General Hospital Corporation Methods for the diagnosis of fetal abnormalities
US20080050739A1 (en) 2006-06-14 2008-02-28 Roland Stoughton Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats
WO2009035447A1 (en) 2006-06-14 2009-03-19 Living Microsystems, Inc. Diagnosis of fetal abnormalities by comparative genomic hybridization analysis
EP2029779A4 (en) 2006-06-14 2010-01-20 Living Microsystems Inc HIGHLY PARALLEL SNP GENOTYPING UTILIZATION FOR FETAL DIAGNOSIS
JP2009540868A (ja) 2006-06-15 2009-11-26 ストラタジーン カリフォルニア 生体分子を試料から単離するシステム
JP2009540802A (ja) 2006-06-16 2009-11-26 セクエノム, インコーポレイテッド サンプルからの核酸を増幅、検出および定量するための方法および組成物
US20080182244A1 (en) 2006-08-04 2008-07-31 Ikonisys, Inc. Pre-Implantation Genetic Diagnosis Test
EP2057282A4 (en) 2006-08-24 2010-10-27 Univ Massachusetts Medical MAPPING GENOMIC INTERACTIONS
EP2064332B1 (en) 2006-09-14 2012-07-18 Ibis Biosciences, Inc. Targeted whole genome amplification method for identification of pathogens
US20080085836A1 (en) 2006-09-22 2008-04-10 Kearns William G Method for genetic testing of human embryos for chromosome abnormalities, segregating genetic disorders with or without a known mutation and mitochondrial disorders following in vitro fertilization (IVF), embryo culture and embryo biopsy
AU2007311126A1 (en) 2006-10-16 2008-04-24 Celula Inc. Methods and compositions for differential expansion of fetal cells in maternal blood and their use
WO2008051928A2 (en) 2006-10-23 2008-05-02 The Salk Institute For Biological Studies Target-oriented whole genome amplification of nucliec acids
KR100825367B1 (ko) 2006-11-07 2008-04-28 전남대학교산학협력단 표지자로서 미토콘드리아 유전자 과변이부위를 이용하는조혈모세포이식 후 생착능 평가방법 및 키트
WO2008069906A2 (en) 2006-11-14 2008-06-12 The Regents Of The University Of California Digital expression of gene analysis
WO2008059578A1 (fr) 2006-11-16 2008-05-22 Olympus Corporation Procédé d'amplification pcr multiplex
WO2008079374A2 (en) 2006-12-21 2008-07-03 Wang Eric T Methods and compositions for selecting and using single nucleotide polymorphisms
WO2008081451A2 (en) 2007-01-03 2008-07-10 Monaliza Medical Ltd. Methods and kits for analyzing genetic material of a fetus
US20080164204A1 (en) 2007-01-08 2008-07-10 Mehdi Hatamian Valve for facilitating and maintaining separation of fluids and materials
WO2008084405A2 (en) 2007-01-11 2008-07-17 Erasmus University Medical Center Circular chromosome conformation capture (4c)
US20100129792A1 (en) 2007-02-06 2010-05-27 Gerassimos Makrigiorgos Direct monitoring and pcr amplification of the dosage and dosage difference between target genetic regions
WO2008098142A2 (en) 2007-02-08 2008-08-14 Sequenom, Inc. Nucleic acid-based tests for rhd typing, gender determination and nucleic acid quantification
JP2008209985A (ja) 2007-02-23 2008-09-11 Canon Inc データ処理装置、電子文書登録方法、及びコンピュータプログラム
WO2008115497A2 (en) 2007-03-16 2008-09-25 Gene Security Network System and method for cleaning noisy genetic data and determining chromsome copy number
US8617816B2 (en) 2007-03-16 2013-12-31 454 Life Sciences, A Roche Company System and method for detection of HIV drug resistant variants
CA2680588A1 (en) 2007-03-26 2008-10-02 Sequenom, Inc. Restriction endonuclease enhanced polymorphic sequence detection
JP5262230B2 (ja) 2007-03-28 2013-08-14 独立行政法人理化学研究所 新規多型検出法
ITTO20070307A1 (it) 2007-05-04 2008-11-05 Silicon Biosystems Spa Metodo e dispositivo per la diagnosi prenatale non-invasiva
JP5389789B2 (ja) 2007-05-31 2014-01-15 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 立体障害および酵素に関連するシグナル増幅に基づく高特異性かつ高感度の検出
WO2008151110A2 (en) 2007-06-01 2008-12-11 The University Of North Carolina At Chapel Hill Molecular diagnosis and typing of lung cancer variants
WO2008157264A2 (en) 2007-06-15 2008-12-24 Sequenom, Inc. Combined methods for the detection of chromosomal aneuploidy
WO2008155599A1 (en) 2007-06-20 2008-12-24 Taag-Genetics Sa Nested multiplex amplification method for identification of multiple biological entities
US20090023190A1 (en) 2007-06-20 2009-01-22 Kai Qin Lao Sequence amplification with loopable primers
ES2647237T3 (es) 2007-07-03 2017-12-20 Genaphora Ltd. Cebadores quiméricos para reacciones de amplificación de ácidos nucleicos mejoradas
WO2009009769A2 (en) 2007-07-11 2009-01-15 Artemis Health, Inc. Diagnosis of fetal abnormalities using nucleated red blood cells
HUE030510T2 (hu) 2007-07-23 2017-05-29 Univ Hong Kong Chinese Magzati kromoszómális aneuploidia diagnosztizálása genomszekvenálás alkalmazásával
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
JP5531367B2 (ja) 2007-08-01 2014-06-25 ダナ−ファーバー キャンサー インスチテュート 標的配列の濃縮
US20090053719A1 (en) 2007-08-03 2009-02-26 The Chinese University Of Hong Kong Analysis of nucleic acids by digital pcr
US8568994B2 (en) 2007-08-03 2013-10-29 Dkfz Deutsches Krebsforschungszentrum, Stiftung Des Offentlichen Rechts Method for prenatal diagnosis
WO2009032779A2 (en) 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for the size-specific seperation of nucleic acid from a sample
EP2195452B1 (en) 2007-08-29 2012-03-14 Sequenom, Inc. Methods and compositions for universal size-specific polymerase chain reaction
US8748100B2 (en) 2007-08-30 2014-06-10 The Chinese University Of Hong Kong Methods and kits for selectively amplifying, detecting or quantifying target DNA with specific end sequences
WO2009033178A1 (en) 2007-09-07 2009-03-12 Fluidigm Corporation Copy number variation determination, methods and systems
CA2697640C (en) 2007-09-21 2016-06-21 Katholieke Universiteit Leuven Tools and methods for genetic tests using next generation sequencing
US20110300608A1 (en) 2007-09-21 2011-12-08 Streck, Inc. Nucleic acid isolation in preserved whole blood
US20100086914A1 (en) 2008-10-03 2010-04-08 Roche Molecular Systems, Inc. High resolution, high throughput hla genotyping by clonal sequencing
JP2011500041A (ja) 2007-10-16 2011-01-06 エフ.ホフマン−ラ ロシュ アーゲー クローナルシークエンシングによる高分解能かつ高効率のhla遺伝子型決定法
WO2009064897A2 (en) 2007-11-14 2009-05-22 Chronix Biomedical Detection of nucleic acid sequence variations in circulating nucleic acid in bovine spongiform encephalopathy
CN101878304B (zh) 2007-11-30 2015-01-07 通用电气医疗集团生物科学公司 用于从单个样品中分离基因组dna、rna和蛋白质的方法
FR2925480B1 (fr) 2007-12-21 2011-07-01 Gervais Danone Sa Procede d'enrichissement d'une eau en oxygene par voie electrolytique, eau ou boisson enrichie en oxygene et utilisations
EP2077337A1 (en) 2007-12-26 2009-07-08 Eppendorf Array Technologies SA Amplification and detection composition, method and kit
EP2620511B1 (en) 2008-01-17 2018-02-28 Sequenom, Inc. Single molecule nucleic acid sequence analysis processes
US8852864B2 (en) 2008-01-17 2014-10-07 Sequenom Inc. Methods and compositions for the analysis of nucleic acids
ES2703363T3 (es) 2008-02-01 2019-03-08 Massachusetts Gen Hospital Uso de microvesículas en el diagnóstico y pronóstico de tumores cerebrales
WO2009099602A1 (en) 2008-02-04 2009-08-13 Massachusetts Institute Of Technology Selection of nucleic acids by solution hybridization to oligonucleotide baits
WO2009105531A1 (en) 2008-02-19 2009-08-27 Gene Security Network, Inc. Methods for cell genotyping
US20090221620A1 (en) 2008-02-20 2009-09-03 Celera Corporation Gentic polymorphisms associated with stroke, methods of detection and uses thereof
US8709726B2 (en) 2008-03-11 2014-04-29 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
US20090299645A1 (en) 2008-03-19 2009-12-03 Brandon Colby Genetic analysis
EP2276858A4 (en) 2008-03-26 2011-10-05 Sequenom Inc RESTRICTED ENDONUCLEASE AMPLIFIED POLYMORPHIC SEQUENCE DETECTION
US8133672B2 (en) 2008-03-31 2012-03-13 Pacific Biosciences Of California, Inc. Two slow-step polymerase enzyme systems and methods
ES2586457T3 (es) 2008-04-03 2016-10-14 Cb Biotechnologies, Inc. Reacción en cadena de la polimerasa múltiple de rescate de amplicón para amplificación de dianas múltiples
WO2009146335A1 (en) 2008-05-27 2009-12-03 Gene Security Network, Inc. Methods for embryo characterization and comparison
EP2128169A1 (de) 2008-05-30 2009-12-02 Qiagen GmbH Verfahren zur Isolierung von kurzkettigen Nukleinsäuren
MX2011000794A (es) 2008-07-21 2011-02-24 Becton Dickinson Co Dispositivo de separacion de fase por densidad.
JP5555453B2 (ja) 2008-07-24 2014-07-23 スリーエム イノベイティブ プロパティズ カンパニー 研磨材製品、その製造方法及び使用方法
US20100041048A1 (en) 2008-07-31 2010-02-18 The Johns Hopkins University Circulating Mutant DNA to Assess Tumor Dynamics
CN104732118B (zh) 2008-08-04 2017-08-22 纳特拉公司 等位基因调用和倍性调用的方法
WO2010027870A2 (en) 2008-08-26 2010-03-11 Fluidigm Corporation Assay methods for increased throughput of samples and/or targets
DE102008045705A1 (de) 2008-09-04 2010-04-22 Macherey, Nagel Gmbh & Co. Kg Handelsgesellschaft Verfahren zur Gewinnung von kurzer RNA sowie Kit hierfür
US8586310B2 (en) 2008-09-05 2013-11-19 Washington University Method for multiplexed nucleic acid patch polymerase chain reaction
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
CN102216456A (zh) 2008-09-16 2011-10-12 塞昆纳姆股份有限公司 基于甲基化富集母体样品中胎儿核酸的非侵入性产前诊断用方法和组合物
EP2324131A4 (en) 2008-09-17 2013-02-27 Ge Healthcare Bio Sciences PROCESS FOR ISOLATING SMALL RNA
US20100112575A1 (en) 2008-09-20 2010-05-06 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive Diagnosis of Fetal Aneuploidy by Sequencing
US9156010B2 (en) 2008-09-23 2015-10-13 Bio-Rad Laboratories, Inc. Droplet-based assay system
US20110301221A1 (en) 2008-10-10 2011-12-08 Swedish Health Services Diagnosis, prognosis and treatment of glioblastoma multiforme
WO2010045617A2 (en) 2008-10-17 2010-04-22 University Of Louisville Research Foundation Detecting genetic abnormalities
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
EP4335932A2 (en) 2008-11-07 2024-03-13 Adaptive Biotechnologies Corporation Methods of monitoring conditions by sequence analysis
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
EP2379746B1 (en) 2008-12-22 2017-03-08 Celula Inc. Methods and genotyping panels for detecting alleles, genomes, and transcriptomes
US11634747B2 (en) 2009-01-21 2023-04-25 Streck Llc Preservation of fetal nucleic acids in maternal plasma
WO2010088288A2 (en) 2009-01-28 2010-08-05 Fluidigm Corporation Determination of copy number differences by amplification
DE202010018569U1 (de) 2009-02-18 2017-09-26 Streck Inc. Konservierung zellfreier Nukleinsäuren
JP5805064B2 (ja) 2009-03-27 2015-11-04 ライフ テクノロジーズ コーポレーション 対立遺伝子変種を検出するための方法、組成物、およびキット
WO2010115044A2 (en) 2009-04-02 2010-10-07 Fluidigm Corporation Selective tagging of short nucleic acid fragments and selective protection of target sequences from degradation
EA023190B9 (ru) 2009-04-02 2018-03-30 Флуидигм Корпорейшн Способ мультипраймерной амплификации для штрихового кодирования целевых нуклеиновых кислот
EP3514244B1 (en) 2009-04-03 2021-07-07 Sequenom, Inc. Nucleic acid preparation methods
US20120164638A1 (en) 2009-04-06 2012-06-28 Case Western Reserve University Digital Quantification of DNA Methylation
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
US8481699B2 (en) 2009-07-14 2013-07-09 Academia Sinica Multiplex barcoded Paired-End ditag (mbPED) library construction for ultra high throughput sequencing
US20130196862A1 (en) 2009-07-17 2013-08-01 Natera, Inc. Informatics Enhanced Analysis of Fetal Samples Subject to Maternal Contamination
US8563242B2 (en) 2009-08-11 2013-10-22 The Chinese University Of Hong Kong Method for detecting chromosomal aneuploidy
CN101643904B (zh) 2009-08-27 2011-04-27 北京北方微电子基地设备工艺研究中心有限责任公司 深硅刻蚀装置和深硅刻蚀设备的进气系统
WO2011032078A1 (en) 2009-09-11 2011-03-17 Health Reseach Inc. Detection of x4 strains of hiv-1 by heteroduplex tracking assay
WO2011035870A1 (en) 2009-09-22 2011-03-31 Roche Diagnostics Gmbh Determination of kir haplotypes associated with disease
CA2773186A1 (en) 2009-09-24 2011-03-31 Qiagen Gaithersburg, Inc. Compositions, methods, and kits for isolating and analyzing nucleic acids using an anion exchange material
US20120185176A1 (en) * 2009-09-30 2012-07-19 Natera, Inc. Methods for Non-Invasive Prenatal Ploidy Calling
CA2778926C (en) 2009-10-26 2018-03-27 Lifecodexx Ag Means and methods for non-invasive diagnosis of chromosomal aneuploidy
CA2779695C (en) 2009-11-05 2016-05-24 The Chinese University Of Hong Kong Fetal genomic analysis from a maternal biological sample
CN102712954A (zh) 2009-11-06 2012-10-03 小利兰·斯坦福大学托管委员会 器官移植患者移植排斥的非侵入性诊断
US20110111410A1 (en) 2009-11-09 2011-05-12 Streck, Inc. Stabilization of rna in intact cells within a blood sample
EP2504448B1 (en) 2009-11-25 2016-10-19 Bio-Rad Laboratories, Inc. Methods and compositions for detecting genetic material
KR101289535B1 (ko) 2009-12-07 2013-07-24 전민용 원심분리관
WO2011072086A1 (en) 2009-12-08 2011-06-16 Hemaquest Pharmaceuticals, Inc. Methods and low dose regimens for treating red blood cell disorders
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US8574842B2 (en) 2009-12-22 2013-11-05 The Board Of Trustees Of The Leland Stanford Junior University Direct molecular diagnosis of fetal aneuploidy
EP3088532B1 (en) 2009-12-22 2019-10-30 Sequenom, Inc. Processes and kits for identifying aneuploidy
EP2524056A4 (en) 2010-01-15 2013-08-14 Univ British Columbia MULTIPLEX AMPLIFICATION FOR DETECTION OF NUCLEIC ACID VARIATIONS
EP3382037B1 (en) 2010-01-19 2021-02-17 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acids in maternal samples
WO2011090556A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acid in maternal samples
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US20120270739A1 (en) 2010-01-19 2012-10-25 Verinata Health, Inc. Method for sample analysis of aneuploidies in maternal samples
US20110312503A1 (en) 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
EP2534263B1 (en) 2010-02-09 2020-08-05 Unitaq Bio Methods and compositions for universal detection of nucleic acids
WO2011106724A2 (en) 2010-02-26 2011-09-01 Life Technologies Corporation Fast pcr for str genotyping
AU2011223789A1 (en) 2010-03-01 2012-09-20 Caris Life Sciences Switzerland Holdings Gmbh Biomarkers for theranostics
EP2551356B1 (en) 2010-03-24 2017-06-14 Toppan Printing Co., Ltd. Method for detecting target base sequence using competitive primer
US9255291B2 (en) 2010-05-06 2016-02-09 Bioo Scientific Corporation Oligonucleotide ligation methods for improving data quality and throughput using massively parallel sequencing
WO2011140433A2 (en) 2010-05-07 2011-11-10 The Board Of Trustees Of The Leland Stanford Junior University Measurement and comparison of immune diversity by high-throughput sequencing
WO2011143659A2 (en) 2010-05-14 2011-11-17 Fluidigm Corporation Nucleic acid isolation methods
US20140186827A1 (en) 2010-05-14 2014-07-03 Fluidigm, Inc. Assays for the detection of genotype, mutations, and/or aneuploidy
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US20190323076A1 (en) 2010-05-18 2019-10-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
WO2013052557A2 (en) 2011-10-03 2013-04-11 Natera, Inc. Methods for preimplantation genetic diagnosis by sequencing
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US20190309358A1 (en) 2010-05-18 2019-10-10 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190284623A1 (en) 2010-05-18 2019-09-19 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US20130123120A1 (en) 2010-05-18 2013-05-16 Natera, Inc. Highly Multiplex PCR Methods and Compositions
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
AU2011255641A1 (en) 2010-05-18 2012-12-06 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20140206552A1 (en) 2010-05-18 2014-07-24 Natera, Inc. Methods for preimplantation genetic diagnosis by sequencing
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20110301854A1 (en) 2010-06-08 2011-12-08 Curry Bo U Method of Determining Allele-Specific Copy Number of a SNP
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US20120190557A1 (en) 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Risk calculation for evaluation of fetal aneuploidy
US20130040375A1 (en) 2011-08-08 2013-02-14 Tandem Diagnotics, Inc. Assay systems for genetic analysis
EP2426217A1 (en) 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
WO2012042374A2 (en) 2010-10-01 2012-04-05 Anssi Jussi Nikolai Taipale Method of determining number or concentration of molecules
CN103534591B (zh) 2010-10-26 2016-04-06 利兰·斯坦福青年大学托管委员会 通过测序分析进行的非侵入性胎儿遗传筛选
US9284602B2 (en) 2010-10-27 2016-03-15 President And Fellows Of Harvard College Compositions of toehold primer duplexes and methods of use
CN108899091B (zh) 2010-11-30 2022-04-15 香港中文大学 与癌症相关的遗传或分子畸变的检测
WO2012078792A2 (en) 2010-12-07 2012-06-14 Stanford University Non-invasive determination of fetal inheritance of parental haplotypes at the genome-wide scale
US20150064695A1 (en) 2010-12-17 2015-03-05 Celula Inc. Methods for screening and diagnosing genetic conditions
AU2011348100B2 (en) 2010-12-22 2016-08-25 Natera, Inc. Methods for non-invasive prenatal paternity testing
EP3564395A1 (en) 2010-12-30 2019-11-06 Foundation Medicine, Inc. Optimization of multigene analysis of tumor samples
US20120190021A1 (en) 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Detection of genetic abnormalities
EP2902500B1 (en) 2011-02-09 2017-01-11 Natera, Inc. Methods for non-invasive prenatal ploidy calling
GB2488358A (en) 2011-02-25 2012-08-29 Univ Plymouth Enrichment of foetal DNA in maternal plasma
US9260753B2 (en) 2011-03-24 2016-02-16 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
DK3567124T3 (da) 2011-04-12 2022-03-07 Verinata Health Inc Opløsning af genomfraktioner ved anvendelse af polymorfisme-optællinger
AU2012242525B2 (en) 2011-04-14 2015-09-17 Complete Genomics, Inc. Processing and analysis of complex nucleic acid sequence data
AU2011365507A1 (en) * 2011-04-14 2013-05-02 Verinata Health, Inc. Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies
EP3907299A1 (en) 2011-04-15 2021-11-10 The Johns Hopkins University Safe sequencing system
US9411937B2 (en) * 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
EP3495497B1 (en) 2011-04-28 2021-03-24 Life Technologies Corporation Methods and compositions for multiplex pcr
CN103717750B (zh) 2011-04-29 2017-03-08 塞昆纳姆股份有限公司 少数核酸物质的定量
CN102876660A (zh) 2011-07-11 2013-01-16 三星电子株式会社 扩增靶核酸的方法和测定样品中的靶核酸的相对量的方法
US20130024127A1 (en) 2011-07-19 2013-01-24 John Stuelpnagel Determination of source contributions using binomial probability calculations
GB201115095D0 (en) 2011-09-01 2011-10-19 Singapore Volition Pte Ltd Method for detecting nucleosomes containing nucleotides
US8712697B2 (en) 2011-09-07 2014-04-29 Ariosa Diagnostics, Inc. Determination of copy number variations using binomial probability calculations
GB2496016B (en) 2011-09-09 2016-03-16 Univ Leland Stanford Junior Methods for obtaining a sequence
JP5536729B2 (ja) 2011-09-20 2014-07-02 株式会社ソニー・コンピュータエンタテインメント 情報処理装置、アプリケーション提供システム、アプリケーション提供サーバ、アプリケーション提供方法、および情報処理方法
ES2937410T3 (es) 2011-09-26 2023-03-28 Qiagen Gmbh Método rápido para aislar ácidos nucleicos extracelulares
EP2764458B1 (en) 2011-10-06 2021-04-07 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9984198B2 (en) 2011-10-06 2018-05-29 Sequenom, Inc. Reducing sequence read count error in assessment of complex genetic variations
US20140234273A1 (en) 2011-10-07 2014-08-21 Muroch Children Research Institute Diagnostic assay for tissue transplantation status
WO2013078470A2 (en) 2011-11-22 2013-05-30 MOTIF, Active Multiplex isolation of protein-associated nucleic acids
US20140364439A1 (en) 2011-12-07 2014-12-11 The Broad Institute, Inc. Markers associated with chronic lymphocytic leukemia prognosis and progression
US10214775B2 (en) 2011-12-07 2019-02-26 Chronix Biomedical Prostate cancer associated circulating nucleic acid biomarkers
US20130190653A1 (en) 2012-01-25 2013-07-25 Angel Gabriel Alvarez Ramos Device for blood collection from the placenta and the umbilical cord
US9670529B2 (en) 2012-02-28 2017-06-06 Population Genetics Technologies Ltd. Method for attaching a counter sequence to a nucleic acid sample
WO2013130848A1 (en) * 2012-02-29 2013-09-06 Natera, Inc. Informatics enhanced analysis of fetal samples subject to maternal contamination
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
US9862995B2 (en) 2012-03-13 2018-01-09 Abhijit Ajit Patel Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
EP3741871A3 (en) 2012-04-19 2021-02-17 The Medical College of Wisconsin, Inc. Highly sensitive surveillance using detection of cell free dna
EP2653562A1 (en) 2012-04-20 2013-10-23 Institut Pasteur Anellovirus genome quantification as a biomarker of immune suppression
JP6445426B2 (ja) 2012-05-10 2018-12-26 ザ ジェネラル ホスピタル コーポレイション ヌクレオチド配列を決定する方法
EP2852687A4 (en) 2012-05-21 2016-10-05 Scripps Research Inst METHODS FOR PREPARING A SAMPLE
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
CN104350152B (zh) 2012-06-01 2017-08-11 欧米伽生物技术公司 选择性核酸片段回收
US11261494B2 (en) * 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
WO2014004726A1 (en) 2012-06-26 2014-01-03 Caifu Chen Methods, compositions and kits for the diagnosis, prognosis and monitoring of cancer
US20150011396A1 (en) 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
EP2877594B1 (en) 2012-07-20 2019-12-04 Verinata Health, Inc. Detecting and classifying copy number variation in a fetal genome
KR20150032340A (ko) * 2012-07-24 2015-03-25 파마시클릭스, 인코포레이티드 브루톤 티로신 키나제(btk)의 억제제에 대한 내성과 관련된 돌연변이
RU2650790C2 (ru) * 2012-07-24 2018-04-17 Натера, Инк. Способы и композиции для высокомультиплексной пцр
US10988803B2 (en) 2014-12-29 2021-04-27 Life Genetics Lab, Llc Multiplexed assay for quantitating and assessing integrity of cell-free DNA in biological fluids for cancer diagnosis, prognosis and surveillance
US10993418B2 (en) 2012-08-13 2021-05-04 Life Genetics Lab, Llc Method for measuring tumor burden in patient derived xenograft (PDX) mice
CA2880331A1 (en) * 2012-08-15 2014-02-20 Universite De Montreal Method for identifying novel minor histocompatibility antigens
US20140051585A1 (en) 2012-08-15 2014-02-20 Natera, Inc. Methods and compositions for reducing genetic library contamination
US20140100126A1 (en) * 2012-08-17 2014-04-10 Natera, Inc. Method for Non-Invasive Prenatal Testing Using Parental Mosaicism Data
CN105164509B (zh) 2012-08-28 2018-02-23 阿科尼生物系统公司 用于纯化核酸的方法和试剂盒
US20140066317A1 (en) 2012-09-04 2014-03-06 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20140065621A1 (en) 2012-09-04 2014-03-06 Natera, Inc. Methods for increasing fetal fraction in maternal blood
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
WO2014149134A2 (en) 2013-03-15 2014-09-25 Guardant Health Inc. Systems and methods to detect rare mutations and copy number variation
CN104781421B (zh) 2012-09-04 2020-06-05 夸登特健康公司 检测稀有突变和拷贝数变异的系统和方法
CA3139031A1 (en) 2012-10-04 2014-04-10 Dana-Farber Cancer Institute, Inc. Human monoclonal anti-pd-l1 antibodies and methods of use
US9669405B2 (en) 2012-10-22 2017-06-06 The Regents Of The University Of California Sterilizable photopolymer serum separator
DK2728014T3 (en) 2012-10-31 2016-01-25 Genesupport Sa A non-invasive method for the detection of fetal chromosomal aneuploidy
US20220307086A1 (en) 2012-11-21 2022-09-29 Natera, Inc. Methods for simultaneous amplification of target loci
WO2014110528A1 (en) 2013-01-13 2014-07-17 Unitaq Bio Methods and compositions for pcr using blocked and universal primers
WO2014122288A1 (en) 2013-02-08 2014-08-14 Qiagen Gmbh Method for separating dna by size
US9982255B2 (en) 2013-03-11 2018-05-29 Kailos Genetics, Inc. Capture methodologies for circulating cell free DNA
US10385394B2 (en) 2013-03-15 2019-08-20 The Translational Genomics Research Institute Processes of identifying and characterizing X-linked disorders
CN113337604A (zh) 2013-03-15 2021-09-03 莱兰斯坦福初级大学评议会 循环核酸肿瘤标志物的鉴别和用途
CA2902006A1 (en) 2013-03-15 2014-09-18 Immucor Gti Diagnostics, Inc. Methods and compositions for assessing renal status using urine cell free dna
CA3156663A1 (en) 2013-03-15 2014-09-18 Verinata Health, Inc. Generating cell-free dna libraries directly from blood
CA2902167A1 (en) 2013-03-15 2014-09-25 Abbott Molecular Inc. Method for amplification and assay of rna fusion gene variants, method of distinguishing same and related primers, probes, and kits
US10072298B2 (en) 2013-04-17 2018-09-11 Life Technologies Corporation Gene fusions and gene variants associated with cancer
WO2014194113A2 (en) 2013-05-29 2014-12-04 Chronix Biomedical Detection and quantification of donor cell-free dna in the circulation of organ transplant recipients
WO2015048535A1 (en) 2013-09-27 2015-04-02 Natera, Inc. Prenatal diagnostic resting standards
EP3049557B1 (en) 2013-09-27 2021-05-05 University of Washington Methods and systems for large scale scaffolding of genome assemblies
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
KR102205950B1 (ko) 2013-11-07 2021-01-22 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 인간 마이크로바이옴 및 그의 성분의 분석을 위한 무세포 핵산
WO2015083004A1 (en) 2013-12-02 2015-06-11 Population Genetics Technologies Ltd. Method for evaluating minority variants in a sample
JP6571665B2 (ja) 2013-12-28 2019-09-04 ガーダント ヘルス, インコーポレイテッド 遺伝的バリアントを検出するための方法およびシステム
EP4094834A1 (en) 2013-12-30 2022-11-30 Atreca, Inc. Analysis of nucleic acids associated with single cells using nucleic acid barcodes
JP7016215B2 (ja) 2014-01-27 2022-02-04 ザ ジェネラル ホスピタル コーポレイション 配列決定のために核酸を調製する方法
CA2938910A1 (en) 2014-02-11 2015-08-20 F. Hoffmann-La Roche Ag Targeted sequencing and uid filtering
WO2015134552A1 (en) 2014-03-03 2015-09-11 Swift Biosciences, Inc. Enhanced adaptor ligation
CA2970916A1 (en) 2014-03-14 2015-09-17 Caredx, Inc. Methods of monitoring immunosuppressive therapies in a transplant recipient
CN106462669A (zh) 2014-03-25 2017-02-22 奎斯特诊断投资股份有限公司 通过使用平均循环阈值的基因内差异表达(ide)检测基因融合
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
WO2015164432A1 (en) 2014-04-21 2015-10-29 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US20180173845A1 (en) 2014-06-05 2018-06-21 Natera, Inc. Systems and Methods for Detection of Aneuploidy
US10400282B2 (en) 2014-06-27 2019-09-03 Inserm (Institut National De La Santéet De La Recherche Médicale) Methods employing circulating DNA and miRNA as biomarkers for female infertility
US10619163B2 (en) 2014-07-03 2020-04-14 Rhodx, Inc. Tagging and assessing a target sequence
AU2015289027B2 (en) 2014-07-17 2021-08-19 Qiagen Gmbh Method for isolating RNA with high yield
WO2016011414A1 (en) 2014-07-18 2016-01-21 Illumina, Inc. Non-invasive prenatal diagnosis of fetal genetic condition using cellular dna and cell free dna
GB201412834D0 (en) 2014-07-18 2014-09-03 Cancer Rec Tech Ltd A method for detecting a genetic variant
EP4026914A1 (en) 2014-10-08 2022-07-13 Cornell University Method for identification and relative quantification of nucleic acid methylation changes using combined nuclease, ligation, and polymerase reactions with carryover prevention
WO2016063122A1 (en) 2014-10-20 2016-04-28 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods for screening a subject for a cancer
US9783799B2 (en) 2014-10-24 2017-10-10 Abbott Molecular Inc. Enrichment of small nucleic acids
WO2016077313A1 (en) 2014-11-11 2016-05-19 Bgi Shenzhen Multi-pass sequencing
EP3754027A1 (en) 2014-12-01 2020-12-23 The Broad Institute, Inc. Methods for altering or modulating spatial proximity between nucleic acids inside of a cell
GB201501907D0 (en) 2015-02-05 2015-03-25 Technion Res & Dev Foundation System and method for single cell genetic analysis
WO2016123698A1 (en) 2015-02-06 2016-08-11 Uti Limited Partnership Diagnostic assay for post-transplant assessment of potential rejection of donor organs
US10557134B2 (en) 2015-02-24 2020-02-11 Trustees Of Boston University Protection of barcodes during DNA amplification using molecular hairpins
EP3262189B1 (en) 2015-02-27 2021-12-08 Becton, Dickinson and Company Methods for barcoding nucleic acids for sequencing
WO2016160844A2 (en) 2015-03-30 2016-10-06 Cellular Research, Inc. Methods and compositions for combinatorial barcoding
KR101850437B1 (ko) 2015-04-14 2018-04-20 이원다이애그노믹스(주) 차세대 염기서열 분석기법을 이용한 장기 이식 거부 반응 예측 방법
EP3286326A1 (en) 2015-04-23 2018-02-28 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
MX2017013878A (es) 2015-04-30 2018-06-22 Medical College Of Wisconsin Inc Amplificación de discordancias optimizadas multiplicadas (moma) - reacción en cadena de polimerasa (pcr) en tiempo real, para evaluar el ácido desoxirribonucleico (adn) libre de celula.
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
US20180291365A1 (en) 2015-06-05 2018-10-11 Qiagen Gmbh Method for separating dna by size
US20160371428A1 (en) 2015-06-19 2016-12-22 Natera, Inc. Systems and methods for determining aneuploidy risk using sample fetal fraction
WO2017004612A1 (en) 2015-07-02 2017-01-05 Arima Genomics, Inc. Accurate molecular deconvolution of mixtures samples
GB201516047D0 (en) 2015-09-10 2015-10-28 Cancer Rec Tech Ltd Method
US20180282796A1 (en) 2015-09-29 2018-10-04 Ludwig Institute For Cancer Research Ltd Typing and Assembling Discontinuous Genomic Elements
AU2016341198B2 (en) 2015-10-19 2023-03-09 Dovetail Genomics, Llc Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection
KR20180097536A (ko) 2015-11-04 2018-08-31 아트레카, 인크. 단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 조합 세트
US20170145475A1 (en) 2015-11-20 2017-05-25 Streck, Inc. Single spin process for blood plasma separation and plasma composition including preservative
CN105986030A (zh) 2016-02-03 2016-10-05 广州市基准医疗有限责任公司 甲基化dna检测方法
US10597717B2 (en) 2016-03-22 2020-03-24 Myriad Women's Health, Inc. Combinatorial DNA screening
WO2017173039A1 (en) 2016-03-30 2017-10-05 Covaris, Inc. Extraction of cfdna from biological samples
EP3436606B8 (en) 2016-04-01 2023-03-15 M.A.G.I.C. Clinic Ltd. Plasma derived cell-free mitochondrial deoxyribonucleic acid
WO2017181146A1 (en) 2016-04-14 2017-10-19 Guardant Health, Inc. Methods for early detection of cancer
ES2913468T3 (es) 2016-04-15 2022-06-02 Natera Inc Métodos para la detección del cáncer de pulmón.
CN109661475A (zh) 2016-04-29 2019-04-19 威斯康星州立大学医学院 多重优化错配扩增(moma)靶标数目
US20190292575A1 (en) 2016-05-24 2019-09-26 The Translational Genomics Research Institute Molecular tagging methods and sequencing libraries
US20170342477A1 (en) 2016-05-27 2017-11-30 Sequenom, Inc. Methods for Detecting Genetic Variations
AU2017290809A1 (en) 2016-07-01 2018-12-13 Natera, Inc. Compositions and methods for detection of nucleic acid mutations
SG11201811556RA (en) 2016-07-06 2019-01-30 Guardant Health Inc Methods for fragmentome profiling of cell-free nucleic acids
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
EA201991105A1 (ru) 2016-11-02 2020-01-27 Дзе Медикал Колледж Оф Висконсин, Инк. Методы оценки риска с использованием общей и специфической неклеточной днк
GB201618485D0 (en) 2016-11-02 2016-12-14 Ucl Business Plc Method of detecting tumour recurrence
US11107021B2 (en) 2016-11-06 2021-08-31 Microsoft Technology Licensing, Llc Presenting and manipulating task items
EP3538672A1 (en) 2016-11-08 2019-09-18 Cellular Research, Inc. Methods for cell label classification
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
EP3571320B1 (en) 2017-01-17 2022-04-06 Life Technologies Corporation Compositions and methods for immune repertoire sequencing
EP3585889A1 (en) 2017-02-21 2020-01-01 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
CN111094593A (zh) 2017-06-20 2020-05-01 威斯康星州立大学医学院 使用供体特异性无细胞dna来评估移植对象中的病症
CA3067635A1 (en) 2017-06-20 2018-12-27 The Medical College Of Wisconsin, Inc. Transplant patient monitoring with cell-free dna
CA3067637A1 (en) 2017-06-20 2018-12-27 The Medical College Of Wisconsin, Inc. Assessing transplant complication risk with total cell-free dna
JP7232476B2 (ja) 2017-08-07 2023-03-08 ザ ジョンズ ホプキンス ユニバーシティ がんを評価及び治療するための方法及び物質
CN111344416A (zh) 2017-09-01 2020-06-26 生命技术公司 用于免疫组库测序的组合物和方法
US11091800B2 (en) 2017-09-20 2021-08-17 University Of Utah Research Foundation Size-selection of cell-free DNA for increasing family size during next-generation sequencing
US20210269879A1 (en) 2017-12-14 2021-09-02 Tai Diagnostics, Inc. Assessing graft suitability for transplantation
CN111699269A (zh) 2018-01-12 2020-09-22 纳特拉公司 新引物及其用途
US20210009990A1 (en) 2018-02-15 2021-01-14 Natera, Inc. Methods for isolating nucleic acids with size selection
GB201819134D0 (en) 2018-11-23 2019-01-09 Cancer Research Tech Ltd Improvements in variant detection
EP3781714A1 (en) 2018-04-14 2021-02-24 Natera, Inc. Methods for cancer detection and monitoring by means of personalized detection of circulating tumor dna
US20210257048A1 (en) 2018-06-12 2021-08-19 Natera, Inc. Methods and systems for calling mutations
BR112020027023A2 (pt) 2018-07-03 2021-04-06 Natera, Inc. Métodos para detecção de dna livre de células derivado de doador
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
KR20210059694A (ko) 2018-07-12 2021-05-25 트윈스트랜드 바이오사이언시스, 인코포레이티드 게놈 편집, 클론 팽창 및 연관된 분야를 규명하기 위한 방법 및 시약
US20210327538A1 (en) 2018-07-17 2021-10-21 Natera, Inc. Methods and systems for calling ploidy states using a neural network
WO2020041449A1 (en) 2018-08-21 2020-02-27 Zymo Research Corporation Methods and compositions for tracking sample quality
WO2020076957A1 (en) 2018-10-09 2020-04-16 Tai Diagnostics, Inc. Cell lysis assay for cell-free dna analysis
WO2020106897A1 (en) 2018-11-20 2020-05-28 Alex Brandt Methods and materials for detecting salmonella in beef
EP3884087A4 (en) 2018-11-21 2022-09-07 Karius Inc. DETECTION AND PREDICTION OF INFECTIOUS DISEASES
WO2020131699A2 (en) 2018-12-17 2020-06-25 Natera, Inc. Methods for analysis of circulating cells
US11931674B2 (en) 2019-04-04 2024-03-19 Natera, Inc. Materials and methods for processing blood samples
CA3134519A1 (en) 2019-04-15 2020-10-22 Natera, Inc. Improved liquid biopsy using size selection
EP3980559A1 (en) 2019-06-06 2022-04-13 Natera, Inc. Methods for detecting immune cell dna and monitoring immune system
US20220340963A1 (en) 2019-09-20 2022-10-27 Natera, Inc. Methods for assessing graft suitability for transplantation
US20230203573A1 (en) 2020-05-29 2023-06-29 Natera, Inc. Methods for detection of donor-derived cell-free dna
US20230257816A1 (en) 2020-07-13 2023-08-17 Aoy Tomita Mitchell Methods for making treatment management decisions in transplant subjects and assessing transplant risks with threshold values
CA3213399A1 (en) 2021-03-18 2022-09-22 Natera, Inc. Methods for determination of transplant rejection

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010509922A (ja) * 2006-11-16 2010-04-02 ジェネンテック インコーポレイテッド 腫瘍と関連している遺伝的変異
JP2014507141A (ja) * 2011-02-09 2014-03-27 ナテラ, インコーポレイテッド 非侵襲的出生前倍数性呼び出しのための方法
WO2013123220A1 (en) * 2012-02-14 2013-08-22 Cornell University Method for relative quantification of nucleic acid sequence, expression, or copy changes, using combined nuclease, ligation, and polymerase reactions
JP2015508655A (ja) * 2012-02-14 2015-03-23 コーネル ユニバーシティー 組み合わせたヌクレアーゼ反応、連結反応、およびポリメラーゼ反応を用いて核酸配列、発現、またはコピー変化を相対的に定量するための方法

Also Published As

Publication number Publication date
AU2015249846A1 (en) 2016-11-10
JP2020072739A (ja) 2020-05-14
US11371100B2 (en) 2022-06-28
US11530454B2 (en) 2022-12-20
CA2945962A1 (en) 2015-10-29
US11319595B2 (en) 2022-05-03
US20230242998A1 (en) 2023-08-03
US20230042405A1 (en) 2023-02-09
US11486008B2 (en) 2022-11-01
JP2020072736A (ja) 2020-05-14
AU2021209221B2 (en) 2022-03-10
JP6994058B2 (ja) 2022-01-14
US20190194758A1 (en) 2019-06-27
US11408037B2 (en) 2022-08-09
CN106460070A (zh) 2017-02-22
US20180171420A1 (en) 2018-06-21
US11414709B2 (en) 2022-08-16
HK1232260A1 (zh) 2018-01-05
JP2017519488A (ja) 2017-07-20
AU2021209221A1 (en) 2021-08-19
US20220213561A1 (en) 2022-07-07
CN109971852A (zh) 2019-07-05
US20190211402A1 (en) 2019-07-11
US20190256931A1 (en) 2019-08-22
US20220154290A1 (en) 2022-05-19
JP2020072735A (ja) 2020-05-14
JP2020072738A (ja) 2020-05-14
AU2015249846A2 (en) 2016-11-10
EP3957749A1 (en) 2022-02-23
JP2022065151A (ja) 2022-04-26
US20170107576A1 (en) 2017-04-20
JP2024001359A (ja) 2024-01-09
JP6659575B2 (ja) 2020-03-04
CN113774132A (zh) 2021-12-10
EP3561075A1 (en) 2019-10-30
CA2945962C (en) 2023-08-29
US20220282335A1 (en) 2022-09-08
US11319596B2 (en) 2022-05-03
US20180320239A1 (en) 2018-11-08
JP2022028950A (ja) 2022-02-16
JP7362805B2 (ja) 2023-10-17
AU2015249846B2 (en) 2021-07-22
US20190211406A1 (en) 2019-07-11
US20190194759A1 (en) 2019-06-27
JP7030860B2 (ja) 2022-03-07
JP2022028949A (ja) 2022-02-16
AU2022202083A1 (en) 2022-04-14
RU2717641C2 (ru) 2020-03-24
AU2022202083B2 (en) 2024-04-18
US10179937B2 (en) 2019-01-15
CN106460070B (zh) 2021-10-08
EP3134541A1 (en) 2017-03-01
EP3134541B1 (en) 2020-08-19
RU2016141308A3 (ja) 2018-11-19
JP6994059B2 (ja) 2022-01-14
RU2016141308A (ru) 2018-05-22
JP2020096601A (ja) 2020-06-25

Similar Documents

Publication Publication Date Title
JP7362805B2 (ja) 変異の検出および染色体分節の倍数性
WO2015164432A1 (en) Detecting mutations and ploidy in chromosomal segments

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200226

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210302

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211102

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211210

R150 Certificate of patent or registration of utility model

Ref document number: 6994059

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150