JP7027468B2 - Highly multiplex PCR method and composition - Google Patents

Highly multiplex PCR method and composition Download PDF

Info

Publication number
JP7027468B2
JP7027468B2 JP2020005462A JP2020005462A JP7027468B2 JP 7027468 B2 JP7027468 B2 JP 7027468B2 JP 2020005462 A JP2020005462 A JP 2020005462A JP 2020005462 A JP2020005462 A JP 2020005462A JP 7027468 B2 JP7027468 B2 JP 7027468B2
Authority
JP
Japan
Prior art keywords
target
primer
dna
allele
primers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020005462A
Other languages
Japanese (ja)
Other versions
JP2020058388A (en
Inventor
ベルンハルト ツィマーマン,
マシュー エム. ヒル,
フィリップ ギルバート ラクルート,
マイケル ドッド,
Original Assignee
ナテラ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/683,604 external-priority patent/US20130123120A1/en
Application filed by ナテラ, インコーポレイテッド filed Critical ナテラ, インコーポレイテッド
Publication of JP2020058388A publication Critical patent/JP2020058388A/en
Priority to JP2022020146A priority Critical patent/JP7348330B2/en
Application granted granted Critical
Publication of JP7027468B2 publication Critical patent/JP7027468B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Organic Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

関連出願の相互参照
本出願は、2012年11月21日出願の米国実用新案出願第13/683,604号、および2012年7月24日出願の米国特許仮出願第61/675,020号の利益と優先権を主張する。米国実用新案出願第13/683,604号は、2011年5月18日出願の米国実用新案出願第13/110,685号の一部継続である2011年11月18日出願の米国実用新案出願第13/300,235号の一部継続であり、2012年7月24日出願の米国特許仮出願第61/675,020号の利益を主張する。米国実用新案出願第13/110,685号は、2010年5月18日出願の米国特許仮出願第61/395,850号;2010年6月21日出願の米国特許仮出願第61/398,159号;2011年2月9日出願の米国特許仮出願第61/462,972号;2011年3月2日出願の米国特許仮出願第61/448,547号;および2011年4月12日出願の米国特許仮出願第61/516,996号の利益を主張する。米国実用新案出願第13/300,235号は、2011年6月23日出願の米国特許仮出願第61/571,248号の利益を主張する。これら全ての特許出願の全体は、それらのすべての教示のために参照により本明細書中に組み込まれる。
Mutual reference to related applications This application is in US Utility Model Application Nos. 13 / 683,604 filed November 21, 2012, and US Patent Provisional Application Nos. 61 / 675,020 filed July 24, 2012. Claim interests and priorities. US Utility Model Application No. 13 / 683,604 is a partial continuation of US Utility Model Application No. 13 / 110,685 filed May 18, 2011, and is a US utility model application filed on November 18, 2011. It is a partial continuation of Nos. 13 / 300,235 and claims the interests of US Patent Provisional Application Nos. 61 / 675,020 filed on July 24, 2012. US Practical New Application No. 13 / 110,685 is US Patent Provisional Application No. 61 / 395,850 filed May 18, 2010; US Patent Provisional Application No. 61/398 filed June 21, 2010, 159; US Patent Provisional Application No. 61 / 462,972 filed February 9, 2011; US Patent Provisional Application Nos. 61 / 448,547 filed March 2, 2011; and April 12, 2011. Claims the benefit of US Patent Provisional Application No. 61 / 516,996 of the application. US Utility Model Application Nos. 13 / 300,235 claim the benefit of US Patent Provisional Application Nos. 61 / 571,248 filed June 23, 2011. All of these patent applications are incorporated herein by reference for all their teachings.

連邦政府による資金提供を受けた研究開発の記載
本発明は、認可番号第5R44HD60423-3号による米国国立衛生研究所の支援によって行われた。米国政府は本出願に由来する全ての特許に対し権利を保有できる。
Federally Funded Description of Research and Development The invention was made with the support of the National Institutes of Health under License No. 5R44HD60423-3. The US Government may hold rights to all patents derived from this application.

発明の分野
本発明は、一般に、複数の目的の核酸領域を1反応体積で同時に増幅する方法と組成物に関する。
Field of Invention The present invention generally relates to methods and compositions for simultaneously amplifying a plurality of nucleic acid regions of interest in one reaction volume.

アッセイスループットを高め、核酸試料のより効率的な使用を可能とするために、多くのオリゴヌクレオチドプライマーを試料と混合した後、当技術分野で多重PCRとして知られるプロセスでポリメラーゼ連鎖反応(PCR)条件に試料を供することにより、目的の試料中の多くの標的核酸の同時増幅を実行できる。多重PCRの使用は、非常に単純な実験手順であり、核酸分析および検出に要する時間を短縮できる。しかし、複数の対が同じPCR反応に加えられる場合、増幅されたプライマー二量体などの非標的増幅産物が生成されることがある。プライマーの数が増えるに伴いこのような産物生成の可能性が増加する。これらの非標的増幅産物は、その後の分析、および/またはアッセイでの増幅産物の使用を大きく制限する。従って、多重PCRの間の非標的増幅産物の形成を減らすように改善された方法が必要である。 To increase assay throughput and allow for more efficient use of nucleic acid samples, a number of oligonucleotide primers are mixed with the sample and then polymerase chain reaction (PCR) conditions are performed in a process known in the art as multiplex PCR. By providing the sample to the sample, simultaneous amplification of many target nucleic acids in the target sample can be performed. The use of multiplex PCR is a very simple experimental procedure that can reduce the time required for nucleic acid analysis and detection. However, when multiple pairs are added to the same PCR reaction, non-target amplification products such as amplified primer dimers may be produced. As the number of primers increases, the likelihood of such product formation increases. These non-target amplification products severely limit the use of amplification products in subsequent analysis and / or assays. Therefore, there is a need for improved methods to reduce the formation of non-target amplification products during multiplex PCR.

改善された多重PCR法は、非侵襲的出生前遺伝子診断(NPD)などの様々な用途に有用となるであろう。具体的には、出生前診断の現行の方法により、医師および親に、成長している胎児の異常を警告することができる。出生前診断をしないと、50人に1人の乳児が重大な身体的または精神的ハンディキャップを持って生まれ、30人に1人もが先天性奇形のいくつかの形態を有する。残念ながら、標準の方法は、正確度が乏しいか、または流産のリスクを有する侵襲的な手順を伴う。母系の血中ホルモンレベルまたは超音波測定に基づく方法は非侵襲的であるが、同様に正確度が低い。羊水穿刺、絨毛膜絨毛生検および胎児の血液試料採取などの方法は正確度が高いが、侵襲的であり、著しいリスクを有する。米国では全妊娠のおよそ3%に対して羊水穿刺が実施されたが、その使用頻度は過去15年にわたって減少している。 The improved multiplex PCR method will be useful in a variety of applications such as non-invasive prenatal genetic diagnosis (NPD). Specifically, current methods of prenatal diagnosis can alert physicians and parents to abnormalities in a growing fetus. Without prenatal diagnosis, 1 in 50 babies are born with significant physical or mental handicap, and as many as 1 in 30 have some form of congenital malformation. Unfortunately, standard methods involve inaccurate or invasive procedures with a risk of miscarriage. Methods based on maternal blood hormone levels or ultrasound measurements are non-invasive, but similarly inaccurate. Methods such as amniocentesis, chorionic villus biopsy and fetal blood sampling are accurate but invasive and carry significant risks. Amniocentesis has been performed in approximately 3% of all pregnancies in the United States, but its frequency of use has declined over the last 15 years.

正常なヒトは、健康な二倍体細胞の全てに23種の染色体を2組有し、1つのコピーが各親に由来する。多すぎる染色体および/または少なすぎる染色体を有する核細胞における状態である異数性が、着床の失敗、流産、および遺伝病の大部分に関与すると考えられる。染色体異常を検出することにより、とりわけ、妊娠成功の機会が増すことに加えて、ダウン症候群、クラインフェルター症候群、およびターナー症候群などの状態を有する個体または胚を同定することができる。染色体異常を検査することは、母親の年齢が35歳から40歳の間では胚の少なくとも40%が異常であり、40歳を超えると、胚の半分超が異常であるということが推定されるので、特に重要である。 A normal human has two sets of 23 chromosomes in all healthy diploid cells, one copy from each parent. Aneuploidy, a condition in nuclear cells with too many and / or too few chromosomes, is thought to contribute to the majority of implantation failures, miscarriage, and genetic diseases. Detection of chromosomal abnormalities can identify individuals or embryos with conditions such as Down's syndrome, Klinefelter's syndrome, and Turner's syndrome, among other things, in addition to increasing the chances of successful pregnancy. Testing for chromosomal abnormalities estimates that at least 40% of embryos are abnormal between the ages of 35 and 40 and more than half of the embryos are abnormal beyond the age of 40. So it is especially important.

最近、無細胞胎児DNAおよびインタクトな胎児細胞が母系の血液循環系に進入し得ることが発見された。したがって、この遺伝材料を分析することにより、早期のNPDが可能になると思われる。改善された方法では、感度および特異性が高められ、NPDに要する時間とコストが減らされるのが望ましい。 Recently, it has been discovered that cell-free fetal DNA and intact fetal cells can enter the maternal blood circulation system. Therefore, analysis of this genetic material may enable early NPD. It is desirable that the improved method increases sensitivity and specificity and reduces the time and cost required for NPD.

一態様では、本発明は、核酸試料中の標的遺伝子座を増幅する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)核酸試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズする試験プライマーライブラリーと接触させて反応混合物を生成するステップと、(ii)反応混合物をプライマー伸長反応条件に供し、標的増幅産物を含む増幅産物を生成するステップとを含む。いくつかの実施形態では、前記方法は、少なくとも1個の標的増幅産物(例えば、少なくとも、50、60、70、80、90、95、96、97、98、99、または99.5%の標的増幅産物)の存在の有無を判定するステップも含む。いくつかの実施形態では、前記方法は、少なくとも1種の標的増幅産物(例えば、少なくとも、50、60、70、80、90、95、96、97、98、99、または99.5%の標的増幅産物)の配列を決定するステップも含む。 In one aspect, the invention features a method of amplifying a target locus in a nucleic acid sample. In some embodiments, the method comprises (i) nucleic acid samples at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000. 40,000; 50,000; 75,000; or a step of contacting with a test primer library that simultaneously hybridizes to 100,000 different target loci to generate a reaction mixture, and (ii) the reaction mixture. It comprises a step of producing an amplification product containing a target amplification product by subjecting it to primer extension reaction conditions. In some embodiments, the method comprises targeting at least one target amplification product (eg, at least 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, or 99.5%). It also includes a step of determining the presence or absence of an amplification product). In some embodiments, the method comprises targeting at least one target amplification product (eg, at least 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, or 99.5%). It also includes the step of determining the sequence of the amplification product).

本発明のいずれかの態様の種々の実施形態では、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。いくつかの実施形態では、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の増幅産物が標的増幅産物である。いくつかの実施形態では、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的遺伝子座が増幅される。種々の実施形態では、増幅産物の内の60、50、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1、または0.05%未満がプライマー二量体である。いくつかの実施形態では、試験プライマーのライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の試験プライマー対を含み、各プライマー対は、同じ標的遺伝子座にハイブリダイズするフォワード試験プライマーおよびリバース試験プライマーを含む。いくつかの実施形態では、試験プライマーのライブラリーは、異なる標的遺伝子座にハイブリダイズする少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の個別試験プライマーを含み、個別プライマーは、プライマー対の一部ではない。 In various embodiments of any aspect of the invention, at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000. 50,000; 75,000; or 100,000 different target loci are amplified. In some embodiments, at least 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, or 99.5% amplification products are target amplification products. In some embodiments, at least 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, or 99.5% of target loci are amplified. In various embodiments, 60, 50, 40, 30, 20, 10, 5, 4, 3, 2, 1, 0.5, 0.25, 0.1, or 0.05% of the amplification products. Less than is a primer dimer. In some embodiments, the library of test primers is at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000. 50,000; 75,000; or 100,000 test primer pairs, each primer pair containing a forward test primer and a reverse test primer that hybridize to the same target locus. In some embodiments, the library of test primers hybridizes to different target loci at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000. 30,000; 40,000; 50,000; 75,000; or 100,000 individual test primers, and the individual primers are not part of the primer pair.

本発明のいずれかの態様の種々の実施形態では、各試験プライマーの濃度は、100、75、50、25、10、5、2、または1nM未満である。種々の実施形態では、試験プライマーのGC含量は、30~80%で、例えば、40~70%または50~60%である。いくつかの実施形態では、試験プライマーのGC含量の範囲(例えば、最大GC含量-最小GC含量、例えば、80%-60%=20%の範囲)は、30、20、10、または5%未満である。いくつかの実施形態では、試験プライマーの融解温度(T)は、40~80℃、例えば、50~70℃、55~65℃、または57~60.5℃である。いくつかの実施形態では、試験プライマーの融解温度の範囲は、20、15、10、5、3、または1℃未満の範囲である。いくつかの実施形態では、試験プライマーの長さは、15~100ヌクレオチド、例えば、15~75ヌクレオチド、15~40ヌクレオチド、17~35ヌクレオチド、18~30ヌクレオチド、20~65ヌクレオチドである。いくつかの実施形態では、試験プライマーは、標的特異的ではないタグ、例えば、内部ループ構造を形成するタグを含む。いくつかの実施形態では、タグは、2つのDNA結合領域の間に存在する。種々の実施形態では、試験プライマーは、標的遺伝子座に特異的な5’領域、標的遺伝子座に特異的でないループ構造を形成する内部領域、および標的遺伝子座に特異的な3’領域を含む。種々の実施形態では、3’領域の長さは、少なくとも7ヌクレオチドである。いくつかの実施形態では、3’領域の長さは、7~20ヌクレオチド、例えば、7~15ヌクレオチド、または7~10ヌクレオチドである。種々の実施形態では、試験プライマーは、標的遺伝子座に特異的ではない5’領域(例えば、タグまたはユニバーサルプライマー結合部位)、それに続けて、標的遺伝子座に特異的な領域、標的遺伝子座に特異的でないループ構造を形成する内部領域、および標的遺伝子座に特異的な3’領域を含む。いくつかの実施形態では、試験プライマーの長さの範囲は、50、40、30、20、10、または5ヌクレオチド未満である。いくつかの実施形態では、標的増幅産物の長さは、50~100ヌクレオチド、例えば、60~80ヌクレオチド、または60~75ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さの範囲は、50、25、15、10、または5ヌクレオチド未満である。 In various embodiments of any aspect of the invention, the concentration of each test primer is less than 100, 75, 50, 25, 10, 5, 2, or 1 nM. In various embodiments, the test primer has a GC content of 30-80%, for example 40-70% or 50-60%. In some embodiments, the range of GC content of the test primers (eg, maximum GC content-minimum GC content, eg, 80% -60% = 20% range) is less than 30, 20, 10, or 5%. Is. In some embodiments, the melting temperature ( Tm ) of the test primer is 40-80 ° C, for example 50-70 ° C, 55-65 ° C, or 57-60.5 ° C. In some embodiments, the melting temperature range of the test primer is in the range of 20, 15, 10, 5, 3, or less than 1 ° C. In some embodiments, the length of the test primer is 15-100 nucleotides, eg, 15-75 nucleotides, 15-40 nucleotides, 17-35 nucleotides, 18-30 nucleotides, 20-65 nucleotides. In some embodiments, the test primer comprises a non-target specific tag, eg, a tag that forms an internal loop structure. In some embodiments, the tag resides between two DNA binding regions. In various embodiments, the test primer comprises a 5'region specific for the target locus, an internal region that forms a loop structure that is not specific for the target locus, and a 3'region specific for the target locus. In various embodiments, the length of the 3'region is at least 7 nucleotides. In some embodiments, the length of the 3'region is 7-20 nucleotides, eg, 7-15 nucleotides, or 7-10 nucleotides. In various embodiments, the test primer is a 5'region that is not specific to the target locus (eg, a tag or universal primer binding site), followed by a region specific to the target locus, specific to the target locus. It contains an internal region that forms an untargeted loop structure and a 3'region that is specific to the target locus. In some embodiments, the range of test primer lengths is less than 50, 40, 30, 20, 10, or 5 nucleotides. In some embodiments, the length of the target amplification product is 50-100 nucleotides, for example 60-80 nucleotides, or 60-75 nucleotides. In some embodiments, the length range of the target amplification product is less than 50, 25, 15, 10, or 5 nucleotides.

本発明のいずれかの態様の種々の実施形態では、プライマー伸長反応条件は、ポリメラーゼ連鎖反応条件(PCR)である。種々の実施形態では、アニーリングステップの長さは、3、5、8、10、または15分超である。種々の実施形態では、伸長ステップの長さは、3、5、8、10、または15分超である。 In various embodiments of any aspect of the invention, the primer extension reaction condition is a polymerase chain reaction condition (PCR). In various embodiments, the length of the annealing step is 3, 5, 8, 10, or more than 15 minutes. In various embodiments, the length of the extension step is 3, 5, 8, 10, or more than 15 minutes.

本発明のいずれかの態様の種々の実施形態では、胎児染色体異常の存在の有無を判定するための胎児の妊娠中の母親由来の母系DNAおよび胎児DNAを含む試料中の少なくとも1,000個の異なる標的遺伝子座を同時に増幅するために試験プライマーが使用される。種々の実施形態では、前記方法は、ユニバーサルプライマー結合部位を試料中のDNA分子にライゲーションするステップと、少なくとも1,000個の特異的プライマーおよびユニバーサルプライマーを使ってライゲーションしたDNA分子を増幅し、第1の増幅産物の集合を生成するステップと少なくとも1,000対の特異的プライマーを使って第1の増幅産物の集合を増幅して第2の増幅産物の集合を生成するステップとを含む。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なるプライマー対が使われる。 In various embodiments of any aspect of the invention, at least 1,000 pieces in a sample containing maternal and fetal DNA from the pregnant mother of the fetus to determine the presence or absence of fetal chromosomal abnormalities. Test primers are used to simultaneously amplify different target loci. In various embodiments, the method comprises ligating a universal primer binding site to a DNA molecule in a sample and amplifying the ligated DNA molecule with at least 1,000 specific and universal primers. It comprises the step of producing a set of 1 amplification product and the step of amplifying the set of the first amplification product with at least 1,000 pairs of specific primers to generate the set of the second amplification product. In various embodiments, at least 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100, 000 different primer pairs are used.

本発明のいずれかの態様の種々の実施形態では、試験プライマーを使って、胎児の父親とされる人由来のDNAを含む試料中の少なくとも1,000個の異なる標的遺伝子座を同時に増幅し、さらに胎児の妊娠中の母親由来の母系DNAおよび胎児DNAを含む試料中の標的遺伝子座を同時に増幅して、父親とされる人が胎児の生物学上の父親であるかどうかが確定される。 In various embodiments of any aspect of the invention, test primers are used to simultaneously amplify at least 1,000 different target loci in a sample containing DNA from a person allegedly the father of a fetus. Further, the target loci in the sample containing the maternal DNA derived from the pregnant mother of the fetus and the fetal DNA are simultaneously amplified to determine whether the person to be the father is the biological father of the fetus.

本発明のいずれかの態様の種々の実施形態では、試験プライマーを使用して、胚由来の1個の細胞または複数の細胞中の少なくとも1,000個の異なる標的遺伝子座を同時に増幅して染色体異常の存在の有無が判定される。種々の実施形態では、2個以上の胚の集合由来の細胞が分析され、インビトロ受精用に一個の胚が選択される。 In various embodiments of any aspect of the invention, test primers are used to simultaneously amplify at least 1,000 different target loci in one embryo-derived cell or cells to chromosomally. The presence or absence of an abnormality is determined. In various embodiments, cells from a collection of two or more embryos are analyzed and one embryo is selected for in vitro fertilization.

本発明のいずれかの態様の種々の実施形態では、試験プライマーを使って、法医学核酸試料中の少なくとも1,000個の異なる標的遺伝子座が同時に増幅される。種々の実施形態では、アニーリングステップの長さは、3、5、8、10、または15分超である。 In various embodiments of any aspect of the invention, test primers are used to simultaneously amplify at least 1,000 different target loci in a forensic nucleic acid sample. In various embodiments, the length of the annealing step is 3, 5, 8, 10, or more than 15 minutes.

本発明のいずれかの態様の種々の実施形態では、前記方法は、試験プライマーを使って、対照核酸試料中の少なくとも1,000個の異なる標的遺伝子座を同時に増幅して第1の標的増幅産物の集合を生成し、さらに試験核酸試料中の標的遺伝子座を同時に増幅して第2の標的増幅産物の集合を生成するステップと第1と第2の標的増幅産物の集合を比較して、標的遺伝子座が1個の試料中に存在するがその他の試料中には存在しないかどうか、または標的遺伝子座が対照試料中と試験試料中で異なるレベルで存在するかどうかを判定するステップとを含む。種々の実施形態では、試験試料は、対象疾患もしくは表現型(例えば、癌)であるか、または対象疾患もしくは表現型である危険性の増加が疑われる個体由来であり、さらに1個または複数個の標的遺伝子座が、対象疾患もしくは表現型の危険性の増加に関連する、または対象疾患もしくは表現型に関連する配列(例えば、多型または他の変異)を含む。種々の実施形態では、前記方法は、試験プライマーを使って、RNAを含む対照試料中の1,000個の異なる標的遺伝子座を同時に増幅して第1の標的増幅産物の集合を生成し、さらにRNAを含む試験試料中の標的遺伝子座を同時に増幅して第2の標的増幅産物の集合を生成するステップと第1と第2の標的増幅産物の集合を比較し、対照試料と試験試料との間のRNA発現レベルの差異の有無を判定するステップとを含む。種々の実施形態では、RNAは、mRNAである。種々の実施形態では、試験試料は、対象疾患もしくは表現型(例えば、癌)であることが疑われるか、または対象疾患もしくは表現型(例えば、癌)の危険性の増加が疑われる個体由来であり、1個または複数個の標的遺伝子座は、対象疾患もしくは表現型の危険性の増加に関連するか、または対象疾患もしくは表現型に関連する配列(例えば、多型または他の変異)を含む。いくつかの実施形態では、試験試料は、対象疾患もしくは表現型(例えば、癌)と診断された個体由来であり、この場合、対照試料と試験試料との間のRNA発現レベルの差異は、標的遺伝子座が対象疾患もしくは表現型の危険性の増加または減少に関連する配列(例えば、多型または他の変異)を含むことを示す。 In various embodiments of any aspect of the invention, the method uses test primers to simultaneously amplify at least 1,000 different target loci in a control nucleic acid sample to produce a first target amplification product. And the steps of simultaneously amplifying the target loci in the test nucleic acid sample to generate the second target amplification product set and the first and second target amplification product sets are compared and targeted. Includes a step to determine if the locus is present in one sample but not in the other sample, or if the target locus is present at different levels in the control sample and the test sample. .. In various embodiments, the test sample is from an individual who is of interest or phenotype (eg, cancer) or who is suspected of having an increased risk of being of interest or phenotype, and one or more. Target loci include sequences (eg, polymorphisms or other mutations) that are associated with an increased risk of the disease or phenotype of interest, or are associated with the disease or phenotype of interest. In various embodiments, the method uses test primers to simultaneously amplify 1,000 different target loci in a control sample containing RNA to produce a set of first target amplification products, further. The step of simultaneously amplifying the target locus in the test sample containing RNA to generate the second target amplification product set is compared with the first and second target amplification product sets, and the control sample and the test sample are compared. Includes a step of determining the presence or absence of differences in RNA expression levels between. In various embodiments, the RNA is mRNA. In various embodiments, the test sample is from an individual suspected of having a target disease or phenotype (eg, cancer) or an increased risk of the target disease or phenotype (eg, cancer). Yes, one or more target loci are associated with an increased risk of the disease or phenotype, or include sequences associated with the disease or phenotype (eg, polymorphisms or other variants). .. In some embodiments, the test sample is from an individual diagnosed with the disease or phenotype (eg, cancer), in which case the difference in RNA expression levels between the control sample and the test sample is targeted. Indicates that the locus contains a sequence (eg, a polymorphism or other mutation) associated with an increased or decreased risk of the disease or phenotype of interest.

本発明のいずれかの態様のいくつかの実施形態では、試験プライマーは、本発明のいずれかの方法を使ったプライマーの選択などの1個または複数個のパラメータに基づく候補プライマーのライブラリーから選択される。いくつかの実施形態では、試験プライマーは、候補プライマーのプライマー二量体形成能力に少なくとも一部基づいて候補プライマーライブラリーから選択される。 In some embodiments of any aspect of the invention, the test primer is selected from a library of candidate primers based on one or more parameters, such as primer selection using any of the methods of the invention. Will be done. In some embodiments, test primers are selected from the candidate primer library based at least in part on the primer dimer forming ability of the candidate primer.

一態様では、本発明は、候補プライマーライブラリーから試験プライマーを選択する方法を特徴とする。種々の実施形態では、選択は、(i)コンピュータを使ってライブラリー由来の2個の候補プライマーの大部分または全ての可能な組み合わせに対するアンデザイアラビリティスコア(undesirability score)を計算するステップであって、それぞれのアンデザイアラビリティスコアが、2個の候補プライマー間の二量体形成の尤度に少なくとも一部基づくステップと、(ii)最高のアンデザイアラビリティスコアを有する候補プライマーライブラリー由来の候補プライマーを除去するステップと、(iii)ステップ(ii)で除去された候補プライマーがプライマー対のメンバーである場合、候補プライマーライブラリー由来のプライマー対のもう一方のメンバーを除去するステップと、(iv)任意選択で、ステップ(ii)と(iii)を反復して試験プライマーライブラリーを選択するステップとを含む。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが全て最小閾値以下になるまで行われる。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの数が所望の数まで減らされるまで行われる。種々の実施形態では、アンデザイアラビリティスコアは、ライブラリー中の候補プライマーの可能な組み合わせの少なくとも80、90、95、98、99、または99.5%に対し計算される。種々の実施形態では、ライブラリー中に残っている候補プライマーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅できる。種々の実施形態では、前記方法は、(v)標的遺伝子座を含む核酸試料をライブラリー中に残っている候補プライマーと接触させて反応混合物を生成するステップ;および(vi)反応混合物をプライマー伸長反応条件に供し、標的増幅産物を含む増幅産物を生成するステップも含む。 In one aspect, the invention features a method of selecting test primers from a candidate primer library. In various embodiments, the selection is (i) a step of using a computer to calculate an undesignability score for most or all possible combinations of the two candidate primers from the library. , Each undesignability score is at least partially based on the likelihood of dimer formation between the two candidate primers, and (ii) candidate primers from the candidate primer library with the highest undesignability score. And (iii) if the candidate primer removed in step (iii) is a member of the primer pair, the step of removing the other member of the primer pair from the candidate primer library, and (iv). Optionally, it comprises repeating steps (ii) and (iii) to select a test primer library. In some embodiments, the selection method is performed until all undesignability scores for the combination of candidate primers remaining in the library are below the minimum threshold. In some embodiments, the selection method is performed until the number of candidate primers remaining in the library is reduced to the desired number. In various embodiments, the undesignability score is calculated for at least 80, 90, 95, 98, 99, or 99.5% of the possible combinations of candidate primers in the library. In various embodiments, the candidate primers remaining in the library are at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different target loci can be amplified simultaneously. In various embodiments, the method comprises (v) contacting a nucleic acid sample containing a target locus with a candidate primer remaining in the library to generate a reaction mixture; and (vi) primer extension of the reaction mixture. It also includes a step of producing an amplification product containing a target amplification product by subjecting it to reaction conditions.

一態様では、本発明は、候補プライマーライブラリーから試験プライマーを選択する方法を特徴とする。種々の実施形態では、候補プライマーライブラリーからの試験プライマーの選択方法は、(i)コンピュータを使ってライブラリー由来の2個の候補プライマーの大部分または全ての可能な組み合わせに対するアンデザイアラビリティスコアを計算するステップであって、各アンデザイアラビリティスコアが、2個の候補プライマー間の二量体形成の尤度に少なくとも一部基づくステップと、(ii)候補プライマーライブラリーから第1の最小閾値を超えるアンデザイアラビリティスコアを有する2個の候補プライマーの組み合わせのうち最多数のもののの一部である候補プライマーを除去するステップと、(iii)ステップ(ii)で除去された候補プライマーがプライマー対のメンバーである場合、候補プライマーライブラリー由来のプライマー対の残りのメンバーを除去するステップと、(iv)任意選択で、ステップ(ii)と(iii)を反復し、試験プライマーライブラリーを選択するステップとを含む。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが、全て第1の最小閾値以下となるまで行われる。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの数が所望の数に減らされるまで行われる。種々の実施形態では、アンデザイアラビリティスコアは、ライブラリー中の可能な候補プライマー組み合わせの少なくとも80、90、95、98、99、または99.5%に対して計算される。種々の実施形態では、ライブラリー中に残っている候補プライマーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅できる。種々の実施形態では、前記方法は、(v)標的遺伝子座を含む核酸試料をライブラリー中に残っている候補プライマーと接触させて反応混合物を生成するステップ;および(vi)反応混合物をプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成するステップも含む。 In one aspect, the invention features a method of selecting test primers from a candidate primer library. In various embodiments, the method of selecting test primers from the candidate primer library is to (i) use a computer to obtain an undesignability score for most or all possible combinations of the two candidate primers from the library. The steps to calculate, where each undesignability score is at least partially based on the likelihood of dimer formation between the two candidate primers, and (ii) the first minimum threshold from the candidate primer library. A step of removing a candidate primer that is part of the largest number of combinations of two candidate primers with an undesignability score that exceeds, and a step of removing the candidate primer in step (iii) step (iii) is a primer pair. If it is a member, a step of removing the remaining members of the primer pair from the candidate primer library and (iv) optionally repeating steps (ii) and (iii) to select a test primer library. And include. In some embodiments, the selection method is performed until the undesignability score for the combination of candidate primers remaining in the library is all below the first minimum threshold. In some embodiments, the selection method is performed until the number of candidate primers remaining in the library is reduced to the desired number. In various embodiments, the undesignability score is calculated for at least 80, 90, 95, 98, 99, or 99.5% of possible candidate primer combinations in the library. In various embodiments, the candidate primers remaining in the library are at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different target loci can be amplified simultaneously. In various embodiments, the method comprises (v) contacting a nucleic acid sample containing a target locus with a candidate primer remaining in the library to generate a reaction mixture; and (vi) primer extension of the reaction mixture. It also includes the step of producing an amplification product containing the target amplification product according to the reaction conditions.

本発明のいずれかの態様の種々の実施形態では、選択法は、ステップ(ii)で使われる第1の最小閾値をより小さい第2の最小閾値に下げることによりライブラリー中に残っている候補プライマーの数をさらに減らすステップ、および任意選択で(ii)と(iii)を反復するステップ含む。いくつかの実施形態では、選択法は、ステップ(ii)で使われる第1の最小閾値をより大きい第2の最小閾値に高めるステップ、および任意選択で(ii)と(iii)を反復するステップを含む。いくつかの実施形態では、選択法は、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが全て第2の最小閾値以下になるまで、またはライブラリー中に残っている候補プライマーの数が所望の数に減らされるまで、実行される。 In various embodiments of any aspect of the invention, the selection method is a candidate remaining in the library by lowering the first minimum threshold used in step (ii) to a smaller second minimum threshold. It includes a step of further reducing the number of primers and an optional step of repeating (ii) and (iii). In some embodiments, the selection method increases the first minimum threshold used in step (ii) to a larger second minimum threshold, and optionally repeats (ii) and (iii). including. In some embodiments, the selection method is such that the undesignability score for the combination of candidate primers remaining in the library is all below the second minimum threshold, or the candidate primers remaining in the library. It is executed until the number is reduced to the desired number.

本発明のいずれかの態様の種々の実施形態では、前記方法は、ステップ(i)の前に、標的遺伝子座にハイブリダイズするプライマーを特定するか、または選択するステップを含む。いくつかの実施形態では、複数プライマー(またはプライマー対)が、同じ標的遺伝子座にハイブリダイズするが、1個または複数個のパラメータに基づく選択法を使って、この標的遺伝子座に対し1個のプライマー(または1個のプライマー対)が選択される。種々の実施形態では、前記方法は、ステップ(ii)の前に、別のプライマー対により生成される標的増幅産物と重複する標的増幅産物を生成するプライマー対をライブラリーから除去するステップを含む。種々の実施形態では、候補プライマーライブラリーから除去することを目的として、1個または複数個の他のパラメータに基づいて、同等のアンデザイアラビリティスコアを有する2個以上の候補プライマーの群から候補プライマーが選択される。いくつかの実施形態では、ライブラリー中に残っている候補プライマーは、本発明のいずれかの方法で試験プライマーライブラリーとして使用される。いくつかの実施形態では、得られた試験プライマーライブラリーは、本発明のプライマーライブラリーのいずれかを含む。 In various embodiments of any aspect of the invention, the method comprises the step of identifying or selecting a primer that hybridizes to the target locus prior to step (i). In some embodiments, multiple primers (or primer pairs) hybridize to the same target locus, but with one or more parameter-based selection methods, one for this target locus. A primer (or one primer pair) is selected. In various embodiments, the method comprises removing from the library a primer pair that produces a target amplification product that overlaps with a target amplification product produced by another primer pair prior to step (ii). In various embodiments, candidate primers from a group of two or more candidate primers with comparable undesignability scores based on one or more other parameters for removal from the candidate primer library. Is selected. In some embodiments, the candidate primers remaining in the library are used as the test primer library in any of the methods of the invention. In some embodiments, the resulting test primer library comprises any of the primer libraries of the invention.

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率、標的遺伝子座の配列(例えば、多型)に関連する有病率、標的遺伝子座の配列(例えば、多型)に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づく。 In various embodiments of any aspect of the invention, the undesignability score is the heterozygotes of the target locus, the prevalence associated with the sequence of the target locus (eg, polymorphism), the prevalence of the target locus. Disease penetration associated with the sequence (eg, polymorphism), specificity of the candidate primer for the target locus, size of the candidate primer, melting temperature of the target amplification product, GC content of the target amplification product, amplification efficiency of the target amplification product, And at least in part based on one or more parameters selected from the group consisting of the size of the target amplification product.

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づき、また、試験プライマーを使って、胎児染色体異常の有無を判定するための胎児の妊娠中の母親由来の母系DNAおよび胎児DNAを含む試料中の少なくとも1,000個の異なる標的遺伝子座が同時に増幅される。種々の実施形態では、前記方法は、ユニバーサルプライマー結合部位を試料中のDNA分子にライゲーションするステップと、少なくとも1,000特異的プライマーおよびユニバーサルプライマーを使ってライゲーションしたDNA分子を増幅し第1の増幅産物の集合を生成するステップと、少なくとも1,000対の特異的プライマーを使って第1の増幅産物の集合を増幅して第2の増幅産物の集合を生成するステップとを含む。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なるプライマー対が使用される。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。 In various embodiments of any aspect of the invention, the undesignability score determines the heterozygous rate of the target locus, the specificity of the candidate primer for the target locus, the size of the candidate primer, the melting temperature of the target amplification product, and the melting temperature of the target amplification product. Fetal chromosomes based on at least one or more parameters selected from the group consisting of the GC content of the target amplification product, the amplification efficiency of the target amplification product, and the size of the target amplification product, and using test primers. At least 1,000 different target loci in a sample containing maternal and fetal DNA from the pregnant mother of the fetal to determine the presence or absence of anomalies are simultaneously amplified. In various embodiments, the method involves ligating a universal primer binding site to a DNA molecule in a sample and amplifying and first amplifying the ligated DNA molecule with at least 1,000 specific and universal primers. It comprises the step of producing a set of products and the step of amplifying the set of first amplification products with at least 1,000 pairs of specific primers to produce a set of second amplification products. In various embodiments, at least 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100, 000 different primer pairs are used. In various embodiments, at least 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100, 000 different target loci are amplified.

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群から選択される1個または複数個のパラメータに少なくとも一部基づいており、また、試験プライマーを使って、胎児の父親とされる人由来のDNAを含む試料中の少なくとも1,000個の異なる標的遺伝子座が増幅され、また、胎児の妊娠中の母親由来の母系DNAおよび胎児DNAを含む試料中の標的遺伝子座が同時に増幅されて、父親とされる人が生物学上の胎児の父親であるかどうかが確定される。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。 In various embodiments of any aspect of the invention, the undesignability score determines the heterozygous rate of the target locus, the specificity of the candidate primer for the target locus, the size of the candidate primer, the melting temperature of the target amplification product, and the melting temperature of the target amplification product. It is based at least in part on one or more parameters selected from the group consisting of the GC content of the target amplification product, the amplification efficiency of the target amplification product, and the size of the target amplification product, and also using test primers. At least 1,000 different target loci are amplified in samples containing DNA from the alleged father of the fetal, and targets in samples containing maternal and fetal DNA from the pregnant mother of the fetal. The loci are simultaneously amplified to determine if the alleged father is the father of a biological fetal. In various embodiments, at least 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100, 000 different target loci are amplified.

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率,候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づいており、また、試験プライマーを使って、胚由来の1個の細胞または複数個の細胞中の少なくとも1,000個の異なる標的遺伝子座が同時に増幅されて染色体異常の有無が判定される。種々の実施形態では、2個以上の胚の集合由来の細胞が分析され、1個の胚がインビトロ受精用に選択される。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。 In various embodiments of any aspect of the invention, the undesignability score determines the heterozygous rate of the target locus, the specificity of the candidate primer for the target locus, the size of the candidate primer, the melting temperature of the target amplification product, and the melting temperature of the target amplification product. It is based at least in part on one or more parameters selected from the group consisting of the GC content of the target amplification product, the amplification efficiency of the target amplification product, and the size of the target amplification product, and also using test primers. At least 1,000 different target loci in one embryo-derived cell or cells are simultaneously amplified to determine the presence or absence of chromosomal abnormalities. In various embodiments, cells from a collection of two or more embryos are analyzed and one embryo is selected for in vitro fertilization. In various embodiments, at least 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100, 000 different target loci are amplified.

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率,候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づいており、また、試験プライマーを使って、法医学核酸試料中の少なくとも1,000個の異なる標的遺伝子座が同時に増幅される。種々の実施形態では、アニーリングステップの長さは、3、5、8、10、または15分超である。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。 In various embodiments of any aspect of the invention, the undesignability score determines the heterozygous rate of the target locus, the specificity of the candidate primer for the target locus, the size of the candidate primer, the melting temperature of the target amplification product, and the melting temperature of the target amplification product. It is based at least in part on one or more parameters selected from the group consisting of the GC content of the target amplification product, the amplification efficiency of the target amplification product, and the size of the target amplification product, and also using test primers. At least 1,000 different target loci in forensic nucleic acid samples are simultaneously amplified. In various embodiments, the length of the annealing step is 3, 5, 8, 10, or more than 15 minutes. In various embodiments, at least 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100, 000 different target loci are amplified.

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率,標的遺伝子座の配列(例えば、多型)に関連する有病率、標的遺伝子座の配列(例えば、多型)に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づいており、また、前記方法は、試験プライマーを使って対照核酸試料中の少なくとも1,000個の異なる標的遺伝子座を同時に増幅し、第1の標的増幅産物の集合を生成し、試験核酸試料中の標的遺伝子座を同時に増幅して第2の標的増幅産物の集合を生成するステップと、第1と第2の標的増幅産物集合を比較して、標的遺伝子座が1つの試料中に存在し、他のものには存在しないかどうか、または、標的遺伝子座が対照試料と試験試料中で異なるレベルで存在するかどうかを判定するステップとを含む。種々の実施形態では、試験試料は、対象疾患もしくは表現型、または対象疾患もしくは表現型の危険性の増加が疑われる個人由来であり、この場合、1個または複数個の標的遺伝子座が、標的遺伝子座に対象疾患もしくは表現型の危険性の増加に関連するかまたは対象疾患もしくは表現型に関連する配列(例えば、多型)を含む。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。 In various embodiments of any aspect of the invention, the undesignability score is the heterozygous rate of the target locus, the prevalence associated with the sequence of the target locus (eg, polymorphism), the prevalence of the target locus. Disease permeability associated with the sequence (eg, polymorphism), specificity of the candidate primer for the target locus, size of the candidate primer, melting temperature of the target amplification product, GC content of the target amplification product, amplification efficiency of the target amplification product, And at least in part based on one or more parameters selected from the group consisting of the size of the target amplification product, the method also uses test primers to at least 1,000 in a control nucleic acid sample. A step of simultaneously amplifying different target loci to generate a first target amplification product set, and simultaneously amplifying the target loci in the test nucleic acid sample to generate a second target amplification product set, and a first step. And the second target amplification product set, whether the target locus is present in one sample and not in the other, or at different levels of the target locus in the control and test samples Includes a step to determine if it exists in. In various embodiments, the test sample is of the subject disease or phenotype, or of an individual suspected of having an increased risk of the subject disease or phenotype, in which case one or more target loci are targeted. A locus contains a sequence (eg, a polymorphism) that is associated with an increased risk of the subject disease or phenotype or is associated with the subject disease or phenotype. In various embodiments, at least 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100, 000 different target loci are amplified.

本発明のいずれかの態様の種々の実施形態では、アンデザイアラビリティスコアは、標的遺伝子座のヘテロ接合率,標的遺伝子座の配列(例えば、多型)に関連する有病率、標的遺伝子座の配列(例えば、多型)に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群より選択される1個または複数個のパラメータに少なくとも一部基づいており、また、前記方法は、試験プライマーを使ってRNAを含む対照核酸試料中の1,000個の異なる標的遺伝子座を同時に増幅し、第1の標的増幅産物の集合を生成し、RNAを含む試験試料中の標的遺伝子座を同時に増幅して第2の標的増幅産物の集合を生成するステップと、第1と第2の標的増幅産物の集合を比較して対照試料と試験試料との間のRNA発現レベルの差異の有無を判定するステップとを含む。種々の実施形態では、RNAは、mRNAである。種々の実施形態では、試験試料は、対象疾患もしくは表現型(例えば、癌)または対象疾患もしくは表現型(例えば、癌)の危険性の増加が疑われる個体由来であり、この場合、1個または複数個の標的遺伝子座は、対象疾患もしくは表現型の危険性の増加に関連するかまたは対象疾患もしくは表現型に関連する配列(例えば、多型または他の変異)を含む。いくつかの実施形態では、試験試料は、対象疾患もしくは表現型(例えば、癌)であると診断された個体由来であり、この場合、対照試料と試験試料との間のRNA発現レベルの差異は、標的遺伝子座が対象疾患もしくは表現型の増加または減少に関連する配列(例えば、多型または他の変異)を含むことを示す。種々の実施形態では、少なくとも2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座が増幅される。 In various embodiments of any aspect of the invention, the undesignability score is the heterozygous rate of the target locus, the prevalence associated with the sequence of the target locus (eg, polymorphism), the prevalence of the target loci. Disease permeability associated with the sequence (eg, polymorphism), specificity of the candidate primer for the target locus, size of the candidate primer, melting temperature of the target amplification product, GC content of the target amplification product, amplification efficiency of the target amplification product, And at least in part based on one or more parameters selected from the group consisting of the size of the target amplification product, and the method is 1,000 in a control nucleic acid sample containing RNA using test primers. A step of simultaneously amplifying different target loci to generate a first set of target amplification products and simultaneously amplifying the target loci in a test sample containing RNA to generate a second set of target amplification products. And the step of comparing the set of the first and second target amplification products to determine the presence or absence of a difference in RNA expression level between the control sample and the test sample. In various embodiments, the RNA is mRNA. In various embodiments, the test sample is from an individual suspected of having an increased risk of the subject disease or phenotype (eg, cancer) or the subject disease or phenotype (eg, cancer), in this case one or more. Multiple target loci include sequences (eg, polymorphisms or other mutations) that are associated with an increased risk of the target disease or phenotype or are associated with the target disease or phenotype. In some embodiments, the test sample is from an individual diagnosed with the disease or phenotype (eg, cancer), in which case the difference in RNA expression levels between the control sample and the test sample is , Indicates that the target locus contains a sequence (eg, a polymorphism or other mutation) associated with an increase or decrease in the disease or phenotype of interest. In various embodiments, at least 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100, 000 different target loci are amplified.

一態様では、本発明は、プライマーライブラリーを特徴とする。いくつかの実施形態では、プライマーは、本発明のいずれかの方法を使って候補プライマーライブラリーから選択される。いくつかの実施形態では、ライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーを含む。いくつかの実施形態では、ライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、ライブラリーは、60、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1、または0.05%未満の増幅産物がプライマー二量体となるように、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、ライブラリーは、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の増幅産物が標的増幅産物であるように、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、ライブラリーは、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座からの少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的遺伝子座が増幅されるように、標的遺伝子座を同時に増幅するプライマーを含む。いくつかの実施形態では、プライマーライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000プライマー対を含み、各プライマー対は、フォワード試験プライマーおよびリバース試験プライマーを含み、各試験プライマー対は、標的遺伝子座にハイブリダイズする。いくつかの実施形態では、プライマーライブラリーは、それぞれ、異なる標的遺伝子座にハイブリダイズする少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の個別プライマーを含み、個別プライマーは、プライマー対の一部ではない。 In one aspect, the invention features a primer library. In some embodiments, primers are selected from a candidate primer library using any of the methods of the invention. In some embodiments, the library is at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50, 000; 75,000; or contains primers that simultaneously hybridize to 100,000 different target loci. In some embodiments, the library is at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50, 000; 75,000; or contains primers that simultaneously amplify 100,000 different target loci. In some embodiments, the library is less than 60, 40, 30, 20, 10, 5, 4, 3, 2, 1, 0.5, 0.25, 0.1, or 0.05%. At least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50 so that the amplification product is a primer dimer. 000; 75,000; or contains primers that simultaneously amplify 100,000 different target loci. In some embodiments, the library has 1 such that at least 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, or 99.5% amplification product is the target amplification product. 000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different Contains a primer that simultaneously amplifies the target locus. In some embodiments, the library is 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or at least 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, or 99.5% target loci from 100,000 different target loci are amplified. As such, it contains a primer that simultaneously amplifies the target locus. In some embodiments, the primer library is at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50. 000; 75,000; or 100,000 primer pairs, each primer pair contains a forward test primer and a reverse test primer, and each test primer pair hybridizes to the target locus. In some embodiments, the primer libraries hybridize to different target loci, respectively, at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000. 30,000; 40,000; 50,000; 75,000; or 100,000 individual primers, the individual primers are not part of the primer pair.

本発明のいずれかの態様の種々の実施形態では、各プライマーの濃度は、100、75、50、25、10、5、2、または1nM未満である。種々の実施形態では、プライマーのGC含量は、30~80%で、例えば、40~70%または50~60%である。いくつかの実施形態では、プライマーのGC含量範囲は、30、20、10、または5%未満である。いくつかの実施形態では、プライマーの融解温度は、40~80℃で、例えば、50~70℃,55~65℃,または57~60.5℃である。いくつかの実施形態では、プライマーの融解温度の範囲は、15、10、5、3、または1℃未満である。いくつかの実施形態では、プライマーの長さは、15~100ヌクレオチドで、例えば、15~75ヌクレオチド、15~40ヌクレオチド、17~35ヌクレオチド、18~30ヌクレオチド、または20~65ヌクレオチドの長さである。いくつかの実施形態では、プライマーは、標的特異的ではないタグ、例えば、内部ループ構造を形成するタグを含む。いくつかの実施形態では、タグは、2個のDNA結合領域の間に存在する。種々の実施形態では、プライマーは、標的遺伝子座に対し特異的な5’領域、標的遺伝子座に特異的でなく、ループ構造を形成する内部領域、および標的遺伝子座に特異的な3’領域を含む。種々の実施形態では、3’領域の長さは、少なくとも7ヌクレオチドである。いくつかの実施形態では、3’領域の長さは、7~20ヌクレオチドであり、例えば、7~15ヌクレオチド、または7~10ヌクレオチドである。種々の実施形態では、プライマーは、標的遺伝子座に対し特異的ではない5’領域(例えば、別のタグまたはユニバーサルプライマー結合部位)、続けて、標的遺伝子座に特異的な領域、標的遺伝子座に特異的でなく、ループ構造を形成する内部領域、および標的遺伝子座に特異的な3’領域を含む。いくつかの実施形態では、プライマーの長さの範囲は、50、40、30、20、10、または5ヌクレオチド未満である。いくつかの実施形態では、標的増幅産物の長さは、50~100ヌクレオチドであり、例えば、60~80ヌクレオチド、または60~75ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さの範囲は、50、25、15、10、または5ヌクレオチド未満である。 In various embodiments of any aspect of the invention, the concentration of each primer is less than 100, 75, 50, 25, 10, 5, 2, or 1 nM. In various embodiments, the primer has a GC content of 30-80%, for example 40-70% or 50-60%. In some embodiments, the primer has a GC content range of less than 30, 20, 10, or 5%. In some embodiments, the melting temperature of the primer is 40-80 ° C, for example 50-70 ° C, 55-65 ° C, or 57-60.5 ° C. In some embodiments, the melting temperature range of the primer is less than 15, 10, 5, 3, or 1 ° C. In some embodiments, the primer is 15-100 nucleotides in length, eg, 15-75 nucleotides, 15-40 nucleotides, 17-35 nucleotides, 18-30 nucleotides, or 20-65 nucleotides in length. be. In some embodiments, the primer comprises a non-target specific tag, eg, a tag that forms an internal loop structure. In some embodiments, the tag resides between two DNA binding regions. In various embodiments, the primer has a 5'region specific to the target locus, an internal region that is not specific to the target locus but forms a loop structure, and a 3'region specific to the target locus. include. In various embodiments, the length of the 3'region is at least 7 nucleotides. In some embodiments, the length of the 3'region is 7-20 nucleotides, for example 7-15 nucleotides, or 7-10 nucleotides. In various embodiments, the primer is located in a 5'region that is not specific for the target locus (eg, another tag or universal primer binding site), followed by a region specific for the target locus, the target locus. It contains internal regions that are not specific and form a loop structure, and 3'regions that are specific to the target locus. In some embodiments, the primer length range is less than 50, 40, 30, 20, 10, or 5 nucleotides. In some embodiments, the length of the target amplification product is 50-100 nucleotides, for example 60-80 nucleotides, or 60-75 nucleotides. In some embodiments, the length range of the target amplification product is less than 50, 25, 15, 10, or 5 nucleotides.

一態様では、本発明は、核酸試料中の標的遺伝子座を増幅するための本発明のプライマーライブラリーのいずれかを含むキットを提供する。いくつかの実施形態では、キットは、ライブラリーを使用して標的遺伝子座を増幅するための説明書を含む。 In one aspect, the invention provides a kit comprising any of the primer libraries of the invention for amplifying a target locus in a nucleic acid sample. In some embodiments, the kit comprises instructions for amplifying a target locus using a library.

一態様では、本発明は、妊娠中の胎児の染色体の倍数性状態を決定する方法を特徴とする。いくつかの実施形態では、前記方法は、核酸試料を少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座に同時にハイブリダイズするプライマーライブラリーに接触させて反応混合物を生成するステップを含み、核酸試料は、胎児の母親由来の母系DNAおよび胎児由来の胎児DNAを含む。いくつかの実施形態では、反応混合物が、プライマー伸長反応条件に供されて増幅産物が生成され、増幅産物から、ハイスループットシーケンサーを使って配列決定データが生成され、配列決定データに基づきコンピュータで多形遺伝子座の対立遺伝子数が計算され、それぞれ異なる染色体の可能な倍数性状態に関連する複数の倍数性仮説がコンピュータにより作成され、それぞれの倍数性仮説に対し染色体の多形遺伝子座で予測される対立遺伝子数に対する同時分布モデルがコンピュータで構築され、それぞれの倍数性仮説の相対的確率が同時分布モデルおよび対立遺伝子数を使ってコンピュータで算出され、さらに、最大の確率を有する仮説に対応する倍数性状態を選択することにより胎児の倍数性状態がコールされる。 In one aspect, the invention features a method of determining the ploidy state of a fetal chromosome during pregnancy. In some embodiments, the method comprises at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000 of nucleic acid samples. The nucleic acid sample comprises the steps of contacting a primer library that simultaneously hybridizes to 50,000; 75,000; or 100,000 different polymorphic loci to generate a reaction mixture, and the nucleic acid sample is from the fetal mother. Includes maternal DNA and fetal DNA from the fetus. In some embodiments, the reaction mixture is subjected to primer extension reaction conditions to produce an amplification product, from which the amplification product is sequenced using a high throughput sequencer and computerized on the basis of the sequencing data. The number of alleles at the morphic loci is calculated, and multiple multiple hypotheses associated with possible multiple states of each different chromosome are computer-generated and predicted at the chromosomal polymorphic locus for each multiple hypothesis. A co-distribution model for the number of alleles is computer-constructed, the relative probability of each multiple hypothesis is computer-calculated using the co-distribution model and the number of alleles, and corresponds to the hypothesis with the highest probability. Choosing a chromosomal state calls the fetal chromosomal state.

一態様では、本発明は、妊娠中の胎児の染色体の倍数性状態を決定する方法を特徴とする。ある実施形態では、妊娠中の胎児における染色体の倍数性状態を決定するための方法は、胎児の母親由来の母系DNAおよび胎児由来の胎児DNAを含む第1のDNAの試料を得るステップと、調製された試料が得られるようにDNAを単離することによって第1の試料を調製するステップと、染色体上の複数の多型遺伝子座における、調製された試料中のDNAを測定するステップと、調製された試料に対して行ったDNA測定から、複数の多型遺伝子座における対立遺伝子数をコンピュータで算出するステップと、それぞれが、染色体における可能性のある異なる倍数性状態に関する、複数の倍数性仮説をコンピュータで作製するステップと、各倍数性仮説について、染色体上の複数の多型遺伝子座における予測される対立遺伝子数についての同時分布モデルをコンピュータで構築するステップと、同時分布モデルおよび調製された試料において測定された対立遺伝子数を用いて、倍数性仮説のそれぞれの相対的確率をコンピュータで決定するステップと、最大の確率を有する仮説に対応する倍数性状態を選択することによって胎児の倍数性状態をコールするステップとを含む。 In one aspect, the invention features a method of determining the ploidy state of a fetal chromosome during pregnancy. In one embodiment, the method for determining the chromosomal polymorphism in a pregnant fetus is the step of obtaining a sample of a first DNA containing maternal DNA from the mother of the fetus and fetal DNA from the fetus, and preparation. Preparation of the first sample by isolating the DNA so that the obtained sample can be obtained, and the step of measuring the DNA in the prepared sample at multiple polymorphic loci on the chromosome. Multiple multiple hypotheses regarding the steps to computerize the number of allogens at multiple polymorphic loci from DNA measurements made on the sample and each of the possible different multiple states on the chromosome. And a computer-built co-distribution model for the expected number of allogens at multiple polymorphic loci on the chromosome for each multiple hypothesis, a co-distribution model and prepared. Fetal multiples by computer-determining the relative probability of each of the multiple hypotheses using the number of allogens measured in the sample and by selecting the polyploid state corresponding to the hypothesis with the highest probability. Includes a step to call the state.

一態様では、本発明は、母系および胎児DNAの混合物を含む試料中の染色体の異常分布を検査する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと試料を接触させて反応混合物を生成するステップであって、標的遺伝子座が複数個の異なる染色体由来であり、複数個の異なる染色体が試料中で異常分布を有すると疑われる少なくとも1個の第1の染色体、および試料中で正常に分布していると推定される少なくとも1個の第2の染色体を含むステップと、(ii)反応混合物をプライマー伸長反応条件に供して増幅産物を生成するステップと、(iii)増幅産物を配列決定して標的遺伝子座に整列した複数の配列タグを得るステップであって、配列タグが特定の標的遺伝子座に割り付けるのに十分な長さであるステップと、(iv)コンピュータで複数の配列タグをそれらの対応する標的遺伝子座に割り付けるステップと、(v)コンピュータで第1の染色体の標的遺伝子座に割り付ける配列タグの数および第2の染色体の標的遺伝子座に割り付ける配列タグの数を決定するステップと、(vi)コンピュータでステップ(v)からの数を比較して、第1の染色体の異常分布の有無を判定するステップとを含む。 In one aspect, the invention features a method of examining chromosomal aberrations in a sample containing a mixture of maternal and fetal DNA. In some embodiments, the method is (i) at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000. 50,000; 75,000; or a step of contacting a sample with a primer library that simultaneously hybridizes to 100,000 different target chromosomal loci to generate a reaction mixture with multiple target chromosomal loci. At least one first chromosome that is derived from a different chromosome and is suspected of having an abnormal distribution in the sample, and at least one presumed to be normally distributed in the sample. A step containing 2 chromosomes, (ii) a step of subjecting the reaction mixture to primer extension reaction conditions to generate an amplification product, and (iii) a plurality of sequence tags in which the amplification product was sequenced and aligned with the target loci. The steps to obtain, one in which the sequence tag is long enough to be assigned to a particular target locus, and (iv) a step in which a computer assigns multiple sequence tags to their corresponding target loci, (. v) From step (v) on a computer to determine the number of sequence tags to be assigned to the target locus of the first chromosome and the number of sequence tags to be assigned to the target locus of the second chromosome. It includes a step of comparing numbers to determine the presence or absence of an abnormal distribution of the first chromosome.

一態様では、本発明は、胎児の異数性の存在の有無を検出する方法を提供する。いくつかの実施形態では、前記方法は、(i)母系と胎児DNAの混合物を含む試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる、複数の異なる染色体由来である非多形標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、(ii)反応混合物をプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成するステップと、(iii)コンピュータで対象の第1と第2の染色体由来の標的増幅産物の相対度数を定量化するステップと、(iv)コンピュータで対象の第1と第2の染色体由来の標的増幅産物の相対度数を比較するステップと、(v)対象の第1と第2の染色体の比較した相対的度数に基づいて異数性の存在の有無を特定するステップとを含む。いくつかの実施形態では、第1の染色体は、正倍数体であると疑われる染色体である。いくつかの実施形態では、第2の染色体は、異数性であると疑われる染色体である。 In one aspect, the invention provides a method of detecting the presence or absence of fetal aneuploidy. In some embodiments, the method comprises (i) a sample containing a mixture of maternal and fetal DNA at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; With a primer library that simultaneously hybridizes to non-polymorphic target loci from 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different, different chromosomes. A step of contacting to generate a reaction mixture, (ii) subjecting the reaction mixture to primer extension reaction conditions to produce an amplification product containing a target amplification product, and (iii) a first and second subject on a computer. A step of quantifying the relative frequency of the target amplification product derived from a chromosome, (iv) a step of comparing the relative frequency of the target amplification product derived from the first and second chromosomes of the subject with a computer, and (v) the first step of the subject. It comprises the step of identifying the presence or absence of aneuploidy based on the relative frequencies of the first and second chromosomes compared. In some embodiments, the first chromosome is a chromosome suspected to be a positive polyploid. In some embodiments, the second chromosome is a chromosome suspected to be aneuploidy.

一態様では、胎児のゲノムDNAおよび母系のゲノムDNAを含む母系の組織試料において胎児の異数性の存在または不在を決定するための方法であって、(a)前記母系の組織試料から、胎児のゲノムDNAと母系のゲノムDNAの混合物を得るステップと、(b)ステップ(a)の胎児のゲノムDNAと母系のゲノムDNAの混合物から無作為に選択されたDNA断片の大規模並行DNA配列決定を行って、前記DNA断片の配列を決定するステップと、(c)ステップ(b)で得られた配列が属する染色体を同定するステップと、(d)ステップ(c)のデータを用いて、前記母系のゲノムDNAと胎児のゲノムDNAの混合物中の少なくとも1つの第1の染色体の量を決定するステップであって、前記少なくとも1つの第1の染色体が、胎児において正倍数性であると推定されるステップと、(e)ステップ(c)のデータを用いて、前記母系のゲノムDNAと胎児のゲノムDNAの混合物中の第2の染色体の量を決定するステップであって、前記第2の染色体が、胎児において異数体であることが疑われるステップと、(f)胎児DNAと母系DNAの混合物中の胎児DNAの割合を算出するステップと、(g)第2の標的染色体が正倍数性である場合、ステップ(d)の数を用いて第2の標的染色体の量の予測される分布を算出するステップと、(h)第2の標的染色体が異数性である場合、ステップ(d)の第1の数およびステップ(f)で算出された、胎児DNAと母系DNAの混合物中の胎児DNAの割合を用いて第2の標的染色体の量の予測される分布を算出するステップと、(i)最尤法または最大事後法を用いて、ステップ(e)で決定された第2の染色体の量がステップ(g)で算出された分布またはステップ(h)で算出された分布の一部である可能性がより高いかを決定し、それにより、胎児の異数性の存在または不在を示すステップとを含む方法が開示されている。 In one aspect, it is a method for determining the presence or absence of fetal heterogeneity in a maternal tissue sample containing fetal genomic DNA and maternal genomic DNA, wherein (a) the maternal tissue sample is used to determine the presence or absence of a fetal chromosomal. Large-scale parallel DNA sequencing of DNA fragments randomly selected from the steps to obtain a mixture of chromosomal DNA and maternal chromosomal DNA and (b) a mixture of fetal and maternal chromosomal DNA in step (a). The step of determining the sequence of the DNA fragment, the step of (c) identifying the chromosome to which the sequence obtained in step (b) belongs, and (d) the data of step (c) are used. A step in determining the amount of at least one first chromosome in a mixture of maternal and fetal genomic DNA, wherein the at least one first chromosome is presumed to be positive multiple in the fetal. And (e) a step of determining the amount of the second chromosome in the mixture of the maternal genomic DNA and the fetal genomic DNA using the data of the second chromosome. However, the step suspected to be an aneuploid in the fetal, (f) the step of calculating the ratio of fetal DNA in the mixture of fetal DNA and maternal DNA, and (g) the second target chromosome is positive multiple. If, the step (d) is used to calculate the predicted distribution of the amount of the second target chromosome, and (h) if the second target chromosome is heterogeneous, the step (d). ) And the step of calculating the predicted distribution of the amount of the second target chromosome using the ratio of the fetal DNA in the mixture of the fetal DNA and the maternal DNA calculated in the first number and the step (f). (I) One of the distributions calculated in step (g) or the distribution calculated in step (h) for the amount of the second chromosome determined in step (e) using the most probable method or the maximum posterior method. Methods are disclosed that include a step that determines if it is more likely to be a part, thereby indicating the presence or absence of chromosomal chromosomality in the fetal.

本発明のいずれかの態様の種々の実施形態では、前記方法は、胎児の一方の親または両親から遺伝子型データを得るステップも包含する。いくつかの実施形態では、胎児の一方の親または両親から遺伝子型データを得るステップは、親由来のDNAを調製するステップであって、複数の多型遺伝子座におけるDNAを優先的に富化し、調製された親のDNAを得ることを含むステップと、必要に応じて、調製された親のDNAを増幅するステップと、複数の多型遺伝子座における、調製された試料中の親のDNAを測定するステップとを含む。 In various embodiments of any aspect of the invention, the method also includes the step of obtaining genotype data from one parent or parent of the fetus. In some embodiments, the step of obtaining genotype data from one parent or parent of the fetus is the step of preparing DNA from the parent, which preferentially enriches the DNA at multiple polymorphic loci. Steps involving obtaining the prepared parental DNA, optionally amplifying the prepared parental DNA, and measuring the parental DNA in the prepared sample at multiple polymorphic loci. Including steps to do.

本発明のいずれかの態様の種々の実施形態では、染色体上の複数の多型遺伝子座における予測される対立遺伝子数の確率についての同時分布モデルを構築するステップを、一方の親または両親から得られた遺伝子データを用いて行う。いくつかの実施形態では、試料(例えば、第1の試料)を母系の血漿から単離し、母親から遺伝子型データを得るステップを、調製された試料に対して行ったDNA測定から母系の遺伝子型データを推定することによって行う。 In various embodiments of any aspect of the invention, one parent or parent obtains a step of constructing a joint distribution model for the probability of a predicted allele number at multiple polymorphic loci on a chromosome. It is performed using the obtained genetic data. In some embodiments, a sample (eg, a first sample) is isolated from the maternal plasma and a step of obtaining genotype data from the mother is performed on the prepared sample from DNA measurements to the genotype of the maternal line. This is done by estimating the data.

一態様では、妊娠中の胎児における染色体の倍数性状態の決定に役立つ診断ボックス(diagnostic box)であって、本発明の方法のいずれかの調製および測定ステップを実行することができる診断ボックスが開示されている。 In one aspect, a diagnostic box is disclosed that aids in the determination of chromosomal ploidy status in a pregnant fetus and is capable of performing the preparation and measurement steps of any of the methods of the invention. Has been done.

本発明のいずれかの態様の種々の実施形態では、対立遺伝子数は、バイナリーではなく確率的なものである。いくつかの実施形態では、複数の多型遺伝子座における、調製された試料中のDNAの測定値を、胎児が1つまたは複数の疾患連鎖ハプロタイプを有するか否かを決定するためにも用いる。 In various embodiments of any aspect of the invention, the number of alleles is probabilistic rather than binary. In some embodiments, measurements of DNA in the prepared sample at multiple polymorphic loci are also used to determine if the fetus has one or more disease chain haplotypes.

本発明のいずれかの態様の種々の実施形態では、対立遺伝子数の確率についての同時分布モデルを構築するステップを、染色体内の異なる場所における染色体乗換えの確率に関するデータを使用して、染色体上の多型対立遺伝子間の依存性をモデリングすることによって行う。いくつかの実施形態では、対立遺伝子数についての同時分布モデルを構築するステップおよび各仮説の相対的確率を決定するステップを、参照染色体を使用することを必要としない方法を用いて行う。 In various embodiments of any aspect of the invention, the steps of constructing a co-distribution model for the probability of allele numbers are performed on the chromosome using data on the probability of chromosome crossover at different locations within the chromosome. This is done by modeling the dependence between polymorphic alleles. In some embodiments, the steps of constructing a joint distribution model for the number of alleles and determining the relative probabilities of each hypothesis are performed using methods that do not require the use of reference chromosomes.

本発明のいずれかの態様の種々の実施形態では、各仮説の相対的確率を決定するステップに、調製された試料中の胎児DNAの推定される割合(estimated fraction)を使用する。いくつかの実施形態では、対立遺伝子数の確率を算出するステップおよび各仮説の相対的確率を決定するステップにおいて使用する、調製された試料からのDNA測定値は、一次遺伝子データを含む。いくつかの実施形態では、最大の確率を有する仮説に対応する倍数性状態を選択するステップを、最尤推定または最大事後推定を用いて行う。 In various embodiments of any aspect of the invention, an estimated fraction of fetal DNA in the prepared sample is used in the step of determining the relative probability of each hypothesis. In some embodiments, the DNA measurements from the prepared samples used in the step of calculating the probability of the number of alleles and the step of determining the relative probability of each hypothesis include primary gene data. In some embodiments, the step of selecting the ploidy state corresponding to the hypothesis with the highest probability is performed using maximum likelihood estimation or maximum a posteriori estimation.

本発明のいずれかの態様の種々の実施形態では、胎児の倍数性状態をコールするステップは、同時分布モデルおよび対立遺伝子数の確率を用いて決定される倍数性仮説のそれぞれの相対的確率と、リード数解析(read count analysis)、ヘテロ接合率の比較、親の遺伝子情報を使用する場合にのみ利用可能な統計量、特定の親の状況に対して正規化された遺伝子型シグナルの確率、試料(例えば、第1の試料)または調製された試料の推定される胎児画分を用いて算出される統計量、およびそれらの組み合わせからなる群から選択される統計学的技法を用いて算出される倍数性仮説のそれぞれの相対的確率とを組み合わせるステップも包含する。 In various embodiments of any aspect of the invention, the steps to call the fetal statistic state are with the respective relative probabilities of the joint probabilities determined using the joint distribution model and the probability of the number of allogenes. , Read count analysis, Heterojunction rate comparison, Statistics available only when using parental genetic information, Probability of genotype signals normalized to a particular parental situation, Calculated using statistics calculated using the estimated fetal fraction of the sample (eg, the first sample) or the prepared sample, and statistical techniques selected from the group consisting of combinations thereof. It also includes the steps to combine with each relative probability of the multiple hypothesis.

本発明のいずれかの態様の種々の実施形態では、信頼度推定値は、コールされた倍数性状態に対し計算される。いくつかの実施形態では、前記方法は、コールされた胎児の倍数性状態に基づいて、妊娠中絶すること、または妊娠を維持することの一方から選択される臨床的措置をとるステップも包含する。 In various embodiments of any aspect of the invention, confidence estimates are calculated for the called ploidy state. In some embodiments, the method also includes the step of taking a clinical measure of choice between abortion or maintaining pregnancy based on the ploidy status of the called fetus.

本発明のいずれかの態様の種々の実施形態では、前記方法は、妊娠4週から5週の間;妊娠5週から6週の間;妊娠6週から7週の間;妊娠7週から8週の間;妊娠8週から9週の間;妊娠9週から10週の間;妊娠10週から12週の間;妊娠12週から14週の間;妊娠14週から20週の間;妊娠20週から40週の間;妊娠初期;妊娠中期;妊娠後期;またはそれらの組み合わせにおいて、胎児に対して実施することができる。 In various embodiments of any aspect of the invention, the method comprises 4-5 weeks gestation; 5-6 weeks gestation; 6-7 weeks gestation; 7-8 weeks gestation. Weeks; 8-9 weeks gestation; 9-10 weeks gestation; 10-12 weeks gestation; 12-14 weeks gestation; 14-20 weeks gestation; pregnancy It can be performed on the fetus between 20 and 40 weeks; early pregnancy; mid-pregnancy; late pregnancy; or a combination thereof.

本発明のいずれかの態様の種々の実施形態では、前記方法を用いて、妊娠中の胎児における決定された染色体の倍数性状態を示す報告を作製する。いくつかの実施形態では、本発明のいずれかの方法で使用するために設計された、妊娠中の胎児における標的染色体の倍数性状態を決定するためのキットであって、複数の内側のフォワードプライマーおよび、必要に応じて複数の内側のリバースプライマーであって、該プライマーのそれぞれが標的染色体上の多型部位のうちの1つのすぐ上流および/または下流のDNAの領域とハイブリダイズするように設計されているプライマーと、必要に応じてさらに別の染色体であって、ハイブリダイズする領域が、少数の塩基によって該多型部位から隔てられており、前記少数が、1、2、3、4、5、6~10、11~15、16~20、21~25、26~30、31~60、およびそれらの組み合わせからなる群から選択される染色体とを含むキットが開示されている。 In various embodiments of any aspect of the invention, the method is used to make a report showing the determined ploidy state of a chromosome in a pregnant fetus. In some embodiments, a kit designed for use in any of the methods of the invention, for determining the polymorphic state of a target chromosome in a pregnant fetus, with multiple inner forward primers. And, optionally, multiple inner reverse primers, each of which is designed to hybridize to regions of DNA immediately upstream and / or downstream of one of the polymorphic sites on the target chromosome. The primer and, if necessary, yet another chromosome, the hybridizing region, is separated from the polymorphic site by a small number of bases, the minority being 1, 2, 3, 4, ... Kits are disclosed that include 5, 6-10, 11-15, 16-20, 21-25, 26-30, 31-60, and chromosomes selected from the group consisting of combinations thereof.

一態様では、本発明は、父親とされる人が妊娠中の母親が懐胎している胎児の生物学上の父親であるか否かを確定する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)父親とされる人由来の少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる遺伝物質上の多形遺伝子座を含む複数の多形遺伝子座を同時に増幅して第1の増幅産物の集合を生成するステップと、(ii)妊娠中の母親の血液試料由来の胎児DNAと母系DNAを含むDNAの混合試料の対応する複数の多形遺伝子座を同時に増幅して第2の増幅産物の集合を生成するステップと、(iii)コンピュータで、第1と第2の増幅産物の集合に基づく遺伝子型測定値を使って父親とされる人が生物学上の胎児の父親である確率を決定するステップと、(iv)父親とされる人が生物学上の胎児の父親であることの決定された確率を使って、生物学上の胎児の父親であるか否かを確定するステップとを含む。種々の実施形態では、前記方法は、母親由来の対応する複数の遺伝物質上の多形遺伝子座を同時に増幅して第3の増幅産物の集合を生成するステップをさらに含み、この場合、父親とされる人が生物学上の胎児の父親である確率が第1、第2、および第3の増幅産物の集合に基づいた遺伝子型測定値を使って決定される。 In one aspect, the invention comprises a method of determining whether a person allegedly a father is the biological father of a fetus in which a pregnant mother is pregnant. In some embodiments, the method is (i) at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; from the alleged father. Simultaneously amplify multiple polymorphic loci including polymorphic loci on 30,000; 40,000; 50,000; 75,000; or 100,000 different genetic material of the first amplification product. The steps to generate the assembly and (ii) simultaneously amplify the corresponding polymorphic loci of a mixed sample of fetal DNA from a pregnant mother's blood sample and DNA containing maternal DNA to produce a second amplification product. The steps to generate the set and (iii) on the computer determine the probability that the alleged father is the father of a biological fetal using genotype measurements based on the set of first and second amplification products. And (iv) the step of determining whether or not the person to be the father is the father of the biological fetal using the determined probability that the person is the father of the biological fetal. include. In various embodiments, the method further comprises the step of simultaneously amplifying a polymorphic locus on a corresponding genetic material of maternal origin to produce a third set of amplification products, in this case with the father. The probability that a person will be the father of a biological fetal is determined using genotyping based on a set of first, second, and third amplification products.

一態様では、本発明は、胚の集合由来のそれぞれの胚を所望の通り発生させる相対尤度を推定する方法が提供される。いくつかの実施形態では、前記方法は、それぞれの胚由来の試料を少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させてそれぞれの胚の反応混合物を生成するステップを含み、試料は1個または複数個の胚由来の細胞からそれぞれ得られる。いくつかの実施形態では、それぞれの反応混合物は、プライマー伸長反応条件に供され、増幅産物を生成する。いくつかの実施形態では、前記方法は、コンピュータで、それぞれの胚由来の少なくとも1個の細胞の1つまたは複数の特性を増幅産物に基づいて決定するステップと、コンピュータで、それぞれの胚の少なくとも1個の細胞の1つまたは複数の特性に基づいて、それぞれの胚を所望の通り発生させる相対尤度を推定するステップとを含む。 In one aspect, the invention provides a method of estimating the relative likelihood of developing each embryo from a set of embryos as desired. In some embodiments, the method comprises at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 30,000; samples from each embryo. The sample comprises the steps of contacting with a primer library that simultaneously hybridizes to 40,000; 50,000; 75,000; or 100,000 different target loci to generate a reaction mixture for each embryo. Obtained from one or more embryo-derived cells, respectively. In some embodiments, each reaction mixture is subjected to primer extension reaction conditions to produce an amplification product. In some embodiments, the method is computerized to determine the properties of one or more cells of at least one cell from each embryo based on the amplification product and computerized to at least each embryo. It comprises the step of estimating the relative likelihood of developing each embryo as desired, based on the properties of one or more cells.

一態様では、本発明は、核酸試料中の2個以上の標的遺伝子座の量を測定する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)PCRを使って、第1の基準遺伝子座、第2の基準遺伝子座、第1の標的遺伝子座、および第2の標的遺伝子座を含む核酸試料を増幅して増幅産物を形成するステップであって、第1の基準遺伝子座および第1の標的遺伝子座が同じ数のヌクレオチドであるが、1個または複数個のヌクレオチドの位置で異なる配列を有し、第2の基準遺伝子座および第2の標的遺伝子座が同じ数のヌクレオチドであるが、1個または複数個のヌクレオチドの位置で異なる配列を有するステップと、(ii)増幅産物を配列決定して増幅された第2の基準遺伝子座に比べて増幅された第1の基準遺伝子座の相対的量を比較する基準比率を決定するステップであって、基準比率が第1の基準遺伝子座および第2の基準遺伝子座の増幅に対するPCR効率の差異を示すステップと、(iii)増幅された第2の標的遺伝子座に比べて増幅された第1の標的遺伝子座の相対量を比較する標的比率を決定するステップと、(iv)ステップ(ii)からの基準比率に基づいてステップ(iii)からの標的比率を調節して試料中の第1の標的遺伝子座および第2の標的遺伝子座の相対量を決定するステップとを含む。種々の実施形態では、前記方法は、試料中の第1の標的遺伝子座および第2の標的遺伝子座の絶対量を決定するステップを含む。種々の実施形態では、前記方法は、試料中の標的遺伝子座(例えば、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座)の存在の有無を判定するステップをさらに含む。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、前記方法は、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座を同時に増幅するステップを含む。 In one aspect, the invention features a method of measuring the amount of two or more target loci in a nucleic acid sample. In some embodiments, the method uses (i) PCR to generate a nucleic acid comprising a first reference locus, a second reference locus, a first target loci, and a second target loci. In the step of amplifying a sample to form an amplification product, the first reference locus and the first target loci are the same number of nucleotides, but different sequences at the positions of one or more nucleotides. Steps that have the same number of nucleotides in the second reference locus and the second target loci but have different sequences at the positions of one or more nucleotides, and (ii) sequencing the amplification product. A step of determining a reference ratio for comparing the relative amount of the amplified first reference locus with respect to the amplified second reference locus, wherein the reference ratio is the first reference locus and A target ratio comparing the step showing the difference in PCR efficiency for the amplification of the second reference locus and (iii) the relative amount of the amplified first target locus compared to the amplified second target locus. And the relative of the first and second target loci in the sample by adjusting the target ratio from step (iii) based on the reference ratio from step (iv) step (iii). Includes steps to determine the amount. In various embodiments, the method comprises determining the absolute amount of a first target locus and a second target locus in a sample. In various embodiments, the method comprises a target locus in a sample (eg, at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30, It further comprises the step of determining the presence or absence of 000; 40,000; 50,000; 75,000; or 100,000 different target loci). In various embodiments, the method comprises the step of using any of the primer libraries of the invention. In various embodiments, the method is 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; Includes the step of simultaneously amplifying 75,000; or 100,000 different target loci.

一態様では、本発明は、分析用試料の複数の遺伝的標的を定量的に測定する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)分析用試料由来の遺伝物質を、複数の標的特異的増幅試薬および標的特異的増幅試薬の標的に対応する複数の基準配列と混合するステップと、(ii)遺伝物質の標的領域および基準配列を増幅して標的増幅産物および基準配列増幅産物を生成するステップと、(iii)生成した標的増幅産物および基準配列増幅産物の量を測定するステップとを含む。いくつかの実施形態では、遺伝物質は、遺伝子ライブラリー中に存在する。いくつかの実施形態では、遺伝的標的は、多形遺伝子座(SNPなど)である。いくつかの実施形態では、量を測定するステップは、配列を計数することにより実現される。いくつかの実施形態では、前記方法は、遺伝子ライブラリーが由来する試料中の少なくとも1個の染色体の推定コピー数を測定するステップをさらに含み、測定は、標的増幅産物のシーケンスリード数を基準増幅産物のシーケンスリード数と比較するステップを含む。いくつかの実施形態では、基準配列および遺伝子ライブラリーは、同じプライマーによりプライミングできるユニバーサルプライミング部位を含む。いくつかの実施形態では、混合ステップは、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的特異的増幅試薬および少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の基準配列を含む。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、前記方法は、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的領域を同時に増幅するステップを含む。いくつかの実施形態では、基準配列のそれぞれの相対量は既知である。いくつかの実施形態では、配列のそれぞれの相対量は、参照ゲノムに対し較正されている。いくつかの実施形態では、分析用試料は、胎児と母系ゲノムの混合物を含む。いくつかの実施形態では、分析用試料は、妊婦の血液由来であるか、または血漿由来である。いくつかの実施形態では、参照ゲノムは、染色体13、18、21、X、またはYの異数性などの少なくとも1つの異数性を有する。いくつかの実施形態では、参照ゲノムは、二倍体である。 In one aspect, the invention features a method of quantitatively measuring a plurality of genetic targets of a sample for analysis. In some embodiments, the method comprises (i) mixing the genetic material from the analytical sample with a plurality of target-specific amplification reagents and a plurality of reference sequences corresponding to the targets of the target-specific amplification reagents. , (Ii) a step of amplifying a target region and a reference sequence of a genetic material to produce a target amplification product and a reference sequence amplification product, and (iii) a step of measuring the amount of the produced target amplification product and the reference sequence amplification product. including. In some embodiments, the genetic material is present in the genetic library. In some embodiments, the genetic target is a polymorphic locus (such as an SNP). In some embodiments, the step of measuring the quantity is accomplished by counting the sequences. In some embodiments, the method further comprises measuring the estimated copy number of at least one chromosome in the sample from which the gene library is derived, wherein the measurement is based on the sequence read number of the target amplification product. Includes steps to compare to the number of sequence reads in the product. In some embodiments, the reference sequence and gene library include a universal priming site that can be primed with the same primers. In some embodiments, the mixing step is at least 10; 100; 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different target-specific amplification reagents and at least 10; 100; 500; 1,000; 2,000; 5,000; 7,500; 10, 000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 reference sequences. In various embodiments, the method comprises the step of using any of the primer libraries of the invention. In various embodiments, the method is 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or including the step of simultaneously amplifying 100,000 different target regions. In some embodiments, the relative amount of each of the reference sequences is known. In some embodiments, the relative amount of each of the sequences is calibrated to the reference genome. In some embodiments, the analytical sample comprises a mixture of fetal and maternal genomes. In some embodiments, the analytical sample is from the blood of a pregnant woman or from plasma. In some embodiments, the reference genome has at least one aneuploidy, such as the aneuploidy of chromosomes 13, 18, 21, X, or Y. In some embodiments, the reference genome is diploid.

一態様では、本発明は、複数の遺伝子基準配列を含む混合物を特徴とし、混合物中のそれぞれの遺伝子基準配列の相対量は、参照ゲノムに対する較正により決定されている。種々の実施形態では、混合物は、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の遺伝子基準配列を含む。種々の実施形態では、遺伝子基準配列は、第1のユニバーサルプライミング部位、第2のユニバーサルプライミング部位、第1の標的特異的プライミング部位、第2の標的特異的プライミング部位、および第1と第2の標的特異的プライミング部位の間に位置するマーカー配列を含み、第1の標的特異的部位および第2の標的特異的プライミング部位は、第1と第2のユニバーサルプライミング部位の間に位置する。種々の実施形態では、較正は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、較正は、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的領域を同時に増幅するステップを含む。いくつかの実施形態では、参照ゲノムは、染色体13、18、21、X、またはYの異数性などの少なくとも1個の異数性を有する。いくつかの実施形態では、参照ゲノムは二倍体である。 In one aspect, the invention features a mixture containing multiple gene reference sequences, the relative amount of each gene reference sequence in the mixture is determined by calibration to the reference genome. In various embodiments, the mixture is at least 10; 100; 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40, 000; 50,000; 75,000; or contains 100,000 gene reference sequences. In various embodiments, the gene reference sequence is a first universal priming site, a second universal priming site, a first target-specific priming site, a second target-specific priming site, and first and second. It comprises a marker sequence located between the target-specific priming sites, the first target-specific site and the second target-specific priming site are located between the first and second universal priming sites. In various embodiments, the calibration comprises the step of using any of the primer libraries of the present invention. In various embodiments, the calibration is 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75. 000; or including the step of simultaneously amplifying 100,000 different target regions. In some embodiments, the reference genome has at least one aneuploidy, such as the aneuploidy of chromosomes 13, 18, 21, X, or Y. In some embodiments, the reference genome is diploid.

一態様では、本発明は、較正された遺伝子基準配列の集合を生成する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)参照ゲノムから調製された遺伝子ライブラリー、複数の標的特異的増幅プライマー試薬の集合、および標的特異的増幅試薬の集合に対応する複数の遺伝子基準配列を含む増幅反応混合物を形成するステップと、(ii)遺伝子ライブラリーおよび遺伝子基準配列を増幅して標的配列由来の増幅産物および遺伝子基準配列由来の増幅産物を生成するステップと、(iii)標的配列由来の増幅産物および遺伝子基準配列由来の増幅産物の量を測定するステップと、(iv)それぞれの遺伝子基準配列相互の相対量を決定し、それにより、複数の遺伝子基準配列が較正されるステップとを含む。種々の実施形態では、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の遺伝子基準配列が使用される。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、本発明は、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる配列を同時に増幅するステップを含む。いくつかの実施形態では、参照ゲノムは、染色体13、18、21、X、またはYの異数性などの少なくとも1個の異数性を有する。いくつかの実施形態では、参照ゲノムは二倍体である。 In one aspect, the invention features a method of producing a calibrated set of genetic reference sequences. In some embodiments, the method comprises (i) a gene library prepared from a reference genome, a collection of multiple target-specific amplification primer reagents, and a plurality of genetic criteria corresponding to the collection of target-specific amplification reagents. A step of forming an amplification reaction mixture containing a sequence, (ii) a step of amplifying a gene library and a gene reference sequence to produce an amplification product derived from a target sequence and an amplification product derived from a gene reference sequence, and (iii) a target. Steps to measure the amount of sequence-derived amplification products and gene reference sequence-derived amplification products, and (iv) determine the relative amount of each gene reference sequence to each other, thereby calibrating multiple gene reference sequences. And include. In various embodiments, at least 10; 100; 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50. , 000; 75,000; or 100,000 gene reference sequences are used. In various embodiments, the method comprises the step of using any of the primer libraries of the invention. In various embodiments, the invention is 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or including the step of simultaneously amplifying 100,000 different sequences. In some embodiments, the reference genome has at least one aneuploidy, such as the aneuploidy of chromosomes 13, 18, 21, X, or Y. In some embodiments, the reference genome is diploid.

一態様では、本発明は、本発明のいずれかの方法により較正されている遺伝子基準配列の集合を提供する。一態様では、本発明は、前記方法が実行される前、その間、その後に較正できる遺伝子基準配列の集合を提供する。 In one aspect, the invention provides a set of genetic reference sequences calibrated by any of the methods of the invention. In one aspect, the invention provides a set of genetic reference sequences that can be calibrated before, during, and after the method is performed.

一態様では、本発明は、欠失を有する少なくとも1個の対立遺伝子を含む対象遺伝子のコピー数を測定する方法を特徴とする。いくつかの実施形態では、前記方法は、(i)分析用試料由来の遺伝物質を、対象の遺伝子に特異的で、対象の遺伝子の対立遺伝子を含む欠失を大きくは増幅できない増幅試薬、対象の遺伝子に対応する基準配列、参照配列に特定的な増幅試薬、および参照配列に対応する基準配列と混合するステップと、(ii)対象の遺伝子配列、対象の遺伝子に対応する基準配列、参照配列、および参照配列に対応する基準配列を増幅し、対象の遺伝子増幅産物、参照配列増幅産物、および基準配列増幅産物を生成するステップと、(iii)生成標的増幅産物および基準配列増幅産物の量を測定するステップとを含む。いくつかの実施形態では、量の測定は、シーケンスリードを計数することにより実現される。いくつかの実施形態では、前記方法は、少なくとも1個の遺伝子ライブラリーが由来する試料中の染色体の推定コピー数を算出するステップをさらに含み、算出ステップは、標的増幅産物の配列の数を、基準増幅産物の配列の数と比較するステップを含む。いくつかの実施形態では、基準配列および遺伝子ライブラリーは、同じプライマーによりプライミングできるユニバーサルプライミング部位を含む。いくつかの実施形態では、それぞれの配列の相対的量は、参照ゲノムに対して較正されている。種々の実施形態では、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の遺伝子基準配列が使われる。種々の実施形態では、前記方法は、本発明のプライマーライブラリーのいずれかを使用するステップを含む。種々の実施形態では、前記方法は、1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的領域を同時に増幅するステップを含む。いくつかの実施形態では、参照ゲノムは二倍体である。いくつかの実施形態では、分析用試料は、血液由来である。 In one aspect, the invention features a method of measuring the number of copies of a gene of interest, including at least one allele with a deletion. In some embodiments, the method comprises (i) an amplification reagent, subject that is specific to the gene of interest and is unable to significantly amplify deletions containing the allelic gene of the gene of interest from the genetic material derived from the sample for analysis. The step of mixing with the reference sequence corresponding to the gene of interest, the amplification reagent specific to the reference sequence, and the reference sequence corresponding to the reference sequence, and (ii) the gene sequence of interest, the reference sequence corresponding to the gene of interest, the reference sequence. , And the step of amplifying the reference sequence corresponding to the reference sequence to generate the gene amplification product, the reference sequence amplification product, and the reference sequence amplification product of interest, and (iii) the amount of the production target amplification product and the reference sequence amplification product. Includes steps to measure. In some embodiments, the measurement of quantity is achieved by counting sequence reads. In some embodiments, the method further comprises calculating the estimated number of copies of chromosomes in a sample from which at least one gene library is derived, where the calculation step is the number of sequences of the target amplification product. Includes a step to compare with the number of sequences of the reference amplification product. In some embodiments, the reference sequence and gene library include a universal priming site that can be primed with the same primers. In some embodiments, the relative amount of each sequence is calibrated to the reference genome. In various embodiments, at least 10; 100; 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50. , 000; 75,000; or 100,000 gene reference sequences are used. In various embodiments, the method comprises the step of using any of the primer libraries of the invention. In various embodiments, the method is 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or including the step of simultaneously amplifying 100,000 different target regions. In some embodiments, the reference genome is diploid. In some embodiments, the analytical sample is of blood origin.

本発明のいずれかの態様の種々の実施形態では、標的遺伝子座(例えば、複数の多型遺伝子座)における試料(例えば、第1の試料)中のDNAを優先的に富化するステップは、複数の環状化前プローブであって、それぞれのプローブが遺伝子座(例えば、多型遺伝子座)のうちの1つを標的とし、好ましくは、該プローブの3’末端および5’末端が遺伝子座の多型部位から少数の塩基で隔てられているDNAの領域とハイブリダイズするように設計されており、前記少数が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21~25、26~30、31~60、またはそれらの組み合わせであるプローブを得るステップと、環状化前プローブと試料(例えば、第1の試料)由来のDNAをハイブリダイズさせるステップと、ハイブリダイズしたプローブ末端間のギャップを、DNAポリメラーゼを用いて埋めるステップと、環状化前プローブを環状化するステップと、環状化されたプローブを増幅するステップとを含む。 In various embodiments of any aspect of the invention, the step of preferentially enriching the DNA in a sample (eg, a first sample) at a target locus (eg, a plurality of polymorphic loci) is a step. A plurality of pre-cyclization probes, each of which targets one of the loci (eg, polymorphic loci), preferably the 3'and 5'ends of the probe are loci. It is designed to hybridize to a region of DNA that is separated from the polymorphic site by a small number of bases, with the minority being 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, ,. Steps to obtain probes 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-25, 26-30, 31-60, or a combination thereof, and pre-cyclization probes and samples. A step of hybridizing the DNA derived from (for example, the first sample), a step of filling the gap between the hybridized probe ends with a DNA polymerase, a step of cyclizing the pre-cyclization probe, and cyclization. Includes a step of amplifying the probe.

本発明のいずれかの態様の種々の実施形態では、標的遺伝子座(例えば、複数の多型遺伝子座)におけるDNAを優先的に富化するステップは、複数のライゲーション媒介性PCRプローブであって、それぞれのPCRプローブが標的遺伝子座(例えば、多型遺伝子座)のうちの1つを標的とし、その上流および下流PCRプローブが、好ましくは、遺伝子座の多型部位から少数の塩基で隔てられているDNAの一方の鎖上のDNAの領域とハイブリダイズするように設計されており、前記少数が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21~25、26~30、31~60、またはそれらの組み合わせであるPCRプローブを得るステップと、ライゲーション媒介性PCRプローブと試料(例えば、第1の試料)由来のDNAをハイブリダイズさせるステップと、ライゲーション媒介性PCRプローブ末端間のギャップを、DNAポリメラーゼを用いて埋めるステップと、ライゲーション媒介性PCRプローブをライゲーションするステップと、ライゲーションされたライゲーション媒介性PCRプローブを増幅するステップとを含む。 In various embodiments of any aspect of the invention, the step of preferentially enriching DNA at a target locus (eg, a plurality of polymorphic loci) is a plurality of ligation-mediated PCR probes. Each PCR probe targets one of the target loci (eg, polymorphic loci), the upstream and downstream PCR probes of which are preferably separated from the polymorphic site of the loci with a small number of bases. It is designed to hybridize to a region of the DNA on one strand of the DNA, the minority of which is 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, Steps to obtain a PCR probe of 13, 14, 15, 16, 17, 18, 19, 20, 21-25, 26-30, 31-60, or a combination thereof, and a ligation-mediated PCR probe and sample (eg,). , The step of hybridizing the DNA derived from (1st sample), the step of filling the gap between the ends of the ligation-mediated PCR probe with a DNA polymerase, and the step of ligating the ligation-mediated PCR probe. Includes a step of amplifying a ligation-mediated PCR probe.

本発明の種々の態様のいくつかの実施形態では、標的遺伝子座(例えば、複数の多型遺伝子座)におけるDNAを優先的に富化するステップは、遺伝子座(例えば、多型遺伝子座)を標的とする複数のハイブリッド捕捉プローブを得るステップと、ハイブリッド捕捉プローブを、試料(例えば、第1の試料)中のDNAとハイブリダイズさせるステップと、DNAに関する試料(例えば、第1の試料)からハイブリダイズしていないDNAの一部または全部を物理的に除去するステップとを含む。 In some embodiments of the various embodiments of the invention, the step of preferentially enriching DNA at a target locus (eg, a plurality of polymorphic loci) is a locus (eg, a polymorphic locus). A step to obtain multiple target hybrid capture probes, a step to hybridize the hybrid capture probe with DNA in a sample (eg, first sample), and a hybrid from a sample relating to DNA (eg, first sample). It comprises the steps of physically removing some or all of the non-soybean DNA.

本発明のいずれかの態様のいくつかの実施形態では、ハイブリッド捕捉プローブは、多型部位と隣接しているがオーバーラップはしていない領域とハイブリダイズするように設計されている。いくつかの実施形態では、ハイブリッド捕捉プローブは、多型部位と隣接しているがオーバーラップはしていない領域とハイブリダイズするように設計されており、隣接捕捉プローブの長さは、約120塩基未満、約110塩基未満、約100塩基未満、約90塩基未満、約80塩基未満、約70塩基未満、約60塩基未満、約50塩基未満、約40塩基未満、約30塩基未満、および約25塩基未満からなる群から選択することができる。いくつかの実施形態では、ハイブリッド捕捉プローブは、多型部位とオーバーラップする領域とハイブリダイズするように設計されており、複数のハイブリッド捕捉プローブは、各多型遺伝子座に対する少なくとも2つのハイブリッド捕捉プローブを含み、各ハイブリッド捕捉プローブが、一方の多型遺伝子座において別の対立遺伝子と相補的であるように設計されている。 In some embodiments of any aspect of the invention, the hybrid capture probe is designed to hybridize to regions that are adjacent to but not overlapping with the polymorphic site. In some embodiments, the hybrid capture probe is designed to hybridize to regions that are adjacent but not overlapping with the polymorphic site, and the length of the adjacent capture probe is approximately 120 bases. Less than, less than about 110 bases, less than about 100 bases, less than about 90 bases, less than about 80 bases, less than about 70 bases, less than about 60 bases, less than about 50 bases, less than about 40 bases, less than about 30 bases, and about 25 You can choose from a group of less than bases. In some embodiments, the hybrid capture probe is designed to hybridize to a region that overlaps the polymorphic site, and the plurality of hybrid capture probes is at least two hybrid capture probes for each polymorphic locus. Each hybrid capture probe is designed to be complementary to another allele at one polymorphic locus.

本発明のいずれかの態様のいくつかの実施形態では、複数の多型遺伝子座のDNAを優先的に富化するステップは、複数の内側のフォワードプライマーであって、それぞれのプライマーが多型遺伝子座のうちの1つを標的とし、該内側のフォワードプライマーの3’末端が、多型部位の上流にあり、少数の塩基で多型部位から隔てられているDNAの領域とハイブリダイズするように設計されており、少数が、1塩基対、2塩基対、3塩基対、4塩基対、5塩基対、6~10塩基対、11~15塩基対、16~20塩基対、21~25塩基対、26~30塩基対または31~60塩基対からなる群から選択されるプライマーを得るステップと、必要に応じて、複数の内側のリバースプライマーであって、それぞれのプライマーが多型遺伝子座のうちの1つを標的とし、内側のリバースプライマーの3’末端が、多型部位の上流にあり、少数の塩基で多型部位から隔てられているDNAの領域とハイブリダイズするように設計されており、少数が、1塩基対、2塩基対、3塩基対、4塩基対、5塩基対、6~10塩基対、11~15塩基対、16~20塩基対、21~25塩基対、26~30塩基対または31~60塩基対からなる群から選択されるプライマーを得るステップと、内側のプライマーをDNAとハイブリダイズさせるステップと、ポリメラーゼ連鎖反応を用いてDNAを増幅して増幅産物を形成するステップとを含む。 In some embodiments of any aspect of the invention, the step of preferentially enriching DNA at multiple polymorphic loci is a plurality of inner forward primers, each primer being a polymorphic gene. Targeting one of the loci so that the 3'end of the inner forward primer is upstream of the polymorphic site and hybridizes to a region of DNA separated from the polymorphic site by a small number of base pairs. Designed, a few are 1 base pair, 2 base pairs, 3 base pairs, 4 base pairs, 5 base pairs, 6-10 base pairs, 11-15 base pairs, 16-20 base pairs, 21-25 base pairs. Steps to obtain primers selected from the group consisting of pairs, 26-30 base pairs or 31-60 base pairs, and optionally multiple inner reverse primers, each primer at the polymorphic locus. Designed to target one of these and hybridize with a region of DNA that has the 3'end of the inner reverse primer upstream of the polymorphic site and is separated from the polymorphic site by a small number of base pairs. A few of them are 1 base pair, 2 base pairs, 3 base pairs, 4 base pairs, 5 base pairs, 6 to 10 base pairs, 11 to 15 base pairs, 16 to 20 base pairs, 21 to 25 base pairs, 26. A step of obtaining a primer selected from the group consisting of ~ 30 base pairs or 31 ~ 60 base pairs, a step of hybridizing the inner primer with DNA, and a step of amplifying DNA using a polymerase chain reaction to form an amplification product. Including steps to do.

本発明のいずれかの態様のいくつかの実施形態では、前記方法は、複数の外側のフォワードプライマーであって、それぞれのプライマーが標的遺伝子座(例えば、多型遺伝子座)のうちの1つを標的とし、内側のフォワードプライマーの上流のDNAの領域とハイブリダイズするように設計されているプライマーを得るステップと、必要に応じて、複数の外側のリバースプライマーであって、それぞれのプライマーが標的遺伝子座(例えば、多型遺伝子座)のうちの1つを標的とし、内側のリバースプライマーのすぐ下流のDNAの領域とハイブリダイズするように設計されているプライマーを得るステップと、第1のプライマーをDNAとハイブリダイズさせるステップと、ポリメラーゼ連鎖反応を用いてDNAを増幅するステップとをさらに含む。 In some embodiments of any aspect of the invention, the method is a plurality of outer forward primers, each primer having one of a target loci (eg, a polymorphic locus). A step to target and obtain primers designed to hybridize with regions of DNA upstream of the inner forward primer, and optionally multiple outer reverse primers, each primer being the target gene. A step to obtain a primer designed to target one of the loci (eg, a polymorphic locus) and hybridize with a region of DNA just downstream of the inner reverse primer, and a first primer. It further comprises a step of hybridizing with the DNA and a step of amplifying the DNA using a polymerase chain reaction.

本発明のいずれかの態様のいくつかの実施形態では、前記方法は、複数の外側のリバースプライマーであって、それぞれのプライマーが標的遺伝子座(例えば、多型遺伝子座)のうちの1つを標的とし、内側のリバースプライマーのすぐ下流のDNAの領域とハイブリダイズするように設計されているプライマーを得るステップと、必要に応じて、複数の外側のフォワードプライマーであって、それぞれのプライマーが多型遺伝子座のうちの1つを標的とし、内側のフォワードプライマーの上流のDNAの領域とハイブリダイズするように設計されているプライマーを得るステップと、第1のプライマーをDNAとハイブリダイズさせるステップと、ポリメラーゼ連鎖反応を用いてDNAを増幅するステップとをさらに含む。 In some embodiments of any aspect of the invention, the method is a plurality of outer reverse primers, each primer having one of a target loci (eg, a polymorphic locus). A step to target and obtain primers designed to hybridize with regions of DNA immediately downstream of the inner reverse primer, and optionally multiple outer forward primers, each with multiple primers. A step of targeting one of the type loci to obtain a primer designed to hybridize with a region of DNA upstream of the inner forward primer, and a step of hybridizing the first primer with DNA. , Further comprising the step of amplifying the DNA using a polymerase chain reaction.

本発明のいずれかの態様のいくつかの実施形態では、試料(例えば、第1の試料)調整ステップは、ユニバーサルアダプタを試料(例えば、第1の試料)中のDNAに付加するステップおよびポリメラーゼ連鎖反応を使って試料(例えば、第1の試料)中のDNAを増幅するステップをさらに含む。いくつかの実施形態では、増幅された増幅産物の少なくとも一部分が100bp未満、90bp未満、80bp未満、70bp未満、65bp未満、60bp未満、55bp未満、50bp未満、または45bp未満であり、一部分とは10%、20%、30%、40%、50%、60%、70%、80%、90%または99%である。 In some embodiments of any aspect of the invention, the sample (eg, first sample) preparation step is the step of adding a universal adapter to the DNA in the sample (eg, first sample) and the polymerase chain. It further comprises the step of amplifying the DNA in the sample (eg, the first sample) using the reaction. In some embodiments, at least a portion of the amplified amplification product is less than 100 bp, less than 90 bp, less than 80 bp, less than 70 bp, less than 65 bp, less than 60 bp, less than 55 bp, less than 50 bp, or less than 45 bp, and a portion is 10. %, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% or 99%.

本発明のいずれかの態様のいくつかの実施形態では、DNAを増幅するステップは、1つまたは複数の個々の反応容積で行われ、個々の反応容積のそれぞれは、100超の異なるフォワードプライマーとリバースプライマーの対、200超の異なるフォワードプライマーとリバースプライマーの対、500超の異なるフォワードプライマーとリバースプライマーの対、1,000超の異なるフォワードプライマーとリバースプライマーの対、2,000超の異なるフォワードプライマーとリバースプライマーの対、5,000超の異なるフォワードプライマーとリバースプライマーの対、10,000超の異なるフォワードプライマーとリバースプライマーの対、20,000超の異なるフォワードプライマーとリバースプライマーの対、50,000超の異なるフォワードプライマーとリバースプライマーの対、または、100,000超の異なるフォワードプライマーとリバースプライマーの対を含有する。 In some embodiments of any aspect of the invention, the step of amplifying DNA is performed in one or more individual reaction volumes, each with more than 100 different forward primers. Reverse Primer Pairs, Over 200 Different Forward and Reverse Primer Pairs, Over 500 Different Forward and Reverse Primer Pairs, Over 1,000 Different Forward and Reverse Primer Pairs, Over 2,000 Different Forwards Primer and Reverse Primer Pairs, Over 5,000 Different Forward and Reverse Primer Pairs, Over 10,000 Different Forward and Reverse Primer Pairs, Over 20,000 Different Forward and Reverse Primer Pairs, 50 It contains more than 000 different forward and reverse primer pairs, or more than 100,000 different forward and reverse primer pairs.

本発明のいずれかの態様のいくつかの実施形態では、試料(例えば、第1の試料)を調製するステップは、試料(例えば、第1の試料)を複数の部分に分割するステップであって、標的遺伝子座(例えば、複数の多型遺伝子座)のサブセットにおいて各部分内のDNAが優先的に富化されるステップをさらに含む。いくつかの実施形態では、望ましくないプライマー2重鎖を形成する可能性があるプライマー対を同定するステップ、および望ましくないプライマー2重鎖を形成する可能性があると同定されたプライマーの対の少なくとも1つを複数のプライマーから除去するステップによって内側のプライマーを選択する。いくつかの実施形態では、内側のプライマーは、標的の遺伝子座(例えば、多型遺伝子座)の上流または下流のいずれかとハイブリダイズするように設計された領域を含有し、必要に応じて、PCR増幅が可能になるように設計されたユニバーサルプライミング配列(priming sequence)を含有する。いくつかの実施形態では、プライマーの少なくとも一部は、個々のプライマー分子各々について異なるランダムな領域をさらに含有する。いくつかの実施形態では、プライマーの少なくとも一部は分子バーコードをさらに含有する。 In some embodiments of any aspect of the invention, the step of preparing a sample (eg, first sample) is the step of dividing the sample (eg, first sample) into multiple portions. , Further comprising the step of preferentially enriching the DNA within each moiety in a subset of target loci (eg, multiple polymorphic loci). In some embodiments, at least a step of identifying a primer pair that may form an undesired primer double chain and a pair of primers that are identified as having the potential to form an undesired primer double chain. The inner primer is selected by the step of removing one from multiple primers. In some embodiments, the inner primer contains a region designed to hybridize either upstream or downstream of the target locus (eg, a polymorphic locus) and, if desired, PCR. It contains a universal priming sequence designed to allow amplification. In some embodiments, at least some of the primers further contain different random regions for each of the individual primer molecules. In some embodiments, at least some of the primers further contain molecular barcodes.

本発明のいずれかの態様のいくつかの実施形態では、優先的な富化により、調製された試料と試料(例えば、第1の試料)との間に、2倍以下、1.5倍以下、1.2倍以下、1.1倍以下、1.05倍以下、1.02倍以下、1.01倍以下、1.005倍以下、1.002倍以下、1.001倍以下および1.0001倍以下からなる群から選択される係数の程度の、平均の対立遺伝子の偏りがもたらされる。いくつかの実施形態では、複数の多型遺伝子座はSNPである。いくつかの実施形態では、調製された試料中のDNAを測定するステップを配列決定によって行う。 In some embodiments of any aspect of the invention, by preferential enrichment, between the prepared sample and the sample (eg, the first sample) no more than twice, no more than 1.5 times. , 1.2 times or less, 1.1 times or less, 1.05 times or less, 1.02 times or less, 1.01 times or less, 1.005 times or less, 1.002 times or less, 1.001 times or less and 1 It results in an average allele bias to the extent of the coefficients selected from the group consisting of .0001 times or less. In some embodiments, the polymorphic locus is an SNP. In some embodiments, the step of measuring DNA in the prepared sample is performed by sequencing.

本発明のいずれかの態様のいくつかの実施形態では、標的遺伝子座は、対照の同じ核酸(例えば、同じ染色体または染色体の同じ領域)上に存在する。いくつかの実施形態では、少なくともいくつかの標的遺伝子座は、対象の異なる核酸(例えば、異なる染色体)上に存在する。いくつかの実施形態では、核酸試料は、フラグメント化または消化核酸を含む。いくつかの実施形態では、核酸試料は、ゲノムDNA、cDNA、またはmRNAを含む。いくつかの実施形態では、核酸試料は、単一細胞由来のDNAを含む。いくつかの実施形態では、核酸試料は、実質的に細胞不含の血液または血漿試料である。いくつかの実施形態では、核酸試料は、血液、血漿、唾液、精液、精子、細胞培養上清、粘液分泌、歯垢、消化管組織、便、尿、毛、骨、体液、涙、組織、皮膚、爪、卵割球、胚、羊水、絨毛膜絨毛試料、胆汁、リンパ液、子宮頸管粘液、または法医学試料を含むか、またはそれら由来である。いくつかの実施形態では、標的遺伝子座は、ヒト核酸のセグメントである。いくつかの実施形態では、標的遺伝子座は、単一ヌクレオチド多型(SNP)を含むか、またはそれから構成される。いくつかの実施形態では、プライマーは、DNA分子である。 In some embodiments of any aspect of the invention, the target locus resides on the same nucleic acid of the control (eg, the same chromosome or the same region of the chromosome). In some embodiments, at least some target loci are present on different nucleic acids of interest (eg, different chromosomes). In some embodiments, the nucleic acid sample comprises fragmented or digested nucleic acid. In some embodiments, the nucleic acid sample comprises genomic DNA, cDNA, or mRNA. In some embodiments, the nucleic acid sample comprises DNA from a single cell. In some embodiments, the nucleic acid sample is a substantially cell-free blood or plasma sample. In some embodiments, the nucleic acid sample is blood, plasma, saliva, sperm, sperm, cell culture supernatant, mucus secretion, dentin, gastrointestinal tissue, stool, urine, hair, bone, body fluid, tears, tissue, Contains or is derived from skin, nails, blastomere, embryos, sheep's water, chorionic villi samples, bile, lymph, cervical mucus, or forensic samples. In some embodiments, the target locus is a segment of human nucleic acid. In some embodiments, the target locus comprises or is composed of a single nucleotide polymorphism (SNP). In some embodiments, the primer is a DNA molecule.

本発明のいずれかの態様のいくつかの実施形態では、試料(例えば、第1の試料)中のDNAは、母系血漿由来である。いくつかの実施形態では、試料(例えば、第1の試料)を調製するステップは、DNAを増幅するステップをさらに含む。いくつかの実施形態では、試料(例えば、第1の試料)を調製するステップは、標的遺伝子座(例えば、複数の多型遺伝子座)における試料(例えば、第1の試料)中のDNAを優先的に富化するステップをさらに含む。 In some embodiments of any aspect of the invention, the DNA in the sample (eg, first sample) is derived from maternal plasma. In some embodiments, the step of preparing a sample (eg, a first sample) further comprises the step of amplifying the DNA. In some embodiments, the step of preparing a sample (eg, first sample) prioritizes the DNA in the sample (eg, first sample) at the target locus (eg, multiple polymorphic loci). Further includes steps to enrich the target.

種々の実施形態では、プライマー伸長反応またはポリメラーゼ連鎖反応は、ポリメラーゼによる1個または複数個のヌクレオチドの付加を含む。種々の実施形態では、プライマー伸長反応またはポリメラーゼ連鎖反応は、ライゲーション媒介性PCRを含まない。種々の実施形態では、プライマー伸長反応またはポリメラーゼ連鎖反応は、リガーゼによる2個のプライマーの連結を含まない。種々の実施形態では、プライマーは、連結逆方向プローブ(LIP)を含まない。このプローブは、環状化前プローブ(pre-circularized probe)、環状化前プローブ(pre-circularizing probe)または環状化プローブ、環状化プローブ、Padlockプローブ、または分子反転プローブ(MIP)とも呼ばれる。 In various embodiments, the primer extension reaction or polymerase chain reaction comprises the addition of one or more nucleotides by the polymerase. In various embodiments, the primer extension reaction or polymerase chain reaction does not include ligation-mediated PCR. In various embodiments, the primer extension reaction or polymerase chain reaction does not involve the ligation of the two primers with ligase. In various embodiments, the primer does not include a ligated reverse probe (LIP). This probe is also referred to as a pre-cyclalized probe, a pre-cyclalized probe or a cyclized probe, a cyclized probe, a padlock probe, or a molecular inversion probe (MIP).

本明細書に記載される本発明のすべての態様および実施形態は、態様および実施形態「を含む(comprising)」、態様およ及び実施形態「からなる(consisting)」、および態様及び実施形態「から実質的になる(consisting essentially of)」を含むことが理解されよう。 All aspects and embodiments of the invention described herein are "comprising", embodiments "consisting", and embodiments and embodiments "comprising". It will be understood that it includes "consisting essentially of".

定義
一塩基多型(SNP)とは、同じ種の2つのメンバーのゲノム間で異なる可能性がある一塩基を指す。この用語の使用は、各変異体が発生する頻度に対するいかなる限定も意味するべきではない。
Definition Single nucleotide polymorphism (SNP) refers to a single nucleotide that can differ between the genomes of two members of the same species. The use of this term should not imply any limitation on the frequency with which each variant occurs.

配列とは、DNA配列または遺伝子配列を指す。配列とは、個体のDNA分子または鎖の一次の物理的構造を指し得る。配列とは、DNA分子またはDNA分子の相補鎖に見いだされるヌクレオチドの配列を指し得る。配列とは、インシリコで表示される、DNA分子に含有される情報を指し得る。 A sequence refers to a DNA sequence or a gene sequence. A sequence can refer to the primary physical structure of an individual's DNA molecule or strand. The sequence can refer to a DNA molecule or a sequence of nucleotides found in a complementary strand of a DNA molecule. The sequence can refer to the information contained in the DNA molecule, which is displayed in silico.

遺伝子座とは、個体のDNA上の対象の特定の領域を指し、可能性のある挿入もしくは欠失の部位またはいくつかの他の関連性のある遺伝的変異の部位である、SNPを指し得る。疾患連鎖SNPとは、疾患連鎖遺伝子座を指す場合もある。 A locus refers to a specific region of interest on an individual's DNA and may refer to an SNP that is the site of a possible insertion or deletion or some other relevant genetic variation site. .. The disease chain SNP may also refer to a disease chain locus.

多型対立遺伝子、同様に「多型遺伝子座」とは、所与の種内の個体間で遺伝子型が変動する対立遺伝子または遺伝子座を指す。多型対立遺伝子のいくつかの例としては、一塩基多型、短いタンデム反復、欠失、重複、および逆位が挙げられる。 A polymorphic allele, as well as a "polymorphic locus," refers to an allele or locus whose genotype varies between individuals within a given species. Some examples of polymorphic alleles include single nucleotide polymorphisms, short tandem repeats, deletions, duplications, and inversions.

多型部位とは、個体間で変動する多型領域に見いだされる特異的なヌクレオチドを指す。 A polymorphic site refers to a specific nucleotide found in a polymorphic region that varies from individual to individual.

対立遺伝子とは、特定の遺伝子座を占有する遺伝子を指す。 An allele is a gene that occupies a specific locus.

遺伝子データ、同様に「遺伝子型データ」とは、1個または複数個の個体のゲノムの態様を記載するデータを指す。これは、1つの遺伝子座または遺伝子座の集合、部分配列または全配列、染色体の部分もしくは染色体の全体、またはゲノム全体を指し得る。これは、1個または複数個のヌクレオチドの同一性を指してもよく、これは、逐次的なヌクレオチドの集合またはゲノム内の異なる場所由来のヌクレオチド、またはそれらの組み合わせを指してもよい。遺伝子型データは、一般にはインシリコであるが、化学的にコードされる遺伝子データとして配列内に物理的なヌクレオチドを考えることも可能である。遺伝子型データは、個体(複数可)「on(に関する)」、「of(の)」、「at(における)」、「from(からの)」または「on(に関する)」と言うことができる。遺伝子型データとは、これらの測定を遺伝物質に対して行う場合、遺伝子型決定プラットフォームからの出力測定値を指し得る。 Genetic data, as well as "genotype data", refers to data that describes the aspects of the genome of one or more individuals. This can refer to a locus or set of loci, a partial or whole sequence, a part of a chromosome or an entire chromosome, or an entire genome. This may refer to the identity of one or more nucleotides, which may refer to a sequential set of nucleotides or nucleotides from different locations within the genome, or a combination thereof. The genotype data is generally in silico, but it is also possible to think of physical nucleotides in the sequence as chemically encoded genetic data. Genotype data can be referred to as an individual (s) "on", "of", "at", "from" or "on". .. Genotyping data can refer to output measurements from genotyping platforms when these measurements are made on genetic material.

遺伝物質、同様に「遺伝子試料」とは、DNAまたはRNAを含む1つまたは複数の個体由来の組織または血液などの物理的物質を指す。 A genetic material, as well as a "gene sample", refers to a physical substance such as tissue or blood from one or more individuals containing DNA or RNA.

ノイズを伴う遺伝子データとは、以下のいずれかを伴う遺伝子データを指す:対立遺伝子ドロップアウト、不確実な塩基対測定値、不正確な塩基対測定値、塩基対測定値の欠落、挿入または欠失の不確実な測定値、染色体セグメントコピー数の不確実な測定値、偽のシグナル、測定値の欠落、他のエラー、またはそれらの組み合わせ。 Gene data with noise refers to genetic data with any of the following: allelic dropouts, uncertain base pair measurements, inaccurate base pair measurements, missing base pair measurements, insertions or omissions: Uncertain measurement of loss, uncertain measurement of chromosomal segment copy count, false signal, missing measurement, other error, or a combination thereof.

信頼度とは、コールされたSNP、対立遺伝子、対立遺伝子の集合、倍数性コールまたは決定された染色体セグメントコピーの数が個体の実際の遺伝子の状態を正確に示す統計学的尤度を指す。 Confidence refers to the statistical likelihood that the number of SNPs called, alleles, sets of alleles, haploid calls or determined chromosomal segment copies accurately indicates the actual genetic state of the individual.

倍数性コール、同様に「染色体コピー数コール」または「コピー数コール」(CNC)、とは、細胞内に存在する1個または複数個の染色体の量および/または染色体の同一性を決定する行為を指し得る。 A polyploid call, as well as a "chromosome copy number call" or "copy number call" (CNC), is the act of determining the amount and / or identity of one or more chromosomes present in a cell. Can point to.

異数性とは、細胞中の誤った数の染色体(例えば、誤った数の完全染色体または誤った数の染色体セグメント、例えば、染色体セグメントの欠失または複製の存在)が存在する状態を意味する。ヒト体細胞の場合には、異数性とは、細胞が、22対の常染色体および1対の性染色体を含有しない場合を指し得る。ヒト配偶子の場合には、異数性とは、細胞が、23種の染色体のそれぞれのうちの1つを含有しない場合を指し得る。単一染色体型の場合には、異数性とは、大体2つの相同であるが同一ではない染色体コピーが存在する場合、または同じ親を起源とする2つの染色体コピーが存在する場合を指し得る。いくつかの実施形態では、染色体セグメントの欠失は微小欠失である。 Aneuploidy means the presence of an incorrect number of chromosomes in a cell (eg, an incorrect number of complete chromosomes or an incorrect number of chromosomal segments, eg, the presence of deletions or duplications of chromosomal segments). .. In the case of human somatic cells, aneuploidy can refer to the case where the cell does not contain 22 pairs of autosomal chromosomes and 1 pair of sex chromosomes. In the case of human gametes, aneuploidy can refer to the case where the cell does not contain one of each of the 23 chromosomes. In the case of a single chromosomal type, aneuploidy can refer to the presence of roughly two homologous but not identical chromosomal copies, or the presence of two chromosomal copies originating from the same parent. .. In some embodiments, the deletion of a chromosomal segment is a microdeletion.

倍数性状態とは、細胞における1つまたは複数の染色体型の量および/または染色体の同一性を指す。 Ploidy state refers to the amount and / or chromosomal identity of one or more chromosomal types in a cell.

染色体とは、単一染色体コピーを指してもよく、これは正常な体細胞に46個存在するDNAの単一分子を意味し、その例は「母体由来の第18染色体」である。染色体とは、正常なヒト体細胞に23個存在する染色体型を指す場合もあり、例は「第18染色体」である。 Chromosome may refer to a single chromosome copy, which means a single molecule of DNA present in 46 normal somatic cells, an example of which is "maternally derived chromosome 18." The chromosome may refer to a chromosome type existing in 23 normal human somatic cells, for example, "chromosome 18".

染色体の同一性とは、指示対象の染色体数、すなわち染色体型を指し得る。正常なヒトは、22種類の番号が付された常染色体型、および2種類の性染色体を有する。染色体の同一性とは、親起源の染色体を指す場合もある。染色体の同一性とは、親から遺伝によって受け継がれる特定の染色体を指す場合もある。染色体の同一性とは、染色体の他の同定される形体(feature)を指す場合もある。 Chromosome identity can refer to the referent number of chromosomes, i.e., the chromosomal type. Normal humans have 22 numbered autosomal types and two sex chromosomes. Chromosome identity may also refer to a chromosome of parental origin. Chromosome identity may also refer to a particular chromosome that is inherited from the parent. Chromosome identity may also refer to other identified forms of chromosomes.

遺伝物質の状態または単に「遺伝子の状態」とは、DNA上のSNPの集合の同一性、相が特定された(phased)遺伝物質のハプロタイプ、および挿入、欠失、反復および変異を含めたDNAの配列を指し得る。これは、1個または複数個の染色体の倍数性状態、染色体セグメントまたは染色体セグメントの集合を指す場合もある。 The state of the genetic material or simply the "gene state" is the identity of the set of SNPs on the DNA, the haplotype of the phased genetic material, and the DNA including insertions, deletions, repetitions and mutations. Can point to an array of. This may refer to a polyploid state of one or more chromosomes, a chromosomal segment or a set of chromosomal segments.

対立遺伝子データとは、1個または複数個の対立遺伝子の集合に関する遺伝子型データの集合を指す。対立遺伝子データとは、相が特定されたハプロタイプデータを指し得る。対立遺伝子データとは、SNPの同一性を指してもよく、対立遺伝子データとは、挿入、欠失、反復および変異を含めたDNAの配列データを指してもよい。対立遺伝子データとは、親起源の各対立遺伝子を包含してもよい。 Allele data refers to a set of genotype data relating to a set of one or more alleles. Allelic data can refer to phase-identified haplotype data. Allelic data may refer to SNP identity and allelic data may refer to DNA sequence data including insertions, deletions, repeats and mutations. The allele data may include each allele of parental origin.

対立遺伝子の状態とは、1個または複数個の対立遺伝子の集合内の遺伝子の実際の状態を指す。対立遺伝子の状態とは、対立遺伝子データに記載されている遺伝子の実際の状態を指し得る。 Allele state refers to the actual state of a gene within a set of one or more alleles. The allelic state can refer to the actual state of the gene described in the allele data.

対立遺伝子の比(allelic ratio)または対立遺伝子の比(allele ratio)とは、試料または個体に存在する遺伝子座における各対立遺伝子の量の間の比を指す。試料を配列決定によって測定した場合、対立遺伝子の比とは、遺伝子座における各対立遺伝子にマッピングされるシーケンスリードの比を指し得る。試料を強度に基づく測定方法によって測定した場合、対立遺伝子の比とは、測定方法によって推定される遺伝子座に存在する各対立遺伝子の量の比を指し得る。 Allele ratio or allele ratio refers to the ratio between the amount of each allele at a locus present in a sample or individual. When the sample is measured by sequencing, the allele ratio can refer to the ratio of sequence reads mapped to each allele at the locus. When the sample is measured by an intensity-based measurement method, the allele ratio can refer to the ratio of the amount of each allele present at the locus estimated by the measurement method.

対立遺伝子数とは、特定の遺伝子座にマッピングされる配列の数を指し、その遺伝子座が多型である場合、対立遺伝子数とは、対立遺伝子のそれぞれにマッピングされる配列の数を指す。各対立遺伝子がバイナリー様式でカウントされる場合は、対立遺伝子数は整数になる。対立遺伝子が確率的にカウントされる場合は、対立遺伝子数は分数であり得る。 The number of alleles refers to the number of sequences mapped to a particular locus, and if the locus is polymorphic, the number of alleles refers to the number of sequences mapped to each of the alleles. If each allele is counted in binary mode, the number of alleles will be an integer. If alleles are stochastically counted, the number of alleles can be a fraction.

対立遺伝子数確率とは、マッピングの確率と組み合わせた、特定の遺伝子座または多型遺伝子座における対立遺伝子の集合にマッピングされる可能性がある配列の数を指す。カウントされた配列のそれぞれについてのマッピングの確率がバイナリーである(0または1)対立遺伝子数は、対立遺伝子数の確率と等しいことに留意されたい。いくつかの実施形態では、対立遺伝子数の確率はバイナリーであってよい。いくつかの実施形態では、対立遺伝子数の確率は、DNA測定値と等しくなるように設定することができる。 Allele number probability refers to the number of sequences that may be mapped to a set of alleles at a particular locus or polymorphic locus, combined with the mapping probability. Note that the probability of mapping for each of the counted sequences is binary (0 or 1) and the number of alleles is equal to the probability of the number of alleles. In some embodiments, the probability of allele number may be binary. In some embodiments, the probability of the number of alleles can be set to be equal to the DNA measurement.

対立遺伝子分布または「対立遺伝子数分布」とは、遺伝子座の集合内の各遺伝子座に存在する各対立遺伝子の相対量を指す。対立遺伝子分布は、個体、試料または試料に対して得た測定値の集合を指す場合がある。配列決定との関連において、対立遺伝子分布とは、多型遺伝子座の集合内の各対立遺伝子についての、特定の対立遺伝子にマッピングされるリード数または見込み数を指す。対立遺伝子測定値は、確率的に処理することができる、すなわち所与の対立遺伝子が所与のシーケンスリードを示す尤度は、0から1の間の分数である、または対立遺伝子測定値は、バイナリー様式で処理することができる、すなわち任意の所与のリードは、特定の対立遺伝子のちょうど0コピーまたは1コピーであると考えられる。 Allele distribution or "allele number distribution" refers to the relative amount of each allele present at each locus within the set of loci. Allelic distribution may refer to an individual, sample or set of measurements obtained for a sample. In the context of sequencing, allele distribution refers to the number of reads or prospects mapped to a particular allele for each allele within the set of polymorphic loci. Allele measurements can be processed probabilistically, i.e. the likelihood that a given allele shows a given sequence read is a fraction between 0 and 1, or allele measurements are. Any given read that can be processed in a binary fashion is considered to be exactly 0 or 1 copy of a particular allele.

対立遺伝子分布パターンとは、異なる親の状況についての異なる対立遺伝子分布の集合を指す。特定の対立遺伝子分布パターンにより、特定の倍数性状態が示され得る。 An allelic distribution pattern refers to a set of different allelic distributions for different parental situations. A particular allele distribution pattern may indicate a particular ploidy state.

対立遺伝子の偏りとは、ヘテロ接合性遺伝子座における測定された対立遺伝子の比が、元のDNAの試料に存在していた比と異なる程度を指す。特定の遺伝子座における対立遺伝子の偏りの程度は、その遺伝子座において観察された対立遺伝子比を測定し、その遺伝子座における元のDNA試料中の対立遺伝子の比で割ったものと等しい。対立遺伝子の偏りは1より大きいと定義することができ、したがって、対立遺伝子の偏りの程度の算出によって1未満の値xが生じる場合、対立遺伝子の偏りの程度は1/xと言い換えることができる。対立遺伝子の偏りは、増幅の偏り、精製の偏りまたは異なる対立遺伝子に違うように影響を及ぼすいくつかの他の現象に起因し得る。 Allele bias refers to the degree to which the measured allele ratio at a heterozygous locus differs from the ratio that was present in the original DNA sample. The degree of allelic bias at a particular locus is equal to measuring the allelic gene ratio observed at that locus and dividing by the ratio of allelic genes in the original DNA sample at that locus. The allele bias can be defined as greater than 1, so if the calculation of the degree of allele bias yields a value x less than 1, then the degree of allele bias can be paraphrased as 1 / x. .. Allele bias can result from amplification bias, purification bias, or some other phenomenon that affects different alleles differently.

プライマー、同様に「PCRプローブ」とは、単一のDNA分子(DNAオリゴマー)またはDNA分子(DNAオリゴマー)の集団を指し、DNA分子は同一またはほぼ同一であり、プライマーは、標的遺伝子座(例えば、標的多型遺伝子座または非多型遺伝子座)とハイブリダイズするように設計された領域を含有しており、PCR増幅が可能になるように設計されたプライミング配列を含有してよい。プライマーは、分子バーコードも含有してよい。プライマーは、個々の分子それぞれについて異なるランダムな領域を含有してよい。用語の「試験プライマー」および「候補プライマー」は、限定を意味するものではなく、本明細書開示のいずれかのプライマーを意味してもよい。 A primer, as well as a "PCR probe", refers to a single DNA molecule (DNA oligomer) or group of DNA molecules (DNA oligomer), the DNA molecule being the same or nearly identical, and the primer being the target locus (eg, the target locus). , Target polymorphic loci or non-polymorphic loci), and may contain priming sequences designed to allow PCR amplification. The primer may also contain a molecular barcode. Primers may contain different random regions for each individual molecule. The terms "test primer" and "candidate primer" are not meant to be limiting and may mean any of the primers disclosed herein.

プライマーライブラリーは、2個以上のプライマーの集団を意味する。種々の実施形態では、ライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なるプライマーを含む。種々の実施形態では、ライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なるプライマー対を含み、それぞれのプライマー対は、フォワード試験プライマーおよびリバース試験プライマーを含み、それぞれの試験プライマー対は、標的遺伝子座にハイブリダイズする。いくつかの実施形態では、プライマーライブラリーは、それぞれ異なる標的遺伝子座にハイブリダイズする少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる個別プライマーを含み、個別プライマーは、プライマー対の一部ではない。いくつかの実施形態では、ライブラリーは、(i)プライマー対、および(ii)プライマー対の一部ではない個別プライマー(例えば、ユニバーサルプライマー)の両方を含む。 Primer library means a population of two or more primers. In various embodiments, the library is at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 50,000. 75,000; or 100,000 different primers. In various embodiments, the library is at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different primer pairs, each primer pair containing a forward test primer and a reverse test primer, and each test primer pair hybridizes to the target locus. In some embodiments, the primer library hybridizes to different target loci at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; It contains 30,000; 40,000; 50,000; 75,000; or 100,000 different individual primers, and the individual primers are not part of a primer pair. In some embodiments, the library comprises both (i) a primer pair and (ii) an individual primer that is not part of the primer pair (eg, a universal primer).

ハイブリッド捕捉プローブとは、PCRまたは直接的な合成などの種々の方法によって生成され、試料中の特異的な標的DNA配列の一方の鎖と相補的であることが意図された、場合によっては改変された任意の核酸配列を指す。外因性のハイブリッド捕捉プローブを調製された試料に加え、変性-再アニーリングプロセスを通じてハイブリダイズさせて、外因性断片-内因性断片の2重鎖を形成することができる。次いで、これらの2重鎖を、種々の手段によって試料から物理的に分離することができる。 Hybrid capture probes are generated by a variety of methods, such as PCR or direct synthesis, and are intended to be complementary to, and in some cases modified, to one strand of a specific target DNA sequence in a sample. Refers to any nucleic acid sequence. An extrinsic hybrid capture probe can be added to the prepared sample and hybridized through a denaturation-reannealing process to form a double chain of exogenous and endogenous fragments. These double chains can then be physically separated from the sample by various means.

シーケンスリードとは、クローン配列決定法を用いて測定したヌクレオチド塩基の配列を示すデータを指す。クローン配列決定により、単一の1つの元のDNA分子または1つの元のDNA分子のクローンまたは1つの元のDNA分子のクラスターを示す配列データを生じることができる。シーケンスリードは、配列の各塩基の位置において、ヌクレオチドが正確にコールされている確率を示す関連する品質スコアも有し得る。 Sequence read refers to data indicating the sequence of nucleotide bases measured by the clonal sequencing method. Clone sequencing can yield sequence data showing a single original DNA molecule or a clone of one original DNA molecule or a cluster of one original DNA molecule. Sequence reads can also have an associated quality score that indicates the probability that the nucleotide is being called correctly at the position of each base in the sequence.

シーケンスリードのマッピングとは、特定の生物体のゲノム内配列におけるシーケンスリードの開始場所を決定するプロセスである。シーケンスリードの開始場所は、リードとゲノム配列のヌクレオチド配列の類似性に基づく。 Sequence read mapping is the process of determining where to start a sequence read in a sequence within the genome of a particular organism. The starting location for sequence reads is based on the similarity between the nucleotide sequences of the reads and the genomic sequences.

一致コピーエラー、同様に「一致染色体異数性」(MCA)とは、1つの細胞が、2つの同一またはほぼ同一の染色体を含有する異数性の状態を指す。この種類の異数性は、減数分裂における配偶子形成の間に生じる可能性があり、減数分裂不分離エラーと称することができる。この種類のエラーは、有糸分裂において生じる可能性がある。一致トリソミーとは、所与の染色体の3つのコピーが個体に存在し、コピーのうちの2つが同一である場合を指し得る。 Match copy error, as well as "matched chromosomal aneuploidy" (MCA), refers to a aneuploidy state in which one cell contains two identical or nearly identical chromosomes. This type of aneuploidy can occur during gametogenesis in meiosis and can be referred to as meiotic inseparable error. This type of error can occur in mitosis. Trisomy can refer to the case where three copies of a given chromosome are present in an individual and two of the copies are identical.

不一致コピーエラー、同様に「独自の染色体異数性(unique chromosome aneuploidy)」(UCA)とは、1つの細胞が同じ親由来であり、かつ相同であるが同一ではない可能性がある2つの染色体を含有する異数性の状態を指す。この種類の異数性は、減数分裂の間に生じる可能性があり、減数分裂エラーと称することができる。不一致トリソミーとは、所与の染色体の3つのコピーが個体に存在し、コピーのうちの2つが同じ親由来であり、かつ相同であるが同一ではない場合を指し得る。不一致トリソミーとは、一方の親由来の2つの相同染色体が存在し、染色体の一部のセグメントは同一であるが他のセグメントはただ単に相同なだけである場合を指し得ることに留意されたい。 Mismatched copy errors, as well as "unique chromosome aneuploidy" (UCA), are two chromosomes in which one cell is from the same parent and may be homologous but not identical. Refers to an aneuploidy state containing. This type of aneuploidy can occur during meiosis and can be referred to as meiosis error. Mismatch trisomy can refer to the case where three copies of a given chromosome are present in an individual, two of which are of the same parental origin, and are homologous but not identical. Note that disagreement trisomy can refer to the presence of two homologous chromosomes from one parent, some segments of the chromosome being identical, while others are merely homologous.

相同染色体とは、通常は減数分裂の間に対合する同じ遺伝子の集合を含有する染色体コピーを指す。 A homologous chromosome refers to a chromosomal copy that contains the same set of genes that normally pair during meiosis.

同一染色体とは、同じ遺伝子の集合を含有する染色体コピーを指し、各遺伝子について、同一染色体は同一またはほぼ同一である同じ対立遺伝子の集合を有する。 The same chromosome refers to a chromosome copy containing the same set of genes, and for each gene, the same chromosome has the same set of alleles that are the same or nearly identical.

対立遺伝子ドロップアウト(ADO)とは、所与の対立遺伝子における相同染色体由来の塩基対の集合内の塩基対の少なくとも一方が検出されない状況を指す。 Allele dropout (ADO) refers to the situation in which at least one of the base pairs in a set of base pairs from a homologous chromosome in a given allele is not detected.

遺伝子座ドロップアウト(LDO)とは、所与の対立遺伝子における相同染色体由来の塩基対の集合内の塩基対の両方が検出されない状況を指す。 Locus dropout (LDO) refers to the situation in which both base pairs within a set of base pairs from homologous chromosomes in a given allele are not detected.

ホモ接合性とは、対応する染色体の遺伝子座と同様の対立遺伝子を有することを指す。 Homozygosity refers to having an allele similar to the locus of the corresponding chromosome.

ヘテロ接合性とは、対応する染色体の遺伝子座と同様でない対立遺伝子を有することを指す。 Heterozygosity refers to having an allele that is not similar to the locus of the corresponding chromosome.

ヘテロ接合性率とは、集団内の個体が所与の遺伝子座においてヘテロ接合性対立遺伝子を有する率を指す。ヘテロ接合性率は、個体またはDNAの試料中の所与の遺伝子座における予測された対立遺伝子の比または測定された対立遺伝子の比を指す場合もある。 Heterozygous rate refers to the rate at which an individual in a population has a heterozygous allele at a given locus. Heterozygous rate may also refer to the predicted or measured allele ratio at a given locus in an individual or DNA sample.

情報価値が高い一塩基多型(HISNP)とは、胎児が母親の遺伝子型には存在しない対立遺伝子を有するSNPを指す。 A single nucleotide polymorphism (HISNP) with high information value refers to an SNP in which the fetus has an allele that is not present in the genotype of the mother.

染色体領域とは、染色体のセグメントまたは完全な染色体を指す。 Chromosome region refers to a segment or complete chromosome of a chromosome.

染色体のセグメントとは、1つの塩基対から染色体全体までサイズに幅があり得る染色体のセクションを指す。 A chromosomal segment is a section of a chromosome that can vary in size from one base pair to the entire chromosome.

染色体とは、完全な染色体または染色体のセグメントもしくはセクションのいずれかを指す。 Chromosome refers to either a complete chromosome or a segment or section of a chromosome.

コピーとは、染色体セグメントのコピーの数を指す。それは、染色体セグメントの同一のコピー、または同一ではない相同なコピーを指す場合があり、染色体セグメントの異なるコピーは実質的に類似した遺伝子座の集合を含有し、対立遺伝子のうちの1個または複数個が異なる。M2コピーエラーなどの異数性のいくつかの場合には、所与の染色体セグメントの同一であるいくらかのコピーならびに同じ染色体セグメントの同一ではないいくらかのコピーを有する可能性があることに留意されたい。 Copy refers to the number of copies of a chromosomal segment. It may refer to the same or non-identical homologous copy of a chromosomal segment, where different copies of a chromosomal segment contain a collection of substantially similar loci and one or more of alleles. The pieces are different. Note that in some cases of aneuploidy, such as M2 copy errors, one may have some copies of a given chromosomal segment that are identical as well as some copies that are not identical to the same chromosomal segment. ..

ハプロタイプとは、一般には、同じ染色体上で一緒に遺伝によって受け継がれる、複数の遺伝子座における対立遺伝子の組み合わせを指す。ハプロタイプとは、所与の遺伝子座の集合の間で起こった組換え事象の数に応じて、わずか2つの遺伝子座または染色体全体を指し得る。ハプロタイプとは、統計学的に関連する単一の染色分体上の一塩基多型(SNP)の集合も指す場合がある。 A haplotype generally refers to a combination of alleles at multiple loci that are inherited together on the same chromosome. A haplotype can refer to just two loci or the entire chromosome, depending on the number of recombination events that have occurred between a given set of loci. Haplotypes may also refer to a set of single nucleotide polymorphisms (SNPs) on a single statistically relevant chromatid.

ハプロタイプデータ、同様に「相が特定されたデータ」または「順序づけられた遺伝子データ」とは、二倍体ゲノムまたは倍数体ゲノムの単一染色体、すなわち、二倍体ゲノムの染色体の分離された母系のコピーまたは父系のコピーのいずれかからのデータを指す。 Haplotype data, as well as "phase-specific data" or "ordered genetic data," is a single chromosome in a diploid or polyploid genome, i.e., a separate maternal lineage of chromosomes in the diploid genome. Refers to data from either a copy of or a copy of the paternal lineage.

相の特定(Phasing)とは、順序づけられていない、二倍体(または倍数性)遺伝子データを考慮して個体のハプロタイプ遺伝子データを決定する行為を指す。相の特定とは、1つの染色体上に見いだされる対立遺伝子の集合について、対立遺伝子の2つの遺伝子のどちらが、個体の2つの相同染色体のそれぞれと関連するかを決定する行為を指し得る。 Phase identification refers to the act of determining an individual's haplotype genetic data by taking into account unordered, diploid (or polyploid) genetic data. Phase identification can refer to the act of determining which of the two allele genes is associated with each of the two homologous chromosomes of an individual for a set of alleles found on one chromosome.

相が特定されたデータとは、1個または複数個のハプロタイプが決定された遺伝子データを指す。 Phase-specific data refers to genetic data for which one or more haplotypes have been determined.

仮説とは、所与の染色体の集合における可能性のある倍数性状態または所与の遺伝子座の集合における可能性のある対立遺伝子の状態の集合を指す。可能性の集合は、1個または複数個のエレメントを含んでよい。 A hypothesis refers to a set of possible polyploid states in a given set of chromosomes or possible allelic states in a given set of loci. The set of possibilities may include one or more elements.

コピー数仮説、同様に「倍数性状態仮説」とは、個体の染色体のコピーの数に関する仮説を指す。これは、各染色体の起源となる親、および親の2つの染色体のどちらが個体に存在するかを含めた、染色体のそれぞれの同一性に関する仮説を指す場合もある。これは、もしあれば、関連する個体由来の染色体または染色体セグメントのいずれが、個体由来の所与の染色体に遺伝的に対応するかに関する仮説を指す場合もある。 The copy number hypothesis, as well as the "haploid state hypothesis," refers to the hypothesis regarding the number of copies of an individual's chromosomes. This may refer to a hypothesis about the identity of each chromosome, including the parent from which each chromosome originates and which of the two parental chromosomes is present in the individual. This may refer to a hypothesis as to whether a related individual-derived chromosome or chromosomal segment, if any, genetically corresponds to a given individual-derived chromosome.

標的個体とは、遺伝子の状態が決定される個体を指す。いくつかの実施形態では、限られた量のDNAのみが標的個体から入手可能である。いくつかの実施形態では、標的個体は胎児である。いくつかの実施形態では、2体以上の標的個体が存在し得る。いくつかの実施形態では、一対の親から生まれた胎児をそれぞれ標的個体とみなすことができる。いくつかの実施形態では、決定される遺伝子データは、1つの対立遺伝子のコールまたは対立遺伝子のコールの集合である。いくつかの実施形態では、決定される遺伝子データは、倍数性コールである。 A target individual is an individual whose genetic status is determined. In some embodiments, only a limited amount of DNA is available from the target individual. In some embodiments, the target individual is a fetus. In some embodiments, there can be more than one target individual. In some embodiments, fetuses born to a pair of parents can each be considered a target individual. In some embodiments, the genetic data determined is a single allele call or a set of allele calls. In some embodiments, the genetic data determined is polyploid call.

関連する個体とは、標的個体と遺伝的に関連する、したがって、標的個体とハプロタイプブロックを共有する任意の個体を指す。ある状況では、関連する個体は、標的個体の遺伝学的な親、または親に由来する任意の遺伝物質、例えば、精子、極体、胚、胎児または子であってよい。関連する個体とは、同胞、親または祖父母を指す場合もある。 A related individual is any individual that is genetically associated with the target individual and therefore shares a haplotype block with the target individual. In certain situations, the relevant individual may be the genetic parent of the target individual, or any genetic material derived from the parent, eg, sperm, polar body, embryo, fetus or offspring. Related individuals may also refer to siblings, parents or grandparents.

同胞とは、遺伝学的な親が問題の個体と同じである任意の個体を指す。いくつかの実施形態では、同胞とは、生まれた子、胚もしくは胎児、または生まれた子、胚もしくは胎児に由来する1個または複数個の細胞を指し得る。同胞とは、親の一方を起源とする一倍体個体、例えば、精子、極体または任意の他のハプロタイプの遺伝物質の集合を指す場合もある。個体は、それ自体を同胞とみなすことができる。 Brotherhood refers to any individual whose genetic parent is the same as the individual in question. In some embodiments, sibs can refer to a born offspring, embryo or fetus, or one or more cells derived from a born offspring, embryo or fetus. A sibling may also refer to a set of polyploid individuals originating from one of the parents, such as sperm, polar bodies or any other haplotype genetic material. An individual can consider itself a sibling.

胎児の(fetal)とは、「胎児の(of the fetus)」、または「胎児と遺伝的に類似である胎盤の領域の(of the region of the placenta that is genetically similar to the fetus)」を指す。妊娠中の女性では、胎盤の一部は胎児と遺伝的に類似であり、母系の血液中に見いだされる浮動性胎児DNAは、遺伝子型が胎児と一致する胎盤の部分を起源とし得る。胎児の染色体の半分の遺伝子情報は、胎児の母親から遺伝によって受け継がれることに留意されたい。いくつかの実施形態では、胎児の細胞に由来するこれらの母系的に遺伝によって受け継がれた染色体からのDNAは、「母体起源の(of maternal origin)」ものではなく「胎児起源の(of fetal origin)」ものと考えられる。 Fetal refers to "of the fetus" or "of the region of the placenta that is genetically simillar to the fetal". .. In pregnant women, part of the placenta is genetically similar to the fetus, and the floating fetal DNA found in the blood of the maternal line can originate from the part of the placenta whose genotype matches the fetus. Note that the genetic information of half of the fetal chromosomes is inherited from the fetal mother. In some embodiments, the DNA from these maternally inherited chromosomes derived from fetal cells is not "of maternal origin" but "of fetal origin". ) ”.

胎児起源のDNAとは、元々は遺伝子型が基本的に胎児の遺伝子型と等しい細胞の一部であったDNAを指す。 Fetal-origin DNA refers to DNA that was originally part of a cell whose genotype is basically equal to that of the fetus.

母体起源のDNAとは、元々は遺伝子型が基本的に母親の遺伝子型と等しい細胞の一部であったDNAを指す。 Maternally-derived DNA refers to DNA that was originally part of a cell whose genotype is essentially the same as that of the mother.

子とは、胚、割球または胎児を指し得る。ここで開示されている実施形態では、記載されている概念は、生まれた子、胎児、胚またはそれら由来の細胞の集合である個体に同等に良好に当てはまることに留意されたい。子という用語の使用は、単に子と称される個体が親の遺伝学的子孫であることを内包することを意味する。 A offspring can refer to an embryo, blastomere or fetus. It should be noted that in the embodiments disclosed herein, the concepts described apply equally well to individuals that are a collection of cells of birth, fetus, embryo or derived from them. The use of the term offspring simply means that the individual referred to as the offspring is the genetic offspring of the parent.

親とは、個体の遺伝学的母親または父親を指す。個体は、一般には、2体の親、母親および父親を有するが、これは、例えば、遺伝子または染色体のキメラ現象において、必ずしもそうではない。親は個体とみなすことができる。 A parent is an individual's genetic mother or father. An individual generally has two parents, a mother and a father, but this is not always the case, for example, in a genetic or chromosomal chimeric phenomenon. Parents can be considered individuals.

親の状況とは、標的の2体の親の一方または両方について、2つの関連性のある染色体のそれぞれにおける所与のSNPの遺伝子の状態を指す。 Parental status refers to the genetic status of a given SNP on each of two related chromosomes for one or both of the two targeted parents.

所望の通り発生させる、同様に「正常に発生させる」とは、成長可能な胚を子宮内に着床させ、妊娠をもたらすこと、および/または、妊娠を継続し、出生をもたらすこと、および/または、生まれた子に染色体異常がないこと、および/または、生まれた子に他の望ましくない遺伝子の状態、例えば、疾患連鎖遺伝子がないことを指す。「所望の通り発生させる」という用語は、親または健康管理の補助者により所望され得るいかなるものも包含することを意味する。いくつかの場合には、「所望の通り発生させる」とは、医学的な研究または他の目的に有用である成長できない胚または成長可能な胚を指し得る。 To develop as desired, as well as to "generate normally", means to implant a viable embryo into the uterus and result in pregnancy, and / or to continue pregnancy and result in birth, and / Alternatively, it refers to the absence of chromosomal abnormalities in the offspring and / or the absence of other unwanted genetic states, such as disease linkage genes, in the offspring. The term "generate as desired" is meant to include anything that may be desired by a parent or health care assistant. In some cases, "developing as desired" can refer to non-growth or viable embryos that are useful for medical research or other purposes.

子宮への挿入とは、インビトロでの受精との関連において胚を子宮腔に移入するプロセスを指す。 Insertion into the uterus refers to the process of transferring an embryo into the uterine cavity in the context of in vitro fertilization.

母系の血漿とは、妊娠中の女性由来の血液の血漿部分を指す。 Maternal plasma refers to the plasma portion of blood from a pregnant woman.

臨床的決定とは、個体の健康または生存に影響を及ぼす転帰を有する措置を取るか取らないかの任意の決定を指す。出生前診断との関連において、臨床的決定とは、胎児を流産するか流産しないかの決定を指し得る。臨床的決定とは、さらなる検査を行うこと、望ましくない表現型を減ずるための措置を取ること、または異常を持つ子の誕生の準備をするための措置を取ることの決定を指す場合もある。 A clinical decision refers to any decision to take or not take measures with outcomes that affect an individual's health or survival. In the context of prenatal diagnosis, a clinical decision can refer to the decision to miscarriage or not to have a fetus. A clinical decision may refer to the decision to take further tests, take steps to reduce unwanted phenotypes, or prepare for the birth of a child with an abnormality.

診断ボックスとは、本明細書に開示されている方法の1つまたは複数の態様を実施するために設計された1つの機械またはその機械の組み合わせを指す。ある実施形態では、診断ボックスは、患者をケアする所に置くことができる。ある実施形態では、診断ボックスにより、標的化増幅、その後の配列決定を実施することができる。ある実施形態では、診断ボックスは、単独で、または技師の補助で機能し得る。 Diagnostic box refers to a machine or a combination of machines designed to perform one or more embodiments of the methods disclosed herein. In certain embodiments, the diagnostic box can be placed in a place that cares for the patient. In certain embodiments, the diagnostic box allows targeted amplification followed by sequencing. In certain embodiments, the diagnostic box may function alone or with the assistance of a technician.

インフォマティクスに基づく方法とは、大量のデータを解明するために、統計量に大きく依拠する方法を指す。出生前診断との関連において、インフォマティクスに基づく方法とは、1個または複数個の染色体における倍数性状態または1個または複数個の対立遺伝子における対立遺伝子の状態を、状態を直接物理的に測定することによってではなく、例えば、分子アレイまたは配列決定からの大量の遺伝子データを考慮して、最も可能性が高い状態を統計学的に推論することによって決定するために設計された方法を指す。本開示のある実施形態では、インフォマティクスに基づく技法は、本特許に開示されているものであってよい。本開示のある実施形態では、インフォマティクスに基づく技法はPARENTAL SUPPORT(商標)であってよい。 Informatics-based methods refer to methods that rely heavily on statistics to unravel large amounts of data. In the context of prenatal diagnosis, informatics-based methods directly physically measure the state of a polyploid state on one or more chromosomes or the state of an allele in one or more alleles. It refers to a method designed to determine the most probable state by statistically inferring, for example, taking into account a large amount of genetic data from a molecular array or sequencing. In certain embodiments of the present disclosure, the informatics-based technique may be those disclosed in this patent. In certain embodiments of the present disclosure, the informatics-based technique may be PARENTAL SUPPORT ™.

一次遺伝子データとは、遺伝子型決定プラットフォームから出力されるアナログの強度シグナルを指す。SNPアレイとの関連において、一次遺伝子データとは、いかなる遺伝子型コールも行われる前の強度シグナルを指す。配列決定との関連において、一次遺伝子データとは、いかなる塩基対の同一性も決定される前、および配列がゲノムにマッピングされる前にシーケンサーから生じる、クロマトグラムと類似しているアナログ測定値を指す。 Primary genetic data refers to the analog intensity signal output from the genotyping platform. In the context of SNP arrays, primary genetic data refers to the intensity signal before any genotype call is made. In the context of sequencing, primary genetic data refers to analog measurements similar to chromatograms that arise from the sequencer before any base pair identity is determined and before the sequence is mapped to the genome. Point to.

二次遺伝子データとは、遺伝子型決定プラットフォームから出力される加工された遺伝子データを指す。SNPアレイとの関連において、二次遺伝子データとは、SNPアレイリーダーに付随するソフトウェアによって行われる対立遺伝子コールを指し、該ソフトウェアにより、試料中に所与の対立遺伝子が存在するか存在しないかのコールが行われる。配列決定との関連において、二次遺伝子データとは、配列の塩基対の同一性が決定されることを指し、場合によっては、同様に、配列がゲノムにマッピングされたことを指す。 Secondary genetic data refers to processed genetic data output from the genotyping platform. In the context of an SNP array, secondary gene data refers to allele calls made by software associated with the SNP array reader, which may or may not be present in the sample. A call is made. In the context of sequencing, secondary genetic data refers to the determination of base pair identity of a sequence, and in some cases, similarly, to the mapping of a sequence to the genome.

非侵襲的な出生前診断(NPD)または、同様に「非侵襲的な出生前スクリーニング」(NPS)とは、母親の血液中に見いだされる遺伝物質を用いて、母親が妊娠中の胎児の遺伝子の状態を決定する方法を指し、遺伝物質は、母親の静脈内血液を抜き取ることによって得る。 Non-invasive prenatal testing (NPD) or similarly "non-invasive prenatal screening" (NPS) is the gene of a fetus in which the mother is pregnant using genetic material found in the mother's blood. Refers to a method of determining the condition of the mother, the genetic material is obtained by drawing the mother's intravenous blood.

遺伝子座に対応するDNAを優先的に富化すること、または遺伝子座におけるDNAを優先的に富化することは、その遺伝子座に対応する富化後のDNA混合物中のDNA分子の百分率を、その遺伝子座に対応する富化前のDNA混合物中のDNA分子の百分率よりも高くする任意の方法を指す。前記方法は、遺伝子座に対応するDNA分子の選択的増幅を包含し得る。前記方法は、遺伝子座に対応しないDNA分子を除去するステップを包含し得る。前記方法は、方法の組み合わせを包含し得る。富化の程度は、その遺伝子座に対応する富化後の混合物におけるDNA分子の百分率を、その遺伝子座に対応する富化前の混合物におけるDNA分子の百分率で割ったものと定義される。優先的な富化は、複数の遺伝子座において行うことができる。本開示のいくつかの実施形態では、富化の程度は20を超える。本開示のいくつかの実施形態では、富化の程度は200を超える。本開示のいくつかの実施形態では、富化の程度は2,000を超える。優先的な富化を複数の遺伝子座において行う場合、富化の程度とは、遺伝子座の集合内の全ての遺伝子座の平均の富化の程度を指し得る。 Priority enrichment of the DNA corresponding to the locus, or preferential enrichment of the DNA at the locus, is a percentage of the DNA molecule in the enriched DNA mixture corresponding to that locus. Refers to any method of increasing the percentage of DNA molecules in the pre-enriched DNA mixture corresponding to that locus. The method may include selective amplification of the DNA molecule corresponding to the locus. The method may include the step of removing a DNA molecule that does not correspond to a locus. The method may include a combination of methods. The degree of enrichment is defined as the percentage of DNA molecules in the post-enrichment mixture corresponding to the locus divided by the percentage of DNA molecules in the pre-enrichment mixture corresponding to the locus. Priority enrichment can be done at multiple loci. In some embodiments of the present disclosure, the degree of enrichment is greater than 20. In some embodiments of the present disclosure, the degree of enrichment exceeds 200. In some embodiments of the present disclosure, the degree of enrichment exceeds 2,000. When preferential enrichment is performed at multiple loci, the degree of enrichment can refer to the average degree of enrichment of all loci within the set of loci.

増幅とは、DNA分子のコピーの数を増加させる方法を指す。 Amplification refers to a method of increasing the number of copies of a DNA molecule.

選択的な増幅とは、特定のDNA分子またはDNAの特定の領域に対応するDNA分子のコピーの数を増加させる方法を指し得る。選択的な増幅とは、特定の標的のDNA分子または標的のDNAの領域のコピーの数を、DNAの標識していない分子または領域を増大させるよりも増加させる方法を指す場合もある。選択的な増幅は、優先的に富化する方法であってよい。 Selective amplification can refer to a method of increasing the number of copies of a particular DNA molecule or DNA molecule corresponding to a particular region of DNA. Selective amplification may also refer to a method of increasing the number of copies of a particular target DNA molecule or region of the target DNA rather than increasing the unlabeled molecule or region of the DNA. Selective amplification may be a preferential enrichment method.

ユニバーサルプライミング配列とは、標的DNA分子の集団に、例えば、ライゲーション、PCRまたはライゲーション媒介性PCRによって付加することができるDNA配列を指す。標的分子の集団に付加した後、ユニバーサルプライミング配列に特異的なプライマーを用いて、増幅プライマーの単一の対を使用して標的集団を増幅することができる。ユニバーサルプライミング配列は、一般には、標的配列に関連しない。 A universal priming sequence refers to a DNA sequence that can be added to a population of target DNA molecules, for example, by ligation, PCR or ligation-mediated PCR. After addition to the population of target molecules, the target population can be amplified using a single pair of amplification primers with primers specific for the universal priming sequence. Universal priming sequences are generally unrelated to target sequences.

ユニバーサルアダプタまたは「ライゲーションアダプタ」または「ライブラリータグ」
は、標的二本鎖DNA分子の集団の5’末端および3’末端に共有結合的に連結することができるユニバーサルプライミング配列を含有するDNA分子である。アダプタを付加することにより、そこからPCR増幅を行うことができる標的集団の5’末端および3’末端にユニバーサルプライミング配列がもたらされ、標的集団由来の全ての分子を、増幅プライマーの単一の対を使用して増幅する。
Universal adapter or "ligation adapter" or "library tag"
Is a DNA molecule containing a universal priming sequence that can be covalently linked to the 5'and 3'ends of a population of target double-stranded DNA molecules. The addition of an adapter results in a universal priming sequence at the 5'and 3'ends of the target population from which PCR amplification can be performed, and all molecules from the target population are singled with an amplification primer. Amplify using pairs.

標的化とは、DNAの混合物中の遺伝子座の集合に対応するDNA分子を選択的に増幅する、または別の方法で優先的に富化するために使用される方法を指す。 Targeting refers to a method used to selectively amplify or otherwise preferentially enrich a DNA molecule corresponding to a set of loci in a mixture of DNA.

同時分布モデルとは、複数のランダムな変数に関して定義済みの事象の確率を、変数の確率が関連づけられている、同じ確率空間に対して定義済みの複数のランダムな変数を考慮して、定義するモデルを指す。いくつかの実施形態では、変数の確率が関連づけられていない退化事例を用いることができる。 A joint distribution model defines the probabilities of predefined events for multiple random variables, taking into account multiple random variables defined for the same probability space to which the probabilities of the variables are associated. Refers to the model. In some embodiments, degeneration cases in which the probabilities of variables are not associated can be used.

ここで開示されている実施形態は、添付図を参照してさらに説明され、同様の構造はいくつかの概観を通じて同様の数字で参照される。示されている図は必ずしも一定の縮尺ではなく、概して、ここで開示されている実施形態の原理の例示が強調されている。 The embodiments disclosed herein are further described with reference to the accompanying figures, and similar structures are referred to by similar numbers throughout some overviews. The figures shown are not necessarily of constant scale and generally emphasize the illustration of the principles of the embodiments disclosed herein.

直接多重mini-PCR法の模式図である。It is a schematic diagram of the direct multiplex mini-PCR method. セミネステッドmini-PCR法の説明図である。It is explanatory drawing of the semi-nested mini-PCR method. 完全ネステッドmini-PCR法の説明図である。It is explanatory drawing of the complete nested mini-PCR method. ヘミネステッドmini-PCR法の説明図である。It is explanatory drawing of the heminestized mini-PCR method. 3重ヘミネステッドmini-PCR法の説明図である。It is explanatory drawing of the triple heminestized mini-PCR method. 片側ネステッドmini-PCR法の説明図である。It is explanatory drawing of the one-sided nested mini-PCR method. 片側mini-PCR法の説明図である。It is explanatory drawing of the one-sided mini-PCR method. 逆セミネステッドmini-PCR法の説明図である。It is explanatory drawing of the reverse semi-nested mini-PCR method. セミネステッド法のいくつかの可能性のあるワークフロー図である。It is a workflow diagram of some possibilities of the semi-nested method. ループライゲーションアダプタの説明図である。It is explanatory drawing of the loop ligation adapter. 内部にタグを付けたプライマーの説明図である。It is explanatory drawing of the primer with a tag inside. 内部のタグを有するいくつかのプライマーの例である。Here are some examples of primers with internal tags. ライゲーションアダプタ結合領域を有するプライマーを使用する方法の説明図である。It is explanatory drawing of the method of using the primer which has a ligation adapter binding region. 2つの異なる分析技法を用いた計数方法についてのシミュレートされた倍数性コールの正確度を示すグラフである。FIG. 6 is a graph showing the accuracy of simulated haploid calls for counting methods using two different analytical techniques. 実験4の細胞系における複数のSNPについての2個の対立遺伝子の比を示す図である。It is a figure which shows the ratio of two alleles for a plurality of SNPs in the cell line of Experiment 4. 染色体により分けた、実験4の細胞系における複数のSNPについての2つの対立遺伝子の比を示す図である。FIG. 5 shows the ratio of two alleles for multiple SNPs in the cell line of Experiment 4, separated by chromosome. 図17A~Dは、染色体により分けた、4人の妊娠中の女性の血漿試料における複数のSNPについての2個の対立遺伝子の比を示す図である。17A-D are diagrams showing the ratio of two alleles for multiple SNPs in plasma samples of four pregnant women, separated by chromosome. 図17A~Dは、染色体により分けた、4人の妊娠中の女性の血漿試料における複数のSNPについての2個の対立遺伝子の比を示す図である。17A-D are diagrams showing the ratio of two alleles for multiple SNPs in plasma samples of four pregnant women, separated by chromosome. 図17A~Dは、染色体により分けた、4人の妊娠中の女性の血漿試料における複数のSNPについての2個の対立遺伝子の比を示す図である。17A-D are diagrams showing the ratio of two alleles for multiple SNPs in plasma samples of four pregnant women, separated by chromosome. 図17A~Dは、染色体により分けた、4人の妊娠中の女性の血漿試料における複数のSNPについての2個の対立遺伝子の比を示す図である。17A-D are diagrams showing the ratio of two alleles for multiple SNPs in plasma samples of four pregnant women, separated by chromosome. データ補正の前後の二項分散によって説明することができるデータの割合を示すグラフである。It is a graph which shows the ratio of the data which can be explained by the binomial variance before and after the data correction. 短いライブラリー調製プロトコール後の試料中の胎児DNAの相対的な富化を示すグラフである。FIG. 6 is a graph showing the relative enrichment of fetal DNA in a sample after a short library preparation protocol. リード深度に関し直接PCRとセミネステッド法を比較したグラフである。It is a graph comparing the direct PCR and the semi-nested method with respect to the read depth. 3種のゲノム試料の直接PCRのリード深度の比較を示すグラフである。It is a graph which shows the comparison of the read depth of the direct PCR of three kinds of genomic samples. 3種の試料のセミネステッドmini-PCRのリード深度の比較を示すグラフである。It is a graph which shows the comparison of the read depth of the semi-nested mini-PCR of three kinds of samples. 1,200プレックス反応および9,600プレックス反応のリード深度の比較を示すグラフである。It is a graph which shows the comparison of the read depth of a 1,200-plex reaction and a 9,600-plex reaction. 6種の細胞について3つの染色体におけるリード数比率を示すグラフである。It is a graph which shows the read number ratio in 3 chromosomes about 6 kinds of cells. 3種の染色体における、2つの3細胞反応についての、および1ngのゲノムDNAに対して行った第3の反応についての対立遺伝子の比を示す図である。FIG. 5 shows the ratio of alleles for two 3-cell reactions on three chromosomes and for a third reaction performed on 1 ng of genomic DNA. 3種の染色体における、2つの単一細胞反応についての対立遺伝子の比を示す図である。It is a figure which shows the ratio of alleles about two single cell reactions in three kinds of chromosomes. 2種のプライマー ライブラリーのそれぞれにより標的とされる特定のマイナー対立遺伝子頻度を有する遺伝子座の数を示す図である。It is a figure which shows the number of loci having a specific minor allele frequency targeted by each of two primer libraries. 図28A:PCR産物の電気泳動のグラフである。FIG. 28A: Graph of electrophoresis of PCR product. 図28B~28Mは、図28A中のそれぞれのレーン1~12の電気泳動図である。28B-28M are electrophoretic diagrams of lanes 1-12 in FIG. 28A, respectively. 図28B~28Mは、図28A中のそれぞれのレーン1~12の電気泳動図である。28B-28M are electrophoretic diagrams of lanes 1-12 in FIG. 28A, respectively. 図28B~28Mは、図28A中のそれぞれのレーン1~12の電気泳動図である。28B-28M are electrophoretic diagrams of lanes 1-12 in FIG. 28A, respectively. 図29A~29E:胎児の異数性の決定用の本発明の方法のイメージ表現である(図29A)。ハップマップデータベース由来の母系および父系遺伝子型データ(血液または頬スワブ由来)および乗換え頻度データを利用してそれぞれの可能な胎児倍数性状態に対する複数の独立仮説をインシリコにより生成する(図29B)。これらの仮説のそれぞれを異なる可能な乗換え点を考慮に入れた副次的仮説を含むように拡張する。データモデルにより、それぞれの仮説上の胎児の遺伝子型および異なる胎児のcfDNA割合に対して、生成しそうな配列決定データが予測され(予測対立遺伝子分布)、実際の配列決定データと比較される(図29C)。ベイズ統計学を使ってそれぞれの仮説に対する尤度が決定される。この仮説上の例で、最高尤度(正倍数性)を有する仮説が決定される(図29D)。図29Cのそれぞれのコピー数仮説ファミリー(モノソミー、ダイソミー、または三倍体性)の個別の尤度が合計される。最大尤度の仮説は、倍数性状態としてコールされ、胎児画分を明らかにし、試料特異的な計算精度(図29E)を示す。29A-29E: Image representation of the method of the invention for determining fetal aneuploidy (FIG. 29A). Maternal and paternal genotype data (from blood or buccal swabs) from the Hapmap database and crossover frequency data are used to generate multiple independent hypotheses for each possible fetal ploidy state by incilico (FIG. 29B). Each of these hypotheses is extended to include secondary hypotheses that take into account different possible transfer points. The data model predicts probable sequencing data for each hypothetical fetal genotype and different fetal cfDNA proportions (predictive allele distribution) and compares it to actual sequencing data (Figure). 29C). Bayesian statistics are used to determine the likelihood for each hypothesis. This hypothetical example determines the hypothesis with the highest likelihood (positive ploidy) (Fig. 29D). The individual likelihoods of each copy number hypothesis family (monosomy, disomy, or triploid) in FIG. 29C are summed. The maximum likelihood hypothesis, called as a ploidy state, reveals the fetal fraction and shows sample-specific computational accuracy (FIG. 29E). 図30A~30H:正倍数性(図30A~30C)、モノソミー(図30D)、およびトリソミー(図30E~30H)の代表的なグラフ表示である。全プロットでx軸は、それぞれの染色体(プロットの下部に示す)に沿った個別多形遺伝子座のリニア位置、およびy軸は、合計(A+B)対立遺伝子リード中の割合としてA対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるy軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がAAの母系遺伝子型を示し、青色がBBの母系遺伝子型を示し、緑色がABの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がAAで胎児がABである対立遺伝子の場合にAA|ABのように、母系|胎児の形式で表される。図30Aは、2個の染色体が存在し、胎児のcfDNA画分が0%である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、1(AA対立遺伝子)、0.5(AB対立遺伝子)、および0(BB対立遺伝子)を中心として分布する。図30Bは、2個の染色体が存在し、胎児画分が12%の場合に生成するプロットを示す。A対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がy軸に沿って上下に移動する。そのために、バンドは、1(AA|AA対立遺伝子)、0.94(AA|AB対立遺伝子)、0.56(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.44(AB|BB対立遺伝子)、0.06(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心になる。図30Cは、2個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。2本の赤色と2本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる(色は図には示されていない)。バンドは、1(AA|AA対立遺伝子)、0.87(AA|AB対立遺伝子)、0.63(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.37(AB|BB対立遺伝子)、0.13(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心となる。図30Dは、1個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。1本の外側赤色および1本の外側青色周辺バンド、ならびに、2本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した(色は図には示されていない)。胎児は対立遺伝子リードに対し、単一対立遺伝子(AまたはB)のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、2本のバンドに圧縮される(色は図には示されていない)。バンドは、1(AA|A対立遺伝子)、0.57(AB|A対立遺伝子)、0.43(AB|B対立遺伝子)、および0(BB|B対立遺伝子)が中心である。図30Eは、3個の染色体が存在し、胎児画分が27%の場合に生成されたプロットである。2本の赤色および2本の青色周辺バンドならびに2本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.88(AA|AAB対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.12(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)を中心とする。図30Fは、3個の染色体が存在し、胎児画分が14%の場合に生成したプロットである。3本の赤色と3本の青色周辺バンド、ならびに2本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.93(AA|AAB対立遺伝子)、0.87(AA|ABB対立遺伝子)、0.60(AB|AAA対立遺伝子)、0.53(AB|AAB対立遺伝子)、0.47(AB|ABB対立遺伝子)、0.40(AB|BBB対立遺伝子)、0.13(BB|AAB対立遺伝子)、0.07(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Gは、3個の染色体が存在し、胎児画分が35%の場合に生成されたプロットである。2本の赤色と2本の青色周辺バンドおよび4本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.85(AA|AAB対立遺伝子)、0.72(AB|AAA対立遺伝子)、0.57(AB|AAB対立遺伝子)、0.43(AB|ABB対立遺伝子)、0.28(AB|BBB対立遺伝子)、0.15(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Hは、3個の染色体が存在し、胎児画分が25%の場合に生成したプロットである。2本の赤色と2本の青色周辺バンド、ならびに、4本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。このパターンは、母系遺伝有糸分裂トリソミー(図30Gのような)のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、1(AA|AAA対立遺伝子)、0.78(AA|ABB対立遺伝子)、0.67(AB|AAA対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.33(AB|BBB対立遺伝子)、0.22(BB|AAB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。30A-30H: Representative graph representations of positive ploidy (FIGS. 30A-30C), monosomy (FIGS. 30D), and trisomy (FIGS. 30E-30H). In all plots, the x-axis is the linear position of the individual polymorphic locus along each chromosome (shown at the bottom of the plot), and the y-axis is the number of A allele reads as a percentage of the total (A + B) allele reads. Represents. Maternal and fetal genotypes, as well as the location of the y-axis at the center of the band, are shown on the right side of the plot. If necessary, the plots are color coded according to maternal genotype so that red indicates the maternal genotype of AA, blue indicates the maternal genotype of BB, and green indicates the maternal genotype of AB. May be good. If desired, the contribution of the maternal allele may be indicated by color in the "fetal genotype" column. Allele contributions are expressed in the form of maternal | fetus, such as AA | AB in the case of alleles where the mother is AA and the fetus is AB. FIG. 30A is a plot generated when two chromosomes are present and the fetal cfDNA fraction is 0%. This plot is from a non-pregnant woman and therefore represents a pattern when the genotype is completely maternal. Therefore, allele clusters are distributed around 1 (AA allele), 0.5 (AB allele), and 0 (BB allele). FIG. 30B shows a plot produced when two chromosomes are present and the fetal fraction is 12%. The contribution of fetal alleles to the proportion of A allele reads causes the position of some allele spots to move up and down along the y-axis. Therefore, the bands are 1 (AA | AA allele), 0.94 (AA | AB allele), 0.56 (AB | AA allele), 0.50 (AB | AB allele), 0. 44 (AB | BB allele), 0.06 (BB | AB allele), and 0 (BB | BB allele) are central. FIG. 30C shows a plot generated when two chromosomes are present and the fetal fraction is 26%. A pattern containing two red and two blue peripheral bands and a triplet of central green bands is readily visible (colors not shown in the figure). The bands are 1 (AA | AA allele), 0.87 (AA | AB allele), 0.63 (AB | AA allele), 0.50 (AB | AB allele), 0.37 (AB). | BB allele), 0.13 (BB | AB allele), and 0 (BB | BB allele) are central. FIG. 30D shows a plot generated when one chromosome is present and the fetal fraction is 26%. Hallmark patterns of one outer red and one outer blue peripheral band, as well as two central green bands, showed maternal genetic monosomy (color not shown in the figure). Since the fetus contributes only to a single allele (A or B) to the allele read, there are no inner peripheral red and blue bands and the central triplet band is compressed into two bands. (Colors are not shown in the figure). The bands are centered around 1 (AA | A allele), 0.57 (AB | A allele), 0.43 (AB | B allele), and 0 (BB | B allele). FIG. 30E is a plot generated when there are 3 chromosomes and the fetal fraction is 27%. This pattern of two red and two blue peripheral bands and two central green bands indicates maternal inherited meiotic trisomy (colors not shown in the figure). The bands are 1 (AA | AAA allele), 0.88 (AA | AAB allele), 0.56 (AB | AAB allele), 0.44 (AB | ABB allele), 0.12 (BB). | ABB allele) and 0 (BB | BBB allele). FIG. 30F is a plot generated when 3 chromosomes are present and the fetal fraction is 14%. This pattern of three red and three blue peripheral bands, as well as two central green bands, indicates paternal inherited meiotic trisomy (colors not shown in the figure). The bands are 1 (AA | AAA alligator gene), 0.93 (AA | AAB allelic gene), 0.87 (AA | ABB allelic gene), 0.60 (AB | AAA allelic gene), 0.53 (AB). | AAB allelic gene), 0.47 (AB | ABB allelic gene), 0.40 (AB | BBB allelic gene), 0.13 (BB | AAB allelic gene), 0.07 (BB | ABB allelic gene), And 0 (BB | BBB allogeneic gene) are central. FIG. 30G is a plot generated when there are 3 chromosomes and the fetal fraction is 35%. This pattern of two red and two blue peripheral bands and four green bands indicates maternally inherited mitotic trisomy (color not shown in the figure). The bands are 1 (AA | AAA allele), 0.85 (AA | AAB allele), 0.72 (AB | AAA allele), 0.57 (AB | AAB allele), 0.43 (AB). | ABB allele), 0.28 (AB | BBB allele), 0.15 (BB | ABB allele), and 0 (BB | BBB allele) are central. FIG. 30H is a plot generated when 3 chromosomes are present and the fetal fraction is 25%. This pattern of two red and two blue peripheral bands, as well as four central green bands, indicates paternally inherited mitotic trisomy (colors not shown in the figure). This pattern can be distinguished from the pattern of maternally inherited mitotic trisomy (as in FIG. 30G) by the position of the medial peripheral band. Specifically, the bands are 1 (AA | AAA allele), 0.78 (AA | ABB allele), 0.67 (AB | AAA allele), 0.56 (AB | AAB allele), It is centered on 0.44 (AB | ABB allele), 0.33 (AB | BBB allele), 0.22 (BB | AAB allele), and 0 (BB | BBB allele). 図30A~30H:正倍数性(図30A~30C)、モノソミー(図30D)、およびトリソミー(図30E~30H)の代表的なグラフ表示である。全プロットでx軸は、それぞれの染色体(プロットの下部に示す)に沿った個別多形遺伝子座のリニア位置、およびy軸は、合計(A+B)対立遺伝子リード中の割合としてA対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるy軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がAAの母系遺伝子型を示し、青色がBBの母系遺伝子型を示し、緑色がABの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がAAで胎児がABである対立遺伝子の場合にAA|ABのように、母系|胎児の形式で表される。図30Aは、2個の染色体が存在し、胎児のcfDNA画分が0%である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、1(AA対立遺伝子)、0.5(AB対立遺伝子)、および0(BB対立遺伝子)を中心として分布する。図30Bは、2個の染色体が存在し、胎児画分が12%の場合に生成するプロットを示す。A対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がy軸に沿って上下に移動する。そのために、バンドは、1(AA|AA対立遺伝子)、0.94(AA|AB対立遺伝子)、0.56(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.44(AB|BB対立遺伝子)、0.06(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心になる。図30Cは、2個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。2本の赤色と2本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる(色は図には示されていない)。バンドは、1(AA|AA対立遺伝子)、0.87(AA|AB対立遺伝子)、0.63(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.37(AB|BB対立遺伝子)、0.13(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心となる。図30Dは、1個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。1本の外側赤色および1本の外側青色周辺バンド、ならびに、2本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した(色は図には示されていない)。胎児は対立遺伝子リードに対し、単一対立遺伝子(AまたはB)のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、2本のバンドに圧縮される(色は図には示されていない)。バンドは、1(AA|A対立遺伝子)、0.57(AB|A対立遺伝子)、0.43(AB|B対立遺伝子)、および0(BB|B対立遺伝子)が中心である。図30Eは、3個の染色体が存在し、胎児画分が27%の場合に生成されたプロットである。2本の赤色および2本の青色周辺バンドならびに2本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.88(AA|AAB対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.12(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)を中心とする。図30Fは、3個の染色体が存在し、胎児画分が14%の場合に生成したプロットである。3本の赤色と3本の青色周辺バンド、ならびに2本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.93(AA|AAB対立遺伝子)、0.87(AA|ABB対立遺伝子)、0.60(AB|AAA対立遺伝子)、0.53(AB|AAB対立遺伝子)、0.47(AB|ABB対立遺伝子)、0.40(AB|BBB対立遺伝子)、0.13(BB|AAB対立遺伝子)、0.07(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Gは、3個の染色体が存在し、胎児画分が35%の場合に生成されたプロットである。2本の赤色と2本の青色周辺バンドおよび4本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.85(AA|AAB対立遺伝子)、0.72(AB|AAA対立遺伝子)、0.57(AB|AAB対立遺伝子)、0.43(AB|ABB対立遺伝子)、0.28(AB|BBB対立遺伝子)、0.15(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Hは、3個の染色体が存在し、胎児画分が25%の場合に生成したプロットである。2本の赤色と2本の青色周辺バンド、ならびに、4本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。このパターンは、母系遺伝有糸分裂トリソミー(図30Gのような)のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、1(AA|AAA対立遺伝子)、0.78(AA|ABB対立遺伝子)、0.67(AB|AAA対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.33(AB|BBB対立遺伝子)、0.22(BB|AAB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。30A-30H: Representative graph representations of positive ploidy (FIGS. 30A-30C), monosomy (FIGS. 30D), and trisomy (FIGS. 30E-30H). In all plots, the x-axis is the linear position of the individual polymorphic locus along each chromosome (shown at the bottom of the plot), and the y-axis is the number of A allele reads as a percentage of the total (A + B) allele reads. Represents. Maternal and fetal genotypes, as well as the location of the y-axis at the center of the band, are shown on the right side of the plot. If necessary, the plots are color coded according to maternal genotype so that red indicates the maternal genotype of AA, blue indicates the maternal genotype of BB, and green indicates the maternal genotype of AB. May be good. If desired, the contribution of the maternal allele may be indicated by color in the "fetal genotype" column. Allele contributions are expressed in the form of maternal | fetus, such as AA | AB in the case of alleles where the mother is AA and the fetus is AB. FIG. 30A is a plot generated when two chromosomes are present and the fetal cfDNA fraction is 0%. This plot is from a non-pregnant woman and therefore represents a pattern when the genotype is completely maternal. Therefore, allele clusters are distributed around 1 (AA allele), 0.5 (AB allele), and 0 (BB allele). FIG. 30B shows a plot produced when two chromosomes are present and the fetal fraction is 12%. The contribution of fetal alleles to the proportion of A allele reads causes the positions of some allele spots to move up and down along the y-axis. Therefore, the bands are 1 (AA | AA allele), 0.94 (AA | AB allele), 0.56 (AB | AA allele), 0.50 (AB | AB allele), 0. 44 (AB | BB allele), 0.06 (BB | AB allele), and 0 (BB | BB allele) are central. FIG. 30C shows a plot generated when two chromosomes are present and the fetal fraction is 26%. A pattern containing two red and two blue peripheral bands and a triplet of central green bands is readily visible (colors not shown in the figure). The bands are 1 (AA | AA allele), 0.87 (AA | AB allele), 0.63 (AB | AA allele), 0.50 (AB | AB allele), 0.37 (AB). | BB allele), 0.13 (BB | AB allele), and 0 (BB | BB allele) are central. FIG. 30D shows a plot generated when one chromosome is present and the fetal fraction is 26%. Hallmark patterns of one outer red and one outer blue peripheral band, as well as two central green bands, showed maternal genetic monosomy (color not shown in the figure). Since the fetus contributes only to a single allele (A or B) to the allele read, there are no inner peripheral red and blue bands and the central triplet band is compressed into two bands. (Colors are not shown in the figure). The bands are centered around 1 (AA | A allele), 0.57 (AB | A allele), 0.43 (AB | B allele), and 0 (BB | B allele). FIG. 30E is a plot generated when there are 3 chromosomes and the fetal fraction is 27%. This pattern of two red and two blue peripheral bands and two central green bands indicates maternal inherited meiotic trisomy (colors not shown in the figure). The bands are 1 (AA | AAA allele), 0.88 (AA | AAB allele), 0.56 (AB | AAB allele), 0.44 (AB | ABB allele), 0.12 (BB). | ABB allele) and 0 (BB | BBB allele). FIG. 30F is a plot generated when 3 chromosomes are present and the fetal fraction is 14%. This pattern of three red and three blue peripheral bands, as well as two central green bands, indicates paternal inherited meiotic trisomy (colors not shown in the figure). The bands are 1 (AA | AAA alligator gene), 0.93 (AA | AAB allelic gene), 0.87 (AA | ABB allelic gene), 0.60 (AB | AAA allelic gene), 0.53 (AB). | AAB allelic gene), 0.47 (AB | ABB allelic gene), 0.40 (AB | BBB allelic gene), 0.13 (BB | AAB allelic gene), 0.07 (BB | ABB allelic gene), And 0 (BB | BBB allogeneic gene) are central. FIG. 30G is a plot generated when there are 3 chromosomes and the fetal fraction is 35%. This pattern of two red and two blue peripheral bands and four green bands indicates maternally inherited mitotic trisomy (color not shown in the figure). The bands are 1 (AA | AAA allele), 0.85 (AA | AAB allele), 0.72 (AB | AAA allele), 0.57 (AB | AAB allele), 0.43 (AB). | ABB allele), 0.28 (AB | BBB allele), 0.15 (BB | ABB allele), and 0 (BB | BBB allele) are central. FIG. 30H is a plot generated when 3 chromosomes are present and the fetal fraction is 25%. This pattern of two red and two blue peripheral bands, as well as four central green bands, indicates paternally inherited mitotic trisomy (colors not shown in the figure). This pattern can be distinguished from the pattern of maternally inherited mitotic trisomy (as in FIG. 30G) by the position of the medial peripheral band. Specifically, the bands are 1 (AA | AAA allele), 0.78 (AA | ABB allele), 0.67 (AB | AAA allele), 0.56 (AB | AAB allele), It is centered on 0.44 (AB | ABB allele), 0.33 (AB | BBB allele), 0.22 (BB | AAB allele), and 0 (BB | BBB allele). 図30A~30H:正倍数性(図30A~30C)、モノソミー(図30D)、およびトリソミー(図30E~30H)の代表的なグラフ表示である。全プロットでx軸は、それぞれの染色体(プロットの下部に示す)に沿った個別多形遺伝子座のリニア位置、およびy軸は、合計(A+B)対立遺伝子リード中の割合としてA対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるy軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がAAの母系遺伝子型を示し、青色がBBの母系遺伝子型を示し、緑色がABの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がAAで胎児がABである対立遺伝子の場合にAA|ABのように、母系|胎児の形式で表される。図30Aは、2個の染色体が存在し、胎児のcfDNA画分が0%である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、1(AA対立遺伝子)、0.5(AB対立遺伝子)、および0(BB対立遺伝子)を中心として分布する。図30Bは、2個の染色体が存在し、胎児画分が12%の場合に生成するプロットを示す。A対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がy軸に沿って上下に移動する。そのために、バンドは、1(AA|AA対立遺伝子)、0.94(AA|AB対立遺伝子)、0.56(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.44(AB|BB対立遺伝子)、0.06(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心になる。図30Cは、2個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。2本の赤色と2本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる(色は図には示されていない)。バンドは、1(AA|AA対立遺伝子)、0.87(AA|AB対立遺伝子)、0.63(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.37(AB|BB対立遺伝子)、0.13(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心となる。図30Dは、1個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。1本の外側赤色および1本の外側青色周辺バンド、ならびに、2本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した(色は図には示されていない)。胎児は対立遺伝子リードに対し、単一対立遺伝子(AまたはB)のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、2本のバンドに圧縮される(色は図には示されていない)。バンドは、1(AA|A対立遺伝子)、0.57(AB|A対立遺伝子)、0.43(AB|B対立遺伝子)、および0(BB|B対立遺伝子)が中心である。図30Eは、3個の染色体が存在し、胎児画分が27%の場合に生成されたプロットである。2本の赤色および2本の青色周辺バンドならびに2本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.88(AA|AAB対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.12(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)を中心とする。図30Fは、3個の染色体が存在し、胎児画分が14%の場合に生成したプロットである。3本の赤色と3本の青色周辺バンド、ならびに2本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.93(AA|AAB対立遺伝子)、0.87(AA|ABB対立遺伝子)、0.60(AB|AAA対立遺伝子)、0.53(AB|AAB対立遺伝子)、0.47(AB|ABB対立遺伝子)、0.40(AB|BBB対立遺伝子)、0.13(BB|AAB対立遺伝子)、0.07(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Gは、3個の染色体が存在し、胎児画分が35%の場合に生成されたプロットである。2本の赤色と2本の青色周辺バンドおよび4本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.85(AA|AAB対立遺伝子)、0.72(AB|AAA対立遺伝子)、0.57(AB|AAB対立遺伝子)、0.43(AB|ABB対立遺伝子)、0.28(AB|BBB対立遺伝子)、0.15(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Hは、3個の染色体が存在し、胎児画分が25%の場合に生成したプロットである。2本の赤色と2本の青色周辺バンド、ならびに、4本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。このパターンは、母系遺伝有糸分裂トリソミー(図30Gのような)のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、1(AA|AAA対立遺伝子)、0.78(AA|ABB対立遺伝子)、0.67(AB|AAA対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.33(AB|BBB対立遺伝子)、0.22(BB|AAB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。30A-30H: Representative graph representations of positive ploidy (FIGS. 30A-30C), monosomy (FIGS. 30D), and trisomy (FIGS. 30E-30H). In all plots, the x-axis is the linear position of the individual polymorphic locus along each chromosome (shown at the bottom of the plot), and the y-axis is the number of A allele reads as a percentage of the total (A + B) allele reads. Represents. Maternal and fetal genotypes, as well as the location of the y-axis at the center of the band, are shown on the right side of the plot. If necessary, the plots are color coded according to maternal genotype so that red indicates the maternal genotype of AA, blue indicates the maternal genotype of BB, and green indicates the maternal genotype of AB. May be good. If desired, the contribution of the maternal allele may be indicated by color in the "fetal genotype" column. Allele contributions are expressed in the form of maternal | fetus, such as AA | AB in the case of alleles where the mother is AA and the fetus is AB. FIG. 30A is a plot generated when two chromosomes are present and the fetal cfDNA fraction is 0%. This plot is from a non-pregnant woman and therefore represents a pattern when the genotype is completely maternal. Therefore, allele clusters are distributed around 1 (AA allele), 0.5 (AB allele), and 0 (BB allele). FIG. 30B shows a plot produced when two chromosomes are present and the fetal fraction is 12%. The contribution of fetal alleles to the proportion of A allele reads causes the position of some allele spots to move up and down along the y-axis. Therefore, the bands are 1 (AA | AA allele), 0.94 (AA | AB allele), 0.56 (AB | AA allele), 0.50 (AB | AB allele), 0. 44 (AB | BB allele), 0.06 (BB | AB allele), and 0 (BB | BB allele) are central. FIG. 30C shows a plot generated when two chromosomes are present and the fetal fraction is 26%. A pattern containing two red and two blue peripheral bands and a triplet of central green bands is readily visible (colors not shown in the figure). The bands are 1 (AA | AA allele), 0.87 (AA | AB allele), 0.63 (AB | AA allele), 0.50 (AB | AB allele), 0.37 (AB). | BB allele), 0.13 (BB | AB allele), and 0 (BB | BB allele) are central. FIG. 30D shows a plot generated when one chromosome is present and the fetal fraction is 26%. Hallmark patterns of one outer red and one outer blue peripheral band, as well as two central green bands, showed maternal genetic monosomy (color not shown in the figure). Since the fetus contributes only to a single allele (A or B) to the allele read, there are no inner peripheral red and blue bands and the central triplet band is compressed into two bands. (Colors are not shown in the figure). The bands are centered on 1 (AA | A allele), 0.57 (AB | A allele), 0.43 (AB | B allele), and 0 (BB | B allele). FIG. 30E is a plot generated when there are 3 chromosomes and the fetal fraction is 27%. This pattern of two red and two blue peripheral bands and two central green bands indicates maternal inherited meiotic trisomy (colors not shown in the figure). The bands are 1 (AA | AAA allele), 0.88 (AA | AAB allele), 0.56 (AB | AAB allele), 0.44 (AB | ABB allele), 0.12 (BB). | ABB allele) and 0 (BB | BBB allele). FIG. 30F is a plot generated when 3 chromosomes are present and the fetal fraction is 14%. This pattern of three red and three blue peripheral bands, as well as two central green bands, indicates paternal inherited meiotic trisomy (colors not shown in the figure). The bands are 1 (AA | AAA alligator gene), 0.93 (AA | AAB allelic gene), 0.87 (AA | ABB allelic gene), 0.60 (AB | AAA allelic gene), 0.53 (AB). | AAB allelic gene), 0.47 (AB | ABB allelic gene), 0.40 (AB | BBB allelic gene), 0.13 (BB | AAB allelic gene), 0.07 (BB | ABB allelic gene), And 0 (BB | BBB allogeneic gene) are central. FIG. 30G is a plot generated when there are 3 chromosomes and the fetal fraction is 35%. This pattern of two red and two blue peripheral bands and four green bands indicates maternally inherited mitotic trisomy (color not shown in the figure). The bands are 1 (AA | AAA allele), 0.85 (AA | AAB allele), 0.72 (AB | AAA allele), 0.57 (AB | AAB allele), 0.43 (AB). | ABB allele), 0.28 (AB | BBB allele), 0.15 (BB | ABB allele), and 0 (BB | BBB allele) are central. FIG. 30H is a plot generated when 3 chromosomes are present and the fetal fraction is 25%. This pattern of two red and two blue peripheral bands, as well as four central green bands, indicates paternally inherited mitotic trisomy (colors not shown in the figure). This pattern can be distinguished from the pattern of maternally inherited mitotic trisomy (as in FIG. 30G) by the position of the medial peripheral band. Specifically, the bands are 1 (AA | AAA allele), 0.78 (AA | ABB allele), 0.67 (AB | AAA allele), 0.56 (AB | AAB allele), It is centered on 0.44 (AB | ABB allele), 0.33 (AB | BBB allele), 0.22 (BB | AAB allele), and 0 (BB | BBB allele). 図30A~30H:正倍数性(図30A~30C)、モノソミー(図30D)、およびトリソミー(図30E~30H)の代表的なグラフ表示である。全プロットでx軸は、それぞれの染色体(プロットの下部に示す)に沿った個別多形遺伝子座のリニア位置、およびy軸は、合計(A+B)対立遺伝子リード中の割合としてA対立遺伝子リード数を表す。母系および胎児の遺伝子型、ならびに、バンドの中心となるy軸の位置はプロットの右側に示されている。見やすくする必要があれば、赤色がAAの母系遺伝子型を示し、青色がBBの母系遺伝子型を示し、緑色がABの母系遺伝子型を示すように、母系遺伝子型に応じてプロットを色分けしてもよい。必要があれば、母系対立遺伝子の寄与を「胎児の遺伝子型」の列中に色で示してもよい。対立遺伝子の寄与は、母がAAで胎児がABである対立遺伝子の場合にAA|ABのように、母系|胎児の形式で表される。図30Aは、2個の染色体が存在し、胎児のcfDNA画分が0%である場合に生成したプロットである。このプロットは非妊婦由来であり、従って、遺伝子型が完全に母系である場合のパターンを表す。従って、対立遺伝子クラスターは、1(AA対立遺伝子)、0.5(AB対立遺伝子)、および0(BB対立遺伝子)を中心として分布する。図30Bは、2個の染色体が存在し、胎児画分が12%の場合に生成するプロットを示す。A対立遺伝子リードの割合に対する胎児の対立遺伝子の寄与により、一部の対立遺伝子スポットの位置がy軸に沿って上下に移動する。そのために、バンドは、1(AA|AA対立遺伝子)、0.94(AA|AB対立遺伝子)、0.56(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.44(AB|BB対立遺伝子)、0.06(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心になる。図30Cは、2個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。2本の赤色と2本の青色の周辺バンドおよび三つ組の中央の緑色のバンドを含むパターンが容易に見てとれる(色は図には示されていない)。バンドは、1(AA|AA対立遺伝子)、0.87(AA|AB対立遺伝子)、0.63(AB|AA対立遺伝子)、0.50(AB|AB対立遺伝子)、0.37(AB|BB対立遺伝子)、0.13(BB|AB対立遺伝子)、および0(BB|BB対立遺伝子)が中心となる。図30Dは、1個の染色体が存在し、胎児画分が26%の場合に生成したプロットを示す。1本の外側赤色および1本の外側青色周辺バンド、ならびに、2本の中央部の緑色のバンドのホールマークパターンは、母系遺伝モノソミーを示した(色は図には示されていない)。胎児は対立遺伝子リードに対し、単一対立遺伝子(AまたはB)のみに寄与するので、内側の周辺部の赤色および青色バンドは存在せず、中央部の三つ組バンドは、2本のバンドに圧縮される(色は図には示されていない)。バンドは、1(AA|A対立遺伝子)、0.57(AB|A対立遺伝子)、0.43(AB|B対立遺伝子)、および0(BB|B対立遺伝子)が中心である。図30Eは、3個の染色体が存在し、胎児画分が27%の場合に生成されたプロットである。2本の赤色および2本の青色周辺バンドならびに2本の中心部緑色のバンドのこのパターンは、母系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.88(AA|AAB対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.12(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)を中心とする。図30Fは、3個の染色体が存在し、胎児画分が14%の場合に生成したプロットである。3本の赤色と3本の青色周辺バンド、ならびに2本の中心部緑色バンドのこのパターンは、父系遺伝減数分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.93(AA|AAB対立遺伝子)、0.87(AA|ABB対立遺伝子)、0.60(AB|AAA対立遺伝子)、0.53(AB|AAB対立遺伝子)、0.47(AB|ABB対立遺伝子)、0.40(AB|BBB対立遺伝子)、0.13(BB|AAB対立遺伝子)、0.07(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Gは、3個の染色体が存在し、胎児画分が35%の場合に生成されたプロットである。2本の赤色と2本の青色周辺バンドおよび4本の緑色バンドのこのパターンは、母系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。バンドは、1(AA|AAA対立遺伝子)、0.85(AA|AAB対立遺伝子)、0.72(AB|AAA対立遺伝子)、0.57(AB|AAB対立遺伝子)、0.43(AB|ABB対立遺伝子)、0.28(AB|BBB対立遺伝子)、0.15(BB|ABB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。図30Hは、3個の染色体が存在し、胎児画分が25%の場合に生成したプロットである。2本の赤色と2本の青色周辺バンド、ならびに、4本の中心部の緑色のバンドのこのパターンは、父系遺伝有糸分裂トリソミーを示す(色は図には示されていない)。このパターンは、母系遺伝有糸分裂トリソミー(図30Gのような)のパターンとは、内側周辺バンドの位置により識別できる。具体的には、バンドは、1(AA|AAA対立遺伝子)、0.78(AA|ABB対立遺伝子)、0.67(AB|AAA対立遺伝子)、0.56(AB|AAB対立遺伝子)、0.44(AB|ABB対立遺伝子)、0.33(AB|BBB対立遺伝子)、0.22(BB|AAB対立遺伝子)、および0(BB|BBB対立遺伝子)が中心である。30A-30H: Representative graph representations of positive ploidy (FIGS. 30A-30C), monosomy (FIGS. 30D), and trisomy (FIGS. 30E-30H). In all plots, the x-axis is the linear position of the individual polymorphic locus along each chromosome (shown at the bottom of the plot), and the y-axis is the number of A allele reads as a percentage of the total (A + B) allele reads. Represents. Maternal and fetal genotypes, as well as the location of the y-axis at the center of the band, are shown on the right side of the plot. If necessary, the plots are color coded according to maternal genotype so that red indicates the maternal genotype of AA, blue indicates the maternal genotype of BB, and green indicates the maternal genotype of AB. May be good. If desired, the contribution of the maternal allele may be indicated by color in the "fetal genotype" column. Allele contributions are expressed in the form of maternal | fetus, such as AA | AB in the case of alleles where the mother is AA and the fetus is AB. FIG. 30A is a plot generated when two chromosomes are present and the fetal cfDNA fraction is 0%. This plot is from a non-pregnant woman and therefore represents a pattern when the genotype is completely maternal. Therefore, allele clusters are distributed around 1 (AA allele), 0.5 (AB allele), and 0 (BB allele). FIG. 30B shows a plot produced when two chromosomes are present and the fetal fraction is 12%. The contribution of fetal alleles to the proportion of A allele reads causes the position of some allele spots to move up and down along the y-axis. Therefore, the bands are 1 (AA | AA allele), 0.94 (AA | AB allele), 0.56 (AB | AA allele), 0.50 (AB | AB allele), 0. 44 (AB | BB allele), 0.06 (BB | AB allele), and 0 (BB | BB allele) are central. FIG. 30C shows a plot generated when two chromosomes are present and the fetal fraction is 26%. A pattern containing two red and two blue peripheral bands and a triplet of central green bands is readily visible (colors not shown in the figure). The bands are 1 (AA | AA allele), 0.87 (AA | AB allele), 0.63 (AB | AA allele), 0.50 (AB | AB allele), 0.37 (AB). | BB allele), 0.13 (BB | AB allele), and 0 (BB | BB allele) are central. FIG. 30D shows a plot generated when one chromosome is present and the fetal fraction is 26%. Hallmark patterns of one outer red and one outer blue peripheral band, as well as two central green bands, showed maternal genetic monosomy (color not shown in the figure). Since the fetus contributes only to a single allele (A or B) to the allele read, there are no inner peripheral red and blue bands and the central triplet band is compressed into two bands. (Colors are not shown in the figure). The bands are centered around 1 (AA | A allele), 0.57 (AB | A allele), 0.43 (AB | B allele), and 0 (BB | B allele). FIG. 30E is a plot generated when there are 3 chromosomes and the fetal fraction is 27%. This pattern of two red and two blue peripheral bands and two central green bands indicates maternal inherited meiotic trisomy (colors not shown in the figure). The bands are 1 (AA | AAA allele), 0.88 (AA | AAB allele), 0.56 (AB | AAB allele), 0.44 (AB | ABB allele), 0.12 (BB). | ABB allele) and 0 (BB | BBB allele). FIG. 30F is a plot generated when 3 chromosomes are present and the fetal fraction is 14%. This pattern of three red and three blue peripheral bands, as well as two central green bands, indicates paternal inherited meiotic trisomy (colors not shown in the figure). The bands are 1 (AA | AAA alligator gene), 0.93 (AA | AAB allelic gene), 0.87 (AA | ABB allelic gene), 0.60 (AB | AAA allelic gene), 0.53 (AB). | AAB allelic gene), 0.47 (AB | ABB allelic gene), 0.40 (AB | BBB allelic gene), 0.13 (BB | AAB allelic gene), 0.07 (BB | ABB allelic gene), And 0 (BB | BBB allogeneic gene) are central. FIG. 30G is a plot generated when there are 3 chromosomes and the fetal fraction is 35%. This pattern of two red and two blue peripheral bands and four green bands indicates maternally inherited mitotic trisomy (color not shown in the figure). The bands are 1 (AA | AAA allele), 0.85 (AA | AAB allele), 0.72 (AB | AAA allele), 0.57 (AB | AAB allele), 0.43 (AB). | ABB allele), 0.28 (AB | BBB allele), 0.15 (BB | ABB allele), and 0 (BB | BBB allele) are central. FIG. 30H is a plot generated when 3 chromosomes are present and the fetal fraction is 25%. This pattern of two red and two blue peripheral bands, as well as four central green bands, indicates paternally inherited mitotic trisomy (colors not shown in the figure). This pattern can be distinguished from the pattern of maternally inherited mitotic trisomy (as in FIG. 30G) by the position of the medial peripheral band. Specifically, the bands are 1 (AA | AAA allele), 0.78 (AA | ABB allele), 0.67 (AB | AAA allele), 0.56 (AB | AAB allele), It is centered on 0.44 (AB | ABB allele), 0.33 (AB | BBB allele), 0.22 (BB | AAB allele), and 0 (BB | BBB allele). 図31:正倍数体(図31A)、T13(図31B)、T18(図31C)、T21(図31D)、45、X(図31E)、および47、XXY(図31F)試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、x軸は、それぞれの染色体に沿ったSNPのリニア位置を表し、y軸は、合計リードに対する割合で表したA対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一SNP遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。FIG. 31: Graph display of positive polyploid (FIG. 31A), T13 (FIG. 31B), T18 (FIG. 31C), T21 (FIG. 31D), 45, X (FIG. 31E), and 47, XXY (FIG. 31F) test samples. Is. Each chromosome is shown at the top of the plot, the fetal and maternal genotypes are shown on the right side of the plot, the x-axis represents the linear position of the SNP along each chromosome, and the y-axis represents the ratio to the total read. A Shows the number of allele reads. Note that the cluster position is changed based on the fetal fraction as described herein. Each spot represents a single SNP locus. Fetal and maternal genotypes are shown on the right side of the plot, and chromosomal identification information is shown at the top of the plot. 図31:正倍数体(図31A)、T13(図31B)、T18(図31C)、T21(図31D)、45、X(図31E)、および47、XXY(図31F)試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、x軸は、それぞれの染色体に沿ったSNPのリニア位置を表し、y軸は、合計リードに対する割合で表したA対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一SNP遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。FIG. 31: Graph display of positive polyploid (FIG. 31A), T13 (FIG. 31B), T18 (FIG. 31C), T21 (FIG. 31D), 45, X (FIG. 31E), and 47, XXY (FIG. 31F) test samples. Is. Each chromosome is shown at the top of the plot, the fetal and maternal genotypes are shown on the right side of the plot, the x-axis represents the linear position of the SNP along each chromosome, and the y-axis represents the ratio to the total read. A Shows the number of allele reads. Note that the cluster position is changed based on the fetal fraction as described herein. Each spot represents a single SNP locus. Fetal and maternal genotypes are shown on the right side of the plot, and chromosomal identification information is shown at the top of the plot. 図31:正倍数体(図31A)、T13(図31B)、T18(図31C)、T21(図31D)、45、X(図31E)、および47、XXY(図31F)試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、x軸は、それぞれの染色体に沿ったSNPのリニア位置を表し、y軸は、合計リードに対する割合で表したA対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一SNP遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。FIG. 31: Graph display of positive polyploid (FIG. 31A), T13 (FIG. 31B), T18 (FIG. 31C), T21 (FIG. 31D), 45, X (FIG. 31E), and 47, XXY (FIG. 31F) test samples. Is. Each chromosome is shown at the top of the plot, the fetal and maternal genotypes are shown on the right side of the plot, the x-axis represents the linear position of the SNP along each chromosome, and the y-axis represents the ratio to the total read. A Shows the number of allele reads. Note that the cluster position is changed based on the fetal fraction as described herein. Each spot represents a single SNP locus. Fetal and maternal genotypes are shown on the right side of the plot, and chromosomal identification information is shown at the top of the plot. 図31:正倍数体(図31A)、T13(図31B)、T18(図31C)、T21(図31D)、45、X(図31E)、および47、XXY(図31F)試験試料のグラフ表示である。それぞれの染色体を、プロットの上端に、胎児と母系遺伝子型をプロットの右側に示し、x軸は、それぞれの染色体に沿ったSNPのリニア位置を表し、y軸は、合計リードに対する割合で表したA対立遺伝子リード数を示す。本明細書で記載のように、胎児画分に基づきクラスター位置を変化していることに留意されたい。それぞれのスポットは、単一SNP遺伝子座を表す。胎児および母系遺伝子型は、プロットの右側に示され、染色体の識別情報はプロットの上部に示す。FIG. 31: Graph display of positive polyploid (FIG. 31A), T13 (FIG. 31B), T18 (FIG. 31C), T21 (FIG. 31D), 45, X (FIG. 31E), and 47, XXY (FIG. 31F) test samples. Is. Each chromosome is shown at the top of the plot, the fetal and maternal genotypes are shown on the right side of the plot, the x-axis represents the linear position of the SNP along each chromosome, and the y-axis represents the ratio to the total read. A Shows the number of allele reads. Note that the cluster position is changed based on the fetal fraction as described herein. Each spot represents a single SNP locus. Fetal and maternal genotypes are shown on the right side of the plot, and chromosomal identification information is shown at the top of the plot. 性染色体異数性による複合出生有病率は、常染色体異数性による場合より高いことを示すグラフである。It is a graph which shows that the compound birth prevalence by sex chromosome aneuploidy is higher than the case by autosomal aneuploidy.

上記の図は、ここで開示されている実施形態がについて説明しているが、考察において言及されている通り、他の実施形態も意図されている。本開示は、例示により実施形態を代表として示しており、限定として示しているのではない。当業者は、ここで開示されている実施形態の原理の範囲および趣旨の範囲内に入る多数の他の改変および実施形態を考案することができる。 The above figure describes the embodiments disclosed herein, but other embodiments are also intended, as mentioned in the discussion. The present disclosure exemplifies the embodiments as representatives, and is not shown as a limitation. One of ordinary skill in the art can devise a number of other modifications and embodiments that fall within the scope and intent of the embodiments disclosed herein.

本発明は、一部は、プライマーライブラリー中の相対的に少数に過ぎないプライマーが多重PCR反応中に形成される相当量の増幅プライマー二量体生成の原因である場合が多いという予期しない発見に基づいている。候補プライマーライブラリーから除去する目的で最も望ましくないプライマーを選択する方法が開発された。無視できる量(PCR産物の約0.1%)までプライマー二量体の量を減らすことにより、これらの方法は、生成したプライマーライブラリーを使ってただ1回の多重PCR反応で多数の標的遺伝子座を同時に増幅することを可能とする。プライマーは、標的遺伝子座にハイブリダイズし、他のプライマーにハイブリダイズして増幅されたプライマー二量体を形成することなく標的遺伝子座を増幅するので、増幅できる異なる標的遺伝子座の数が増加する。また、通常より低プライマー濃度およびかなり長いアニーリング時間を使うことにより、相互にハイブリダイズしてプライマー二量体を形成するのではなく、プライマーが標的遺伝子座にハイブリダイズする尤度が高まることも明らかになった。 The present invention is in part an unexpected finding that relatively few primers in the primer library are often responsible for the production of significant amounts of amplified primer dimers formed during multiplex PCR reactions. Is based on. A method has been developed to select the least desirable primers for removal from the candidate primer library. By reducing the amount of primer dimer to a negligible amount (about 0.1% of the PCR product), these methods use the generated primer library to generate a large number of target genes in a single multiplex PCR reaction. Allows the locus to be amplified at the same time. Primers hybridize to target loci and amplify target loci without forming amplified primer dimers by hybridizing to other primers, thus increasing the number of different target loci that can be amplified. .. It is also clear that using lower primer concentrations and significantly longer annealing times increases the likelihood that the primers will hybridize to the target locus rather than hybridize to each other to form primer dimers. Became.

PCR増幅およびゲノム試料中の19,488標的遺伝子座のシークエンシングの間に、これらの99.4~99.7%のシークエンシングリードがゲノムにマップされ、99.99%が標的遺伝子座にマップされた。1000万シークエンシングリードを有する血漿試料に対しては、通常、19,488標的遺伝子座の内の少なくとも19,350(99.3%)が増幅され、配列決定された。このような多数の標的遺伝子座を一度に同時増幅できることにより、数千の標的遺伝子座の解析に必要な時間とDNAの量を大幅に減らせる。例えば、インビトロ受精の前の胚由来の単一細胞の遺伝子検査または小量のDNAを含む法医学試料の遺伝子検査などのDNAの量が少ない用途で重要である数千の標的遺伝子座を同時に解析するために、単1細胞由来のDNAで充分である。さらに、標的遺伝子座を複数の別の反応に試料を分割しないで1反応体積(例えば、1つの容器またはウェル)で解析できることにより、反応中に起こり得る変動を減らせる。さらに、前記方法は、参照基準を使用し、異なる標的遺伝子座の間で起こる得る増幅の偏りを補正するように開発されている。例えば、GC含量などの因子に起因する標的遺伝子座間の増幅効率の差異により、実際は同じ量で産生されるべき標的遺伝子座のPCR産物の量が、異なった量になってしまう場合がある。標的遺伝子座に類似の参照基準の使用により、このような増幅の偏りを検出して、それを標的遺伝子座の定量化の間に補正することができる。 During PCR amplification and sequencing of 19,488 target loci in the genomic sample, 99.4-99.7% of these sequencing reads are mapped to the genome and 99.99% are mapped to the target loci. Was done. For plasma samples with 10 million sequencing reads, at least 19,350 (99.3%) of the 19,488 target loci were typically amplified and sequenced. The ability to simultaneously amplify such a large number of target loci at one time can significantly reduce the time and amount of DNA required to analyze thousands of target loci. Simultaneously analyze thousands of target loci that are important in low DNA applications, such as genetic testing of single cells from embryos prior to in vitro fertilization or genetic testing of forensic samples containing small amounts of DNA. Therefore, DNA derived from a single cell is sufficient. In addition, the ability to analyze the target locus in one reaction volume (eg, one vessel or well) without dividing the sample into multiple different reactions can reduce possible variability during the reaction. In addition, the method has been developed to use reference criteria to correct for possible amplification bias between different target loci. For example, due to differences in amplification efficiency between target loci due to factors such as GC content, the amount of PCR product at the target locus that should actually be produced in the same amount may be different. By using reference criteria similar to the target locus, such amplification bias can be detected and corrected during quantification of the target locus.

PCR産物のシークエンシング中に、プライマー二量体などのアーチファクトが検出され、その結果、標的増幅産物の検出を阻害する。この制限のために、ハイブリダイゼーションプローブを備えたマイクロアレイが検出用に使用される場合が多い。理由は、プライマー二量体の干渉に対する感度が低いためである。現状達成できる最小限の非標的増幅産物を含む高レベルの多重化により、マイクロアレイの代替としてPCRとそれに引き続くシークエンシングが使用可能となる。 During sequencing of PCR products, artifacts such as primer dimers are detected, resulting in inhibition of detection of target amplification products. Due to this limitation, microarrays with hybridization probes are often used for detection. The reason is that the sensitivity of the primer dimer to interference is low. High levels of multiplexing with minimal non-target amplification products that are currently achievable allow PCR and subsequent sequencing to be used as an alternative to microarrays.

本発明の多重PCR法は、多様な用途に使用可能である。例えば、遺伝子型分析、染色体異常(例えば、胎児染色体異数性)の検出、遺伝子変異および多型(例えば、一塩基多型、SNP)分析、遺伝子欠失分析、父子鑑定、集団内の遺伝的差異分析、法医学分析、疾患に対する素因測定、mRNAの定量分析、および感染病原体(例えば、細菌、寄生虫、およびウイルス)の検出と特定に使用可能である。また、多重PCR法は、無侵襲的出生前遺伝学的検査、例えば、父子鑑定または胎児染色体異常の検出用にも使用できる。 The multiplex PCR method of the present invention can be used for various purposes. For example, genotyping, detection of chromosomal abnormalities (eg, fetal chromosomal aneuploidy), gene mutations and polymorphisms (eg, single-base polymorphism, SNP) analysis, gene deletion analysis, paternal identification, genetic within a population. It can be used for aneuploidy analysis, forensic analysis, predisposition to disease, quantitative analysis of mRNA, and detection and identification of infectious agents (eg, bacteria, parasites, and viruses). Multiple PCR methods can also be used for non-invasive prenatal genetic testing, such as paternity testing or detection of fetal chromosomal abnormalities.

代表的プライマー設計法
高度多重PCRにより、多くの場合、プライマー二量体形成などの非生産的な副反応がもたらす産物DNAが非常に高い割合で産生され得る。ある実施形態では、非生産的な副反応を引き起こす可能性が最も高い特定のプライマーを、プライマーライブラリーから除去して、ゲノムにマッピングされる増幅されたDNAを高い割合でもたらすプライマーライブラリーを得ることができる。問題のあるプライマー、すなわち、特に二量体を安定させる可能性があるプライマーを除去するステップにより、予想外に、その後の配列決定による分析のための非常に高いPCR多重化レベルが可能になった。プライマー二量体および/または他の悪影響を及ぼす産物によって性能が著しく低下する配列決定などの系では、他に記載されている多重化よりも10倍超、50倍超、および100倍超高度な多重化が実現された。これは、過剰なプライマー二量体が感知できるほど結果に影響を及ぼさないプローブに基づく検出方法、例えば、マイクロアレイ、TAQMAN、PCRとは対照的であることに留意されたい。当技術分野における一般的な考えでは、配列決定するための多重化PCRは、同じウェルでは約100アッセイに限られることにも留意されたい。FluidigmおよびRain Danceは、1つの試料について並行した反応で48または1000のPCRアッセイを実施するためのプラットフォームを提供する。
Typical Primer Design Methods Advanced multiplex PCR can often produce very high proportions of product DNA resulting from non-productive side reactions such as primer dimer formation. In one embodiment, certain primers that are most likely to cause unproductive side reactions are removed from the primer library to obtain a primer library that yields a high percentage of amplified DNA that is mapped to the genome. be able to. The step of removing problematic primers, especially those that may stabilize the dimer, unexpectedly enabled very high PCR multiplexing levels for subsequent sequencing analysis. .. In systems such as sequencing where performance is significantly degraded by primer dimers and / or other adverse products, they are more than 10 times, more than 50 times, and more than 100 times more sophisticated than the multiplexing described elsewhere. Multiplexing has been achieved. Note that this is in contrast to probe-based detection methods, such as microarrays, TAQMAN, PCR, where excess primer dimers do not perceptibly affect results. It should also be noted that the general idea in the art is that multiplexed PCR for sequencing is limited to about 100 assays in the same well. Fluidim and Rain Dance provide a platform for performing 48 or 1000 PCR assays in parallel reactions on a single sample.

非マッピングプライマー二量体または他の悪影響を及ぼすプライマー産物の量を最小限にしたライブラリーのためのプライマーを選択するためのいくつもの方法が存在する。経験的なデータにより、少数の「悪い」プライマーは大量の非マッピングプライマー二量体副反応に関与することが示されている。これらの「悪い」プライマーを除去することにより、標的の遺伝子座に対して位置を決めるシーケンスリードのパーセントを上昇させることができる。「悪い」プライマーを同定するための1つの方法は、標的化増幅によって増幅されたDNAの配列決定データを調べることであり、最大の頻度で認められるプライマー二量体を除去して、ゲノムにマッピングされない副産物DNAをもたらす可能性が有意に低いプライマーライブラリーを生じることができる。種々のプライマーの組み合わせの結合エネルギーを算出することができる公的に入手可能なプログラムも存在し、結合エネルギーが最も高いプライマーの組み合わせを除去することにより、同様に、ゲノムにマッピングされない副産物DNAをもたらす可能性が有意に低いプライマーライブラリーが生じる。 There are a number of ways to select primers for libraries that minimize the amount of non-mapping primer dimers or other adversely affecting primer products. Empirical data have shown that a small number of "bad" primers are involved in large numbers of non-mapping primer dimer side reactions. Removal of these "bad" primers can increase the percentage of sequence reads that position the target locus. One way to identify "bad" primers is to examine the sequencing data of DNA amplified by targeted amplification, removing the most frequently found primer dimers and mapping them to the genome. It can result in a primer library that is significantly less likely to result in unsuccessful by-product DNA. There are also publicly available programs that can calculate the binding energies of various primer combinations, and removing the combination of primers with the highest binding energies also results in by-product DNA that is not mapped to the genome. A primer library is created that is significantly less likely.

プライマー選択のためのいくつかの実施形態では、初期の候補プライマーライブラリーは、候補標的遺伝子座に対する1個または複数個のプライマーまたはプライマー対を設計することにより作製される。候補標的遺伝子座(例えば、SNP)の集合は、標的集団内のSNPの頻度またはSNPのヘテロ接合率などの標的遺伝子座の所望のパラメータに関する公的に入手可能な情報に基づいて選択できる。一実施形態では、PCRプライマーは、Primer3プログラム(primer3.sourceforge.netのworldwide web;libprimer3 release 2.2.3、(参照によりその全体が本明細書に組み込まれる))を使って設計できる。必要に応じ、プライマーは、特定のアニーリング温度範囲内でアニールするように、特定の範囲のGC含量となるように、特定のサイズ範囲に入るように、特定のサイズ範囲の標的増幅産物を産生するように、および/または他のパラメータ特性を有するように設計できる。候補標的遺伝子座当たり複数プライマーまたはプライマー対から出発することにより、ライブラリー中にほとんどのまたは全ての標的遺伝子座に対するプライマーまたはプライマー対が残る尤度を高める。一実施形態では、選択基準は、標的遺伝子座当たり少なくとも1個のプライマー対がライブラリー中に残ることが必要であるということであってもよい。そのようにして、最終プライマーライブラリーを使うことにより、ほとんどまたは全ての標的遺伝子座が増幅されるであろう。これは、欠失の選別またはゲノム中の多数の部位での複製または疾患または疾患の危険性の増加に関連する多数の配列(例えば、多型または他の変異)の選別などの用途にとって望ましい。ライブラリー由来のプライマー対が別のプライマー対により生成された標的増幅産物と重複する標的増幅産物を生成する場合には、プライマー対の片方をライブラリーから取り除き、干渉を防止できる。 In some embodiments for primer selection, an initial candidate primer library is made by designing one or more primers or primer pairs for a candidate target locus. The set of candidate target loci (eg, SNPs) can be selected based on publicly available information about the desired parameters of the target loci, such as the frequency of SNPs within the target population or the heterozygous rate of SNPs. In one embodiment, PCR primers can be designed using the Primer3 program (primer3.sourceforge.net worldwide web; libprimer3 release 2.2.3, which is incorporated herein by reference in its entirety). If necessary, the primer produces a target amplification product in a specific size range, such as annealing within a specific annealing temperature range, a specific range of GC content, and a specific size range. And / or can be designed to have other parameter characteristics. Starting with multiple primers or primer pairs per candidate target locus increases the likelihood that primers or primer pairs will remain in the library for most or all target loci. In one embodiment, the selection criterion may be that at least one primer pair per target locus needs to remain in the library. As such, by using the final primer library, almost or all target loci will be amplified. This is desirable for applications such as selection of deletions or replication at multiple sites in the genome or selection of multiple sequences (eg, polymorphisms or other mutations) associated with an increased risk of disease or disease. If a primer pair from the library produces a target amplification product that overlaps with a target amplification product produced by another primer pair, one of the primer pairs can be removed from the library to prevent interference.

いくつかの実施形態では、「アンデザイアラビリティスコア」(より高いスコアが最小の望ましさを表す)が、候補プライマーライブラリー由来の2個のプライマーのほとんどまたは全ての可能な組み合わせに対し計算(コンピュータによる計算等で)される。種々の実施形態では、アンデザイアラビリティスコアは、ライブラリー中の候補プライマーの少なくとも80、90、95、98、99、または99.5%の可能な組み合わせに対して計算される。それぞれのアンデザイアラビリティスコアは、2個の候補プライマー間の二量体形成の尤度に少なくとも一部基づいている。必要に応じ、アンデザイアラビリティスコアはまた、標的遺伝子座のヘテロ接合率、標的遺伝子座での配列(例えば、多型)に関連する有病率、標的遺伝子座での配列(例えば、多型)に関連する疾患浸透度、候補プライマーの標的遺伝子座に対する特異性、候補プライマーのサイズ、標的増幅産物の融解温度、標的増幅産物のGC含量、標的増幅産物の増幅効率、および標的増幅産物のサイズからなる群から選択される1個または複数個の他のパラメータに基づいてもよい。複数の因子を考慮する場合、アンデザイアラビリティスコアは、種々のパラメータの加重平均に基づいて計算してもよい。パラメータは、プライマーが使われる特定の用途に対する重要性に基づいて異なる加重を割り付けることができる。いくつかの実施形態では、最高のアンデザイアラビリティスコアを有するプライマーは、ライブラリーから取り除かれる。取り除かれたプライマーが1つの標的遺伝子座にハイブリダイズするプライマー対のメンバーである場合、プライマー対のもう一方のメンバーもライブラリーから取り除くことができる。プライマーと取り除くプロセスは、必要に応じ繰り返すことができる。いくつかの実施形態では、ライブラリー中に残っている候補プライマーの組み合わせのアンデザイアラビリティスコアが全て最小閾値以下になるまでその選択方法が実行される。いくつかの実施形態では、その選択方法は、ライブラリー中に残っている候補プライマーの数が所望の数に減らされるまで実行される。 In some embodiments, an "undesignability score" (a higher score represents the least desirability) is calculated for most or all possible combinations of two primers from the candidate primer library (computer). (By calculation etc.). In various embodiments, the undesignability score is calculated for at least 80, 90, 95, 98, 99, or 99.5% possible combinations of candidate primers in the library. Each undesignability score is at least partially based on the likelihood of dimer formation between the two candidate primers. If desired, the undesignability score also includes heterozygotes at the target locus, prevalence associated with the sequence at the target locus (eg, polymorphism), sequence at the target locus (eg, polymorphism). From disease permeability associated with, specificity of candidate primers for target loci, size of candidate primers, melting temperature of target amplification product, GC content of target amplification product, amplification efficiency of target amplification product, and size of target amplification product. It may be based on one or more other parameters selected from the group of. When considering multiple factors, the undesignability score may be calculated based on weighted averages of various parameters. The parameters can be assigned different weights based on their importance to the particular application in which the primer is used. In some embodiments, the primer with the highest undesignability score is removed from the library. If the removed primer is a member of a primer pair that hybridizes to one target locus, the other member of the primer pair can also be removed from the library. The primer and removal process can be repeated as needed. In some embodiments, the selection method is performed until the undesignability scores of all combinations of candidate primers remaining in the library are below the minimum threshold. In some embodiments, the selection method is performed until the number of candidate primers remaining in the library is reduced to the desired number.

種々の実施形態では、アンデザイアラビリティスコアが計算された後で、第1の最小閾値を超えるアンデザイアラビリティスコアを有する2個の候補プライマーの組み合わせのうち最多数のもののの一部である候補プライマーがライブラリーから取り除かれる。このステップは、第1の最小閾値以下の相互作用を無視する。理由は、これらの相互作用は、重要性が低いからである。取り除かれたプライマーが1つの標的遺伝子座にハイブリダイズするプライマー対のメンバーの場合は、プライマー対のもう一方のメンバーをライブラリーから取り除くことができる。プライマーを取り除くプロセスは、必要に応じ繰り返すことができる。いくつかの実施形態では、ライブラリー中に残っている候補プライマーの組み合わせに対するアンデザイアラビリティスコアが全て第1の最小閾値以下になるまでその選択方法が実行される。ライブラリー中に残っている候補プライマーの数が必要数より多い場合は、第1の最小閾値を第2の最小閾値に下げ、プライマーを取り除くプロセスを繰り返すことによりプライマーの数を減らすことができる。ライブラリー中に残っている候補プライマーの数が必要数より少ない場合は、第1の最小閾値をより大きい第2の最小閾値に増やし、ことにより、元の候補プライマーライブラリーを使ってプライマーを取り除くプロセスを繰り返し、それにより、より多くの候補プライマーをライブラリー中に残すことにより前記方法を継続できる。いくつかの実施形態では、ライブラリー中に残っている補プライマーの組み合わせのアンデザイアラビリティスコアが全て第2の最小閾値以下になるか、またはライブラリー中に残っている候補プライマーの数が所望の数に減るまでその選択方法が実行される。 In various embodiments, candidate primers that are part of the largest number of combinations of two candidate primers with an undesignability score above the first minimum threshold after the undesignability score has been calculated. Is removed from the library. This step ignores interactions below the first minimum threshold. The reason is that these interactions are less important. If the removed primer is a member of a primer pair that hybridizes to one target locus, the other member of the primer pair can be removed from the library. The process of removing the primer can be repeated as needed. In some embodiments, the selection method is performed until all the undesignability scores for the combination of candidate primers remaining in the library are below the first minimum threshold. If the number of candidate primers remaining in the library is greater than the required number, the number of primers can be reduced by lowering the first minimum threshold to the second minimum threshold and repeating the process of removing the primers. If the number of candidate primers remaining in the library is less than required, increase the first minimum threshold to a larger second minimum threshold, thereby removing the primers using the original candidate primer library. The process can be repeated, thereby continuing the process by leaving more candidate primers in the library. In some embodiments, the undesignability score of the combination of complementary primers remaining in the library is all below the second minimum threshold, or the number of candidate primers remaining in the library is desired. The selection method is executed until the number is reduced.

必要に応じ、別のプライマー対により生成される標的増幅産物と重複する標的増幅産物を生成するプライマー対は、別の増幅反応に分割できる。多重PCR増幅反応は、(重複する標的増幅産物のために分析から候補標的遺伝子座を除くのではなく)全ての候補標的遺伝子座を分析するのが望ましい用途への適用が好ましい場合もある。 If desired, a primer pair that produces a target amplification product that overlaps with a target amplification product produced by another primer pair can be split into different amplification reactions. Multiplex PCR amplification reactions may be preferably applied in applications where it is desirable to analyze all candidate target loci (rather than removing candidate target loci from the analysis due to overlapping target amplification products).

これらの選択方法は、プライマー二量体の所望の低減を達成するためにライブラリーから取り除く必要のある候補プライマーの数を最小限化する。より少ない数の候補プライマーをライブラリーから取り除くことにより、得られたプライマーライブラリーを使ってより多くの(または全ての)標的遺伝子座を増幅できる。 These selection methods minimize the number of candidate primers that need to be removed from the library to achieve the desired reduction in primer dimers. By removing a smaller number of candidate primers from the library, the resulting primer library can be used to amplify more (or all) target loci.

多数のプライマーを多重化することにより、含めることができるアッセイにかなりの制約が課される。意図せずに相互作用するアッセイにより、偽の増幅産物がもたらされる。miniPCRのサイズの制約により、さらなる制約がもたらされ得る。ある実施形態では、非常に多数の潜在的なSNP標的(約500から100万超の間)で開始し、各SNPを増幅するためのプライマーを設計することを試みることが可能である。プライマーを設計することができる場合、可能性のあるプライマーの対の全ての間で偽のプライマー2重鎖が形成される尤度を、DNA2重鎖形成についての公開された熱力学的なパラメータを使用して評価することによって、偽の産物を形成する可能性があるプライマー対を同定することを試みることが可能である。プライマー相互作用は、相互作用に関連するスコア関数によって順位づけ、所望のプライマーの数に見合うまで相互作用スコアが最も悪いプライマーを排除することができる。ヘテロ接合性の可能性があるSNPが最も有用である場合には、同様にアッセイの一覧を順位付け、最もヘテロ接合性に適合するアッセイを選択することが可能である。実験により、相互作用スコアが高いプライマーが、プライマー二量体を形成する可能性が最も高いことが検証された。高度な多重化においては、全ての偽の相互作用を排除することは不可能であるが、インシリコで相互作用スコアが最も高いプライマーまたはプライマー対は、全体の反応の優位を占め、意図された標的からの増幅を著しく限定するので、これらを除去することが必須である。この手順を実施して、10,000プライマーにも達する、および、場合によってはそれを超える多重化プライマー集合を作製した。この手順による改善は、実質的なものであり、全てのPCR産物の配列決定によって決定された通り、最も悪いプライマーを除去しなかった反応からの10%と比較して、標的産物の80%超、90%超、95%超、98%超、およびさらには99%超の増幅を可能にする。以前に記載されている部分的なセミネステッド手法と組み合わせると、90%超、および95%超までもの増幅産物を標的の配列にマッピングすることができる。 Multiplexing a large number of primers imposes considerable restrictions on the assays that can be included. Assays that interact unintentionally result in sham amplification products. The size constraints of miniPCR can introduce additional constraints. In certain embodiments, it is possible to start with a large number of potential SNP targets (between about 5 and over 1 million) and attempt to design primers to amplify each SNP. If a primer can be designed, the likelihood of forming a fake primer double chain between all possible primer pairs, and the published thermodynamic parameters for DNA double chain formation. By using and evaluating, it is possible to attempt to identify primer pairs that may form fake products. Primer interactions can be ranked by the score function associated with the interaction and the primers with the worst interaction scores can be excluded until the desired number of primers is met. If a potentially heterozygous SNP is most useful, it is possible to similarly rank the list of assays and select the assay that best suits the heterozygotes. Experiments have verified that primers with high interaction scores are most likely to form primer dimers. With a high degree of multiplexing, it is not possible to eliminate all false interactions, but the primer or primer pair with the highest interaction score in in silico occupies the predominance of the overall reaction and is the intended target. It is essential to remove them as they significantly limit the amplification from. This procedure was performed to create a set of multiplexed primers that reached, and in some cases exceeded, 10,000 primers. The improvement with this procedure is substantive and, as determined by sequencing of all PCR products, more than 80% of the target product compared to 10% from the reaction that did not remove the worst primer. Allows amplification of greater than 90%, greater than 95%, greater than 98%, and even greater than 99%. Combined with the partially semi-nested approach described previously, it is possible to map up to over 90% and up to over 95% amplification products to the target sequence.

どのPCRプローブが二量体を形成する可能性があるかを決定するための他の方法が存在することに留意されたい。ある実施形態では、最適化されていないプライマーの集合を使用して増幅したDNAのプールの分析が、問題のあるプライマーを決定するために十分であり得る。例えば、分析は配列決定を用いて行うことができ、最大の数で存在する二量体を、二量体を形成する可能性が最も高いものであると決定し、除去することができる。 Note that there are other methods for determining which PCR probe may form a dimer. In certain embodiments, analysis of a pool of DNA amplified using a non-optimized set of primers may be sufficient to determine the problematic primer. For example, the analysis can be performed using sequencing and the largest number of dimers present can be determined to be the most likely to form a dimer and removed.

この方法には、いくつもの潜在的な適用、例えば、SNP遺伝子型決定、ヘテロ接合性率決定、コピー数測定、および他の標的化配列決定への適用がある。ある実施形態では、プライマーを設計する方法を、本文書の他の箇所に記載されているmini-PCR法と組み合わせて用いることができる。いくつかの実施形態では、プライマーの設計方法を、大規模な多重PCR法の一部として用いることができる。 This method has a number of potential applications, such as SNP genotyping, heterozygosity rate determination, copy counting, and other targeted sequencing applications. In certain embodiments, the method of designing primers can be used in combination with the mini-PCR method described elsewhere in this document. In some embodiments, the primer design method can be used as part of a large-scale multiplex PCR method.

プライマーにタグを使用することにより、プライマー二量体産物の増幅および配列決定を減らすことができる。いくつかの実施形態では、プライマーは、タグを有するループ構造を形成する内部領域を含む。特定の実施形態では、プライマーは、標的遺伝子座に特異的な5’領域、標的遺伝子座に特異的ではないループ構造を形成する内部領域,および標的遺伝子座に特異的な3’領域を含む。いくつかの実施形態では、ループ領域は、2つの結合領域がテンプレートDNAの近接または隣接領域に結合するように設計されている2つの結合領域の間に位置してもよい。種々の実施形態では、3’領域の長さは、少なくとも7ヌクレオチドである。いくつかの実施形態では、3’領域の長さは、7~20ヌクレオチドであり、例えば、7~15ヌクレオチド,または7~10ヌクレオチドである。種々の実施形態では、プライマーは、標的遺伝子座に特異的ではない5’領域(例えば、タグまたはユニバーサルプライマー結合部位)、続けて、標的遺伝子座に特異的な領域、標的遺伝子座に特異的ではないループ構造を形成する内部領域,および標的遺伝子座に特異的な3’領域を含む。タグ-プライマーを用いて、必要な標的特異的配列を20塩基対未満、15塩基対未満、12塩基対未満、さらには10塩基対未満までに短縮することができる。これは、プライマー結合部位内で標的配列が断片化される場合に標準のプライマーの設計に伴って偶然発見され得る、または、または、プライマー設計へと企画することができる。この方法の利点としては、特定の最大の増幅産物の長さに対して設計することができるアッセイの数が増加すること、および「情報価値のない」プライマー配列の配列決定が短縮されることが挙げられる。前記方法は、内部のタグ付けと組み合わせて用いることもできる(本文書の他の箇所を参照されたい)。 The use of tags as primers can reduce the amplification and sequencing of primer dimer products. In some embodiments, the primer comprises an internal region that forms a loop structure with tags. In certain embodiments, the primer comprises a 5'region specific for the target locus, an internal region that forms a loop structure that is not specific for the target locus, and a 3'region specific for the target locus. In some embodiments, the loop region may be located between two binding regions designed so that the two binding regions bind to adjacent or adjacent regions of the template DNA. In various embodiments, the length of the 3'region is at least 7 nucleotides. In some embodiments, the length of the 3'region is 7-20 nucleotides, eg, 7-15 nucleotides, or 7-10 nucleotides. In various embodiments, the primer is a non-target locus-specific 5'region (eg, a tag or universal primer binding site), followed by a target locus-specific region, a target locus-specific region. It contains an internal region that forms no loop structure, and a 3'region specific to the target locus. Tag-primers can be used to shorten the required target-specific sequences to less than 20 base pairs, less than 15 base pairs, less than 12 base pairs, and even less than 10 base pairs. This can be accidentally discovered with standard primer design if the target sequence is fragmented within the primer binding site, or can be planned for primer design. The advantages of this method are that it increases the number of assays that can be designed for a particular maximum amplification product length and that it shortens the sequencing of "informative" primer sequences. Can be mentioned. The method can also be used in combination with internal tagging (see elsewhere in this document).

ある実施形態では、多重標的PCR増幅における非生産的な産物の相対量を、アニーリング温度を上昇させることによって減少させることができる。標的特異的プライマーと同じタグを有するライブラリーを増幅する場合には、タグがプライマー結合に寄与するので、アニーリング温度をゲノムDNAと比較して増大させることができる。いくつかの実施形態では、以前報告されたものよりも相当低いプライマー濃度を用い、それと一緒に、他の箇所で報告されているものよりも長いアニーリング時間を用いる。いくつかの実施形態では、アニーリング時間は、3分超、5分超、8分超、10分超、15分超、20分超、30分超、60分超、120分超、240分超、480分超、およびさらには960分超であってよい。ある実施形態では、以前の報告よりも長いアニーリング時間を用い、これにより、より低いプライマー濃度が可能になる。種々の実施形態では、例えば、3,5,8,10,または15分を超える通常より長い伸長時間が使われる。いくつかの実施形態では、プライマー濃度は、50nM、20nM、10nM、5nM、1nM、および1μM未満までの低さである。驚いたことに、これにより、高度に多重化された反応、例えば、1,000プレックス反応、2,000プレックス反応、5,000プレックス反応、10,000プレックス反応、20,000プレックス反応、50,000プレックス反応、およびさらには100,000プレックス反応に対して頑強な性能がもたらされる。ある実施形態では、増幅には、長いアニーリング時間で実行する1サイクル、2サイクル、3サイクル、4サイクルまたは5サイクルを用い、その後、タグを付けたプライマーを用いて通常のアニーリング回数より多いPCRサイクルを行う。 In certain embodiments, the relative amount of unproductive product in multiple target PCR amplification can be reduced by increasing the annealing temperature. When amplifying a library with the same tag as the target-specific primer, the annealing temperature can be increased compared to genomic DNA because the tag contributes to primer binding. Some embodiments use significantly lower primer concentrations than previously reported, along with longer annealing times than reported elsewhere. In some embodiments, the annealing time is greater than 3 minutes, greater than 5 minutes, greater than 8 minutes, greater than 10 minutes, greater than 15 minutes, greater than 20 minutes, greater than 30 minutes, greater than 60 minutes, greater than 120 minutes, greater than 240 minutes. It can be more than 480 minutes, and even more than 960 minutes. In some embodiments, a longer annealing time than previously reported is used, which allows for lower primer concentrations. In various embodiments, longer than usual elongation times of, for example, greater than 3, 5, 8, 10, or 15 minutes are used. In some embodiments, primer concentrations are as low as 50 nM, 20 nM, 10 nM, 5 nM, 1 nM, and less than 1 μM. Surprisingly, this results in highly multiplexed reactions such as 1,000 plex reaction, 2,000 plex reaction, 5,000 plex reaction, 10,000 plex reaction, 20,000 plex reaction, 50, Robust performance is provided for 000 plex reactions and even 100,000 plex reactions. In one embodiment, amplification uses 1 cycle, 2 cycles, 3 cycles, 4 cycles or 5 cycles performed over a long annealing time, followed by PCR cycles with more than normal annealing times using tagged primers. I do.

標的場所を選択するために、候補となるプライマー対設計物のプールを用いて着手し、プライマー対間の潜在的に有害な相互作用の熱力学的モデルを作製し、次いで、このモデルを用いてプール内の他の設計物と適合しない設計物を排除することができる。 To select a target location, start with a pool of candidate primer pairs and designs to create a thermodynamic model of potentially harmful interactions between the primer pairs, and then use this model. Designs that are incompatible with other designs in the pool can be eliminated.

選択プロセス後、ライブラリー中に残っているプライマーは、本発明のいずれかの方法で使用できる。 Primers remaining in the library after the selection process can be used in any of the methods of the invention.

代表的プライマーライブラリー
一態様では、本発明は、プライマー、例えば、候補プライマーライブラリーから本発明のいずれかの方法を使って選択されたプライマーのライブラリーを特徴とする。いくつかの実施形態では、ライブラリーは、1反応体積で、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズする(もしくは、同時にハイブリダイズ可能な)、または同時に増幅する(もしくは、同時に増幅可能な)プライマーを含む。種々の実施形態では、ライブラリーは、1,000~2,000;2,000~5,000;5,000~7,500;7,500~10,000;10,000~20,000;20,000~25,000;25,000~30,000;30,000~40,000;40,000~50,000;50,000~75,000;75,000~100,000個の異なる標的遺伝子座を1反応体積で同時に増幅する(もしくは、同時に増幅可能な)プライマーを含む。種々の実施形態では、ライブラリーは、1反応体積で、1,000~100,000個の異なる標的遺伝子座、例えば、1,000~50,000;1,000~30,000;1,000~20,000;1,000~10,000;2,000~30,000;2,000~20,000;2,000~10,000;5,000~30,000;5,000~20,000;または5,000~10,000個の異なる標的遺伝子座を同時に増幅する(もしくは、同時に増幅可能な)プライマーを含む。いくつかの実施形態では、ライブラリーは、標的遺伝子座を1反応体積で同時に増幅する(もしくは、同時に増幅可能な)プライマーを含み、それにより、増幅産物の60、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1、または0.5%未満がプライマー二量体となる。種々の実施形態では、プライマー二量体増幅産物の量は、0.5~60%であり、例えば、0.1~40%,0.1~20%,0.25~20%,0.25~10%,0.5~20%,0.5~10%,1~20%,または1~10%である。いくつかの実施形態では、プライマーは、標的遺伝子座を1反応体積で同時に増幅し(もしくは、同時に増幅可能であり)、それにより、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の増幅産物が標的増幅産物である。種々の実施形態では、標的増幅産物である増幅産物の量は、50~99.5%,例えば、60~99%,70~98%,80~98%,90~99.5%,または95~99.5%である。いくつかの実施形態では、プライマーは、標的遺伝子座を1反応体積で同時に増幅し(もしくは、同時に増幅可能であり)、それにより、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的遺伝子座が増幅される。種々の実施形態では、増幅された標的遺伝子座の量は、50~99.5%であり、例えば、60~99%,70~98%,80~99%,90~99.5%,95~99.9%,または98~99.99%である。いくつかの実施形態では、プライマーライブラリーは、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個のプライマー対を含み、それぞれの対のプライマーは、フォワード試験プライマーおよびリバース試験プライマーを含み、それぞれの試験プライマー対は、標的遺伝子座にハイブリダイズする。いくつかの実施形態では、プライマーライブラリーは、それぞれ異なる標的遺伝子座にハイブリダイズする少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の個別プライマーを含み、個別プライマーは、プライマー対の一部ではない。
Representative Primer Library In one aspect, the invention features a library of primers, eg, primers selected from a candidate primer library using any of the methods of the invention. In some embodiments, the library is at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40 in one reaction volume. Primers that simultaneously hybridize (or simultaneously hybridize) or simultaneously amplify (or simultaneously amplify) 100,000 different target loci, 000; 50,000; 75,000; or 100,000 different target loci. include. In various embodiments, the library is 1,000 to 2,000; 2,000 to 5,000; 5,000 to 7,500; 7,500 to 10,000; 10,000 to 20,000; 20,000 to 25,000; 25,000 to 30,000; 30,000 to 40,000; 40,000 to 50,000; 50,000 to 75,000; 75,000 to 100,000 different Includes primers that simultaneously amplify (or simultaneously amplify) the target locus in one reaction volume. In various embodiments, the library has 1,000 to 100,000 different target loci in one reaction volume, eg, 1,000 to 50,000; 1,000 to 30,000; 1,000. ~ 20,000; 1,000 ~ 10,000; 2,000 ~ 30,000; 2,000 ~ 20,000; 2,000 ~ 10,000; 5,000 ~ 30,000; 5,000 ~ 20 000; or contains primers that simultaneously amplify (or simultaneously amplify) 5,000 to 10,000 different target loci. In some embodiments, the library comprises primers that simultaneously amplify (or simultaneously amplify) the target locus in one reaction volume, thereby 60, 40, 30, 20, 10, of the amplification product. 5, 4, 3, 2, 1, 0.5, 0.25, 0.1, or less than 0.5% is the primer dimer. In various embodiments, the amount of primer dimer amplification product is 0.5-60%, eg, 0.1-40%, 0.1-20%, 0.25-20%, 0. It is 25 to 10%, 0.5 to 20%, 0.5 to 10%, 1 to 20%, or 1 to 10%. In some embodiments, the primer simultaneously amplifies (or can simultaneously amplify) the target locus in one reaction volume, thereby at least 50, 60, 70, 80, 90, 95, 96, 97. , 98, 99, or 99.5% amplification products are target amplification products. In various embodiments, the amount of amplification product that is the target amplification product is 50-99.5%, for example 60-99%, 70-98%, 80-98%, 90-99.5%, or 95. It is ~ 99.5%. In some embodiments, the primer simultaneously amplifies (or can simultaneously amplify) the target locus in one reaction volume, thereby at least 50, 60, 70, 80, 90, 95, 96, 97. , 98, 99, or 99.5% of target loci are amplified. In various embodiments, the amount of amplified target locus is 50-99.5%, eg 60-99%, 70-98%, 80-99%, 90-99.5%, 95. It is ~ 99.9%, or 98-99.99%. In some embodiments, the primer library is at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50. 000; 75,000; or 100,000 primer pairs, each pair of primers contains a forward test primer and a reverse test primer, and each test primer pair hybridizes to the target locus. In some embodiments, the primer library hybridizes to different target loci at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; It contains 30,000; 40,000; 50,000; 75,000; or 100,000 individual primers, and the individual primers are not part of a primer pair.

種々の実施形態では、それぞれのプライマーの濃度は、100、75、50、25、20、10、5、2、もしくは1nM未満、または500、100、10、もしくは1uM未満である。種々の実施形態では、それぞれのプライマーの濃度は、1uM~100nMであり、例えば、1uM~1nM,1~75nM,2~50nMまたは5~50nMである。種々の実施形態では、プライマーのGC含量は、30~80%であり、例えば、40~70%,または50~60%である。いくつかの実施形態では、プライマーのGC含量の範囲は、30、20、10、または5%未満である。いくつかの実施形態では、プライマーのGC含量の範囲は、5~30%であり、例えば、5~20%または5~10%である。いくつかの実施形態では、試験プライマーの融解温度(T)は、40~80℃であり、例えば、50~70℃,55~65℃,または57~60.5℃である。いくつかの実施形態では、Tは、組込みSantaLuciaパラメータ(primer3.sourceforge.netのworldwide web)を使ってprimer3プログラム(libprimer3 release 2.2.3)で計算される。いくつかの実施形態では、プライマーの融解温度の範囲は、15、10、5、3、または1℃未満である。いくつかの実施形態では、プライマーの融解温度の範囲は、1~15℃であり、例えば、1~10℃、1~5℃、または1~3℃である。いくつかの実施形態では、プライマーの長さは、15~100ヌクレオチドであり、例えば、15~75ヌクレオチド、15~40ヌクレオチド、17~35ヌクレオチド、18~30ヌクレオチド、20~65ヌクレオチドである。いくつかの実施形態では、プライマーの長さの範囲は、50、40、30、20、10、または5ヌクレオチド未満である。いくつかの実施形態では、プライマーの長さの範囲は、5~50ヌクレオチドであり、例えば、5~40ヌクレオチド、5~20ヌクレオチド、または5~10ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さは、50~100ヌクレオチドであり、例えば、60~80ヌクレオチド、または60~75ヌクレオチドである。いくつかの実施形態では、標的増幅産物の長さの範囲は、50、25、15、10、または5ヌクレオチド未満である。いくつかの実施形態では、標的増幅産物の長さの範囲は、5~50ヌクレオチドであり、例えば、5~25ヌクレオチド、5~15ヌクレオチド、または5~10ヌクレオチドである。 In various embodiments, the concentration of each primer is less than 100, 75, 50, 25, 20, 10, 5, 2, or 1 nM, or less than 500, 100, 10, or 1 uM. In various embodiments, the concentration of each primer is 1 uM to 100 nM, for example, 1 uM to 1 nM, 1 to 75 nM, 2 to 50 nM or 5 to 50 nM. In various embodiments, the primer has a GC content of 30-80%, for example 40-70%, or 50-60%. In some embodiments, the range of GC content of the primer is less than 30, 20, 10, or 5%. In some embodiments, the range of GC content of the primer is 5-30%, eg 5-20% or 5-10%. In some embodiments, the melting temperature ( Tm ) of the test primer is 40-80 ° C, for example 50-70 ° C, 55-65 ° C, or 57-60.5 ° C. In some embodiments, Tm is calculated in the primer3 program (libprimer3 release 2.2.3) using the built-in SantaLucia parameter (worldforce web of primer3.sourceforge.net). In some embodiments, the melting temperature range of the primer is less than 15, 10, 5, 3, or 1 ° C. In some embodiments, the melting temperature range of the primer is 1-15 ° C, for example 1-10 ° C, 1-5 ° C, or 1-3 ° C. In some embodiments, the primer length is 15-100 nucleotides, eg, 15-75 nucleotides, 15-40 nucleotides, 17-35 nucleotides, 18-30 nucleotides, 20-65 nucleotides. In some embodiments, the primer length range is less than 50, 40, 30, 20, 10, or 5 nucleotides. In some embodiments, the primer length range is 5 to 50 nucleotides, eg, 5 to 40 nucleotides, 5 to 20 nucleotides, or 5 to 10 nucleotides. In some embodiments, the length of the target amplification product is 50-100 nucleotides, for example 60-80 nucleotides, or 60-75 nucleotides. In some embodiments, the length range of the target amplification product is less than 50, 25, 15, 10, or 5 nucleotides. In some embodiments, the length range of the target amplification product is 5 to 50 nucleotides, eg, 5 to 25 nucleotides, 5 to 15 nucleotides, or 5 to 10 nucleotides.

これらのプライマーライブラリーは、本発明のいずれかの方法で使用可能である。 These primer libraries can be used by any of the methods of the invention.

代表的プライマーキット
一態様では、本発明は、本発明のいずれかのプライマーライブラリーを含むキット(例えば、核酸試料中の標的遺伝子座を増幅するキット)を特徴とする。いくつかの実施形態では、本開示で記載の方法を実現するために設計された複数のプライマーを含むキットを処方することができる。プライマーは、本明細書に開示されている外側のフォワードプライマーおよびリバースプライマー、内側のフォワードプライマーおよびリバースプライマーであってよく、プライマーの設計のセクションに開示されている通り、キット内の他のプライマーに対する結合親和性が低いように設計されたプライマーであってよく、関連するセクションに記載のとおりハイブリッド捕捉プローブまたは環状化前プローブであるかまたはそのいくつかの組み合わせであってよい。ある実施形態では、本明細書に開示されている方法で使用するために設計された、妊娠中の胎児における標的染色体の倍数性状態を決定するためのキットであって、複数の内側のフォワードプライマー、および必要に応じて複数の内側のリバースプライマー、および必要に応じて、外側のフォワードプライマーおよび外側のリバースプライマーであって、該プライマーのそれぞれが、標的染色体および必要に応じて、さらに別の染色体上の標的部位(例えば、多型部位)のうちの1つのすぐ上流および/または下流のDNAの領域とハイブリダイズするように設計されているプライマー、を含むキットを構築することができる。ある実施形態では、プライマーキットは、本文書の他の箇所に記載されている診断ボックスと組み合わせて用いることができる。いくつかの実施形態では、キットは、ライブラリーを使用して標的遺伝子座を増幅するための説明書を含む。
Representative Primer Kit In one aspect, the invention features a kit comprising any of the primer libraries of the invention (eg, a kit that amplifies a target locus in a nucleic acid sample). In some embodiments, kits comprising multiple primers designed to implement the methods described in the present disclosure can be formulated. Primers may be the outer forward and reverse primers, inner forward and reverse primers disclosed herein, and as disclosed in the Primer Design section, for other primers in the kit. The primers may be designed to have low binding affinity and may be hybrid capture probes, pre-cyclization probes or some combination thereof as described in the relevant section. In one embodiment, a kit designed for use in the methods disclosed herein for determining the polymorphic state of a target chromosome in a pregnant fetus, with multiple inner forward primers. , And optionally multiple inner reverse primers, and optionally outer forward and outer reverse primers, each of which is a target chromosome and, if desired, yet another chromosome. Kits can be constructed that include primers, which are designed to hybridize to regions of DNA immediately upstream and / or downstream of one of the above target sites (eg, polymorphic sites). In certain embodiments, the primer kit can be used in combination with the diagnostic boxes described elsewhere in this document. In some embodiments, the kit comprises instructions for amplifying a target locus using a library.

代表的多重PCR法
一態様では、本発明は、核酸試料中の標的遺伝子座を増幅する方法を特徴とし、前記方法は、(i)核酸試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップ、および(ii)反応混合物をプライマー伸長反応条件(例えば、PCR条件)に供し、標的増幅産物を含む増幅産物を生成するステップを含む。いくつかの実施形態では、前記方法はまた、少なくとも1種の標的増幅産物(例えば、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的増幅産物)の存在の有無を判定するステップも含む。いくつかの実施形態では、前記方法はまた、少なくとも1種の標的増幅産物(例えば、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的増幅産物)の配列を決定するステップも含む。いくつかの実施形態では、少なくとも50、60、70、80、90、95、96、97、98、99、または99.5%の標的遺伝子座が増幅される。種々の実施形態では、60、50、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1、または0.05%未満の増幅産物がプライマー二量体である。
Representative Multiple PCR Methods In one aspect, the invention features a method of amplifying a target locus in a nucleic acid sample, wherein (i) the nucleic acid sample is at least 1,000; 2,000; 5,. Primers that simultaneously hybridize to 000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different target loci. It comprises contacting with a library to generate a reaction mixture, and (ii) subjecting the reaction mixture to primer extension reaction conditions (eg, PCR conditions) to produce an amplification product, including a target amplification product. In some embodiments, the method also targets at least one target amplification product (eg, at least 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, or 99.5%). It also includes a step of determining the presence or absence of an amplification product). In some embodiments, the method also targets at least one target amplification product (eg, at least 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, or 99.5%). It also includes the step of determining the sequence of the amplification product). In some embodiments, at least 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, or 99.5% of target loci are amplified. In various embodiments, less than 60, 50, 40, 30, 20, 10, 5, 4, 3, 2, 1, 0.5, 0.25, 0.1, or 0.05% amplification products It is a primer dimer.

ある実施形態では、本明細書に開示されている方法は、非常に効率的な高度多重標的PCRを使用して、DNAを増幅し、その後ハイスループット配列決定を行って各標的遺伝子座における対立遺伝子頻度を決定する。約50または100を超えるPCRプライマーを1反応体積で、生じたシーケンスリードの大部分が、標的の遺伝子座にマッピングされるように多重化できることは、新規かつ非自明である。非常に効率的な様式で実施するための高度多重標的PCRを可能にする1つの技法は、互いとハイブリダイズする可能性が低いプライマーの設計を伴う。一般にはプライマーと称されるPCRプローブは、少なくとも500、少なくとも1,000、少なくとも2,000、少なくとも5,000、少なくとも7,500、少なくとも10,000、少なくとも20,000、少なくとも25,000、少なくとも30,000、少なくとも40,000、少なくとも50,000、少なくとも75,000、または少なくとも100,000の潜在的なプライマー対間の潜在的に有害な相互作用、または、プライマーと試料DNAの間の意図されたものではない相互作用の熱力学的モデルを作製し、次いで、このモデルを使用して、プール内の他の設計物と適合しない設計物を排除することによって選択する。非常に効率的な様式で実施するための高度多重標的PCRを可能にする別の技法は、部分的な、または完全なネスティング手法を用いて標的PCRを行うことである。これらの手法の1つまたはその組み合わせを用いることにより、単一のプール内の少なくとも300個、少なくとも800個、少なくとも1,200個、少なくとも4,000個または少なくとも10,000個のプライマーを多重化することが可能になり、生じた増幅されたDNAは、配列決定すると、標的の遺伝子座にマッピングされる大多数のDNA分子を含む。これらの手法の1つまたはその組み合わせを用いることにより、単一のプール内の多数のプライマーを多重化することが可能になり、生じた増幅されたDNAは、50%超、60%超、67%超、80%超、90%超、95%超、96%超、97%超、98%超、99%超、または99.5%超の、標的の遺伝子座にマッピングされるDNA分子を含む。 In certain embodiments, the methods disclosed herein use highly efficient highly multiplex target PCR to amplify DNA and then perform high-throughput sequencing to perform alleles at each target locus. Determine the frequency. It is novel and non-trivial that more than about 50 or 100 PCR primers can be multiplexed in one reaction volume so that the majority of the resulting sequence reads are mapped to the target locus. One technique that allows highly multiplex target PCR to be performed in a highly efficient manner involves the design of primers that are unlikely to hybridize with each other. PCR probes, commonly referred to as primers, are at least 500, at least 1,000, at least 2,000, at least 5,000, at least 7,500, at least 10,000, at least 20,000, at least 25,000, at least. Potentially harmful interactions between 30,000, at least 40,000, at least 50,000, at least 75,000, or at least 100,000 potential primer pairs, or intent between primers and sample DNA. A thermodynamic model of the non-existent interaction is created and then selected by using this model to eliminate designs that are incompatible with other designs in the pool. Another technique that allows highly multiplex target PCR to be performed in a highly efficient manner is to perform targeted PCR using partial or complete nesting techniques. Multiplexing at least 300, at least 800, at least 1,200, at least 4,000, or at least 10,000 primers in a single pool by using one or a combination of these techniques. The resulting amplified DNA contains the majority of DNA molecules that, upon sequencing, are mapped to the target locus. By using one or a combination of these techniques, it is possible to multiplex multiple primers in a single pool and the resulting amplified DNA is> 50%,> 60%, 67. Over%, over 80%, over 90%, over 95%, over 96%, over 97%, over 98%, over 99%, or over 99.5%, DNA molecules that are mapped to the target locus. include.

いくつかの実施形態では、標的遺伝物質の検出は多重様式で行うことができる。並行して実行することができる遺伝子の標的配列の数は、1~10、10~100、100~1,000、1,000~10,000、10,000~100,000、100,000~1,000,000または1,000,000~10,000,000にわたり得る。プール当たり100個超のプライマーを多重化するための以前の試みでは、プライマーの二量体形成などの望ましくない副反応を伴う重大な問題が生じた。 In some embodiments, the detection of the target genetic material can be performed in a multimodal fashion. The number of target sequences of genes that can be executed in parallel is 1 to 10, 10 to 100, 100 to 1,000, 1,000 to 10,000, 10,000 to 100,000, 100,000 to 10,000. Obtained in the range of 1,000,000 or 1,000,000 to 10,000,000. Previous attempts to multiplex more than 100 primers per pool have created serious problems with unwanted side reactions such as primer dimer formation.

標的PCR
いくつかの実施形態では、PCRを用いて、ゲノムの特定の場所を標的とすることができる。血漿試料において、元のDNAは高度に断片化されている(一般には、500bp未満、平均長200bp未満)。PCRでは、増幅を可能にするために、フォワードプライマーとリバースプライマーの両方が同じ断片とアニーリングする。したがって、断片が短い場合、PCRアッセイでは、同様に比較的短い領域を増幅しなければならない。MIPSのように、多型の位置がポリメラーゼ結合部位と近すぎると、異なる対立遺伝子からの増幅に偏りが生じる。現在、SNPを含有するものなどの多型領域を標的とするPCRプライマーは、一般には、プライマーの3’末端が1個または複数個の多型の塩基のすぐ隣の塩基とハイブリダイズするように設計される。本開示のある実施形態では、フォワードPCRプライマーおよびリバースPCRプライマーの両方の3’末端が、標的の対立遺伝子の変異の位置(多型部位)と1つまたは少数の位置だけ離れている塩基とハイブリダイズするように設計する。多型部位(SNPまたは他の種類のもの)と、プライマーの3’末端がハイブリダイズするように設計された塩基との間の塩基の数は、1塩基であってよい、2塩基であってよい、3塩基であってよい、4塩基であってよい、5塩基であってよい、6塩基であってよい、7~10塩基であってよい、11~15塩基であってよい、または、16~20塩基であってよい。フォワードプライマーおよびリバースプライマーは、多型部位から離れた異なる数の塩基とハイブリダイズするように設計することができる。
Target PCR
In some embodiments, PCR can be used to target specific locations in the genome. In plasma samples, the original DNA is highly fragmented (generally less than 500 bp, average length less than 200 bp). In PCR, both the forward and reverse primers anneal to the same fragment to allow amplification. Therefore, if the fragment is short, the PCR assay must also amplify the relatively short region. If the position of the polymorphism is too close to the polymerase binding site, as in MIPS, there will be a bias in amplification from different alleles. Currently, PCR primers targeting polymorphic regions, such as those containing SNPs, generally such that the 3'end of the primer hybridizes to the base immediately adjacent to one or more polymorphic bases. Designed. In one embodiment of the present disclosure, the 3'ends of both the forward and reverse PCR primers hybridize with a base that is separated from the mutation location (polymorphic site) of the target allele by one or a few positions. Design to soy. The number of bases between the polymorphic site (SNP or other type) and the base designed for the 3'end of the primer to hybridize may be 1 base or 2 bases. It may be 3 bases, 4 bases, 5 bases, 6 bases, 7-10 bases, 11-15 bases, or It may be 16 to 20 bases. Forward and reverse primers can be designed to hybridize to different numbers of bases away from the polymorphic site.

PCRアッセイを多数生成することができるが、異なるPCRアッセイ間の相互作用により、約100アッセイを越えてそれらを多重化することが難しくなる。種々の複雑な分子的手法を用いて、多重化のレベルを上昇させることができるが、それでも反応当たり100未満、おそらく200、またはことによると500アッセイに限られ得る。多量のDNAを有する試料は、複数の副次反応に分割し、次いで配列決定の前に組み換えることができる。DNA分子の全体的な試料または一部の亜集団のいずれかが限られている試料については、試料を分割することにより統計学的なノイズが導入されることになる。ある実施形態では、少ないまたは限られた量のDNAとは、10pg未満、10pgから100pgの間、100pgから1ngの間、1ngから10ngの間または10ngから100ngの間の量を指し得る。この方法は、複数のプールに分割するステップを包含する他の方法では確率論的ノイズの導入に関連する重大な問題が引き起こされ得る少量のDNAに対して特に有用であるが、この方法は、いかなる量のDNAの試料に対して実行された場合でも、偏りを最小化する利益をもたらすことに留意されたい。これらの状況では、ユニバーサル前増幅ステップを使用して、全体的な試料の量を増大させることができる。理想的には、この前増幅ステップでは、対立遺伝子分布を感知できるほどには変えるべきでない。 Although a large number of PCR assays can be generated, the interaction between different PCR assays makes it difficult to multiplex them beyond about 100 assays. Various complex molecular techniques can be used to increase the level of multiplexing, but may still be limited to less than 100, perhaps 200, or possibly 500 assays per reaction. A sample with a large amount of DNA can be divided into multiple side reactions and then recombined prior to sequencing. For samples where either the entire sample of DNA molecules or some subpopulations is limited, dividing the sample will introduce statistical noise. In certain embodiments, a small or limited amount of DNA can refer to an amount of less than 10 pg, between 10 pg and 100 pg, between 100 pg and 1 ng, between 1 ng and 10 ng, or between 10 ng and 100 ng. This method is particularly useful for small amounts of DNA, where other methods involving the step of splitting into multiple pools can cause serious problems associated with the introduction of stochastic noise. It should be noted that when performed on any amount of DNA sample, it provides the benefit of minimizing bias. In these situations, a universal preamplification step can be used to increase the overall sample volume. Ideally, this preamplification step should not change the allele distribution to a perceptible level.

ある実施形態では、本開示の方法により、体液由来の単一細胞またはDNAなどの限られた試料から、配列決定またはいくつかの他の遺伝子型決定方法によって遺伝子型決定するために、多数の標的の遺伝子座、詳細には1,000~5,000の遺伝子座、5,000~10,000の遺伝子座、または10,000超の遺伝子座に特異的なPCR産物を生成することができる。現在、5超~10個の標的の多重PCR反応を実施することにより、大きな課題が示され、多くの場合、プライマー副産物、例えば、プライマー二量体、および他のアーチファクトが妨害となる。ハイブリダイゼーションプローブを用いたマイクロアレイを使用して標的配列を検出する場合、プライマー二量体および他のアーチファクトは検出されないので、これらは無視することができる。しかし、検出の方法として配列決定を用いる場合、シーケンシングリードの大部分は、そのようなアーチファクトを配列決定し、試料中の所望の標的配列は配列決定しない。1反応体積において50超または100の反応を多重化し、その後に配列決定するために用いられる先行技術に記載の方法により、一般には20%超、および多くの場合50%超、多くの場合80%超およびいくつかの場合には90%超のオフターゲットのシーケンスリードがもたらされる。 In certain embodiments, the methods of the present disclosure allow a large number of targets to be sequenced or locused by some other locus method from a limited sample, such as a single cell or DNA derived from body fluids. Loci, specifically 1,000-5,000 loci, 5,000-10,000 loci, or more than 10,000 loci-specific PCR products can be produced. Currently, performing multiplex PCR reactions of more than 5 to 10 targets presents a major challenge, often with primer by-products such as primer dimers and other artifacts interfering. When detecting target sequences using microarrays with hybridization probes, primer dimers and other artifacts are not detected and can be ignored. However, when sequencing is used as the method of detection, the majority of sequencing reads sequence such artifacts and do not sequence the desired target sequence in the sample. By the methods described in the prior art used to multiplex and then sequence more than 50 or 100 reactions in one reaction volume, generally more than 20%, and often more than 50%, often 80%. It results in ultra-and in some cases> 90% off-target sequence reads.

一般に、試料における多数の(n)標的(50超、100超、500超または1,000超)に対し標的化配列決定を実施するために、試料をいくつもの並行した反応物へと分割し、1つの個体標的を増幅することができる。これは、PCR多ウェルプレートにおいて実施されている、または商業的なプラットフォーム、例えば、FLUIDIGM ACCESS ARRAY(マイクロ流体チップにおいて試料当たり48の反応)またはRAIN DANCE TECHNOLOGYからのDROPLET PCR(100~数千もの標的)において実行することができる。残念ながら、これらのスプリットアンドプール(split-and-pool)方法は、多くの場合、存在するゲノムのコピーが、各ウェル中にゲノムの各領域の1つのコピーが存在することを確実にするためには不十分であるので、DNAの量が限られている試料に対しては問題がある。これは、多型遺伝子座を標的とする場合に特に重大な問題であり、分割およびプールすることによって導入される確率論的ノイズにより、元のDNAの試料に存在していた対立遺伝子の割合の非常に不十分に正確な測定が引き起こされるので、多型遺伝子座における対立遺伝子の相対的な割合が必要である。限られた量のDNAのみが利用可能である場合に適用可能な、多くのPCR反応物を有効かつ効率的に増幅するための方法が本明細書に記載されている。ある実施形態では、単一細胞、体液、DNAの混合物、例えば、母系の血漿中に見いだされる浮動性DNA、生検材料、環境試料および/または法医学試料を分析するために前記方法を適用することができる。 In general, in order to perform targeted sequencing on a large number of (n) targets (> 50,> 100,> 500 or> 1,000) in a sample, the sample is divided into a number of parallel reactants. One individual target can be amplified. This is performed in PCR multi-well plates or on commercial platforms such as FLUIDIGM ACCESS ARRAY (48 reactions per sample in microfluidic chips) or DROPLET PCR from RAIN DANCE TECHNOLOGY (100-thousands of targets). ) Can be executed. Unfortunately, these split-and-pool methods often ensure that a copy of the genome present is a copy of each region of the genome in each well. There is a problem with samples where the amount of DNA is limited, as it is not sufficient. This is a particularly serious problem when targeting polymorphic loci, and the proportion of alleles present in the original DNA sample due to the probabilistic noise introduced by splitting and pooling. Relative proportions of alleles at the polymorphic locus are needed, as they cause very inadequately accurate measurements. Methods for effectively and efficiently amplifying many PCR reactants, applicable when only a limited amount of DNA is available, are described herein. In certain embodiments, the method is applied to analyze a mixture of single cells, body fluids, DNA, such as floating DNA, biopsy material, environmental samples and / or forensic samples found in maternal plasma. Can be done.

ある実施形態では、標的シークエンシングは、1つの、複数の、または全ての次のステップを含んでもよい。a) DNA断片の両端にアダプタ配列を有するライブラリーを生成し、増幅する。b)ライブラリー増幅後、複数反応に分割する。c) DNA断片の両端にアダプタ配列を有するライブラリーを生成し、任意選択で、増幅する。d)標的当たり1個の標的特異的「フォワード」プライマーおよび1個のタグ特異的プライマーを使って、選択標的の1000~10,000プレックス増幅を行う。e)「リバース」標的特異的プライマーおよび第1ラウンドで標的特異的フォワードプライマーの一部として導入されたユニバーサルタグ特異的1個(または2個以上)のプライマーを使ってこの産物から第2の増幅を行う。f)限定サイクル数で選択標的の1000プレックスプレ増殖を行う。g)産物を複数分割量に分け、標的のサブプールを個別反応で増幅する(例えば、50~500プレックス(この方法は、単一プレックスまでの任意プレックスで使用できる))。h)並列サブプール反応の産物をプールする。i)これらの増幅の間、プライマーは、シークエンシング適合性タグ(部分長または全長)を保持でき、それにより、産物をシークエンシングできる。 In certain embodiments, target sequencing may include one, multiple, or all of the following steps. a) Generate and amplify a library with adapter sequences at both ends of the DNA fragment. b) After library amplification, divide into multiple reactions. c) Generate a library with adapter sequences at both ends of the DNA fragment and optionally amplify it. d) 1000-10,000 plex amplification of selected targets is performed using one target-specific "forward" primer and one tag-specific primer per target. e) Second amplification from this product using "reverse" target-specific primers and one (or more) universal tag-specific primers introduced as part of the target-specific forward primers in the first round. I do. f) Perform 1000 plex pre-proliferation of the selective target in a limited number of cycles. g) Divide the product into multiple fractions and amplify the target subpools in individual reactions (eg, 50-500 plexes (this method can be used with any plexes up to a single plex)). h) Pool the products of the parallel subpool reaction. i) During these amplifications, the primer can retain a sequencing compatibility tag (partial length or full length), whereby the product can be sequenced.

高度多重PCR
本明細書には、血漿から得られるゲノムDNAなどの核酸試料由来の100~数万をも超える標的配列(例えば、SNP遺伝子座)の標的化増幅を可能にする方法が開示されている。増幅された試料は、プライマー二量体産物を比較的含まず、標的遺伝子座における対立遺伝子の偏りが少ない。増幅の間または増幅後に、産物に配列決定適合性アダプタを付加する場合、これらの産物の分析を配列決定によって実施することができる。
Highly multiplex PCR
The present specification discloses a method that enables targeted amplification of more than one hundred to tens of thousands of target sequences (eg, SNP loci) derived from nucleic acid samples such as genomic DNA obtained from plasma. The amplified sample is relatively free of primer dimer products and has less allele bias at the target locus. If sequencing compatibility adapters are added to the products during or after amplification, analysis of these products can be performed by sequencing.

当技術分野で公知の方法を用いて高度多重PCR増幅を実施することにより、所望の増幅産物が過剰であり、配列決定に適さないプライマー二量体産物が生成する。これらは、経験的に、これらの産物を形成するプライマーを排除することによって、またはプライマーのインシリコ選択を実施することによって減少させることができる。しかし、アッセイの数が多くなるほど、この問題はより困難になる。 Performing highly multiplex PCR amplification using methods known in the art yields primer dimer products that are in excess of the desired amplification product and are not suitable for sequencing. These can be empirically reduced by eliminating the primers that form these products or by performing in silico selection of the primers. However, the greater the number of assays, the more difficult this problem becomes.

1つの解法は、5,000プレックス反応をいくつかの低プレックス増幅、例えば、100回の50プレックス反応または50回の100プレックス反応に分割すること、またはマイクロフルイディクスを使用すること、または、さらには、試料を個々のPCR反応に分割することである。しかし、妊娠血漿からの非侵襲的な出生前診断においてなど試料DNAが限られている場合は、多数の反応間に試料を分割することは、これによりボトルネッキングが生じるので、回避するべきである。 One solution is to divide the 5,000-plex reaction into several low-plex amplifications, such as 100 50-plex reactions or 50 100-plex reactions, or using microfluidics, or even more. Is to divide the sample into individual PCR reactions. However, if sample DNA is limited, such as in non-invasive prenatal diagnosis from pregnancy plasma, splitting the sample between multiple reactions should be avoided as this causes bottlenecking. ..

本明細書には、まず試料の血漿DNAを全体的に増幅し、次いで試料を、反応当たり、より中程度の数の標的配列を伴う複数の多重化標的富化反応に分割するための方法が記載されている。ある実施形態では、本開示の方法は、DNA混合物を複数の遺伝子座で優先的に富化するために用いることができ、前記方法は以下のステップの1つまたは複数を含む:DNAの混合物からライブラリーを生成し、増幅するステップであって、ライブラリー内の分子がDNA断片の両末端にライゲーションされたアダプタ配列を有するステップ、増幅されたライブラリーを複数の反応に分割するステップ、選択された標的の多重増幅の第1ラウンドを、標的当たり1つの標的特異的「フォワード」プライマーおよび1個または複数個のアダプタ特異的なユニバーサル「リバース」プライマーを使用して実施するステップ。ある実施形態では、本開示の方法は、「リバース」標的特異的プライマー、および1個または複数個の、第1ラウンドにおいて標的特異的フォワードプライマーの一部として導入されたユニバーサルタグに特異的なプライマーを使用して第2の増幅を実施するステップをさらに含む。ある実施形態では、前記方法は、完全ネステッドPCR手法、ヘミネステッドPCR手法、セミネステッドPCR手法、片側完全ネステッドPCR手法、片側ヘミネステッドPCR手法または片側セミネステッドPCR手法を伴ってよい。ある実施形態では、DNA混合物を複数の遺伝子座において優先的に富化するために本開示の方法を用い、前記方法は、選択された標的の多重化前増幅を、限られたサイクル数で実施するステップと、産物を複数の一定分量に分けるステップと、個々の反応における標的のサブプールを増幅するステップと、並行サブプール反応の産物をプールするステップとを含む。この手法は、50~500遺伝子座について、500~5,000遺伝子座について、5,000~50,000遺伝子座について、または、さらには50,000~500,000遺伝子座について、対立遺伝子の偏りが低レベルになるように標的化増幅を実施するために用いることができることに留意されたい。ある実施形態では、プライマーは、部分長、または完全長の配列決定適合性タグを担持する。 Here is a method for first amplifying the plasma DNA of a sample as a whole and then dividing the sample into multiple multiplex target enrichment reactions with a more moderate number of target sequences per reaction. Are listed. In certain embodiments, the methods of the present disclosure can be used to preferentially enrich a DNA mixture at multiple loci, said method comprising one or more of the following steps: from a mixture of DNA. A step of creating and amplifying a library, in which the molecules in the library have adapter sequences ligated at both ends of the DNA fragment, a step of dividing the amplified library into multiple reactions, is selected. The first round of multiple amplification of a target is performed using one target-specific "forward" primer per target and one or more adapter-specific universal "reverse" primers. In certain embodiments, the methods of the present disclosure are "reverse" target-specific primers and one or more universal tag-specific primers introduced as part of the target-specific forward primer in the first round. Further comprises the step of performing a second amplification using. In certain embodiments, the method may involve a complete nested PCR technique, a heminated PCR technique, a semi-nested PCR technique, a one-sided complete nested PCR technique, a one-sided hemmened PCR technique, or a one-sided semi-nested PCR technique. In certain embodiments, the methods of the present disclosure are used to preferentially enrich the DNA mixture at multiple loci, the method performing premultiplexing amplification of selected targets in a limited number of cycles. A step of dividing the product into a plurality of fixed amounts, a step of amplifying a target subpool in each reaction, and a step of pooling the product of a parallel subpool reaction. This technique involves allelic bias for 50-500 loci, 500-5,000 loci, 5,000-50,000 loci, or even 50,000-500,000 loci. Note that it can be used to perform targeted amplification to low levels. In certain embodiments, the primer carries a partial or full length sequencing compatibility tag.

ワークフローは、(1)血漿DNAなどのDNAを抽出するステップと、(2)断片の両末端にユニバーサルアダプタを有する断片ライブラリーを調製するステップと、(3)ライブラリーを、アダプタに特異的なユニバーサルプライマーを使用して増幅するステップと、(4)増幅された試料「ライブラリー」を複数の一定分量に分けるステップと、(5)一定分量に対して多重化(例えば、標的当たり1つの標的特異的プライマーおよびタグ特異的プライマーを用いた約100プレックス、1,000または10,000プレックス)増幅を実施するステップと、(6)1つの試料の一定分量をプールするステップと、(7)試料についてバーコーディングを行うステップと、(8)試料を混合し、濃度を調整するステップと、(9)試料について配列決定するステップとを伴ってよい。ワークフローは、列挙されているステップのうちの1つを含有する複数のサブステップを含んでよい(例えば、ステップ(2)のライブラリーを調製するステップは、3つの酵素的ステップ(平滑末端化、dAテーリングおよびアダプタライゲーション)および3つの精製ステップを伴ってよい)。ワークフローのステップは、組み合わせることができる、分けることができる、または異なる順序で実施することができる(例えば、試料のバーコーディングおよびプール)。 The workflow consists of (1) extracting DNA such as plasma DNA, (2) preparing a fragment library having universal adapters at both ends of the fragment, and (3) making the library adapter-specific. Amplification using a universal primer, (4) dividing the amplified sample "library" into multiple aliquots, and (5) multiplexing for a given aliquot (eg, one target per target). Approximately 100 plexes, 1,000 or 10,000 plexes) amplification using specific and tag-specific primers, (6) a step of pooling a fixed amount of one sample, and (7) a sample. It may be accompanied by a step of barcoding with respect to, (8) a step of mixing the sample and adjusting the concentration, and (9) a step of sequencing the sample. The workflow may include multiple substeps containing one of the listed steps (eg, the step of preparing the library of step (2) is three enzymatic steps (blunted, blunt-ended,). dA tailing and adapter ligation) and may involve three purification steps). Workflow steps can be combined, separated, or performed in a different order (eg, sample barcoding and pooling).

ライブラリーの増幅は、短い断片をより効率的に増幅することに偏りがあるように実施することができることに留意することが重要である。このように、より短い配列、例えば、モノヌクレオソームのDNA断片を妊娠中の女性の循環中に見いだされる無細胞の胎児DNA(胎盤起源の)として優先的に増幅することが可能である。PCRアッセイは、タグ、例えば配列決定タグ(通常15~25塩基の切断形態)を有してよいことに留意されたい。多重化した後、試料のPCR多重化産物をプールし、次いで、タグ特異的PCRによって(ライゲーションによって行うこともできる)タグ付けを完了する(バーコーディングを含む)。また、多重化として完全な配列決定タグを同じ反応に加えることができる。第1のサイクルでは、標的を、標的特異的プライマーを用いて増幅することができ、その後、タグ特異的プライマーが優勢になって完全なSQアダプタ配列を完成させる。PCRプライマーはタグを担持しなくてよい。配列決定タグはライゲーションによって増幅産物に付加することができる。 It is important to note that library amplification can be performed in a biased manner in amplifying short pieces more efficiently. Thus, shorter sequences, eg, DNA fragments of mononucleosomes, can be preferentially amplified as cell-free fetal DNA (of placental origin) found in the circulation of pregnant women. It should be noted that the PCR assay may have a tag, eg, a sequencing tag (usually a cleavage form of 15-25 bases). After multiplexing, the PCR multiplexing products of the sample are pooled, and then tagging is completed (including barcoding) by tag-specific PCR (which can also be done by ligation). Also, complete sequencing tags can be added to the same reaction as a multiplexing. In the first cycle, the target can be amplified with target-specific primers, after which the tag-specific primers predominate to complete the complete SQ adapter sequence. The PCR primer does not have to carry the tag. Sequencing tags can be added to the amplification product by ligation.

ある実施形態では、高度多重PCR、その後クローン配列決定を用いて増幅された材料を評価することによって、胎児の異数性を検出などの種々の用途に使用することができる。従来の多重PCRでは最大で50遺伝子座を同時に評価するが、本明細書に記載の手法を使用して、50超の遺伝子座を同時に、100超遺伝子座を同時に、500超遺伝子座を同時に、1,000超遺伝子座を同時に、5,000超遺伝子座を同時に、10,000超遺伝子座を同時に、50,000超遺伝子座を同時に、および100,000超遺伝子座を同時に、同時評価することを可能にし得る。実験により、10,000まで、10,000を含めて、および10,000超の別個の遺伝子座を、単一反応において、十分に優良な効率および特異性で同時に評価して、非侵襲的な出生前異数性診断および/またはコピー数のコールを高い正確度で行うことができることが示された。アッセイは、単一反応において、母系の血漿から単離されたcfDNA試料などの試料全体、その画分またはcfDNA試料のさらに加工した誘導体と組み合わせることができる。試料(例えば、cfDNAまたは誘導体)は、複数の並行の多重反応に分割することもできる。最適な試料の分割および多重化を、種々の性能仕様のトレードオフによって決定する。材料の量が限られているので、試料を複数の画分に分割することにより、サンプリングノイズ、取扱い時間、およびエラーの可能性の増大がもたらされる可能性がある。逆に、高多重化の結果、偽の増幅の量が増え、増幅の不等性が増す可能性があり、どちらによっても検査性能が低下する。 In certain embodiments, fetal aneuploidy can be used for a variety of applications, such as by evaluating amplified material using highly multiplex PCR followed by clonal sequencing. Whereas conventional multiplex PCR evaluates up to 50 loci simultaneously, the techniques described herein are used to simultaneously evaluate over 50 loci, over 100 loci, and over 500 loci at the same time. Simultaneously evaluate 1,000 or more loci, 5,000 or more loci at the same time, 10,000 or more loci at the same time, 50,000 or more loci at the same time, and 100,000 or more loci at the same time. Can be made possible. Experimentally, up to 10,000, including 10,000, and over 10,000 distinct loci were simultaneously evaluated in a single reaction with sufficiently good efficiency and specificity, non-invasively. It has been shown that prenatal aneuploidy diagnosis and / or copy count calls can be made with high accuracy. The assay can be combined in a single reaction with an entire sample, such as a cfDNA sample isolated from maternal plasma, its fraction or a further processed derivative of the cfDNA sample. The sample (eg, cfDNA or derivative) can also be divided into multiple parallel multiple reactions. Optimal sample partitioning and multiplexing is determined by trade-offs for various performance specifications. Due to the limited amount of material, dividing the sample into multiple fractions can result in increased sampling noise, handling time, and increased likelihood of error. Conversely, as a result of high multiplexing, the amount of false amplification may increase and amplification inequality may increase, both of which reduce inspection performance.

本明細書に記載の方法の適用における2つの極めて重要な関連する考慮すべき事柄は、限られた量の元の試料(例えば、血漿)および対立遺伝子頻度または他の測定値を得る材料内の元の分子の数である。元の分子の数が特定のレベルを下回る場合、ランダムサンプリングノイズが著しくなり、検査の正確度に影響を及ぼす可能性がある。一般には、標的遺伝子座当たり500~1000個の元の分子相当を含む試料に対して測定を行う場合、非侵襲的な出生前異数性診断を行うために十分な品質のデータを得ることができる。別個の測定値の数を増加させる、例えば、試料の体積を増加させるいくつもの方法が存在する。試料に適用される各操作によっても、潜在的に材料が損失する。検査の性能を低下させ得る損失を回避するために、種々の操作によって受けた損失を特徴付けること、および特定の操作を回避するまたは必要に応じてその収量を改善することが必須である。 Two very important related considerations in the application of the methods described herein are in limited quantities of the original sample (eg, plasma) and materials for obtaining allelic frequencies or other measurements. The number of original molecules. If the number of original molecules is below a certain level, random sampling noise will be significant and can affect the accuracy of the test. In general, measurements on samples containing 500-1000 original molecule equivalents per target locus may provide sufficient quality data for non-invasive prenatal aneuploidy diagnosis. can. There are several ways to increase the number of separate measurements, eg, to increase the volume of the sample. Each operation applied to the sample also results in potential material loss. In order to avoid losses that can degrade the performance of the test, it is essential to characterize the losses incurred by various operations and to avoid certain operations or improve their yields as needed.

ある実施形態では、元の試料(例えば、cfDNA試料)の全てまたはある割合を増幅することによって、その後のステップにおける潜在的な損失を減ずることが可能である。試料中の遺伝物質の全てを増幅し、それにより下流の手順のために利用可能な量を増大させるために、種々の方法が利用可能である。ある実施形態では、ライゲーション媒介性PCR(LM-PCR)DNA断片を、1つの別個のアダプタ、2つの別個のアダプタまたは多くの別個のアダプタのいずれかをライゲーションした後に、PCRによって増幅する。ある実施形態では、多置換増幅(MDA)phi-29ポリメラーゼを使用して、全てのDNAを等温的に増幅する。DOP-PCRおよびその変形では、ランダムプライミングを使用して元の材料DNAを増幅する。各方法は、特定の特性、例えば、代表的なゲノムの領域全てにわたる増幅の均一性、元のDNAの捕捉および増幅の効率、および断片の長さに応じた増幅性能を有する。 In certain embodiments, it is possible to reduce potential losses in subsequent steps by amplifying all or a percentage of the original sample (eg, cfDNA sample). Various methods are available to amplify all of the genetic material in the sample, thereby increasing the amount available for downstream procedures. In one embodiment, a ligation-mediated PCR (LM-PCR) DNA fragment is amplified by PCR after ligating either one separate adapter, two separate adapters, or many separate adapters. In one embodiment, polysubstituted amplification (MDA) fi-29 polymerase is used to isothermally amplify all DNA. In DOP-PCR and its variants, random priming is used to amplify the original material DNA. Each method has specific properties, such as amplification homogeneity over all typical genomic regions, efficiency of capture and amplification of the original DNA, and amplification performance depending on fragment length.

ある実施形態では、LM-PCRを、3’チロシンを有する単一のヘテロ二本鎖アダプタと一緒に使用することができる。ヘテロ二本鎖アダプタにより、PCRの第1ラウンドの間に元のDNA断片の5’末端および3’末端上の2つの別個の配列に変換することができる単一のアダプタ分子を使用することが可能になる。ある実施形態では、サイズ分離によって増幅されたライブラリー、またはAMPURE、TASS、もしくは他の同様の方法などの産物を分画することが可能である。ライゲーションの前に、試料DNAを平滑末端化し、次いで、単一のアデノシン塩基を3’末端に付加する。ライゲーションの前に、DNAを、制限酵素またはいくつかの他の切断方法を用いて切断することができる。ライゲーションの間、試料断片の3’アデノシンおよびアダプタの相補的な3’チロシンオーバーハングにより、ライゲーション効率が増強され得る。PCR増幅の伸長ステップは、約200bp、約300bp、約400bp、約500bpまたは約1,000bpより長い断片からの増幅を低下させるための時間の観点から、限られ得る。母系の血漿中に見いだされるより長いDNAはほぼ排他的に母系であるので、これにより、胎児DNAの10~50%の富化および検査性能の改善がもたらされ得る。市販のキットによって規定されている条件を用いていくつもの反応を実行し、試料DNA分子の10%未満の上首尾のライゲーションがもたらされた。これに対する反応条件の一連の最適化により、ライゲーションがおよそ70%に改善された。 In certain embodiments, LM-PCR can be used with a single heteroduplex adapter having 3'tyrosine. Heteroduplex adapters allow the use of a single adapter molecule that can be converted to two separate sequences on the 5'and 3'ends of the original DNA fragment during the first round of PCR. It will be possible. In certain embodiments, it is possible to fractionate a library amplified by size separation, or a product such as AMPURE, TASS, or other similar method. Prior to ligation, the sample DNA is blunt-ended and then a single adenosine base is added to the 3'end. Prior to ligation, the DNA can be cleaved using restriction enzymes or some other cleavage method. During ligation, the ligation efficiency may be enhanced by the 3'adenosine of the sample fragment and the complementary 3'tyrosine overhang of the adapter. The extension step of PCR amplification can be limited in terms of time to reduce amplification from fragments longer than about 200 bp, about 300 bp, about 400 bp, about 500 bp or about 1,000 bp. Since the longer DNA found in maternal plasma is almost exclusively maternal, this can result in a 10-50% enrichment of fetal DNA and improved testing performance. A number of reactions were performed using the conditions specified by the commercially available kit, resulting in successful ligation of less than 10% of the sample DNA molecules. A series of optimizations of reaction conditions for this improved ligation to approximately 70%.

Mini-PCR
下記のMini-PCR法は、cfDNAなどの短い核酸,消化核酸,またはフラグメント化核酸を含む試料に好適する。従来のPCRアッセイ設計により、特徴的な胎児の分子の損失が大きいが、この損失は、mini-PCRアッセイと称される非常に短いPCRアッセイを設計することによって著しく低下させることができる。母系の血清中の胎児のcfDNAは高度に断片化されており、断片サイズはほぼガウス様式で分布しており、平均が160bpであり、標準偏差が15bpであり、最小サイズが約100bpであり、最大サイズが約220bpである。標的の多型に関する断片の開始位置および終了位置の分布は、必ずしもランダムではないが、個々の標的の間で、および集合的に全ての標的の間で広範に変動し、1つの特定の標的遺伝子座の多型部位は、その遺伝子座を起源とする種々の断片の中で開始から終了までの任意の位置を占有し得る。mini-PCRという用語は、さらなる制限または限定なく、通常のPCRを等しく良好に指し得ることに留意されたい。
Mini-PCR
The Mini-PCR method described below is suitable for samples containing short nucleic acids such as cfDNA, digested nucleic acids, or fragmented nucleic acids. The loss of characteristic fetal molecules is high due to conventional PCR assay design, but this loss can be significantly reduced by designing a very short PCR assay called the mini-PCR assay. The fetal cfDNA in maternal serum is highly fragmented, the fragment size is distributed in a nearly Gaussian fashion, with an average of 160 bp, a standard deviation of 15 bp, and a minimum size of about 100 bp. The maximum size is about 220 bp. The distribution of fragment start and end positions for a target polymorphism is not necessarily random, but varies widely among individual targets and collectively among all targets, with one particular target gene. The locus polymorphic site can occupy any position from start to finish in the various fragments originating from that locus. It should be noted that the term mini-PCR may refer equally well to conventional PCR without further limitation or limitation.

PCRの間、増幅はフォワードプライマー部位とリバースプライマー部位の両方を含む鋳型DNA断片のみから起こる。胎児のcfDNA断片は短いので、両方のプライマー部位が存在する尤度であって、フォワードプライマー部位とリバースプライマー部位の両方を含む長さLの胎児の断片の尤度は、増幅産物の長さと断片の長さの比である。理想的な条件下では、増幅産物が45bp、50bp、55bp、60bp、65bpまたは70bpであるアッセイにより、それぞれ、利用可能な鋳型断片分子の72%、69%、66%、63%、59%または56%から首尾よく増幅される。増幅産物の長さは、フォワードプライミング部位およびリバースプライミング部位の5’末端の間の距離である。当業者により一般に使用されるものよりも短い長さの増幅産物により、必要な短いシーケンスリードのみによる所望の多型遺伝子座のより効率的な測定がもたらされ得る。ある実施形態では、増幅産物の実質的な画分は100bp未満、90bp未満、80bp未満、70bp未満、65bp未満、60bp未満、55bp未満、50bp未満、または45bp未満であるべきである。 During PCR, amplification occurs only from template DNA fragments containing both forward and reverse primer sites. Since the fetal cfDNA fragment is short, the likelihood that both primer sites are present and the likelihood of a long L fetal fragment containing both the forward and reverse primer sites is the length and fragment of the amplification product. Is the ratio of lengths. Under ideal conditions, by assay where the amplification product is 45 bp, 50 bp, 55 bp, 60 bp, 65 bp or 70 bp, 72%, 69%, 66%, 63%, 59% or of the available template fragment molecules, respectively. Amplified successfully from 56%. The length of the amplification product is the distance between the 5'ends of the forward priming site and the reverse priming site. Amplification products of shorter length than those commonly used by those of skill in the art can result in more efficient measurements of the desired polymorphic locus with only the required short sequence reads. In certain embodiments, the substantial fraction of the amplification product should be less than 100 bp, less than 90 bp, less than 80 bp, less than 70 bp, less than 65 bp, less than 60 bp, less than 55 bp, less than 50 bp, or less than 45 bp.

先行技術で公知の方法において、本明細書に記載のものなどの短いアッセイは、必要ではなく、また、プライマーの設計に対して、プライマーの長さの限定、アニーリング特性、およびフォワードプライマーとリバースプライマーの間の距離によってかなりの制約を課すので、通常は回避されることに留意されたい。 In the methods known in the prior art, short assays such as those described herein are not required, and for primer design, primer length limitation, annealing properties, and forward and reverse primers. Note that the distance between them imposes considerable constraints and is usually avoided.

いずれかのプライマーの3’末端が多型部位のおよそ1~6塩基の範囲内である場合、増幅の偏りが潜在的に存在することにも留意されたい。最初にポリメラーゼが結合する部位におけるこの一塩基の差異により、一方の対立遺伝子の優先的な増幅がもたらされる可能性があり、これにより、観察される対立遺伝子頻度が変更され、性能が低下する可能性がある。これらの制約の全てにより、特定の遺伝子座を首尾よく増幅するプライマーを同定すること、およびそれに加えて、同じ多重化反応に適合するプライマーの大きな集合を設計することが非常に困難になる。ある実施形態では、内側のフォワードプライマーおよびリバースプライマーの3’末端を、多型部位の上流にあり、少数の塩基で多型部位から隔てられているDNAの領域とハイブリダイズするように設計する。理想的には、塩基の数は6塩基から10塩基の間であってよいが、同等に良好に、4塩基から15塩基の間、3塩基から20塩基の間、2塩基から30塩基の間または1塩基から60塩基の間であってよく、実質的に同じ結果が実現され得る。 It should also be noted that there is a potential amplification bias if the 3'end of any primer is in the range of approximately 1-6 bases at the polymorphic site. This single-base difference at the site where the polymerase initially binds can result in preferential amplification of one allele, which can alter the frequency of alleles observed and reduce performance. There is sex. All of these constraints make it very difficult to identify primers that successfully amplify a particular locus, and in addition to design a large set of primers that are compatible with the same multiplexing reaction. In one embodiment, the 3'ends of the inner forward and reverse primers are designed to hybridize to regions of DNA that are upstream of the polymorphic site and separated from the polymorphic site by a small number of bases. Ideally, the number of bases may be between 6 and 10 bases, but equally well, between 4 and 15 bases, between 3 and 20 bases, and between 2 and 30 bases. Alternatively, it may be between 1 and 60 bases, and substantially the same result can be achieved.

多重PCRは、全ての標的が増幅される単回ラウンドのPCRを伴ってよい、または、1ラウンドのPCR、その後の1または複数のラウンドのネステッドPCRまたはネステッドPCRのいくつかの変形を伴ってよい。ネステッドPCRは、前のラウンドで使用されたプライマーよりも少なくとも1つの塩基対だけ内部に結合する1個または複数個の新しいプライマーを使用した、次の1または複数のラウンドのPCR増幅からなる。ネステッドPCRにより、正確な内部の配列を有する前の反応からの増幅産物のみを、その後の反応において、増幅することによって偽の増幅標的の数が減少する。偽の増幅標的が減少することにより、特に配列決定において得ることができる有用な測定値の数が改善される。ネステッドPCRは、一般には、前のプライマー結合部位よりも完全に内部のプライマーを設計することを伴い、必然的に、増幅のために必要な最小のDNAセグメントサイズが増大する。DNAが高度に断片化されている母系の血漿cfDNAなどの試料については、より大きなアッセイサイズにより、測定値を得ることができる別個のcfDNA分子の数が減少する。ある実施形態では、この影響を相殺するために、第2ラウンドのプライマーの一方または両方が、いくつかの数の塩基を内部に伸長させている第1の結合部位とオーバーラップしている部分的なネスティング手法を用いて、全アッセイサイズの拡大を最小限にしながらさらに別の特異性を実現することができる。 Multiplex PCR may involve a single round of PCR in which all targets are amplified, or may involve one round of PCR followed by one or more rounds of nested PCR or some variation of nested PCR. .. Nested PCR consists of one or more rounds of PCR amplification using one or more new primers that bind internally by at least one base pair than the primers used in the previous round. Nested PCR reduces the number of false amplification targets by amplifying only amplification products from the previous reaction with the correct internal sequence in subsequent reactions. The reduction of sham amplification targets improves the number of useful measurements that can be obtained, especially in sequencing. Nested PCR generally involves designing a primer that is more completely internal than the previous primer binding site, which inevitably increases the minimum DNA segment size required for amplification. For samples such as maternal plasma cfDNA, where the DNA is highly fragmented, the larger assay size reduces the number of separate cfDNA molecules from which measurements can be obtained. In one embodiment, to offset this effect, one or both of the second round primers partially overlap with the first binding site, which extends some bases inward. Nesting techniques can be used to achieve yet another specificity while minimizing the increase in total assay size.

ある実施形態では、PCRアッセイの多重プールを、潜在的にヘテロ接合性である1個または複数個の染色体上のSNPまたは他の多型遺伝子座または非多型遺伝子座を増幅するように設計し、これらのアッセイを単一反応において用いてDNAを増幅する。PCRアッセイの数は、50回から200回の間のPCRアッセイ、200回から1,000回の間のPCRアッセイ、1,000回から5,000回の間のPCRアッセイまたは5,000回から20,000回の間のPCRアッセイ(50~200プレックス、200~1,000プレックス、1,000~5,000プレックス、5,000~20,000プレックス、20,000超プレックスそれぞれ)であってよい。ある実施形態では、約10,000PCRアッセイ(10,000プレックス)の多重プールを、X染色体、Y染色体、第13染色体、第18染色体、および第21染色体および第1染色体または第2染色体上の潜在的にヘテロ接合性であるSNP遺伝子座を増幅するように設計し、これらのアッセイを単一反応において用いて、材料血漿試料、絨毛膜絨毛試料、羊水穿刺試料、単一または少数の細胞、他の体液または組織、がんまたは他の遺伝物質から得られたcfDNAを増幅する。各遺伝子座のSNP頻度は、増幅産物の配列決定のクローンによる方法またはいくつかの他の方法によって決定することができる。対立遺伝子頻度分布の統計分析または全てのアッセイの比を使用して、試料が、検査に含まれる染色体のうちの1個または複数個のトリソミーを含有するかどうかを決定することができる。別の実施形態では、元のcfDNA試料を2つの試料に分割し、並行した5,000プレックスアッセイを実施する。別の実施形態では、元のcfDNA試料をn個の試料に分割し、並行した(約10,000/n)プレックスアッセイを実施し、ここでnは、2から12の間または12から24の間または24から48の間または48から96の間である。データを収集し、既に記載されているものと同様に分析する。この方法は、転座、欠失、重複、および他の染色体異常を検出することに同等に良好に適用可能であることに留意されたい。 In one embodiment, the multiple pool of PCR assays is designed to amplify SNPs or other polymorphic or non-polymorphic loci on one or more chromosomes that are potentially heterozygous. , These assays are used in a single reaction to amplify the DNA. The number of PCR assays is 50 to 200 PCR assays, 200 to 1,000 PCR assays, 1,000 to 5,000 PCR assays or 5,000 to 5,000. PCR assays between 20,000 times (50-200 plexes, 200-1,000 plexes, 1,000-5,000 plexes, 5,000-20,000 plexes, 20,000-plus plexes, respectively). good. In one embodiment, multiple pools of approximately 10,000 PCR assays (10,000 plexes) are latent on the X, Y, 13th, 18th, and 21st and 1st or 2nd chromosomes. Designed to amplify the SNP chromosome, which is heterozygous, and using these assays in a single reaction, material plasma samples, chorionic villi samples, sheep's water puncture samples, single or few cells, etc. Amplifies cfDNA obtained from body fluids or tissues, cancer or other genetic material. The SNP frequency of each locus can be determined by clonal methods of sequencing the amplification product or by some other method. Statistical analysis of the allele frequency distribution or ratios of all assays can be used to determine if a sample contains trisomy of one or more of the chromosomes included in the test. In another embodiment, the original cfDNA sample is split into two samples and a parallel 5,000-plex assay is performed. In another embodiment, the original cfDNA sample is divided into n samples and a parallel (about 10,000 / n) plex assay is performed where n is between 2 and 12 or between 12 and 24. Between 24 and 48 or between 48 and 96. Collect data and analyze as described already. It should be noted that this method is equally well applicable to detect translocations, deletions, duplications, and other chromosomal abnormalities.

ある実施形態では、標的ゲノムに対する相同性を有さない尾部をプライマーのいずれかの3’末端または5’末端に付加することもできる。これらの尾部により、その後の操作、手順または測定が容易になる。ある実施形態では、尾部配列は、標的特異的フォワードプライマーと標的特異的リバースプライマーに対して同じであってよい。ある実施形態では、標的特異的フォワードプライマーと標的特異的リバースプライマーのために異なる尾部を用いることができる。ある実施形態では、異なる遺伝子座または遺伝子座の集合に対して複数の異なる尾部を用いることができる。全ての遺伝子座の間で、または遺伝子座のサブセットの間で特定の尾部が共有されてよい。例えば、現行の配列決定プラットフォームのいずれかに必要なフォワード配列およびリバース配列に対応するフォワード尾部およびリバース尾部を用いて、増幅後の直接配列決定が可能になる。ある実施形態では、尾部を、全ての増幅された標的の間で、他の有用な配列を付加するために使用することができる一般的なプライミング部位として使用することができる。いくつかの実施形態では、内側のプライマーは、標的の遺伝子座(例えば、多型遺伝子座)の上流または下流のいずれかとハイブリダイズするように設計された領域を含有してよい。いくつかの実施形態では、プライマーは、分子バーコードを含有してよい。いくつかの実施形態では、プライマーは、PCR増幅が可能になるように設計されたユニバーサルプライミング配列を含有してよい。 In certain embodiments, a tail that is not homologous to the target genome can also be added to either the 3'end or the 5'end of the primer. These tails facilitate subsequent operations, procedures or measurements. In certain embodiments, the tail sequence may be the same for the target-specific forward primer and the target-specific reverse primer. In certain embodiments, different tails can be used for target-specific forward and target-specific reverse primers. In certain embodiments, a plurality of different tails can be used for different loci or sets of loci. A particular tail may be shared among all loci or between a subset of loci. For example, forward and reverse tails corresponding to the forward and reverse sequences required for any of the current sequencing platforms can be used for direct sequencing after amplification. In certain embodiments, the tail can be used as a general priming site that can be used to add other useful sequences among all amplified targets. In some embodiments, the inner primer may contain a region designed to hybridize either upstream or downstream of the target locus (eg, a polymorphic locus). In some embodiments, the primer may contain a molecular barcode. In some embodiments, the primer may contain a universal priming sequence designed to allow PCR amplification.

ある実施形態では、10,000プレックスPCRアッセイプールを、フォワードプライマーおよびリバースプライマーが、ハイスループット配列決定計器、例えば、ILLUMINAから入手可能なHISEQ、GAIIXまたはMYSEQに必要な所要のフォワード配列およびリバース配列に対応する尾部を有するように作製する。さらに、配列決定尾部に対して5’側には、その後のPCRにおいて増幅産物にヌクレオチドバーコード配列を付加するためのプライミング部位として用いることができるさらに別の配列が含まれ、それにより、複数の試料をハイスループット配列決定計器の単一のレーンで多重化シークエンシングが可能になる。 In one embodiment, a 10,000-plex PCR assay pool is provided with forward and reverse primers to the required forward and reverse sequences required for a high-throughput sequencing instrument, eg, HISEQ, GAIIX or MYSEQ available from ILLUMINA. Make to have a corresponding tail. In addition, the 5'side of the sequencing tail contains yet another sequence that can be used as a priming site for adding the nucleotide barcode sequence to the amplification product in subsequent PCR, thereby providing multiple sequences. Samples can be multiplexed and sequenced in a single lane of a high-throughput sequencing instrument.

ある実施形態では、10,000プレックスPCRアッセイプールを、リバースプライマーが、ハイスループット配列決定計器に必要な所要のリバース配列に対応する尾部を有するように作製する。第1の10,000プレックスアッセイで増幅した後、その後のPCR増幅を、全ての標的に対して部分ネステッドフォワードプライマー(例えば、6塩基ネステッド)、および第1ラウンドに含まれたリバース配列決定尾部に対応するリバースプライマーを有する別の10,000プレックスプールを使用して実施することができる。この、ただ1つの標的特異的プライマーおよびユニバーサルプライマーを用いた部分ネステッド増幅の次のラウンドでは、アッセイに必要なサイズが限られ、サンプリングノイズが低下するが、偽の増幅産物の数が著しく減少する。配列決定タグを、付加したライゲーションアダプタに、および/またはPCRプローブの一部として付加することができ、したがって、タグは最後の増幅産物の一部になる。 In one embodiment, a 10,000-plex PCR assay pool is made such that the reverse primer has a tail corresponding to the required reverse sequence required for a high-throughput sequencing instrument. After amplification in the first 10,000-plex assay, subsequent PCR amplification was applied to partially nested forward primers (eg, 6-base nested) for all targets, and to the reverse sequencing tail included in the first round. It can be performed using another 10,000 plex pool with the corresponding reverse primer. In the next round of this partial nested amplification with only one target-specific primer and universal primer, the size required for the assay is limited, sampling noise is reduced, but the number of false amplification products is significantly reduced. .. The sequencing tag can be attached to the attached ligation adapter and / or as part of the PCR probe, thus the tag becomes part of the final amplification product.

胎児画分は検査の性能に影響を及ぼす。母系の血漿中に見いだされるDNAの胎児画分を富化するためのいくつもの方法が存在する。胎児画分は、既に考察されている上記のLM-PCR法によって、ならびに長い母系断片の標的化除去によって増大させることができる。ある実施形態では、標的遺伝子座の多重PCR増幅の前に、追加の多重PCR反応を行って、その後の多重PCRにおいて標的とされる遺伝子座に対応する長くて大きい母系断片を選択的に除去することができる。追加のプライマーを、無細胞の胎児DNA断片の間に存在することが予想されるよりも多型からの距離が長い部位とアニーリングするように設計する。これらのプライマーは、標的多型遺伝子座の多重PCRの前の1サイクル多重PCR反応において用いることができる。これらの遠位プライマーには、タグを付けたDNAの小片の選択的な認識を可能にし得る分子または部分でタグ付けする。ある実施形態では、これらのDNAの分子は、1サイクルのPCR後に、これらのプライマーを含む新しく形成された二本鎖DNAを除去することを可能にするビオチン分子を用いて共有結合的に修飾することができる。その第1ラウンドの間に形成された二本鎖DNAは、母体起源であるようである。ハイブリッド材料の除去は、磁性ストレプトアビジンビーズを使用することにより実現することができる。同等に良好に機能し得るタグ付けの他の方法が存在する。ある実施形態では、サイズ選択法を使って、例えば、約800bp未満、約500bp未満、または約300bp未満のDNAなどのより短鎖のDNAのために試料を富化できる。次いで、短い断片の増幅を通常通り進める。 The fetal fraction affects the performance of the test. There are several ways to enrich the fetal fraction of DNA found in maternal plasma. The fetal fraction can be increased by the above-mentioned LM-PCR method already discussed, as well as by targeted removal of long maternal fragments. In one embodiment, an additional multiplex PCR reaction is performed prior to the multiplex PCR amplification of the target locus to selectively remove the long and large maternal fragments corresponding to the targeted locus in subsequent multiplex PCR. be able to. Additional primers are designed to anneal to sites that are farther from the polymorphism than would be expected to be present between cell-free fetal DNA fragments. These primers can be used in a one-cycle multiplex PCR reaction prior to multiplex PCR at the target polymorphism locus. These distal primers are tagged with molecules or moieties that may allow selective recognition of tagged pieces of DNA. In certain embodiments, these DNA molecules are covalently modified with a biotin molecule that allows removal of newly formed double-stranded DNA containing these primers after one cycle of PCR. be able to. The double-stranded DNA formed during that first round appears to be of maternal origin. Removal of the hybrid material can be achieved by using magnetic streptavidin beads. There are other methods of tagging that can work equally well. In certain embodiments, the size selection method can be used to enrich the sample for shorter strands of DNA, such as DNA less than about 800 bp, less than about 500 bp, or less than about 300 bp. The amplification of the short pieces is then proceeded normally.

本開示に記載のmini-PCR法により、単一反応において、単一の試料から数百~数千、またはさらに数百万もの遺伝子座の高度に多重化された増幅および分析が可能になる。同時に、増幅されたDNAの検出を多重化することができ、バーコーディングPCRを用いることによって、数十~数百の試料を1つの配列決定レーンにおいて多重化することができる。この多重化検出は、最大49プレックスまで首尾よく試験されており、はるかに高い程度の多重化が可能である。事実上、これにより、単回の配列決定の実行で、数百の試料について数千ものSNPにおける遺伝子型決定することが可能になる。これらの試料について、前記方法により、遺伝子型およびヘテロ接合性率を決定すること、また、同時に、コピー数を決定することが可能になり、これらはどちらも異数性を検出するために用いることができる。この方法は、母系の血漿中に見いだされる浮動性DNAから妊娠中の胎児の異数性を検出することにおいて特に有用である。この方法は、胎児の性判別をし、かつ/または胎児の父系性を予測するための方法の一部として用いることができる。この方法は、変異量決定ための方法の一部として用いることができる。この方法は、任意の量のDNAまたはRNAに対して用いることができ、標的の領域はSNP、他の多型領域、非多型領域、およびそれらの組み合わせであってよい。 The mini-PCR method described in the present disclosure allows for highly multiplexed amplification and analysis of hundreds to thousands, or even millions of loci from a single sample in a single reaction. At the same time, the detection of amplified DNA can be multiplexed, and by using barcoding PCR, tens to hundreds of samples can be multiplexed in one sequencing lane. This multiplexing detection has been successfully tested up to 49 plexes, allowing a much higher degree of multiplexing. In effect, this allows a single sequence sequence to be genotyped in thousands of SNPs for hundreds of samples. For these samples, the method described above allows the genotype and heterozygotes to be determined, and at the same time, the number of copies, both of which are used to detect aneuploidy. Can be done. This method is particularly useful in detecting fetal aneuploidy during pregnancy from floating DNA found in maternal plasma. This method can be used as part of a method for determining fetal sex and / or predicting fetal paternity. This method can be used as part of the method for determining the amount of mutation. This method can be used for any amount of DNA or RNA, and the target region may be SNPs, other polymorphic regions, non-polymorphic regions, and combinations thereof.

いくつかの実施形態では、断片化されたDNAのライゲーション媒介性ユニバーサルPCR増幅を用いることができる。ライゲーション媒介性ユニバーサルPCR増幅を用いて、血漿DNAを増幅することができ、次いで、それを複数の並行した反応へと分割することができる。ライゲーション媒介性ユニバーサルPCR増幅は、短い断片を優先的に増幅し、それにより、胎児画分を富化するためにも用いることができる。いくつかの実施形態では、ライゲーションによって断片にタグを付加することにより、より短い断片を検出すること、プライマーのより短い標的配列特異的部分を使用すること、および/または非特異的な反応を減少させるより高温でアニーリングすることを可能にし得る。 In some embodiments, ligation-mediated universal PCR amplification of fragmented DNA can be used. Plasma DNA can be amplified using ligation-mediated universal PCR amplification, which can then be divided into multiple parallel reactions. Ligation-mediated universal PCR amplification can also be used to preferentially amplify short fragments, thereby enriching the fetal fraction. In some embodiments, tagging the fragment by ligation detects shorter fragments, uses a shorter target sequence-specific portion of the primer, and / or reduces non-specific reactions. It may be possible to anneal at a higher temperature than letting it.

本明細書に記載の方法は、ある量の混入DNAと混在している標的DNAの集合が存在する場合の、いくつもの目的のために用いることができる。いくつかの実施形態では、標的DNAおよび混入DNAは、遺伝的に関連する個体由来であってよい。例えば、胎児(標的)における遺伝子の異常は、胎児(標的)のDNAおよび同様に母系の(混入)DNAを含有する母系の血漿から検出することができ、異常としては、全染色体異常(例えば、異数性)、部分的な染色体異常(例えば、欠失、重複、逆位、転座)、ポリヌクレオチド多型(例えば、STR)、一塩基多型、および/または他の遺伝子の異常または差異が挙げられる。いくつかの実施形態では、標的DNAおよび混入DNAは、同じ個体由来であってよいが、例えば、がんの場合には、標的DNAと混入DNAが1個または複数個の変異によって異なる (例えば、H.Mamon et al.Preferential Amplification of Apoptotic DNA from Plasma:Potential for Enhancing Detection of Minor DNA Alterations in Circulating DNA.Clinical Chemistry 54:9(2008)、を参照)。いくつかの実施形態では、DNAは、細胞培養物(アポトーシス性)上清中に見いだすことができる。いくつかの実施形態では、その後のライブラリーの調製、増幅および/または配列決定のために、生体試料(例えば、血液)においてアポトーシスを誘導することが可能である。この目的を実現するためのいくつもの可能となるワークフローおよびプロトコールが本開示の他の箇所に示されている。 The methods described herein can be used for a number of purposes in the presence of a collection of target DNA mixed with a certain amount of contaminating DNA. In some embodiments, the target DNA and contaminating DNA may be of genetically related individual origin. For example, genetic abnormalities in the fetal (target) can be detected in maternal plasma containing fetal (target) DNA as well as maternal (contaminated) DNA, and the abnormalities include all chromosomal abnormalities (eg, for example). Abnormalities or differences in chromosomal abnormalities (eg, deletions, duplications, inversions, translocations), polynucleotide polymorphisms (eg, STR), monobase polymorphisms, and / or other genes. Can be mentioned. In some embodiments, the target DNA and the contaminating DNA may be from the same individual, but in the case of cancer, for example, the target DNA and the contaminating DNA will differ by one or more mutations (eg,). H. Mamon et al. Priorential Amplification of Apoptotic DNA from Plasma: Potential for Enchanting Detection of Minor DNA Alterations in Circulation2 (Circulating DNA) 54. In some embodiments, DNA can be found in cell culture (apoptotic) supernatants. In some embodiments, it is possible to induce apoptosis in a biological sample (eg, blood) for subsequent library preparation, amplification and / or sequencing. A number of possible workflows and protocols for achieving this goal are set forth elsewhere in this disclosure.

いくつかの実施形態では、標的DNAは、単一細胞、標的ゲノムの1個に満たないコピーからなるDNA試料、小量のDNA、混合起源からのDNA(例えば、妊娠血漿:胎盤および母系DNA;癌患者血漿および腫瘍:健康および癌DNAの混合物、移植片、など)、他の体液,細胞培養物、培養上清、法医学DNA試料、古代DNA試料(例えば、琥珀中に捕捉された昆虫),他のDNA試料、およびこれらの組み合わせ由来であってよい。 In some embodiments, the target DNA is a single cell, a DNA sample consisting of less than one copy of the target genome, a small amount of DNA, DNA from a mixed origin (eg, pregnancy plasma: placenta and maternal DNA; Cancer Patients Plasma and Tumors: Mixtures of Healthy and Cancer DNA, Transplants, etc.), Other Body Fluids, Cell Cultures, Culture Supernatants, Forensic DNA Samples, Ancient DNA Samples (eg, Insects Captured in Amber), It may be derived from other DNA samples, and combinations thereof.

いくつかの実施形態では、短い増幅産物サイズを用いることができる。短い増幅産物サイズは、断片化されたDNAに特に適している(例えば、A. Sikoraら、Detection of increased amounts of cell-free fetal DNA with short PCR amplicons.Clin Chem. 2010年1月;56巻(1号):136~8頁を参照されたい)。 In some embodiments, short amplification product sizes can be used. The short amplification product size is particularly suitable for fragmented DNA (eg, A. Sikora et al., Detection of increased amounts of cell-free fetal DNA with short PCR amplifiers. Clin Chem. 2010; No. 1)), see pages 136-8).

短い増幅産物サイズを用いることにより、いくつかの重要な利益がもたらされ得る。短い増幅産物サイズにより、最適化された増幅効率がもたされ得る。短い増幅産物サイズにより、一般には、より短い産物が生じ、したがって、非特異的なプライミングの見込みは少ない。より短い産物は、クラスターがより小さくなるほど、配列決定フローセル上により高密度にクラスター化することができる。本明細書に記載の方法は、より長いPCR増幅産物に対して同等に良好に機能し得ることに留意されたい。増幅産物の長さは、必要であれば、例えば、より大きな配列の範囲について配列決定する場合には増大させることができる。ネステッドPCRプロトコールの第1のステップとして100bp~200bp長のアッセイを伴う146プレックス標的化増幅を用いた実験を、単一細胞およびゲノムDNAに対して行い、陽性の結果を得た。 The use of short amplification product sizes can provide some significant benefits. Short amplification product sizes can provide optimized amplification efficiency. Short amplification product sizes generally result in shorter products, and therefore the likelihood of non-specific priming is low. Shorter products can be clustered more densely on the sequencing flow cell as the clusters become smaller. It should be noted that the methods described herein may work equally well for longer PCR amplification products. The length of the amplification product can be increased if desired, for example, when sequencing on a larger sequence range. Experiments with 146-plex targeted amplification with 100bp-200bp length assays were performed on single cell and genomic DNA as the first step in the nested PCR protocol with positive results.

いくつかの実施形態では、本明細書に記載の方法を用いて、SNP、コピー数、ヌクレオチドのメチル化、mRNAのレベル、他の種類のRNAの発現レベル、他の遺伝子の形体および/または後成的な形体を増幅し、かつ/または検出することができる。本明細書に記載のmini-PCR法は、次世代配列決定と一緒に用いることができ、前記方法は、他の下流の方法、例えば、マイクロアレイ、デジタルPCRによる計数、リアルタイムPCR、質量分析などと一緒に用いることができる。 In some embodiments, the methods described herein are used to SNP, copy count, nucleotide methylation, mRNA levels, other types of RNA expression levels, other gene forms and / or posterior. Synthetic forms can be amplified and / or detected. The mini-PCR method described herein can be used in conjunction with next-generation sequencing, which can be used with other downstream methods such as microarrays, digital PCR counting, real-time PCR, mass spectrometry, and the like. Can be used together.

いくつかの実施形態では、本明細書に記載のmini-PCR増幅方法は、少数集団を正確に定量化するための方法の一部として用いることができる。前記方法は、スパイク較正物質を使用した絶対的定量化のために用いることができる。前記方法は、超ディープシーケンシングによる、変異/微量な対立遺伝子の定量化のために用いることができ、高度に多重化された様式で実行することができる。前記方法は、ヒト、動物、植物または他の生き物における近親者または祖先の標準の父系性および同一性検査のために用いることができる。前記方法は、法医学的試験のために用いることができる。前記方法は、任意の種類の材料、例えば、羊水およびCVS、精子、受胎産物(POC)に対する迅速な遺伝子型決定およびコピー数解析(CN)のために用いることができる。前記方法は、胚からの生検試料に対する遺伝子型決定などの単一細胞分析のために用いることができる。前記方法は、min-PCRを用いた標的化配列決定による迅速な胚分析(生検から1日未満、1日、または2日以内)のために用いることができる。 In some embodiments, the mini-PCR amplification methods described herein can be used as part of a method for accurately quantifying a minority population. The method can be used for absolute quantification using spike calibrators. The method can be used for quantification of mutations / trace alleles by ultra-deep sequencing and can be performed in a highly multiplexed fashion. The method can be used for standard paternality and identity testing of relatives or ancestors in humans, animals, plants or other organisms. The method can be used for forensic examinations. The method can be used for rapid genotyping and copy number analysis (CN) for any type of material, such as amniotic fluid and CVS, sperm, conceptus (POC). The method can be used for single cell analysis such as genotyping of biopsy samples from embryos. The method can be used for rapid embryo analysis by targeted sequencing using min-PCR (less than 1 day, 1 day, or 2 days after biopsy).

いくつかの実施形態では、mini-PCR増幅方法は、腫瘍分析に使用できる:腫瘍生検は、健康と腫瘍細胞の混合物であることが多い。標的PCRにより、近くにバックグラウンド配列がないSNPおよび遺伝子座のディープシーケンシングが可能になる。前記方法は、腫瘍DNAに対するコピー数およびヘテロ接合性の損失の分析のために用いることができる。前記腫瘍DNAは、腫瘍患者の多くの異なる体液または組織に存在し得る。前記方法は、腫瘍の再発の検出および/または腫瘍スクリーニングのために用いることができる。前記方法は、種子の品質管理試験のために用いることができる。前記方法は、育種または漁業のために用いることができる。これらの方法はいずれも、倍数性コールのための非多型の遺伝子座の標的化に同等に良好に用いることができることに留意されたい。 In some embodiments, the mini-PCR amplification method can be used for tumor analysis: tumor biopsy is often a mixture of health and tumor cells. Targeted PCR enables deep sequencing of SNPs and loci with no nearby background sequences. The method can be used for analysis of copy count and heterozygous loss to tumor DNA. The tumor DNA can be present in many different body fluids or tissues of a tumor patient. The method can be used for detection of tumor recurrence and / or tumor screening. The method can be used for seed quality control tests. The method can be used for breeding or fishing. It should be noted that both of these methods can be used equally well for targeting non-polymorphic loci for polymorphic calls.

本開示の基礎になるいくつかの基本的な方法を記載している一部の文献には、(1)Wang HY,Luo M,Tereshchenko IV,Frikker DM,Cui X,LiJ Y,Hu G,Chu Y,Azaro MA,Lin Y,Shen L,Yang Q,Kambouris ME,Gao R,Shih W,LiH.Genome Res.2005 Feb;15(2):276-83.Department of Molecular Genetics,Microbiology and Immunology/The Cancer Institute of New Jersey,Robert Wood Johnson Medical School,New Brunswick,New Jersey 08903,USA.(2)High-throughput genotyping of single nucleotide polymorphisms with high sensitivity.Li H,Wang HY,Cui X,Luo M,Hu G,Greenawalt DM,Tereshchenko IV,Li JY,Chu Y,Gao R.Methods Mol Biol.2007;396-PubMed PMID:18025699.(3)Nested Patch PCR enables highly multiplexed mutation discovery in candidate genes.Varley KE,Mitra RD.Genome Res.2008 Nov;18(11):1844-50.Epub 2008 Oct 10(この文献にはシーケンシング用の平均9種のアッセイの多重化を含む方法が記載されている)、が含まれる。本明細書に開示されている方法により、上記の参考文献におけるものよりも桁の大きい多重化が可能になることに留意されたい。 Some references describing some of the basic methods underlying this disclosure include (1) Wang HY, Luo M, Tereshchenko IV, Frikker DM, Cui X, LiJ Y, Hu G, Chu. Y, Azaro MA, Lin Y, Shen L, Yang Q, Kambouris ME, Gao R, Shih W, LiH. Genome Res. 2005 Feb; 15 (2): 276-83. Department of Molecular Genetics, Microbiology and Immunology / The Cancer Institute of New Jersey, Robot Wood Jones3, New Brunswick, New Brunswick, New Brunswick, New Brunswick, New Brunswick, New Brunswick, New Brunswick, New Brunswick, New Brunswick, New Brunswick, (2) High-throughput genotyping of single nucleic acid polymorphisms with high sensitivity. Li H, Wang HY, Cui X, Luo M, Hu G, Greenawalt DM, Tereshchenko IV, Li JY, Chu Y, Gao R. Methods Mol Biol. 2007; 396-PubMed PMID: 18025699. (3) Next Patch PCR enables highly multiplexed mutation discovery discovery genes. Varley KE, Mitra RD. Genome Res. 2008 Nov; 18 (11): 1844-50. EPUB 2008 Oct 10 (this document describes a method comprising multiplexing an average of 9 assays for sequencing). It should be noted that the methods disclosed herein allow for multiplexes that are orders of magnitude higher than those in the references above.

標的PCRの変形物-ネスティング
PCRを行う場合に可能である多くのワークフローが存在し、本明細書に開示されている方法に典型的ないくつかのワークフローが記載されている。本明細書において概説されているステップは、他の可能性のあるステップを排除することを意図しておらず、かつ、方法が適正に機能するために本明細書に記載のステップいずれかが必要であることも意味しない。多数のパラメータの変形または他の改変が文献において公知であり、本発明の核心に影響を及ぼすことなく行うことができる。1つの特定の一般的なワークフローが下に示され、その後にいくつもの可能性のある変形物(variant)が続く。変形物とは、一般には、可能性のある二次PCR反応、例えば、行うことができる異なる種類のネスティング(ステップ3)を指す。変形物は、本明細書に明確に記載されているものと違う時間において、または異なる順序で行うことができることに留意することが重要である。説明のために多形遺伝子座を使用している例は、必要に応じ、非多形遺伝子座の増幅に容易に適合させることができる。
1. 試料中のDNAには、多くの場合ライブラリータグまたはライゲーションアダプタタグ(LT)と称されるライゲーションアダプタを付加することができ、ライゲーションアダプタはユニバーサルプライミング配列を含有し、その後にユニバーサル増幅が続く。ある実施形態では、これは、断片化後に、配列決定ライブラリーを作製するために設計された標準のプロトコールを使用して行うことができる。ある実施形態では、DNA試料を平滑末端化し、次いで、Aを3’末端に付加することができる。T-オーバーハングを有するY-アダプタを付加し、ライゲーションすることができる。いくつかの実施形態では、AまたはTオーバーハング以外の他の粘着末端を使用することができる。いくつかの実施形態では、他のアダプタ、例えば、ループライゲーションアダプタを付加することができる。いくつかの実施形態では、アダプタは、PCR増幅のために設計されたタグを有してよい。
2. 特異的標的増幅(STA):数百、数千、数万、さらには数十万もの標的を1反応体積において前増幅で多重化することができる。STAは、一般には、10~30サイクル実行されるが、5~40サイクル、2~50サイクル、およびさらには1~100サイクル実行することができる。例えば、より単純なワークフローのため、または大部分の二量体の配列決定を回避するために、プライマーに尾部を付けることができる。一般には、同じタグを保有する両方のプライマーの二量体は効率的に増幅または配列決定されないことに留意されたい。いくつかの実施形態では、1サイクルから10サイクルの間のPCRを行うことができ、いくつかの実施形態では、10サイクルから20サイクルの間のPCRを行うことができ、いくつかの実施形態では、20サイクルから30サイクルの間のPCRを行うことができ、いくつかの実施形態では、30サイクルから40サイクルの間のPCRを行うことができ、いくつかの実施形態では、40サイクル超のPCRを行うことができる。増幅は、線形増幅であってよい。PCRサイクルの数を最適化して、最適なリード深度(DOR)プロファイルをもたらすことができる。異なるDORプロファイルは異なる目的のために望ましい場合がある。いいくつかの実施形態では、全てのアッセイ間のリードのより均一な分布が望ましい;いくつかのアッセイについてDORが非常に小さい場合、データが非常に有用であるためには確率論的ノイズが高すぎる可能性があるが、リード深度が非常に深い場合、各追加のリードの限界有用性は比較的小さい。
プライマー尾部により、普遍的にタグを付けたライブラリーからの断片化されたDNAの検出を改善することができる。ライブラリータグおよびプライマー尾部が相同な配列を含有する場合、ハイブリダイゼーションを改善することができ(例えば、融解温度(T)を下げる)、プライマー標的配列の一部が試料のDNA断片内にある場合にのみ、プライマーを伸長することができる。いくつかの実施形態では、13以上の標的特異的塩基対を用いることができる。いくつかの実施形態では、10~12の標的特異的塩基対を用いることができる。いくつかの実施形態では、8~9の標的特異的塩基対を用いることができる。いくつかの実施形態では、6~7の標的特異的塩基対を用いることができる。いくつかの実施形態では、STAは、前増幅されたDNA、例えば、MDA、RCA、他の全ゲノム増幅またはアダプタ-媒介性ユニバーサルPCRに対して実施することができる。いくつかの実施形態では、STAは、例えば、サイズ選択、標的捕捉、指向性分解によって特定の配列および集団が富化された、または枯渇した試料に対して実施することができる。
3. いくつかの実施形態では、二次的な多重PCRまたはプライマー伸長反応を実施して、特異性を増大させ、望ましくない産物を減少させることが可能である。例えば、完全なネスティング、セミネスティング、ヘミネスティング、および/またはより小さなアッセイプールの並行した反応への細分化は、全て、特異性を増大させるために用いることができる技法である。実験により、試料を3回の400プレックス反応に分割することにより、正確に同じプライマーを用いた1回の1,200プレックス反応よりも高い特異性で産物DNAがもたらされることが示された。同様に、実験により、試料を4回の2,400プレックス反応に分割することにより、正確に同じプライマーを用いた1回の9,600プレックス反応よりも高い特異性で産物DNAがもたらされることが示された。ある実施形態では、同じ方向性および反対の方向性の標的特異的プライマーおよびタグ特異的プライマーを用いることが可能である。
4. いくつかの実施形態では、STA反応によって産生されるDNA試料(希釈、精製またはその他)をタグ特異的プライマーおよび「ユニバーサル増幅」を用いて増幅すること、すなわち、前増幅し、タグを付けた標的の多くまたは全てを増幅することが可能である。プライマーは、ハイスループット配列決定プラットフォームにおける配列決定に必要な追加の機能的な配列、例えば、バーコードまたは完全なアダプタ配列を含有してよい。
Variants of Targeted PCR-There are many workflows possible when performing nesting PCR, and some workflows typical of the methods disclosed herein are described. The steps outlined herein are not intended to rule out other possible steps, and any of the steps described herein is required for the method to function properly. It does not mean that it is. Modifications of many parameters or other modifications are known in the literature and can be done without affecting the core of the invention. One particular general workflow is shown below, followed by a number of possible variants. Variants generally refer to possible secondary PCR reactions, such as different types of nesting (step 3) that can be performed. It is important to note that variants can be made at different times or in different orders than those expressly described herein. Examples using polymorphic loci for illustration can be readily adapted for amplification of non-polymorphic loci, if desired.
1. 1. A ligation adapter, often referred to as a library tag or ligation adapter tag (LT), can be attached to the DNA in the sample, the ligation adapter containing a universal priming sequence, followed by universal amplification. In certain embodiments, this can be done after fragmentation using a standard protocol designed to generate a sequencing library. In certain embodiments, the DNA sample can be blunt-ended and then A can be added to the 3'end. A Y-adapter with a T-overhang can be added and ligated. In some embodiments, other sticky ends other than A or T overhangs can be used. In some embodiments, other adapters, such as loop ligation adapters, can be added. In some embodiments, the adapter may have a tag designed for PCR amplification.
2. 2. Specific Target Amplification (STA): Hundreds, thousands, tens of thousands, and even hundreds of thousands of targets can be pre-amplified and multiplexed in one reaction volume. The STA is generally performed for 10 to 30 cycles, but can be performed for 5 to 40 cycles, 2 to 50 cycles, and even 1 to 100 cycles. For example, primers can be tailed for a simpler workflow or to avoid sequencing most dimers. Note that in general, dimers of both primers carrying the same tag are not efficiently amplified or sequenced. In some embodiments, PCR can be performed between 1 and 10 cycles, in some embodiments, PCR can be performed between 10 and 20 cycles, and in some embodiments, PCR can be performed. , 20 to 30 cycles of PCR can be performed, in some embodiments 30 to 40 cycles of PCR can be performed, and in some embodiments more than 40 cycles of PCR can be performed. It can be performed. The amplification may be linear amplification. The number of PCR cycles can be optimized to provide the optimum read depth (DOR) profile. Different DR profiles may be desirable for different purposes. In some embodiments, a more uniform distribution of reads across all assays is desired; if the DOR is very small for some assays, the probabilistic noise is high for the data to be very useful. It may be too deep, but if the lead depth is very deep, the marginal usefulness of each additional lead is relatively small.
The primer tail can improve the detection of fragmented DNA from universally tagged libraries. Hybridization can be improved (eg, lowering the melting temperature ( TM )) if the library tag and primer tail contain homologous sequences, and some of the primer target sequences are within the DNA fragment of the sample. Only if can the primer be extended. In some embodiments, 13 or more target-specific base pairs can be used. In some embodiments, 10-12 target-specific base pairs can be used. In some embodiments, 8-9 target-specific base pairs can be used. In some embodiments, 6-7 target-specific base pairs can be used. In some embodiments, the STA can be performed against pre-amplified DNA, such as MDA, RCA, other whole genome amplification or adapter-mediated universal PCR. In some embodiments, the STA can be performed, for example, on a sample enriched or depleted of a particular sequence and population by size selection, target capture, directional degradation.
3. 3. In some embodiments, it is possible to perform a secondary multiplex PCR or primer extension reaction to increase specificity and reduce unwanted products. For example, complete nesting, semi-nesting, heminesting, and / or subdivision of smaller assay pools into parallel reactions are all techniques that can be used to increase specificity. Experiments have shown that dividing the sample into three 400-plex reactions yields product DNA with higher specificity than a single 1,200-plex reaction with exactly the same primers. Similarly, experiments can show that dividing the sample into four 2,400 plex reactions yields product DNA with higher specificity than a single 9,600 plex reaction with exactly the same primers. Shown. In certain embodiments, it is possible to use target-specific and tag-specific primers in the same and opposite directions.
4. In some embodiments, the DNA sample (diluted, purified or otherwise) produced by the STA reaction is amplified using tag-specific primers and "universal amplification", i.e., pre-amplified and tagged targets. It is possible to amplify many or all of them. Primers may contain additional functional sequences required for sequencing on high-throughput sequencing platforms, such as barcodes or complete adapter sequences.

これらの方法は、任意のDNAの試料を分析するために用いることができ、DNAの試料が特に少ない場合、または、それが、DNAが2つ以上の個体を起源とするDNAの試料である場合、例えば、母系の血漿の場合に特に有用である。これらの方法は、単一または少数の細胞、ゲノムDNA、血漿DNA、増幅された血漿ライブラリー、増幅されたアポトーシス性の上清ライブラリーまたは他の混合DNAの試料などのDNA試料に対して用いることができる。ある実施形態では、これらの方法は、遺伝子の構成が異なる細胞が、単一の個体に存在する可能性がある場合、例えば、がんまたは移植片に用いることができる。 These methods can be used to analyze a sample of any DNA, especially if the sample of DNA is particularly small, or if the DNA is a sample of DNA originating from more than one individual. , For example, especially in the case of maternal plasma. These methods are used for DNA samples such as single or few cells, genomic DNA, plasma DNA, amplified plasma library, amplified autogenic supernatant library or other mixed DNA samples. be able to. In certain embodiments, these methods can be used, for example, in cancer or grafts where cells with different genetic makeup can be present in a single individual.

プロトコールの変形物(上記のワークフローに対する変形物および/または追加物)
直接多重mini-PCR:タグを付けたプライマーを用いた複数の標的配列の特異的標的増幅(STA)が図1に示されている。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、PCRプライマーがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、最終のPCR産物を示す。いくつかの実施形態では、STAは、100超、200超、500超、1,000超、2,000超、5,000超、10,000超、20,000超、50,000超、100,000超、または200,000超の標的に対して行うことができる。その後の反応において、タグ特異的プライマーにより全ての標的配列を増幅し、サンプリングインデックスを含めた、配列決定するために必要な全ての配列を含むタグを伸長する。ある実施形態では、プライマーにタグ付けしなくてよい、または特定のプライマーのみにタグを付けてよい。シーケンシングアダプタは、従来のアダプタライゲーションによって付加することができる。ある実施形態では、最初のプライマーはタグを担持してよい。
Protocol variants (variants and / or additions to the above workflow)
Direct Multiplex Mini-PCR: Specific Target Amplification (STA) of multiple target sequences using tagged primers is shown in FIG. 101 represents a double-stranded DNA having the polymorphic locus of interest at X. 102 shows double-stranded DNA with a ligation adapter added for universal amplification. 103 shows universally amplified single-stranded DNA hybridized with PCR primers. 104 indicates the final PCR product. In some embodiments, the STA is over 100, over 200, over 500, over 1,000, over 2,000, over 5,000, over 10,000, over 20,000, over 50,000, 100. It can be done for more than 000, or more than 200,000 targets. In subsequent reactions, tag-specific primers amplify all target sequences and extend tags containing all sequences required for sequencing, including sampling indexes. In certain embodiments, the primers may not need to be tagged, or only specific primers may be tagged. Sequencing adapters can be added by conventional adapter ligation. In certain embodiments, the first primer may carry the tag.

ある実施形態では、プライマーを、増幅されるDNAの長さが予想外に短くなるように設計する。先行技術により、当業者が一般には、100+bpの増幅産物を設計することが実証されている。ある実施形態では、増幅産物を、80bp未満になるように設計することができる。ある実施形態では、増幅産物を、70bp未満になるように設計することができる。ある実施形態では、増幅産物を、60bp未満になるように設計することができる。ある実施形態では、増幅産物を、50bp未満になるように設計することができる。ある実施形態では、増幅産物を、45bp未満になるように設計することができる。ある実施形態では、増幅産物を、40bp未満になるように設計することができる。ある実施形態では、増幅産物を、35bp未満になるように設計することができる。ある実施形態では、増幅産物を、40bpから65bpの間になるように設計することができる。 In one embodiment, the primer is designed so that the length of the amplified DNA is unexpectedly short. Prior art has demonstrated that those skilled in the art generally design 100 + bp amplification products. In certain embodiments, the amplification product can be designed to be less than 80 bp. In certain embodiments, the amplification product can be designed to be less than 70 bp. In certain embodiments, the amplification product can be designed to be less than 60 bp. In certain embodiments, the amplification product can be designed to be less than 50 bp. In certain embodiments, the amplification product can be designed to be less than 45 bp. In certain embodiments, the amplification product can be designed to be less than 40 bp. In certain embodiments, the amplification product can be designed to be less than 35 bp. In certain embodiments, the amplification product can be designed to be between 40 bp and 65 bp.

実験を、このプロトコールを使用して、1200プレックス増幅を用いて実施した。ゲノムDNAと妊娠血漿の両方を使用した;シーケンスリードの約70%が標的の配列にマッピングされた。詳細は本文書の他の箇所に示されている。アッセイの設計および選択を伴わない1042プレックスの配列決定により、配列の>99%がプライマー二量体産物となった。 Experiments were performed using this protocol with 1200 plex amplification. Both genomic DNA and pregnancy plasma were used; about 70% of the sequence reads were mapped to the target sequence. Details are given elsewhere in this document. Sequencing of 1042 plexes without assay design and selection resulted in> 99% of the sequences being primer dimer products.

逐次的なPCR:STA1の後、産物の複数の一定分量を、同じプライマーを有する複雑さが低下したプールを用いて並行して増幅することができる。第1の増幅により、分割するために十分な材料が生じ得る。この方法は、少ない試料、例えば、約6~100pg、約100pg~1ng、約1ng~10ngまたは約10ng~100ngの試料に対して特に優良である。1200プレックスを3回の400プレックスにしたプロトコールを実施した。シーケンシングリードのマッピングは、1200プレックス単独における約60~70%から95%超まで増大した。 Sequential PCR: After STA1, multiple aliquots of product can be amplified in parallel using a less complex pool with the same primers. The first amplification may give rise to sufficient material for splitting. This method is particularly good for small samples, such as about 6-100 pg, about 100 pg-1 ng, about 1 ng-10 ng or about 10 ng-100 ng. A protocol was carried out in which 1200 plexes were changed to 400 plexes three times. Sequencing read mapping increased from about 60-70% to over 95% on the 1200 plex alone.

セミネステッドmini-PCR:(図2参照)STA1の後、内側のネステッドフォワードプライマー(103B、105b)の多重のセットおよび1つ(または少数)のタグ特異的リバースプライマー(103A)で構成される第2のSTAを実施する。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、フォワードプライマーBおよびリバースプライマーAがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、103からのPCR産物を示す。105は、ハイブリダイズしたネステッドフォワードプライマーb、および既に103と104の間に生じたPCRからの分子の一部であるリバースタグAを有する104からの産物を示す。106は、最終のPCR産物を示す。このワークフローを用いると、通常、配列の95%超が意図された標的にマッピングされる。ネステッドプライマーは外側のフォワードプライマー配列とオーバーラップしてよいが、追加の3’末端塩基を導入する。いくつかの実施形態では、1から20個の間の余分の3’塩基を用いることが可能である。実験により、1200プレックス設計物において9個以上の余分の3’塩基を用いると良好に機能することが示された。 Semi-Nested mini-PCR: (see FIG. 2) STA1 followed by a plurality of sets of inner nested forward primers (103B, 105b) and one (or a few) tag-specific reverse primers (103A). Carry out 2 STAs. 101 shows a double-stranded DNA having the polymorphic locus of interest at X. 102 shows double-stranded DNA with a ligation adapter added for universal amplification. Reference numeral 103 indicates a universally amplified single-stranded DNA in which the forward primer B and the reverse primer A are hybridized. 104 indicates the PCR product from 103. 105 shows a product from 104 having a hybridized nested forward primer b and a reverse tag A that is already part of a molecule from PCR generated between 103 and 104. 106 indicates the final PCR product. Using this workflow, more than 95% of the sequence is typically mapped to the intended target. The nested primer may overlap the outer forward primer sequence, but introduces an additional 3'end base. In some embodiments, it is possible to use an extra 3'base between 1 and 20. Experiments have shown that using 9 or more extra 3'bases in a 1200 plex design works well.

完全ネステッドmini-PCR:(図3参照)STAステップ1の後、第2の多重PCR(または複雑さが低下した並行のm.p.PCR)を、タグ(A、a、B、b)を保有する2つのネステッドプライマーを用いて実施することが可能である。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、フォワードプライマーBおよびリバースプライマーAがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、103からのPCR産物を示す。105は、ネステッドフォワードプライマーbおよびネステッドリバースプライマーaがハイブリダイズした、104からの産物を示す。106は、最終のPCR産物を示す。いくつかの実施形態では、2つのプライマーの完全なセットを用いることが可能である。完全ネステッドmini-PCRプロトコールを使用した実験を用いて、単一細胞および3つの細胞に対して、ユニバーサルライゲーションアダプタを付加し、増幅するステップ102を伴わずに146プレックス増幅を実施した。 Fully nested mini-PCR: (see Figure 3) After STA step 1, a second multiplex PCR (or less complex parallel mp PCR), tagged (A, a, B, b). It is possible to carry out using two nested primers in possession. 101 shows a double-stranded DNA having the polymorphic locus of interest at X. 102 shows double-stranded DNA with a ligation adapter added for universal amplification. Reference numeral 103 indicates a universally amplified single-stranded DNA in which the forward primer B and the reverse primer A are hybridized. 104 indicates the PCR product from 103. 105 shows the product from 104 in which the nested forward primer b and the nested reverse primer a hybridized. 106 indicates the final PCR product. In some embodiments, it is possible to use the complete set of two primers. Using experiments using a fully nested mini-PCR protocol, 146-plex amplification was performed on single cells and three cells with the addition of universal ligation adapters and without step 102 of amplification.

ヘミネステッドmini-PCR:(図4参照)断片の末端にアダプタを有する標的DNAを用いることが可能である。フォワードプライマー(B)の多重セットおよび1つ(または少数)のタグ特異的リバースプライマー(A)で構成されるSTAを実施する。第2のSTAを、ユニバーサルタグ特異的フォワードプライマーおよび標的特異的リバースプライマーを使用して実施することができる。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、リバースプライマーAがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、リバースプライマーAおよびライゲーションアダプタタグプライマーLTを使用して増幅した、103からのPCR産物を示す。105は、フォワードプライマーBがハイブリダイズした、104からの産物を示す。106は、最終のPCR産物を示す。このワークフローでは、標的特異的フォワードプライマーおよびリバースプライマーを別々の反応において使用し、それにより、反応の複雑さが減少し、フォワードプライマーとリバースプライマーの二量体形成が防がれる。この例では、プライマーAおよびBを、第1のプライマーとみなすことができ、プライマー「a」および「b」を、内側のプライマーとみなすことができることに留意されたい。この方法は、直接PCRと同等に優良であるが、プライマー二量体を回避するので、直接PCRに対する大きな改善である。第1ラウンドのヘミネステッドプロトコールの後、一般には、約99%の非標的DNAが認められるが、第2ラウンドの後には一般には、大きく改善される。 Heminated mini-PCR: (see FIG. 4) It is possible to use target DNA with an adapter at the end of the fragment. An STA consisting of multiple sets of forward primers (B) and one (or a few) tag-specific reverse primers (A) is performed. The second STA can be performed using universal tag-specific forward and target-specific reverse primers. 101 shows a double-stranded DNA having the polymorphic locus of interest at X. 102 shows double-stranded DNA with a ligation adapter added for universal amplification. Reference numeral 103 indicates a universally amplified single-stranded DNA to which the reverse primer A is hybridized. 104 shows the PCR product from 103 amplified using reverse primer A and ligation adapter tag primer LT. 105 shows the product from 104 to which the forward primer B hybridized. 106 indicates the final PCR product. In this workflow, target-specific forward and reverse primers are used in separate reactions, which reduces the complexity of the reaction and prevents the formation of forward and reverse primer dimers. Note that in this example, primers A and B can be considered as the first primer and the primers "a" and "b" can be considered as the inner primers. This method is as good as direct PCR, but it is a great improvement over direct PCR because it avoids primer dimers. After the first round of heminated protocol, generally about 99% of non-target DNA is found, but after the second round, there is generally a significant improvement.

三重ヘミネステッドmini-PCR:(図5参照)断片の末端にアダプタを有する標的DNAを用いることが可能である。フォワードプライマー(B)の多重セットおよび1つ(または少数)のタグ特異的なリバースプライマー(A)および(a)で構成されるSTAを実施する。第2のSTAを、ユニバーサルタグ特異的フォワードプライマーおよび標的特異的リバースプライマーを使用して実施することができる。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、リバースプライマーAがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、リバースプライマーAおよびライゲーションアダプタタグプライマーLTを使用して増幅した、103からのPCR産物を示す。105は、フォワードプライマーBがハイブリダイズした、104からの産物を示す。106は、リバースプライマーAおよびフォワードプライマーBを使用して増幅した、105からのPCR産物を示す。107は、リバースプライマー「a」がハイブリダイズした、106からの産物を示す。108は、最終のPCR産物を示す。この例では、プライマー「a」およびBを、内側のプライマーとみなすことができ、Aを、第1のプライマーとみなすことができることに留意されたい。必要に応じて、AとBの両方を第1のプライマーとみなすことができ、「a」を、内側のプライマーとみなすことができる。リバースプライマーおよびフォワードプライマーの名称は切り換えることができる。このワークフローでは、標的特異的フォワードプライマーおよびリバースプライマーを別々の反応において使用し、それにより、反応の複雑さが減少し、フォワードプライマーとリバースプライマーの二量体形成が防がれる。この方法は、直接PCRと同等に優良であるが、プライマー二量体を回避するので、直接PCRに対する大きな改善である。第1ラウンドのヘミネステッドプロトコールの後、一般には、約99%の非標的DNAが認められるが、第2ラウンドの後には一般には、大きく改善される。 Triple Heminated mini-PCR: (See FIG. 5) It is possible to use target DNA with an adapter at the end of the fragment. An STA consisting of multiple sets of forward primers (B) and one (or minority) tag-specific reverse primers (A) and (a) is performed. The second STA can be performed using universal tag-specific forward and target-specific reverse primers. 101 shows a double-stranded DNA having the polymorphic locus of interest at X. 102 shows double-stranded DNA with a ligation adapter added for universal amplification. Reference numeral 103 indicates a universally amplified single-stranded DNA to which the reverse primer A is hybridized. 104 shows the PCR product from 103 amplified using reverse primer A and ligation adapter tag primer LT. 105 shows the product from 104 to which the forward primer B hybridized. 106 shows the PCR product from 105 amplified using reverse primer A and forward primer B. 107 shows the product from 106 to which the reverse primer "a" was hybridized. 108 indicates the final PCR product. Note that in this example, primers "a" and B can be considered as inner primers and A can be considered as a first primer. If desired, both A and B can be considered as the first primer and the "a" can be considered as the inner primer. The names of the reverse primer and the forward primer can be switched. In this workflow, target-specific forward and reverse primers are used in separate reactions, which reduces the complexity of the reaction and prevents the formation of forward and reverse primer dimers. This method is as good as direct PCR, but it is a great improvement over direct PCR because it avoids primer dimers. After the first round of heminated protocol, generally about 99% of non-target DNA is found, but after the second round, there is generally a significant improvement.

片側ネステッドmini-PCR:(図6参照)断片の末端にアダプタを有する標的DNAを用いることが可能である。STAを、ネステッドフォワードプライマーの多重セットを用い、リバースプライマーとしてライゲーションアダプタタグを使用して実施することもできる。次いで、ネステッドフォワードプライマーおよびユニバーサルリバースプライマーのセットを使用して第2のSTAを実施することができる。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、フォワードプライマーAがハイブリダイズした、ユニバーサル増幅された一本鎖DNAを示す。104は、フォワードプライマーAおよびライゲーションアダプタタグリバースプライマーLTを使用して増幅した、103からのPCR産物を示す。105は、ネステッドフォワードプライマーがハイブリダイズした、104からの産物を示す。106は、最終のPCR産物を示す。この方法では、第1のSTAおよび第2のSTAにおいてオーバーラップしているプライマーを使用することにより、標準のPCRによるよりも短い標的配列を検出することができる。前記方法は、一般には、既に上記のSTAステップ1-ユニバーサルタグの付加および増幅を受けたDNAの試料を差し引いて実施し、2つのネステッドプライマーは一方の側にのみあり、他方の側にはライブラリータグを使用する。前記方法を、アポトーシス性の上清および妊娠血漿のライブラリーに対して実施した。このワークフローを用いると、配列の約60%が意図された標的にマッピングされた。リバースアダプタ配列を含有したリードはマッピングしておらず、したがって、リバースアダプタ配列を含有するリードをマッピングした場合にはこの数字は大きくなることが予想されることに留意されたい。 One-sided nested mini-PCR: (see FIG. 6) It is possible to use target DNA with an adapter at the end of the fragment. STAs can also be performed using multiple sets of nested forward primers and using ligation adapter tags as reverse primers. A second STA can then be performed using a set of nested forward and universal reverse primers. 101 shows a double-stranded DNA having the polymorphic locus of interest at X. 102 shows double-stranded DNA with a ligation adapter added for universal amplification. Reference numeral 103 indicates a universally amplified single-stranded DNA to which the forward primer A is hybridized. 104 shows the PCR product from 103 amplified using forward primer A and ligation adapter tag reverse primer LT. 105 shows the product from 104 to which the nested forward primer hybridized. 106 indicates the final PCR product. In this method, overlapping primers in the first STA and the second STA can be used to detect shorter target sequences than by standard PCR. The method is generally performed by subtracting a sample of DNA that has already undergone the addition and amplification of the STA step 1-universal tag described above, with the two nested primers on only one side and live on the other side. Use rally tags. The above method was performed on an apoptotic supernatant and a library of pregnant plasma. Using this workflow, about 60% of the sequences were mapped to the intended target. Note that reads containing the reverse adapter sequence are not mapped and therefore this number is expected to be higher when mapping reads containing the reverse adapter sequence.

片側のみのmini-PCR:断片の末端にアダプタを有する標的DNAを用いることが可能である(図7参照)。STAを、フォワードプライマーの多重セットおよび1つ(または少数)のタグ特異的なリバースプライマーを用いて実施することができる。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、フォワードプライマーAがハイブリダイズした一本鎖DNAを示す。104は、フォワードプライマーAおよびライゲーションアダプタタグリバースプライマーLTを使用して増幅した、103からのPCR産物を示し、これは最終のPCR産物である。この方法により、標準のPCRによるよりも短い標的配列を検出することができる。しかし、ただ1つの標的特異的プライマーを使用するので、比較的非特異的であり得る。このプロトコールの有効性は片側ネステッドminiPCRの半分である。 One-sided mini-PCR: Target DNA with an adapter at the end of the fragment can be used (see Figure 7). STAs can be performed with multiple sets of forward primers and one (or a small number) tag-specific reverse primers. 101 shows a double-stranded DNA having the polymorphic locus of interest at X. 102 shows double-stranded DNA with a ligation adapter added for universal amplification. Reference numeral 103 indicates a single-stranded DNA hybridized with the forward primer A. 104 shows the PCR product from 103 amplified using forward primer A and ligation adapter tag reverse primer LT, which is the final PCR product. This method allows the detection of shorter target sequences than standard PCR. However, it can be relatively non-specific because it uses only one target-specific primer. The effectiveness of this protocol is half that of one-sided nested miniPCR.

リバースセミネステッドmini-PCR:断片の末端にアダプタを有する標的DNAを用いることが可能である(図8参照)。STAを、フォワードプライマーの多重セットおよび1つ(または少数)のタグ特異的なリバースプライマーを用いて実施することができる。101は、Xに対象の多型遺伝子座を有する二本鎖DNAを示す。102は、ユニバーサル増幅のためにライゲーションアダプタを付加した二本鎖DNAを示す。103は、リバースプライマーBがハイブリダイズした一本鎖DNAを示す。104は、リバースプライマーBおよびライゲーションアダプタタグフォワードプライマーLTを使用して増幅した、103からのPCR産物を示す。105は、フォワードプライマーA、および内側のリバースプライマー「b」がハイブリダイズした、PCR産物104を示す。106は、フォワードプライマーAおよびリバースプライマー「b」を使用して105から増幅されたPCR産物を示し、これは最終のPCR産物である。この方法により、標準のPCRによるよりも短い標的配列を検出することができる。 Reverse semi-nested mini-PCR: Target DNA with an adapter at the end of the fragment can be used (see Figure 8). STAs can be performed with multiple sets of forward primers and one (or a small number) tag-specific reverse primers. 101 shows a double-stranded DNA having the polymorphic locus of interest at X. 102 shows double-stranded DNA with a ligation adapter added for universal amplification. Reference numeral 103 indicates a single-stranded DNA hybridized with the reverse primer B. 104 shows the PCR product from 103 amplified using reverse primer B and ligation adapter tag forward primer LT. 105 shows the PCR product 104 hybridized with the forward primer A and the inner reverse primer "b". Reference numeral 106 indicates a PCR product amplified from 105 using the forward primer A and the reverse primer "b", which is the final PCR product. This method allows the detection of shorter target sequences than standard PCR.

上記の方法の単に反復または組み合わせであるさらなる変形物、例えば、プライマーの3つのセットを使用する二重ネステッドPCRも存在し得る。別の変形物は片側半ネステッドmini-PCRであり、STAをネステッドフォワードプライマーの多重セットおよび1つ(または少数)のタグ特異的なリバースプライマーを用いて実施することもできる。 There may also be additional variants that are merely repetitions or combinations of the above methods, eg, double nested PCR using three sets of primers. Another variant is unilateral half-nested mini-PCR, where STA can also be performed with multiple sets of nested forward primers and one (or a few) tag-specific reverse primers.

これらの変形物の全てにおいて、フォワードプライマーおよびリバースプライマーの同一性は交換することができることに留意されたい。いくつかの実施形態では、ネステッド変形物は、アダプタタグを付加すること、およびユニバーサル増幅ステップを含む最初のライブラリーの調製を伴わずに同等に良好に実行することができることに留意されたい。いくつかの実施形態では、追加のフォワードプライマーおよび/またはリバースプライマーおよび増幅ステップを伴ってPCRの追加のラウンドを含めることができ、これらの追加のステップは、標的の遺伝子座に対応するDNA分子のパーセントをさらに増大させることが望ましい場合に特に有用であり得ることに留意されたい。 Note that the identity of the forward and reverse primers can be exchanged in all of these variants. It should be noted that in some embodiments, the nested variants can be performed equally well without the addition of adapter tags and the preparation of the initial library comprising the universal amplification step. In some embodiments, additional rounds of PCR can be included with additional forward and / or reverse primers and amplification steps, which are the additional steps of the DNA molecule corresponding to the target locus. Note that it can be especially useful when it is desirable to increase the percentage further.

ネスティングワークフロー
異なる程度のネスティング、および異なる程度の多重化を伴って増幅を実施するための多くの方法が存在する。図9では、フローチャートが、可能性のあるワークフローのいくつかと共に示されている。10,000プレックスPCRの使用は単なる例であり、これらのフローチャートは他の多重化の程度に対しても同等に良好に機能することに留意されたい。
Nesting Workflow There are many ways to perform amplification with different degrees of nesting and different degrees of multiplexing. In FIG. 9, a flow chart is shown along with some of the possible workflows. Note that the use of 10,000 plex PCR is just an example and these flowcharts work equally well for other degrees of multiplexing.

ループライゲーションアダプタ
例えば、配列決定するためのライブラリーを作出するためにユニバーサルタグを付けたアダプタを付加する場合、アダプタをライゲーションするためのいくつもの方法が存在する。1つの方法は、試料DNAを平滑末端化し、A-テーリングを実施し、T-オーバーハングを有するアダプタとライゲーションすることである。アダプタをライゲーションするための、いくつもの他の方法が存在する。ライゲーションすることができるアダプタもいくつも存在する。例えば、DNAの2つの鎖からなり、一方の鎖が二本鎖領域、およびフォワードプライマー領域によって指定される領域を有し、他方の鎖が第1の鎖上の二本鎖領域と相補的な二本鎖領域、およびリバースプライマーを伴う領域によって指定されるY-アダプタを使用することができる。アニーリングする場合、二本鎖領域は、Aオーバーハングを有する二本鎖DNAとライゲーションするために、T-オーバーハングを含有してよい。
Loop ligation adapter For example, when adding a universally tagged adapter to create a library for sequencing, there are several ways to ligate the adapter. One method is to blunt-end the sample DNA, perform A-tailing, and ligate with an adapter having a T-overhang. There are a number of other ways to ligate the adapter. There are also a number of adapters that can be ligated. For example, it consists of two strands of DNA, one strand having a double-stranded region and a region designated by the forward primer region, the other strand being complementary to the double-stranded region on the first strand. A Y-adapter specified by a double-stranded region and a region with a reverse primer can be used. When annealing, the double-stranded region may contain a T-overhang to ligate with double-stranded DNA having an A overhang.

ある実施形態では、アダプタは、末端領域が相補的であって、フォワードプライマーでタグを付けた領域(LFT)、リバースプライマーでタグを付けた領域(LRT)、およびその2つの間の切断部位を含有する、DNAのループであってよい(図10参照)。101は、二本鎖の平滑末端の標的DNAを指す。102は、A尾部をもつ標的DNAを指す。103は、Tオーバーハング「T」および切断部位「Z」を有するループライゲーションアダプタを指す。104は、ループライゲーションアダプタが付加された標的DNAを指す。105は、切断部位において切断された、ライゲーションアダプタが付加された標的DNAを指す。LFTはライゲーションアダプタフォワードタグを指し、LRTはライゲーションアダプタリバースタグを指す。相補的な領域はTオーバーハング、または標的DNAとライゲーションするために使用することができる他の形体で終わってよい。切断部位は、UNGに沿った切断のための一連のウラシルであり得るか、あるいは制限酵素もしくは他の切断方法または単に基本的な増幅によって認識され切断され得る配列であり得る。これらのアダプタは、例えば、配列決定するための任意のライブラリーを調製するために使用することができる。これらのアダプタは、本明細書に記載の他の方法のいずれか、例えば、mini-PCR増幅方法と組み合わせて用いることができる。 In one embodiment, the adapter has complementary terminal regions, a region tagged with a forward primer (LFT), a region tagged with a reverse primer (LRT), and a cleavage site between the two. It may be a loop of DNA contained (see FIG. 10). 101 refers to the double-stranded blunt-ended target DNA. 102 refers to the target DNA having the A tail. Reference numeral 103 refers to a loop ligation adapter having a T overhang "T" and a cutting site "Z". Reference numeral 104 refers to the target DNA to which the loop ligation adapter is added. Reference numeral 105 refers to the target DNA to which the ligation adapter has been added, which has been cleaved at the cleavage site. LFT refers to the ligation adapter forward tag and LRT refers to the ligation adapter reverse tag. Complementary regions may end with a T-overhang, or other form that can be used to ligate the target DNA. The cleavage site can be a series of uracils for cleavage along UNG, or a sequence that can be recognized and cleaved by restriction enzymes or other cleavage methods or simply by basic amplification. These adapters can be used, for example, to prepare any library for sequencing. These adapters can be used in combination with any of the other methods described herein, eg, the mini-PCR amplification method.

内部にタグを付けたプライマー
所与の多型遺伝子座に存在する対立遺伝子を決定するために配列決定を用いる場合、シーケンスリードは、一般には、プライマー結合部位(a)の上流で開始され、次いで、多型部位(X)が読まれる。タグは一般には、図11の左側に示されている通り配置される。101は、対象の多型遺伝子座「X」およびタグ「b」が付加されたプライマー「a」を有する一本鎖標的DNAを指す。非特異的なハイブリダイゼーションを回避するために、プライマー結合部位(「a」と相補的な標的DNAの領域)は、一般には、18~30bpの長さである。配列タグ「b」は、一般には約20bpであり、理論上は、これらは約15bpより長い任意の長さであってよいが、多くの人々は配列決定プラットフォームの企業から販売されているプライマー配列を使用する。「a」と「X」の間の距離「d」は、対立遺伝子の偏りを回避するために少なくとも2bpであってよい。W多重PCR増幅を、過剰なプライマー間相互作用を回避するために慎重なプライマーの設計が必要である、本明細書に開示されている方法または他の方法を用いて実施する場合、許容できる「a」と「X」の間の距離「d」のウィンドウは、相当に変動し得る:2bp~10bp、2bp~20bp、2bp~30bpまたは、さらには2bp~30bp超。したがって、図11の左側に示されているプライマーの配置を用いる場合、シーケンスリードは、多型遺伝子座を測定するために十分に長いリードを得るために、最小の40bpでなければならず、また、「a」および「d」の長さに応じてシーケンスリードは60bpまたは75bpまでが必要になる場合がある。通常、シーケンスリードが長いほど、所与の数のリードについて配列決定するための費用および時間が増し、したがって、必要なリードの長さを最小化することにより、時間と金の両方を節約することができる。さらに、平均で、リードの初期の塩基のリードは、リード後期のリードよりも正確なリードであるので、必要なシーケンスリードの長さを減らすことにより、多型領域の測定の正確度を上げることもできる。
Internally tagged Primers When using sequencing to determine alleles present at a given polymorphic locus, sequence read is generally initiated upstream of the primer binding site (a) and then , Polymorphic site (X) is read. Tags are generally arranged as shown on the left side of FIG. Reference numeral 101 refers to a single-stranded target DNA having the target polymorphic locus "X" and the primer "a" to which the tag "b" is added. To avoid non-specific hybridization, the primer binding site (the region of target DNA complementary to "a") is generally 18-30 bp in length. The sequence tag "b" is generally about 20 bp, and in theory they may be of any length longer than about 15 bp, but many people are primer sequences sold by companies on sequencing platforms. To use. The distance "d" between "a" and "X" may be at least 2 bp to avoid allele bias. If W multiplex PCR amplification is performed using the methods disclosed herein or other methods that require careful primer design to avoid excessive primer-to-primer interactions, it is acceptable. The window of the distance "d" between "a" and "X" can vary considerably: 2bp to 10bp, 2bp to 20bp, 2bp to 30bp, or even more than 2bp to 30bp. Therefore, when using the primer arrangement shown on the left side of FIG. 11, the sequence read must be a minimum of 40 bp to obtain a read long enough to measure the polymorphic locus. , "A" and "d" may require sequence reads up to 60 bp or 75 bp, depending on the length. In general, the longer the sequence read, the more cost and time it takes to sequence for a given number of reads, thus saving both time and money by minimizing the required read length. Can be done. In addition, on average, early base reads of reads are more accurate than late reads, thus reducing the length of sequence reads required to increase the accuracy of polymorphic region measurements. You can also.

ある実施形態では、図11の103に示されている通り、内部にタグを付けたプライマーと称されるプライマー結合部位(a)を複数のセグメント(a’、a’’、a’’’....)に分割し、配列タグ(b)を、2つのプライマー結合部位の中央のDNAのセグメント上に置く。この配置により、シーケンサーがより短いシーケンスリードを行うことが可能になる。ある実施形態では、a’+a’’は少なくとも約18bpであるべきであり、30bp、40bp、50bp、60bp、80bp、100bp、または100bp超の長さであってよい。ある実施形態では、a’’は少なくとも約6bpであるべきであり、ある実施形態では、約8bpから16bpの間である。全ての他の因子も同等であり、内部にタグを付けたプライマーを使用することにより、必要なシーケンスリードの長さを、少なくとも6bp、8bp、10bp、12bp、15bpと同程度、さらには20bpまたは30bpと同程度に切り詰めることができる。この結果、かなりの金、時間および正確度の利点がもたらされ得る。内部にタグを付けたプライマーの例は図12に示されている。 In one embodiment, as shown in 103 of FIG. 11, a plurality of segments (a', a'', a'''. ...) and place the sequence tag (b) on the central DNA segment of the two primer binding sites. This arrangement allows the sequencer to perform shorter sequence reads. In certain embodiments, a ′ + a ″ should be at least about 18 bp and may be 30 bp, 40 bp, 50 bp, 60 bp, 80 bp, 100 bp, or more than 100 bp in length. In some embodiments, a ″ should be at least about 6 bp, and in some embodiments between about 8 bp and 16 bp. All other factors are equivalent, and by using internally tagged primers, the required sequence read length can be at least as high as 6 bp, 8 bp, 10 bp, 12 bp, 15 bp, or even 20 bp or more. It can be truncated to the same extent as 30 bp. This can result in significant money, time and accuracy benefits. An example of an internally tagged primer is shown in FIG.

ライゲーションアダプタ結合領域を有するプライマー
断片化されたDNAに伴う1つの問題は、その長さが短いので、多型がDNA鎖の末端の近くにある見込みが長い鎖よりも高いことである(例えば、101、図10)。多型をPCRによって捕捉するためには、多型の両側に適切な長さのプライマー結合部位が必要であるので、プライマーと標的の結合部位の間のオーバーラップが不十分であることに起因して、標的の多型を有するかなりの数のDNAの鎖が捕捉し損なわれる。ある実施形態では、標的DNA101にはライゲーションアダプタ102を付加することができ、標的プライマー103は、設計された結合領域(a)の上流に付加したライゲーションアダプタタグ(lt)と相補的な領域(cr)を有し得る(図13参照);したがって、結合領域(aと相補的な101の領域)が一般にハイブリダイゼーションのために必要な18bpよりも短い場合には、ライブラリータグと相補的なプライマーの領域(cr)により、PCRが進行することができるところまで結合エネルギーを増大させることができる。より短い結合領域に起因して失われる任意の特異性は、適切に長い標的結合領域を有する他のPCRプライマーによって補うことができることに留意されたい。この実施形態は、直接PCRまたは本明細書に記載の他の方法のいずれか、例えば、ネステッドPCR、セミネステッドPCR、ヘミネステッドPCR、片側ネステッドまたはセミネステッドまたはヘミネステッドPCRまたは他のPCRプロトコールと組み合わせて用いることができることに留意されたい。
Primer with Ligation Adapter Binding Region One problem with fragmented DNA is that its short length makes polymorphisms more likely than long strands near the ends of DNA strands (eg,). 101, FIG. 10). Due to the inadequate overlap between the primer and the target binding site, the polymorph's capture by PCR requires primer binding sites of appropriate length on both sides of the polymorphism. Thus, a significant number of DNA strands with the target polymorphism are captured and compromised. In certain embodiments, the ligation adapter 102 can be attached to the target DNA 101, where the target primer 103 is a region (cr) complementary to the ligation adapter tag (lt) added upstream of the designed binding region (a). ) (See FIG. 13); therefore, if the binding region (101 region complementary to a) is shorter than the 18 bp generally required for hybridization, a primer complementary to the library tag. The region (cr) allows the binding energy to be increased to the point where PCR can proceed. Note that any specificity lost due to shorter binding regions can be supplemented by other PCR primers with appropriately long target binding regions. This embodiment is used in combination with either direct PCR or any of the other methods described herein, eg, nested PCR, semi-nested PCR, hemi-nested PCR, one-sided nested or semi-nested or hemi-nested PCR or other PCR protocols. Keep in mind that you can.

配列決定データを用い、種々の仮説について、観察された対立遺伝子データと予測される対立遺伝子分布を比較することを伴う分析的な方法と組み合わせて倍数性を決定する場合、リード深度が低い対立遺伝子からの追加のリードのそれぞれにより、リード深度が高い対立遺伝子からのリードよりも多くの情報がもたらされる。したがって、理想的には、各遺伝子座が同様の数の代表的なシーケンスリードを有する均一なリード深度(DOR)が認められることが望まれる。したがって、DORの分散を最小限にすることが望ましい。ある実施形態では、アニーリング時間を増加させることによってDORの変動係数(これは、DORの標準偏差/平均DORと定義することができる)を減少させることが可能である。いくつかの実施形態では、アニーリング温度は、2分超、4分超、10分超、30分超、および1時間超またはさらに長くてよい。アニーリングは平衡プロセスであるので、アニーリング時間の増加に伴うDORの分散の改善に限界はない。ある実施形態では、プライマー濃度を増加させることにより、DORの分散が減少する。 Low read depth alleles when sequencing data are used to determine multiples for various hypotheses in combination with analytical methods involving comparison of observed allele data with predicted allele distributions. Each of the additional reads from will provide more information than a read from an allele with a high read depth. Therefore, ideally, it is desired to have a uniform read depth (DOR) where each locus has a similar number of representative sequence reads. Therefore, it is desirable to minimize the variance of DOR. In certain embodiments, it is possible to reduce the coefficient of variation of DOR, which can be defined as the standard deviation / mean DOR of DOR, by increasing the annealing time. In some embodiments, the annealing temperature may be greater than 2 minutes, greater than 4 minutes, greater than 10 minutes, greater than 30 minutes, and greater than 1 hour or even longer. Since annealing is an equilibrium process, there is no limit to the improvement in DOR dispersion with increasing annealing time. In certain embodiments, increasing the primer concentration reduces the dispersion of DOR.

代表的全ゲノム増幅法
いくつかの実施形態では、標的遺伝子座のみを増幅する前に、核酸試料を増幅するために全ゲノムアプリケーションなどのDNA増幅を含めることができる。DNAの増幅は、少量の遺伝物質を、同様の遺伝子データの集合を含む、より大量の遺伝物質に変換するプロセスであり、これに限定されないが、ポリメラーゼ連鎖反応(PCR)を含めた多種多様な方法によって行うことができる。DNAを増幅する1つの方法は、全ゲノム増幅(WGA)である。WGAに利用可能ないくつもの方法がある:ライゲーション媒介性PCR(LM-PCR)、縮重オリゴヌクレオチドプライマーPCR(DOP-PCR)、および多置換増幅(MDA)。LM-PCRでは、アダプタと称される短いDNA配列をDNAの平滑末端にライゲーションする。これらのアダプタはユニバーサル増幅配列を含有し、これを使用して、PCRによってDNAを増幅する。DOP-PCRでは、同様にユニバーサル増幅配列を含有するランダムプライマーが第1ラウンドのアニーリングおよびPCRにおいて使用されている。次いで、第2ラウンドのPCRを使用して、さらにユニバーサルプライマー配列を用いて配列を増幅する。MDAでは、DNAを複製する高度にプロセッシブかつ非特異的な酵素であり、単一細胞分析のために使用されているphi-29ポリメラーゼを用いる。単一細胞由来の材料の増幅に対する主要な限定は、(1)極度に希釈したDNA濃度または非常に小さな体積の反応混合物を使用する必要性、および(2)全ゲノムにわたってDNAをタンパク質から確実に解離することの難しさである。それにもかかわらず、単一細胞全ゲノム増幅は、何年にもわたる種々の適用のために首尾よく用いられてきた。DNAの試料からDNAを増幅する他の方法がある。DNA増幅では、最初のDNAの試料を、配列の集合が同様であるが、はるかに量が多いDNAの試料に変換する。いくつかの場合には、増幅は必要ない可能性がある。
Representative Whole Genome Amplification Methods In some embodiments, DNA amplification, such as a whole genome application, can be included to amplify a nucleic acid sample before amplifying only the target locus. DNA amplification is the process of converting a small amount of genetic material into a larger amount of genetic material containing a similar collection of genetic data, including, but not limited to, the polymerase chain reaction (PCR). It can be done by the method. One method of amplifying DNA is whole genome amplification (WGA). There are several methods available for WGA: ligation-mediated PCR (LM-PCR), degenerate oligonucleotide primer PCR (DOP-PCR), and polysubstituted amplification (MDA). In LM-PCR, a short DNA sequence called an adapter is ligated to the blunt end of the DNA. These adapters contain a universal amplification sequence that is used to amplify DNA by PCR. In DOP-PCR, random primers also containing universal amplification sequences are used in the first round annealing and PCR. Second round PCR is then used to further amplify the sequence with universal primer sequences. MDA uses the phi-29 polymerase, a highly processive and non-specific enzyme that replicates DNA and is used for single cell analysis. The major limitations to the amplification of single cell-derived materials are (1) the need to use extremely diluted DNA concentrations or very small volumes of reaction mixtures, and (2) ensuring that DNA is derived from proteins throughout the genome. It is difficult to dissociate. Nevertheless, single-cell whole-genome amplification has been successfully used for many years of various applications. There are other ways to amplify DNA from a sample of DNA. In DNA amplification, the first sample of DNA is converted into a sample of DNA with a similar set of sequences but a much larger amount. In some cases, amplification may not be necessary.

いくつかの実施形態では、DNAを、ユニバーサル増幅、例えば、WGAまたはMDAを用いて増幅することができる。いくつかの実施形態では、DNAを、標的化増幅、例えば、標的PCRまたは環状化プローブを用いることによって増幅することができる。いくつかの実施形態では、DNAを、標的化増幅方法または所望のDNAと望ましくないDNAの完全なまたは部分的な分離をもたらす方法、例えば、ハイブリダイゼーション手法による捕捉を用いて、優先的に富化することができる。いくつかの実施形態では、DNAを、ユニバーサル増幅方法と優先的な富化方法の組み合わせを用いることによって増幅することができる。これらの方法のいくつかについてのより充実した記載は本文書の他の箇所に見いだすことができる。 In some embodiments, the DNA can be amplified using universal amplification, such as WGA or MDA. In some embodiments, the DNA can be amplified by using targeted amplification, eg, targeted PCR or cyclized probe. In some embodiments, the DNA is preferentially enriched using a targeted amplification method or a method that results in complete or partial separation of the desired and undesired DNA, eg, capture by hybridization techniques. can do. In some embodiments, the DNA can be amplified by using a combination of universal amplification methods and preferred enrichment methods. A more complete description of some of these methods can be found elsewhere in this document.

代表的富化およびシークエンシング法
ある実施形態では、本明細書に開示されている方法は、元のDNAの試料中、標的遺伝子座(例えば、多型遺伝子座)の集合からの各標的遺伝子座(例えば、各多型遺伝子座)に存在する相対的な対立遺伝子頻度を保存する選択的富化技法を用いる。富化は多形遺伝子座の分析法として特に有益であるが、これらの富化方法は、必要に応じ、非多形遺伝子座に対しても容易に適合させることができる。いくつかの実施形態では、増幅および/または選択的富化技法は、ライゲーション媒介性PCRなどのPCR、ハイブリダイゼーションによる断片の捕捉、分子反転プローブまたは他の環状化プローブを伴い得る。いくつかの実施形態では、増幅または選択的な富化のための方法は、標的配列と正確にハイブリダイズした際に、ヌクレオチドプローブの3’末端または5’末端が、少数のヌクレオチドで対立遺伝子の多型部位から隔てられるようなプローブの使用を伴ってよい。この隔たりにより、対立遺伝子の偏りと称される、一方の対立遺伝子の優先的な増幅が減少する。
これは、正確にハイブリダイズしたプローブの3’末端または5’末端が対立遺伝子の多型部位と直接隣接する、またはそれと非常に近くなるようなプローブの使用を伴う方法よりも改善されている。ある実施形態では、ハイブリダイズ領域が、多型部位を含有する可能性がある、またはそれを確実に含有するプローブは排除される。ハイブリダイゼーションの部位に多型部位があることにより、一部の対立遺伝子において不均等なハイブリダイゼーションが引き起こされ得る、または、ハイブリダイゼーションが全体で阻害されてもよく、その結果、特定の対立遺伝子が優先的に増幅される。これらの実施形態は、試料が単一の個体由来の純粋なゲノム試料であろうが個体の混合物であろうが、試料の各多型遺伝子座における元の対立遺伝子頻度をより良好に保存するという点で、標的化増幅および/または選択的な富化を伴う他の方法よりも改善されている。
Representative enrichment and sequencing methods In certain embodiments, the methods disclosed herein are each target locus from a collection of target loci (eg, polymorphic loci) in a sample of the original DNA. Selective enrichment techniques are used to preserve the relative allele frequencies present at (eg, each polymorphic locus). Although enrichment is particularly useful as a method for analyzing polymorphic loci, these enrichment methods can also be easily adapted to non-polymorphic loci, if desired. In some embodiments, amplification and / or selective enrichment techniques may involve PCR such as ligation-mediated PCR, fragment capture by hybridization, molecular inversion probes or other cyclization probes. In some embodiments, the method for amplification or selective enrichment is that when exactly hybridized to the target sequence, the 3'or 5'end of the nucleotide probe is allelic with a small number of nucleotides. It may be accompanied by the use of a probe that is separated from the polymorphic site. This gap reduces the preferential amplification of one allele, called allele bias.
This is an improvement over methods involving the use of probes such that the 3'or 5'end of the precisely hybridized probe is directly adjacent to or very close to the allele polymorphic site. In certain embodiments, probes where the hybridization region may or does not contain a polymorphic site are excluded. The presence of polymorphic sites at the site of hybridization can cause heterogeneous hybridization in some alleles, or the hybridization may be totally inhibited, resulting in specific alleles. It is preferentially amplified. These embodiments better preserve the original allelic frequency at each polymorphic locus of the sample, whether the sample is a pure genomic sample from a single individual or a mixture of individuals. In that respect, it is an improvement over other methods with targeted amplification and / or selective enrichment.

非侵襲的な出生前対立遺伝子コールまたは倍数性コールのための方法の一部としてDNAの試料を標的遺伝子座の集合において富化し、その後、配列決定する技法を使用することにより、いくつもの予想外の利点が付与され得る。本開示のいくつかの実施形態では、前記方法は、インフォマティクスに基づく方法、例えば、PARENTAL SUPPORT(商標)(PS)で使用するための遺伝子データを測定するステップを包含する。実施形態のいくつかの最終の転帰は、胚または胎児のすぐに使用可能な遺伝子データである。具体化された方法の一部として、個体および/または関連する個体の遺伝子データを測定するために用いることができる多くの方法が存在する。ある実施形態では、標的の対立遺伝子の集合の濃度を富化するための方法が本明細書に開示されており、前記方法は、以下のステップの1個または複数個を含む:遺伝物質を標的化増幅するステップ、遺伝子座に特異的なオリゴヌクレオチドプローブを添加するステップ、特定のDNA鎖をライゲーションするステップ、所望のDNAの集合を単離するステップ、反応の望ましくない構成成分を除去するステップ、ハイブリダイゼーションによって特定のDNAの配列を検出するステップ、およびDNAの配列決定方法によって1個または複数個のDNA鎖の配列を検出するステップ。いくつかの場合には、DNA鎖とは標的遺伝物質を指してもよく、いくつかの場合には、DNA鎖とはプライマーを指してもよく、いくつかの場合には、DNA鎖とは合成された配列、またはそれらの組み合わせを指してもよい。これらのステップは、いくつもの異なる順序で行うことができる。 A number of unexpected results by enriching a sample of DNA in a set of target loci and then using sequencing techniques as part of a method for non-invasive prenatal allelic or polyploid calls. Benefits can be granted. In some embodiments of the present disclosure, the method comprises measuring an informatics-based method, eg, genetic data for use in PARENTAL SUPPORT ™ (PS). Some final outcomes of the embodiments are ready-to-use genetic data for embryos or fetuses. As part of the embodied methods, there are many methods that can be used to measure genetic data for individuals and / or related individuals. In certain embodiments, methods for enriching the concentration of a set of target allelic genes are disclosed herein, said method comprising one or more of the following steps: targeting a genetic material. Amplification step, adding a gene locus-specific oligonucleotide probe, ligating a specific DNA strand, isolating a desired set of DNA, removing unwanted components of the reaction, A step of detecting a specific DNA sequence by hybridization, and a step of detecting the sequence of one or more DNA strands by a DNA sequencing method. In some cases, the DNA strand may refer to the target genetic material, in some cases the DNA strand may refer to the primer, and in some cases it may refer to the DNA strand. It may refer to the sequences or combinations thereof. These steps can be performed in a number of different orders.

例えば、標的化増幅の前のDNAのユニバーサル増幅ステップにより、いくつかの有利な点、例えば、ボトルネックのリスクの除去および対立遺伝子の偏りの低減が付与され得る。DNAを、標的配列の両側の2つの隣接する領域とハイブリダイズすることができるオリゴヌクレオチドプローブと混合することができる。ハイブリダイゼーション後、プローブの末端を、ライゲーションの手段であるポリメラーゼ、およびプローブの環状化を可能にするための任意の必要な試薬を加えることによって結びつけることができる。環状化した後、エキソヌクレアーゼを加えて環状化されていない遺伝物質を消化し、その後、環状化されたプローブを検出することができる。DNAを、標的配列の両側の2つの隣接する領域とハイブリダイズすることができるPCRプライマーと混合することができる。ハイブリダイゼーション後、プローブの末端を、ライゲーションの手段であるポリメラーゼ、およびPCR増幅を完了させるための任意の必要な試薬を加えることによって結びつけることができる。増幅されたDNAまたは増幅されなかったDNAは、遺伝子座の集合を標的とするハイブリッド捕捉プローブの標的であってもよく、ハイブリダイゼーション後、プローブを局在させ、混合物から分離して、標的配列で富化されたDNAの混合物をもたらすことができる。 For example, a universal amplification step of DNA prior to targeted amplification may provide some advantages, such as elimination of the risk of bottlenecks and reduction of allele bias. DNA can be mixed with oligonucleotide probes capable of hybridizing to two adjacent regions on either side of the target sequence. After hybridization, the ends of the probe can be ligated by adding a polymerase, which is a means of ligation, and any required reagent to allow cyclization of the probe. After cyclization, exonucleases can be added to digest the non-cyclized genetic material and then the cyclized probe can be detected. The DNA can be mixed with PCR primers that can hybridize to two adjacent regions on either side of the target sequence. After hybridization, the ends of the probe can be ligated by adding polymerase, which is a means of ligation, and any required reagent to complete PCR amplification. Amplified or unamplified DNA may be the target of a hybrid capture probe that targets a collection of loci, after hybridization, the probe is localized, separated from the mixture, and at the target sequence. It can result in a mixture of enriched DNA.

対立遺伝子コールまたは倍数性コールの方法の一部として特定の遺伝子座を標的とし、その後配列決定する方法を用いることにより、いくつもの予想外の利点が付与され得る。DNAを標的とし得る、または優先的に富化することができるいくつかの方法は、環状化プローブ、連結逆方向プローブ(linked inverted probe)(LIP、MIP)、SURESELECTなどのハイブリダイゼーションによる捕捉方法、および標的PCRまたはライゲーション媒介性PCR増幅戦略を使用することを含む。 Targeting a particular locus as part of the method of allelic or polyploid call and then using the method of sequencing can provide a number of unexpected benefits. Several methods that can target or preferentially enrich DNA include hybridization-based capture methods such as cyclized probes, linked inverted probes (LIPs, MIPs), and SURESELECT. And include using targeted PCR or ligation-mediated PCR amplification strategies.

いくつかの実施形態では、本開示の方法は、インフォマティクスに基づく方法、例えば、本明細書でさらに説明されるPARENTAL SUPPORT(商標)(PS)で使用するための遺伝子データを測定するステップを包含する。PARENTAL SUPPORT(商標)は、遺伝子データを操作するためのインフォマティクスに基づく手法であり、その態様は本明細書に記載されている。実施形態のいくつかの最終の転帰は、胚または胎児のすぐに使用可能な遺伝子データ、その後のすぐに使用可能なデータに基づく臨床的決定である。PS法の背景のアルゴリズムは、標的個体、多くの場合は胚または胎児の測定された遺伝子データ、および関連する個体から測定された遺伝子データを取得し、標的個体の遺伝子の状態が分かる正確度を上昇させることができる。ある実施形態では、測定された遺伝子データを、出生前遺伝子診断の間に倍数性の決定を行う状況において使用する。ある実施形態では、測定された遺伝子データを、インビトロでの受精の間に胚に対して倍数性の決定または対立遺伝子コールを行う状況において使用する。上述の状況において個体および/または関連する個体の遺伝子データを測定するために用いることができる多くの方法が存在する。異なる方法は、いくつものステップを含み、これらのステップは、多くの場合、遺伝物質を増幅するステップ、オリゴヌクレオチドプローブを添加するステップ、特定のDNA鎖をライゲーションするステップ、所望のDNAの集合を単離するステップ、反応の望ましくない構成成分を除去するステップ、ハイブリダイゼーションによって特定のDNAの配列を検出するステップ、DNAの配列決定方法によって1個または複数個のDNA鎖の配列を検出するステップを伴う。ある場合には、DNA鎖とは標的遺伝物質を意味し、ある場合には、DNA鎖とはプライマーを意味し、ある場合には、DNA鎖とは合成された配列、またはそれらの組み合わせを意味する。これらのステップは、いくつもの異なる順序で行うことができる。 In some embodiments, the methods of the present disclosure include informatics-based methods, such as measuring genetic data for use in PARENTAL SUPPORT ™ (PS), further described herein. .. PARENTAL SUPPORT ™ is an informatics-based technique for manipulating genetic data, the embodiments of which are described herein. Some final outcome of the embodiment is a clinical decision based on the ready-to-use genetic data of the embryo or fetus, followed by the ready-to-use data. The background algorithm of the PS method obtains measured genetic data of the target individual, often embryo or fetus, and genetic data measured from related individuals to determine the accuracy of the genetic status of the target individual. Can be raised. In certain embodiments, the measured genetic data is used in situations where polyploidy determinations are made during prenatal genetic diagnosis. In certain embodiments, the measured genetic data is used in situations where polyploidy determinations or allelic calls are made to embryos during in vitro fertilization. There are many methods that can be used to measure genetic data for individuals and / or related individuals in the situations described above. Different methods involve a number of steps, often simply the steps of amplifying a genetic material, adding an oligonucleotide probe, ligating a particular DNA strand, the desired set of DNA. It involves a step of separation, a step of removing unwanted components of the reaction, a step of detecting a specific DNA sequence by hybridization, and a step of detecting the sequence of one or more DNA strands by a DNA sequencing method. .. In some cases, a DNA strand means a target genetic material, in some cases, a DNA strand means a primer, and in some cases, a DNA strand means a synthesized sequence, or a combination thereof. do. These steps can be performed in a number of different orders.

理論上はゲノム内の任意の数の遺伝子座、1個の遺伝子座から100万超までのいずれかの遺伝子座を標的とすることが可能であることに留意されたい。DNAの試料を標的化、次いで配列決定に供する場合、シーケンサーによって読み取られる対立遺伝子の割合は、それらが試料中に天然に存在する量に対して富化される。富化の程度は、1パーセント(またはさらに低い)から10倍、100倍、1,000倍またはさらに多く100万倍までのいずれであってもよい。ヒトゲノムには、およそ7,500万の多型遺伝子座を含む、およそ30億の塩基対、およびヌクレオチドが存在する。標的とされる遺伝子座が多いほど、より少ない富化の程度が可能である。標的とされる遺伝子座の数が少ないほど、より大きな富化の程度が可能であり、それらの遺伝子座において、所与の数のシーケンスリードに対してより大きなリード深度を実現することができる。 Note that it is theoretically possible to target any number of loci in the genome, from one locus to over one million. When a sample of DNA is targeted and then sequenced, the proportion of alleles read by the sequencer is enriched relative to the amount they are naturally present in the sample. The degree of enrichment may be from 1 percent (or even lower) to 10 times, 100 times, 1,000 times or even more 1 million times. There are approximately 3 billion base pairs and nucleotides in the human genome, including approximately 75 million polymorphic loci. The more loci targeted, the less enrichment is possible. The smaller the number of targeted loci, the greater the degree of enrichment is possible, and at those loci, a greater read depth can be achieved for a given number of sequence reads.

本開示のある実施形態では、標的化または優先(preferential)は、完全にSNPに焦点を当てることができる。ある実施形態では、標的化または優先は、任意の多型部位に焦点を当てることができる。エクソンを富化するためのいくつもの商業的な標的化産物が利用可能である。驚いたことに、排他的にSNPを、または排他的に多型遺伝子座を標的化することは、対立遺伝子分布に依拠するNPDのための方法を用いる場合に特に有利である。配列決定を用いるNPDのための公開された方法も存在し、例えば、米国特許第7,888,017号は、リード数が、所与の染色体にマッピングされるリード数をカウントすることに焦点が当てられるリード数解析を伴い、分析されたシーケンスリードは、多型のゲノムの領域には焦点を当てていない。多型対立遺伝子に焦点を当てないこれらの種類の方法体系は、対立遺伝子の集合を標的化または優先的に富化することほど役立たない。 In certain embodiments of the present disclosure, targeting or priorial can be fully focused on SNPs. In certain embodiments, targeting or prioritization can focus on any polymorphic site. A number of commercial targeting products are available to enrich exons. Surprisingly, targeting SNPs exclusively or exclusively at polymorphic loci is particularly advantageous when using methods for NPD that rely on allelic distribution. There are also published methods for NPDs that use sequencing, for example, US Pat. No. 7,888,017 focuses on counting the number of reads in which the number of reads maps to a given chromosome. With read count analysis applied, the sequence reads analyzed do not focus on regions of the polymorphic genome. These types of methodologies that do not focus on polymorphic alleles are less useful than targeting or preferentially enriching the set of alleles.

本開示のある実施形態では、遺伝子試料をゲノムの多型領域において富化するためにSNPに焦点を当てる標的化方法を用いることが可能である。ある実施形態では、少数のSNP、例えば、1から100の間のSNP、またはそれよりも多数、例えば、100から1,000の間、1,000から10,000の間、10,000から100,000の間、または100,000超のSNPに焦点を当てることが可能である。ある実施形態では、生存するトリソミーでの出生と相関する1つまたは少数の染色体、例えば、第13染色体、第18染色体、第21染色体、X染色体およびY染色体またはそのいくつかの組み合わせに焦点を当てることが可能である。ある実施形態では、標的のSNPを小さな係数、例えば、1.01倍から100倍の間、またはそれよりも大きな係数、例えば、100倍から1,000,000倍の間、または1,000,000超倍まで富化することが可能である。本開示のある実施形態では、標的化方法を用いて、ゲノムの多型領域において優先的に富化されたDNAの試料を作製することが可能である。ある実施形態では、この方法を用いて、これらの特性のいずれかを有するDNAの混合物を作製することが可能であり、ここで、DNAの混合物は、母系DNAと、浮動性胎児DNAも含有する。ある実施形態では、この方法を用いて、これらの係数の任意の組み合わせを有するDNAの混合物を作製することが可能である。例えば、本明細書に記載の方法を用いて、母系DNAおよび胎児DNAを含み、200SNPであって、全てが第18染色体または第21染色体のいずれかに位置し、平均で1,000倍に富化される200SNPに対応するDNAにおいて優先的に富化されたDNAの混合物を生成することができる。別の例では、前記方法を用いて、10,000SNPであって、全てまたはほとんどが第13染色体、第18染色体、第21染色体、X染色体およびY染色体に位置し、遺伝子座当たりの平均の富化が500倍を超える10,000SNPにおいて優先的に富化されたDNAの混合物を作製することが可能である。本明細書に記載の標的化方法のいずれかを用いて、特定の遺伝子座において優先的に富化されたDNAの混合物を作製することができる。 In certain embodiments of the present disclosure, it is possible to use SNP-focused targeting methods to enrich genetic samples in polymorphic regions of the genome. In certain embodiments, a small number of SNPs, eg, SNPs between 1 and 100, or more, eg, between 100 and 1,000, between 1,000 and 10,000, and 10,000 to 100. It is possible to focus on SNPs between 000 or over 100,000. In certain embodiments, the focus is on one or a few chromosomes that correlate with birth in a living trisomy, such as chromosomes 13, 18, 21, 21, X and Y, or some combination thereof. It is possible. In certain embodiments, the target SNP has a small factor, eg, between 1.01 and 100 times, or a larger factor, such as between 100 and 1,000,000 times, or 1,000. It is possible to enrich up to more than 000 times. In one embodiment of the present disclosure, it is possible to use a targeting method to prepare a sample of DNA that is preferentially enriched in a polymorphic region of the genome. In certain embodiments, this method can be used to make a mixture of DNA having any of these properties, where the mixture of DNA also contains maternal DNA and floating fetal DNA. .. In certain embodiments, it is possible to use this method to make a mixture of DNA having any combination of these coefficients. For example, using the methods described herein, it contains maternal and fetal DNA, 200 SNPs, all located on either chromosome 18 or chromosome 21, and on average 1,000-fold richer. It is possible to produce a mixture of DNA that is preferentially enriched in the DNA corresponding to the 200 SNPs to be converted. In another example, using the method described above, 10,000 SNPs, all or most of which are located on chromosomes 13, 18, 21, X and Y, and have an average wealth per locus. It is possible to make a mixture of DNA that is preferentially enriched at 10,000 SNPs that are more than 500-fold. Any of the targeting methods described herein can be used to make a mixture of DNA that is preferentially enriched at a particular locus.

いくつかの実施形態では、本開示の方法は、ハイスループットDNAシーケンサーを使用して混合画分中のDNAを測定するステップであって、混合画分中のDNAが、不相応な数の1個または複数個の染色体由来の配列を含有し、1個または複数個の染色体が第13染色体、第18染色体、第21染色体、X染色体、Y染色体およびそれらの組み合わせを含む群から選択されるステップをさらに含む。 In some embodiments, the method of the present disclosure is a step of measuring DNA in a mixed fraction using a high throughput DNA sequencer, wherein the DNA in the mixed fraction is one or an disproportionate number. Further steps are selected from the group containing sequences from multiple chromosomes, where one or more chromosomes include chromosomes 13, 18, 21, 21, X, Y and combinations thereof. include.

本明細書には3つの方法、多重PCR、ハイブリダイゼーションによる標的化捕捉、および連結逆方向プローブ(LIP)が記載されており、それを用いて、胎児の異数性を検出するために、母系の血漿試料由来の十分な数の多型遺伝子座から測定値を得て解析することができる。これは、標的の遺伝子座を選択的に富化する他の方法を排除するものではない。前記方法の核心を変化させることなく他の方法を同等に良好に用いることができる。それぞれの場合において、アッセイされる多型は、一塩基多型(SNP)、小さな挿入欠失またはSTRを含んでよい。好ましい方法は、SNPの使用を伴う。各手法により、対立遺伝子頻度データが生じ、各標的の遺伝子座についての対立遺伝子頻度データおよび/またはこれらの遺伝子座からの同時対立遺伝子頻度分布を解析して、胎児の倍数性を決定することができる。各手法は、供給源材料が限られていること、および母系の血漿が母系DNAと胎児DNAの混合物からなるという事実に起因して、それ自体の考慮すべき事柄を有する。この方法は、より正確な決定をもたらすための他の手法と組み合わせることができる。ある実施形態では、この方法を、米国特許第7,888,017号に記載のものなどの配列計数手法と組み合わせることができる。記載されている手法は、胎児の父系性を非侵襲的に、母系の血漿試料から検出するために用いることもできる。さらに、各手法は、異数性染色体の存在または不在を検出するため、分解されたDNA試料由来の多数のSNPについて遺伝子型決定するため、セグメントに分かれたコピー数の変動(CNV)を検出するため、他の対象の遺伝子型の状態またはそのいくつかの組み合わせを検出するために、他のDNAの混合物または純粋なDNA試料に適用することができる。 Three methods are described herein, multiplex PCR, targeted capture by hybridization, and ligated reverse probe (LIP), which can be used to detect fetal variability in the maternal line. Measurements can be obtained and analyzed from a sufficient number of polymorphic loci derived from plasma samples. This does not preclude other methods of selectively enriching the target locus. Other methods can be used equally well without changing the core of the method. In each case, the polymorphism assayed may include single nucleotide polymorphisms (SNPs), small insertion deletions or STRs. The preferred method involves the use of SNPs. Each technique produces allelic frequency data, which can be analyzed for allelic frequency data for each target locus and / or simultaneous allelic frequency distributions from these loci to determine fetal multiples. can. Each approach has its own considerations due to the limited source material and the fact that maternal plasma consists of a mixture of maternal DNA and fetal DNA. This method can be combined with other methods to result in more accurate decisions. In certain embodiments, this method can be combined with sequence counting techniques such as those described in US Pat. No. 7,888,017. The techniques described can also be used to detect fetal paternality non-invasively from maternal plasma samples. In addition, each method detects segmented copy number variation (CNV) to genotype a large number of SNPs from degraded DNA samples to detect the presence or absence of heterologous chromosomes. Therefore, it can be applied to a mixture of other DNAs or a pure DNA sample to detect the status of other genotypes of interest or some combination thereof.

試料中の対立遺伝子分布の正確な測定
現行の配列決定手法を用いて、試料中の対立遺伝子の分布を推定することができる。そのような方法の1つは、ショットガン配列決定と称される、プールDNAから配列を無作為にサンプリングするステップを包含する。配列決定データにおける特定の対立遺伝子の割合は、一般には、非常に低く、単純統計量によって決定することができる。ヒトゲノムは、およそ30億の塩基対を含有する。したがって、使用した配列決定方法により100bpのリードが生じた場合、特定の対立遺伝子は、およそ3,000万回のシーケンスリードごとに1回測定される。
Accurate measurement of allele distribution in a sample Current sequencing techniques can be used to estimate the distribution of alleles in a sample. One such method involves a step of randomly sampling sequences from pooled DNA, called shotgun sequencing. The proportion of a particular allele in the sequencing data is generally very low and can be determined by simple statistics. The human genome contains approximately 3 billion base pairs. Therefore, if the sequencing method used yields 100 bp reads, the particular allele is measured approximately once for every 30 million sequence reads.

ある実施形態では、本開示の方法を用いて、DNAの試料中の同じ遺伝子座の集合を含有する2種以上の異なるハプロタイプの存在または不在を、その染色体由来の遺伝子座の測定された対立遺伝子分布から決定する。異なるハプロタイプは、1つの個体由来の2つの異なる相同染色体、トリソミーの個体由来の3つの異なる相同染色体、母親および胎児由来の3つの異なる相同なハプロタイプであって、該ハプロタイプのうちの1つが母親と胎児の間で共有されるハプロタイプ、母親および胎児由来の3つまたは4つのハプロタイプであって、該ハプロタイプの1つまたは2つが母親と胎児の間で共有されるハプロタイプ、または他の組み合わせを示し得る。ハプロタイプ間で多型である対立遺伝子はより情報価値がある傾向があるが、母親および父親がどちらも同じ対立遺伝子についてホモ接合性ではない任意の対立遺伝子により、測定された対立遺伝子分布を通じて、単純リード数解析から入手可能である情報を越えた有用な情報がもたらされる。 In certain embodiments, the methods of the present disclosure are used to determine the presence or absence of two or more different haplotypes containing the same set of loci in a sample of DNA, a measured allele of the locus derived from that chromosome. Determined from the distribution. Different haplotypes are two different homologous chromosomes from one individual, three different homologous chromosomes from trisomy individuals, and three different homologous haplotypes from the mother and fetus, one of which is with the mother. A haplotype shared between the fetus, three or four haplotypes derived from the mother and the fetus, one or two of which may indicate a haplotype shared between the mother and the fetus, or another combination. .. Alleles that are polymorphic between haplotypes tend to be more informative, but simple through the allele distribution measured by any allele whose mother and father are not homozygous for the same allele. It provides useful information that goes beyond what is available from read count analysis.

しかし、そのような試料のショットガン配列決定は、それにより、試料中の異なるハプロタイプ間で多型ではない領域、または対象ではない染色体についての多くの配列がもたらされ、したがって、標的ハプロタイプの割合に関する情報を示さないので、非常に非効率的である。本明細書には、ゲノム内で多型である可能性がより高い、試料中のDNAのセグメントを特異的に標的とし、かつ/または優先的に富化して、配列決定によって得られる対立遺伝子の情報の収量を上昇させる方法が記載されている。標的個体に存在する実際の量を真に表すことになる富化された試料において測定された対立遺伝子分布について、標的のセグメント内の所与の遺伝子座における他の対立遺伝子と比較して1つの対立遺伝子の優先的な富化がわずかである、または存在しないことが重大であることに留意されたい。多型対立遺伝子を標的とするための現行の当技術分野で公知の方法は、存在する任意の対立遺伝子の少なくとも一部が検出されることが確実になるように設計されている。しかし、これらの方法は、元の混合物に存在する多型対立遺伝子の不偏の対立遺伝子分布を測定する目的では設計されていなかった。標的富化の任意の特定の方法により、富化された試料を生成することができ、測定された対立遺伝子分布が元の増幅されていない試料に存在する対立遺伝子分布を、任意の他の方法よりも良好に正確に示すことは自明ではない。理論上は、多くの富化方法がそのような目的を実現することが予測され得るが、当業者は、現行の増幅、標的化および他の優先的な富化方法には相当量の確率論的または決定論的な偏りがあることをよく理解している。本明細書に記載の方法の一実施形態により、ゲノム内の所与の遺伝子座に対応するDNAの混合物に見いだされる複数の対立遺伝子を、対立遺伝子のそれぞれの富化の程度がほぼ同じになるように増幅または優先的に富化することが可能になる。別の言い方では、前記方法により、各遺伝子座に対応する対立遺伝子間の比は元のDNAの混合物における比と基本的に同じままで、混合物に存在する対立遺伝子の相対的な量を全体として増大させることが可能になる。いくつかの報告されている方法では、1%超、2%超、5%超、さらには10%超の対立遺伝子の偏りがもたらされ得る。この優先的な富化は、ハイブリダイゼーション手法による捕捉を用いた場合の捕捉の偏り、または各サイクルに関しては小さい可能性があるが、20サイクル、30サイクルまたは40サイクルにわたって組み立てる(compounded)と大きくなり得る増幅の偏りに起因し得る。本開示の目的で、比が基本的に同じままであるとは、元の混合物における対立遺伝子の比を、生じた混合物における対立遺伝子の比で割ったものが、0.95から1.05の間、0.98から1.02の間、0.99から1.01の間、0.995から1.005の間、0.998から1.002の間、0.999から1.001の間、または0.9999から1.0001の間であることを意味する。本明細書で提示された対立遺伝子の比の算出は、標的個体の倍数性状態の決定には使用することができず、単に対立遺伝子の偏りを測定するために使用されるメトリックであり得ることに留意されたい。 However, shotgun sequencing of such samples results in many sequences for non-polymorphic regions, or non-target chromosomes, among different haplotypes in the sample, and thus the proportion of target haplotypes. It is very inefficient because it does not show any information about. Here we describe alleles obtained by sequencing by specifically targeting and / or preferentially enriching a segment of DNA in a sample that is more likely to be polymorphic in the genome. It describes how to increase the yield of information. One allele distribution measured in an enriched sample that would truly represent the actual amount present in the target individual compared to other alleles at a given locus within the target segment. Note that it is important that the preferential enrichment of alleles is small or absent. Current methods known in the art for targeting polymorphic alleles are designed to ensure that at least a portion of any existing allele is detected. However, these methods were not designed to measure the unbiased allele distribution of polymorphic alleles present in the original mixture. Any particular method of target enrichment can produce an enriched sample, any other method of allelic distribution present in the original unamplified sample with the measured allelic distribution. It is not self-evident to show better and more accurately than. In theory, many enrichment methods can be expected to serve such objectives, but those skilled in the art have considerable probabilistic theory for current amplification, targeting and other preferred enrichment methods. I understand well that there is a target or deterministic bias. By one embodiment of the method described herein, multiple alleles found in a mixture of DNA corresponding to a given locus in the genome will have approximately the same degree of enrichment of each allele. It becomes possible to amplify or preferentially enrich. In other words, by the method described above, the ratio between alleles corresponding to each locus remains essentially the same as the ratio in the original DNA mixture, with the relative amount of alleles present in the mixture as a whole. It will be possible to increase. Some reported methods can result in over 1%, over 2%, over 5%, and even over 10% allele bias. This preferential enrichment may be small for capture bias when using hybridization techniques, or for each cycle, but becomes greater when assembled over 20, 30 or 40 cycles. It may be due to the bias of the resulting amplification. For the purposes of the present disclosure, the ratio remains essentially the same when the ratio of alleles in the original mixture divided by the ratio of alleles in the resulting mixture is 0.95 to 1.05. Between 0.98 and 1.02, between 0.99 and 1.01, between 0.995 and 1.005, between 0.998 and 1.002, between 0.999 and 1.001. It means that it is between 0.9999 and 1.0001. The calculation of allele ratios presented herein cannot be used to determine the ploidy state of a target individual, but may simply be a metric used to measure allele bias. Please note.

ある実施形態では、混合物が標的遺伝子座の集合において優先的に富化されたら、クローン試料(単一分子から生成される試料;例としては、ILLUMINA GAIIx、ILLUMINA HiSeq、Life Technologies SOLiD、5500XLが挙げられる)について配列決定する、以前の、現行のまたは次世代の配列決定計器のうちの任意の1つを用いてシークエンシングができる。比は、標的の領域内の特定の対立遺伝子を通してシークエンシングによって評価することができる。これらのシーケンシングリードを、対立遺伝子の型、および、したがって決定される異なる対立遺伝子の割り当てに応じて分析し、カウントすることができる。1から数塩基の長さである変動について、対立遺伝子の検出は配列決定によって実施し、捕捉された分子の対立遺伝子の組成を評価するために、シーケンシングリードが問題の対立遺伝子にわたることが必須である。遺伝子型についてアッセイする捕捉された分子の総数は、シーケンシングリードの長さが増加することによって増加することができる。全ての分子の完全な配列決定により、富化されたプールにおいて利用可能な最大量のデータの収集が保証される。しかし、配列決定は、現在は費用がかかり、少数のシーケンスリードを用いて対立遺伝子分布を測定することができる方法は非常に価値がある。さらに、リードの長さが増加すると、可能性のあるリードの最大長に対する技術的な限界ならびに正確度の限界がでてくる。有用性が最大である対立遺伝子は、1~数塩基の長さのものであるが、理論的には、シーケンシングリードの長さよりも短い任意の対立遺伝子を使用することができる。対立遺伝子の変動は全ての型で生じるが、本明細書において提供される実施例は、ほんの数個隣接する塩基対に含有されるSNPまたは変異体に焦点を当てる。より大きな変異体、例えば、セグメントに分かれたコピー数の変異体は、多くの場合、セグメントの内部のSNPの全体的な集団が重複しているので、これらのより小さな変動を総計することによって検出することができる。数塩基よりも大きな変異体、例えば、STRは、特別な考慮およびいくつかの標的化手法研究を必要とするが、他のものは必要としない。 In one embodiment, once the mixture is preferentially enriched in the set of target loci, cloned samples (samples generated from a single molecule; examples include ILLUMINA GAIIx, ILLUMINA HiSeq, Life Technologies SOLiD, 5500XL. Can be sequenced using any one of the previous, current or next generation sequencing instruments that sequence. Ratios can be assessed by sequencing through specific alleles within the target region. These sequencing reads can be analyzed and counted according to the type of allele and the allocation of different alleles thus determined. For variations that are one to several bases in length, allele detection is performed by sequencing and it is essential that the sequencing reads span the alleles in question in order to assess the composition of the alleles in the captured molecule. Is. The total number of captured molecules assayed for genotype can be increased by increasing the length of the sequencing read. Complete sequencing of all molecules ensures the collection of the maximum amount of data available in the enriched pool. However, sequencing is now costly, and methods that allow allelic distribution to be measured using a small number of sequence reads are of great value. In addition, increasing lead length introduces technical and accuracy limits to the maximum possible lead length. The most useful allele is one to several bases in length, but theoretically any allele that is shorter than the length of the sequencing read can be used. Allelic variations occur in all types, but the examples provided herein focus on SNPs or variants contained in only a few adjacent base pairs. Larger variants, such as segmented copy count variants, are often detected by summing up these smaller variations, as the overall population of SNPs within the segment overlaps. can do. Mutants larger than a few bases, such as STR, require special consideration and some targeting technique studies, but not others.

ゲノム内の1個または複数個の変異体の位置を特異的に単離し、富化するために使用することができる複数の標的化手法が存在する。一般には、これらは、変異体配列に隣接している変異していない配列を利用することに依拠する。基質が母系血漿場合のシークエンシングにおける標的化に関連する他の研究者による報告がある(例えば、Liao et al.,Clin.Chem.2011;57(1):pp.92-101、を参照)。しかし、これらの手法は、エクソンを標的とする標的化プローブを使用し、ゲノムの多型領域を標的とすることには焦点を当てていない。ある実施形態では、本開示の方法は、多型領域に排他的またはほぼ排他的に焦点を当てた標的化プローブを使用するステップを包含する。ある実施形態では、本開示の方法は、SNPに排他的またはほぼ排他的に焦点を当てる標的化プローブを使用するステップを包含する。本開示のいくつかの実施形態では、標的の多型部位は、少なくとも10%のSNP、少なくとも20%のSNP、少なくとも30%のSNP、少なくとも40%のSNP、少なくとも50%のSNP、少なくとも60%のSNP、少なくとも70%のSNP、少なくとも80%のSNP、少なくとも90%のSNP、少なくとも95%のSNP、少なくとも98%のSNP、少なくとも99%のSNP、少なくとも99.9%のSNPまたは排他的にSNPからなる。 There are multiple targeting techniques that can be used to specifically isolate and enrich the location of one or more mutants in the genome. In general, they rely on utilizing unmutated sequences that are flanked by mutant sequences. There are reports by other researchers related to targeting in sequencing when the substrate is maternal plasma (see, eg, Liao et al., Clin. Chem. 2011; 57 (1): pp. 92-101). .. However, these methods use targeting probes that target exons and do not focus on targeting polymorphic regions of the genome. In certain embodiments, the methods of the present disclosure include the step of using a targeted probe that focuses exclusively or nearly exclusively on the polymorphic region. In certain embodiments, the methods of the present disclosure include the step of using a targeted probe that focuses exclusively or nearly exclusively on the SNP. In some embodiments of the present disclosure, the target polymorphic site is at least 10% SNP, at least 20% SNP, at least 30% SNP, at least 40% SNP, at least 50% SNP, at least 60%. SNPs, at least 70% SNPs, at least 80% SNPs, at least 90% SNPs, at least 95% SNPs, at least 98% SNPs, at least 99% SNPs, at least 99.9% SNPs or exclusively It consists of SNPs.

ある実施形態では、本開示の方法を用いて、遺伝子型(特定の遺伝子座におけるDNAの塩基組成)およびDNA分子の混合物由来のこれらの遺伝子型の相対的な割合を決定することができ、これらのDNA分子は、1つまたはいくつもの遺伝的に別個の個体を起源とし得る。ある実施形態では、本開示の方法を用いて、多型遺伝子座の集合における遺伝子型、およびこれらの遺伝子座に存在する異なる対立遺伝子の量の相対的な比を決定することができる。ある実施形態では、多型遺伝子座は、完全にSNPからなってよい。ある実施形態では、多型遺伝子座は、SNP、単一のタンデム反復、および他の多型を含んでよい。ある実施形態では、本開示の方法を用いて、DNAの混合物における多型遺伝子座の集合における対立遺伝子の相対的な分布を決定することができ、DNAの混合物は、母親を起源とするDNA、および胎児を起源とするDNAを含む。ある実施形態では、妊娠中の女性由来の血液から単離されたDNAの混合物について同時対立遺伝子分布を決定することができる。ある実施形態では、遺伝子座の集合における対立遺伝子分布を使用して、妊娠中の胎児について1個または複数個の染色体の倍数性状態を決定することができる。 In certain embodiments, the methods of the present disclosure can be used to determine the genotype (the basic composition of DNA at a particular locus) and the relative proportions of these genotypes from a mixture of DNA molecules. DNA molecules can originate from one or several genetically distinct individuals. In certain embodiments, the methods of the present disclosure can be used to determine the genotype in a set of polymorphic loci and the relative ratio of the amount of different alleles present at these loci. In certain embodiments, the polymorphic locus may consist entirely of SNPs. In certain embodiments, the polymorphic locus may include SNPs, single tandem repeats, and other polymorphisms. In certain embodiments, the methods of the present disclosure can be used to determine the relative distribution of alleles in a set of polymorphic loci in a DNA mixture, where the DNA mixture is a DNA of maternal origin, And contains DNA originating from the fetus. In certain embodiments, the co-allelic distribution can be determined for a mixture of DNA isolated from blood from a pregnant woman. In certain embodiments, the allelic distribution in a set of loci can be used to determine the ploidy state of one or more chromosomes for a pregnant fetus.

ある実施形態では、DNA分子の混合物は、1つの個体の複数の細胞から抽出したDNAに由来してよい。ある実施形態では、個体がモザイク(生殖系列または体細胞)である場合、DNAが由来する元の細胞の集団は、同じ遺伝子型または異なる遺伝子型の二倍体細胞または一倍体細胞の混合物を含み得る。ある実施形態では、DNA分子の混合物は、単一細胞から抽出したDNAに由来してもよい。ある実施形態では、DNA分子の混合物は、同じ個体の2つ以上の細胞または異なる個体の2つ以上の細胞の混合物から抽出したDNAに由来してもよい。ある実施形態では、DNA分子の混合物は、無細胞DNAを含有することが公知である血漿などの、既に細胞から遊離した生物材料から単離されたDNAに由来してよい。ある実施形態では、この生物材料は、胎児DNAが混合物中に存在することが示されている妊娠中の場合と同様に、1つまたは複数の個体由来のDNAの混合物であってよい。ある実施形態では、生物材料は、母系の血液中に見いだされた細胞の混合物由来であってよく、細胞のいくつかは胎児を起源とする。ある実施形態では、生物材料は、胎児の細胞において富化された妊娠中の血液由来の細胞であってよい。 In certain embodiments, the mixture of DNA molecules may be derived from DNA extracted from multiple cells of an individual. In one embodiment, when the individual is a mosaic (germline or somatic cell), the original cell population from which the DNA is derived contains a mixture of diploid cells or haploid cells of the same or different genotypes. Can include. In certain embodiments, the mixture of DNA molecules may be derived from DNA extracted from a single cell. In certain embodiments, the mixture of DNA molecules may be derived from DNA extracted from a mixture of two or more cells of the same individual or two or more cells of different individuals. In certain embodiments, the mixture of DNA molecules may be derived from DNA isolated from a biological material already freed from cells, such as plasma, which is known to contain cell-free DNA. In certain embodiments, the biological material may be a mixture of DNA from one or more individuals, as in the case of pregnancy in which fetal DNA has been shown to be present in the mixture. In certain embodiments, the biomaterial may be from a mixture of cells found in the blood of the maternal line, some of which are of fetal origin. In certain embodiments, the biological material may be cells derived from pregnant blood enriched in fetal cells.

環状化プローブ
本開示のいくつかの実施形態は、以前文献に記載された「連結逆方向プローブ」(LIP)を使用し、本発明の多重PCR法でLIPではないプライマーを使って増幅する前または後で、標的遺伝子座を増幅することを含む。LIPとは、環状DNA分子を作製することを伴う技術を包含することを意味する総称であり、プローブは、標的の対立遺伝子の両側の標的のDNAの領域とハイブリダイズするように設計されており、したがって、適切なポリメラーゼおよび/もしくはリガーゼ、および適切な条件、緩衝液および他の試薬の添加により、標的の対立遺伝子をわたるDNAの相補的な逆方向領域が完成し標的の対立遺伝子に見いだされる情報を捕捉するDNAの環状ループを作製される。LIPは、環状化前プローブ(pre-circularized probe)、環状化前プローブ(pre-circularizing probe)または環状化プローブとも称される。LIPプローブは、長さが50ヌクレオチドから500ヌクレオチドの間の直鎖DNA分子であってよく、ある実施形態では、長さが70ヌクレオチドから100ヌクレオチドの間であってよく、いくつかの実施形態では、本明細書に記載されているよりも長くてよい、または短くてよい。本開示の他の複数の実施形態は、LIP技術の異なる具体化、例えば、Padlockプローブおよび分子逆方向プローブ(MIP)を伴う。
Cyclic probe Some embodiments of the present disclosure use a "connected reverse probe" (LIP) previously described in the literature, either prior to amplification with a non-LIP primer in the multiplex PCR method of the invention. Later, it involves amplifying the target locus. LIP is a generic term that means to include techniques involving the production of circular DNA molecules, and probes are designed to hybridize to regions of the target DNA on both sides of the target allele. Thus, with the addition of the appropriate polymerase and / or ligase, and appropriate conditions, buffers and other reagents, complementary reverse regions of DNA across the target allele are completed and found in the target allele. A circular loop of DNA that captures information is created. The LIP is also referred to as a pre-cyclalized probe, a pre-cyclalizing probe or a cyclized probe. The LIP probe may be a linear DNA molecule with a length between 50 and 500 nucleotides, in some embodiments between 70 and 100 nucleotides in length, and in some embodiments. , May be longer or shorter than described herein. Other embodiments of the present disclosure involve different reifications of LIP technology, such as padlock probes and reverse molecular probes (MIPs).

配列決定するために特定の場所を標的とする1つの方法は、プローブの3’末端および5’末端が標的DNAと、標的の領域に近接し、その両側の場所で、逆方向様式でアニーリングし、したがって、DNAポリメラーゼおよびDNAリガーゼを添加することにより、3’末端からの伸長がもたらされ、標的分子と相補的な一本鎖プローブに塩基が付加され(ギャップ充填)、その後、新しい3’末端が元のプローブの5’末端とライゲーションし、その結果、後でバックグラウンドDNAから単離することができる環状DNA分子がもたらされるようなプローブを合成することである。プローブ末端は、対象の標的の領域に隣接するように設計されている。Oこの手法の一態様は、一般に、MIPSと称され、充填される配列の性質を決定するために、アレイ技術と併せて用いられている。対立遺伝子の比を測定する状況においてMIPを用いることの1つの欠点は、ハイブリダイゼーションステップ、環状化ステップおよび増幅ステップが、同じ遺伝子座における異なる対立遺伝子について同等の率で起こらないことである。その結果、元の混合物に存在する実際の対立遺伝子の比を表さない対立遺伝子の比が測定される。 One method of targeting a specific site for sequencing is that the 3'and 5'ends of the probe are close to the target DNA and the target region and are annealed in a reverse fashion at both sites. Therefore, the addition of DNA polymerase and DNA ligase results in extension from the 3'end, adding a base to the single-stranded probe complementary to the target molecule (gap filling), followed by a new 3'. Synthesizing a probe such that the end ligates to the 5'end of the original probe, resulting in a circular DNA molecule that can later be isolated from the background DNA. The probe end is designed to be adjacent to the target area of interest. O One aspect of this technique, commonly referred to as MIPS, is used in conjunction with array technology to determine the nature of the array to be filled. One drawback of using MIP in situations where the ratio of alleles is measured is that the hybridization, cyclization and amplification steps do not occur at equal rates for different alleles at the same locus. As a result, the ratio of alleles that do not represent the ratio of the actual alleles present in the original mixture is measured.

ある実施形態では、環状化プローブは、標的の多型遺伝子座の上流とハイブリダイズするように設計されているプローブの領域および標的の多型遺伝子座の下流とハイブリダイズするように設計されているプローブの領域が、非核酸骨格を通じ共有結合的に接続するように構築される。この骨格は、任意の生体適合性分子または生体適合性分子の組み合わせであってよい。可能性のある生体適合性分子のいくつかの例は、ポリ(エチレングリコール)、ポリカーボネート、ポリウレタン、ポリエチレン、ポリプロピレン、スルホンポリマー、シリコーン、セルロース、フルオロポリマー、アクリル化合物、スチレンブロック共重合体、および他のブロック共重合体である。 In certain embodiments, the circularized probe is designed to hybridize to a region of the probe that is designed to hybridize upstream of the target polymorphic locus and downstream of the target polymorphic locus. Regions of the probe are constructed to connect covalently through a non-nucleic acid skeleton. The skeleton may be any biocompatible molecule or a combination of biocompatible molecules. Some examples of possible biocompatible molecules are poly (ethylene glycol), polycarbonate, polyurethane, polyethylene, polypropylene, sulfone polymers, silicones, cellulose, fluoropolymers, acrylic compounds, styrene block copolymers, and others. It is a block copolymer of.

本開示のある実施形態では、この手法は、配列内の充填を調べる手段として配列決定を容易に受けられるように改変されている。元の試料の元の対立遺伝子の割合を保持するために、少なくとも1つの重要な考慮すべき事柄を考慮に入れなければならない。ギャップ充填領域内の異なる対立遺伝子の間の可変性の位置は、変異体の鑑別をもたらすDNAポリメラーゼによる開始の偏りがあり得るので、プローブ結合部位に近すぎないようにすべきである。別の考慮すべき事柄は、異なる対立遺伝子からの不均等な増幅をもたらし得るギャップ充填領域内の変異体と相関があるプローブ結合部位にさらなる変動が存在する可能性があることである。本開示のある実施形態では、環状化前プローブの3’末端および5’末端を、標的の対立遺伝子の変異の位置(多型部位)と1つまたは少数の位置だけ離れている塩基とハイブリダイズするように設計する。多型部位(SNPまたは他の種類のもの)と、環状化前プローブの3’末端および/または5’末端がハイブリダイズするように設計されている塩基との間の塩基の数は、1塩基であってよく、2塩基であってよく、3塩基であってよく、4塩基であってよく、5塩基であってよく、6塩基であってよく、7~10塩基であってよく、11~15塩基であってよく、または、16~20塩基、20~30塩基または30~60塩基であってよい。フォワードプライマーおよびリバースプライマーは、多型部位から離れた異なる数の塩基とハイブリダイズするように設計することができる。現行のDNA合成技術を用いて環状化プローブを多数生成することができ、これにより、非常に多数のプローブを生成し、潜在的にプールすることが可能になり、多くの遺伝子座を同時に調べることができる。300,000超のプローブで作業することが報告されている。標的個体のゲノムのデータを測定するために使用することができる環状化プローブを伴う方法を考察している2つの論文としては、Porrecaら、Nature Methods、2007年、4巻(11号)、931~936頁;および同様にTurnerら、Nature Methods、2009年、6巻(5号)、315~316頁が挙げられる。これらの論文に記載されている方法は、本明細書に記載の他の方法と組み合わせて用いることができる。これらの2つの論文からの方法の特定のステップは、本明細書に記載の他の方法からの他のステップと組み合わせて用いることができる。 In certain embodiments of the present disclosure, the technique has been modified to facilitate sequencing as a means of examining filling within a sequence. At least one important consideration must be taken into account in order to retain the proportion of the original allele in the original sample. The location of variability between different alleles within the gap-filled region should not be too close to the probe binding site, as there may be a bias in initiation by the DNA polymerase that results in the differentiation of the mutant. Another consideration is that there may be additional variability in probe binding sites that correlate with variants within the gap-filled region that can result in uneven amplification from different alleles. In one embodiment of the present disclosure, the 3'and 5'ends of the pre-cyclization probe hybridize to a base that is separated from the mutation location (polymorphic site) of the target allele by one or a few positions. Design to do. The number of bases between the polymorphic site (SNP or other type) and the base designed to hybridize the 3'and / or 5'ends of the pre-cyclization probe is 1 base. It may be 2 bases, 3 bases, 4 bases, 5 bases, 6 bases, 7-10 bases, 11 It may be up to 15 bases, or 16 to 20 bases, 20 to 30 bases or 30 to 60 bases. Forward and reverse primers can be designed to hybridize to different numbers of bases away from the polymorphic site. A large number of circularized probes can be generated using current DNA synthesis techniques, which allows a large number of probes to be generated and potentially pooled, allowing the simultaneous examination of many loci. Can be done. It has been reported to work with over 300,000 probes. Two papers discussing methods involving circularized probes that can be used to measure genomic data of target individuals include Porreca et al., Nature Methods, 2007, Vol. 4, (No. 11), 931. Pp. 936; and similarly, Turner et al., Nature Methods, 2009, Volume 6 (No. 5), pp. 315-316. The methods described in these papers can be used in combination with the other methods described herein. The specific steps of the method from these two papers can be used in combination with other steps from the other methods described herein.

本明細書に開示されている方法のいくつかの実施形態では、標的個体の遺伝物質を、必要に応じて増幅し、その後、環状化前プローブとハイブリダイズさせ、ギャップ充填を実施してハイブリダイズしたプローブの2つの末端間の塩基を充填し、2つの末端をライゲーションして環状化されたプローブを形成し、環状化されたプローブを、例えば、ローリングサークル増幅を用いて増幅する。所望の標的対立遺伝子の遺伝子情報が適切に設計された環状化オリゴヌクレオチド性プローブ、例えば、LIP系において捕捉されたら、環状化されたプローブの遺伝子配列を測定して、所望の配列データをもたらすことができる。ある実施形態では、適切に設計されたオリゴヌクレオチドプローブを、増幅されなかった標的個体の遺伝物質において直接環状化し、その後増幅することができる。ローリングサークル増幅、MDAまたは他の増幅プロトコールを含めたいくつもの増幅手順を使用して、元の遺伝物質を増幅することまたはLIPを環状化することができることに留意されたい。異なる方法を用いて、例えば、ハイスループット配列決定、サンガー配列決定、他の配列決定方法、ハイブリダイゼーションによる捕捉、環状化による捕捉、多重PCR、他のハイブリダイゼーション方法、およびそれらの組み合わせを用いて、標的ゲノム上の遺伝子情報を測定することができる。 In some embodiments of the methods disclosed herein, the genetic material of the target individual is amplified as needed, then hybridized with the pre-cyclization probe, and gap filling is performed for hybridization. The base between the two ends of the probe is filled and the two ends are ligated to form a circularized probe, and the circularized probe is amplified using, for example, rolling circle amplification. Once the genetic information of the desired target allele is captured in a well-designed circular oligonucleotide-like probe, eg, a LIP system, the gene sequence of the circularized probe is measured to yield the desired sequence data. Can be done. In certain embodiments, a well-designed oligonucleotide probe can be directly cyclized in the genetic material of the unamplified target individual and then amplified. It should be noted that a number of amplification procedures, including rolling circle amplification, MDA or other amplification protocols, can be used to amplify the original genetic material or to cyclize the LIP. Using different methods, eg, high-throughput sequencing, Sanger sequencing, other sequencing methods, hybridization-based capture, cyclization-based capture, multiplex PCR, other hybridization methods, and combinations thereof. Genetic information on the target genome can be measured.

上記の方法の1つまたは組み合わせ、インフォマティクスに基づく方法、例えば、PARENTAL SUPPORT(商標)法を、適切な遺伝子測定と一緒に用いて個体の遺伝物質を測定したら、次いで、それを用いて、個体における1個または複数個の染色体の倍数性状態、および/または対立遺伝子の1つもしくは対立遺伝子の集合(詳細には、対象の疾患または遺伝子の状態と相関する対立遺伝子)の遺伝子の状態を決定することができる。遺伝子配列を多重化捕捉し、その後、配列決定を用いて遺伝子型決定するためのLIPの使用が報告されていることに留意されたい。しかし、LIPに基づく戦略によって生じる配列決定データを、単一細胞、少数の細胞または細胞外DNAにおいて見いだされる遺伝物質を増幅するために使用することは、標的個体の倍数性状態を決定するためには用いられていない。 One or a combination of the above methods, an informatics-based method, eg, the PARENTAL SUPPORT ™ method, is used in conjunction with appropriate genetic measurement to measure an individual's genetic material, which is then used in the individual. Determines the polymorphic state of one or more chromosomes and / or the state of the gene for one or a set of alleles (specifically, alleles that correlate with the state of the disease or gene of interest). be able to. Note that the use of LIP for multiplexing and capturing gene sequences and then genotyping using sequencing has been reported. However, the use of sequencing data generated by LIP-based strategies to amplify genetic material found in single cells, small numbers of cells or extracellular DNA is to determine the ploidy state of the target individual. Is not used.

ハイブリダイゼーションアレイ、例えば、ILLUMINA INFINIUMアレイまたはAFFYMETRIX遺伝子チップによって測定された遺伝子データから個体の倍数性状態を決定するためのインフォマティクスに基づく方法の適用は、本文書の他の箇所の参考文献に記載されている。しかし、本明細書に記載の方法は、以前に文献に記載された方法に対する改善を示す。例えば、LIPに基づく手法、その後のハイスループット配列決定により、この手法は、多重化についての能力がより優れ、捕捉特異性がより優れ、均一性がより優れ、対立遺伝子の偏りが少ないので、予想外に、より良好な遺伝子型データがもたらされる。多重化がより大きいことにより、より多くの対立遺伝子を標的とすることが可能になり、より正確な結果がもたらされる。均一性がより優れていることにより、より多くの標的の対立遺伝子が測定され、より正確な結果がもたらされる。対立遺伝子の偏りの率がより低いことにより、誤ったコールの率が低下し、より正確な結果がもたらされる。より正確な結果により、臨床転帰が改善され、より良い医療がもたらされる。 The application of informatics-based methods for determining an individual's multiple state from genetic data measured by a hybridization array, such as the ILLUMINA INFINIUM array or the AFFYMETRIX gene chip, is described in references elsewhere in this document. ing. However, the methods described herein show an improvement over the methods previously described in the literature. For example, with a LIP-based approach followed by high-throughput sequencing, this approach is expected because it has better multiplexing capabilities, better capture specificity, better uniformity, and less allele bias. Externally, better genotype data is provided. Larger multiplexing allows more alleles to be targeted, resulting in more accurate results. The better homogeneity measures more target alleles, resulting in more accurate results. The lower rate of allele bias reduces the rate of false calls and provides more accurate results. More accurate results improve clinical outcomes and lead to better medical care.

LIPを、配列決定以外の方法によって遺伝子型決定するために、DNAの試料における特定の遺伝子座を標的とするための方法として用いることができることに留意することが重要である。例えば、SNPアレイまたは他のDNAもしくはRNAに基づくマイクロアレイを用いて遺伝子型決定するために、LIPを用いてDNAを標的とすることができる。 It is important to note that LIP can be used as a method for targeting specific loci in a sample of DNA for genotyping by methods other than sequencing. For example, DNA can be targeted using LIP for genotyping using SNP arrays or other DNA or RNA-based microarrays.

ライゲーション媒介性PCR
ライゲーションされていないプライマーを使ってPCR増幅する前または後でライゲーション媒介性PCRを使って標的遺伝子座を増幅できる。ライゲーション媒介性PCRは、DNAの混合物における1個または複数個の遺伝子座を増幅することによってDNAの試料を優先的に富化するために用いるPCRの方法であり、前記方法は、プライマー対の集合を得るステップであって、対の各プライマーが標的特異的配列および非標的配列を含有し、好ましくは、標的特異的配列が、標的領域であって、1つが多型部位の上流、および1つが多型部位の下流である標的領域とアニーリングするように設計されており、該標的特異的配列が、多型部位から0、1、2、3、4、5、6、7、8、9、10、11~20、21~30、31~40、41~50、51~100、または、100超隔てられていてよいステップと、上流のプライマーの3’末端からDNAを重合させて、それと、標的分子と相補的なヌクレオチドを有する下流のプライマーの5’末端との間の一本鎖領域を充填するステップと、上流のプライマーの最後の重合した塩基を、近接する下流のプライマーの5’塩基とライゲーションさせるステップと、重合し、ライゲーションした分子のみを、上流のプライマーの5’末端および下流のプライマーの3’末端を含有する非標的配列を使用して増幅するステップとを含む。別個の標的に対するプライマー対を同じ反応において混合することができる。非標的配列は、ユニバーサル配列としての機能を果たし、したがって、首尾よく重合し、ライゲーションした全てのプライマー対を、増幅プライマーの単一の対を用いて増幅することができる。
Ligation-mediated PCR
Target loci can be amplified using ligation-mediated PCR before or after PCR amplification with unligated primers. Ligation-mediated PCR is a method of PCR used to preferentially enrich a sample of DNA by amplifying one or more loci in a mixture of DNA, wherein the method is a set of primer pairs. Each primer in the pair contains a target-specific sequence and a non-target sequence, preferably the target-specific sequence is the target region, one upstream of the polymorphic site, and one. Designed to anneal to a target region downstream of the polymorphic site, the target-specific sequence is 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, from the polymorphic site. Steps that may be separated by 10, 11-20, 21-30, 31-40, 41-50, 51-100, or more than 100, and DNA polymerized from the 3'end of the upstream primer, and The step of filling the single-stranded region between the 5'end of the downstream primer having a nucleotide complementary to the target molecule and the last polymerized base of the upstream primer are the 5'bases of the adjacent downstream primer. It comprises the steps of ligating with and amplifying only the polymerized and ligated molecules using a non-target sequence containing the 5'end of the upstream primer and the 3'end of the downstream primer. Primer pairs for different targets can be mixed in the same reaction. The non-target sequence acts as a universal sequence and therefore all successfully polymerized and ligated primer pairs can be amplified with a single pair of amplification primers.

ハイブリダイゼーションによる捕捉
いくつかの実施形態では、本開示の方法は、多重PCRを使用して標的遺伝子座を増幅することに加えて、次のいずれかのハイブリダイゼーション法による捕捉を使用するステップを含むことができる。標的ゲノムにおける特異的な配列の集合を優先的に富化することは、いくつもの方法で実現することができる。本文書の他の箇所に、特異的な配列の集合を標的とするためにLIPをどのように用いることができるかについての記載があるが、これらの適用の全てにおいて、他の標的化および/または優先的な富化方法を、同じ目的のために同等に良好に用いることができる。別の標的化方法の1つの例はハイブリダイゼーション手法による捕捉である。商業的なハイブリダイゼーション技術による捕捉のいくつかの例としては、AGILENTのSURE SELECT、およびILLUMINAのTruSeqが挙げられる。ハイブリダイゼーションによる捕捉では、所望の標的の配列と相補的またはほぼ相補的なオリゴヌクレオチドの集合をDNAの混合物とハイブリダイズさせ、次いで混合物から物理的に分離することが可能になる。所望の配列が標的化オリゴヌクレオチドとハイブリダイズしたら、標的化オリゴヌクレオチドを物理的に取り出す作用により、標的の配列も取り出されることになる。ハイブリダイズしたオリゴを取り出したら、それらを、それらの融解温度を上回るまで加熱し、増幅することができる。標的化オリゴヌクレオチドを物理的に取り出すためのいくつかの方法は、標的化オリゴを固体支持体、例えば磁気ビーズまたはチップと共有結合させることによる。標的化オリゴヌクレオチドを物理的に取り出すための別の方法は、標的化オリゴヌクレオチドを、別の分子部分に対する強力な親和性を有する分子部分と共有結合させることによる。そのような分子対の例は、例えばSURE SELECTにおいて使用されるビオチンおよびストレプトアビジンである。したがって、その標的の配列をビオチン分子に共有結合的に付着させ、ハイブリダイゼーション後に、ストレプトアビジンを付加した固体支持体を使用して、標的の配列がハイブリダイズしたビオチン化オリゴヌクレオチドをプルダウンすることができる。
Capturing by Hybridization In some embodiments, the method of the present disclosure comprises the step of using capture by any of the following hybridization methods, in addition to amplifying the target locus using multiplex PCR. be able to. Priority enrichment of a set of specific sequences in the target genome can be achieved in a number of ways. Other parts of this document describe how LIP can be used to target a set of specific sequences, but in all of these applications other targeting and / Alternatively, preferred enrichment methods can be used equally well for the same purpose. One example of another targeting method is capture by hybridization techniques. Some examples of capture by commercial hybridization techniques include Agilent's SURE SELECT and ILLUMINA's TruSeq. Hybridization capture allows the set of oligonucleotides that are complementary or nearly complementary to the desired target sequence to hybridize to the mixture of DNA and then be physically separated from the mixture. Once the desired sequence hybridizes to the targeted oligonucleotide, the action of physically extracting the targeted oligonucleotide will also extract the target sequence. Once the hybridized oligos are removed, they can be heated and amplified to above their melting temperature. Several methods for physically removing the targeted oligonucleotide are by covalently attaching the targeted oligonucleotide to a solid support, such as a magnetic bead or chip. Another method for physically removing a targeted oligonucleotide is by covalently attaching the targeted oligonucleotide to a molecular moiety that has a strong affinity for another molecular moiety. Examples of such molecular pairs are, for example, biotin and streptavidin used in SURE SELECT. Therefore, the target sequence can be covalently attached to the biotin molecule, and after hybridization, a solid support to which streptavidin is added can be used to pull down the biotinylated oligonucleotide to which the target sequence has hybridized. can.

ハイブリッド捕捉は、対象の標的と相補的なプローブを標的分子とハイブリダイズさせることを伴う。ハイブリッド捕捉プローブはもともと、標的間に相対的な均一性を有するゲノムの大部分を標的とし、富化するために開発された。その適用では、増幅される全ての標的が、全ての領域を配列決定によって検出することができる十分な均一性を有することが重要であったが、元の試料における対立遺伝子の割合を保持することには注意が払われなかった。捕捉した後、試料中に存在する対立遺伝子を、捕捉された分子の直接配列決定によって決定することができる。これらのシーケンシングリードを、対立遺伝子の型に応じて分析し、カウントすることができる。しかし、現行の技術を用いると、測定された捕捉された配列の対立遺伝子分布は、一般には、元の対立遺伝子分布を表さない。 Hybrid capture involves hybridizing a probe complementary to the target of interest to the target molecule. Hybrid capture probes were originally developed to target and enrich most of the genome with relative homogeneity between targets. In its application, it was important that all amplified targets had sufficient homogeneity so that all regions could be detected by sequencing, but retaining the proportion of alleles in the original sample. Was not paid attention to. After capture, alleles present in the sample can be determined by direct sequencing of the captured molecule. These sequencing reads can be analyzed and counted according to the type of allele. However, using current techniques, the measured allelic distribution of the captured sequence generally does not represent the original allelic distribution.

ある実施形態では、配列決定によって対立遺伝子の検出を実施する。多型部位における対立遺伝子の同一性を捕捉するために、捕捉された分子の対立遺伝子の組成を評価するために、シーケンシングリードが問題の対立遺伝子にわたることが必須である。捕捉分子は多くの場合、長さが変動するので、配列決定の際に、分子全体が配列決定されなければ、変異の位置がオーバーラップすることを保証することができない。しかし、最大の可能性のある長さおよびシーケンシングリードの正確度に関する費用検討ならびに技術的な限界により、分子全体の配列決定は実行できない。ある実施形態では、約30塩基から約50塩基または約70塩基まで増加させることができるリードの長さにより、標的の配列内の変異の位置とオーバーラップするリード数を著しく増加させることができる。 In certain embodiments, allele detection is performed by sequencing. In order to capture allele identity at the polymorphic site, it is essential that the sequencing read span the allele in question in order to assess the composition of the alleles in the captured molecule. Since capture molecules often vary in length, it cannot be guaranteed that mutation positions will overlap unless the entire molecule is sequenced during sequencing. However, due to cost considerations and technical limitations regarding the maximum possible length and accuracy of sequencing reads, whole molecule sequencing cannot be performed. In certain embodiments, a read length that can be increased from about 30 bases to about 50 bases or about 70 bases can significantly increase the number of reads that overlap the location of the mutation in the target sequence.

対象の位置を調べるリード数を増加させるための別の方法は、基礎をなす富化された対立遺伝子の偏りをもたらさない限りはプローブの長さを減少させることである。合成されたプローブの長さは、1つの遺伝子座において見いだされた2つの異なる対立遺伝子とハイブリダイズするように設計された2種のプローブが元の試料中の種々の対立遺伝子とほぼ同等の親和性でハイブリダイズするために十分な長さであるべきである。現在、当技術分野で公知の方法には、一般には120塩基より長いプローブが記載されている。現行の実施形態において、対立遺伝子が1つまたは少数の塩基である場合、捕捉プローブは、約110塩基未満、約100塩基未満、約90塩基未満、約80塩基未満、約70塩基未満、約60塩基未満、約50塩基未満、約40塩基未満、約30塩基未満、および約25塩基未満であってもよく、全ての対立遺伝子からの同等の富化を確実にするためにはこの量で十分である。ハイブリッド捕捉技術を用いて富化するDNAの混合物が、血液、例えば母系の血液から単離された浮動性DNAを含む混合物である場合、DNAの平均長はかなり短く、一般には、200塩基未満である。より短いプローブを使用することにより、ハイブリッド捕捉プローブが所望のDNA断片を捕捉する見込みが大きくなる。より大きな変動は、より長いプローブを必要とする場合がある。ある実施形態では、対象の変動は、1(SNP)~数塩基の長さである。ある実施形態では、ゲノム内の標的の領域を、ハイブリッド捕捉プローブを使用して優先的に富化することができ、ここで、ハイブリッド捕捉プローブの長さは90塩基未満であり、80塩基未満、70塩基未満、60塩基未満、50塩基未満、40塩基未満、30塩基未満または25塩基未満であってよい。ある実施形態では、所望の対立遺伝子が配列決定される見込みを増大させるために、多型の対立遺伝子の場所に隣接している領域とハイブリダイズするように設計されているプローブの長さを、90塩基超から、約80塩基まで、または約70塩基まで、または約60塩基まで、または約50塩基まで、または約40塩基まで、または約30塩基まで、または約25塩基まで減少させることができる。 Another way to increase the number of reads to locate a subject is to reduce the length of the probe as long as it does not result in a bias in the underlying enriched alleles. The length of the synthesized probe is such that the two probes designed to hybridize with two different alleles found at one locus have approximately the same affinity as the various alleles in the original sample. It should be long enough to hybridize by sex. Currently, methods known in the art generally describe probes longer than 120 bases. In current embodiments, when the allele is one or a few bases, the capture probe is less than about 110 bases, less than about 100 bases, less than about 90 bases, less than about 80 bases, less than about 70 bases, about 60. It may be less than a base, less than about 50 bases, less than about 40 bases, less than about 30 bases, and less than about 25 bases, and this amount is sufficient to ensure equivalent enrichment from all allelics. Is. When the mixture of DNA enriched using hybrid capture techniques is a mixture containing floating DNA isolated from blood, eg maternal blood, the average length of the DNA is fairly short, generally less than 200 bases. be. The use of shorter probes increases the likelihood that the hybrid capture probe will capture the desired DNA fragment. Larger variability may require longer probes. In certain embodiments, the variation of interest is from 1 (SNP) to a few bases in length. In certain embodiments, a region of the target within the genome can be preferentially enriched using a hybrid capture probe, where the length of the hybrid capture probe is less than 90 bases and less than 80 bases. It may be less than 70 bases, less than 60 bases, less than 50 bases, less than 40 bases, less than 30 bases or less than 25 bases. In certain embodiments, the length of the probe, which is designed to hybridize with a region flanking the location of the polymorphic allelic gene, to increase the likelihood that the desired allelic gene will be sequenced. It can be reduced from over 90 bases to about 80 bases, or to about 70 bases, or to about 60 bases, or to about 50 bases, or to about 40 bases, or to about 30 bases, or to about 25 bases. ..

捕捉を可能にするために、合成されたプローブと標的分子の間に最小のオーバーラップが存在する。この合成されたプローブは、できるだけ短くすることができるが、それでもこの最小の必要なオーバーラップよりも大きい。多型領域を標的とするためにより短いプローブ長を用いることの効果は、より多くの分子が標的対立遺伝子領域とオーバーラップすることである。元のDNA分子の断片化の状態も、標的の対立遺伝子とオーバーラップするリード数に影響を及ぼす。血漿試料などの一部のDNA試料は、インビボで起こる生物学的プロセスに起因して既に断片化されている。しかし、より長い断片を有する試料には、配列決定ライブラリーの調製および富化の前の断片化が有益である。プローブと断片の両方が短い(約60~80bp)場合、最大の特異性は、対象の重要な領域とオーバーラップできない比較的少ないシーケンスリードで実現することができる。 There is minimal overlap between the synthesized probe and the target molecule to allow capture. This synthesized probe can be as short as possible, but still greater than this minimum required overlap. The effect of using shorter probe lengths to target polymorphic regions is that more molecules overlap the target allele region. The fragmentation status of the original DNA molecule also affects the number of reads that overlap the target allele. Some DNA samples, such as plasma samples, are already fragmented due to biological processes that occur in vivo. However, for samples with longer fragments, fragmentation prior to the preparation and enrichment of the sequencing library is beneficial. When both the probe and the fragment are short (about 60-80 bp), maximum specificity can be achieved with relatively few sequence reads that do not overlap the critical region of interest.

ある実施形態では、ハイブリダイゼーション条件を調整して、元の試料中に存在する異なる対立遺伝子の捕捉における均一性を最大にすることができる。ある実施形態では、対立遺伝子間のハイブリダイゼーションの偏りの差異を最小限にするためにハイブリダイゼーション温度を低下させる。当技術分野で公知の方法では、温度を低下させることには、プローブと、意図されたものではない標的とのハイブリダイゼーションを増大させる効果があるので、ハイブリダイゼーションのためにより低い温度を用いることを回避する。しかし、目的が、最大の忠実度で対立遺伝子の比を保存することである場合、現行技術の教示がこの手法を避けているという事実にもかかわらずより低いハイブリダイゼーション温度を用いる手法により、最適に正確な対立遺伝子の比がもたらされる。ハイブリダイゼーション温度は、標的の領域の実質的なオーバーラップを有する標的のみが捕捉されるように、標的と合成されたプローブとの間のより大きなオーバーラップを必要とするために上昇させることもできる。本開示のいくつかの実施形態では、ハイブリダイゼーション温度を、通常のハイブリダイゼーション温度から、約40℃まで、約45℃まで、約50℃まで、約55℃まで、約60℃まで、約65までまたは約70℃まで低下させる。 In certain embodiments, hybridization conditions can be adjusted to maximize homogeneity in the capture of different alleles present in the original sample. In certain embodiments, the hybridization temperature is lowered to minimize differences in hybridization bias between alleles. In methods known in the art, lowering the temperature has the effect of increasing hybridization between the probe and unintended targets, so it is recommended to use a lower temperature for hybridization. To avoid. However, if the goal is to preserve allelic ratios with maximum fidelity, then methods using lower hybridization temperatures are optimal despite the fact that the teachings of current techniques avoid this method. Provides the exact allele ratio. The hybridization temperature can also be increased to require a larger overlap between the target and the synthesized probe so that only targets with substantial overlap in the target area are captured. .. In some embodiments of the present disclosure, the hybridization temperature is increased from normal hybridization temperature to about 40 ° C, up to about 45 ° C, up to about 50 ° C, up to about 55 ° C, up to about 60 ° C, up to about 65. Alternatively, the temperature is lowered to about 70 ° C.

ある実施形態では、ハイブリッド捕捉プローブは、多型の対立遺伝子に隣接している領域に見いだされるDNAと相補的なDNAを有する捕捉プローブの領域が多型部位のすぐ隣ではないように設計することができる。その代わりに、捕捉プローブは、標的の多型部位に隣接しているDNAとハイブリダイズするように設計されている捕捉プローブの領域が、多型部位とファンデルワールスにより接触する捕捉プローブの部分と、1つまたは少数の塩基と等しい長さの小さな距離で隔てられているように設計することができる。ある実施形態では、ハイブリッド捕捉プローブは、多型の対立遺伝子と隣接しているが、それとは交差していない領域とハイブリダイズするように設計されており、これは、隣接捕捉プローブと称される。隣接捕捉プローブの長さは、約120塩基未満、約110塩基未満、約100塩基未満、約90塩基未満であってよく、約80塩基未満、約70塩基未満、約60塩基未満、約50塩基未満、約40塩基未満、約30塩基未満、または約25塩基未満であってよい。隣接捕捉プローブの標的となるゲノムの領域は、多型遺伝子座と1塩基対、2塩基対、3塩基対、4塩基対、5塩基対、6塩基対、7塩基対、8塩基対、9塩基対、10塩基対、11~20塩基対、または、20超塩基対で隔てられていてよい。 In one embodiment, the hybrid capture probe is designed so that the region of the capture probe having DNA complementary to the DNA found in the region adjacent to the polymorphic allele is not immediately adjacent to the polymorphic site. Can be done. Instead, the capture probe is designed to hybridize to DNA adjacent to the target polymorphic site, with the portion of the capture probe where the region of the capture probe contacts the polymorphic site by van der Waals. It can be designed to be separated by a small distance of equal length to one or a few bases. In one embodiment, the hybrid capture probe is designed to hybridize to a region that is adjacent to, but not intersecting with, the polymorphic allele, which is referred to as the adjacent capture probe. .. Adjacent capture probes may be less than about 120 bases, less than about 110 bases, less than about 100 bases, less than about 90 bases, less than about 80 bases, less than about 70 bases, less than about 60 bases, about 50 bases. It may be less than, less than about 40 bases, less than about 30 bases, or less than about 25 bases. The regions of the genome targeted by the adjacent capture probe are 1 base pair, 2 base pairs, 3 base pairs, 4 base pairs, 5 base pairs, 6 base pairs, 7 base pairs, 8 base pairs, and 9 base pairs with the polymorphic locus. It may be separated by base pairs, 10 base pairs, 11 to 20 base pairs, or 20 super base pairs.

標的化配列捕捉を用いる、標的化捕捉に基づく疾患スクリーニング検査についての記載。現在AGILENT(SURE SELECT)、ROCHE-NIMBLEGENまたはILLUMINAから提供されているものなどの特別注文の標的化配列捕捉。捕捉プローブは、種々の種類の変異の捕捉を確実にするために特別注文で設計することができる。点変異については、点変異とオーバーラップする1個または複数個のプローブが、変異を捕捉し、配列決定するために十分であるはずである。 A description of a disease screening test based on targeted capture using targeted sequence capture. Custom-made targeted sequence captures such as those currently offered by Agilent (SURE SELECT), ROCHE-NIMBLEGEN or ILLUMINA. Capturing probes can be custom designed to ensure the capture of various types of mutations. For point mutations, one or more probes that overlap with the point mutation should be sufficient to capture and sequence the mutation.

小さな挿入または欠失については、変異とオーバーラップする1個または複数個のプローブが、変異を含む断片を捕捉し、配列決定するために十分であり得る。ハイブリダイゼーションは、一般には、ゲノム配列を参照するために設計されるプローブ限定捕捉効率の間で効率が低い可能性がある。変異を含む断片の捕捉を確実にするために、正常な対立遺伝子と一致するものと、変異対立遺伝子と一致するものの2種のプローブを設計することができる。より長いプローブにより、ハイブリダイゼーションを増強することができる。複数のオーバーラッププローブにより捕捉を増強することができる。最後に、プローブをすぐ隣であるがオーバーラップはしていないところに置くと、変異は、正常な対立遺伝子と変異対立遺伝子の比較的同様の捕捉効率が可能となり得る。 For small insertions or deletions, one or more probes that overlap the mutation may be sufficient to capture and sequence the fragment containing the mutation. Hybridization may be less efficient among probe-limited capture efficiencies that are generally designed to reference genomic sequences. Two probes can be designed to ensure capture of the fragment containing the mutation, one that matches the normal allele and one that matches the mutant allele. Hybridization can be enhanced with longer probes. Capturing can be enhanced by multiple overlapping probes. Finally, placing the probe directly next to it but not overlapping may allow the mutation to have relatively similar capture efficiencies for normal and mutant alleles.

単純タンデム反復(STR)については、これらの高度に可変性の部位とオーバーラップしているプローブは、断片を上手く捕捉する可能性が低い。捕捉を増強するために、プローブを、可変性部位と近接しているがオーバーラップはしていないところに置くことができる。次いで、断片について通常通り配列決定して、STRの長さおよび組成を示すことができる。 For simple tandem repeats (STRs), probes that overlap these highly variable sites are unlikely to successfully capture the fragment. To enhance capture, the probe can be placed in close proximity to the variable site but not overlapping. The fragments can then be sequenced as usual to indicate the length and composition of the STR.

大規模な欠失については、現在エクソン捕捉系において用いられている一般的な手法である一連のオーバーラッププローブが機能し得る。しかし、この手法を用いると、個体がヘテロ接合性であるか否かを決定することが難しい場合がある。捕捉された領域内のSNPを標的とし、評価することにより、個体が保有者であることを示す、その領域にわたるヘテロ接合性の損失を潜在的に示すことができる。ある実施形態では、非オーバーラッププローブまたはシングルトンプローブを、潜在的に欠失した領域にわたって置き、捕捉された断片の数をヘテロ接合性の尺度として使用することが可能である。個体が大規模な欠失を有する場合には、非欠失(二倍体)参照遺伝子座と比較して、断片の数の2分の1を捕捉のために利用可能であることが予測される。したがって、欠失した領域から得られたリード数は、正常な二倍体の遺伝子座から得られたリード数のおよそ半分であるはずである。潜在的に欠失した領域にわたる複数のシングルトンプローブからのシーケンシングリード深度を総計し、平均することにより、シグナルを増強し、診断の信頼度を改善することができる。2つの手法、SNPを標的として、ヘテロ接合性の損失を同定すること、および複数のシングルトンプローブを使用して、その遺伝子座から基礎をなす断片の量の定量的尺度を得ることを組み合わせることもできる。これらの戦略のいずれか、または両方を、他の戦略と組み合わせて、同じ結果をよりよく得ることができる。 For large deletions, a series of overlapping probes, a common technique currently used in exon capture systems, may work. However, using this technique, it can be difficult to determine if an individual is heterozygous. Targeting and assessing SNPs within a captured region can potentially indicate a loss of heterozygotes across that region, indicating that the individual is a carrier. In certain embodiments, non-overlapping or singleton probes can be placed over potentially deleted regions and the number of captured fragments can be used as a measure of heterozygosity. If the individual has a large deletion, it is predicted that half the number of fragments will be available for capture compared to the non-deleted (diploid) reference locus. To. Therefore, the number of reads obtained from the deleted region should be approximately half the number of reads obtained from the normal diploid locus. Sequencing read depths from multiple singleton probes across potentially deleted regions can be summed and averaged to enhance the signal and improve diagnostic confidence. It is also possible to combine two methods, targeting SNPs to identify heterozygous losses, and using multiple singleton probes to obtain a quantitative measure of the amount of underlying fragment from that locus. can. Either or both of these strategies can be combined with other strategies to achieve the same results better.

試験の間に、同じ試験において捕捉され、配列決定されるY染色体断片の存在によって示される、男の胎児のcfDNAの検出、ならびに母親および父親が影響されないX連鎖優性変異または母親が影響されない優性変異のいずれかにより、胎児に対するリスクが高まることが示される。影響のない母親における同じ遺伝子内に2つの変異劣性対立遺伝子が検出されることは、胎児が、変異対立遺伝子を父親から、および潜在的に第2の変異対立遺伝子を母親から遺伝によって受け継いだことを意味する。全ての場合において、羊水穿刺または絨毛膜絨毛採取による追跡検査も示され得る。 Detection of male fetal cfDNA, as well as X-linked dominant mutations unaffected by the mother and father or dominant mutations unaffected by the mother, as indicated by the presence of a Y chromosome fragment captured and sequenced in the same test during the test. It is shown that either of these increases the risk to the fetus. The detection of two mutant recessive alleles within the same gene in an unaffected mother means that the fetus inherited the mutant allele from the father and potentially the second mutant allele from the mother. Means. In all cases, follow-up by amniocentesis or chorionic villus collection may also be indicated.

標的化捕捉に基づく疾患スクリーニング検査は、異数性についての標的化捕捉に基づく非侵襲的な出生前診断検査と組み合わせることができる。リード深度(DOR)の変動性を減少させるためのいくつもの方法が存在する:例えば、プライマー濃度を上昇させることができる、より長い標的化増幅プローブを使用することができる、または、STAサイクルをより多く実行することができる(例えば、25超、30超、35超、または、さらには40超)。 Disease screening tests based on targeted capture can be combined with non-invasive prenatal diagnostic tests based on targeted capture for aneuploidy. There are a number of ways to reduce read depth (DOR) variability: for example, longer targeted amplification probes can be used that can increase primer concentration, or more STA cycles. Many can be performed (eg, more than 25, more than 30, more than 35, or even more than 40).

試料中のDNA分子数の代表的決定方法
第1ラウンドのDNA増幅の間に試料中の元のDNA分子のそれぞれについて独自に同定された分子を生成することによって、試料中のDNA分子の数を決定するための方法が本明細書に記載されている。上記の目的を実現し、その後に単一分子配列決定法またはクローン配列決定法が続く手順が本明細書に記載されている。
Representative method for determining the number of DNA molecules in a sample During the first round of DNA amplification, the number of DNA molecules in a sample is determined by generating molecules that are uniquely identified for each of the original DNA molecules in the sample. Methods for determining are described herein. Procedures for achieving the above object, followed by a single molecule or clonal sequencing method, are described herein.

該手法は、1個または複数個の特定の遺伝子座を標的とするステップ、および、各標的の遺伝子座が独特のタグを有し、このバーコードをクローン配列決定または単一分子配列決定を用いて配列決定した際に互いに区別することができるように元の分子のタグを付けたコピーを生成するステップを包含する。独特の配列決定されたバーコードのそれぞれは元の試料における独特の分子を示す。同時に、配列決定データを使用して、分子が由来する遺伝子座を確認する。この情報を使用して、各遺伝子座について、元の試料中の独特の分子の数を決定することができる。 The technique uses steps to target one or more specific loci, and each target locus has a unique tag, and this barcode is sequenced using a clone sequence or a single molecule sequence. Includes the steps of producing a tagged copy of the original molecule so that it can be distinguished from each other when sequenced. Each of the uniquely sequenced barcodes shows a unique molecule in the original sample. At the same time, the sequencing data is used to identify the locus from which the molecule is derived. This information can be used to determine the number of unique molecules in the original sample for each locus.

この方法は、元の試料中の分子の数の定量的評価が必要な任意の適用のために用いることができる。さらに、1個または複数個の標的の独特の分子の数を、1個または複数個の他の標的に対する独特の分子の数に関連づけて、相対的なコピー数、対立遺伝子分布または対立遺伝子の比を決定することができる。あるいは、元の標的のコピーの最も可能性の高い数を同定するために、種々の標的から検出されたコピーの数を分布によってモデリングすることができる。適用としては、これらに限らないが、挿入および欠失、例えば、デュシェンヌ型筋ジストロフィーの保有者に見いだされるものの検出;染色体のセグメントの欠失または重複、例えば、コピー数変異体において観察されたものの定量;生まれた個体由来の試料の染色体コピー数;生まれていない個体、例えば、胚または胎児由来の試料の染色体コピー数が挙げられる。 This method can be used for any application that requires a quantitative assessment of the number of molecules in the original sample. In addition, the number of unique molecules of one or more targets is associated with the number of unique molecules for one or more other targets, relative copy number, allele distribution or allele ratio. Can be determined. Alternatively, the number of copies detected from various targets can be modeled by distribution to identify the most likely number of copies of the original target. Applications include, but are not limited to, insertions and deletions, eg, detection of those found in carriers of Duchenne muscular dystrophy; quantification of deletions or duplications of chromosomal segments, eg, those observed in copy number variants. The number of chromosomal copies of the sample from the born individual; the number of chromosomal copies of the sample from the unborn individual, eg, embryo or fetal.

前記方法は、配列による標的化に含有される同時に起こる変動の評価と組み合わせることができる。これを用いて、元の試料における各対立遺伝子を示す分子の数を決定することができる。このコピー数法は、SNPまたは他の配列の変動の評価と組み合わせて、生まれた個体および生まれていない個体の染色体コピー数を決定することができる;短い配列の変動を有するが、その中でPCRにより複数の標的領域から増幅することができる遺伝子座由来のコピーの識別および定量化、例えば、棘筋萎縮の保有者検出の目的で;異なる個体の混合物からなる試料由来の分子の種々の供給源のコピー数の決定、例えば、母系の血漿から得られた浮動性DNAからの胎児の異数性の検出の目的で。 The method can be combined with an assessment of concomitant variability contained in sequence targeting. This can be used to determine the number of molecules representing each allele in the original sample. This copy number method can be combined with an assessment of SNP or other sequence variability to determine the number of chromosomal copies of born and unborn individuals; with short sequence variability, among which PCR For the purpose of identifying and quantifying locus-derived copies that can be amplified from multiple target regions, eg, for carrier detection of spinal cord atrophy; various sources of sample-derived molecules consisting of a mixture of different individuals. For the purpose of determining the number of copies of, eg, detecting fetal aneuploidy from floating DNA obtained from maternal plasma.

ある実施形態では、単一の標的遺伝子座に関係する方法は、以下のステップの1つまたは複数を含んでよい:(1)特定の遺伝子座をPCR増幅するための、オリゴマーの標準の対を設計するステップ。(2)合成の間に、標的特異的オリゴマーのうちの1つの5’末端側に、標的遺伝子座またはゲノムに対する相補性を有さない、または最小の相補性を有する特定の塩基の配列を付加するステップ。尾部と称されるこの配列は既知の配列であって、その後の増幅のために用いられるものであり、ランダムなヌクレオチドの配列が後に続く。これらのランダムなヌクレオチドはランダムな領域を含む。ランダムな領域は、各プローブ分子間で確率的に異なる、ランダムに生成した核酸の配列を含む。したがって、合成した後、尾部を付けたオリゴマープールは、既知の配列から始まり、その後に分子間で異なる未知の配列が続き、その後に標的特異的配列が続くオリゴマーの集団からなる。(3)尾部を付けたオリゴマーのみを使用して1ラウンドの増幅(変性、アニーリング、伸長)を実施するステップ。(4)エキソヌクレアーゼを反応物に加え、PCR反応を有効に停止させ、反応物を適切な温度でインキュベートして、鋳型とアニーリングしなかったフォワード一本鎖オリゴを除去し、伸長させて二本鎖産物を形成するステップ。(5)反応物を高い温度でインキュベートして、エキソヌクレアーゼを変性させ、その活性を排除するするステップ(6)第1の反応において使用したオリゴマーの尾部と相補的な新しいオリゴヌクレオチドを他の標的特異的オリゴマーと一緒に反応物に加えて、PCRの第1ラウンドで生成した産物のPCR増幅を可能にするステップ。(7)増幅を継続して下流のクローン配列決定のために十分な産物を生成させるステップ。(8)十分な数の塩基を配列に結んだ、増幅されたPCR産物を、多数の方法、例えば、クローン配列決定によって測定するステップ。 In certain embodiments, a method involving a single target locus may include one or more of the following steps: (1) a standard pair of oligomers for PCR amplification of a particular locus. Steps to design. (2) During synthesis, a sequence of a specific base having no complementarity to the target locus or genome or having minimal complementarity is added to the 5'end side of one of the target-specific oligomers. Steps to do. This sequence, referred to as the tail, is a known sequence that is used for subsequent amplification, followed by a random nucleotide sequence. These random nucleotides contain random regions. Random regions contain sequences of randomly generated nucleic acids that are stochastically different between each probe molecule. Thus, after synthesis, the tailed oligomer pool consists of a population of oligomers starting with a known sequence, followed by an unknown sequence that differs between molecules, followed by a target-specific sequence. (3) A step of performing one round of amplification (denaturation, annealing, elongation) using only the tailed oligomer. (4) Add exonuclease to the reactants, effectively stop the PCR reaction, incubate the reactants at an appropriate temperature to remove the forward single-stranded oligo that did not anneal to the template, and extend the two strands. Steps to form chain products. (5) Incubate the reactants at high temperatures to denature exonucleases and eliminate their activity. (6) Other targets are new oligonucleotides complementary to the tail of the oligomer used in the first reaction. A step that allows PCR amplification of the product produced in the first round of PCR in addition to the reactants with specific oligomers. (7) A step of continuing amplification to produce sufficient products for downstream clonal sequencing. (8) A step of measuring an amplified PCR product, in which a sufficient number of bases are sequenced, by a number of methods, eg, clonal sequencing.

ある実施形態では、本開示の方法は、多数の遺伝子座を並行してまたは別の方法で標的とするステップを包含する。異なる標的遺伝子座に対するプライマーを独立に生成し、混合して多重PCRプールを作製することができる。ある実施形態では、元の試料を、サブプールに分けることができ、各サブプールにおいて異なる遺伝子座を標的とした後に組み換え、シークエンシングができる。ある実施形態では、プールを細分する前にタグを付けるステップおよびいくつもの増幅サイクルを実施して全ての標的の効率的な標的化を確実にした後に、分割し、改善し、その後、細分されたプールにおけるより小さなプライマーの集合を使用して増幅を継続することによって増幅することができる。 In certain embodiments, the methods of the present disclosure include the steps of targeting multiple loci in parallel or otherwise. Primers for different target loci can be independently generated and mixed to create a multiplex PCR pool. In certain embodiments, the original sample can be divided into subpools, where each subpool can be recombined and sequenced after targeting different loci. In one embodiment, the pool was subdivided before tagging and a number of amplification cycles were performed to ensure efficient targeting of all targets, followed by subdivision, improvement, and then subdivision. It can be amplified by continuing amplification using a smaller set of primers in the pool.

この技術が特に有用になる適用の1つの例は、非侵襲的な出生前異数性診断であり、所与の遺伝子座における対立遺伝子の比またはいくつもの遺伝子座における対立遺伝子の分布を用いて、胎児に存在する染色体のコピーの数の決定に役立てることができる。この状況では、最初の試料中に存在するDNAを、種々の対立遺伝子の相対的な量を維持しながら増幅することが望ましい。一部の場合、特に、存在するDNAが非常に少量である、例えば、5,000未満のゲノムのコピー、1,000未満のゲノムのコピー、500未満のゲノムのコピー、および100未満のゲノムのコピーである場合には、ボトルネッキングと称される現象が起こり得る。これは、最初の試料中に任意の所与の対立遺伝子の少数のコピーが存在し、増幅の偏りの結果、増幅されたDNAのプールの有するそれらの対立遺伝子の比が最初のDNAの混合物におけるそれらの対立遺伝子の比とは有意に異なるということである。標準のPCR増幅の前に、各DNAの鎖にバーコードの独特のまたはほぼ独特の集合を適用することにより、同じ元の分子を起源とする配列決定されたDNAのn個の同一の分子の集合からDNAのn-1コピーを排除することが可能である。 One example of an application in which this technique becomes particularly useful is non-invasive prenatal aneuploidy diagnosis, using the ratio of alleles at a given locus or the distribution of alleles at multiple loci. , Can help determine the number of copies of chromosomes present in the fetus. In this situation, it is desirable to amplify the DNA present in the first sample while maintaining the relative amount of various alleles. In some cases, in particular, there is a very small amount of DNA present, for example, less than 5,000 copies of the genome, less than 1,000 copies of the genome, less than 500 copies of the genome, and less than 100 copies of the genome. In the case of copying, a phenomenon called bottle necking can occur. This is because there are a small number of copies of any given allele in the first sample and as a result of the amplification bias, the ratio of those alleles in the pool of amplified DNA is in the first DNA mixture. The ratio of their alleles is significantly different. By applying a unique or nearly unique set of barcodes to each DNA strand prior to standard PCR amplification, n identical molecules of sequenced DNA originating from the same original molecule It is possible to exclude n-1 copies of DNA from the set.

例えば、個体のゲノム内のヘテロ接合性であるSNP、および元のDNAの試料中に各対立遺伝子が10分子存在する個体由来のDNAの混合物を考える。増幅した後、その遺伝子座に対応する100,000分子のDNAが存在し得る。確率論的なプロセスに起因して、DNAの比は1:2~2:1のいずれであってもよいが、元の分子のそれぞれに独特のタグでタグを付けたので、増幅されたプール内のDNAが正確に各対立遺伝子由来の10分子のDNAを起源とすることを決定することが可能である。したがって、この方法により、この手法を用いない方法よりも正確な測度の相対的な各対立遺伝子の量がもたらされる。対立遺伝子の偏りの相対量を最小限にすることが望ましい方法に対して、この方法により正確なデータがもたらされる。 For example, consider a heterozygous SNP in an individual's genome and a mixture of DNA from an individual in which 10 molecules of each allele are present in a sample of the original DNA. After amplification, there may be 100,000 molecules of DNA corresponding to that locus. Due to the stochastic process, the DNA ratio can be any of 1: 2 to 2: 1, but since each of the original molecules was tagged with a unique tag, the amplified pool. It is possible to determine that the DNA within is exactly from 10 molecules of DNA from each allele. Therefore, this method results in a relative amount of each allele with a more accurate measure than the method without this method. This method provides accurate data for methods in which it is desirable to minimize the relative amount of allele bias.

配列決定された断片と標的遺伝子座の関連づけは、いくつもの方法で実現することができる。ある実施形態では、標的配列に対応する分子バーコード、同様に、十分な数の独特の塩基を標的の断片に結んで十分な長さの配列を得て、標的遺伝子座を明白に同定することを可能にする。別の実施形態では、ランダムに生成した分子バーコードを含有する分子バーコーディングプライマーは、それが関連づけられる標的を同定する遺伝子座に特異的なバーコード(遺伝子座バーコード)も含有することができる。この遺伝子座バーコードは、個々の標的の各々に対する全ての分子バーコーディングプライマー間で、したがって、生じた増幅産物の全ての間で同一であるが、他の全ての標的とは異なる。ある実施形態では、本明細書に記載のタグ付け方法を、片側のネスティングプロトコールと組み合わせることができる。 The association of sequenced fragments with target loci can be achieved in a number of ways. In one embodiment, the molecular barcode corresponding to the target sequence, as well as a sufficient number of unique bases, are tied to the target fragment to obtain a sequence of sufficient length to clearly identify the target locus. Enables. In another embodiment, a molecular barcoding primer containing a randomly generated molecular barcode can also contain a locus-specific barcode (locus barcode) that identifies the target with which it is associated. .. This locus barcode is identical among all molecular barcoding primers for each of the individual targets and thus among all of the resulting amplification products, but unlike all other targets. In certain embodiments, the tagging methods described herein can be combined with a one-sided nesting protocol.

ある実施形態では、分子バーコーディングプライマーの設計および生成は、以下の通り実施化することができる:分子バーコーディングプライマーは、標的配列と相補的でない配列、それに続くランダムな分子バーコード領域、それに続く標的特異的配列からなってよい。分子バーコードの5’の配列は部分配列PCR増幅ために用いることができ、配列決定するために増幅産物をライブラリーに変換することにおいて有用な配列を含み得る。ランダムな分子バーコード配列は多数の方法で生成することができる。好ましい方法では、分子タグを付けたプライマーを、バーコード領域を合成する間の反応のために4種の塩基全てを含むように合成する。塩基の全てまたは塩基の種々の組み合わせは、IUPACDNA多義コードを使用して明記することができる。このように、合成された分子の集団は、分子バーコード領域内の配列のランダムな混合物を含有する。バーコード領域の長さにより、どのくらい多くのプライマーが独特のバーコードを含有するかが決定される。独特の配列の数は、Nとしてバーコード領域の長さに関連づけられ、ここで、Nは塩基の数であり、一般には4であり、Lはバーコードの長さである。5塩基のバーコードにより、最大1024個の独特の配列をもたらすことができ、8塩基のバーコードにより、65536個の独特のバーコードをもたらすことができる。ある実施形態では、DNAを、配列決定方法によって測定することができ、配列データは単一分子の配列を示す。これは、単一分子について直接配列決定する方法、または単一分子を増幅して、配列決定計器によって検出可能なクローンを形成するが、なお単一分子を示す、本明細書ではクローン配列決定と称される方法を含むことができる。 In certain embodiments, the design and generation of molecular barcoding primers can be implemented as follows: a molecular barcoding primer is a sequence that is not complementary to the target sequence, followed by a random molecular barcode region, followed by. It may consist of a target-specific sequence. The 5'sequence of the molecular barcode can be used for partial sequence PCR amplification and may contain sequences useful in converting the amplification product into a library for sequencing. Random molecular barcode sequences can be generated in a number of ways. The preferred method is to synthesize the molecularly tagged primer to include all four bases for the reaction during the synthesis of the barcode region. All or various combinations of bases can be specified using the IUPACDNA ambiguous code. Thus, the synthesized population of molecules contains a random mixture of sequences within the molecular barcode region. The length of the barcode region determines how many primers contain a unique barcode. The number of unique sequences is associated with the length of the barcode region as N L , where N is the number of bases, generally 4 and L is the length of the barcode. A 5-base barcode can result in up to 1024 unique sequences, and an 8-base barcode can result in 65536 unique barcodes. In certain embodiments, the DNA can be measured by a sequencing method and the sequence data indicates the sequence of a single molecule. This is a method of direct sequencing on a single molecule, or amplifying a single molecule to form a clone detectable by a sequencing instrument, but still showing a single molecule, as used herein with clone sequencing. It can include the method referred to.

増幅産物の定量化の代表的方法および試薬 対象の特異的核酸配列の定量化は、通常、TAQMAN(LIFE TECHNOLOGIES)、INVADERプローブ(THIRD WAVE TECHNOLOGIES)、などの定量的リアルタイムPCR技術により行われる。このような技術は、複数配列の並行同時分析(多重化)に対する限られた能力および増幅サイクルが可能な狭い範囲(例えば、PCR増幅産生量の対数対サイクル数が、直線範囲内)でのみ正確な定量データを生成する能力などの多くの短所がある。MYSEQ(ILLUMINA)、HISEQ(ILLUMINA)、ION TORRENT(LIFE TECHNOLOGIES)、GENOME ANALYZERILX(ILLUMINA)、GSFLEX+(ROCHE454)などで採用されるようなDNAシークエンシング技術、特に高スループット次世代シークエンシング技術(大量並列シーケンシング技術と呼ばれることも多い)を使って、試料中に存在する対象配列のコピー数の定量的測定ができ、それにより、出発物質に関する定量的情報、例えば、コピー数または転写レベルを得ることができる。高スループット遺伝子シーケンサーは、バーコーディング(すなわち、特徴的核酸配列を使った試料のタギング)を使用して、個別集団から特異的試料を特定し、それにより、DNAシーケンサーの1回の操作で複数試料の同時分析を可能とする。ライブラリー調製物(または他の対象核酸調製物)中の一定の領域のゲノムが配列決定される回数(リード数)は、対象ゲノム中のその配列のコピー数(または、cDNA含有調製物の場合は、発現レベル)に比例するであろう。しかし、遺伝子ライブラリーの調製およびシークエンシング(および、類似のゲノム由来の調製)は、対象の核酸配列の正確な定量的リードの取得と干渉する多くの偏りを持ち込む場合がある。例えば、核酸配列が異なると、遺伝子ライブラリー調製または試料調製の間に発生する核酸増幅ステップ中の増幅効率が異なる場合がある。 Typical Methods and Reagents for Quantification of Amplified Products Quantification of specific nucleic acid sequences of interest is usually performed by quantitative real-time PCR techniques such as TAQMAN (LIFE TECHNOLOGIES), INVADER probe (THIRD WAVE TECHNOLOGIES). Such techniques are accurate only in the limited capacity for parallel simultaneous analysis (multiplexing) of multiple sequences and in a narrow range where amplification cycles are possible (eg, the log-to-cycle number of PCR amplification production is within a linear range). It has many disadvantages, such as the ability to generate variable quantitative data. DNA sequencing technology such as that used in MYSEQ (ILLUMINA), HISEQ (ILLUMINA), ION TORRENT (LIFE TECHNOLOGIES), GENOME ANALYZERILX (ILLUMINA), GSFLEX + (ROCHE454), etc., especially high-throughput next-generation sequencing technology. (Often referred to as sequencing techniques) can be used to quantitatively measure the number of copies of a target sequence present in a sample, thereby obtaining quantitative information about the starting material, eg, copy number or transcription level. Can be done. High-throughput gene sequencers use barcoding (ie, sample tagging with characteristic nucleic acid sequences) to identify specific samples from individual populations, thereby allowing multiple samples in a single operation of the DNA sequencer. Allows simultaneous analysis of. The number of times (reads) the genome of a region in a library preparation (or other nucleic acid preparation of interest) is sequenced is the number of copies of that sequence in the genome of interest (or in the case of cDNA-containing preparations). Will be proportional to the expression level). However, gene library preparation and sequencing (and preparations from similar genomes) can introduce many biases that interfere with the acquisition of accurate quantitative reads of the nucleic acid sequence of interest. For example, different nucleic acid sequences may result in different amplification efficiencies during the nucleic acid amplification steps that occur during gene library preparation or sample preparation.

異なる増幅効率に関連する問題は、本発明の特定の実施形態を使うことにより緩和できる。本発明は、定量化の正確度を改善するために使用できる増幅プロセス中の含有物基準の使用に関連する種々の方法と組成物を含む。本明細書で記載し、また、特に、米国特許第8,008,018号;同7,332,277号;国際公開第WO2012/078792A2号;同WO2011/146632A1号に記載されているように、本発明は、母系血液中の浮動性胎児DNAを分析することによる胎児の異数性の検出の領域で特に有用である。これらの特許は、参照によりその全体が本明細書に組み込まれる。また、本発明の実施形態は、インビトロ生成胚中の異数性の検出にも有用である。商業的に重要な検出可能な異数性には、ヒト染色体13、18、21、XおよびYの異数性が含まれる。 Problems associated with different amplification efficiencies can be mitigated by using certain embodiments of the invention. The present invention includes various methods and compositions related to the use of inclusion criteria in amplification processes that can be used to improve the accuracy of quantification. As described herein and, in particular, U.S. Pat. No. 8,008,018; 7,332,277; International Publication No. WO2012 / 078792A2; WO2011 / 146632A1; The present invention is particularly useful in the area of fetal aneuploidy detection by analyzing floating fetal DNA in maternal blood. These patents are incorporated herein by reference in their entirety. The embodiments of the present invention are also useful for detecting aneuploidy in in vitro generated embryos. Commercially significant detectable aneuploidies include aneuploidies of human chromosomes 13, 18, 21, X and Y.

本発明の実施形態は、ヒトまたは非ヒト核酸に対して使用でき、また、動物および植物由来核酸の両方に適用できる。また、本発明の実施形態を使って、欠失または挿入により特徴付けられる他の遺伝性障害に関連する対立遺伝子の検出、および/または定量化も可能である。欠失含有対立遺伝子が、対象対立遺伝子保持者と疑われる人から検出される場合がある。 Embodiments of the invention can be used for human or non-human nucleic acids and are also applicable to both animal and plant-derived nucleic acids. It is also possible to detect and / or quantify alleles associated with other hereditary disorders characterized by deletions or insertions using embodiments of the invention. Deletion-containing alleles may be detected in suspected carriers of the target allele.

本発明の一実施形態は、既知の量(相対的または絶対的)で存在する基準を含む。例えば、染色体8(遺伝子座Aを含む)は二倍体、および染色体21(遺伝子座Bを含む)は三倍体である遺伝源から作製される遺伝子ライブラリーを考える。遺伝子ライブラリーは、試料中に存在する染色体の数、例えば、200コピーの遺伝子座Aおよび300コピーの遺伝子座Bの関数となる量の配列を含む試料から生成できる。しかし、遺伝子座Aが遺伝子座Bよりはるかに高い効率で増幅される場合、PCR後には、60,000コピーのA増幅産物および30,000コピーのB増幅産物が存在する可能性があり、従って、高スループットDNAシークエンシング(または他の定量核酸検出技術)による分析の場合に、初期の真のゲノム試料の染色体コピー数を不明確にすることになる。この問題を軽減するために、遺伝子座Aに対する基準配列が採用され、この場合、基準配列は、実質的に遺伝子座Aと同じ効率で増幅される。同様に、遺伝子座Bの基準配列が形成され、この場合、基準配列は、遺伝子座Bと実質的に同じ効率で増幅される。PCR(または他の増幅技術)の前に遺伝子座Aの基準配列および遺伝子座Bの基準配列が混合物に加えられる。これらの基準配列は、相対量または絶対量としての既知の量で存在する。従って、同じ条件セット下で、基準配列Aと基準配列Bの1:1混合物が、前の例中の混合物に(増幅の前に)加えられた場合、3000コピーの基準A増幅産物が生成され、また、1000コピーの基準B増幅産物が生成され、遺伝子座Aは、遺伝子座Bより3倍効率的に増幅されることを示す。 One embodiment of the invention includes criteria that exist in known quantities (relative or absolute). For example, consider a gene library made from a gene source in which chromosome 8 (including locus A) is diploid and chromosome 21 (containing locus B) is triploid. A gene library can be generated from a sample that contains a number of chromosomes present in the sample, eg, an amount of sequence that is functional in 200 copies of locus A and 300 copies of locus B. However, if locus A is amplified much more efficiently than locus B, there may be 60,000 copies of A and 30,000 copies of B amplification product after PCR. In the case of analysis by high-throughput DNA sequencing (or other quantitative nucleic acid detection techniques), it will obscure the number of chromosomal copies of the early true genomic sample. To alleviate this problem, a reference sequence for locus A is adopted, in which case the reference sequence is amplified with substantially the same efficiency as locus A. Similarly, a reference sequence for locus B is formed, in which case the reference sequence is amplified with substantially the same efficiency as locus B. The reference sequence of locus A and the reference sequence of locus B are added to the mixture prior to PCR (or other amplification technique). These reference sequences exist in known quantities as relative or absolute quantities. Thus, under the same set of conditions, if a 1: 1 mixture of reference sequence A and reference sequence B is added to the mixture in the previous example (prior to amplification), 3000 copies of reference A amplification product will be produced. Also, 1000 copies of the reference B amplification product are produced, indicating that locus A is amplified three times more efficiently than locus B.

対象SNP(または他の多型)を含むゲノムの1つまたは複数の選択領域に対し、特異的増幅およびその後の配列決定ができる。この標的特異的増幅は、シークエンシング用の遺伝子ライブラリー形成中に行わせることができる。ライブラリーは、多くの標的増幅領域を含むことができる。いくつかの実施形態では、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000の対象領域を含む。このようなライブラリーの例は、本明細書に記載され、また、2011年11月18日出願の米国特許公開第2012/0270212号で見出すことができる。この特許は、参照によりその全体が本明細書に組み込まれる。 Specific amplification and subsequent sequencing are possible for one or more selected regions of the genome containing the SNP (or other polymorphism) of interest. This target-specific amplification can be performed during gene library formation for sequencing. The library can contain many target amplification regions. In some embodiments, at least 10; 100; 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; Includes 50,000; 75,000; or 100,000 target areas. Examples of such libraries are described herein and can also be found in US Patent Publication No. 2012/0270212 filed November 18, 2011. This patent is incorporated herein by reference in its entirety.

多くの高スループットDNAシークエンシング技術は、ライブラリー形成に出発遺伝物質の改変、例えば、ユニバーサルプライミング部位および/またはバーコードのライゲーションが必要で、それにより、その後のシークエンシング反応を行う前に小さい核酸フラグメントのクローン増幅を促進する。いくつかの実施形態では、遺伝子ライブラリー形成中に1個または複数個の基準配列が付加されるか、またはライブラリーの増幅の前に遺伝子ライブラリーの前駆成分に付加される。基準配列は、高スループット遺伝子シークエンシング技術によりシークエンシング用に調製される標的ゲノムフラグメントを模倣する(それでも、ヌクレオチド塩基配列に基づいて区別できる)ように選択できる。一実施形態では、基準配列は、1、2、3、4~10、または11~20個のヌクレオチドを除いて標的ゲノムフラグメントと同じであってもよい。いくつかの実施形態では、標的遺伝子配列がSNPを含む場合、基準配列は、多形塩基のヌクレオチド以外のSNPと同じであってもよく、天然の部位には観察されない4個のヌクレオチドの内の1個であるように選択できる。基準配列は、複数標的遺伝子座(例えば、多形遺伝子座)の高度多重化分析に使用できる。基準配列は、ライブラリー形成(増幅前)のプロセス中に(相対的または絶対的)既知の量で付加されて分析試料中の対象標的配列の量の決定に際し、より高い正確度のための基準メトリックを提供できる。以前に特徴が明らかにされた倍数性レベル、例えば、全常染色体が二倍体であるとわかっているゲノムから形成されたシークエンシング用倍数性レベルライブラリー形成の情報と共に、使用された既知の量の基準配列の情報の組み合わせを使って、それぞれの基準配列のそれに対応する標的配列に関する増幅特性を較正でき、また、複数基準配列を含むバッチ混合物間の変動を考慮に入れることができる。大量の遺伝子座を同時に分析することが必要となる場合が多いことを考慮すれば、多くの基準配列セットを含む混合物を生成することは有用である。本発明の実施形態には、複数基準配列を含む混合物が含まれる。混合物中のそれぞれの基準配列の量が高精度で分かっていることが理想的である。しかし、この理想の達成は極めて困難である。理由は、実際問題として、混合物中のそれぞれの基準配列の量、特に、多数の異なる合成オリゴヌクレオチドを含む混合物の基準配列の量に大きな変動があるためである。この変動には多くの発生源、例えば、インビトロオリゴヌクレオチド合成反効率のバッチ間変動、体積測定の不正確さ、ピペット操作の変動が挙げられる。さらに、この変動は、理論的に正確に同じ量の正確に同じ基準配列セットを含むバッチ間でも起こる場合がある。従って、それぞれの基準配列バッチを独立に較正することは有意義である。基準配列バッチは、既知の染色体組成の参照ゲノムに対し較正できる。基準配列バッチは、シークエンシングプロトコール中に含まれる増幅ステップを最小限にして、または増幅ステップ無しで、基準配列バッチをシークエンシングすることにより較正できる。本発明の実施形態は、較正された種々の基準配列の混合物を含む。他の本発明の実施形態は、異なる基準配列の混合物を較正する方法および本方法により作製された較正された異なる基準配列の混合物を含む。 Many high-throughput DNA sequencing techniques require modification of the starting genetic material, such as universal priming sites and / or barcode ligation, for library formation, thereby small nucleic acids prior to subsequent sequencing reactions. Promotes clonal amplification of fragments. In some embodiments, one or more reference sequences are added during gene library formation, or are added to the precursor component of the gene library prior to library amplification. The reference sequence can be selected to mimic the target genomic fragment prepared for sequencing by high throughput gene sequencing techniques (still distinguishable based on the nucleotide sequence). In one embodiment, the reference sequence may be identical to the target genomic fragment except for 1, 2, 3, 4-10, or 11-20 nucleotides. In some embodiments, if the target gene sequence comprises an SNP, the reference sequence may be the same as the SNP other than the nucleotides of the polymorphic base, out of 4 nucleotides not observed at the natural site. It can be selected to be one. The reference sequence can be used for highly multiplexed analysis of multiple target loci (eg, polymorphic loci). The reference sequence is added in a known amount (relative or absolute) during the process of library formation (pre-amplification) and is a reference for higher accuracy in determining the amount of target sequence of interest in the analytical sample. Can provide metrics. Known haploid levels used with previously characterized polyploidy levels, eg, information on the formation of a haploid level library for sequencing formed from a genome known to be diploid in all autosomal chromosomes. The combination of quantity reference sequence information can be used to calibrate the amplification characteristics of each reference sequence for its corresponding target sequence, and to take into account variations between batch mixtures containing multiple reference sequences. Given that it is often necessary to analyze large numbers of loci at the same time, it is useful to generate a mixture containing many reference sequence sets. Embodiments of the invention include mixtures containing multiple reference sequences. Ideally, the amount of each reference sequence in the mixture is known with high accuracy. However, achieving this ideal is extremely difficult. The reason is that, as a practical matter, the amount of each reference sequence in the mixture, in particular the amount of reference sequence in the mixture containing a large number of different synthetic oligonucleotides, varies widely. This variation includes many sources, such as inter-batch variations in in vitro oligonucleotide synthesis antiefficiencies, volumetric inaccuracy, and pipette operation variations. Moreover, this variation can occur between batches containing exactly the same quantity of exactly the same reference sequence set in theory. Therefore, it makes sense to calibrate each reference sequence batch independently. The reference sequence batch can be calibrated to the reference genome of known chromosomal composition. The reference sequence batch can be calibrated by sequencing the reference sequence batch with minimal or no amplification steps included in the sequencing protocol. Embodiments of the invention include a mixture of various calibrated reference sequences. Other embodiments of the invention include a method of calibrating a mixture of different reference sequences and a mixture of different calibrated reference sequences produced by the method.

対象基準配列混合物およびそれらの使用方法の種々の実施形態は、少なくとも10;100;500;1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個以上の基準配列、ならびに、種々のこれらの中間の個数を含んでよい。基準配列の数は、DNAシークエンシング用標的ライブラリーの生成中に分析用に選択された標的配列の数と同じであってもよい。しかし、いくつかの実施形態では、構築されるライブラリー中の標的領域の数より少ない数の基準配列を使用するのが有利な場合がある。より少ない数を使って採用した高スループットDNAシーケンサーのシークエンシング能力の限界に達するのを避けるのが有利であろう。基準配列の数は、標的領域の数の50%以下、標的領域の数の40%以下、標的領域の数の30%以下、標的領域の数の20%以下、標的領域の数の10%以下、標的領域の数の5%以下、標的領域の数の1%以下、ならびに種々のこれらの中間の数であってよい。例えば、遺伝子ライブラリーが特異的SNP含有遺伝子座を標的とする15,000対のプライマーを使って作製される場合、15,000個の標的遺伝子座の内の1500個に対応する1500個の基準配列を含む適切な混合物を、ライブラリー構築の増幅ステップの前に添加できる。 Various embodiments of subject reference sequence mixtures and methods of their use include at least 10; 100; 500; 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000. 30,000; 40,000; 50,000; 75,000; or 100,000 or more reference sequences, as well as various intermediate numbers thereof. The number of reference sequences may be the same as the number of target sequences selected for analysis during the generation of the target library for DNA sequencing. However, in some embodiments, it may be advantageous to use a smaller number of reference sequences than the number of target regions in the library being constructed. It would be advantageous to avoid reaching the limit of the sequencing capacity of the high throughput DNA sequencer employed with a smaller number. The number of reference sequences is 50% or less of the number of target regions, 40% or less of the number of target regions, 30% or less of the number of target regions, 20% or less of the number of target regions, and 10% or less of the number of target regions. , 5% or less of the number of target areas, 1% or less of the number of target areas, and various intermediate numbers. For example, if the gene library is made with 15,000 pairs of primers targeting specific SNP-containing loci, 1500 criteria corresponding to 1500 of the 15,000 target loci. Appropriate mixtures containing sequences can be added prior to the amplification step of library construction.

ライブラリー構築中に添加される基準配列の量は、個別実施形態間で大きく変化してもよい。いくつかの実施形態では、それぞれの基準配列の量は、ライブラリー調製に使用されるゲノム物質試料中に存在する標的配列の予測量とほぼ同じであってよい。他の実施形態では、それぞれの基準配列の量は、ライブラリー調製に使用されるゲノム物質試料中に存在する標的配列の予測量よりも多くても、または少なくてもよい。標的配列および基準配列の初期の相対量は、本発明の目的にとって重大なものではないが、ライブラリー調製に使用されるゲノム物質試料中に存在する標的配列の量より100倍多い量から100倍少ない量の範囲であるのが好ましい。過剰な量の基準配列は、装置の定められた操作回数でDNAシーケンサーのシークエンシング能力の多くを使い過ぎる可能性がある。あまりに少ない量の基準配列を使用した場合は、増幅効率の変動の分析に役立たせるにしては不充分なデータになるであろう。 The amount of reference sequence added during library construction may vary significantly between individual embodiments. In some embodiments, the amount of each reference sequence may be approximately the same as the predicted amount of target sequence present in the genomic material sample used to prepare the library. In other embodiments, the amount of each reference sequence may be greater than or less than the predicted amount of target sequence present in the genomic material sample used to prepare the library. The initial relative amounts of the target and reference sequences are not significant for the purposes of the invention, but are 100 to 100 times greater than the amount of target sequences present in the genomic material sample used to prepare the library. It is preferably in the range of a small amount. Excessive amounts of reference sequences can overuse much of the sequencing capability of the DNA sequencer with a defined number of operations on the device. If too small a quantity of reference sequence is used, the data will be inadequate for use in the analysis of fluctuations in amplification efficiency.

基準配列は、増幅される対象領域に極めて類似したヌクレオチド塩基配列となるように選択でき、好ましくは、基準配列は、分析されるゲノム領域、すなわち、「標的配列」と正確に同じプライマー結合部位を有する。基準配列は、所与の遺伝子座の対応する標的配列とは区別できる必要がある。便宜上、この区別可能な基準配列の領域を「マーカー配列」と呼ぶ。いくつかの実施形態では、標的配列のマーカー配列領域は、多形領域、例えば、SNPを含み、プライマー結合領域が両側の位置に配置されていてもよい。基準配列は、対応する標的配列のGC含量に厳密に適合するように選択できる。いくつかの実施形態では、基準配列のプライマー結合領域は、ユニバーサルプライミング部位により両脇を挟まれている。これらのユニバーサルプライミング部位は、分析用ゲノムライブラリー中で使われるユニバーサルプライミング部位に適合するように選択される。他の実施形態では、基準配列は、ユニバーサルプライミング部位が無く、ユニバーサルプライミング部位は、ライブラリー形成中に付加される。基準配列は、通常、一本鎖型で提供される。基準配列は、対応する標的配列に対して定義され、配列特異的試薬を使用して標的配列が増幅される。いくつかの実施形態では、標的配列は、分析用の核酸試料中に存在する対象多型、例えば、SNP、欠失、または挿入を含む。基準配列は、ヌクレオチド塩基配列が標的配列と類似であるが、それでも、少なくとも1個のヌクレオチド塩基の差異のために標的配列とは区別でき、それにより、基準配列由来の増幅産物配列を、標的配列由来の増幅産物配列とは区別する機構を与える合成ポリヌクレオチドである。基準配列は、同じセットの増幅試薬、例えば、PCRプライマーと共に増幅される場合、対応する標的配列と実質的に同じ増幅特性を有するように選択される。いくつかの実施形態では、基準配列は、対応する標的配列と同じプライマー配列結合部位を有することができる。他の実施形態では、基準配列は、対応する標的配列とは異なるプライマー配列結合部位を持つことができる。いくつかの実施形態では、基準配列は、対応する標的配列由来の増幅産物の長さと同じ長さの増幅産物を生成するように選択できる。他の実施形態では、基準配列は、対応する標的配列由来の増幅産物の長さよりわずかに異なる長さの増幅産物を生成するように選択できる。 The reference sequence can be selected to have a nucleotide sequence that closely resembles the region of interest to be amplified, preferably the reference sequence has the exact same primer binding site as the genomic region being analyzed, i.e. the "target sequence". Have. The reference sequence needs to be distinguishable from the corresponding target sequence at a given locus. For convenience, this distinguishable reference sequence region is referred to as the "marker sequence". In some embodiments, the marker sequence region of the target sequence may include a polymorphic region, eg, an SNP, with primer binding regions located at both sides. The reference sequence can be selected to exactly match the GC content of the corresponding target sequence. In some embodiments, the primer binding region of the reference sequence is flanked by universal priming sites. These universal priming sites are selected to match the universal priming sites used in the analytical genomic library. In other embodiments, the reference sequence lacks a universal priming site and the universal priming site is added during library formation. The reference sequence is usually provided in a single chain form. A reference sequence is defined for the corresponding target sequence and the target sequence is amplified using sequence-specific reagents. In some embodiments, the target sequence comprises a target polymorphism present in the nucleic acid sample for analysis, such as an SNP, deletion, or insertion. The reference sequence has a nucleotide base sequence similar to that of the target sequence, but is still distinguishable from the target sequence due to the difference of at least one nucleotide base, whereby the amplification product sequence derived from the reference sequence is referred to as the target sequence. It is a synthetic polynucleotide that provides a mechanism to distinguish it from the derived amplification product sequence. The reference sequence is selected to have substantially the same amplification properties as the corresponding target sequence when amplified with the same set of amplification reagents, eg PCR primers. In some embodiments, the reference sequence can have the same primer sequence binding site as the corresponding target sequence. In other embodiments, the reference sequence can have a primer sequence binding site that is different from the corresponding target sequence. In some embodiments, the reference sequence can be selected to produce an amplification product of the same length as the amplification product from the corresponding target sequence. In other embodiments, the reference sequence can be selected to produce an amplification product with a length slightly different than the length of the amplification product from the corresponding target sequence.

増幅反応が完了後、ライブラリーは、高スループットDNAシーケンサーで配列決定されるが、この場合、個別分子をクローン増幅して配列決定される。標的配列のそれぞれの対立遺伝子のシーケンスリード数が計数され、また、同様に、標的配列に対応する基準配列のシーケンスリード数も計数される。また、このプロセスは、少なくとももう一対の標的配列と対応する基準配列に対しても同様に行われる。例えば、遺伝子座Aに関し、遺伝子座Aの対立遺伝子1に対しXA1リード、遺伝子座Aの対立遺伝子2に対しXA2リードが生成され、基準配列Aに対しXACリードが生成されたとする。それぞれの対象遺伝子座に対し、XACに対する(XA1プラスXA2)の比率が決定される。前に考察のように、このプロセスは、参照ゲノム、例えば、全染色体が二倍体であるとわかっているゲノムで行うことができる。このプロセスは、多くの数のリード値を得て平均リード数およびリード数の標準偏差を測定するために多数回反復できる。このプロセスは、異なる遺伝子座に対応する多数の異なる基準配列を含む混合物で行われる。(1)XA1プラスXA2が、既知の数の染色体、例えば、通常のヒトの女性ゲノムに対しては2に対応すること、および(2)基準配列が、それらの対応する天然遺伝子座と類似の増幅(および検出)特性を有することを仮定することにより、多重基準混合物中の相対量の異なる基準配列が決定できる。その後、較正された多重基準配列混合物を使って、多重増幅反応における異なる遺伝子座間の増幅効率の変動を調節できる。 After the amplification reaction is complete, the library is sequenced on a high throughput DNA sequencer, in which case the individual molecules are cloned and amplified and sequenced. The number of sequence reads for each allele of the target sequence is counted, and similarly, the number of sequence reads for the reference sequence corresponding to the target sequence is counted. This process is also performed for at least another pair of target sequences and corresponding reference sequences. For example, with respect to locus A, it is assumed that an XA1 read is generated for the allele 1 at the locus A, an XA2 read is generated for the allele 2 at the locus A, and an XAC read is generated for the reference sequence A. For each locus of interest, the ratio of (X A1 plus X A2 ) to X AC is determined. As discussed earlier, this process can be performed on the reference genome, eg, a genome in which all chromosomes are known to be diploid. This process can be repeated many times to obtain a large number of read values and measure the average number of reads and the standard deviation of the number of reads. This process is carried out on a mixture containing a large number of different reference sequences corresponding to different loci. (1) X A1 plus X A2 corresponds to 2 for a known number of chromosomes, eg, the normal human female genome, and (2) the reference sequence is associated with their corresponding natural loci. By assuming that they have similar amplification (and detection) properties, reference sequences with different relative quantities in the multiple reference mixture can be determined. A calibrated multiplex reference sequence mixture can then be used to regulate variations in amplification efficiency between different loci in the multiplex amplification reaction.

他の本発明の実施形態は、複製およびシークエンシングによる定量化と干渉する可能性のある大きな欠失が特徴の変異体遺伝子などの対象特異的遺伝子のコピー数を測定する方法と組成物を含む。シークエンシングでは、このような欠失を有する対立遺伝子の検出が難しい場合がある。基準配列を含む増幅プロセスを使用して、この問題を低減できる。 Other embodiments of the invention include methods and compositions for measuring the number of copies of a subject-specific gene, such as a mutant gene characterized by large deletions that may interfere with replication and sequencing quantification. .. Sequencing can make it difficult to detect alleles with such deletions. An amplification process involving reference sequences can be used to reduce this problem.

本発明の一実施形態では、分析用標的配列は、野性型(すなわち、機能型)および欠失が特徴の変異型の遺伝子である。代表的なこのような遺伝子は、遺伝疾患の脊髄性筋萎縮症(SMA)の原因である欠失を有する対立遺伝子のSMN1である。高スループット遺伝子シークエンシング技術によって変異型の遺伝子を保持する個人を検出することは有意義である。特に、シークエンシング中に配列の欠如が観察される(単純点変異またはSNPの検出とは対照的に)という理由で、欠失変異の検出へのこのような技術の応用は、問題がある場合がある。このような実施形態では、(1)対象の遺伝子(またはその一部)を増幅し、変異対立遺伝子を大きくは増幅しない、対象の遺伝子に特異的な一対の増幅プライマー、(2)対象の遺伝子(すなわち、標的配列)の野性型対立遺伝子に対応するが、少なくとも1個の検出可能ヌクレオチド塩基が異なる基準配列、(3)参照配列として機能する第2の標的配列に特異的な一対の増幅プライマー、および(4)参照配列に対応する基準配列、を用いる。 In one embodiment of the invention, the analytical target sequence is a mutant gene characterized by wild (i.e., functional) and deletion. A representative such gene is the allele SMN1 with a deletion responsible for the genetic disease spinal muscular atrophy (SMA). It is meaningful to detect individuals carrying mutant genes by high-throughput gene sequencing techniques. The application of such techniques to the detection of deletion mutations is problematic, especially because sequence deficiencies are observed during sequencing (as opposed to detection of simple point mutations or SNPs). There is. In such an embodiment, (1) a pair of amplification primers specific to the target gene, which amplifies the target gene (or a part thereof) and does not significantly amplify the mutation allele, (2) the target gene. A pair of amplification primers specific for a second target sequence that corresponds to the wild allele of (ie, target sequence) but differs in at least one detectable nucleotide base, (3) serves as a reference sequence. , And (4) the reference sequence corresponding to the reference sequence.

本発明の一実施形態では、対象の遺伝子のコピー数を測定する方法が提供され、対象の遺伝子は、欠失を含む1個の意図的対立遺伝子を有する。前記方法は、対象の遺伝子の欠失含有対立遺伝子を増幅しないで、少なくとも対象の遺伝子の一部、もしくは対象の全遺伝子、または対象の遺伝子に隣接する領域を増幅する点で対象の遺伝子に特異的な増幅試薬、例えば、PCRプライマーを採用できる。さらに、本方法は、対象の遺伝子に対応する基準配列を採用し、この場合、基準配列は、少なくとも1個のヌクレオチド塩基分だけ対象の遺伝子とは異なる(基準配列の配列が、対象の天然の遺伝子とは容易に区別できるように)。通常、基準配列は、対象の遺伝子と同じプライマー結合部位を含み、それにより、対象の遺伝子と、対象の遺伝子に対応する基準配列との間の全ての増幅時の差異を最小化する。また、反応は、参照配列に特異的な増幅試薬も含む。参照配列は、分析されるゲノム中の既知の(または少なくとも既知であると想定される)コピー数の配列である。反応は、参照配列に対応する基準配列をさらに含む。通常、参照配列に対応する基準配列は、参照配列と同じプライマー結合部位を含み、それにより、参照配列と、参照配列に対応する基準配列との間の全ての増幅時の差異を最小化する。 In one embodiment of the invention, a method of measuring the number of copies of a gene of interest is provided, the gene of interest having one intentional allele containing a deletion. The method is specific to the gene of interest in that it does not amplify the deletion-containing allele of the gene of interest, but at least part of the gene of interest, or all of the gene of interest, or the region adjacent to the gene of interest. Amplification reagents such as PCR primers can be adopted. Furthermore, the method employs a reference sequence corresponding to the gene of interest, where the reference sequence differs from the gene of interest by at least one nucleotide base (the sequence of the reference sequence is the natural of the subject). To be easily distinguishable from genes). Normally, the reference sequence contains the same primer binding site as the gene of interest, thereby minimizing any amplification difference between the gene of interest and the reference sequence corresponding to the gene of interest. The reaction also includes an amplification reagent specific for the reference sequence. A reference sequence is a sequence of known (or at least assumed to be known) number of copies in the genome being analyzed. The reaction further comprises a reference sequence corresponding to the reference sequence. Normally, the reference sequence corresponding to the reference sequence contains the same primer binding site as the reference sequence, thereby minimizing any amplification difference between the reference sequence and the reference sequence corresponding to the reference sequence.

代表的核酸試料
いくつかの実施形態では、遺伝子試料を調製し、かつ/または精製することができる。そのような目的を実現するための当技術分野で公知のいくつもの標準の手順がある。いくつかの実施形態では、試料を遠心分離して、種々の層に分離することができる。いくつかの実施形態では、濾過を用いてDNAを単離することができる。いくつかの実施形態では、DNAの調製は、増幅、分離、クロマトグラフィーによる精製、液液分離、単離、優先的な富化、優先的な増幅、標的化増幅または当技術分野で公知であるか、または本明細書に記載されているいくつもの他の技法のいずれかを伴ってよい。
Representative Nucleic Acid Samples In some embodiments, genetic samples can be prepared and / or purified. There are a number of standard procedures known in the art to achieve such objectives. In some embodiments, the sample can be centrifuged and separated into various layers. In some embodiments, filtration can be used to isolate the DNA. In some embodiments, DNA preparation is known in the art for amplification, separation, chromatographic purification, liquid separation, isolation, preferential enrichment, preferential amplification, targeted amplification or in the art. Or may be accompanied by any of a number of other techniques described herein.

いくつかの実施形態では、本明細書に開示されている方法は、存在するDNAが非常に少量である状況において、例えば、インビトロでの受精または、1つまたは少数の細胞(一般には、細胞10個未満、細胞20個未満または細胞40個未満)が利用可能である法医学的な状況において用いることができる。これらの実施形態では、本明細書に開示されている方法は、他のDNAが混入していないが、DNAが少量であるので倍数性コールが非常に難しい場合に少量のDNAから倍数性コールを行うために役立つ。いくつかの実施形態では、本明細書に開示されている方法は、標的DNAに別の個体のDNAが混入している状況において、例えば、出生前診断、父子試験との関連における母系の血液または受胎検査の産物において用いることができる。これらの方法が特に有利になるいくつかの他の状況は、より大量の正常な細胞の中でただ1つまたは少数の細胞が存在するがん検査の場合である。これらの方法の一部として用いる遺伝子測定は、DNAまたはRNAを含む任意の試料、例えば、これらに限定されないが血液、血漿、体液、尿、毛髪、涙、唾液、組織、皮膚、指の爪、割球、胚、羊水、絨毛膜絨毛試料、糞便、胆汁、リンパ液、頸管粘液、精液または核酸を含む他の細胞または材料に対して行うことができる。ある実施形態では、本明細書に開示されている方法は、核酸検出方法、例えば、配列決定、マイクロアレイ、qPCR、デジタルPCRまたは核酸を測定するために用いられる他の方法と一緒に実行することができる。何らかの理由で望ましいことが見いだされた場合、遺伝子座における対立遺伝子数の確率の比を算出することができ、対立遺伝子の比を、本明細書に記載の方法のいくつかと、それらの方法に適合性がある限りにおいて組み合わせて用いて倍数性状態を決定することができる。いくつかの実施形態では、本明細書に開示されている方法は、加工された試料に対して行ったDNA測定から、複数の多型遺伝子座における対立遺伝子の比をコンピュータで算出するステップを包含する。いくつかの実施形態では、本明細書に開示されている方法は、本開示に記載の他の改善の任意の組み合わせと一緒に、加工された試料に対して行ったDNA測定から、複数の多型遺伝子座における対立遺伝子の比をコンピュータで算出するステップを包含する。 In some embodiments, the methods disclosed herein are fertilized in vitro or in one or a few cells (typically cells 10) in situations where the amount of DNA present is very small. It can be used in forensic situations where less than 20 cells, less than 20 cells or less than 40 cells) are available. In these embodiments, the methods disclosed herein do not contaminate other DNA, but haploid calls from a small amount of DNA when haploid calls are very difficult due to the small amount of DNA. Help to do. In some embodiments, the methods disclosed herein are contaminated with the DNA of another individual in the target DNA, eg, maternal blood or in the context of prenatal testing, paternal and child testing. It can be used in the product of conception testing. Some other situations in which these methods are particularly advantageous are in the case of cancer screening, where only one or a few cells are present in a larger number of normal cells. Genetic measurements used as part of these methods include any sample containing DNA or RNA, such as, but not limited to, blood, plasma, body fluids, urine, hair, tears, saliva, tissue, skin, fingertips, etc. It can be done on blastomere, embryo, amniotic fluid, chorionic villi sample, feces, bile, lymph, cervical mucus, semen or other cells or materials containing nucleic acids. In certain embodiments, the methods disclosed herein can be performed in conjunction with nucleic acid detection methods such as sequencing, microarray, qPCR, digital PCR or other methods used to measure nucleic acids. can. If desired is found to be desirable for any reason, the ratio of the probabilities of the number of alleles at the locus can be calculated and the ratio of alleles is suitable for some of the methods described herein and those methods. The polyploid state can be determined by using them in combination as long as they have sex. In some embodiments, the methods disclosed herein include the step of computerizing the ratio of alleles at multiple polymorphic loci from DNA measurements made on a processed sample. do. In some embodiments, the methods disclosed herein are multiple, from DNA measurements made on processed samples, along with any combination of other improvements described herein. Includes a computerized calculation of the ratio of alleles at a type locus.

いくつかの実施形態では、この方法を用いて、単一細胞、少数の細胞、2~5個の細胞、6~10個の細胞、10~20個の細胞、20~50個の細胞、50~100個の細胞、100~1,000個の細胞または少量、例えば、1~10ピコグラム、10~100ピコグラム、100ピコグラム~1ナノグラム、1~10ナノグラム、10~100ナノグラムまたは100ナノグラム~1マイクログラムの細胞外DNAについて遺伝子型決定することができる。 In some embodiments, this method is used to use a single cell, a small number of cells, 2-5 cells, 6-10 cells, 10-20 cells, 20-50 cells, 50. ~ 100 cells, 100 ~ 1,000 cells or small amounts, eg 1-10 picograms, 10-100 picograms, 100 picograms-1 nanograms, 1-10 nanograms, 10-100 nanograms or 100 nanograms-1 micron Grams of extracellular DNA can be genotyped.

代表的RNA発現調査
本発明の多重PCR法を使って、遺伝子発現プロファイリング実験中に評価できる標的遺伝子座の数を増やすことができる。例えば、数千の遺伝子の発現レベルを同時にモニターして、疾患(例えば、癌)または疾患の危険性の増加に関連する配列(例えば、多型または他の変異)を有するかどうかを判定できる。これらの方法を使って、患者由来の試料中の遺伝子発現(例えば、特定のmRNA対立遺伝子の発現)を疾患の有無と比較することにより、疾患、例えば、癌の危険性の増加または減少に関する配列(例えば、多型または他の変異)を特定できる。さらに、特定の治療、疾患、または発育段階が遺伝子発現に与える影響を決定できる。同様に、これらの方法を使って、感染および非感染細胞または組織中の遺伝子発現を比較することにより、病原体または他の生物に反応してどの遺伝子の発現が変化したかを特定できる。これらの方法では、シークエンシングリード数は、検出されるべき多型に対し十分なリードが実行されるように、その多型の頻度に基づいて調節できる(分析される多型が存在する場合)。
Representative RNA Expression Investigations The multiplex PCR method of the present invention can be used to increase the number of target loci that can be evaluated during gene expression profiling experiments. For example, the expression levels of thousands of genes can be monitored simultaneously to determine if a disease (eg, cancer) or a sequence associated with an increased risk of the disease (eg, a polymorphism or other mutation) is present. Sequences relating to an increased or decreased risk of a disease, eg, cancer, by using these methods to compare gene expression (eg, expression of a particular mRNA allele) in a patient-derived sample to the presence or absence of the disease. (For example, polymorphisms or other mutations) can be identified. In addition, the effect of a particular treatment, disease, or developmental stage on gene expression can be determined. Similarly, these methods can be used to compare gene expression in infected and uninfected cells or tissues to identify which gene expression has changed in response to a pathogen or other organism. In these methods, the number of sequencing reads can be adjusted based on the frequency of the polymorphism (if any polymorphism is analyzed) so that sufficient reads are performed for the polymorphism to be detected. ..

いくつかの実施形態では、RNA(例えば、mRNA)を含む試料は、逆転写酵素(RT)を使って増幅され、得られたDNA(例えば、cDNA)は、その後、DNAポリメラーゼ(PCR)を使って増幅される。RTとPCRステップは、同じ反応体積中でまたは別々に、順次行うことができる。本発明のプライマーライブラリーのいずれかを、このリバース転写ポリメラーゼ連鎖反応(RT-PCR)法で使用できる。種々の実施形態では、リバース転写は、オリゴdT、ランダムプライマー、オリゴdTとランダムプライマーの混合物、または標的遺伝子座特異的プライマーを使って行うことができる。混入ゲノムDNAの増幅を避けるために、RT-PCR用のプライマーは、1個のプライマーの一部が、1個のエキソンの3’末端にハイブリダイズし、他のプライマーの一部が隣接エキソンの5’末端にハイブリダイズするように設計できる。このようなプライマーは、スプライスされたmRNAから合成されたcDNAにアニールするが、ゲノムDNAにはアニールしない。混入DNAの増幅を検出するために、RT-PCRプライマー対を、少なくとも1個のイントロンを含む領域の側に配置されるように設計できる。cDNA(イントロン不含)から増幅された産物は、ゲノムDNA(イントロン含有)から増幅されたものより小さい。産物のサイズ差を使って混入DNAの存在が検出される。いくつかの実施形態では、mRNA配列のみが既知である場合、少なくとも300~400塩基対離れているプライマーアニーリング部位が選択される。理由は、真核生物DNA由来のこのサイズのフラグメントは、スプライスジャンクションを含む可能性があるためである。あるいは、試料をDNA分解酵素で処理して混入DNAを分解できる。 In some embodiments, a sample containing RNA (eg, mRNA) is amplified using reverse transcriptase (RT) and the resulting DNA (eg, cDNA) is then used with DNA polymerase (PCR). Is amplified. The RT and PCR steps can be performed sequentially in the same reaction volume or separately. Any of the primer libraries of the invention can be used in this reverse transcription-polymerase chain reaction (RT-PCR) method. In various embodiments, reverse transcription can be performed using oligo dT, random primers, a mixture of oligo dT and random primers, or target locus-specific primers. To avoid amplification of contaminating genomic DNA, some primers for RT-PCR hybridize to the 3'end of one exon and some of the other primers are adjacent exons. It can be designed to hybridize to the 5'end. Such primers anneal to cDNA synthesized from spliced mRNA, but not genomic DNA. To detect amplification of contaminating DNA, the RT-PCR primer pair can be designed to be located beside the region containing at least one intron. Products amplified from cDNA (intron-free) are smaller than those amplified from genomic DNA (intron-containing). The presence of contaminating DNA is detected using the size difference of the product. In some embodiments, if only the mRNA sequence is known, primer annealing sites separated by at least 300-400 base pairs are selected. The reason is that fragments of this size from eukaryotic DNA may contain splice junctions. Alternatively, the sample can be treated with a DNase to degrade the contaminating DNA.

代表的父子鑑定方法
非常に多くの標的遺伝子座を一度に分析できるために、(例えば、2011年12月22日出願の米国特許公開第2012/0122701号を参照。この特許は、参照によりその全体が本明細書に組み込まれる)本発明の多重PCR法を使って父子鑑定の正確度を改善できる。例えば、多重PCR法は、数千の多形遺伝子座(例えば、SNP)を本明細書記載のPARENTAL SUPPORTアルゴリズム中で使用するために分析して父親とされる人が胎児の生物学上の父親であるかどうかを判定することを可能とする。いくつかの実施形態では、前記方法は、(i)父親とされる人由来の遺伝物質上の少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座を含む複数の多形遺伝子座を同時に増幅して第1の増幅産物集合を生成するステップと、(ii)妊娠中の母親の血液試料由来の胎児DNAおよび母系DNAを含む混合DNA試料の対応する複数の多形遺伝子座を同時に増幅して第2の増幅産物集合を生成するステップと、(iii)第1および第2の増幅産物集合に基づく遺伝子型測定値を使って父親とされる人が胎児の生物学上の父親である確率をコンピュータで算出するステップと、(iv)父親とされる人が胎児の生物学上の父親であることに関する算出された確率を使って父親とされる人が胎児の生物学上の父親かどうかを確定するステップとを含む。種々の実施形態では、前記方法は、母親由来の遺伝物質上の対応する複数の多形遺伝子座を同時に増幅して第3の増幅産物集合を生成するステップをさらに含み、この場合、第1、第2、および第3の増幅産物集合に基づく遺伝子型測定値を使って父親とされる人が胎児の生物学上の父親である確率が算出される。
Representative paternity testing methods Because so many target loci can be analyzed at once (see, for example, US Patent Publication No. 2012/0122701 filed December 22, 2011; this patent is in its entirety by reference. The multiple PCR method of the present invention can be used to improve the accuracy of paternity testing. For example, the multiplex PCR method analyzes and analyzes thousands of polymorphic loci (eg, SNPs) for use in the PARENTAL SUPPORT algorithm described herein, and the father is the biological father of the fetus. It is possible to determine whether or not. In some embodiments, the method is (i) at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or a first amplification product set that simultaneously amplifies multiple polymorphic loci including 100,000 different polymorphic loci. And (ii) simultaneously amplify the corresponding polymorphic loci of the mixed DNA sample containing fetal DNA and maternal DNA from the blood sample of the pregnant mother to generate a second amplification product set. And (iii) a computer-calculated probability that the alleged father is the biological father of the fetal using the genotype measurements based on the first and second amplification product sets. iv) Includes the step of determining whether the alleged father is the biological father of the fetal using the calculated probability that the alleged father is the biological father of the fetal. In various embodiments, the method further comprises simultaneously amplifying the corresponding polymorphic loci on the maternally derived genetic material to generate a third amplification product set, in this case the first. The genotyping values based on the second and third amplification product sets are used to calculate the probability that the alleged father is the biological father of the fetal.

代表的胚キャラクタリゼーションおよび選択方法
本発明の多重PCR法を使って数千の標的遺伝子座を一度に分析可能とすることにより、インビトロ受精用の胚の選択を改善できる(例えば、2008年5月27日出願、2011年12月22日出願の米国特許公開第2011/0092763号を参照。この特許は、参照によりその全体が本明細書に組み込まれる)。例えば、多重PCR法は、本明細書で記載のPARENTAL SUPPORTアルゴリズムで使用するための数千の多形遺伝子座(例えば、SNP)を分析可能として、胚の集合からインビトロ受精用の胚の選択を行うことができる。
Representative Embryo Characterization and Selection Methods By making it possible to analyze thousands of target loci at once using the multiple PCR method of the present invention, the selection of embryos for in vitro fertilization can be improved (eg, May 2008). See US Patent Publication No. 2011/0092763 filed 27th, 22nd December 2011, which is incorporated herein by reference in its entirety). For example, the multiplex PCR method allows the analysis of thousands of polymorphic loci (eg, SNPs) for use in the PARENTAL SUPPORT algorithm described herein to select embryos for in vitro fertilization from embryo populations. It can be carried out.

いくつかの実施形態では、本発明は、胚集合由来のそれぞれの胚を所望の通り発生させる相対的尤度を推定する方法を提供する。いくつかの実施形態では、前記方法は、それぞれの胚由来の試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させてそれぞれの胚の混合物を生成するステップを含み、試料は、それぞれ、胚由来の1個または複数個の細胞から得られる。いくつかの実施形態では、それぞれの反応混合物は、プライマー伸長反応条件に供されて増幅産物を生成する。いくつかの実施形態では、前記方法は、コンピュータでそれぞれの胚由来の少なくとも1個の細胞の1つまたは複数の特性を増幅産物に基づいて決定するステップと、それぞれの胚を所望の通り発生させる相対的尤度をそれぞれの胚に対する少なくとも1個の細胞の1つまたは複数の特性に基づいてコンピュータで推定するステップとを含む。いくつかの実施形態では、前記方法は、インフォマティクスベースの方法を使用して少なくとも1つの特性、例えば、本明細書で記載のPARENTAL SUPPORTアルゴリズムを決定するステップを含む。いくつかの実施形態では、特性は、倍数性状態を含む。いくつかの実施形態では、特性は、異数体、正倍数体、モザイク、零染色体性、モノソミー、片親ダイソミー、トリソミー、テトラソミー、異数性のタイプ、不一致コピーエラートリソミー、一致コピーエラートリソミー、母体起源の異数性、父系起源の異数性、疾患連鎖遺伝子の存在の有無、全ての正倍数体染色体の染色体同一性、異常遺伝子状態、欠失または複製、特性の尤度、およびこれらの組み合わせからなる群より選択される。特性は、染色体1、染色体2、染色体3、染色体4、染色体5、染色体6、染色体7、染色体8、染色体9、染色体10、染色体11、染色体12、染色体13、染色体14、染色体15、染色体16、染色体17、染色体18、染色体19、染色体20、染色体21、染色体22、X染色体またはY染色体、およびこれらの組み合わせ、からなる群より選択される染色体に関連するものであってよい。 In some embodiments, the invention provides a method of estimating the relative likelihood of developing each embryo from an embryo set as desired. In some embodiments, the method comprises at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30, The sample comprises steps to generate a mixture of each embryo by contacting with a primer library that simultaneously hybridizes to 000; 40,000; 50,000; 75,000; or 100,000 different target loci. , Each obtained from one or more cells derived from the embryo. In some embodiments, each reaction mixture is subjected to primer extension reaction conditions to produce an amplification product. In some embodiments, the method is a step of computer-based determination of one or more properties of at least one cell from each embryo based on an amplification product, and the development of each embryo as desired. Includes a step of computer-estimating the relative likelihood based on the properties of one or more cells of at least one cell for each embryo. In some embodiments, the method comprises using an informatics-based method to determine at least one characteristic, eg, the PARENTAL SUPPORT algorithm described herein. In some embodiments, the property comprises a ploidic state. In some embodiments, the properties are aneuploidy, positive multiple, mosaic, zero-chromosomal, monosomy, aneuploidy, trisomy, tetrasomy, aneuploidy type, mismatched copy error trisomy, matched copy error trisomy, maternal. Aneuploidy of origin, aneuploidy of paternal origin, presence or absence of disease chain genes, chromosomal identity of all trisomy chromosomes, aberrant gene status, deletion or replication, likelihood of traits, and combinations thereof. Selected from the group consisting of. The characteristics are chromosome 1, chromosome 2, chromosome 3, chromosome 4, chromosome 5, chromosome 6, chromosome 7, chromosome 8, chromosome 9, chromosome 10, chromosome 11, chromosome 12, chromosome 13, chromosome 14, chromosome 15, and chromosome 16. , Chromosome 17, Chromosome 19, Chromosome 20, Chromosome 21, Chromosome 22, X or Y chromosome, and combinations thereof, may be related to a chromosome selected from the group.

代表的出生前診断法
本発明の多重PCR法を使用して、胎児染色体の倍数性状態の判定などの出生前診断法を改善できる。同時に増幅される多数の標的遺伝子座を考慮すれば、より正確な判定を行うことが可能である。
Representative Prenatal Diagnostic Methods The multiple PCR methods of the present invention can be used to improve prenatal diagnostic methods such as determining the ploidy state of fetal chromosomes. Considering the large number of target loci that are amplified at the same time, it is possible to make a more accurate determination.

ある実施形態では、本開示は、DNAの混合試料(すなわち、胎児の母親由来のDNA、および胎児由来のDNA)から測定された遺伝子型データから、および必要に応じて、母親由来の遺伝物質および場合によっては同様に父親由来の遺伝物質の試料から測定された遺伝子型データから、妊娠中の胎児における染色体の倍数性状態を決定するためのエクスビボ方法であって、前記決定を、同時分布モデルを用い、親の遺伝子型データを考慮して、胎児における可能性のある異なる倍数性状態についての予測される対立遺伝子分布の集合を作製し、予測される対立遺伝子分布と、混合試料において測定された実際の対立遺伝子分布とを比較し、予測される対立遺伝子分布パターンが観察された対立遺伝子分布パターンと最も厳密に一致する倍数性状態を選択することによって行う方法を提供する。ある実施形態では、混合試料は、母系の血液または母系の血清もしくは血漿に由来する。ある実施形態では、DNAの混合試料を、標的遺伝子座(例えば、複数の多型遺伝子座)で優先的に富化することができる。ある実施形態では、優先的な富化は、対立遺伝子の偏りが最小限になるように行う。ある実施形態では、本開示は、複数の遺伝子座において対立遺伝子の偏りが少なくなるように優先的に富化されたDNAの組成に関する。ある実施形態では、対立遺伝子分布(複数可)を、混合試料由来のDNAについてシークエンシングによって測定する。ある実施形態では、同時分布モデルにより、対立遺伝子が二項様式で分布することが仮定される。ある実施形態では、種々の供給源からの現存の組換え頻度を考慮して、例えば、International HapMap Consortiumからのデータを使用して、遺伝的に連鎖している遺伝子座について予測同時対立遺伝子分布の集合を作製する。 In certain embodiments, the present disclosure is from genotypic data measured from a mixed sample of DNA (ie, DNA from the mother of the fetus, and DNA from the fetus), and optionally with genetic material from the mother. In some cases, it is an exvivo method for determining the chromosomal polymorphism in a pregnant fetus from genotype data also measured from a sample of genetic material derived from the father, and the above determination is based on a co-distribution model. Using, taking into account parental genotype data, a set of predicted allogeneic distributions for possible different multiple states in the fetus was generated and measured in the predicted allogeneic distribution and mixed samples. Provided is a method performed by comparing with an actual allelic gene distribution and selecting a multiple state in which the predicted allelic gene distribution pattern most closely matches the observed allelic gene distribution pattern. In certain embodiments, the mixed sample is derived from maternal blood or maternal serum or plasma. In certain embodiments, a mixed sample of DNA can be preferentially enriched at a target locus (eg, a plurality of polymorphic loci). In certain embodiments, preferential enrichment is performed so that allele bias is minimized. In certain embodiments, the present disclosure relates to the composition of DNA that is preferentially enriched to reduce allele bias at multiple loci. In one embodiment, the allele distribution (s) are measured by sequencing the DNA from the mixed sample. In certain embodiments, joint distribution models assume that alleles are distributed in a binomial fashion. In one embodiment, taking into account the frequency of existing recombination from various sources, for example, using data from the International HapMap Consortium, predictive simultaneous allelic distributions for genetically linked loci. Create a set.

ある実施形態では、本開示は、非侵襲的な出生前診断(NPD)の方法、詳細には、DNA混合物について測定された遺伝子型データにおいて複数の多型遺伝子座における対立遺伝子測定値を観察することによって胎児の異数性状態を決定するための方法であって、ある特定の対立遺伝子測定値により異数体の胎児が示され、一方、他の対立遺伝子測定値により正倍数性の胎児が示される示す方法を提供する。ある実施形態では、遺伝子型データを、母系の血漿に由来するDNA混合物についてシークエンシングによって測定する。ある実施形態では、DNA試料を、対立遺伝子分布を算出する複数の遺伝子座に対応するDNA分子について優先的に富化することができる。ある実施形態では、母親由来の遺伝物質のみを含む、または、ほぼ母親由来の遺伝物質のみを含むDNAの試料を測定し、場合によっては、父親由来の遺伝物質のみを含む、または、ほぼ父親由来の遺伝物質のみを含むDNAの試料も測定する。ある実施形態では、一方の親または両親の遺伝子測定値を推定される胎児画分と一緒に使用して、胎児における可能性のある異なる基礎をなす遺伝子の状態に対応する複数の予測される対立遺伝子分布を作製し、前記予測される対立遺伝子分布は、仮説と称することができる。ある実施形態では、母系の遺伝子データは、天然で排他的またはほぼ排他的に母系のものである遺伝物質を測定することによって決定するのではなく、母系DNAと胎児DNAの混合物を含む母系の血漿に対して行われる遺伝子測定から推定する。いくつかの実施形態では、仮説は、1個または複数個の染色体における胎児の倍数性、胎児のどの染色体のどのセグメントがどちらの親から遺伝したか、およびそれらの組み合わせを含んでよい。いくつかの実施形態では、胎児の倍数性状態は、観察された対立遺伝子測定値と、異なる仮説であって、前記仮説の少なくとも一部が、異なる倍数性状態に対応する仮説を比較し、観察された対立遺伝子測定値を考慮して、真である可能性が最も高い仮説に対応する倍数性状態を選択することによって決定する。ある実施形態では、この方法は、遺伝子座がホモ接合性であるかヘテロ接合性であるかにかかわらず、測定されたSNPの一部または全部からの対立遺伝子測定データの使用を伴い、したがって、ヘテロ接合性のみである遺伝子座の対立遺伝子の使用は伴わない。この方法は、遺伝子データがただ1つの多型遺伝子座に関係する状況には適さない場合がある。この方法は、遺伝子データが、標的染色体に対して10超の多型遺伝子座、または20超の多型遺伝子座についてのデータを含む場合に特に有利である。この方法は、遺伝子データが、標的染色体に対して50超の多型遺伝子座、100超の多型遺伝子座、または標的染色体に対して200超の多型遺伝子座についてのデータを含む場合に特に有利である。いくつかの実施形態では、遺伝子データは、標的染色体に対して500超の多型遺伝子座、1,000超の多型遺伝子座、2,000超の多型遺伝子座、または、標的染色体に対して5,000超の多型遺伝子座についてのデータを含んでよい。 In certain embodiments, the present disclosure observes allogeneic measurements at multiple polymorphic loci in genotype data measured for non-invasive prenatal diagnosis (NPD) methods, specifically DNA mixtures. This is a method for determining the aneuploid state of a fetal, in which certain allogeneic measurements indicate an aneuploid fetal, while other allogeneic measurements indicate a positive multiple fetal. The indicated method is provided. In one embodiment, genotype data is measured by sequencing on a DNA mixture derived from maternal plasma. In certain embodiments, the DNA sample can be preferentially enriched for DNA molecules corresponding to multiple loci for calculating allelic distribution. In certain embodiments, a sample of DNA containing only or substantially mother-derived genetic material is measured and, in some cases, containing only father-derived genetic material or substantially father-derived. A sample of DNA containing only the genetic material of is also measured. In one embodiment, genetic measurements from one parent or parent are used in conjunction with an estimated fetal fraction to accommodate multiple predicted alleles that correspond to possible different underlying genetic states in the fetal. A gene distribution is created and the predicted allele distribution can be referred to as a hypothesis. In certain embodiments, maternal genetic data is not determined by measuring genetic material that is naturally exclusive or almost exclusively maternal, but maternal plasma containing a mixture of maternal DNA and fetal DNA. Estimated from the genetic measurements made on the. In some embodiments, the hypothesis may include fetal ploidy on one or more chromosomes, which segment of which chromosome of the fetus was inherited from which parent, and combinations thereof. In some embodiments, the fetal ploidy state is a different hypothesis with the observed allelic measurements, comparing and observing hypotheses in which at least some of the hypotheses correspond to different ploidy states. Determined by choosing the ploidy state that corresponds to the hypothesis most likely to be true, taking into account allele measurements made. In certain embodiments, this method involves the use of allelic measurement data from some or all of the measured SNPs, regardless of whether the locus is homozygous or heterozygous, thus. It does not involve the use of alleles at loci that are only heterozygous. This method may not be suitable for situations where genetic data is associated with only one polymorphic locus. This method is particularly advantageous when the genetic data contains data for more than 10 polymorphic loci or more than 20 polymorphic loci with respect to the target chromosome. This method is especially useful if the genetic data contains data for more than 50 polymorphic loci, more than 100 polymorphic loci, or more than 200 polymorphic loci for the target chromosome. It is advantageous. In some embodiments, the genetic data is for more than 500 polymorphic loci, more than 1,000 polymorphic loci, more than 2,000 polymorphic loci, or target chromosomes for the target chromosome. May contain data for more than 5,000 polymorphic loci.

ある実施形態では、本明細書に開示されている方法は、多型遺伝子座の各対立遺伝子の独立した観察の数の定量的尺度を提供する。これは、マイクロアレイまたは定性的PCRなどの、2つの対立遺伝子の比に関する情報をもたらすが、いずれかの対立遺伝子の独立した観察の数を定量化しない大多数の方法とは異なる。独立した観察の数に関する定量的情報をもたらす方法では、倍数性の算出には比のみを利用し、一方、定量的情報はそれ自体では有用ではない。独立した観察の数に関する情報を保持することの重要性を例示するために、2つの対立遺伝子、AおよびBを有する試料の遺伝子座について考察する。第1の実験では20の対立遺伝子Aおよび20の対立遺伝子Bを観察し、第2の実験では200の対立遺伝子Aおよび200の対立遺伝子Bを観察する。どちらの実験でも、比(A/(A+B))は0.5と等しいが、第2の実験は、第1の実験よりも対立遺伝子AまたはBの頻度の確実性に関する多くの情報を伝える。別の研究者によるいくつかの方法は、個々の対立遺伝子からの対立遺伝子の比(チャネル比)(すなわちx/y)を平均または合計し、この比を、参照染色体と比較するか、またはこの比が特定の状況でどのように挙動すると予想されるかに関する規則を用いるかのいずれかで解析することを伴う。このような方法では、対立遺伝子の重み付けを伴わず、各対立遺伝子についてほぼ同じ量のPCR産物を確実にすることができること、および全ての対立遺伝子が同じように挙動するはずであることが想定される。このような方法にはいくつもの不都合があり、より重要なことに、本開示の他の箇所で記載されているいくつもの改善を用いることが妨げられる。 In certain embodiments, the methods disclosed herein provide a quantitative measure of the number of independent observations of each allele at a polymorphic locus. This provides information about the ratio of the two alleles, such as microarrays or qualitative PCR, unlike most methods that do not quantify the number of independent observations of either allele. Methods that provide quantitative information about the number of independent observations use only ratios to calculate ploidy, while quantitative information is not useful in itself. To illustrate the importance of retaining information about the number of independent observations, consider the loci of a sample with two alleles, A and B. In the first experiment, 20 alleles A and 20 alleles B are observed, and in the second experiment, 200 alleles A and 200 alleles B are observed. In both experiments, the ratio (A / (A + B)) is equal to 0.5, but the second experiment conveys more information about the certainty of the frequency of the allele A or B than the first experiment. Some methods by another researcher are to average or sum the allele ratios (channel ratios) from individual alleles (ie x i / y i ) and compare this ratio to the reference chromosome. Or it involves analyzing either by using rules regarding how this ratio is expected to behave in a particular situation. It is assumed that such a method can ensure approximately the same amount of PCR product for each allele without allele weighting, and that all alleles should behave similarly. To. Such methods have a number of disadvantages and, more importantly, prevent the use of any of the improvements described elsewhere in this disclosure.

ある実施形態では、本明細書に開示されている方法は、ダイソミーにおいて予測される対立遺伝子頻度分布ならびに減数分裂Iの間の染色体不分離、減数分裂IIの間の染色体不分離、および/または胎児発生の初期の有糸分裂の間の染色体不分離によって生じるトリソミーの場合に予測され得る複数の対立遺伝子頻度分布を明確にモデリングする。なぜこれが重要であるかを例示するために、乗換えがない場合を考える:減数分裂Iの間の染色体不分離により、2つの異なる相同体が一方の親から遺伝によって受け継がれたトリソミーがもたらされ、対照的に、減数分裂IIの間、または胎児発生の初期の有糸分裂の間の染色体不分離により、一方の親由来の同じ相同体の2つのコピーがもたらされることになる。各筋書きにより、各多型遺伝子座において、また遺伝連鎖に起因して、共同して考えられる全ての遺伝子座において、予測される対立遺伝子の異なる頻度がもたらされることになる。相同体間での遺伝物質の交換をもたらす乗換えにより、遺伝様式がより複雑になり、ある実施形態では、当該方法は、遺伝子座間の物理的な距離に加えて、組換え率の情報を使用することによってこれに適応する。ある実施形態では、減数分裂I時の染色体不分離と減数分裂IIまたは有糸分裂時の染色体不分離との間の区別の改善を可能にするために、当該方法では、モデルに、セントロメアからの距離が増加するにつれて上昇する乗換えの確率を組み入れる。減数分裂IIおよび有糸分裂時の染色体不分離は、有糸分裂時の染色体不分離により、一般には、1つの相同体の同一またはほぼ同一のコピーがもたらされるが、一方、減数分裂II時の染色体不分離事象の後に存在する2つの相同体は、多くの場合、配偶子形成の間の1つまたは複数の乗換えに起因して異なるという事実によって区別することができる。 In certain embodiments, the methods disclosed herein are the predicted allogeneic frequency distribution in dysomy and nondisjunction between meiosis I, nondisjunction between meiosis II, and / or fetal. It clearly models the frequency distribution of multiple allelic genes that can be predicted in the case of trisomy caused by chromosomal nondisjunction during early mitosis of development. To illustrate why this is important, consider the case of no crossover: chromosomal nondisjunction during meiosis I results in a trisomy in which two different homologues are inherited from one parent. In contrast, chromosomal nondisjunction during meiosis II or during early mitosis of fetal development results in two copies of the same homologue from one parent. Each scenario will result in different frequencies of predicted alleles at each polymorphic locus and at all jointly considered loci due to genetic linkage. Crossovers that result in the exchange of genetic material between homologues complicate the mode of inheritance, and in certain embodiments, the method uses information on the rate of recombination in addition to the physical distance between loci. By adapting to this. In certain embodiments, in order to allow an improvement in the distinction between chromosomal nondisjunction during meiosis I and chromosomal nondisjunction during meiosis II or mitosis, in this method, the model is from a centromere. Incorporate the probability of a crossover that increases as the distance increases. In meiosis II and mitotic nondisjunction, mitotic nondisjunction generally results in the same or nearly identical copy of one homologue, while at meiosis II. The two homologues that exist after a nondisjunction event can often be distinguished by the fact that they differ due to one or more crossovers during mitosis.

いくつかの実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値を、可能性のある胎児の遺伝子異数性に対応する理論的仮説と比較するステップを包含し、ヘテロ接合性遺伝子座における対立遺伝子の比を定量するステップは包含しない。遺伝子座の数が約20未満の場合、ヘテロ接合性遺伝子座における対立遺伝子の比を定量するステップを含む方法を用いて行った倍数性の決定と、観察された対立遺伝子測定値を、可能性のある胎児の遺伝子の状態に対応する理論的な対立遺伝子分布の仮説と比較することを含む方法を用いて行った倍数性の決定は、同様の結果をもたらし得る。しかし、遺伝子座の数が50超である場合、これらの2つの方法は、有意に異なる結果をもたらす可能性があり、遺伝子座の数が400超、1,000超または2,000超である場合、これらの2つの方法は、ますます有意に異なる結果をもたらす可能性が高い。これらの差は、各対立遺伝子の大きさを独立に測定すること、および比を総計または平均することを伴わずにヘテロ接合性遺伝子座における対立遺伝子の比を定量するステップを含む方法が、同時分布モデルを用いること、連鎖解析を実施すること、二項分布モデルを用いること、および/または他の高度な統計学的技法を含めた技法を用いることを妨げるが、観察された対立遺伝子測定値を、可能性のある胎児の遺伝子の状態に対応する理論的な対立遺伝子分布の仮説と比較するステップを含む方法を用いると、決定の正確度を実質的に上昇させることができるこれらの技法を用いることができるという事実に起因する。 In some embodiments, the methods disclosed herein include the step of comparing the observed allelic measurements to the theoretical hypothesis corresponding to the potential fetal locus. , Does not include the step of quantifying the ratio of alleles at the heterozygous locus. If the number of loci is less than about 20, multiple determinations made using methods involving quantifying the ratio of alleles at heterozygous loci and observed allelic measurements are possible. Multiple determinations made using methods involving comparison with the hypothesis of a theoretical allelic distribution corresponding to the genetic status of a fetal can yield similar results. However, if the number of loci is greater than 50, these two methods can give significantly different results, with more than 400, 1,000 or 2,000 loci. If so, these two methods are likely to produce increasingly significantly different results. These differences are simultaneous with methods involving measuring the size of each allele independently and quantifying the ratio of alleles at the heterozygous loci without summing or averaging the ratios. Obstructed from using distribution models, performing chain analysis, using binomial distribution models, and / or using techniques including other advanced statistical techniques, but observed allelic measurements. These techniques can substantially increase the accuracy of the determination using methods that include the step of comparing with the hypothesis of the theoretical allele distribution corresponding to the potential genetic status of the fetus. Due to the fact that it can be used.

ある実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値の分布により、同時分布モデルを用いて正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。同時分布モデルの使用は、方法であって、多型遺伝子座を独立に処理することによってヘテロ接合率を決定する方法とは、得られた決定の正確度が有意に高いという点で異なり、それよりも有意に改善されている。いかなる特定の理論にも縛られることなく、それらの正確度が高い1つの理由は、同時分布モデルでは、SNP間の連鎖、および成長して胎児になる胚を形成する配偶子を生じる減数分裂の間に起こった乗換えの尤度を考慮に入れることであると考えられる。1個または複数個の仮説について対立遺伝子測定値の予測される分布を作製する際に連鎖の概念を用いる目的は、それにより、連鎖を用いない場合よりも相当よい現実に対応する予測される対立遺伝子測定値分布の作製を可能にすることである。例えば、2つのSNPが存在し、1および2は、互いに近くに位置し、母親は、一方の相同体上のSNP1がAであり、SNP2がAであり、相同体2上のSNP1がBであり、SNP2がBであると考える。父親が、両方の相同体上の両方のSNPについてAであり、胎児のSNP1についてBが測定された場合、これは、相同体2を胎児が遺伝によって受け継いだこと、したがって、胎児のSNP2にBが存在する尤度がはるかに高いことを示す。連鎖を考慮に入れたモデルではこれが予測されるが、連鎖を考慮に入れないモデルでは予測されない。あるいは、母親のSNP1がABであり、近くのSNP2がABである場合、その場所における母系トリソミーに対応する2つの仮説-一致コピーエラー(減数分裂IIまたは胎児発生初期の有糸分裂における染色体不分離)を伴うもの、および不一致コピーエラー(減数分裂Iにおける染色体不分離)を伴うものを用いることができる。一致コピーエラートリソミーの場合には、胎児が、SNP1において母親からAAを遺伝によって受け継いだ場合、胎児は、SNP2において母親から、ABではなく、AAまたはBBのいずれかを遺伝によって受け継ぐ可能性がはるかに高い。不一致コピーエラーの場合には、胎児は、両方のSNPにおいて母親からABを遺伝によって受け継ぐことになる。連鎖を考慮に入れた、倍数性コール方法によって立てられた対立遺伝子分布の仮説により、これらの予測がなされ、したがって、連鎖を考慮に入れなかった倍数性コール方法よりも相当に大きな程度で、実際の対立遺伝子測定値に対応する。連鎖手法は、対立遺伝子の比を算出することおよびそれらの対立遺伝子の比を総計することに依拠する方法を用いる場合には不可能であることに留意されたい。 In certain embodiments, the methods disclosed herein determine whether the distribution of observed allelic measurements indicates a positive polyploid or aneuploid fetus using a joint distribution model. Including steps. The use of joint distribution models is a method that differs from the method of determining heterozygotes by treating polymorphic loci independently in that the decisions obtained are significantly more accurate. It is significantly improved than. One reason for their high accuracy, without being bound by any particular theory, is that in joint distribution models, chains between SNPs and meiosis that give rise to gametes that form embryos that grow into fetuses. It is considered to take into account the likelihood of crossovers that occurred in the meantime. The purpose of using the concept of linkage in creating a predicted distribution of allelic measurements for one or more hypotheses is thereby a predicted conflict that corresponds to a much better reality than without linkage. It is to make it possible to create a gene measurement value distribution. For example, there are two SNPs, 1 and 2 located close to each other, and the mother has SNP1 on one homology A, SNP2 A, and SNP1 on homology 2 B. Yes, and consider that SNP2 is B. If the father is A for both SNPs on both homologues and B is measured for fetal SNP1, this is because the fetus inherited homology 2 and therefore B to the fetal SNP2. Indicates that the probability of existence is much higher. This is expected in models that take chain into account, but not in models that do not take chain into account. Alternatively, if the mother's SNP1 is AB and the nearby SNP2 is AB, there are two hypotheses corresponding to maternal trisomy at that location-matching copy error (meiosis II or chromosomal nondisjunction in early mitosis). ), And those with a mismatched copy error (nondisjunction in meiosis I) can be used. In the case of coincident copy error trisomy, if the fetus inherits AA from the mother in SNP1, the fetus is much more likely to inherit either AA or BB from the mother in SNP2 instead of AB. High. In the case of a mismatched copy error, the fetus will inherit AB from the mother in both SNPs. These predictions are made by the allelic distribution hypothesis made by the haploid calling method, which takes linkage into account, and therefore, to a much greater extent than the haploid calling method, which does not take linkage into account, in fact. Corresponds to allele measurements. Note that linkage techniques are not possible when using methods that rely on calculating allele ratios and summing the ratios of those alleles.

観察された対立遺伝子測定値を、可能性のある胎児の遺伝子の状態に対応する理論的仮説と比較するステップを含む方法を用いる倍数性の決定の正確度がより高いと考えられる1つの理由は、配列決定を使用して対立遺伝子を測定する場合、この方法では、リードの総数が他の方法よりも少ない場合に、対立遺伝子からのデータから、より多くの情報を収集することができることであり、例えば、対立遺伝子の比を算出することおよび総計することに依拠する方法では、不釣り合いに重み付けられた確率論的ノイズが生じる。例えば、配列決定を用いて対立遺伝子を測定することを伴う場合であって、各遺伝子座についてシーケンスリードが5つのみ検出された遺伝子座の集合が存在する場合を考える。ある実施形態では、対立遺伝子のそれぞれについて、データを、仮定された対立遺伝子分布と比較し、シーケンスリード数に従って重み付けることができ、したがって、これらの測定からのデータは、適切に重み付けられ、全体的な決定に組み入れられる。これは、ヘテロ接合性遺伝子座における対立遺伝子の比を定量することを伴う方法が、可能性のある対立遺伝子の比として0%、20%、40%、60%、80%または100%の比しか算出することができず、これらはいずれも予測される対立遺伝子の比には近づくことができないので、上記方法とは対照的である。この後者の場合、算出された対立遺伝子の比は、リードが不十分なので棄却しなければならないか、あるいは、不相応に重み付けされ、確率論的ノイズが決定に導入され、それにより、決定の正確度が低下する。ある実施形態では、個々の対立遺伝子測定を、独立した測定として処理することができ、この場合、同じ遺伝子座の対立遺伝子に対して行った測定間の関係が、異なる遺伝子座の対立遺伝子に対して行った測定間の関係と異ならない。 One reason why multiple determinations using methods involving the step of comparing observed allelic measurements to theoretical hypotheses corresponding to possible fetal genetic states may be more accurate. When measuring alleles using sequencing, this method is able to collect more information from the data from the alleles if the total number of reads is smaller than the other methods. For example, methods that rely on calculating and summing allele ratios result in disproportionately weighted probabilistic noise. For example, consider the case where alleles are measured using sequencing and there is a set of loci in which only 5 sequence reads are detected for each locus. In certain embodiments, for each of the alleles, the data can be compared to the assumed allele distribution and weighted according to the number of sequence reads, thus the data from these measurements are appropriately weighted and overall. Incorporated into a decision. This involves quantifying the ratio of alleles at the heterozygous locus, with possible allele ratios of 0%, 20%, 40%, 60%, 80% or 100%. In contrast to the above method, they can only be calculated and none of them can approach the expected allele ratio. In this latter case, the calculated allele ratio must be rejected because of insufficient reads, or it is disproportionately weighted and probabilistic noise is introduced into the decision, thereby the accuracy of the decision. Decreases. In one embodiment, individual allele measurements can be treated as independent measurements, in which case the relationship between measurements made for alleles at the same locus is for alleles at different loci. It does not differ from the relationship between the measurements made.

ある実施形態では、本明細書に開示されている方法は、任意のメトリックを、ダイソミーであることが予想される参照染色体において観察された対立遺伝子測定値と比較するステップ(RC法と称される)を包含せずに、観察された対立遺伝子測定値の分布により、正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。これは、疑わしい染色体から無作為に配列決定された断片の割合を、1個または複数個の推測ダイソミー参照染色体と比較して評価することによって異数性を検出する、ショットガン配列決定を用いる方法などの方法に対する有意な改善である。このRC法では、推測ダイソミー参照染色体が実際にはダイソミーではない場合、不正確な結果がもたらされる。これは、異数性が、単一染色体のトリソミーより実質的である場合、または胎児が三倍体であり、全ての常染色体がトリソミーである場合に起こり得る。雌性三倍体(69、XXX)胎児の場合には、実際は、ダイソミー染色体は全く存在しない。本明細書に記載の方法は、参照染色体を必要とせず、雌性三倍体胎児におけるトリソミー染色体を正確に同定することができる。染色体、仮説、子の割合(child fraction)およびノイズレベルのそれぞれについて、同時分布モデルを、参照染色体のデータ、全体的な子の割合の見積もりまたは固定された参照仮説のいずれも伴わずに適合させることができる。 In certain embodiments, the method disclosed herein is a step (referred to as the RC method) of comparing any metric with allelic measurements observed on a reference chromosome that is expected to be disomy. ) Is not included, but includes the step of determining whether the distribution of observed allelic measurements indicates a positive polyploid or aneuploid fetus. This is a method using shotgun sequencing, which detects aneuploidy by evaluating the proportion of randomly sequenced fragments from a suspicious chromosome compared to one or more inferred disomy reference chromosomes. It is a significant improvement over such methods. This RC method gives inaccurate results if the inferred disomy reference chromosome is not really disomy. This can occur if the aneuploidy is more substantive than the trisomy of a single chromosome, or if the fetus is triploid and all autosomal chromosomes are trisomy. In the case of female triploid (69, XXX) fetuses, in fact, there are no disomy chromosomes. The methods described herein do not require a reference chromosome and can accurately identify trisomy chromosomes in female triploid fetuses. For each of the chromosomes, hypotheses, child fractions and noise levels, the joint distribution model is fitted without any reference chromosome data, overall child proportion estimates or fixed reference hypotheses. be able to.

ある実施形態では、本明細書に開示されている方法は、観察されている多型遺伝子座における対立遺伝子分布をどのように使用して、先行技術の方法よりも高い正確度で胎児の倍数性状態を決定することができるかを実証している。ある実施形態では、前記方法は、標的化配列決定を用いて、複数のSNPにおける混合母体-胎児遺伝子型、および必要に応じて、母親の遺伝子型および/または父親の遺伝子型を得て、最初に異なる仮説の下での種々の予測される対立遺伝子頻度分布を確立すること、次いで、母体-胎児混合物において得られる定量的な対立遺伝子の情報を観察すること、および、どの仮説がデータに最もよく適合するかを評価することを用い、データに最もよく適合する仮説に対応する遺伝子の状態を正確な遺伝子の状態としてコールする。ある実施形態では、本明細書に開示されている方法は、コールされた遺伝子の状態が正確な遺伝子の状態であることの信頼度を生成するために、適合の程度も用いる。ある実施形態では、本明細書に開示されている方法は、親の状況が異なる遺伝子座に関して見いだされる対立遺伝子の分布を解析するアルゴリズムを使用するステップ、および異なる親の状況(異なる親の遺伝子型のパターン)についての、異なる倍数性状態について、観察された対立遺伝子分布を、予測される対立遺伝子分布と比較するステップを包含する。これは、母体-胎児混合試料中の各遺伝子座における各対立遺伝子の独立した事例の数を推定することができる方法を用いない方法とは異なり、それよりも改善されている。ある実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値の分布により、母親がヘテロ接合性である遺伝子座において測定された、観察された対立遺伝子分布を用いて、正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。これは、その特定の標的個体に対して情報価値が高いことが知られていない遺伝子座についてDNAが優先的に富化されていない場合、または優先的に富化されている場合、倍数性の決定において、配列データの集合から約2倍の遺伝子測定データを用いることが可能になり、それにより、より正確な決定がもたらされるので、母親がヘテロ接合性である遺伝子座における観察された対立遺伝子分布を用いない方法とは異なり、それよりも改善されている。 In certain embodiments, the methods disclosed herein use the allelic distribution at the observed polymorphic loci to be more accurate than prior art methods in fetal ploidy. Demonstrate whether the state can be determined. In certain embodiments, the method first obtains mixed maternal-fetal genotypes in multiple SNPs and, optionally, maternal and / or paternal genotypes using targeted sequencing. Establishing various predicted allogenotype frequency distributions under different hypotheses, then observing quantitative allogeneic information obtained in the maternal-fetal mixture, and which hypothesis is most in the data. Using assessing good fit, we call the state of the gene that corresponds to the hypothesis that best fits the data as the exact state of the gene. In certain embodiments, the methods disclosed herein also use the degree of fit to generate confidence that the state of the called gene is the correct state of the gene. In certain embodiments, the methods disclosed herein use an algorithm that analyzes the distribution of alleles found for different parental loci, and different parental situations (different parental genotypes). Includes the step of comparing the observed allelic distribution to the predicted allelic distribution for different multiple states). This is an improvement over the method without a method that can estimate the number of independent cases of each allele at each locus in a maternal-fetal mixed sample. In certain embodiments, the method disclosed herein uses the observed allelic distribution measured at a locus in which the mother is heterozygous, with the observed distribution of allelic measurements. Includes the steps to determine if a positive polyploid or aneuploid fetus is shown. This is a multiple if the DNA is not preferentially enriched or preferentially enriched for loci that are not known to be informative for that particular target individual. Observed alleles at loci where the mother is heterozygous, as it will be possible to use approximately twice as many gene measurement data from the set of sequence data in the determination, which will lead to more accurate determination. Unlike the non-distribution method, it is an improvement over it.

ある実施形態では、本明細書に開示されている方法は、天然では、各遺伝子座における対立遺伝子頻度が多項式(したがって、SNPが二対立遺伝子である場合は二項式)であると仮定する同時分布モデルを用いる。いくつかの実施形態では、同時分布モデルは、ベータ二項分布を使用する。各遺伝子座に存在する各対立遺伝子についての定量的尺度を提供する配列決定などの測定技法を用いる場合、二項モデルを、各遺伝子座に適用することができ、対立遺伝子頻度の基礎をなす程度およびその頻度の信頼度を確かめることができる。対立遺伝子の比から倍数性コールを生成する当技術分野で公知の方法または定量的な対立遺伝子情報が棄却される方法を用いて、観察された比の確実性を確かめることができない。当該方法は、特定の遺伝子座における対立遺伝子の比を算出し、次いでそれらの比を総計することを伴う任意の方法では、任意の所与の対立遺伝子または遺伝子座からのDNAの量を示す測定された強度または計数値がガウス様式で分布することを必ず仮定するので、対立遺伝子の比を算出し、それらの比を総計して倍数性コールを行う方法とは異なり、それよりも改善されている。本明細書に開示されている方法は、対立遺伝子の比を算出することを伴わない。いくつかの実施形態では、本明細書に開示されている方法は、複数の遺伝子座の各対立遺伝子の観察結果の数をモデルに組み入れるステップを包含し得る。いくつかの実施形態では、本明細書に開示されている方法は、予測される分布自体を算出するステップであって、それにより、対立遺伝子測定値のガウス分布を仮定するモデルのいずれよりも正確であり得る同時二項分布(joint binomial distribution)モデルを用いることが可能になるステップを包含し得る。二項分布モデルがガウス分布よりも有意に正確である尤度は、遺伝子座の数が増加するにつれて増大する。例えば、20未満の遺伝子座を調べる場合、二項分布モデルが有意にすぐれている尤度は低い。しかし、100超、または特に400超、または特に1,000超、または特に2,000超の遺伝子座を使用すると、二項分布モデルの、ガウス分布モデルよりも有意に正確である尤度は非常に高くなり、それにより、より正確な倍数性の決定がもたらされる。二項分布モデルがガウス分布よりも有意に正確である尤度は、同様に、各遺伝子座における観察結果の数が増加するにつれて増大する。例えば、各遺伝子座において10未満の別個の配列を観察する場合、二項分布モデルが有意にすぐれている尤度は低い。しかし、各遺伝子座について50超のシーケンスリード、または特に100超のシーケンスリード、または特に200超のシーケンスリード、または特に300超のシーケンスリードを使用すると、二項分布モデルの、ガウス分布モデルよりも有意に正確である尤度は非常に高くなり、それにより、より正確な倍数性の決定がもたらされる。 In certain embodiments, the methods disclosed herein naturally assume that the allele frequency at each locus is a polynomial (hence, a binomial if the SNP is a bi-allele). Use a distribution model. In some embodiments, the joint distribution model uses a beta-binomial distribution. When using measurement techniques such as sequencing that provide a quantitative measure for each allele present at each locus, a binomial model can be applied to each locus to the extent that it forms the basis of allele frequency. And the reliability of its frequency can be confirmed. It is not possible to ascertain the certainty of the observed ratio using methods known in the art for generating ploidy calls from allelic ratios or methods in which quantitative allelic information is rejected. The method calculates the ratio of alleles at a particular locus and then measures the amount of DNA from any given allele or locus in any method involving summing those ratios. It always assumes that the strengths or counts given are distributed in Gaussian fashion, so it is better than that, unlike the method of calculating allele ratios and summing those ratios to make a multiple call. There is. The methods disclosed herein do not involve calculating the ratio of alleles. In some embodiments, the methods disclosed herein may include incorporating into the model the number of observations of each allele at multiple loci. In some embodiments, the method disclosed herein is a step in calculating the predicted distribution itself, thereby being more accurate than any of the models that assume a Gaussian distribution of allelic measurements. It may include steps that make it possible to use a joint binomial distribution model that may be. The likelihood that the binomial distribution model is significantly more accurate than the Gaussian distribution increases as the number of loci increases. For example, when investigating loci less than 20, the likelihood that the binomial distribution model is significantly better is low. However, with more than 100, or especially more than 400, or especially more than 1,000, or especially more than 2,000 loci, the likelihood that the binomial distribution model is significantly more accurate than the Gaussian distribution model is very high. Higher, which leads to a more accurate ploidy determination. The likelihood that the binomial distribution model is significantly more accurate than the Gaussian distribution also increases as the number of observations at each locus increases. For example, when observing distinct sequences less than 10 at each locus, the binomial distribution model is less likely to be significantly better. However, using more than 50 sequence reads, especially more than 100 sequence reads, or especially more than 200 sequence reads, or especially more than 300 sequence reads for each locus, is better than the Gaussian distribution model of the binomial distribution model. The likelihood of being significantly accurate is very high, which leads to a more accurate multiple determination.

ある実施形態では、本明細書に開示されている方法では、配列決定を用いて、DNA試料中の各遺伝子座における各対立遺伝子の事例の数を測定する。シーケンシングリードのそれぞれは、特定の遺伝子座にマッピングし、バイナリーのシーケンスリードとして処理することができる、あるいは、リードおよび/またはマッピングの同一性の確率を、シーケンスリードの一部として組み入れることができ、その結果、確率的なシーケンスリード、すなわち所与の遺伝子座にマッピングされるシーケンスリードの推定の整数または分数がもたらされる。バイナリーの計数値または計数値の確率を使用すると、測定値の各集合について二項分布を用いることが可能であり、これにより、計数値の範囲の(around the number of counts)信頼区間を算出することが可能になる。二項分布を用いることができることにより、より正確な倍数性の推定およびより精度の高い信頼区間を算出することが可能になる。これは、存在する対立遺伝子の量を測定するために強度を用いる方法、例えば、マイクロアレイを用いる方法、または電気泳動のバンドにおいて蛍光性タグを付けたDNAの強度を測定するために蛍光リーダーを用いて測定を行う方法とは異なり、それよりも改善されている。 In certain embodiments, the methods disclosed herein use sequencing to measure the number of cases of each allele at each locus in a DNA sample. Each of the sequencing reads can be mapped to a particular locus and treated as a binary sequence read, or the probability of read and / or mapping identity can be incorporated as part of the sequence read. The result is a probabilistic sequence read, an estimated integer or fraction of the sequence read that maps to a given locus. Binomial distributions can be used for each set of measurements using a binary count value or the probability of the count value, thereby calculating the (around the number of counts) confidence interval for the range of count values. Will be possible. The ability to use the binomial distribution allows for more accurate ploidy estimation and more accurate confidence intervals. It uses a method that uses intensity to measure the amount of allelic genes present, such as a microarray, or a fluorescent reader to measure the intensity of fluorescently tagged DNA in the band of electrophoresis. Unlike the method of making measurements, it is better than that.

ある実施形態では、本明細書に開示されている方法では、本データの集合の態様を用いて、そのデータの集合についての推定される対立遺伝子頻度分布のパラメータを決定する。これは、本予測される対立遺伝子頻度分布または場合によっては予測される対立遺伝子の比のパラメータを設定するために、トレーニングデータ集合または事前データ集合を利用する方法よりも改善されている。これは、あらゆる遺伝子試料の収集および測定に関与する異なる状態の集合が存在することが原因であり、したがって、当該データの集合からのデータを使用して、その試料についての倍数性の決定に使用するためのものである同時分布モデルのパラメータを決定する方法がより正確になりやすい。 In certain embodiments, the methods disclosed herein use aspects of this set of data to determine the parameters of the estimated allele frequency distribution for that set of data. This is an improvement over the method of utilizing training data sets or prior data sets to set parameters for this predicted allele frequency distribution or, in some cases, predicted allele ratios. This is due to the existence of a set of different states involved in the collection and measurement of any genetic sample, and therefore the data from that set of data is used to determine the ploidy for that sample. The method of determining the parameters of the joint distribution model, which is intended to do so, tends to be more accurate.

ある実施形態では、本明細書に開示されている方法は、観察された対立遺伝子測定値の分布により、最尤法を用いて、正倍数性または異数体の胎児が示されるかどうかを決定するステップを包含する。最尤法を用いることは、得られる決定の正確度が有意に高いという点で、単一仮説棄却法を用いる方法とは異なり、それよりも有意に改善されている。1つの理由は、単一仮説棄却法では、2つの測定値分布ではなく、ただ1つの測定値分布に基づいてカットオフ閾値が設定される、つまり、閾値が通常は最適ではないことである。別の理由は、最尤法では、個々の試料の各々の特定の特性にかかわらず全ての試料に対して使用されるカットオフ閾値を決定するのではなく、個々の試料の各々についてカットオフ閾値を最適化することが可能になることである。別の理由は、最尤法を用いることにより、各倍数性コールについて信頼度を算出することが可能になることである。各コールに対して信頼度の算出を行うことができることにより、実践者が、どのコールが正確であるか、およびどれが誤りである可能性がより高いかを知ることが可能になる。いくつかの実施形態では、多種多様な方法を最尤推定法と組み合わせて、倍数性コールの正確度を増強することができる。ある実施形態では、最尤法を、米国特許第7,888,017号に記載の方法と組み合わせて用いることができる。ある実施形態では、最尤法を、標的PCR増幅を用いて混合試料中のDNAを増幅し、その後、リード計数方法、例えば、2011年10月のMontrealでのInternational Congress of Human Genetics 2011年において発表されたTANDEM DIAGNOSTICSを用いて配列決定し分析する方法と組み合わせて用いることができる。ある実施形態では、本明細書に開示されている方法は、混合試料中のDNAの胎児画分を推定するステップ、およびその推定値を用いて倍数性コールと倍数性コールの信頼度の両方を算出するステップを包含する。これは、推定される胎児画分を十分な胎児画分のスクリーニングとして用い、その後、胎児画分を考慮に入れず、コールについての信頼度の算出も生じない単一仮説棄却法を用いて倍数性コールを行う方法とは異なり、かつその方法とは区別されることに留意されたい。 In certain embodiments, the method disclosed herein uses the most probable method to determine whether the distribution of observed allelic measurements indicates a positive polyploid or aneuploid fetus. Including the steps to be taken. Using the maximum likelihood method is significantly improved, unlike the method using the single hypothesis rejection method, in that the accuracy of the decisions obtained is significantly higher. One reason is that in the single hypothesis rejection method, the cutoff threshold is set based on only one measurement distribution rather than two measurement distributions, that is, the thresholds are usually not optimal. Another reason is that the maximum likelihood method does not determine the cutoff threshold used for all samples regardless of their specific characteristics of each sample, but rather for each individual sample. Is to be possible to optimize. Another reason is that by using the maximum likelihood method, it is possible to calculate the reliability for each haploid call. Being able to calculate confidence for each call allows practitioners to know which calls are accurate and which are more likely to be incorrect. In some embodiments, a wide variety of methods can be combined with maximum likelihood estimation to increase the accuracy of haploid calls. In certain embodiments, the maximum likelihood method can be used in combination with the method described in US Pat. No. 7,888,017. In one embodiment, the most probable method is presented in a read counting method, eg, International Congress of Human Genetics 2011, at Montreal, October 2011, in which the DNA in the mixed sample is amplified using targeted PCR amplification. It can be used in combination with the method of sequencing and analyzing using the TANDEM DIAGNOSTICS. In certain embodiments, the methods disclosed herein include the steps of estimating the fetal fraction of DNA in a mixed sample, and the estimates used to provide both polyploid and polyploid call reliability. Includes steps to calculate. It is a multiple using a single hypothesis rejection method that uses the estimated fetal fraction as a sufficient fetal fraction screening and then does not take into account the fetal fraction and does not result in the calculation of confidence for the call. Note that it is different from and distinct from the method of making a sex call.

ある実施形態では、本明細書に開示されている方法は、各測定値に確率を付与することによってデータがノイズを伴い、エラーを含有する傾向を考慮に入れる。付与された確率的な推定値を伴う測定データを使用して立てられた仮説の集合から正確な仮説を選択するために最尤法を用いることにより、不正確な測定値が考慮に入れられない可能性が高くなり、倍数性コールを導く算出において正確な測定値が用いられる。より精度が高くあるために、この方法では、倍数性の決定において不正確に測定されたデータの影響を系統的に低下させる。これは、全てのデータが同等に正確であると仮定される方法または範囲外のデータが倍数性コールを導く算出から任意に排除される方法よりも改善されている。チャネル比測定値を用いる現行の方法は、個々のSNPチャネル比を平均することによってこの方法を多数のSNPに拡張することを主張する。SNPの質および観察されたリード深度に基づいて予測される測定値の分散によって個々のSNPに重み付けをしないことにより、生じた統計量の正確度が低下し、その結果、倍数性コールの正確度が、特に境界の場合に有意に低下する。 In certain embodiments, the methods disclosed herein take into account the tendency of the data to be noisy and error-containing by imparting probabilities to each measurement. Inaccurate measurements are not taken into account by using the maximum likelihood method to select the correct hypothesis from the set of hypotheses made using the measured data with the given probabilistic estimates. It is more likely that accurate measurements will be used in the calculations that lead to multiple calls. Due to its higher accuracy, this method systematically reduces the effect of inaccurately measured data in determining ploidy. This is an improvement over the method in which all data are assumed to be equally accurate or where out-of-range data is arbitrarily excluded from calculations leading to haploid calls. Current methods using channel ratio measurements claim to extend this method to a large number of SNPs by averaging individual SNP channel ratios. By not weighting individual SNPs by the variance of the measurements predicted based on the quality of the SNPs and the observed read depth, the resulting statistics are less accurate, resulting in multiple call accuracy. However, it is significantly reduced, especially at the boundary.

ある実施形態では、本明細書に開示されている方法は、胎児においてどのSNPまたは他の多型遺伝子座がヘテロ接合性であるかの知見を前提としない。この方法により、父系の遺伝子型の情報が入手不可能である場合に倍数性コールを行うことが可能になる。これは、標的とする遺伝子座を適切に選択するため、または混合胎児DNA/母系DNA試料に対して得た遺伝子測定値を解釈するために、どのSNPがヘテロ接合性であるかの知見が前もって知られていなければならない方法よりも改善されている。 In certain embodiments, the methods disclosed herein do not presuppose a finding of which SNP or other polymorphic locus is heterozygous in the fetus. This method makes it possible to make polyploid calls when paternal genotype information is not available. This is a priori finding of which SNPs are heterozygous for proper selection of target loci or for interpreting gene measurements obtained for mixed fetal DNA / maternal DNA samples. It is an improvement over the method that must be known.

本明細書に記載の方法は、利用可能なDNAが少量である試料、または胎児DNAのパーセントが低い試料に対して用いる場合に特に有利である。これは、少量のDNAしか利用可能でない場合に生じる、対立遺伝子ドロップアウト率が相応して高いこと、および/または胎児DNAと母系DNAの混合試料中の胎児DNAのパーセントが低い場合に胎児の対立遺伝子ドロップアウト率が相応して高いことに起因する。対立遺伝子ドロップアウト率が高いこと、つまり、標的個体について、対立遺伝子の大部分が測定されなかったことにより、不十分に正確な胎児画分の算出、および不十分に正確な倍数性の決定がもたらされる。本明細書に開示されている方法は、SNP間の遺伝様式における連鎖を考慮に入れた同時分布モデルを用いることができるので、有意により正確な倍数性の決定を行うことができる。本明細書に記載の方法により、混合物中の胎児性のDNA分子のパーセントが40%未満、30%未満、20%未満、10%未満、8%未満、さらには6%未満である場合に、正確な倍数性の決定を行うことが可能になる。 The methods described herein are particularly advantageous when used for samples with a small amount of available DNA or with a low percentage of fetal DNA. This occurs when the allele dropout rate is correspondingly high when only a small amount of DNA is available, and / or when the percentage of fetal DNA in the mixed sample of fetal DNA and maternal DNA is low. This is due to the correspondingly high gene dropout rate. The high allele dropout rate, that is, the lack of measurement of most of the alleles for the target individual, resulted in inadequately accurate fetal fraction calculations and inadequately accurate ploidy determinations. Brought to you. The methods disclosed herein can use joint distribution models that take into account linkages in the mode of inheritance between SNPs, allowing for significantly more accurate ploidy determinations. When the percentage of fetal DNA molecules in the mixture is less than 40%, less than 30%, less than 20%, less than 10%, less than 8%, and even less than 6% by the methods described herein. It will be possible to make accurate ploidy determinations.

ある実施形態では、個体のDNAが関連する個体のDNAと混在している場合の測定値に基づいて個体の倍数性状態を決定することが可能である。ある実施形態では、DNAの混合物は、母系の血漿中に見いだされる浮動性DNAであり、これは、既知の核型および既知の遺伝子型を有する母親由来のDNAを含んでもよく、また、未知の核型および未知の遺伝子型を有する胎児DNAと混在してもよい。一方の親または両親からの既知の遺伝子型の情報を用いて、混合試料中のDNAの複数の潜在的な遺伝子の状態を、異なる倍数性状態、各親から胎児への異なる染色体の寄与、および必要に応じて、混合物中の異なる胎児DNAの割合について予測することが可能である。潜在的な組成のそれぞれは、仮説と称することができる。次いで、胎児の倍数性状態を、実際の測定値について調べ、観察されたデータを考慮してどの潜在的な組成が最も可能性が高いかを決定することによって決定することができる。 In certain embodiments, it is possible to determine the ploidy state of an individual based on measurements when the individual's DNA is mixed with the associated individual's DNA. In certain embodiments, the DNA mixture is a floating DNA found in maternal plasma, which may include DNA from a mother with a known karyotype and a known genotype, and is unknown. It may be mixed with fetal DNA having karyotype and unknown genotype. Using information on known genotypes from one parent or parents, the state of multiple potential genes of DNA in a mixed sample, different ploidy states, different chromosomal contributions from each parent to the fetus, and If desired, it is possible to predict the proportion of different fetal DNA in the mixture. Each of the potential compositions can be referred to as a hypothesis. The ploidy state of the fetus can then be determined by examining the actual measurements and taking into account the observed data to determine which potential composition is most likely.

上記の点のさらなる考察は、本文書の他の箇所に見いだすことができる。 Further consideration of the above points can be found elsewhere in this document.

非侵襲的な出生前診断(NPD)
非侵襲的な出生前診断のプロセスは、いくつものステップを伴う。ステップのいくつかとしては、(1)胎児から遺伝物質を得るステップと、(2)混合試料中に存在する可能性がある胎児の遺伝物質をエクスビボで富化するステップと、(3)遺伝物質をエクスビボで増幅するステップと、(4)遺伝物質の特定の遺伝子座をエクスビボで優先的に富化するステップと、(5)遺伝物質をエクスビボで測定するステップと、(6)遺伝子型データを、エクスビボで、コンピュータで分析するステップとを挙げることができる。これらの6つおよび他の関連性のあるステップの実施を減少させるための方法が本明細書に記載されている。前記方法のステップの少なくとも一部は、直接体には適用されない。ある実施形態では、本開示は、体から単離され、分離された組織および他の生物材料に適用される処置および診断の方法に関する。前記方法のステップの少なくとも一部は、コンピュータで実行される。
Non-invasive prenatal diagnosis (NPD)
The non-invasive prenatal diagnosis process involves several steps. Some of the steps include (1) obtaining the genetic material from the fetus, (2) enriching the genetic material of the fetus that may be present in the mixed sample with Exvivo, and (3) the genetic material. Steps to amplify with Exvivo, (4) Steps to preferentially enrich specific loci of genetic material with Exvivo, (5) Steps to measure genetic material with Exvivo, and (6) Genetic type data. , Exvivo, can be mentioned as a step of computer analysis. Methods for reducing the implementation of these six and other related steps are described herein. At least some of the steps in the method do not apply directly to the body. In certain embodiments, the present disclosure relates to methods of treatment and diagnosis applied to tissues and other biological materials isolated and isolated from the body. At least some of the steps in the method are performed on a computer.

本開示のいくつかの実施形態により、臨床医は母親が妊娠中の胎児の遺伝子の状態を非侵襲的に決定することが可能になり、それにより、胎児の遺伝物質を採取することによって乳児の健康が危険にさらされることがなく、また、母親が侵襲的手順を受ける必要がない。さらに、ある特定の態様では、本開示により、胎児の遺伝子の状態を、高い正確度、例えば、出生前ケアに広く用いられているトリプルテストの、非侵襲的な母系の血清分析物に基づくスクリーニングよりも有意に高い正確度で決定することが可能になる。 Some embodiments of the present disclosure allow the clinician to non-invasively determine the genetic status of the fetus during pregnancy, thereby allowing the infant to collect genetic material from the fetus. Health is not compromised and the mother does not have to undergo invasive procedures. In addition, in certain embodiments, the present disclosure screens the genetic status of the fetus with high accuracy, eg, a triple test, non-invasive maternal serum analysis that is widely used in prenatal care. It will be possible to determine with significantly higher accuracy than.

本明細書に開示されている方法の正確度が高いことは、本明細書に記載の、遺伝子型データを分析するためのインフォマティクス手法の結果である。現代の技術的な進歩により、ハイスループット配列決定および遺伝子型決定アレイなどの方法を用いて遺伝子試料から大量の遺伝子情報を測定することができるようになった。本明細書に開示されている方法により、臨床医は利用可能な大量のデータをより大きく活用すること、および胎児の遺伝子の状態のより正確な診断を行うことが可能になる。いくつもの実施形態の詳細が下に示されている。異なる実施形態は、上述のステップの異なる組み合わせを包含し得る。異なるステップの異なる実施形態の種々の組み合わせを互換的に用いることができる。 The high accuracy of the methods disclosed herein is the result of the informatics techniques described herein for analyzing genotype data. Modern technological advances have made it possible to measure large amounts of genetic information from genetic samples using methods such as high-throughput sequencing and genotyping arrays. The methods disclosed herein allow clinicians to make greater use of the large amount of data available and to make more accurate diagnoses of fetal genetic status. Details of a number of embodiments are shown below. Different embodiments may include different combinations of steps described above. Various combinations of different embodiments of different steps can be used interchangeably.

ある実施形態では、妊娠中の母親から血液試料を取得し、母体起源のDNA、および胎児起源のDNAの両方の混合物を含有する母親の血液の血漿中の浮動性DNAを単離し、胎児の倍数性状態を決定するために使用する。ある実施形態では、本明細書に開示されている方法は、多型対立遺伝子に対応するDNAの混合物中のDNA配列を、対立遺伝子の比および/または対立遺伝子分布が、富化に際してほとんど変わらないままであるように、優先的に富化するステップを包含する。ある実施形態では、本明細書に開示されている方法は、生じた分子の非常に高い百分率が、標的の遺伝子座に対応するように、非常に効率的な標的PCRに基づく増幅を伴う。ある実施形態では、本明細書に開示されている方法は、母体起源のDNA、および胎児起源のDNAの両方を含有するDNAの混合物について配列決定するステップを包含する。ある実施形態では、本明細書に開示されている方法は、測定された対立遺伝子分布を用いて、母親が妊娠中の胎児の倍数性状態を決定するステップを包含する。ある実施形態では、本明細書に開示されている方法は、決定された倍数性状態を臨床医に報告するステップを包含する。ある実施形態では、本明細書に開示されている方法は、臨床的措置をとるステップ、例えば、絨毛膜絨毛採取または羊水穿刺の侵襲的検査の経過観察を実施するステップ、トリソミーの個体の誕生の準備をするステップ、またはトリソミーの胎児の選択的中絶を包含する。 In one embodiment, a blood sample is taken from a pregnant mother and floating DNA in the plasma of the mother's blood containing a mixture of both maternal and fetal origin DNA is isolated and is a multiple of the fetus. Used to determine sexual status. In certain embodiments, the methods disclosed herein show little change in the DNA sequence in the mixture of DNA corresponding to the polymorphic allele, the allele ratio and / or the allele distribution upon enrichment. As it is, it includes the steps of preferential enrichment. In certain embodiments, the methods disclosed herein involve highly efficient target PCR-based amplification such that a very high percentage of the resulting molecule corresponds to the target locus. In certain embodiments, the methods disclosed herein include sequencing a mixture of DNA containing both maternal and fetal origin DNA. In certain embodiments, the methods disclosed herein include the step of using the measured allelic distribution to determine the ploidy state of the fetus in which the mother is pregnant. In certain embodiments, the methods disclosed herein include the step of reporting the determined ploidy status to the clinician. In certain embodiments, the methods disclosed herein are steps of taking clinical measures, such as performing follow-up of invasive villus collection or amniocentesis invasive examination, the birth of an individual of trisomy. Includes steps to prepare, or selective abortion of a trisomy fetus.

本出願は、2006年11月28日出願の米国実用新案出願第11/603,406号(米国特許出願公開第:20070184467);2008年3月17日出願の米国実用新案出願第12/076,348号(米国特許出願公開第:20080243398);2009年8月4日出願のPCT出願第PCT/US09/52730号(PCT公開第WO/2010/017214号);2010年9月30日出願のPCT出願第PCT/US10/050824号(PCT公開第WO/2011/041485号)、2011年5月18日出願の米国実用新案出願第13/110,685号、および2012年10月3日出願のPCT出願第PCT/US12/58578号を参照する。これらの特許は、その全体が参照により本明細書に組み込まれる。本出願において使用される語彙のいくつかは、これらの参考文献にその前例を有し得る。本明細書に記載の概念のいくつかは、これらの参考文献に見いだされる概念に照らして、よりよく理解することができる。 This application is filed in US Practical New Application No. 11 / 603,406 filed on November 28, 2006 (US Patent Application Publication No. 20070184467); US Practical New Application Application No. 12/076 filed on March 17, 2008, 348 (US Patent Application Publication No. 20080243398); PCT Application No. PCT / US09 / 52730 filed August 4, 2009 (PCT Publication No. WO / 2010/017214); PCT filed September 30, 2010 Application No. PCT / US10 / 050824 (PCT Publication No. WO / 2011/041485), US Practical New Application Nos. 13 / 110,685 filed May 18, 2011, and PCT filed October 3, 2012. See application No. PCT / US12 / 58578. These patents are incorporated herein by reference in their entirety. Some of the vocabularies used in this application may have their precedents in these references. Some of the concepts described herein can be better understood in the light of the concepts found in these references.

浮動性胎児DNAを含む母系の血液のスクリーニング
本明細書に記載の方法を用いて、標的の遺伝物質が、ある量の他の遺伝物質の存在下で見いだされる、子、胎児または他の標的個体の遺伝子型の決定を補助することができる。いくつかの実施形態では、遺伝子型とは、1個または複数個の染色体の倍数性状態を指してもよく、1つまたは複数の疾患連鎖対立遺伝子またはそのいくつかの組み合わせを指してもよい。本開示では、考察は、胎児DNAが母系の血液中に見いだされる場合に胎児の遺伝子の状態を決定することに焦点が当てられるが、この例は、この方法を適用することができる可能性のある状況に限定することを示していない。さらに、前記方法は、標的DNAの量が非標的DNAに対していかなる割合で存在する場合にも適用可能であり、例えば、標的DNAは、存在するDNAの0.000001%から99.999999%の間のいずれを構成してもよい。さらに、非標的DNAは、関連性のある非標的個体(複数可)の一部または全部からの遺伝子データが既知である限りは、必ずしも1つの個体由来である必要はなく、さらには関連する個体由来である必要はない。ある実施形態では、本明細書に開示されている方法を用いて、胎児DNAを含有する母系の血液から胎児の遺伝子型データを決定することができる。前記方法は、妊娠中の女性の子宮内に複数の胎児がいる場合、または他の混入DNA、例えば、他の既に生まれている同胞由来のDNAが試料に存在する可能性がある場合にも用いることができる。
Screening of Maternal Blood Containing Floating Fetal DNA Using the methods described herein, a target genetic material is found in the presence of a certain amount of other genetic material, offspring, fetus or other target individual. Can assist in determining the genotype of. In some embodiments, genotype may refer to a polyploid state of one or more chromosomes, or may refer to one or more disease chain alleles or some combination thereof. In this disclosure, the discussion is focused on determining the genetic status of the fetus when fetal DNA is found in the blood of the maternal line, but this example may be applicable to this method. It does not indicate that it is limited to a certain situation. Further, the method is applicable when the amount of target DNA is present in any proportion to the non-target DNA, for example, the target DNA is 0.000001% to 99.999999% of the present DNA. Any of the spaces may be configured. Furthermore, the non-target DNA does not necessarily have to be derived from one individual, as long as genetic data from some or all of the relevant non-target individuals (s) are known, and even related individuals. It does not have to be of origin. In certain embodiments, the methods disclosed herein can be used to determine fetal genotype data from maternal blood containing fetal DNA. The method is also used when there are multiple fetuses in the womb of a pregnant woman, or when other contaminated DNA, such as DNA from other already born sibs, may be present in the sample. be able to.

この技法は、胎児の血液細胞が胎盤絨毛を通じて母系の循環に進入する現象を用いることができる。普通は、胎児の細胞の非常に少数のみが、このように母系の循環に入る(胎児母体間出血についてのKleihauer-Betke検査で陽性になるには不十分である)。胎児の細胞を選別し、さまざまな技法によって解析して特定のDNA配列を探すことができるが、侵襲的手順が本質的に有するリスクは伴わない。この技法は、問題の胎盤組織が胎児と同じ遺伝子型のDNAを含有する場合、胎盤組織のアポトーシス後のDNA放出によって浮動性胎児DNAが母系の循環に進入する現象も用いることができる。母系の血漿中に見いだされる浮動性DNAは、30~40%の胎児DNAと同程度の割合で胎児DNAを含有することが示されている。 This technique can use the phenomenon of fetal blood cells entering the maternal circulation through placental villi. Normally, only a very small number of fetal cells enter the maternal circulation in this way (not enough to be positive on the Kleihauer-Betke test for intermaternal hemorrhage). Fetal cells can be screened and analyzed by a variety of techniques to find specific DNA sequences, but without the inherent risks of invasive procedures. This technique can also be used when the placental tissue in question contains DNA of the same genotype as the fetus, and the floating fetal DNA enters the maternal circulation due to DNA release after the placental tissue apoptosis. Floating DNA found in maternal plasma has been shown to contain fetal DNA in proportions comparable to 30-40% fetal DNA.

ある実施形態では、血液を妊娠中の女性から抜き取ることができる。研究により、母系の血液は、母体起源の浮動性DNAに加えて、胎児由来の少量の浮動性DNAを含有し得ることが示された。さらに、母体起源の多くの血液細胞に加えて、胎児起源のDNAを含む脱核胎児血液細胞も存在してよく、これは、一般には、核DNAを含有しない。胎児DNAを単離するまたは胎児DNAが富化された画分を作製するための当技術分野で公知の多くの方法が存在する。例えば、クロマトグラフィーにより、胎児DNAが富化された特定の画分が作製されることが示されている。 In certain embodiments, blood can be drawn from a pregnant woman. Studies have shown that maternal blood can contain small amounts of fetal-derived floating DNA in addition to maternal-derived floating DNA. Furthermore, in addition to many blood cells of maternal origin, there may also be enucleated fetal blood cells containing DNA of fetal origin, which generally does not contain nuclear DNA. There are many methods known in the art for isolating fetal DNA or producing fractions enriched with fetal DNA. For example, chromatography has been shown to produce specific fractions enriched with fetal DNA.

比較的非侵襲的に抜き取られ、ある量の胎児DNAを、細胞性または浮動性のいずれかで、その母系DNAに対する割合に富化されて、またはその元の比率のいずれかで含有する母系の血液、血漿または他の体液の試料を手にしたら、前記試料中に見いだされるDNAの遺伝子型を決定することができる。いくつかの実施形態では、血液は、血液を静脈、例えば、尺側皮静脈から回収するための針を使用して抜き取ることができる。本明細書に記載の方法を用いて、胎児の遺伝子型データを決定することができる。例えば、前記方法を用いて、1個または複数個の染色体における倍数性状態を決定することができ、前記方法を用いて、挿入、欠失、および転座を含め、1つのSNPまたはSNPの集合の同一性を決定することができる。前記方法を用いて、1個または複数個の遺伝子型の形体の起源である親を含めた1個または複数個のハプロタイプを決定することができる。 A maternal line that is relatively non-invasively extracted and contains a certain amount of fetal DNA, either cellular or floating, enriched in proportion to its maternal DNA, or in its original proportion. Once you have a sample of blood, plasma or other body fluid, you can genotype the DNA found in the sample. In some embodiments, blood can be withdrawn using a needle for collecting blood from a vein, eg, the basilic vein. The methods described herein can be used to determine fetal genotype data. For example, the method can be used to determine polyploid states in one or more chromosomes, and the method can be used to include a single SNP or set of SNPs, including insertions, deletions, and translocations. Can determine the identity of. The method can be used to determine one or more haplotypes, including the parent from which the form of one or more genotypes originated.

この方法は、任意の遺伝子型決定および/または配列決定方法、例えば、ILLUMINA INFINIUM ARRAYプラットフォーム、AFFYMETRIX GENECHIP、ILLUMINA GENOME ANALYZERまたはLIFE TECHNOLGIES’ SOLID SYSTEMに使用することができる任意の核酸を用いて機能する点に留意されたい。これは、血漿から抽出された浮動性DNAまたはその増幅物(例えば、全ゲノム増幅、PCR);他の細胞型(例えば、全血由来のヒトリンパ球)由来のゲノムDNAまたはその増幅物を含む。DNAを調製するために、これらのプラットフォームのうちの1つに適したゲノムDNAを生成する任意の抽出または精製方法も同様に機能する。この方法は、RNAの試料を用いて同等に良好に機能し得る。ある実施形態では、試料の保管は、分解が最小限になるように行ない得る(例えば、約-20℃またはそれよりも低い温度で凍結下)。 This method uses any nucleic acid that can be used for any genotyping and / or sequencing method, eg, ILLUMINA INFINIUM ARRAY platform, AFFYMETRIX GENECHIP, ILLUMINA GENOME ANALYZER or LIFE TECHNOLGIES'SOLID SYSTEM. Please note. This includes floating DNA extracted from plasma or an amplification thereof (eg, whole genome amplification, PCR); genomic DNA from other cell types (eg, human lymphocytes from whole blood) or a amplification thereof. For preparing DNA, any extraction or purification method that produces genomic DNA suitable for one of these platforms will work as well. This method can work equally well with RNA samples. In certain embodiments, storage of the sample may be performed with minimal degradation (eg, under freezing at a temperature of about −20 ° C. or lower).

親支援
いくつかの実施形態は、PARENTAL SUPPORT(商標)(PS)法と組み合わせて用いることができ、PARENTAL SUPPORT(商標)(PS)法の複数の実施形態は、その全体が参照により本明細書に組み込まれる、米国特許出願第11/603,406号(米国特許出願公開第20070184467号)、米国特許出願第12/076,348号(米国特許出願公開第20080243398号)、米国特許出願第13/110,685号、PCT出願第PCT/US09/52730号(PCT公開第WO/2010/017214号)、およびPCT出願第PCT/US10/050824号(PCT公開第WO/2011/041485号)に記載されている。これらの特許は、その全体が参照により本明細書に組み込まれる。PARENTAL SUPPORT(商標)は、遺伝子データを解析するために使用することができる、インフォマティクスに基づく手法である。いくつかの実施形態では、本明細書に開示されている方法は、PARENTAL SUPPORT(商標)法の一部とみなすことができる。いくつかの実施形態では、PARENTAL SUPPORT(商標)法は、標的個体の遺伝子データを高い正確度で、その個体由来の1つまたは少数の細胞の遺伝子データ、または標的個体由来のDNAおよび1個または複数個の他の個体由来のDNAからなるDNAの混合物の遺伝子データを決定するため、詳細には、標的個体における疾患関連対立遺伝子、他の対象の対立遺伝子、および/または1個または複数個の染色体の倍数性状態を決定するために使用することができる方法の集合である。PARENTAL SUPPORT(商標)とは、これらの方法のいずれも指し得る。PARENTAL SUPPORT(商標)は、インフォマティクスに基づく方法の例である。PARENTAL SUPPORT(商標)法の代表的実施形態は、図29~31Gに図示され、また、実験19に記載されている。
Parental Assistance Some embodiments may be used in combination with the PARENTAL SUPPORT ™ (PS) method, and the plurality of embodiments of the PARENTAL SUPPORT ™ (PS) method are herein by reference in their entirety. US Patent Application No. 11 / 603,406 (US Patent Application Publication No. 20070184467), US Patent Application No. 12 / 076,348 (US Patent Application Publication No. 20080243398), US Patent Application No. 13 / 110,685, PCT Application No. PCT / US09 / 52730 (PCT Publication No. WO / 2010/017214), and PCT Application No. PCT / US10 / 050824 (PCT Publication No. WO / 2011/041485). ing. These patents are incorporated herein by reference in their entirety. PARENTAL SUPPORT ™ is an informatics-based technique that can be used to analyze genetic data. In some embodiments, the methods disclosed herein can be considered part of the PARENTAL SUPPORT ™ method. In some embodiments, the PARENTAL SUPPORT ™ method provides the genetic data of a target individual with high accuracy, the genetic data of one or a few cells from that individual, or the DNA and one or more from the target individual. To determine genetic data for a mixture of DNA consisting of DNA from multiple other individuals, in particular, disease-related alleles in the target individual, alleles of other subjects, and / or one or more. A set of methods that can be used to determine the polymorphic state of a chromosome. PARENTAL SUPPORT ™ can refer to any of these methods. PARENTAL SUPPORT ™ is an example of an informatics-based method. Representative embodiments of the PARENTAL SUPPORT ™ method are illustrated in FIGS. 29-31G and described in Experiment 19.

PARENTAL SUPPORT(商標)法では、既知の親の遺伝子データ、すなわち母親および/または父親のハプロタイプおよび/または二倍体の遺伝子データを、減数分裂の機構および標的DNAの不完全な測定、および場合によっては1つまたは複数の関連する個体の知見と共に、集団に基づく乗換え頻度と一緒に、インシリコで、複数の対立遺伝子における遺伝子型、および/または胚または任意の標的細胞(複数可)の倍数性状態、および重要な遺伝子座に対して位置を決める標的DNAを高い程度の信頼度で再構築するために使用する。PARENTAL SUPPORT(商標)法により、不十分に測定された一塩基多型(SNP)だけでなく、挿入および欠失、ならびに全く測定されなかったSNPまたはDNAの全領域も再構築することができる。さらに、PARENTAL SUPPORT(商標)法により、単一細胞から、複数の疾患連鎖遺伝子座の測定ならびに異数性についてのスクリーニングの両方を行うことができる。いくつかの実施形態では、PARENTAL SUPPORT(商標)法を用いて、1個または複数個の細胞の遺伝子の状態を決定するために、IVFサイクルの間に生検された胚由来の1個または複数個の細胞を特徴付けることができる。 In the PARENTAL SUPPORT ™ method, known parental genetic data, ie, maternal and / or paternal haplotype and / or diploid genetic data, is used for incomplete measurement of meiosis mechanism and target DNA, and optionally. With the findings of one or more related individuals, along with population-based crossover frequency, genotypes in multiple allelic genes and / or polyploid states of the embryo or any target cell (s). , And target DNA locating for important genotypes is used to reconstruct with a high degree of confidence. The PARENTAL SUPPORT ™ method can reconstruct not only poorly measured single nucleotide polymorphisms (SNPs), but also insertions and deletions, as well as all regions of SNPs or DNA that have not been measured at all. In addition, the PARENTAL SUPPORT ™ method allows both measurement of multiple disease chain loci and screening for aneuploidy from a single cell. In some embodiments, one or more embryo-derived embryos biopsied during the IVF cycle to determine the genetic status of one or more cells using the PARENTAL SUPPORT ™ method. Individual cells can be characterized.

PARENTAL SUPPORT(商標)法により、ノイズを伴う遺伝子データをクリーニングすることが可能になる。これは、関連する個体(親)の遺伝子型を参照として用いて、標的ゲノム(胚)における正確な遺伝子の対立遺伝子を推定することによって行ない得る。PARENTAL SUPPORT(商標)は、少量の遺伝物質しか利用可能でない場合(例えば、PGD)、および遺伝物質の量が限られていることに起因して遺伝子型の直接的な測定が本質的にノイズを伴う場合に特に適し得る。PARENTAL SUPPORT(商標)は、利用可能な遺伝物質のごく一部のみが標的個体由来である場合(例えば、NPD)、および別の個体由来の混入DNAシグナルに起因して遺伝子型の直接的な測定が本質的にノイズを伴う場合に特に適し得る。PARENTAL SUPPORT(商標)法により、従来の順序づけられていない二倍体測定値は対立遺伝子のドロップアウト、ドロップイン、可変性の増幅の偏りおよび他のエラーの率が高いことによって特徴付けることができるが、胚上に非常に正確な規則正しい二倍体の対立遺伝子配列を、染色体セグメントのコピー数と共に再構築することができる。前記方法では、基礎をなす遺伝子モデルおよび基礎をなす測定エラーのモデルの両方を使用することができる。遺伝子モデルにより、各SNPにおける対立遺伝子の確率およびSNP間の乗換え確率の両方を決定することができる。対立遺伝子の確率は、各SNPにおいて親から得られたデータに基づいてモデリングすることができ、International HapMap Projectにより開発されたHapMapデータベースから得られたデータに基づいてSNP間の乗換え確率をモデリングすることができる。適切な基礎をなす遺伝子モデルおよび測定エラーモデルを考慮すると、最大事後(MAP)推定を、計算的に効率的にするための改変を伴って用いて、正確な、胚の各SNPにおける規則正しい対立遺伝子値を推定することができる。 The PARENTAL SUPPORT ™ method makes it possible to clean genetic data with noise. This can be done by estimating the exact gene allele in the target genome (embryo) using the genotype of the relevant individual (parent) as a reference. PARENTAL SUPPORT ™ is inherently noisy when only small amounts of genetic material are available (eg, PGD) and due to the limited amount of genetic material, direct genotyping is inherently noisy. May be particularly suitable when accompanied. PARENTAL SUPPORT ™ is a direct measurement of genotype when only a small portion of the available genetic material is from the target individual (eg, NPD) and due to contaminated DNA signals from another individual. May be particularly suitable when is inherently noisy. Although the PARENTAL SUPPORT ™ method allows traditional unordered diploid measurements to be characterized by high rates of allele dropouts, drop-ins, variability amplification bias and other errors. A very accurate and regular diploid allelic sequence can be reconstructed on the embryo, along with the number of copies of the chromosomal segment. Both the underlying genetic model and the underlying measurement error model can be used in the method. The genetic model can determine both the probability of alleles in each SNP and the probability of crossover between SNPs. Allele probabilities can be modeled based on data obtained from parents at each SNP, and modeling transfer probabilities between SNPs based on data obtained from the HapMap database developed by the International HapMap Project. Can be done. Given the appropriate underlying genetic and measurement error models, maximal posterior (MAP) estimation is used with modifications to make it computationally efficient, accurate, and regular alleles in each embryonic SNP. The value can be estimated.

上で概説した技法により、いくつかの場合には、個体の遺伝子型を、その個体に由来する非常に少量のDNAを考慮して決定することができる。これは、1つまたは少数の細胞由来のDNAであってよい、または、母系の血液中に見いだされる少量の胎児DNA由来であってよい。 The techniques outlined above can, in some cases, determine the genotype of an individual, taking into account very small amounts of DNA from that individual. It may be DNA from one or a few cells, or it may be from a small amount of fetal DNA found in maternal blood.

仮説
本開示との関連において、仮説とは、可能性のある遺伝子の状態を指す。仮説とは、可能性のある倍数性状態を指し得る。仮説とは、可能性のある対立遺伝子の状態を指し得る。仮説の集合とは、可能性のある遺伝子の状態の集合、可能性のある対立遺伝子の状態の集合、可能性のある倍数性状態の集合、またはそれらの組み合わせを指し得る。いくつかの実施形態では、仮説の集合は、集合からの1つの仮説が、任意の所与の個体の実際の遺伝子の状態に対応するように設計することができる。いくつかの実施形態では、仮説の集合は、あらゆる可能性のある遺伝子の状態が、集合からの少なくとも1つの仮説によって記載することができるように設計することができる。本開示のいくつかの実施形態では、方法の一態様は、どの仮説が問題の個体の実際の遺伝子の状態に対応するかを決定することである。
Hypothesis In the context of this disclosure, a hypothesis refers to a possible genetic state. A hypothesis can refer to a possible ploidic state. A hypothesis can refer to a possible allelic state. A set of hypotheses can refer to a set of possible genetic states, a set of possible allelic states, a set of possible ploidic states, or a combination thereof. In some embodiments, a set of hypotheses can be designed such that one hypothesis from the set corresponds to the actual genetic state of any given individual. In some embodiments, a set of hypotheses can be designed such that the state of any possible gene can be described by at least one hypothesis from the set. In some embodiments of the present disclosure, one aspect of the method is to determine which hypothesis corresponds to the actual genetic state of the individual in question.

本開示の別の実施形態では、1つのステップは仮説を作製するステップを包含する。いくつかの実施形態では、仮説は、コピー数仮説であってよい。いくつかの実施形態では、仮説は、関連する個体のそれぞれ由来のどの染色体のセグメントが、もしあれば、他の関連する個体のどのセグメントに遺伝的に対応するかに関する仮説を包含する。仮説を作製することとは、変数の限度を、考慮中の可能性のある遺伝子の状態の全集合がそれらの変数に包含されるように設定する行為を指し得る。 In another embodiment of the present disclosure, one step comprises the step of making a hypothesis. In some embodiments, the hypothesis may be a copy number hypothesis. In some embodiments, the hypothesis includes a hypothesis as to which segment of the chromosome from each of the related individuals, if any, genetically corresponds to which segment of the other related individual. Creating a hypothesis can refer to the act of setting the limits of a variable so that the complete set of genetic states that may be under consideration is included in those variables.

「コピー数仮説」は、「倍数性仮説」または「倍数性状態仮説」とも称され、標的個体における所与の染色体コピー、染色体型または染色体のセクションについての可能性のある倍数性状態に関する仮説を指し得る。これは、個体の2種以上の染色体型における倍数性状態を指す場合もある。コピー数仮説の集合とは、仮説の集合を指してもよく、各仮説は、個体における可能性のある異なる倍数性状態に対応する。仮説の集合は、可能性のある倍数性状態の集合、可能性のある親のハプロタイプの寄与の集合、混合試料中の可能性のある胎児DNAの百分率の集合、またはそれらの組み合わせに関するものであってもよい。 The "copy number hypothesis", also known as the "haploid hypothesis" or "haploid state hypothesis," is a hypothesis about a possible haploid state for a given chromosomal copy, chromosomal type, or section of a chromosome in a target individual. Can point. This may refer to a ploidic state in two or more chromosomal types of an individual. The set of copy number hypotheses may refer to a set of hypotheses, where each hypothesis corresponds to possible different ploidic states in the individual. The set of hypotheses concerns a set of possible ploidy states, a set of possible parental haplotype contributions, a set of possible fetal DNA percentages in a mixed sample, or a combination thereof. You may.

正常な個体は、各親由来の各染色体型のうちの1つを含有する。しかし、減数分裂および有糸分裂におけるエラーに起因して、個体が、各親由来の所与の染色体型を0個、1個、2個、またはそれより多くを有する可能性がある。実際には、親由来の所与の染色体が3つ以上認められることはまれである。本開示では、いくつかの実施形態では、所与の染色体の0コピー、1コピーまたは2コピーが親に由来する、可能性のある仮説のみを考慮し、親を起源とするいくらか可能性のあるコピーを考慮することは自明の拡張である。いくつかの実施形態では、所与の染色体に対して、可能性のある仮説が9つある:母体起源の0個の染色体、1個の染色体または2個の染色体に関する3つの可能性のある仮説に父系起源の0個の染色体、1個の染色体または2個の染色体に関する3つの可能性のある仮説を掛け合わせたもの。(m,f)を、mが母親から遺伝によって受け継がれた所与の染色体の数であり、およびfが父親から遺伝によって受け継がれた所与の染色体の数である仮説を指すものとする。したがって、9つの仮説は、(0、0)、(0、1)、(0、2)、(1、0)、(1、1)、(1、2)、(2、0)、(2、1)、および(2、2)である。これらは、H00、H01、H02、H10、H12、H20、H21、およびH22と記載することもできる。.異なる仮説は、異なる倍数性状態に対応する。例えば、(1、1)とは、通常のダイソミー染色体を指し、(2、1)とは、母系トリソミーを指し、(0、1)とは、父系モノソミーを指す。いくつかの実施形態では、2つの染色体が一方の親から遺伝によって受け継がれ、1つの染色体が他方の親から遺伝によって受け継がれる場合は、2つの場合にさらに分けられ得る:2つの染色体が同一である場合(一致コピーエラー)と、2つの染色体が相同であるが同一ではない場合(不一致コピーエラー)。これらの実施形態では、可能性のある仮説が16ある。他の仮説の集合、および異なる数の仮説を使用することが可能であることが理解されるべきである。 A normal individual contains one of each chromosomal type from each parent. However, due to errors in meiosis and mitosis, an individual may have 0, 1, 2, or more of a given chromosomal type from each parent. In practice, it is rare to find more than one given parental chromosome. The present disclosure considers only possible hypotheses that, in some embodiments, 0, 1 or 2 copies of a given chromosome are of parental origin, and there is some possibility of parental origin. Considering copying is a self-evident extension. In some embodiments, there are nine possible hypotheses for a given chromosome: 0 chromosomes of maternal origin, 3 possible hypotheses for 1 or 2 chromosomes. Multiplied by three possible hypotheses about zero chromosomes of paternal origin, one chromosome or two chromosomes. Let (m, f) refer to the hypothesis that m is the number of given chromosomes inherited from the mother and f is the number of given chromosomes inherited from the father. Therefore, the nine hypotheses are (0,0), (0,1), (0,2), (1,0), (1,1), (1,2), (2,0), ( 2, 1), and (2, 2). These can also be described as H 00 , H 01 , H 02 , H 10 , H 12 , H 20 , H 21 and H 22 . .. Different hypotheses correspond to different ploidic states. For example, (1, 1) refers to a normal disomy chromosome, (2, 1) refers to maternal trisomy, and (0, 1) refers to paternal monosomy. In some embodiments, if two chromosomes are inherited from one parent and one chromosome is inherited from the other parent, it can be further divided into two cases: the two chromosomes are identical. In some cases (matched copy error) and when the two chromosomes are homologous but not identical (mismatched copy error). In these embodiments, there are 16 possible hypotheses. It should be understood that it is possible to use a set of other hypotheses, and a different number of hypotheses.

本開示のいくつかの実施形態では、倍数性仮説とは、他の関連する個体由来の染色体のいずれが、標的個体のゲノムに見いだされる染色体に対応するかに関する仮説を指す。いくつかの実施形態では、方法の鍵となるのは、関連する個体がハプロタイプブロックを共有することが予測され得るという事実であり、関連する個体から測定された遺伝子データを、どのハプロタイプブロックが標的個体と関連する個体との間で一致するかの知見と一緒に用いると、標的個体の遺伝子測定値を単独で用いるよりも高い信頼度で標的個体についての正確な遺伝子データを推論することが可能である。従って、いくつかの実施形態では、倍数性仮説は、染色体の数だけでなく、関連する個体のどの染色体が、標的個体の1個または複数個の染色体と同一またはほぼ同一であるかに関し得る。 In some embodiments of the present disclosure, the ploidy hypothesis refers to the hypothesis as to which of the chromosomes from other related individuals corresponds to the chromosome found in the genome of the target individual. In some embodiments, the key to the method is the fact that related individuals can be expected to share a haplotype block, which haplotype block targets genetic data measured from the relevant individual. When used in conjunction with the finding of agreement between an individual and a related individual, it is possible to infer accurate genetic data for the target individual with higher reliability than using the genetic measurements of the target individual alone. Is. Thus, in some embodiments, the ploidy hypothesis may relate not only to the number of chromosomes, but also to which chromosomes of the associated individual are identical or nearly identical to one or more chromosomes of the target individual.

仮説の集合が定義されたら、アルゴリズムが入力遺伝子データに対して作動すると、考慮中の仮説のそれぞれについて、決定された統計学的な確率が出力され得る。種々の仮説の確率は、種々の仮説のそれぞれについて、専門技法、アルゴリズム、および/または本開示の他の箇所に記載されている方法のうちの1つまたは複数により示された確率が等しい値を、関連性のある遺伝子データを入力として用いて数学的に算出することによって決定することができる。 Once the set of hypotheses has been defined, when the algorithm operates on the input genetic data, a determined statistical probability can be output for each of the hypotheses under consideration. The probabilities of the various hypotheses are such that for each of the various hypotheses, the probabilities indicated by one or more of the techniques, algorithms, and / or methods described elsewhere in this disclosure are equal. , Can be determined by mathematical calculation using relevant genetic data as input.

複数の技法によって決定された通り、異なる仮説の確率が推定されたら、それらを組み合わせることができる。これは、各仮説について、各技法によって決定された確率を掛け算することを必要とし得る。仮説の確率の積を正規化することができる。1つの倍数性仮説は、染色体についての1つの可能性のある倍数性状態を指す。 Once the probabilities of different hypotheses have been estimated, as determined by multiple techniques, they can be combined. This may require multiplying each hypothesis by the probabilities determined by each technique. The product of hypothetical probabilities can be normalized. One ploidy hypothesis refers to one possible ploidy state for a chromosome.

「確率の組み合わせ」プロセスは、「仮説の組み合わせ」または専門技法の結果の組み合わせとも称され、線形代数の当業者によく知られているはずの概念である。1つの可能性のある確率の組み合わせ方は以下の通りである:専門技法を用いて、遺伝子データの集合を考慮して仮説の集合を評価する場合、方法の出力は、仮説の集合内の各仮説と1対1で関連する確率の集合である。そのそれぞれが集合内の仮説のうちの1つと関連づけられる、第1の専門技法によって決定された確率の集合を、そのそれぞれが同じ仮説の集合と関連づけられる、第2の専門技法によって決定された確率の集合と組み合わせる場合、確率の2つの集合を掛け算する。これは、集合内の各仮説について、2つの専門方法によって決定された、その仮説と関連づけられる2つの確率を掛け合わせ、対応する積が出力確率であることを意味する。このプロセスは、任意の数の専門技法に拡大することができる。ただ1つの専門技法を用いる場合、出力確率は入力確率と同じである。3つ以上の専門技法を用いる場合、関連性のある確率を同時に掛け算することができる。積は、仮説の集合内の仮説の確率が合計で100%になるように正規化することができる。 The "combination of probabilities" process, also referred to as the "combination of hypotheses" or the combination of the results of specialized techniques, is a concept that should be familiar to those skilled in the art of linear algebra. One possible combination of probabilities is as follows: When using specialized techniques to evaluate a set of hypotheses considering a set of genetic data, the output of the method is each in the set of hypotheses. It is a set of probabilities that are one-to-one related to the hypothesis. A set of probabilities determined by a first technician, each associated with one of the hypotheses in the set, with a probability determined by a second technician, each associated with the same set of hypotheses. When combined with a set of, multiply by two sets of probabilities. This means that for each hypothesis in the set, the two probabilities associated with that hypothesis, determined by two specialized methods, are multiplied and the corresponding product is the output probability. This process can be extended to any number of specialized techniques. When using only one technique, the output probability is the same as the input probability. When using three or more specialized techniques, related probabilities can be multiplied at the same time. The product can be normalized so that the probabilities of the hypotheses in the set of hypotheses are 100% in total.

いくつかの実施形態では、所与の仮説についての複合確率が他の仮説のいずれかについての複合確率を超える場合、その仮説が、最も可能性が高いと決定されるとみなすことができる。いくつかの実施形態では、正規化された確率が閾値を超えた場合、仮説を、最も可能性が高いと決定することができ、倍数性状態または他の遺伝子の状態をコールすることができる。ある実施形態では、これは、その仮説に関連づけられる染色体の数および同一性を、倍数性状態としてコールすることができることを意味し得る。ある実施形態では、これは、その仮説に関連づけられる対立遺伝子の同一性を、対立遺伝子の状態としてコールすることができることを意味し得る。いくつかの実施形態では、閾値は、約50%から約80%の間であり得る。いくつかの実施形態では、閾値は、約80%から約90%の間であり得る。いくつかの実施形態では、閾値は、約90%から約95%の間であり得る。いくつかの実施形態では、閾値は、約95%から約99%の間であり得る。いくつかの実施形態では、閾値は、約99%から約99.9%の間であり得る。いくつかの実施形態では、閾値は、約99.9%超であり得る。 In some embodiments, if the compound probability for a given hypothesis exceeds the compound probability for any of the other hypotheses, then that hypothesis can be considered to be determined to be most likely. In some embodiments, if the normalized probability exceeds a threshold, the hypothesis can be determined to be most likely, and a polyploid state or the state of another gene can be called. In certain embodiments, this can mean that the number and identity of chromosomes associated with that hypothesis can be called as a haploid state. In certain embodiments, this can mean that the allelic identity associated with that hypothesis can be called as the allelic state. In some embodiments, the threshold can be between about 50% and about 80%. In some embodiments, the threshold can be between about 80% and about 90%. In some embodiments, the threshold can be between about 90% and about 95%. In some embodiments, the threshold can be between about 95% and about 99%. In some embodiments, the threshold can be between about 99% and about 99.9%. In some embodiments, the threshold can be greater than about 99.9%.

親の状況
親の状況とは、標的の2体の親の一方または両方についての、2つの関連性のある染色体のそれぞれの所与の対立遺伝子の遺伝子の状態を指す。ある実施形態では、親の状況とは、標的の対立遺伝子の状態を指すのではなく、親の対立遺伝子の状態を指すことに留意されたい。所与のSNPについての親の状況は、父系の2つと母系の2つの、4塩基対からなってよく、これらは互いに同じであってよい、または異なってよい。「m|f」と書くことが一般的であり、ここでmおよびmは、2つの母系染色体上の所与のSNPの遺伝子の状態であり、fおよびfは2つの父系染色体上の所与のSNPの遺伝子の状態である。いくつかの実施形態では、親の状況は、「f|m」と書くことができる。下付き文字の「1」および「2」は、第1の染色体および第2の染色体の所与の対立遺伝子における遺伝子型を示すことに留意されたい。どの染色体を「1」とし、どの染色体を「2」とするかの選択は任意であることにも留意されたい。
Parental status Parental status refers to the genetic status of each given allele of two related chromosomes for one or both of the two targeted parents. Note that in certain embodiments, the parental situation does not refer to the state of the target allele, but to the state of the parental allele. The parental situation for a given SNP may consist of two paternal and two maternal four base pairs, which may be the same as or different from each other. It is common to write "m 1 m 2 | f 1 f 2 ", where m 1 and m 2 are the genetic states of a given SNP on two maternal chromosomes, f 1 and f. 2 is the genetic state of a given SNP on two paternal chromosomes. In some embodiments, the parental situation can be written as "f 1 f 2 | m 1 m 2 ". Note that the subscripts "1" and "2" indicate genotypes in a given allele of the first and second chromosomes. It should also be noted that the choice of which chromosome is "1" and which chromosome is "2" is optional.

本開示では、塩基対の同一性を一般的に示すために、多くの場合、AおよびBを使用することに留意されたい;AまたはBは、C(シトシン)、G(グアニン)、A(アデニン)またはT(チミン)を同等に上手く示すことができる。例えば、所与のSNPに基づく対立遺伝子において、母親の遺伝子型が1つの染色体上のそのSNPにおいてTであり、相同染色体上のそのSNPにおいてGであり、その対立遺伝子における父親の遺伝子型が、相同染色体の両方のそのSNPにおいてGであった場合、標的個体の対立遺伝子が親の状況AB|BBを有するということができ、対立遺伝子が親の状況AB|AAを有するということもできる。理論上、4種の可能性のあるヌクレオチドはいずれも所与の対立遺伝子に存在してもよく、したがって、例えば、所与の対立遺伝子において母親が遺伝子型ATを有し、父親が遺伝子型GCを有する可能性があることに留意されたい。しかし、経験的なデータにより、ほとんどの場合、所与の対立遺伝子において4種の可能性のある塩基対のうち2種のみが観察されることが示されている。例えば、単一のタンデム反復を用いた場合、2超、4超、さらには10超の親の状況を有する可能性がある。本開示の考察では、所与の対立遺伝子において2種の可能性のある塩基対のみが観察されると仮定するが、本明細書に開示されている実施形態は、この仮定が当てはまらない場合を考慮に入れるように改変することができる。 It should be noted in this disclosure that A and B are often used to generally indicate base pair identity; A or B is C (cytosine), G (guanine), A ( Adenine) or T (thymine) can be shown equally well. For example, in an allele based on a given SNP, the mother's genotype is T at that SNP on one chromosome, G at that SNP on a homologous gene, and the father's genotype at that allele. If both of the homologous chromosomes are G in that SNP, then the allele of the target individual can be said to have the parental status AB | BB, and the allele can also be said to have the parental status AB | AA. In theory, all four possible nucleotides may be present in a given allele, thus, for example, in a given allele, the mother has genotype AT and the father has genotype GC. Please note that you may have. However, empirical data show that in most cases only two of the four possible base pairs are observed in a given allele. For example, when using a single tandem repeat, it is possible to have more than two, more than four, and even more than ten parental situations. The discussion of this disclosure assumes that only two possible base pairs are observed in a given allele, but the embodiments disclosed herein assume that this assumption does not apply. It can be modified to take into account.

「親の状況」とは、同じ親の状況を有する標的SNPの集合またはサブセットを指し得る。例えば、標的個体の所与の染色体上の1000個の対立遺伝子を測定する場合、状況AA|BBとは、標的の母親の遺伝子型がホモ接合性であり、標的の父親の遺伝子型がホモ接合性であるが、その遺伝子座における母系の遺伝子型と父系の遺伝子型が同様でない、1,000個の対立遺伝子群内の全ての対立遺伝子の集合を示し得る。親のデータについて相が特定されない、したがって、AB=BAである場合は、可能性のある親の状況は9ある:AA|AA、AA|AB、AA|BB、AB|AA、AB|AB、AB|BB、BB|AA、BB|AB、およびBB|BB。親のデータについて相が特定される、したがって、AB≠BAである場合は、可能性のある異なる親の状況が16ある:AA|AA、AA|AB、AA|BA、AA|BB、AB|AA、AB|AB、AB|BA、AB|BB、BA|AA、BA|AB、BA|BA、BA|BB、BB|AA、BB|AB、BB|BA、およびBB|BB。性染色体上の一部のSNPを除いて、染色体上のあらゆるSNP対立遺伝子が、これらの親の状況のうちの1つを有する。一方の親についての親の状況がヘテロ接合性であるSNPの集合は、ヘテロ接合性の状況と称することができる。 A "parental situation" can refer to a set or subset of target SNPs that have the same parental situation. For example, when measuring 1000 allogens on a given chromosome of a target individual, situation AA | BB means that the genotype of the target mother is homozygous and the genotype of the target father is homozygous. It may indicate a set of all allelic genes within a group of 1,000 allelic genes that are sex but not similar in maternal and paternal genotypes at that locus. If no phase is specified for the parental data, and therefore AB = BA, there are nine possible parental situations: AA | AA, AA | AB, AA | BB, AB | AA, AB | AB, AB | BB, BB | AA, BB | AB, and BB | BB. If the phase is specified for the parental data, and therefore AB ≠ BA, then there are 16 possible different parental situations: AA | AA, AA | AB, AA | BA, AA | BB, AB | AA, AB | AB, AB | BA, AB | BB, BA | AA, BA | AB, BA | BA, BA | BB, BB | AA, BB | AB, BB | BA, and BB | BB. All SNP alleles on the chromosome, with the exception of some SNPs on the sex chromosome, have one of these parental situations. A set of SNPs in which the parental situation for one parent is heterozygous can be referred to as the heterozygous situation.

NPDにおける親の状況の使用
非侵襲的な出生前診断は、非侵襲的に、例えば、妊娠中の母親に対する採血によって得られる遺伝物質から胎児の遺伝子の状態を決定するために用いることができる重要な技法である。血液を分離し、血漿単離し、その後血漿DNAを単離することができる。サイズ選択を用いて、適切な長さのDNAを単離することができる。DNAを遺伝子座の集合において優先的に富化することができる。次いで、このDNAを、遺伝子型決定アレイにハイブリダイズさせ、蛍光を測定することによって、またはハイスループットシーケンサーでシークエンシングによる、いくつもの手段によって測定することができる。
Use of Parental Situation in NPD Non-invasive prenatal diagnosis can be used non-invasively, eg, to determine the genetic status of a fetus from genetic material obtained by drawing blood to a pregnant mother. Technique. Blood can be separated, plasma isolated, and then plasma DNA isolated. Size selection can be used to isolate DNA of appropriate length. DNA can be preferentially enriched in a set of loci. The DNA can then be hybridized to a genotyping array and measured by a number of means, either by measuring fluorescence or by sequencing on a high throughput sequencer.

非侵襲的な出生前診断との関連において胎児の倍数性コールのために配列決定を使用する場合、配列データを使用するいくつもの方法がある。配列データを使用することができる最も一般的な方法は、単に所与の染色体にマッピングされるリード数をカウントすることである。例えば、胎児の第21染色体の倍数性状態を決定しようとすると考える。さらに、試料中のDNAの10%が胎児起源のDNAで構成され、90%が母体起源のDNAで構成されると考える。この場合、ダイソミーであることが予測され得る染色体、例えば、第3染色体のリードの平均の数を調べ、それを、リードを独特の配列の一部である染色体上の塩基対の数について調整した第21染色体上のリード数と比較する。胎児が正倍数性であった場合、ゲノムの単位当たりのDNAの量は全ての場所においてほぼ同等であることが予想される(確率的変動を受けやすい)。他方では、胎児が第21染色体においてトリソミーであった場合、第21染色体由来の遺伝単位当たりのDNAがゲノムの他の場所よりもわずかに多いことが予想される。詳細には、混合物中の第21染色体由来のDNAが約5%多いことが予想される。配列決定を使用してDNAを測定する場合、独特のセグメント当たりの第21染色体由来の独自にマッピング可能なリードが他の染色体由来のものよりも約5%多いことが予想される。ある特定の閾値よりも多い量の特定の染色体由来のDNAの観察を、その染色体に独自にマッピング可能な配列の数について調整した場合に、異数性を診断するための基礎として使用することができる。異数性を検出するために使用することができる別の方法は、親の状況を考慮に入れることができること以外は上記のものと同様である。 When using sequencing for fetal ploidy calls in the context of non-invasive prenatal diagnosis, there are several ways to use sequence data. The most common method in which sequence data can be used is simply to count the number of reads mapped to a given chromosome. For example, consider trying to determine the ploidy state of the fetal chromosome 21. Furthermore, it is considered that 10% of the DNA in the sample is composed of fetal origin DNA and 90% is composed of maternal origin DNA. In this case, we examined the average number of reads on chromosomes that could be predicted to be disomy, eg, chromosome 3, and adjusted the reads for the number of base pairs on the chromosomes that were part of the unique sequence. Compare with the number of reads on chromosome 21. If the fetus was positive polyploid, the amount of DNA per unit of the genome is expected to be about the same everywhere (susceptible to stochastic variability). On the other hand, if the fetus was trisomy on chromosome 21, it is expected that there will be slightly more DNA per genetic unit from chromosome 21 than elsewhere in the genome. Specifically, it is expected that the mixture will be about 5% more DNA from chromosome 21. When measuring DNA using sequencing, it is expected that there will be approximately 5% more uniquely mapable reads from chromosome 21 per unique segment than those from other chromosomes. Observations of DNA from a particular chromosome in an amount greater than a certain threshold can be used as the basis for diagnosing aneuploidy when adjusted for the number of sequences that can be uniquely mapped to that chromosome. can. Another method that can be used to detect aneuploidy is similar to that described above, except that the parental situation can be taken into account.

どの対立遺伝子を標的とするかを考える際、一部の親の状況が、他よりも情報価値がある可能性がある尤度を考慮に入れることができる。例えば、AA|BBおよび対称の状況BB|AAでは、胎児が母親とは異なる対立遺伝子を保有することが既知であるので、最も情報価値のある状況である。対称性の理由で、AA|BB状況とBB|AA状況はどちらもAA|BBと称することができる。情報価値のある親の状況の別の集合はAA|ABおよびBB|ABであり、これは、これらの場合、胎児が、母親が有さない対立遺伝子を保有する見込みが50%であるからである。対称性の理由で、AA|AB状況とBB|AB状況はどちらも、AA|ABと称することができる。情報価値のある親の状況の第3の集合はAB|AAおよびAB|BBであり、これは、これらの場合、胎児が既知の父系対立遺伝子を保有し、その対立遺伝子が母系ゲノムにも存在するからである。対称性の理由で、AB|AA状況とAB|BB状況は、AB|AAと称することができる。第4の親の状況はAB|ABであり、ここでは胎児は未知の対立遺伝子の状態を有し、対立遺伝子の状態がいかなるものでも、それは、母親が同じ対立遺伝子を有するものである。第5の親の状況はAA|AAであり、ここでは母親および父親がヘテロ接合性である。 When considering which allele to target, the likelihood that some parental situations may be more informative than others can be taken into account. For example, the AA | BB and symmetric situations BB | AA are the most informative situations as it is known that the fetus carries a different allele than the mother. For reasons of symmetry, both the AA | BB situation and the BB | AA situation can be referred to as AA | BB. Another set of informative parental situations is AA | AB and BB | AB, because in these cases the fetus is 50% likely to carry an allele that the mother does not have. be. For reasons of symmetry, both the AA | AB situation and the BB | AB situation can be referred to as AA | AB. The third set of informative parental situations is AB | AA and AB | BB, which in these cases the fetus carries a known paternal allele, which is also present in the maternal genome. Because it does. For reasons of symmetry, the AB | AA situation and the AB | BB situation can be referred to as AB | AA. The fourth parental situation is AB | AB, where the fetus has an unknown allele state, whatever the allele state is, that the mother has the same allele. The fifth parental situation is AA | AA, where the mother and father are heterozygous.

ここで開示されている実施形態の異なる実行
標的個体の倍数性状態を決定するための方法が本明細書に開示されている。標的個体は、割球、胚または胎児であってよい。本開示のいくつかの実施形態では、標的個体における1個または複数個の染色体の倍数性状態を決定するための方法は、本文書に記載のステップのいずれか、およびそれらの組み合わせを包含し得る:
Methods for determining the ploidy state of different execution target individuals disclosed herein are disclosed herein. The target individual may be a blastomere, embryo or fetus. In some embodiments of the present disclosure, the method for determining the ploidy state of one or more chromosomes in a target individual may include any of the steps described herein, or a combination thereof. :

いくつかの実施形態では、胎児の遺伝子の状態を決定することにおいて使用する遺伝物質の供給源は、母系の血液から単離された胎児有核赤血球などの胎児の細胞であってよい。前記方法は、妊娠中の母親由来の血液試料を得るステップを包含し得る。前記方法は、視覚的な技法を用いて、色の特定の組み合わせは有核赤血球と独自に関連づけられ、色の同様の組み合わせは母系の血液中に存在する任意の他の細胞には関連づけられないというアイデアに基づいて胎児の赤血球を単離するステップを包含し得る。有核赤血球に関連づけられる色の組み合わせは、染色することによってより区別可能にすることができる核の周りのヘモグロビンの赤色、および、例えば青色に染色することができる核材料の色を含んでよい。母系の血液から細胞を単離し、それをスライドに広げ、次いで、赤色(ヘモグロビン由来)と青色(核材料由来)の両方が認められる点を同定することにより、有核赤血球の場所を同定することが可能となり得る。次いで、これらの有核赤血球を、マイクロマニピュレーターを使用して抽出し、遺伝子型決定および/または配列決定技法を用いて、これらの細胞の遺伝物質の遺伝子型の態様を測定することができる。 In some embodiments, the source of the genetic material used in determining the genetic status of the fetus may be fetal cells such as fetal nucleated red blood cells isolated from maternal blood. The method may include the step of obtaining a blood sample from a pregnant mother. The method uses a visual technique to uniquely associate a particular combination of colors with nucleated red blood cells and not a similar combination of colors with any other cell present in the blood of the maternal line. It may include the step of isolating fetal erythrocytes based on the idea. The color combinations associated with nucleated red blood cells may include the red color of hemoglobin around the nucleus, which can be made more distinguishable by staining, and the color of the nuclear material, which can be stained, for example, blue. Identifying the location of nucleated red blood cells by isolating cells from maternal blood, spreading them on slides, and then identifying the presence of both red (from hemoglobin) and blue (from nuclear material). Can be possible. These nucleated red blood cells can then be extracted using a micromanipulator and genotyping and / or sequencing techniques can be used to determine the genotyping aspect of the genetic material of these cells.

ある実施形態では、胎児のヘモグロビンの存在下でのみ蛍光を発し、母系のヘモグロビンの存在下では蛍光を発しない色素を用いて有核赤血球を染色し、したがって、有核赤血球が、母親に由来するかまたは胎児に由来するかの多義性を除くことができる。本開示のいくつかの実施形態は、染色または他の方法で核材料に印をつけることを伴ってよい。本開示のいくつかの実施形態は、胎児の細胞に特異的な抗体を使用して胎児核材料に特異的に印をつけることを伴ってよい。 In certain embodiments, nucleated red blood cells are stained with a dye that fluoresces only in the presence of fetal hemoglobin and does not fluoresce in the presence of maternal hemoglobin, thus the nucleated red blood cells are derived from the mother. The ambiguity of whether it is derived from the fetus or from the fetus can be excluded. Some embodiments of the present disclosure may involve marking the nuclear material by staining or other methods. Some embodiments of the present disclosure may involve specifically marking fetal nuclear material with an antibody specific for fetal cells.

胎児の細胞を母系の血液から単離するため、または胎児DNAを母系の血液から単離するため、または母系遺伝物質の存在下で胎児の遺伝物質の試料を富化するための多くの方法がある。これらの方法のいくつかがここに列挙されているが、これは網羅的な列挙を意図したものではない。便宜上、一部の適切な技法がここに列挙されている:蛍光で、または別の方法でタグを付けた抗体、サイズ排除クロマトグラフィー、磁気で、または他の方法で標識したアフィニティータグ、後成的な差異、例えば、特定の対立遺伝子における母系の細胞と胎児の細胞の間の示差的なメチル化、密度勾配遠心分離に続くCD45/14枯渇およびCD45/14陰性細胞からのCD71陽性選択、異なる重量オスモル濃度を用いた一重または二重のPercoll勾配またはガラクトース特異的レクチン法。 There are many ways to isolate fetal cells from maternal blood, or to isolate fetal DNA from maternal blood, or to enrich a sample of fetal genetic material in the presence of maternal genetic material. be. Some of these methods are listed here, but this is not intended to be an exhaustive list. For convenience, some suitable techniques are listed here: antibodies tagged by fluorescence or otherwise, size exclusion chromatography, magnetic or otherwise labeled affinity tags, posterior. Differences, eg, differential methylation between maternal and fetal cells in a particular allelic gene, CD45 / 14 depletion following density gradient centrifugation and CD71 positive selection from CD45 / 14 negative cells, different. Single or double Percoll gradient or galactose-specific lectin method with weight osmol concentration.

本開示のある実施形態では、標的個体は胎児であり、胎児由来の複数のDNA試料に対して異なる遺伝子型測定を行う。本開示のいくつかの実施形態では、胎児DNA試料は単離された胎児の細胞由来であり、その胎児の細胞は、母系の細胞と混在している可能性がある。本開示のいくつかの実施形態では、胎児DNA試料は浮動性胎児DNA由来であり、その胎児DNAは、浮動性母系DNAと混在している可能性がある。いくつかの実施形態では、胎児DNA試料は、母系DNAと胎児DNAの混合物を含有する母系の血漿または母系の血液から得ることができる。いくつかの実施形態では、胎児DNAは、母系DNAと、99.9:0.1%~99:1%;99:1%~90:10%;90:10%~80:20%;80:20%~70:30%;70:30%~50:50%;50:50%~10:90%;または10:90%~1:99%;1:99%~0.1:99.9%、の範囲の母体:胎児比で混在している可能性がある。 In one embodiment of the present disclosure, the target individual is a fetus and different genotyping is performed on a plurality of fetal-derived DNA samples. In some embodiments of the present disclosure, the fetal DNA sample is derived from isolated fetal cells, which may be mixed with maternal cells. In some embodiments of the present disclosure, the fetal DNA sample is derived from floating fetal DNA, which may be mixed with floating maternal DNA. In some embodiments, the fetal DNA sample can be obtained from maternal plasma or maternal blood containing a mixture of maternal DNA and fetal DNA. In some embodiments, the fetal DNA is 99.9: 0.1% to 99: 1%; 99: 1% to 90:10%; 90: 10% to 80: 20%; 80 with the maternal DNA. : 20% to 70:30%; 70:30% to 50:50%; 50:50% to 10:90%; or 10:90% to 1:99%; 1:99% to 0.1:99 Maternal: fetus ratio in the range of 9.9% may be mixed.

標的個体および/または関連する個体の遺伝子データは、これらに限定されないが、遺伝子型決定マイクロアレイ、およびハイスループット配列決定を含めた群から選択されるツールおよび、または技法を用いて適切な遺伝物質を測定することによって、分子的状態から電子的状態に変換することができる。いくつかのハイスループット配列決定方法としては、サンガーDNA配列決定、パイロシークエンシング、ILLUMINA SOLEXAプラットフォーム、ILLUMINAのGENOME ANALYZERまたはAPPLIED BIOSYSTEMの454配列決定プラットフォーム、HELICOSのTRUE SINGLE MOLECULE SEQUENCINGプラットフォーム、HALCYON MOLECULARの電子顕微鏡配列決定法または任意の他の配列決定法が挙げられる。これらの方法は全て、DNAの試料に保存されている遺伝子データを、一般には、途中でメモリデバイスに保存されて加工される遺伝子データの集合に物理的に変換する。 Genetic data for target individuals and / or related individuals is not limited to these, but using tools and / or techniques selected from the group including genotyping microarrays and high-throughput sequencing to determine the appropriate genetic material. By measuring, it is possible to convert from a molecular state to an electronic state. Some high-throughput sequencing methods include Sanger DNA sequencing, pyrosequencing, ILLUMINA SOLEXA platform, ILLUMINA GENOME ANALYZER or APPLIED BIOSYSTEM 454 sequencing platform, HELICOS TRUE SINGLE MOLECULE SEQUEL Sequencing methods or any other sequencing method can be mentioned. All of these methods physically convert the genetic data stored in the DNA sample into a set of genetic data that is generally stored and processed in a memory device along the way.

関連性のある個体の遺伝子データは、これらに限定されないが、個体のバルク二倍体組織、個体由来の1個または複数個の二倍体細胞、個体由来の1個または複数個の一倍体細胞、標的個体由来の1個または複数個の割球、個体において見いだされる細胞外遺伝物質、母系の血液中に見いだされる個体由来の細胞外遺伝物質、母系の血液中に見いだされる個体由来の細胞、関連する個体由来の配偶子(複数可)から作製される1個または複数個の胚、そのような胚から取得した1個または複数個の割球、関連する個体において見いだされる細胞外遺伝物質、関連する個体を起源とすることが既知である遺伝物質、およびそれらの組み合わせを含めた群から選択される物質を分析することによって測定することができる。 Genetic data for relevant individuals is not limited to these, but is limited to bulk diploid tissue of the individual, one or more diploid cells from the individual, one or more diploids from the individual. Cells, one or more blastomeres from a target individual, extracellular genetic material found in an individual, extracellular genetic material from an individual found in maternal blood, cells from an individual found in maternal blood , One or more embryos made from gametes (s) from related individuals, one or more blastomeres obtained from such embryos, extracellular genetic material found in related individuals , Genetic substances known to originate from related individuals, and substances selected from the group including combinations thereof can be measured.

いくつかの実施形態では、標的個体の対象の染色体型のそれぞれについて、少なくとも1つの倍数性状態仮説の集合を作製することができる。倍数性状態仮説はそれぞれ、標的個体の染色体または染色体セグメントの1つの可能性のある倍数性状態を指し得る。仮説の集合は、標的個体の染色体が有すると予測することができる、可能性のある倍数性状態の一部または全部を含んでよい。可能性のある倍数性状態のいくつかは、零染色体性、モノソミー、ダイソミー、片親性ダイソミー、正倍数性、トリソミー、一致トリソミー、不一致トリソミー、母系トリソミー、父系トリソミー、テトラソミー、平衡(2:2)テトラソミー、不平衡(3:1)テトラソミー、ペンタソミー、ヘキサソミー、他の異数性、およびそれらの組み合わせを含んでよい。これらの異数性状態はいずれも、混在していてよい、または、部分的な異数性、例えば、不平衡転座、平衡転座、ロバートソン転座、組換え、欠失、挿入、乗換え、およびそれらの組み合わせであってよい。 In some embodiments, it is possible to generate at least one set of polyploid state hypotheses for each of the target chromosomal types of the target individual. Each ploidy state hypothesis can refer to one possible ploidy state of a target individual's chromosome or chromosomal segment. The set of hypotheses may include some or all of the possible ploidic states that can be predicted to be possessed by the chromosomes of the target individual. Some of the possible polyploid states are zero-chromosomal, monosomy, aneuploidy, uniparental disomy, positive ploidy, trisomy, matched trisomy, mismatched trisomy, maternal trisomy, paternal trisomy, tetrasomy, equilibrium (2: 2). It may include trisomy, unbalanced (3: 1) tetrasomy, pentasomy, hexasomy, other aneuploidies, and combinations thereof. Any of these aneuploidy states may be mixed or partially aneuploidy, eg, unbalanced translocation, equilibrium translocation, Robertsonian translocation, recombination, deletion, insertion, crossover. , And combinations thereof.

いくつかの実施形態では、決定された倍数性状態の知見を使用して、臨床的決定を行うことができる。この知見は、一般には、事項の物理的配列としてメモリデバイスに保存され、次いで、報告に変換することができる。次いで、報告は実行され得る。例えば、臨床的決定は、妊娠中絶することであってよい、あるいは、臨床的決定は、妊娠を継続することであってよい。いくつかの実施形態では、臨床的決定は、遺伝的障害の表現型の発現の重症度を低下させるために設計された介入、または特別支援児(special needs child)に対する準備をするための関連性のあるステップを取る決定を伴ってよい。 In some embodiments, the knowledge of the determined ploidy state can be used to make clinical decisions. This finding is generally stored in a memory device as a physical array of matters and can then be converted into a report. The report can then be carried out. For example, the clinical decision may be an abortion, or the clinical decision may be to continue the pregnancy. In some embodiments, the clinical decision is an intervention designed to reduce the severity of the expression of the phenotype of the genetic disorder, or relevance to prepare for a special needs child. May be accompanied by a decision to take a certain step.

本開示のある実施形態では、本明細書に記載の任意の方法は、複数の標的が、同じ標的個体、例えば、同じ妊娠中の母親からの複数の採血に由来することを可能にするために改変することができる。これにより、複数の遺伝子測定によって標的遺伝子型を決定することができるより多くのデータがもたらされ得るので、モデルの正確度を改善することができる。ある実施形態では、1つの標的遺伝子データの集合は、報告された一次データとしての機能を果たし、他の標的遺伝子データの集合は、一次標的遺伝子データを再確認するためのデータとしての機能を果たす。ある実施形態では、標的個体から取得した遺伝物質からそれぞれ測定された複数の遺伝子データの集合を並行して考慮し、したがって、両方の標的遺伝子データの集合は、高い正確度で測定された親の遺伝子データのどのセクションが胎児のゲノムを構成するかを決定するための助けとして機能する。 In certain embodiments of the present disclosure, any method described herein is to allow multiple targets to be derived from multiple blood draws from the same target individual, eg, the same pregnant mother. Can be modified. This can improve the accuracy of the model, as multiple gene measurements can provide more data that can determine the target genotype. In one embodiment, one set of target gene data serves as the reported primary data, and the other set of target gene data serves as data for reconfirming the primary target gene data. .. In one embodiment, multiple sets of genetic data, each measured from genetic material obtained from the target individual, are considered in parallel, thus both sets of target genetic data of the parent measured with high accuracy. It serves as an aid in determining which section of genetic data constitutes the fetal genome.

ある実施形態では、前記方法を、父子試験のために使用することができる。例えば、母親から、および遺伝学的父親である、またはそうでない可能性がある男性からのSNPに基づく遺伝子型の情報ならびに混合試料から測定された遺伝子型の情報を考慮すると、その男性の遺伝子型の情報が実際に妊娠中の胎児の実際の遺伝学的父親を表しているかどうかを決定することが可能である。これを行うための単純な方法は、単に、母親がAAであり、可能性のある父親がABまたはBBである状況について検査することである。これらの場合、それぞれ、父親が2分の1回(AA|AB)または常に(AA|BB)寄与することを予想することができる。予測ADOを考慮に入れると、観察される胎児のSNPが、可能性のある父親のSNPと相関するかどうかを決定することは簡単である。 In certain embodiments, the method can be used for a parent-child test. Given, for example, SNP-based genotype information from a mother and from a man who may or may not be a genetic father, as well as genotype information measured from a mixed sample, that man's genotype. It is possible to determine if the information in the above actually represents the actual genetic father of the pregnant fetus. A simple way to do this is simply to test for situations where the mother is AA and the possible father is AB or BB. In each of these cases, it can be expected that the father will contribute half a time (AA | AB) or always (AA | BB). Taking into account the predictive ADO, it is easy to determine whether the observed fetal SNP correlates with the possible paternal SNP.

本開示の一実施形態は以下の通りであってよい:妊娠中の女性が、自身の胎児がダウン症候群を患っているかどうか、および/または嚢胞性線維症を患っているかどうか知ることを望んでおり、その女性はこれらの状態のいずれかを患っている子を産むことを望んでいない。医師はその女性の血液を採り、ヘモグロビンを1つのマーカーではっきり赤色があらわれるように染色し、核材料を別のマーカーではっきり青色があらわれるように染色する。母系の赤血球は、一般には無核であるが、高い割合の胎児の細胞が核を含有することが公知であるので、医師は、赤色および青色の両方を示す細胞を同定することにより、いくつもの有核赤血球を視覚的に単離することができる。医師は、これらの細胞を、マイクロマニピュレーターでスライドから取り出し、検査室に送り、そこで10個の個々の細胞を増幅し、遺伝子型決定する。遺伝子測定を使用することによって、PARENTAL SUPPORT(商標)法で、細胞10個のうち6個が母系の血液細胞であり、細胞10個のうち4個が胎児の細胞であることを決定することができる。妊娠中の母親に既に子が生まれている場合、PARENTAL SUPPORT(商標)は、胎児の細胞に対して信頼できる対立遺伝子コールを行い、それらが生まれた子の対立遺伝子と同様でないことを示すことによって、胎児の細胞が生まれた子の細胞と別個のものであることを決定するためにも使用することができる。この方法は、本開示の父系検査実施形態と同様の概念であることに留意されたい。胎児の細胞から測定された遺伝子データは質が非常に悪い可能性があり、単一細胞の遺伝子型決定の難しさに起因して、多くの対立遺伝子ドロップアウトを含む。臨床医は、測定された胎児DNAを親の信頼できるDNA測定値と一緒に用い、PARENTAL SUPPORT(商標)を使用して胎児のゲノムの態様を高い正確度で推定し、それにより、胎児由来の遺伝物質に含有される遺伝子データを、コンピュータ上に保存される、予測される胎児の遺伝子の状態に変換することができる。臨床医は、胎児の倍数性状態と、複数の疾患連鎖対象遺伝子の存在または不在の両方とを決定することができる。胎児は正倍数性であり、嚢胞性線維症の保有者ではないことが分かり、母親は妊娠を継続することを決定する。 One embodiment of the disclosure may be as follows: A pregnant woman wishing to know if her fetus has Down's syndrome and / or cystic fibrosis. And the woman does not want to give birth to a child suffering from any of these conditions. The doctor takes the woman's blood and stains hemoglobin with one marker for a distinct red color and fertile material with another marker for a clear blue color. Maternal erythrocytes are generally anucleated, but it is known that a high proportion of fetal cells contain nuclei, so doctors can identify cells that show both red and blue, in a number of ways. Nucleated red blood cells can be visually isolated. The doctor removes these cells from the slide with a micromanipulator and sends them to the laboratory where 10 individual cells are amplified and genotyped. By using genetic measurements, the PARENTAL SUPPORT ™ method can be used to determine that 6 out of 10 cells are maternal blood cells and 4 out of 10 cells are fetal cells. can. If the pregnant mother already has offspring, PARENTAL SUPPORT ™ makes reliable allelic calls to fetal cells to show that they are not similar to the offspring's alleles. It can also be used to determine that the fetal cells are distinct from the offspring cells that were born. It should be noted that this method is similar in concept to the patrilineal test embodiment of the present disclosure. Genetic data measured from fetal cells can be of very poor quality and contain many allelic dropouts due to the difficulty of single cell genotyping. Clinicians use the measured fetal DNA in conjunction with the parent's reliable DNA measurements and use PARENTAL SUPPORT ™ to estimate the fetal genomic aspect with high accuracy, thereby derived from the fetus. The genetic data contained in the genetic material can be converted into the predicted fetal genetic state stored on the computer. The clinician can determine both the ploidy state of the fetus and the presence or absence of multiple disease chained genes. The fetus is found to be positive polyploid and not a carrier of cystic fibrosis, and the mother decides to continue her pregnancy.

本開示のある実施形態では、妊娠中の母親は、自身の胎児がいずれかの全染色体異常を患っているかどうかを決定することを望んでいる。その女性は担当医師の所に行き、自身の血液の試料を提供し、また、その女性とその女性の夫は、頬スワブにより自身のDNAの試料を提供する。検査室の研究者は、親のDNAを増幅するためのMDAプロトコールを使用し、多数のSNPにおける親の遺伝子データを測定するためのILLUMINA INFINIUMアレイを使用して、親のDNAの遺伝子型決定を行う。次いで、研究者は血液を遠心沈澱し、血漿を採り、サイズ排除クロマトグラフィーを使用して浮動性DNAの試料を単離する。あるいは、研究者は、1個または複数個の蛍光抗体、例えば、胎児のヘモグロビンに特異的な抗体を使用して、胎児有核赤血球を単離する。次いで、研究者は、単離または富化された胎児の遺伝物質を取得し、それを、各オリゴヌクレオチドの2つの末端が標的対立遺伝子のいずれかの側の隣接配列に対応するように適切に設計された70-マー(mer)のオリゴヌクレオチドのライブラリーを使用して増幅する。ポリメラーゼ、リガーゼ、および適切な試薬を添加すると、オリゴヌクレオチドはギャップ充填環状化、所望の対立遺伝子の捕捉を受けた。エキソヌクレアーゼを加え、熱失活させ、産物を直接PCR増幅の鋳型として使用した。PCR産物について、ILLUMINA GENOME ANALYZERで配列決定した。シーケンスリードをPARENTAL SUPPORT(商標)法のための入力として使用し、次いで、それにより胎児の倍数性状態を予測した。 In one embodiment of the disclosure, a pregnant mother wants to determine if her fetus suffers from any chromosomal abnormality. The woman goes to her doctor and provides a sample of her blood, and the woman and her husband provide a sample of their DNA by cheek swab. Laboratory researchers use the MDA protocol to amplify the parent's DNA and the ILLUMINA INFINIUM array to measure the parent's genetic data in multiple SNPs to genotype the parent's DNA. conduct. Researchers then centrifuge the blood, collect plasma, and use size-exclusion chromatography to isolate a sample of floating DNA. Alternatively, researchers use one or more fluorescent antibodies, eg, antibodies specific for fetal hemoglobin, to isolate fetal nucleated red blood cells. Researchers then obtain isolated or enriched fetal genetic material, which is appropriately adapted so that the two ends of each oligonucleotide correspond to adjacent sequences on either side of the target allele. Amplify using a designed library of 70-mer oligonucleotides. With the addition of polymerases, ligases, and appropriate reagents, the oligonucleotides underwent gap-filled cyclization, capture of the desired allelic gene. Exonucleases were added, heat inactivated, and the product was used directly as a template for PCR amplification. The PCR product was sequenced by ILLUMINA GENOME ANALYZER. Sequence reads were used as inputs for the PARENTAL SUPPORT ™ method, which in turn predicted the ploidy state of the fetus.

別の実施形態では、母親が妊娠中であり、高齢出産である夫婦が、妊娠中の胎児がダウン症候群、ターナー症候群、プラダーウィリー症候群またはいくつかの他の全染色体異常を有するかどうかを知ることを望んでいる。産科医は、母親および父親から採血を行う。血液を検査室に送り、そこで、技師が母体試料を遠心分離して血漿およびバフィーコートを単離する。バフィーコート内のDNAおよび父系の血液試料を増幅によって変換し、増幅された遺伝物質にコードされる遺伝子データを、遺伝物質をハイスループットシーケンサーにかけることによって、分子的に保存された遺伝子データから電子的に保存された遺伝子データにさらに変換して、親の遺伝子型を測定する。血漿試料を、5,000プレックスヘミネステッド標的PCR法を用いて、遺伝子座の集合において優先的に富化する。DNA断片の混合物を、配列決定に適したDNAライブラリーに調製する。次いで、DNAを、ハイスループット配列決定方法、例えば、ILLUMINA GAIIx GENOME ANALYZERを用いて配列決定する。配列決定により、DNA内に分子的にコードされている情報をコンピュータハードウェアに電子的にコードされる情報に変換する。ここで開示されている実施形態を含むインフォマティクスに基づく技法、例えば、PARENTAL SUPPORT(商標)を使用して、胎児の倍数性状態を決定することができる。これは、調製された試料に対して行ったDNA測定から、複数の多型遺伝子座における対立遺伝子数の確率をコンピュータで算出するステップと、それぞれが、染色体における可能性のある異なる倍数性状態に関連する、複数の倍数性仮説をコンピュータで作製するステップと、各倍数性仮説について、染色体上の複数の多型遺伝子座における予測される対立遺伝子数についての同時分布モデルをコンピュータで構築するステップと、同時分布モデルおよび調製された試料において測定された対立遺伝子数を用いて、倍数性仮説のそれぞれの相対的確率をコンピュータで決定するステップと、最大の確率を有する仮説に対応する倍数性状態を選択することによって胎児の倍数性状態をコールするステップとを包含し得る。胎児がダウン症候群を有することが決定される。報告を印刷する、または妊娠中の女性の担当産科医に電子的に送信し、その産科医が診断をその女性に伝達する。その女性、その女性の夫、および医師は腰を据えて選択肢を議論する。夫婦は、胎児がトリソミーの状態を患っているという知見に基づいて、妊娠中絶することを決定する。 In another embodiment, a couple whose mother is pregnant and has advanced maternal age knows if the pregnant fetus has Down's syndrome, Turner's syndrome, Prader-Willi syndrome or some other chromosomal abnormality. I want. Obstetricians collect blood from mothers and fathers. Blood is sent to the laboratory where the technician centrifuges the maternal sample to isolate plasma and buffy coat. The DNA in the buffy coat and the blood sample of the paternal line are converted by amplification, and the genetic data encoded by the amplified genetic material is electron-generated from the genetic data stored molecularly by subjecting the genetic material to a high-throughput sequencer. The genotype of the parent is measured by further conversion to the conserved genetic data. Plasma samples are preferentially enriched at the locus set using the 5,000-plex heminestized target PCR method. A mixture of DNA fragments is prepared in a DNA library suitable for sequencing. The DNA is then sequenced using a high-throughput sequencing method, eg, ILLUMINA GAIIx GENEOME ANALYZER. Sequencing converts information that is molecularly encoded in DNA into information that is electronically encoded by computer hardware. Informatics-based techniques, including the embodiments disclosed herein, can be used to determine the ploidy state of the fetus, eg, PARENTAL SUPPORT ™. This is a computerized step in calculating the probability of alleles at multiple polymorphic loci from DNA measurements made on the prepared sample, each with a possible different multiple state in the chromosome. A computer-based step to create related multiple multiple hypotheses, and a computer-based co-distribution model for the expected number of alleles at multiple polymorphic loci on the chromosome for each multiple hypothesis. Using the co-distribution model and the number of alleles measured in the prepared sample, the steps to computerize the relative probabilities of each of the multiple hypotheses, and the polymorphic states corresponding to the hypotheses with the highest probabilities. It may include steps to call the chromosomal state of the fetal by choice. It is determined that the fetus has Down's syndrome. Print the report or electronically send it to the obstetrician in charge of the pregnant woman, who will convey the diagnosis to the woman. The woman, her husband, and the doctor sit down to discuss options. The couple decides to have an abortion based on the finding that the fetus suffers from a trisomy condition.

ある実施形態では、企業が、母系の採血から妊娠中の胎児における異数性を検出するために設計された診断技術を提供することを決定し得る。その産物により、母親が、該母親の血液を採取することができる担当産科医に来診することを必要とし得る。産科医は、胎児の父親からも遺伝子試料を収集することができる。臨床医は、母親の血液から血漿を単離し、血漿からDNAを精製することができる。臨床医は、母親の血液からバフィーコート層を単離し、バフィーコートからDNAを調製することもできる。臨床医は、父親の遺伝子試料からDNAを調製することもできる。臨床医は、本開示に記載の分子生物学技法を用いて、血漿試料に由来するDNAにおいてDNAにユニバーサル増幅タグを付加することができる。臨床医は、ユニバーサルタグが付けられたDNAを増幅することができる。臨床医は、ハイブリダイゼーションによる捕捉および標的PCRを含めたいくつもの技法によってDNAを優先的に富化することができる。標的PCRは、ネスティング、ヘミネスティングまたはセミネスティングまたは血漿由来DNAの効率的な富化をもたらす任意の他の手法を伴ってよい。標的PCRにより、例えば、1反応体積で10,000個のプライマーを用いて大規模に多重化することができ、ここで、プライマーは、第13染色体、第18染色体、第21染色体、X染色体上のSNPおよびXおよびYの両方に共通し、必要に応じて、他の染色体にも共通する遺伝子座を標的とする。選択的な富化および/または増幅は、個々の分子それぞれに、異なるタグ、分子バーコード、増幅用タグ、および/または配列決定用タグを用いてタグ付けすることを伴ってよい。次いで、臨床医は血漿試料について配列決定し、また、場合によっては、調製された母系DNAおよび/または父系DNAをシークエンシングができる。分子生物学的ステップを、診断ボックスによって完全にまたは部分的に実行することができる。配列データを、単一のコンピュータに、または別の種類の計算プラットフォーム、例えば、「クラウド」において見出すことができるものに供給することができる。計算プラットフォームにより、シーケンサーによって行われた測定から標的の多型遺伝子座における対立遺伝子数を算出することができる。計算プラットフォームにより、第13染色体、第18染色体、第21染色体、X染色体およびY染色体のそれぞれについての零染色体性、モノソミー、ダイソミー、一致トリソミー、および不一致トリソミーに関係する、複数の倍数性仮説を作製することができる。計算プラットフォームにより、調べられている5つの染色体のそれぞれに対して、各倍数性仮説に対して、染色体上の標的の遺伝子座における予測される対立遺伝子数についての同時分布モデルを構築することができる。計算プラットフォームにより、同時分布モデルおよび血漿試料に由来する優先的に富化されたDNAに対して測定された対立遺伝子数を用いて、倍数性仮説のそれぞれが真である確率を決定することができる。計算プラットフォームにより、第13染色体、第18染色体、第21染色体、X染色体およびY染色体のそれぞれについて、最大の確率を有する適切な仮説に対応する倍数性状態を選択することによって胎児の倍数性状態をコールすることができる。コールされた倍数性状態を含む報告を作製することができ、それを産科医に電子的に送ること、出力デバイスに表示すること、または印刷した報告のハードコピーを産科医に送達することができる。産科医は、患者、および必要に応じて胎児の父親に知らせることができ、彼らは、どの臨床的な選択肢を受け入れられるか、およびどれが最も望ましいかを決定することができる。 In certain embodiments, the entity may decide to provide diagnostic techniques designed to detect aneuploidy in a pregnant fetus from maternal blood draws. The product may require the mother to visit an obstetrician in charge who can collect the mother's blood. Obstetricians can also collect genetic samples from the father of the fetus. The clinician can isolate the plasma from the mother's blood and purify the DNA from the plasma. The clinician can also isolate the buffy coat layer from the mother's blood and prepare the DNA from the buffy coat. The clinician can also prepare DNA from the father's genetic sample. Clinicians can use the molecular biology techniques described in the present disclosure to add a universal amplification tag to DNA in DNA derived from plasma samples. Clinicians can amplify universally tagged DNA. Clinicians can preferentially enrich DNA by a number of techniques, including hybridization capture and targeted PCR. Targeted PCR may involve nesting, heminesting or semi-nesting or any other technique that results in efficient enrichment of plasma-derived DNA. Targeted PCR can be extensively multiplexed, for example, with 10,000 primers in one reaction volume, where the primers are on chromosomes 13, 18, 21, and X. Target loci common to both SNP and X and Y, and optionally to other chromosomes. Selective enrichment and / or amplification may involve tagging each individual molecule with a different tag, molecular barcode, amplification tag, and / or sequencing tag. The clinician can then sequence the plasma sample and, optionally, sequence the prepared maternal and / or paternal DNA. The molecular biology step can be performed completely or partially by the diagnostic box. Array data can be supplied to a single computer or to another type of computing platform, eg, one that can be found in the "cloud". The computational platform allows the number of alleles at the target polymorphic locus to be calculated from measurements made by the sequencer. Computational platform creates multiple multiple hypotheses related to zero-chromosomal, monosomy, disomy, coincident trisomy, and mismatched trisomy for each of chromosomes 13, 18, 21, X, and Y. can do. The computational platform allows us to build joint distribution models for the predicted number of alleles at the target loci on the chromosome for each polyploidy hypothesis for each of the five chromosomes being investigated. .. The computational platform allows the probability that each of the polyploidy hypotheses is true using a joint distribution model and the number of alleles measured against preferentially enriched DNA from plasma samples. .. For each of chromosomes 13, 18, 21, X, and Y, the computational platform determines the ploidy state of the fetal by selecting the ploidy state that corresponds to the appropriate hypothesis with the greatest probability. You can call. A report containing the called ploidy state can be produced and sent electronically to the obstetrician, displayed on an output device, or a hard copy of the printed report can be delivered to the obstetrician. .. Obstetricians can inform the patient and, if necessary, the father of the fetus, who can determine which clinical options are acceptable and which is most desirable.

別の実施形態では、以後「母親」と称される妊娠中の女性は、自身の胎児(複数可)がいずれかの遺伝子異常または他の状態を保有するか否か知りたいと決めることができる。母親は、いかなる全体的異常もないことを確実にしてから妊娠の継続を確信することを希望することができる。母親は、担当産科医のもとに行くことができ、担当産科医は、母親の血液の試料も採ることができる。担当産科医は、母親の頬からの頬スワブなどの遺伝子試料を採ることもできる。担当産科医は、胎児の父親からも遺伝子試料、例えば、頬スワブ、精子試料または血液試料を採ることができる。担当産科医は、試料を臨床医に送ることができる。臨床医は、母系の血液試料中の浮動性胎児DNAの画分を富化することができる。臨床医は、母系の血液試料中の脱核胎児血液細胞の画分を富化することができる。臨床医は、本明細書に記載の方法の種々の態様を用いて、胎児の遺伝子データを決定することができる。その遺伝子データは、胎児の倍数性状態、および/または胎児における1つまたはいくつもの疾患連鎖対立遺伝子の同一性を含み得る。出生前診断の結果が要約されている報告を作製することができる。報告は、医師に送達または郵送することができ、医師は、母親に胎児の遺伝子の状態を告げることができる。母親は、胎児が1個または複数個の染色体もしくは遺伝子の異常または望ましくない状態を有するという事実に基づいて、妊娠を中止することを決定することができる。母親は、同様に、胎児が、いかなる染色体全体もしくは遺伝子の異常またはいかなる対象の遺伝子の状態も有さないという事実に基づいて、妊娠を継続することを決定することができる。 In another embodiment, a pregnant woman, hereafter referred to as the "mother," may decide that she wants to know if her fetus (s) carry any genetic abnormality or other condition. .. The mother may wish to be confident of continuing pregnancy after ensuring that there are no general abnormalities. The mother can go to her obstetrician, who can also take a sample of her mother's blood. The obstetrician in charge can also take a genetic sample such as a cheek swab from the mother's cheek. The obstetrician in charge can also take a genetic sample, such as a cheek swab, sperm sample or blood sample, from the father of the fetus. The obstetrician in charge can send the sample to the clinician. Clinicians can enrich the fraction of floating fetal DNA in maternal blood samples. Clinicians can enrich the fraction of enucleated fetal blood cells in maternal blood samples. The clinician can use various aspects of the methods described herein to determine fetal genetic data. The genetic data may include the ploidy state of the fetus and / or the identity of one or more disease chain alleles in the fetus. A report can be produced that summarizes the results of prenatal diagnosis. The report can be served or mailed to the doctor, who can inform the mother of the genetic status of the fetus. The mother can decide to discontinue pregnancy based on the fact that the fetus has one or more chromosomal or genetic abnormalities or undesired conditions. The mother can likewise decide to continue the pregnancy based on the fact that the fetus does not have any chromosomal or genetic abnormalities or genetic status of any subject.

別の例は、精子ドナーにより人工受精し、妊娠中である妊娠中の女性に関し得る。その女性は、自身が保有している胎児が遺伝病を有するリスクを最小限にすることを希望している。その女性は、静脈瀉血士による採血を受け、本開示に記載の技法を用いて、3つの胎児有核赤血球を単離し、組織試料も、母親および遺伝学的父親から採取する。胎児由来の遺伝物質ならびに母親および父親由来の遺伝物質を、必要に応じて増幅し、ILLUMINA INFINIUM BEADARRAYを用いて遺伝子型決定し、本明細書に記載の方法により親の遺伝子型および胎児の遺伝子型をきれいにし、高い正確度で相を特定し、ならびに、胎児についての倍数性コールを行う。胎児が正倍数性であることが見いだされ、再構築された胎児の遺伝子型から表現型による罹病性を予測し、報告を作製し、母親の担当医師に送り、したがって、彼らはどんな臨床的決定が最良であり得るかを決定することができる。 Another example may be for a pregnant woman who is artificially fertilized by a sperm donor and is pregnant. The woman wants to minimize the risk that her fetus will have a genetic disease. The woman receives blood drawn by a venous phleboder and uses the techniques described in the present disclosure to isolate three fetal nucleated red blood cells, and tissue samples are also taken from the mother and genetic father. Fetal-derived genetic material and mother- and father-derived genetic material are amplified as needed and genotyped using ILLUMINA INFINIUM BEADARRAY, and the genotypes of the parent and the fetus are genotyped by the methods described herein. Clean, identify phases with high accuracy, and make multiple calls for the fetus. The fetus was found to be positive polyploid, predicting phenotypic susceptibility from the reconstructed fetal genotype, producing a report and sending it to the mother's physician, thus making any clinical decisions. Can be determined to be the best.

ある実施形態では、母親および父親の未処理の遺伝物質を、増幅によって、ある量の、配列は同様であるが量がより多いDNAに変換する。次いで、遺伝子型決定方法により、核酸によりコードされる遺伝子型データを、上記のものなどのメモリデバイスに物理的かつ/または電子的に保存することができる遺伝子測定値に変換する。PARENTAL SUPPORT(商標)アルゴリズムを構成する関連性のあるアルゴリズムを、プログラミング言語を用いてコンピュータプログラムに翻訳するが、そのアルゴリズムの関連性のある部分は本明細書において詳細に考察されている。次いで、物理的にコードされるビットおよびバイトではなく、生の測定データを示すパターンに整理されているコンピュータハードウェアでコンピュータプログラムを実行することにより、胎児の倍数性状態の高い信頼度の決定を示すパターンに変換される。この変換の詳細は、本明細書に記載の方法を実行するために使用するデータ自体およびコンピュータ言語およびハードウェアシステムに依拠する。次いで、高い質の胎児の倍数性の決定を示すように物理的に構成されたデータを、健康管理実践者に送ることができる報告に変換する。この変換は、プリンタまたはコンピュータディスプレイを使用して行うことができる。報告は、紙または他の適切な媒体に印刷されたコピーであってよい、あるいは、報告は、電子的なものであってよい。電子報告の場合は、伝達することができ、健康管理実践者が利用できるコンピュータに位置するメモリデバイス上に物理的に保存することができる。電子報告は、読み取ることができるようにスクリーン上に表示することもできる。スクリーン表示の場合には、データは、表示デバイス上でピクセルの物理的変換を引き起こすことによって可読の形式に変換することができる。変換は、リン光性スクリーンに電子を物理的に発射することによって、光子を放出または吸収する基材の前に置くことができるスクリーン上のピクセルの特定の集合の透明度を物理的に変化させる電気的な電荷を変更することによって実現することができる。この変換は、ピクセルの特定の集合において、液晶中のナノスケールの分子の配向を、例えば、ネマティック相からコレステリック相またはスメクチックな相に変化させることによって実現することができる。この変換は、意味のあるパターンに配置された複数の発光ダイオードで構成されたピクセルの特定の集合からの光子の放出を引き起こす電流によって実現することができる。この変換は、情報を表示するために使用される任意の他の方法、例えば、コンピュータスクリーンまたはいくつかの他の出力デバイスまたは情報伝達法によって実現することができる。次いで、健康管理実践者は、報告にあるデータを措置に変換するように、報告に基づいて行動することができる。措置は、妊娠を継続または中止することであってよく、その場合、遺伝子の異常を有する妊娠中の胎児は、非生存胎児に変換される。本明細書において列挙されている変換は、例えば、妊娠中の母親および父親の遺伝物質を、本開示において概説されているいくつものステップを通じて、遺伝子の異常を有する胎児を流産することからなる、または妊娠を継続することからなる医学的な決定に変換することができるように総計することができる。あるいは、遺伝子型の測定値の集合を、医師が妊娠中の患者を処置することに役立つ報告に変換することができる。 In certain embodiments, the untreated genetic material of the mother and father is converted by amplification into a certain amount of DNA that is similar in sequence but higher in quantity. The genotyping method then converts the genotypic data encoded by the nucleic acid into a genetic measurement that can be physically and / or electronically stored in a memory device such as the one described above. The relevant algorithms that make up the PARENTAL SUPPORT ™ algorithm are translated into computer programs using programming languages, the relevant parts of which are discussed in detail herein. Then, by running the computer program on computer hardware that is organized into patterns that represent raw measurement data rather than physically coded bits and bytes, a highly reliable determination of the fetal polymorphic state is then made. It is converted to the pattern shown. The details of this conversion depend on the data itself and the computer language and hardware system used to perform the methods described herein. The data, physically configured to show the determination of high quality fetal ploidy, is then transformed into a report that can be sent to health care practitioners. This conversion can be done using a printer or computer display. The report may be a copy printed on paper or other suitable medium, or the report may be electronic. In the case of electronic reports, they can be communicated and physically stored on a memory device located on the computer available to health care practitioners. Electronic reports can also be displayed on the screen for readability. In the case of screen display, the data can be converted into a readable format by inducing a physical transformation of the pixels on the display device. The transformation physically changes the transparency of a particular set of pixels on a screen that can be placed in front of a substrate that emits or absorbs photons by physically emitting electrons to a phosphorescent screen. It can be realized by changing the target charge. This transformation can be achieved by changing the orientation of the nanoscale molecules in the liquid crystal, for example, from a nematic phase to a cholesteric or smectic phase in a particular set of pixels. This transformation can be achieved by a current that causes the emission of photons from a particular set of pixels composed of multiple light emitting diodes arranged in a meaningful pattern. This conversion can be achieved by any other method used to display the information, such as a computer screen or some other output device or information transmission method. Health care practitioners can then act on the basis of the report to translate the data in the report into measures. The measure may be to continue or discontinue the pregnancy, in which case the pregnant fetus with the genetic abnormality is converted to a non-surviving fetus. The transformations listed herein consist of, for example, miscarriage of a pregnant mother and father's genetic material through a number of steps outlined in this disclosure to a fetus with a genetic abnormality. It can be summed up so that it can be transformed into a medical decision consisting of continuing pregnancy. Alternatively, the set of genotype measurements can be translated into reports that help physicians treat pregnant patients.

本開示のある実施形態では、本明細書に記載の方法を用いて、宿主母親、すなわち妊娠中の女性が、自身が保有している胎児の生物学的母親ではない場合にでも、胎児の倍数性状態を決定することができる。本開示のある実施形態では、本明細書に記載の方法を用いて、母系の血液試料のみを使用し、父系の遺伝子試料を必要とせずに胎児の倍数性状態を決定することができる。 In certain embodiments of the present disclosure, using the methods described herein, the host mother, a pregnant woman, is a multiple of the fetus, even if it is not the biological mother of the fetus in her possession. The sexual state can be determined. In certain embodiments of the present disclosure, the methods described herein can be used to determine the ploidy state of the fetus using only maternal blood samples and without the need for paternal genetic samples.

ここで開示されている実施形態における数学のいくつかにより、限られた数の異数性の状態に関する仮説が立てられる。いくつかの場合には、例えば、0、1つまたは2つの染色体のみが、各親を起源とすることが予測される。本開示のいくつかの実施形態では、本開示の基本的な概念を変化させることなく、数学的な導出を拡大して異数性の他の形態、例えば、3つの染色体が一方の親を起源とするクアドロソミー(quadrosomy)、ペンタソミー、ヘキサソミーを考慮に入れることができる。同時に、より小さな数の倍数性状態、例えば、トリソミーおよびダイソミーのみに焦点を当てることが可能である。整数でない染色体を示す倍数性の決定は、遺伝物質の試料中のモザイク現象を示し得ることに留意されたい。 Some of the mathematics in the embodiments disclosed herein make hypotheses about a limited number of aneuploidy states. In some cases, for example, only 0, 1 or 2 chromosomes are expected to originate from each parent. In some embodiments of the present disclosure, other forms of aneuploidy, such as three chromosomes originating from one parent, extend the mathematical derivation without altering the basic concepts of the present disclosure. Quadrosomy, pentasomy, and hexasomy can be taken into consideration. At the same time, it is possible to focus only on smaller numbers of ploidic states, such as trisomy and disomy. Note that polyploidy determinations that indicate non-integer chromosomes can indicate a mosaic phenomenon in a sample of genetic material.

いくつかの実施形態では、遺伝子の異常は、ダウン症候群(または21トリソミー)、エドワーズ症候群(18トリソミー)、パトー症候群(13トリソミー)、ターナー症候群(45X)、クラインフェルター症候群(2つのX染色体を持つ男性)、プラダーウィリー症候群、およびディジョージ症候群(UPD15)などの異数性の一種である。前文に列挙されているものなどの先天性障害は、一般に望ましくなく、胎児が1つまたは複数の表現型の異常を患っているという知見により、妊娠中絶すること、特別支援児の誕生のための準備をするために必要な対策をとること、または染色体異常の重症度を減らすことを意図したいくつかの治療的手法をとることを決定するための基礎を提供することができる。 In some embodiments, the genetic abnormality has Down syndrome (or trisomy 21), Edwards syndrome (trisomy 18), Patau syndrome (trisomy 13), Turner syndrome (45X), Kleinfelder syndrome (with two X chromosomes). Male), Praderwilly Syndrome, and DiGeorge Syndrome (UPD15). Congenital disorders, such as those listed in the preamble, are generally undesirable and are due to the finding that the fetus suffers from one or more phenotypic abnormalities, resulting in an abortion or the birth of a special needs child. It can provide the basis for deciding to take the necessary steps to prepare or to take some therapeutic approach intended to reduce the severity of the chromosomal abnormality.

いくつかの実施形態では、本明細書に記載の方法を、非常に初期の妊娠期間、例えば、早ければ4週、早ければ5週、早ければ6週、早ければ7週、早ければ8週、早ければ9週、早ければ10週、早ければ11週、および早ければ12週において用いることができる。 In some embodiments, the methods described herein are used for very early gestational periods, eg, 4 weeks at the earliest, 5 weeks at the earliest, 6 weeks at the earliest, 7 weeks at the earliest, 8 weeks at the earliest. It can be used at 9 weeks at the earliest, 10 weeks at the earliest, 11 weeks at the earliest, and 12 weeks at the earliest.

いくつかの実施形態では、本明細書に開示されている方法を、インビトロでの受精の間に胚を選択するための着床前遺伝子診断(PGD)との関連において使用し、ここで、標的個体は胚であり、3日目の胚由来の単一細胞または2つの細胞の生検または5日目または6日目の胚の栄養外胚葉生検材料からの配列決定データから、胚に関する倍数性の決定を行うために、親の遺伝子型データを使用することができる。PGDの環境では、子のDNAのみを測定し、ほんの少数の細胞、一般に、1~5個であるが、多くて10個、20個または50個を検査する。次いで、対立遺伝子AおよびB(SNPにおける)の開始時のコピーの総数が子の遺伝子型および細胞の数によって自明に決定される。NPDでは、開始時のコピーの数は非常に多く、したがって、PCRの後の対立遺伝子の比が開始時の比を正確に反映することが予想される。しかし、PGDにおける開始時のコピーが少数であることは、コンタミネーションおよび不完全なPCR効率が、PCR後の対立遺伝子の比に対する非自明の効果を有することを意味する。この効果は、配列決定後に測定された対立遺伝子の比における分散を予測することにおけるリード深度よりも重要であり得る。既知の子の遺伝子型を考慮して測定された対立遺伝子の比の分布は、PCRプローブの効率およびコンタミネーションの確率に基づいたPCRプロセスのMonteCarloシミュレーションによって作製することができる。可能性のある子の遺伝子型のそれぞれについて対立遺伝子の比の分布を考慮して、種々の仮説の尤度を、NIPDについて記載されているのと同様に算出することができる。 In some embodiments, the methods disclosed herein are used in the context of preimplantation genetic diagnosis (PGD) for selecting embryos during in vitro fertilization, where they are targeted. The individual is an embryo and is a multiple for the embryo from sequencing data from a single or two cell biopsy from the embryo on day 3 or from the nutritional ectoderm biopsy material of the embryo on day 5 or 6. Parental genotype data can be used to make sex decisions. In the PGD environment, only the DNA of the offspring is measured and examined for only a few cells, generally 1-5, but at most 10, 20, or 50. The total number of starting copies of alleles A and B (in SNP) is then self-determined by the genotype of the offspring and the number of cells. In NPD, the number of copies at the start is very large, so it is expected that the allele ratio after PCR accurately reflects the ratio at the start. However, the small number of starting copies in PGD means that contamination and incomplete PCR efficiency have a non-trivial effect on the ratio of alleles after PCR. This effect can be more important than the read depth in predicting variance in allele ratios measured after sequencing. Distribution of allele ratios measured taking into account known offspring genotypes can be generated by MonteCarlo simulation of the PCR process based on the efficiency of the PCR probe and the probability of contamination. The likelihood of various hypotheses can be calculated in the same manner as described for NIPD, taking into account the distribution of allele ratios for each of the possible offspring genotypes.

最尤推定
生物学的な現象または医学的状態の存在または不在を検出するための当技術分野で公知の大多数の方法は、状態と相関するメトリックを測定し、メトリックが所与の閾値の一方の側にあれば、その状態が存在し、メトリックが閾値の他方の側にあれば、その状態は存在しないという単一仮説棄却検定を用いることを包含する。単一仮説棄却検定では、帰無仮説と対立仮説の間の決定を行う際に帰無分布を調べるだけである。対立分布を考慮に入れなければ、観察されたデータを考慮して各仮説の尤度を推定することはできず、したがって、コールに対する信頼度を算出することができない。したがって、単一仮説棄却検定を用いて、特定の場合と関連する信頼度についての感受性を伴わずにyesまたはnoの答えを得る。
Maximum likelihood estimation The majority of methods known in the art for detecting the presence or absence of a biological phenomenon or medical condition measure a metric that correlates with the condition, where the metric is one of a given threshold. Includes using a single hypothesis rejection test that the state exists if it is on the other side of the threshold and that the state does not exist if the metric is on the other side of the threshold. The single hypothesis rejection test only examines the null distribution when making a decision between the null hypothesis and the alternative hypothesis. Without taking into account the antagonism, the likelihood of each hypothesis cannot be estimated in light of the observed data, and therefore the confidence in the call cannot be calculated. Therefore, a single hypothesis rejection test is used to obtain a yes or no answer without sensitivity to the confidence associated with a particular case.

いくつかの実施形態では、本明細書に開示されている方法では、生物学的な現象または医学的状態の存在または不在を、最尤法を用いて検出することができる。最尤法は、状態の不在または存在をコールするための閾値をそれぞれの場合について適切に調整することができるので、単一仮説棄却法を用いる方法に対する実質的な改善である。これは、母系の血漿中に見いだされる浮動性DNAに存在する胎児DNAと母系DNAの混合物から入手可能な遺伝子データから、妊娠中の胎児における異数性の存在または不在を決定することを目的とする診断技法に特に関連性がある。これは、血漿中の胎児DNAの一部分により割合の変化(fraction change)が導かれると、異数性対正倍数性をコールするための最適な閾値が変化することに起因する。胎児画分が降下すると、異数性に関連づけられるデータの分布がますます正倍数性に関連づけられるデータの分布と同様になる。 In some embodiments, the methods disclosed herein can detect the presence or absence of a biological phenomenon or medical condition using maximum likelihood methods. The maximum likelihood method is a substantial improvement over the method using the single hypothesis rejection method, as the threshold for calling the absence or existence of the state can be adjusted appropriately for each case. It is intended to determine the presence or absence of aneuploidy in a pregnant fetus from genetic data available from a mixture of fetal and maternal DNA present in the floating DNA found in maternal plasma. Is particularly relevant to the diagnostic technique used. This is due to the fact that when a portion of fetal DNA in plasma induces a fraction change, the optimal threshold for calling aneuploidy vs. positive ploidy changes. As the fetal fraction descends, the distribution of data associated with aneuploidy becomes more and more similar to the distribution of data associated with positive ploidy.

最尤推定法では、各仮説に関連づけられる分布を使用して、各仮説に対して条件づけたデータの尤度を推定する。次いで、これらの条件的確率を、仮説コールおよび信頼度に変換することができる。同様に、最大事後推定法では、最尤推定と同じ条件的確率を使用するが、最良の仮説を選択し、信頼度を決定する際に前の母集団も組み入れる。 The maximum likelihood estimation method uses the distribution associated with each hypothesis to estimate the likelihood of the data conditioned for each hypothesis. These conditional probabilities can then be converted into hypothetical calls and confidence. Similarly, maximum a posteriori estimation uses the same conditional probabilities as maximum likelihood estimation, but selects the best hypothesis and incorporates the previous population in determining confidence.

したがって、最尤推定(MLE)技法または密接に関連する最大事後(MAP)技法を用いることにより、2つの利点が生じ、まず、正確なコールの見込みが増大し、また、各コールに対して信頼度を算出することが可能になる。ある実施形態では、最大の確率を有する仮説に対応する倍数性状態を選択するステップを、最尤推定または最大事後推定を使用して行う。ある実施形態では、妊娠中の胎児の倍数性状態を決定するための方法であって、単一仮説棄却法を用いる現在当技術分野で公知の任意の方法をとり、それをMLE技法またはMAP技法を用いるように再公式化することを含む方法が開示されている。これらの技法を適用することによって有意に改善することができる方法のいくつかの例は、米国特許第8,008,018号、米国特許第7,888,017号または米国特許第7,332,277号に見いだすことができる。 Therefore, using maximum likelihood estimation (MLE) techniques or closely related maximum a posteriori (MAP) techniques offers two advantages, first of all, increasing the likelihood of an accurate call and trusting each call. It becomes possible to calculate the degree. In one embodiment, the step of selecting the ploidy state corresponding to the hypothesis with the highest probability is performed using maximum likelihood estimation or maximum a posteriori estimation. In certain embodiments, a method for determining the ploidy state of a fetus during pregnancy, which uses any method currently known in the art using a single hypothesis rejection method, is the MLE technique or the MAP technique. Disclosed are methods that include reformalization to use. Some examples of methods that can be significantly improved by applying these techniques are US Pat. No. 8,008,018, US Pat. No. 7,888,017 or US Pat. No. 7,332. It can be found in No. 277.

ある実施形態では、胎児のゲノムDNAおよび母系のゲノムDNAを含む母系の血漿試料における胎児の異数性の存在または不在を決定するための方法であって、母系の血漿試料を得るステップと、血漿試料中に見いだされるDNA断片を、ハイスループットシーケンサーを用いて測定するステップと、配列を染色体にマッピングし、各染色体にマッピングされるシーケンスリード数を決定するステップと、血漿試料中の胎児DNAの割合を算出するステップと、第2の標的染色体が正倍数性である場合に存在すると予測される標的染色体の量の予測される分布、およびその染色体が異数性である場合に予測される1つまたは複数の予測される分布を、胎児画分および正倍数性であることが予測される1個または複数個の参照染色体にマッピングされるシーケンスリード数を使用して算出するステップと、MLEまたはMAPを用いて、どの分布が、正確である可能性が最も高いかを決定し、それにより、胎児の異数性の存在または不在を示すステップとを含む方法が記載されている。ある実施形態では、血漿由来のDNAを測定するステップは、大規模な並行のショットガン配列決定を行うことを包含し得る。ある実施形態では、血漿試料由来のDNAを測定するステップは、例えば、標的化増幅によって、複数の多型遺伝子座または非多型遺伝子座において優先的に富化されたDNAをシークエンシングを包含し得る。複数の遺伝子座を、1つまたは少数の異数性が疑わしい染色体および1つまたは少数の参照染色体を標的とするように設計することができる。優先的に富化することの目的は、倍数性を決定するために情報価値のあるシーケンスリード数を増加させることである。 In one embodiment, a method for determining the presence or absence of fetal aneuploidy in a maternal chromosomal sample comprising fetal and maternal chromosomal DNA, the step of obtaining the maternal plasma sample, and the plasma. A step of measuring DNA fragments found in a sample using a high-throughput sequencer, a step of mapping sequences to chromosomes and determining the number of sequence reads mapped to each chromosome, and the proportion of fetal DNA in a plasma sample. And the predicted distribution of the amount of target chromosome that is predicted to be present if the second target chromosome is positive multiple, and one that is predicted if that chromosome is aneuploid. Or a step to calculate multiple predicted distributions using the number of sequence reads mapped to one or more reference chromosomes predicted to be fetal fractions and positive multiples, and MLE or MAP. Is used to determine which distribution is most likely to be accurate, thereby describing a method comprising a step indicating the presence or absence of fetal aneuploidy. In certain embodiments, the step of measuring plasma-derived DNA may include performing large-scale parallel shotgun sequencing. In one embodiment, the step of measuring DNA from a plasma sample comprises sequencing DNA that is preferentially enriched at multiple polymorphic or non-polymorphic loci, eg, by targeted amplification. obtain. Multiple loci can be designed to target one or a few suspected aneuploidy chromosomes and one or a few reference chromosomes. The purpose of preferential enrichment is to increase the number of informative sequence reads to determine ploidy.

倍数性コールのインフォマティクスによる方法
本明細書には、配列データを考慮して胎児の倍数性状態を決定するための方法が記載されている。いくつかの実施形態では、この配列データは、ハイスループットシーケンサーで測定することができる。いくつかの実施形態では、配列データは、母系の血液から単離された浮動性DNAを起源とするDNAについて測定することができ、ここで、浮動性DNAは、いくらかの母体起源のDNA、およびいくらかの胎児/胎盤起源のDNAを含む。このセクションでは、分析された混合物中の胎児DNAの割合は未知であり、データから推定されると仮定して胎児の倍数性状態を決定する本開示の一実施形態が記載される。混合物中の胎児DNAの割合(「胎児画分」)または胎児DNAの百分率を別の方法によって測定することができ、また、それが胎児の倍数性状態の決定において既知であると仮定される実施形態も記載される。いくつかの実施形態では、胎児DNAと母系DNAの混合物である母系の血液試料自体に対して行った遺伝子型決定測定値のみを使用して胎児画分を算出することができる。いくつかの実施形態では、測定されたか、または別の方法で既知である母親の遺伝子型および/または測定されたか、または別の方法で既知である父親の遺伝子型を用いてその割合を算出することもできる。別の実施形態では、胎児の倍数性状態は、単に、問題の染色体について算出された胎児DNAの割合に基づいて、ダイソミーであると仮定される参照染色体について算出された胎児DNAの割合と比較して決定することができる。
Informatics Method of Ploidy Calls This specification describes a method for determining the ploidy state of a fetus in consideration of sequence data. In some embodiments, this sequence data can be measured with a high throughput sequencer. In some embodiments, sequence data can be measured for DNA originating from floating DNA isolated from maternal blood, where the floating DNA is DNA of some maternal origin, and. Contains some fetal / placental origin DNA. This section describes one embodiment of the present disclosure that determines the ploidy state of the fetus assuming that the proportion of fetal DNA in the analyzed mixture is unknown and is estimated from the data. The proportion of fetal DNA in the mixture (“fetal fraction”) or the percentage of fetal DNA can be measured by another method, and it is assumed that it is known in determining the ploidy state of the fetus. The morphology is also described. In some embodiments, the fetal fraction can be calculated using only genotyping measurements made on the maternal blood sample itself, which is a mixture of fetal DNA and maternal DNA. In some embodiments, the proportion is calculated using the genotype of the mother measured or otherwise known and / or the genotype of the father measured or otherwise known. You can also do it. In another embodiment, the ploidy state of the fetus is simply compared to the proportion of fetal DNA calculated for the reference chromosome that is supposed to be disomy, based on the proportion of fetal DNA calculated for the chromosome in question. Can be decided.

好ましい実施形態では、特定の染色体について、N個のSNPを観察し、解析する場合、
・NR個の浮動性DNA配列測定値の集合S=(s,...,sNR)となる。この方法では、SNP測定値を利用するので、非多型の遺伝子座に対応する配列データは全て無視することができる。単純化形では、各SNPに対して計数値(A,B)が得られ、AおよびBが、所与の遺伝子座に存在する2つの対立遺伝子に対応する場合、SはS=((a,b),...,(a,b))と書くことができ、式中、aはSNP i上のA計数値であり、bはSNP i上のB計数値であり、Σi=1:N(a+b)=NRであり、また
・親のデータは、
〇SNPマイクロアレイまたは他の強度に基づく遺伝子型決定プラットフォームからの
遺伝子型:母親M=(m,...,m)、父親F=(f,...,f)、m,f∈(AA,AB,BB)、および/または
〇配列データ測定値:NRM個の母親の測定値SM=(sm,...,smnrm)、NRF個の父親の測定値SF=(sf,...,sfnrf)から構成される。上記の単純化と同様、各SNPについて計数値(A,B)が得られる場合、SM=((am,bm),...,(am,bm))、SF=((af,bf),...,(af,bf))となる。
In a preferred embodiment, when observing and analyzing N SNPs for a particular chromosome,
-A set of NR floating DNA sequence measured values S = (s 1 , ..., s NR ). Since this method uses SNP measurements, all sequence data corresponding to non-polymorphic loci can be ignored. In the simplified form, a count value (A, B) is obtained for each SNP, and if A and B correspond to two alleles present at a given locus, then S = ((a). It can be written as 1 , b 1 ), ..., (a N , b N )), where a i is the A count value on the SNP i and bi is the B count value on the SNP i. Σ i = 1: N ( ai + bi) = NR, and ・ The parent data is
〇 Genotypes from SNP microarrays or other intensity-based genotyping platforms: mother M = (m 1 , ..., m N ), father F = (f 1 , ..., f N ), mi , Fi ∈ (AA, AB, BB), and / or 〇 Sequence data measurements: NRM mother's measurements SM = (sm 1 , ..., sm nrm ), NRF father's measurements SF = (Sf 1 , ..., sf nrf ). Similar to the above simplification, if a count value (A, B) is obtained for each SNP, SM = ((am 1 , bm 1 ), ..., (am N , bm N )), SF = (((am 1, bm 1)). af 1 , bf 1 ), ..., (af N , bf N )).

まとめて、母親、父親、子のデータはD=(M,F,SM,SF,S)で示される。親のデータの取得が望ましく、それによりアルゴリズムの正確度が上昇するが、親のデータ、特に父親のデータは必ずしも必要ではないことに留意されたい。これは、母親および/または父親のデータの不在下でさえ、非常に正確なコピー数の結果を得ることが可能であることを意味する。 Collectively, mother, father, and child data are indicated by D = (M, F, SM, SF, S). It should be noted that acquisition of parental data is desirable, which increases the accuracy of the algorithm, but parental data, especially paternal data, is not always necessary. This means that it is possible to obtain highly accurate copy count results even in the absence of mother and / or father data.

データの対数尤度LIK(D|H)を、考えられる仮説(H)全てにわたって最大にすることによって最良のコピー数の推定値(H†*)を導くことが可能である。特に、倍数性仮説のそれぞれの相対的確率は、同時分布モデルおよび調製された試料において測定された対立遺伝子数を用いて、また、以下の通り正確である可能性が最も高い仮説を決定することが可能である:

Figure 0007027468000001
同様に事後仮説尤度は、データを考慮すると:
Figure 0007027468000002
と書くことができ、式中、priorprob(H)はモデル設計および以前の知見に基づいて各仮説Hに割り当てられた事前確率である。
事前確率を用いて最大事後推定値を得ることも可能である:
Figure 0007027468000003
It is possible to derive the best copy count estimate (H † * ) by maximizing the log-likelihood LIK (D | H) of the data over all possible hypotheses (H). In particular, the relative probabilities of each of the ploidy hypotheses should use the joint distribution model and the number of alleles measured in the prepared sample to determine the hypothesis most likely to be accurate as follows: Is possible:
Figure 0007027468000001
Similarly, the posterior hypothesis likelihood is:
Figure 0007027468000002
In the equation, the priorprob (H) is the prior probability assigned to each hypothesis H based on the model design and previous findings.
It is also possible to obtain the maximum a posteriori estimate using prior probabilities:
Figure 0007027468000003

ある実施形態では、考慮に入れることができるコピー数仮説は、以下である:
・モノソミー:
○ 母系H10(母親由来の1つのコピー)
○ 父系H01(父親由来の1つのコピー)
・ダイソミー:H11(母親および父親それぞれにつき1つのコピー)
・単純なトリソミー、乗換えは考慮しない:
○ 母系:H21_一致(母親由来の2つの同一のコピー、父親由来の1つのコピー)、H21_不一致(母親由来の両方のコピー、父親由来の1つのコピー)
○父系:H12_一致(母親由来の1つのコピー、父親由来の2つの同一のコピー)、H12_不一致(母親由来の1つのコピー、父親由来の両方のコピー)
・複合トリソミー、乗換えを考慮する(同時分布モデルを用いる):
○ 母系H21(母親由来の2つのコピー、父親由来の1つのコピー)、
○ 父系H12(母親由来の1つのコピー、父親由来の2つのコピー)
In one embodiment, the copy number hypothesis that can be taken into account is:
・ Monosomy:
○ Maternal H10 (one copy from the mother)
○ Patriline H01 (one copy from the father)
Dysomy: H11 (one copy for each mother and father)
・ Simple trisomy, transfer is not considered:
○ Matrilineal: H21_match (two identical copies from the mother, one copy from the father), H21_mismatch (both copies from the mother, one copy from the father)
○ Patriline: H12_match (one copy from the mother, two identical copies from the father), H12_mismatch (one copy from the mother, both copies from the father)
・ Consider compound trisomy and transfer (using joint distribution model):
○ Matrilineal H21 (two copies from the mother, one copy from the father),
○ Patrilineal H12 (one copy from the mother, two copies from the father)

他の実施形態では、他の倍数性状態、例えば、ゼロ染色体性(H00)、片親性ダイソミー(H20およびH02)、およびテトラソミー(H04、H13、H22、H31およびH40)を考慮することができる。 In other embodiments, other polyploid states such as zero chromosomal (H00), uniparental disomy (H20 and H02), and tetrasomy (H04, H13, H22, H31 and H40) can be considered.

乗換えがない場合、起源が有糸分裂、減数分裂Iまたは減数分裂IIのいずれにしろ、各トリソミーは、一致トリソミーまたは不一致トリソミーのうちの一方になる。乗換えに起因して、真のトリソミーは通常、2つの組み合わせになる。まず、単純仮説について仮説の尤度を導く方法が記載されている。次に、個々のSNP尤度を乗換えと組み合わせた複合仮説について仮説の尤度を導く方法が記載されている。 In the absence of crossover, each trisomy, whether of mitosis, meiosis I or meiosis II, is either a matched trisomy or a mismatched trisomy. Due to the transfer, the true trisomy is usually a combination of the two. First, a method for deriving the likelihood of a hypothesis for a simple hypothesis is described. Next, a method for deriving the likelihood of a hypothesis for a composite hypothesis in which individual SNP likelihoods are combined with crossover is described.

単純仮説についてのLIK(D|H)
ある実施形態では、単純仮説について、以下の通りLIK(D|H)を決定することができる。単純仮説Hについて、染色体全体についての仮説Hの対数尤度LIK(H)を、既知のまたは導かれた子の割合cfを仮定して、個々のSNPの対数尤度の合計として算出することができる。ある実施形態では、データからcfを導くことが可能である。

Figure 0007027468000004
この仮説では、いかなるSNP間の連鎖も仮定せず、したがって、同時分布モデルを利用しない。 LIK (D | H) about the simple hypothesis
In one embodiment, for a simple hypothesis, LIK (D | H) can be determined as follows. For the simple hypothesis H, the log-likelihood LIK (H) of the hypothesis H for the entire chromosome can be calculated as the sum of the log-likelihoods of the individual SNPs, assuming a known or derived child ratio cf. can. In certain embodiments, it is possible to derive cf from the data.
Figure 0007027468000004
This hypothesis does not assume a chain between any SNPs and therefore does not utilize a joint distribution model.

いくつかの実施形態では、SNPごとに対数尤度を決定することができる。特定のSNP iについて、胎児の倍数性についての仮説Hおよびパーセント胎児DNA cfを仮定すると、観察されたデータDの対数尤度は、

Figure 0007027468000005
と定義され、式中、mは可能性のある真の母親の遺伝子型であり、fは可能性のある真の父親の遺伝子型であり、m,f∈{AA,AB,BB}であり、cは、仮説Hを考慮した、可能性のある子の遺伝子型である。特に、モノソミーについてはc∈{A,B}であり、ダイソミーについてはc∈{AA,AB,BB}であり、トリソミーについてはc∈{AAA,AAB,ABB,BBB}である。 In some embodiments, the log-likelihood can be determined for each SNP. Assuming hypothesis H and percent fetal DNA cf for fetal ploidy for a particular SNP i, the log-likelihood of the observed data D is
Figure 0007027468000005
In the formula, m is the genotype of the possible true mother, f is the genotype of the possible true father, and m, f ∈ {AA, AB, BB}. , C are genotypes of possible offspring, taking into account Hypothesis H. In particular, c ∈ {A, B} for monosomy, c ∈ {AA, AB, BB} for disomy, and c ∈ {AAA, AAB, ABB, BBB} for trisomy.

遺伝子型事前頻度:p(m|i)は、SNP Iにおける既知の母集団頻度に基づくSNP iにおける母親の遺伝子型mの一般的な事前確率であり、pAiで示される。具体的には、
p(AA|pA)=(pA,p(AB|pA)=2(pA)*(1-pA),p(BB|pA)=(1-pA
父親の遺伝子型の確率、p(f|i)も同様に決定することができる。
Genotype Prior Frequency: p (m | i) is the general prior probability of the maternal genotype m in SNP i based on the known population frequency in SNP I and is represented by pAi. In particular,
p (AA | pA i ) = (pA i ) 2 , p (AB | pA i ) = 2 (pA i ) * (1-pA i ), p (BB | pA i ) = (1-pA i ) 2
The probability of the paternal genotype, p (f | i), can be determined in the same way.

真の子の確率:p(c|m,f,H)は、親m、f、および仮定している仮説Hを考慮して真の子の遺伝子型=cが得られる確率であり、これは容易に算出することができる。例えば、H11、H21一致およびH21不一致についてのp(c|m,f,H)が以下に示されている。

Figure 0007027468000006
True child probability: p (c | m, f, H) is the probability that the true child genotype = c is obtained in consideration of the parent m, f, and the hypothesis H. Can be easily calculated. For example, p (c | m, f, H) for H11, H21 match and H21 disagreement are shown below.
Figure 0007027468000006

データの尤度:P(D|m,f,c,H,i,cf)は、真の母親の遺伝子型m、真の父親の遺伝子型f、真の子の遺伝子型c、仮説Hおよび子の割合cfを考慮したSNP iにおける所与のデータDの確率である。これは、以下の通り母親、父親および子データの確率に分解することができる:
P(D|m,f,c,H,cf,i)=P(SM|m,i)P(M|m,i)P(SF|f,i)P(F|f,i)P(S|m,c,H、cf,i)
Data likelihood: P (D | m, f, c, H, i, cf) is the genotype m of the true mother, the genotype f of the true father, the genotype c of the true child, the hypothesis H and The probability of a given data D in SNP i taking into account the proportion cf of the offspring. It can be decomposed into probabilities of mother, father and child data as follows:
P (D | m, f, c, H, cf, i) = P (SM | m, i) P (M | m, i) P (SF | f, i) P (F | f, i) P (S | m, c, H, cf, i)

母親のSNPアレイデータの尤度:SNPアレイ遺伝子型が正確であると仮定して、真の遺伝子型mと比較した、SNP iにおける母親のSNPアレイ遺伝子型データの確率mは、単に、

Figure 0007027468000007
である。 Probability of maternal SNP array data: Assuming that the SNP array genotype is accurate, the probability mi of the maternal SNP array genotype data in SNP i compared to the true genotype m is simply:
Figure 0007027468000007
Is.

母親の配列データの尤度:SNP iにおける母親の配列データの確率は、計数値S=(am,bm)の場合には、余分のノイズまたは偏りを伴わず、P(SM|m,i)=PX|m(am)と定義される二項確率であり、ここで、X|m~Binom(p(A),am+bm)であり、p(A)は下表に示す値である。

Figure 0007027468000008
Likelihood of mother's sequence data: The probability of mother's sequence data in SNP i is P (SM | m) without extra noise or bias when the count value S i = (ami i , bmi). , I) = binomial probability defined as PX | m (am i ), where X | m to Binom (pm (A), am i + bm i ), pm (A). Is the value shown in the table below.
Figure 0007027468000008

父親のデータの尤度:同様の式が父親のデータの尤度にも当てはまる。親のデータ、特に父親のデータを用いずに子の遺伝子型を決定することが可能であることに留意されたい。例えば、父親の遺伝子型データFが利用可能でない場合、単にP(F|f,i)=1を使用することができる。父親の配列データSFが利用可能でない場合、単にP(SF|f,i)=1を使用することができる。 Likelihood of father's data: A similar formula applies to the likelihood of father's data. Note that it is possible to genotype the offspring without using parental data, especially paternal data. For example, if paternal genotype data F is not available, then simply P (F | f, i) = 1 can be used. If the father's sequence data SF is not available, then simply P (SF | f, i) = 1 can be used.

いくつかの実施形態では、前記方法は、各倍数性仮説について、染色体上の複数の多型遺伝子座において予測される対立遺伝子数についての同時分布モデルを構築することを伴い、そのような目的を実現するための1つの方法がここに記載されている。遊離の胎児DNAデータの尤度:P(S|m,c,H,cf,i)は、SNP iにおける遊離の胎児DNA配列データの確率であり、真の母親の遺伝子型m、真の子の遺伝子型c、子のコピー数仮説Hを考慮し、子の割合cfを仮定する。これは、実際、SNP iにおけるA含量の真の確率μ(m,c,cf,H)を考慮したSNP Iにおける配列データSの確率P(S|m,c,H,cf,i)=P(S|μ(m,c,cf,H),i)である。
計数値に関しては、S=(a,b)であり、データに余分のノイズまたは偏りを伴わない場合、
P(S|μ(m,c,cf,H),i)=P(a
となり、式中、X~Binom(p(A),a+b)であり、p(A)=μ(m,c,cf,H)である。正確なアラインメントおよびSNP当たりの(A,B)計数値が未知の、より複雑な場合には、P(S|μ(m,c,cf,H),i)は積分した二項式の組み合わせである。
In some embodiments, the method comprises constructing a joint distribution model for the expected number of alleles at multiple polymorphic loci on the chromosome for each ploidy hypothesis, for such purpose. One method for achieving this is described here. Probability of free fetal DNA data: P (S | m, c, H, cf, i) is the probability of free fetal DNA sequence data in SNP i, true maternal genotype m, true offspring. Considering the genotype c of the gene and the copy number hypothesis H of the offspring, the proportion cf of the offspring is assumed. This is, in fact, the probability P (S | m, c, H, cf, i) of the sequence data S in SNP I considering the true probability μ (m, c, cf, H) of the A content in SNP i = P (S | μ (m, c, cf, H), i).
With respect to the count value, if S i = ( ai , bi ) and the data is not accompanied by extra noise or bias.
P (S | μ (m, c, cf, H), i) = P x ( ai )
In the equation, X to Binomi (p (A), ai + bi), and p (A) = μ (m, c, cf, H). If the exact alignment and (A, B) counts per SNP are unknown and more complex, then P (S | μ (m, c, cf, H), i) is a combination of integrated binomials. Is.

真のA含量の確率:この母親/子混合物におけるSNP iにおけるA含量の真の確率μ(m,c,cf,H)は、真の母親の遺伝子型=m、真の子の遺伝子型=c、および全体的な子の割合=cfと仮定して、

Figure 0007027468000009
と定義され、式中、#A(g)=遺伝子型gにおけるAの数であり、n=2は、母親のソミーであり、nは仮説Hの下での子の倍数性である(1はモノソミーであり、2はダイソミーであり、3はトリソミーである)。 Probability of true A content: The true probability μ (m, c, cf, H) of A content in SNP i in this mother / child mixture is true mother genotype = m, true child genotype = Assuming c, and the overall proportion of children = cf,
Figure 0007027468000009
In the formula, # A (g) = the number of A in genotype g, nm = 2 is the mother's trisomy, and n c is the polyploidy of the offspring under hypothesis H. (1 is monosomy, 2 is disomy, and 3 is trisomy).

同時分布モデルの使用:複合仮説についてのLIK(D|H)
いくつかの実施形態では、この方法は、各倍数性仮説について、染色体上の複数の多型遺伝子座において、予測される対立遺伝子数の同時分布モデルを構築することを伴い、そのような目的を実現するための1つの方法がここに記載されている。多くの場合、トリソミーは、通常、乗換えに起因して、純粋に一致または不一致ではなく、したがって、このセクションでは、可能性のある乗換えを考慮に入れて、一致トリソミーと不一致トリソミーが組み合わされた複合仮説H21(母系トリソミー)およびH12(父系トリソミー)についての結果が導かれる。
Use of joint distribution model: LIK (D | H) for compound hypothesis
In some embodiments, this method involves constructing a joint distribution model of the predicted allele numbers at multiple polymorphic loci on the chromosome for each ploidy hypothesis, with such objectives. One method for achieving this is described here. In many cases, trisomy is not purely a match or mismatch, usually due to a transfer, so in this section, a composite of matched and mismatched trisomy, taking into account possible transfers. Results are derived for the hypotheses H21 (maternal trisomy) and H12 (paternal trisomy).

トリソミーの場合には、乗換えがなければ、トリソミーは単に一致トリソミーまたは不一致トリソミーになる。一致トリソミーとは、子が一方の親由来の同一染色体セグメントの2つのコピーを遺伝によって受け継ぐ場合である。不一致トリソミーとは、子が親由来の各相同染色体セグメントの1つのコピーを遺伝によって受け継ぐ場合である。乗換えにより、染色体の一部のセグメントが一致トリソミーを有する場合もあり、他の部分が、不一致トリソミーを有してもよい。このセクションには、対立遺伝子の集合について、ヘテロ接合率について、すなわち、1個または複数個の仮説について、いくつもの遺伝子座における予測される対立遺伝子数の同時分布モデルをどのように構築するかが記載されている。 In the case of trisomy, if there is no transfer, the trisomy is simply a matching trisomy or a disagreeing trisomy. Trisomy coincidence is when the offspring inherits two copies of the same chromosomal segment from one parent. Mismatch trisomy is when the offspring inherits one copy of each homologous chromosomal segment from the parent. By crossover, some segments of the chromosome may have a matching trisomy and other parts may have a mismatched trisomy. This section describes how to build a joint distribution model of the predicted number of alleles at multiple loci for a set of alleles, for heterozygotes, that is, for one or more hypotheses. Are listed.

SNP iに対し、LIK(D|Hm,i)は、一致仮説Hに対する適合であり、LIK(D|Hu,i)は、不一致仮説Hに対する適合であり、pc(i)=SNP i-1とSNP iの間の乗換えの確率であると仮定する。このとき、完全な尤度を以下の通り算出することができる:

Figure 0007027468000010
式中、LIK(D|E,1:N)は、SNP 1:Nについての仮説Eの最終尤度である。E=最後のSNPの仮説であり、E∈(Hm,Hu)である。再帰的に、以下を算出することができる:
Figure 0007027468000011
式中、~EはE以外の仮説(非E)であり、考慮される仮説はHおよびHである。詳細には、1:i SNPの尤度を、1から(i-1)までのSNPの尤度に基づいて、同じ仮説で乗換えなしか、または逆の仮説で乗換えありのいずれかを用い、SNP iの尤度を乗じて算出することができる:
SNP 1に対し、i=1、LIK(D|E,1:1)=LIK(D|E,1)、
SNP 2に対し、i=2、LIK(D|E,1:2)=LIK(D|E,2)+log(exp(LIK(D|E,1))*(1-pc(2))+exp(LIK(D|~E,1))*pc(2))、
また、i=3:Nについても同様である。 For SNP i, LIK (D | Hm, i) is a fit for the concordance hypothesis H m , LIK (D | Hu, i) is a fit for the disagreement hypothesis Hu, pc (i) = SNP i. It is assumed that it is the probability of transfer between -1 and SNP i. At this time, the complete likelihood can be calculated as follows:
Figure 0007027468000010
In the equation, LIK (D | E, 1: N) is the final likelihood of hypothesis E for SNP 1: N. E = the last SNP hypothesis, E ∈ (Hm, Hu). Recursively, the following can be calculated:
Figure 0007027468000011
In the equation, ~ E is a hypothesis other than E (non-E), and the hypotheses considered are H m and Hu . Specifically, the likelihood of 1: i SNP is either not transferred with the same hypothesis or with transfer with the opposite hypothesis based on the likelihood of SNP from 1 to (i-1). Can be calculated by multiplying the likelihood of SNP i:
For SNP 1, i = 1, LIK (D | E, 1: 1) = LIK (D | E, 1),
For SNP 2, i = 2, LIK (D | E, 1: 2) = LIK (D | E, 2) + log (exp (LIK (D | E, 1)) * (1-pc (2)) + Exp (LIK (D | ~ E, 1)) * pc (2)),
The same applies to i = 3: N.

いくつかの実施形態では、子の割合(fraction)を決定することができる。子の割合とは、DNAの混合物における子を起源とする配列の割合(proportion)を指してもよい。非侵襲的な出生前診断との関連において、子の割合とは、母系の血漿における、胎児または胎児の遺伝子型を有する胎盤の部分を起源とする配列の割合を指してもよい。子の割合とは、母系の血漿から調製したDNAの試料中の子の画分を指してもよく、胎児DNAに関して富化されていてよい。DNAの試料中の子の割合を決定する1つの目的は、胎児に関して倍数性コールを行うことができるアルゴリズムにおいて使用するためであり、したがって、子の割合とは、非侵襲的な出生前診断のために配列決定によって分析したいかなるDNAの試料を指してもよい。 In some embodiments, the fraction of children can be determined. The proportion of offspring may refer to the proportion of sequences originating from offspring in a mixture of DNA. In the context of non-invasive prenatal testing, the proportion of offspring may refer to the proportion of sequences originating from the fetal or part of the placenta with the fetal genotype in the maternal plasma. The proportion of offspring may refer to a fraction of offspring in a sample of DNA prepared from maternal plasma and may be enriched with respect to fetal DNA. One purpose of determining the proportion of offspring in a sample of DNA is for use in algorithms that can make multiple calls with respect to the fetus, and therefore the proportion of offspring is a non-invasive prenatal diagnosis. It may refer to a sample of any DNA analyzed for sequencing.

非侵襲的な出生前異数性診断の方法の一部である本開示において示されているアルゴリズムのいくつかは、既知の子の割合を仮定するが、これはいつでもこのようになるわけではない。ある実施形態では、親のデータの存在を含めて、または含めずに、選択された染色体上のダイソミーの尤度を最大にすることによって、最も可能性が高い子の割合を見いだすことが可能である。 Some of the algorithms presented in this disclosure, which are part of a non-invasive method of prenatal aneuploidy diagnosis, assume a known proportion of offspring, but this is not always the case. .. In certain embodiments, it is possible to find the most likely proportion of offspring by maximizing the likelihood of disomy on selected chromosomes, with or without the presence of parental data. be.

詳細には、ダイソミー仮説について、および染色体chr上の子の割合cfについて、上記の通りLIK(D|H11,cf,chr)=対数尤度と仮定する。正倍数性であると仮定した、Csetにおいて選択された染色体(通常、1:16)についての完全な尤度は:

Figure 0007027468000012
である。
最も可能性が高い子の割合(cf†*)は、cf=argmaxcfLIK(cf)として導かれる。 Specifically, for the disomy hypothesis and for the proportion cf of the offspring on the chromosome chr, we assume LIK (D | H11, cf, chr) = log-likelihood as described above. The complete likelihood for the chromosomes selected in Cset (usually 1:16), assumed to be positive polyploidy:
Figure 0007027468000012
Is.
The most likely proportion of offspring (cf † * ) is derived as cf * = argmax cf LIK (cf).

染色体の任意の集合を使用することが可能である。参照染色体における正倍数性を仮定せずに子の割合を導くことも可能である。この方法を用いて、以下の状況のいずれかについて子の割合を決定することが可能である:(1)親に関するアレイデータおよび母系の血漿に関するショットガン配列決定データを有する;(2)親に関するアレイデータおよび母系の血漿に関する標的化配列決定データを有する;(3)親と母系の血漿の両方に関する標的化配列決定データを有する;(4)母親と母系の血漿画分の両方に関する標的化配列決定データを有する;(5)母系の血漿画分に関する標的化配列決定データを有する;(6)親の画分および子の画分の測定値の他の組み合わせ。 It is possible to use any set of chromosomes. It is also possible to derive the proportion of offspring without assuming positive ploidy in the reference chromosome. Using this method, it is possible to determine the proportion of offspring for any of the following situations: (1) have array data for the parent and shotgun sequencing data for the maternal plasma; (2) for the parent. Has array data and targeted sequencing data for maternal plasma; (3) has targeted sequencing data for both parental and maternal plasma; (4) targeted sequences for both maternal and maternal plasma fractions. Has decision data; (5) has targeted sequence determination data for the maternal plasma fraction; (6) other combinations of parental and child fraction measurements.

いくつかの実施形態では、インフォマティクスによる方法により、データドロップアウトを組み入れることができる。これにより、より正確度が高い倍数性の判定結果を得ることができる。本開示の他の箇所において、Aが生じる確率は、真の母親の遺伝子型、真の子の遺伝子型、混合物中の子の割合、および子のコピー数の一次関数であると仮定されている。例えば、混合物中の真の子ABを測定する代わりに、母親または子の対立遺伝子がドロップアウトする可能性もあり、これは対立遺伝子Aにマッピングされる配列のみを測定する場合に起こり得る。ゲノムのイルミナデータについての親のドロップアウト率をdpg、配列データについての親のドロップアウト率をdpsおよび配列データについての子のドロップアウト率をdcsで示すことができる。いくつかの実施形態では、母親のドロップアウト率を0、子のドロップアウト率を比較的低いと仮定することができ、この場合、結果はドロップアウトの影響を大きくは受けない。いくつかの実施形態では、対立遺伝子ドロップアウトの可能性は、それにより予測される倍数性コールに有意な影響がもたらされるのに十分に大きい場合がある。そのような場合、対立遺伝子ドロップアウトをここでアルゴリズムに組み入れる: In some embodiments, data dropouts can be incorporated by informatics methods. This makes it possible to obtain a ploidy determination result with higher accuracy. Elsewhere in the disclosure, the probability of A occurring is assumed to be a linear function of the true mother's genotype, the true offspring genotype, the proportion of offspring in the mixture, and the number of copies of the offspring. .. For example, instead of measuring the true offspring AB in the mixture, the mother or offspring allele may drop out, which can occur if only the sequence mapped to the allele A is measured. The parent dropout rate for genomic illumination data can be indicated by dpg , the parental dropout rate for sequence data can be indicated by dps , and the child dropout rate for sequence data can be indicated by dcs . In some embodiments, it can be assumed that the mother's dropout rate is 0 and the child's dropout rate is relatively low, in which case the results are not significantly affected by the dropout. In some embodiments, the potential for allelic dropouts may be large enough to have a significant effect on the predicted ploidy call. In such cases, incorporate the allele dropout into the algorithm here:

親のSNPアレイデータドロップアウト:母親のゲノムのデータMについて、ドロップアウト後の遺伝子型をmとすると、

Figure 0007027468000013
で、式中、上記と同様に、
Figure 0007027468000014
であり、P(m|m)は、ドロップアウト率dについて以下の通り定義される真の遺伝子型mを考慮した可能性のあるドロップアウト後の遺伝子型mの尤度である
Figure 0007027468000015
同様の式が父親のSNPアレイデータにも当てはまる。 Parental SNP array data dropout: For the mother's genome data M, if the genotype after the dropout is md ,
Figure 0007027468000013
So, in the formula, in the same way as above
Figure 0007027468000014
P (md | m) is the likelihood of post-dropout genotype md that may take into account the true genotype m defined below for the dropout rate d .
Figure 0007027468000015
A similar formula applies to the father's SNP array data.

親の配列データドロップアウト:母親の配列データSMに対し、

Figure 0007027468000016
式中、P(m|m)は前のセクションで定義された通りであり、二項分布からのPx|md(am)確率は、親のデータの尤度セクションにおいて上記の通り定義される。同様の式が父系の配列データにも適用できる。 Parent sequence data dropout: For the mother sequence data SM
Figure 0007027468000016
In the equation, P ( md | m) is as defined in the previous section, and the P x | md ( ami ) probability from the binomial distribution is defined above in the likelihood section of the parent data. Will be done. Similar equations can be applied to patrilineal sequence data.

浮動性DNA配列データドロップアウト:

Figure 0007027468000017
式中、P(S|μ(m,c,cf,H),i)は浮動性のデータの尤度に関するセクションにおいて定義されている通りである。 Floating DNA Sequence Data Dropout:
Figure 0007027468000017
In the equation, P (S | μ ( md , cd , cf, H), i) is as defined in the section on the likelihood of floating data.

ある実施形態では、p(m|m)は、真の母親の遺伝子型mを考慮し、ドロップアウト率dpsを仮定した、観察された母親の遺伝子型mの確率であり、p(c|c)は、真の子の遺伝子型cを考慮し、ドロップアウト率dcsを仮定した、観察された子の遺伝子型cの確率である。nA=真の遺伝子型cにおける対立遺伝子Aの数であり、nA=観察された遺伝子型cにおける対立遺伝子Aの数であり、nA≧nAであり、同様に、nB=真の遺伝子型cにおける対立遺伝子Bの数であり、nB=観察された遺伝子型cにおける対立遺伝子Bの数であり、nB≧nBであり、d=ドロップアウト率であるとすると、

Figure 0007027468000018
である。 In one embodiment, p (md | m) is the probability of the observed maternal genotype md , taking into account the true maternal genotype m and assuming a dropout rate d ps , p ( c d | c) is the probability of the observed offspring genotype cd, taking into account the true offspring genotype c and assuming a dropout rate d cs . nA T = the number of alleles A in the true genotype c , nA D = the number of alleles A in the observed genotype cd, nA T ≥ nA D , and similarly nBT =. Suppose that the number of alleles B in the true genotype c, nB D = the number of alleles B in the observed genotype c d , nBTnBD , and d = dropout rate. ,
Figure 0007027468000018
Is.

ある実施形態では、インフォマティクスによる方法により、ランダムな偏りおよび一貫した偏りが組み入れられる可能性がある。理想的に言えば、配列計数値にSNP当たりの一貫したサンプリングの偏りまたはランダムなノイズ(二項分布の変動に加えて)は存在しない。詳細には、SNP iにおいて、母親の遺伝子型m、真の子の遺伝子型cおよび子の割合cf、およびX=SNP iにおける(A+B)リードの集合内のAの数に対して、XはX~Binomial(p,A+B)として作用し、p=μ(m,c,cf,H)=A含量の真の確率である。 In some embodiments, the informatics method may incorporate random and consistent biases. Ideally, there is no consistent sampling bias or random noise (in addition to binomial distribution variation) per SNP in the sequence counts. Specifically, in SNP i, X is for the genotype m of the mother, the genotype c of the true offspring and the proportion cf of the offspring, and the number of A in the set of (A + B) reads at X = SNP i. Acting as X to Binomial (p, A + B), p = μ (m, c, cf, H) = true probability of A content.

ある実施形態では、インフォマティクスによる方法により、ランダムな偏りが組み入れられる可能性がある。大抵の場合、測定値に偏りがあると仮定し、したがってこのSNPにおいてAが生じる確率は、上で定義されたpとは少し異なるqに等しい。pとqがどのくらい異なるかは、測定プロセスの正確度および他の因子の数に左右され、pから離れたqの標準偏差によって定量化することができる。ある実施形態では、qを、ベータ分布を有するとしてpに集中したその分布の平均に応じたパラメータα、β、および一部の特定の標準偏差sを用いてモデリングすることが可能である。詳細には、これによりX|q~Bin(q,D)がもたらされ、q~Beta(α,β)である。E(q)=p、V(q)=sとすれば、パラメータα、βはα=pN、β=(1-p)Nとして導くことができ、

Figure 0007027468000019
である。 In some embodiments, the informatics method may incorporate random bias. In most cases, we assume that the measurements are biased, so the probability of an A occurring in this SNP is equal to q, which is slightly different from p as defined above. How different p and q are depends on the accuracy of the measurement process and the number of other factors and can be quantified by the standard deviation of q away from p. In certain embodiments, q can be modeled with parameters α, β, and some specific standard deviations s, depending on the average of the distributions concentrated on p as having a beta distribution. Specifically, this results in X | q-Bin (q, Di ), q-Beta (α, β). If E (q) = p and V (q) = s 2 , the parameters α and β can be derived as α = pN and β = (1-p) N.
Figure 0007027468000019
Is.

これはベータ二項分布の定義であり、可変性のパラメータqを伴う二項分布からサンプリングし、qは平均のpを有するベータ分布に従う。したがって、偏りがないセットアップでは、SNP iにおいて、真の母親の遺伝子型(m)を仮定し、SNP i上の母親の配列A計数値(am)およびSNP i上の母親の配列B計数値(bm)を考慮した親の配列データ(SM)確率を以下の通り算出することができる:P(SM|m,i)=PX|m(am)、ここで、X|m~Binom(p(A),am+bm)である。 This is the definition of a beta-binomial distribution, sampled from a binomial distribution with the parameter q of variability, where q follows a beta distribution with mean p. Therefore, in an unbiased setup, in SNP i, the true mother genotype (m) is assumed, and the mother's sequence A count value (am i ) on SNP i and the sequence B count value of the mother on SNP i. The parental sequence data (SM) probabilities considering (bm i ) can be calculated as follows: P (SM | m, i) = PX | m (am i ), where X | m ~. Binom (pm (A), am i + bm i ).

ここで、標準偏差sを有するランダムな偏りを含めると、以下になる:
X|m~BetaBinom(p(A),am+bm,s)。
Here, including a random bias with standard deviation s:
X | m to BetaBinom (pm (A), am i + bm i , s).

偏りがない場合には、真の母親の遺伝子型(m)、真の子の遺伝子型(c)、子の割合(cf)を仮定し、子の仮説Hを仮定し、SNP i上の浮動性DNA配列A計数値(ai)およびSNP i上の浮動性配列B計数値(bi)を考慮した母系の血漿DNA配列データ(S)確率を以下の通り算出することができる:
P(S|m,c,cf,H,i)=Px(a
式中、X~Binom(p(A),a+b)、p(A)=μ(m,c,cf,H)。
If there is no bias, the true mother genotype (m), true child genotype (c), and child proportion (cf) are assumed, the child hypothesis H is assumed, and floating on SNP i. The maternal plasma DNA sequence data (S) probability considering the sex DNA sequence A count value (ai) and the floating sequence B count value (bi) on SNP i can be calculated as follows:
P (S | m, c, cf, H, i) = Px ( ai )
In the formula, X to Binom (p (A), ai + bi), p (A) = μ (m, c, cf, H).

ある実施形態では、標準偏差sを有するランダムな偏りを含めると、これはX~BetaBinom(p(A),a+b、s)になり、余分の変動の量は偏差パラメータsまたは同等にNによって指定される。sの値が小さいほど(またはNの値が大きいほど)この分布は標準的な二項分布に近づく。偏りの量を推定すること、すなわち上記のNを、明白な状況AA|AA、BB|BB、AA|BB、BB|AAから、上記の確率における推定:

Figure 0007027468000020
を用いて推定することが可能である。データの挙動に応じて、Nを、リード深度a+bまたはa+bの関数に関係なく一定になるようにし、これにより、より大きなリード深度に対して偏りをより小さくすることができる。 In one embodiment, including a random bias with standard deviation s, this is X- BetaBiom (p (A), ai + bi, s) and the amount of extra variation is the deviation parameter s or equivalent. Specified by N. The smaller the value of s (or the larger the value of N), the closer this distribution is to the standard binomial distribution. Estimating the amount of bias, i.e., estimating the above N from the obvious situations AA | AA, BB | BB, AA | BB, BB | AA:
Figure 0007027468000020
It is possible to estimate using. Depending on the behavior of the data, N can be constant regardless of the function of read depth ai + bi or ai + bi , which can result in less bias for larger read depths. ..

ある実施形態では、インフォマティクスによる方法により、一貫したSNPごとの偏りが組み入れられる可能性がある。配列決定プロセスのアーチファクトに起因して、一部のSNPは、真のA含量に関係なく、一貫して低いまたは高い計数値を有し得る。SNP iが一貫してA計数値に対してwパーセントの偏りを加えると仮定する。いくつかの実施形態では、この偏りを、同じ条件で導かれたトレーニングデータの集合から推定し、以下のように親の配列データ推定値に戻すことができる:
P(SM|m,i)=PX|m(am)<ここで、X|m~BetaBinom(p(A)+w,am+bm,s)>、
また、浮動性DNA配列データ確率推定値は:
P(S|m,c,cf,H,i)=P(a)<ここで、X~BetaBinom(p(A)+w,a+b,s)>
となる。
In certain embodiments, the informatics method may incorporate a consistent per-SNP bias. Due to the artifacts in the sequencing process, some SNPs may have consistently low or high counts, regardless of their true A content. Suppose SNP i consistently adds a wi percent bias to the A count value. In some embodiments, this bias can be estimated from a set of training data derived under the same conditions and returned to the parent sequence data estimate as follows:
P (SM | m, i) = PX | m (am i ) <Here, X | m to BetaBinom (pm (A) + wi, am i + bm i , s ) >,
Also, the floating DNA sequence data probability estimate is:
P (S | m, c, cf, H, i ) = PX ( ai ) <Here, X to BetaBinom (p (A) + wi, ai + bi, s)>
Will be.

いくつかの実施形態では、前記方法は、特にさらに別のノイズ、示差的な試料の質、示差的なSNPの質、およびランダムサンプリングの偏りを考慮に入れて書くことができる。この例はここに示されている。この方法は、データを大規模に多重化されたmini-PCRプロトコールを使用して生成した状況において特に有用であることが示されており、これを実験7~13において用いた。前記方法は、それぞれが最終のモデルに異なる種類のノイズおよび/または偏りを導入するいくつかのステップを伴う:
(1)母系DNAと胎児DNAの混合物を含む第1の試料は、サイズ=N分子、通常、1,000~40,000の範囲、p=真の%refの元のDNAの量を含有すると仮定する。
(2)ユニバーサルライゲーションアダプタを使用した増幅において、N分子がサンプリングされると仮定する;通常、サンプリングに起因してN~N/2分子およびランダムサンプリングの偏りが導入される。増幅された試料は、いくつもの分子Nを含有してよく、N>>Nである。XはNサンプリングされた分子のうちの参照遺伝子座の量(SNPごと)を示し、プロトコールの残り全体を通してランダムサンプリングの偏りを導入するp=X/Nの変動を伴うとする。このサンプリングの偏りを、単純な二項分布モデルを使用する代わりにベータ二項(BB)分布を使用することによってモデルに含める。ベータ二項分布のパラメータNを後で、試料ごとに、0<p<1のSNPについて漏れおよび増幅の偏りを調整した後に、トレーニングデータから推定することができる。漏れは、SNPが不正確に読み取られる傾向である。
(3)増幅ステップにより、対立遺伝子のあらゆる偏りが増幅され、したがって、可能性のある一様でない増幅によって増幅の偏りが導入される。遺伝子座における一方の対立遺伝子がf倍に増幅され、その遺伝子座における他方の対立遺伝子がg倍に増幅されると仮定すると、f=geであり、b=0は偏りがないことを示す。偏りパラメータbは0に集中し、特定のSNPにおいて対立遺伝子Aが対立遺伝子Bと対照的にどのくらい多くまたは少なく増幅されたかを示す。パラメータbは、SNPによって異なってよい。偏りパラメータbは、SNPごとに、例えば、トレーニングデータから推定することができる。
(4)配列決定ステップは、増幅された分子の試料について配列決定するステップを包含する。このステップでは、漏れが存在する可能性があり、漏れとは、SNPが不正確に読み取られる状況である。漏れは、様々な問題に起因する可能性があり、漏れの結果、SNPは、正確な対立遺伝子Aとして読み取られないが、その遺伝子座において見いだされる別の対立遺伝子Bとして、または一般にはその遺伝子座において見いだされない対立遺伝子CまたはDとして読み取られる。配列決定により、サイズN、N<Nの増幅された試料からいくつものDNA分子の配列データが測定されると仮定する。いくつかの実施形態では、Nは、20,000~100,000;100,000~500,000;500,000~4,000,000;4,000,000~20,000,000;または20,000,000~100,000,000の範囲内であってよい。サンプリングされた各分子は正確に読み取られた確率pを有し、その場合、正確に対立遺伝子Aとして示される。試料は、確率1-pgで元の分子と無関係の対立遺伝子として不正確に読み取られ、確率prで対立遺伝子Aのようであり、確率pで対立遺伝子Bのようであり、または確率pで対立遺伝子Cまたは対立遺伝子Dのようであり、p+p+p=1である。パラメータp、p、p、pは、SNPごとに、トレーニングデータから推定する。
In some embodiments, the method can be written specifically taking into account yet another noise, differential sample quality, differential SNP quality, and random sampling bias. An example of this is shown here. This method has been shown to be particularly useful in situations where data was generated using a extensively multiplexed mini-PCR protocol, which was used in Experiments 7-13. Each of these methods involves several steps to introduce different types of noise and / or bias into the final model:
(1) The first sample containing a mixture of maternal DNA and fetal DNA contains size = N0 molecules, usually in the range 1,000-40,000, p = amount of original DNA with true% ref. Then assume.
(2) In amplification using a universal ligation adapter, it is assumed that N1 molecules are sampled; usually, N1 to N0 / 2 molecules and a random sampling bias are introduced due to sampling. The amplified sample may contain a number of molecules N 2 and is N 2 >> N 1 . X 1 indicates the amount of reference loci (per SNP) in the N 1 sampled molecule, with a variation of p 1 = X 1 / N 1 that introduces a random sampling bias throughout the rest of the protocol. .. This sampling bias is included in the model by using a beta binomial (BB) distribution instead of using a simple binomial distribution model. The beta-binomial distribution parameter N can later be estimated from the training data after adjusting for leakage and amplification bias for SNPs of 0 <p <1 for each sample. Leaks tend to cause SNPs to be read inaccurately.
(3) The amplification step amplifies any allele bias and thus introduces an amplification bias with possible non-uniform amplification. Assuming that one allele at the locus is amplified f-fold and the other allele at that locus is amplified g-fold, then f = ge b and b = 0 indicates that there is no bias. .. The bias parameter b concentrates on 0 and indicates how much or less allele A is amplified in contrast to allele B in a particular SNP. The parameter b may differ depending on the SNP. The bias parameter b can be estimated for each SNP, for example, from training data.
(4) The sequencing step includes the step of sequencing the sample of the amplified molecule. In this step, a leak may be present, which is a situation in which the SNP is read incorrectly. The leak can be due to a variety of problems, and as a result of the leak, the SNP is not read as the exact allele A, but as another allele B found at that locus, or generally the gene. Read as an allele C or D not found in the locus. It is assumed that the sequencing will measure the sequence data of several DNA molecules from the amplified sample of size N 3 , N 3 <N 2 . In some embodiments, N3 is 20,000-100,000 ; 100,000-500,000; 500,000-4,000,000; 4,000,000-20,000,000; or It may be in the range of 20,000,000 to 100,000,000. Each sampled molecule has an accurately read probability pg , in which case it is exactly shown as the allele A. The sample is inaccurately read as an allele unrelated to the original molecule with a probability of 1-pg, like an allele A with a probability pr , like an allele B with a probability pm, or a probability po . It seems to be allele C or allele D, and pr + pm + po = 1. The parameters p g , pr , p m , and po are estimated from the training data for each SNP.

異なるプロトコールは、同様のステップを包含し、分子生物学的ステップに変動を伴ってよく、その結果、異なる量のランダムサンプリング、異なるレベルの増幅および異なる漏れによる偏りがもたらされる。以下のモデルを、これらの場合のそれぞれに同等に良好に適用することができる。サンプリングされたDNAの量のモデルは、SNPごとに、以下によって示される:
~BetaBinomial(L(F(p,b),p,p)、N*H(p,b))
式中、p=参照DNAの真の量であり、b=SNP当たりの偏りであり、上記のように、pは正確なリードの確率であり、pは、上記の通り、悪いリードの場合、不正確に読み取られたが、偶然に正確な対立遺伝子に見えるリードの確率であり:
F(p,b)=pe/(pe+(1-p))、H(p,b)=(ep+(1-p))/e、L(p,p,p)=p*p+p*(1-p)である。
Different protocols may include similar steps and may be accompanied by variations in molecular biology steps, resulting in different amounts of random sampling, different levels of amplification and bias due to different leaks. The following models can be applied equally well to each of these cases. A model of the amount of sampled DNA is shown for each SNP by:
X 3 to Beta Binomial (L (F (p, b), pr , pg ), N * H (p, b))
In the equation, p = true amount of reference DNA, b = bias per SNP, as described above, pg is the probability of an accurate read, and pr is, as described above, of bad reads. If it was read incorrectly, but by chance it is the probability of a read that appears to be the correct allele:
F (p, b) = pe b / (pe b + (1-p)), H (p, b) = (e b p + (1-p)) 2 / e b , L (p, pr , p g ) = p * p g + pr * (1- pg ).

いくつかの実施形態では、前記方法では単純な二項分布の代わりにベータ二項分布を使用する。これは、ランダムサンプリングの偏りに対処する。ベータ二項分布のパラメータNは、試料ごとに、必要に応じて推定する。単にpの代わりに偏り補正F(p,b)、H(p,b)を用いて、増幅の偏りに対処する。偏りのパラメータbは、前もって、SNPごとに、トレーニングデータから推定する。 In some embodiments, the method uses a beta-binomial distribution instead of a simple binomial distribution. This addresses the random sampling bias. The parameter N of the beta-binomial distribution is estimated for each sample as needed. The bias correction F (p, b), H (p, b) is used instead of simply p to deal with the amplification bias. The bias parameter b is estimated in advance from the training data for each SNP.

いくつかの実施形態では、前記方法では、単にpの代わりに漏れ補正L(p,p,p)を用い、これは漏れによる偏り、すなわちSNPおよび試料の質の変動に対処する。いくつかの実施形態では、パラメータp、p、pは、前もって、SNPごとに、トレーニングデータから推定する。いくつかの実施形態では、パラメータp、p、pは、実行されている現行の試料を用いて更新して、試料の質の変動を明らかにすることができる。 In some embodiments, the method simply uses a leak correction L (p, pr , pg ) instead of p, which addresses the bias due to leakage, i.e., variation in SNP and sample quality. In some embodiments, the parameters pg , pr , po are pre-estimated from the training data for each SNP. In some embodiments, the parameters pg, pr , po can be updated with the current sample being performed to reveal variations in sample quality.

本明細書に記載のモデルは、かなり一般的であり、示差的な試料の質と示差的なSNPの質の両方を明らかにすることができる。異なる試料およびSNPは、いくつかの実施形態では平均および分散が元のDNAの量、ならびに試料およびSNPの質の関数であるベータ二項分布を用いるという事実によって例証されるように、異なって処理される。 The models described herein are fairly general and can reveal both differential sample quality and differential SNP quality. Different samples and SNPs are treated differently, as illustrated by the fact that in some embodiments the mean and dispersion use the quantity of the original DNA, as well as the beta-binomial distribution, which is a function of the quality of the samples and SNPs. Will be done.

プラットフォームのモデリング
血漿中に存在する予測される対立遺伝子の比がrである(母系の遺伝子型および胎児の遺伝子型に基づいて)単一のSNPを考慮に入れる。予測される対立遺伝子の比は、母系DNAと胎児DNAの組み合わせにおいて、予測される対立遺伝子Aの割合と定義される。母系の遺伝子型gおよび子の遺伝子型gについて、予測される対立遺伝子の比は、遺伝子型が同様に対立遺伝子の比で示されると仮定して、式1によって示される。
r=fg+(1-f)g (1)
Platform Modeling Take into account a single SNP (based on maternal and fetal genotypes) where the ratio of predicted alleles present in plasma is r. The predicted allele ratio is defined as the predicted proportion of allele A in the combination of maternal and fetal DNA. For the genotype g m of the maternal line and the genotype g c of the offspring, the predicted allelic ratio is given by Equation 1, assuming that the genotype is also indicated by the allele ratio.
r = fg c + (1-f) g m (1)

SNPにおける観察は、存在する各対立遺伝子でマッピングされたリード数、nおよびnからなり、合計してリード深度dになる。閾値が既にマッピング確率およびphredスコアに適用されており、したがって、マッピングおよび対立遺伝子の観察を正確であるとみなすことができると仮定する。phredスコアとは、特定の塩基における特定の測定値が誤りである確率に関する数値尺度である。ある実施形態では、塩基を配列決定によって測定した場合、phredスコアは、コールされた塩基に対応する色素の強度と他の塩基の色素の強度の比から算出することができる。尤度を観察するための最も単純なモデルは、dリードのそれぞれが、対立遺伝子の比rを有する大規模なプールからそれぞれ独立に抜き取られたと仮定する二項分布である。式2によりこのモデルが説明される。

Figure 0007027468000021
Observations in the SNP consist of the number of reads, na and n b mapped in each of the alleles present, summing up to the read depth d. It is assumed that the thresholds have already been applied to the mapping probabilities and phred scores and therefore mapping and allele observations can be considered accurate. The phred score is a numerical measure of the probability that a particular measurement at a particular base is erroneous. In one embodiment, when the base is measured by sequencing, the phred score can be calculated from the ratio of the intensity of the dye corresponding to the called base to the intensity of the dye of the other base. The simplest model for observing likelihood is a binomial distribution, assuming that each of the d-reads is independently extracted from a large pool with the allele ratio r. Equation 2 describes this model.
Figure 0007027468000021

二項式モデルは、いくつもの方法で拡張することができる。母系の遺伝子型および胎児の遺伝子型が全てAであるかまたは全てBであるかのいずれかの場合、血漿における予測される対立遺伝子の比は0または1になり、二項確率は明確に定義されない。実際には、時には実施において予想外の対立遺伝子が観察される。ある実施形態では、補正した対立遺伝子の比

Figure 0007027468000022
を用いて、予想外の対立遺伝子を少数にすることが可能である。ある実施形態では、トレーニングデータを用いて、各SNP上に現れる予想外の対立遺伝子の比率をモデリングすること、およびこのモデルを使用して予測される対立遺伝子の比を補正することが可能である。予測される対立遺伝子の比が0または1ではない場合、観察された対立遺伝子の比は、増幅の偏りまたは他の現象に起因して、予測される対立遺伝子の比に十分に高いリード深度に収束し得ない。次いで、対立遺伝子の比を、予測される対立遺伝子の比に集中したベータ分布としてモデリングし、二項分布よりも分散が大きいP(n,n|r)についてのベータ二項分布を得ることができる。 The binomial model can be extended in a number of ways. If the maternal and fetal genotypes are either all A or all B, the expected allele ratio in plasma will be 0 or 1, and the binomial probability is clearly defined. Not done. In practice, sometimes unexpected alleles are observed in practice. In one embodiment, the corrected allele ratio
Figure 0007027468000022
Can be used to reduce the number of unexpected alleles to a small number. In certain embodiments, training data can be used to model the proportion of unexpected alleles appearing on each SNP, and the model can be used to correct the predicted allele proportions. .. If the predicted allele ratio is not 0 or 1, the observed allele ratio will have a sufficiently high read depth to the predicted allele ratio due to amplification bias or other phenomena. It cannot converge. The allele ratio is then modeled as a beta distribution concentrated on the predicted allele ratio to obtain a beta-binomial distribution for P ( na, n b | r), which has a greater variance than the binomial distribution. be able to.

単一のSNPにおける応答についてのプラットフォームモデルは、F(a,b、g,g,f)と定義される(3)、または観察されているn=aおよびn=bの確率は、母系の遺伝子型および胎児の遺伝子型を考慮すると、同様に式1による胎児画分に左右される。Fの関数形式は、二項分布、ベータ二項分布または上記と同様の関数であってよい。
F(a,b,g,g,f)=P(n=a,n=b|g,g,f)=P(n=a,n=b|r(g,g,f)) (3)
A platform model for a response in a single SNP is defined as F (a, b, g c , g m , f) (3), or the observed probability of n a = a and n b = b. Also depends on the fetal fraction according to Equation 1, considering the genotype of the maternal line and the genotype of the fetus. The function form of F may be a binomial distribution, a beta-binomial distribution or a function similar to the above.
F (a, b, g c , g m , f) = P ( na = a, n b = b | g c , g m , f) = P ( na = a, n b = b | r ( g c , g m , f)) (3)

ある実施形態では、子の割合を以下の通り決定することができる。出生前検査のための胎児画分fの最尤推定値は、父系の情報を使用することなく導くことができる。これは、父系の遺伝子データが入手不可能である場合、例えば、記録の父親が実際には胎児の遺伝学的父親ではない場合に関連性があり得る。胎児画分は、母系の遺伝子型が0または1である場合にSNPの集合から推定し、その結果、可能性のある胎児の遺伝子型2つのみの集合がもたらされる。Sを、母系の遺伝子型が0であるSNPの集合と定義し、Sを、母系の遺伝子型が1であるSNPの集合と定義する。Sにおける可能性のある胎児の遺伝子型は0および0.5であり、可能性のある対立遺伝子の比の集合R(f)={0,f/2}がもたらされる。同様に、R(f)={1-f/2,1}である。この方法は、母系の遺伝子型が0.5であるSNPを含むように自明に拡張され得るが、これらのSNPは、可能性のある対立遺伝子の比のより大きな集合に起因して情報価値が低い。 In certain embodiments, the proportion of offspring can be determined as follows. Maximum likelihood estimates of the fetal fraction f for prenatal testing can be derived without the use of paternal information. This can be relevant if paternal genetic data is not available, for example if the father of the record is not really the genetic father of the fetus. The fetal fraction is estimated from the set of SNPs when the maternal genotype is 0 or 1, resulting in a set of only two possible fetal genotypes. S 0 is defined as a set of SNPs having a genotype of 0 in the maternal line, and S 1 is defined as a set of SNPs having a genotype of 1 in the maternal line. The possible fetal genotypes at S 0 are 0 and 0.5, resulting in a set of possible allele ratios R 0 (f) = {0, f / 2}. Similarly, R 1 (f) = {1-f / 2,1}. This method can be trivially extended to include SNPs with a maternal genotype of 0.5, but these SNPs are informative due to the larger set of possible allele ratios. Low.

a0およびNb0を、SにおけるSNPについてnasおよびnbsによって形成されるベクトルと定義し、Na1およびNb1を同様にSについて定義する。fの最尤推定値

Figure 0007027468000023
は式4によって定義される。
Figure 0007027468000024
N a0 and N b0 are defined as vectors formed by na as and n bs for the SNP in S 0 , and N a 1 and N b 1 are similarly defined for S 1 . Maximum likelihood estimation of f
Figure 0007027468000023
Is defined by Equation 4.
Figure 0007027468000024

各SNPにおける対立遺伝子数をSNPの血漿対立遺伝子の比に対して独立して条件づけたと仮定して、確率は、各集合内のSNPに関する積として表すことができる(5)。

Figure 0007027468000025
Assuming that the number of alleles in each SNP was conditioned independently of the ratio of plasma alleles in the SNP, the probabilities can be expressed as a product for the SNPs within each set (5).
Figure 0007027468000025

fへの依存は、可能性のある対立遺伝子の比の集合R(f)およびR(f)による。SNP確率P(nas,nbs|f)は、fに対して条件づけた最尤遺伝子型を仮定することによって概算することができる。合理的に高い胎児画分およびリード深度における最尤遺伝子型の選択は信頼度が高くなる。例えば、胎児画分10パーセントおよびリード深度1000において、母親が遺伝子型ゼロを有するSNPを考慮する。予測される対立遺伝子の比は0パーセントおよび5パーセントであり、これは十分に高いリード深度において容易に区別可能である。推定される子の遺伝子型を式5に代入することにより、胎児画分を推定するための完全な式(6)が得られる。

Figure 0007027468000026
Dependence on f depends on the set of possible allele ratios R 0 (f) and R 1 (f). The SNP probability P ( nas , n bs | f) can be estimated by assuming the maximum likelihood genotype conditioned on f. Selection of maximum likelihood genotypes at reasonably high fetal fractions and read depths is reliable. For example, consider an SNP in which the mother has zero genotype at a fetal fraction of 10 percent and a read depth of 1000. The expected allele ratios are 0 percent and 5 percent, which are easily distinguishable at sufficiently high read depths. Substituting the estimated genotype of the offspring into Equation 5 gives the complete equation (6) for estimating the fetal fraction.
Figure 0007027468000026

胎児画分は、範囲[0,1]でなければならず、したがって、条件付き一次元検索によって最適化を容易に実行することができる。 The fetal fraction must be in the range [0,1], and therefore optimization can be easily performed by conditional one-dimensional retrieval.

低いリード深度の場合または高いノイズレベルの存在下では、不自然に高い信頼度をもたらし得る最尤遺伝子型を仮定しないことが好ましい場合がある。別の方法では、各SNPにおける可能性のある遺伝子型にわたって合計し、その結果、SにおけるSNPについてのP(n,n|f)について以下の式(7)が得られる。事前確率P(r)は、R(f)にわたって一様であると仮定することができ、または母集団頻度に基づいてよい。群Sへの拡大は自明である。

Figure 0007027468000027
In the case of low read depths or in the presence of high noise levels, it may be preferable not to assume maximum likelihood genotypes that can unnaturally result in high reliability. Alternatively, they are summed across the possible genotypes in each SNP, resulting in the following equation (7) for P ( na, n b | f) for the SNP in S0. Prior probabilities P (r) can be assumed to be uniform across R 0 (f) or may be based on population frequency. The expansion into group S1 is self-evident.
Figure 0007027468000027

いくつかの実施形態では、確率を以下の通り導くことができる。2つの仮説HおよびHのデータ尤度から信頼度を算出することができる。各仮説の尤度を、応答モデル、推定される胎児画分、母親の遺伝子型、対立遺伝子の母集団頻度、および血漿対立遺伝子数に基づいて導く。
以下の表記を定義する:
、G 真の母系の遺伝子型および子の遺伝子型
af、Gtf 父親とされる人の真の遺伝子型および真の父親の真の遺伝子型
G(g,g,gtf)=P(G=g|G=g,Gtf=gtf) 遺伝形質確率
P(g)=P(Gtf=g) 特定のSNPにおける遺伝子型gの母集団頻度
In some embodiments, the probabilities can be derived as follows. The reliability can be calculated from the data likelihoods of the two hypotheses H t and H f . The likelihood of each hypothesis is derived based on the response model, estimated fetal fraction, maternal genotype, population frequency of alleles, and number of alleles.
Define the following notation:
G m , G c true maternal genotype and offspring genotype G af , G tf true genotype of the alleged father and true genotype of the true father G (g c , g m , g tt f) ) = P (G c = g c | G m = g m , G ft = g ft ) Genetic trait probability P (g) = P (G tt f = g) Population frequency of genotype g in a particular SNP

各SNPにおける観察は血漿対立遺伝子の比に対して独立して条件づけられると仮定して、父系性仮説の尤度はSNPにおける尤度の積である。以下の式により、単一のSNPについての尤度が導かれる。式8は、任意の仮説hの尤度についての一般的な表現であり、次いで、HおよびHの特定の場合に分解される。

Figure 0007027468000028
の場合には、父親とされる人は真の父親であり、胎児の遺伝子型は、式9に従って母系の遺伝子型および父親とされる人の遺伝子型から遺伝によって受け継がれる。
Figure 0007027468000029
The likelihood of the paternal hypothesis is the product of the likelihoods in the SNP, assuming that the observations at each SNP are conditioned independently of the ratio of plasma alleles. The following equation derives the likelihood for a single SNP. Equation 8 is a general expression for the likelihood of any hypothesis h, which is then decomposed in certain cases of H t and H f .
Figure 0007027468000028
In the case of Ht , the alleged father is the true father, and the genotype of the fetal is inherited from the genotype of the maternal line and the genotype of the alleged father according to Formula 9.
Figure 0007027468000029

の場合には、父親とされる人は真の父親ではない。真の父親の遺伝子型の最良の推定値は、各SNPにおける母集団頻度によって生じる。したがって、子の遺伝子型の確率を、式10の場合と同様に既知の母親の遺伝子型および母集団頻度によって決定する。

Figure 0007027468000030
In the case of Hf , the alleged father is not a true father. The best estimates of true paternal genotype depend on population frequency at each SNP. Therefore, the probability of offspring genotype is determined by the known maternal genotype and population frequency, as in Equation 10.
Figure 0007027468000030

正確な父系性に対する信頼度Cを、ベイズの法則(11)を用いて、2つの尤度のSNPに関する積から算出する。

Figure 0007027468000031
The confidence C p for the exact patrilineality is calculated from the product of the two likelihood SNPs using Bayes' law (11).
Figure 0007027468000031

パーセントによる胎児画分を用いた最尤モデル
母系の血清中に含有される浮動性DNAを測定することによって、または任意の混合試料中の遺伝子型の材料を測定することによって胎児の倍数性状態を決定することは、非自明の作業である。いくつもの方法があり、例えば、推測が、胎児が特定の染色体においてトリソミーである場合は、母系の血液中に見いだされるその染色体由来の全体的なDNAの量が参照染色体に対して上昇するというものであるリード数解析を実施する方法が存在する。そのような胎児においてトリソミーを検出するための1つの方法は、各染色体について予測されるDNAの量を、例えば、所与の染色体に対応する分析集合内のSNPの数に従って、または染色体の独自にマッピング可能な部分の数に従って正規化することである。測定値が正規化されたら、特定の閾値を超えるDNAの量が測定された任意の染色体をトリソミーであると決定する。この手法は、FanらPNAS、2008年;105巻(42号);16266~16271頁に記載されており、ChiuらBMJ 2011年;342巻:c7401頁にも記載されている。Chiuらの論文では、正規化は、以下の通りZスコアを算出することによって実現された:
検査例における第21染色体の百分率についてのZスコア=((検査例における第21染色体の百分率)-(参照対照における第21染色体の百分率の平均))/(参照対照における第21染色体の百分率の標準偏差)。
これらの方法では、単一仮説棄却法を用いて胎児の倍数性状態を決定する。しかし、これらは、いくつかの著しい欠点を被る。胎児における倍数性を決定するためのこれらの方法は試料中の胎児DNAの百分率に従って不変であるので、1つのカットオフ値を使用し、その結果、決定の正確度は最適ではなく、混合物中の胎児DNAの百分率が比較的低い場合は、正確度が最も悪くなる。
Most likely model using the fetal fraction by percentage Fetal polyploid state by measuring the floating DNA contained in the serum of the maternal line or by measuring the genotypic material in any mixed sample. Determining is a non-trivial task. There are several ways, for example, the speculation is that if the fetus is trisomy on a particular chromosome, the total amount of DNA from that chromosome found in the blood of the maternal line will increase relative to the reference chromosome. There is a method of performing the read number analysis. One method for detecting trisomy in such embryos is to determine the predicted amount of DNA for each chromosome, eg, according to the number of SNPs in the analysis set corresponding to a given chromosome, or independently of the chromosome. Normalize according to the number of mapable parts. Once the measurements are normalized, any chromosome measured for the amount of DNA above a particular threshold is determined to be trisomy. This technique is described in Fan et al. PNAS, 2008; Vol. 105 (No. 42); pp. 16266-16271, and also in Chiu et al., BMJ 2011; Vol. 342: pp. 7401. In Chiu et al.'S paper, normalization was achieved by calculating the Z-score as follows:
Z-score for the percentage of chromosome 21 in the test example = ((percentage of chromosome 21 in the test example)-(average of the percentage of chromosome 21 in the reference control)) / (standard of the percentage of chromosome 21 in the reference control) deviation).
These methods use a single hypothesis rejection method to determine the ploidy state of the fetus. However, they suffer some significant drawbacks. Since these methods for determining ploidy in the fetus are invariant according to the percentage of fetal DNA in the sample, one cutoff value is used, as a result, the accuracy of the determination is not optimal and in the mixture. If the percentage of fetal DNA is relatively low, the accuracy is the worst.

ある実施形態では、胎児の倍数性状態を決定するために用いる本開示の方法は、試料中の胎児DNAの割合を考慮に入れるステップを包含する。本開示の別の実施形態では、前記方法は、最尤推定の使用を包含する。ある実施形態では、本開示の方法は、試料中の胎児起源または胎盤起源のDNAのパーセントを算出するステップを包含する。ある実施形態では、異数性をコールするための閾値は、算出されたパーセント胎児DNAに基づいて適応調整する。いくつかの実施形態では、DNAの混合物中の胎児起源のものであるDNAの百分率を推定するための方法は、母親由来の遺伝物質、および胎児由来の遺伝物質を含む混合試料を得るステップと、胎児の父親由来の遺伝子試料を得るステップと、混合試料中のDNAを測定するステップと、父親の試料中のDNAを測定するステップと、混合試料のDNA測定値、および父親の試料のDNA測定値を使用して、混合試料中の胎児起源のものであるDNAの百分率を算出するステップとを含む。 In certain embodiments, the methods of the present disclosure used to determine the ploidy state of the fetus include a step that takes into account the proportion of fetal DNA in the sample. In another embodiment of the present disclosure, the method comprises the use of maximum likelihood estimation. In certain embodiments, the methods of the present disclosure include the step of calculating the percentage of DNA of fetal or placental origin in a sample. In certain embodiments, the threshold for calling aneuploidy is adaptively adjusted based on the calculated percent fetal DNA. In some embodiments, a method for estimating the percentage of DNA that is of fetal origin in a mixture of DNA is a step of obtaining a mixed sample containing a maternally-derived genetic material, and a fetal-derived genetic material. A step to obtain a gene sample derived from a fetal father, a step to measure DNA in a mixed sample, a step to measure DNA in a father's sample, a DNA measurement value of a mixed sample, and a DNA measurement value of a father's sample. Includes the step of calculating the percentage of DNA of fetal origin in the mixed sample using.

本開示のある実施形態では、混合物中の胎児DNAの割合または胎児DNAの百分率を測定することができる。いくつかの実施形態では、胎児DNAと母系DNAの混合物である母系の血漿試料自体に対して行った遺伝子型決定の測定値のみを使用して割合を算出することができる。いくつかの実施形態では、測定されたか、または別の方法で既知である母親の遺伝子型および/または測定されたか、または別の方法で既知である父親の遺伝子型を用いてその割合を算出することもできる。いくつかの実施形態では、母系DNAと胎児DNAの混合物に対して得た測定値を親の状況の知見と一緒に使用して、パーセント胎児DNAを算出することができる。ある実施形態では、特定の対立遺伝子測定値についての確率についてのモデルを調整するために母集団頻度を使用して胎児DNAの割合を算出することができる。 In certain embodiments of the present disclosure, the proportion of fetal DNA or the percentage of fetal DNA in the mixture can be measured. In some embodiments, the proportion can be calculated using only the genotyping measurements made on the maternal plasma sample itself, which is a mixture of fetal DNA and maternal DNA. In some embodiments, the proportion is calculated using the genotype of the mother measured or otherwise known and / or the genotype of the father measured or otherwise known. You can also do it. In some embodiments, measurements obtained for a mixture of maternal DNA and fetal DNA can be used in conjunction with parental situational insights to calculate percent fetal DNA. In certain embodiments, population frequency can be used to calculate the proportion of fetal DNA in order to adjust the model for probabilities for specific allelic measurements.

本開示のある実施形態では、胎児の倍数性状態の決定の正確度について信頼度を算出することができる。ある実施形態では、最大の尤度(Hmajor)の仮説の信頼度を(1-Hmajor)/Σ(全てのH)として算出することができる。仮説の全ての分布が既知である場合、仮説の信頼度を決定することが可能である。親の遺伝子型情報が既知である場合、仮説の全ての分布を決定することが可能である。正倍数性の胎児についての予測されるデータの分布および異数性の胎児についての予測されるデータの分布の知見が既知である場合、倍数性の決定の信頼度を算出することが可能である。親の遺伝子型データが既知である場合、これらの予測される分布を算出することが可能である。ある実施形態では、正常な仮説の周りの検定統計量の分布および異常な仮説の周りの検定統計量の分布の知見を用いて、コールの信頼性を決定すること、ならびに閾値を改良してより信頼できるコールを行うことができる。これは、混合物中の胎児DNAの量および/またはパーセントが低い場合に特に有用である。これは、Z統計量などの検定統計量が、胎児DNAが高いパーセントで存在する場合に対して最適化された閾値に基づいて設けた閾値を超えないことが原因で、実際には異数性である胎児が正倍数性であると見いだされる状況を回避するために役立つ。 In certain embodiments of the present disclosure, confidence can be calculated for the accuracy of determining the ploidy state of the fetus. In certain embodiments, the reliability of the hypothesis of maximum likelihood (H major ) can be calculated as (1-H major ) / Σ (all H). If the entire distribution of the hypothesis is known, it is possible to determine the reliability of the hypothesis. If the parental genotype information is known, it is possible to determine the entire distribution of the hypothesis. Given the knowledge of the predicted data distribution for positive ploidy fetuses and the predicted data distribution for aneuploidic fetuses, it is possible to calculate the confidence of the ploidy determination. .. If parental genotype data is known, it is possible to calculate these predicted distributions. In one embodiment, the knowledge of the distribution of test statistic around the normal hypothesis and the distribution of the test statistic around the anomalous hypothesis is used to determine the reliability of the call, as well as to improve the threshold. You can make reliable calls. This is especially useful when the amount and / or percentage of fetal DNA in the mixture is low. This is actually aneuploidy because test statistic such as Z statistic does not exceed the threshold set based on the optimized threshold for the presence of high percentage of fetal DNA. Helps avoid situations where the fetus is found to be positive polyploid.

ある実施形態では、本明細書に開示されている方法を用いて、母系の遺伝物質と胎児の遺伝物質の混合物中の母系の標的染色体および胎児の標的染色体のコピーの数を決定することによって胎児の異数性を決定することができる。この方法は、母系の遺伝物質と胎児の遺伝物質の両方を含む母系の組織を得るステップを伴ってよく、いくつかの実施形態では、この母系の組織は、母系の血液から単離された母系の血漿または組織であってよい。この方法は、上述の母系の組織を加工することによって、前記母系の組織から母系の遺伝物質と胎児の遺伝物質の混合物を得るステップも伴ってよい。この方法は、標的染色体由来の標的配列を含む個々の反応試料および標的染色体由来の標的配列を含まない個々の反応試料を無作為にもたらすために、得られた遺伝物質を複数の反応試料に分配するステップ、例えば、試料に対してハイスループット配列決定を実施するステップも伴ってよい。この方法は、前記個々の反応試料中に存在するまたは存在しない遺伝物質の標的配列を分析して、反応試料中の正倍数性であると推測される胎児の染色体の存在または不在を示すバイナリーの結果の第1の数、および反応試料中の異数性である可能性がある胎児の染色体の存在または不在を示すバイナリーの結果の第2の数をもたらすステップを伴ってよい。例えば、特定の染色体、染色体の特定の領域、特定の遺伝子座または遺伝子座の集合にマッピングされるシーケンスリードをカウントするインフォマティクス技法によってバイナリーの結果の数のいずれかを算出することができる。この方法は、集団内の染色体の長さ、染色体の領域の長さまたは遺伝子座の数に基づいてバイナリーの事象の数を規格化するステップを包含し得る。この方法は、反応試料中の正倍数性であると推測される胎児の染色体について、第1の数を用いてバイナリーの結果の数の予測される分布を算出するステップを伴ってよい。この方法は、反応試料中の異数性であることが推測される胎児の染色体についてのバイナリーの結果の数の予測される分布を算出するステップであって、第1の数、および混合物において見いだされる胎児DNAの推定される割合を、例えば、正倍数性であると推測される胎児の染色体についてのバイナリーの結果の数の予測リード数分布に(1+n/2)(nは推定される胎児画分である)を掛けることによって用いて算出するステップを伴ってよい。いくつかの実施形態では、シーケンスリードを、バイナリーの結果ではなく、確率的なマッピングで処理することができ、この方法では、より高い正確度がもたらされるが、さらなる計算能力が必要である。胎児画分は、複数の方法によって推定することができ、そのいくつかは、本開示の他の箇所に記載されている。この方法は、最尤手法を用いて、第2の数が、正倍数性であるまたは異数性である、異数性である可能性がある胎児の染色体に対応するかどうかを決定するステップを伴ってよい。この方法は、測定されたデータを考慮して、正確である尤度が最大である仮説に対応する倍数性状態である胎児の倍数性状態をコールするステップを包含し得る。 In certain embodiments, the methods disclosed herein are used to determine the number of copies of the maternal and fetal target chromosomes in a mixture of maternal and fetal genetic material. The aneuploidy of can be determined. This method may involve the step of obtaining maternal tissue containing both maternal and fetal genetic material, and in some embodiments, the maternal tissue is isolated from maternal blood. May be plasma or tissue. This method may also involve the step of obtaining a mixture of maternal and fetal genetic material from the maternal tissue by processing the maternal tissue described above. This method distributes the resulting genetic material to multiple reaction samples in order to randomly yield individual reaction samples containing the target sequence derived from the target chromosome and individual reaction samples not containing the target sequence derived from the target chromosome. A step of performing high throughput sequencing on the sample may also be involved. This method analyzes the target sequences of genetic material present or absent in the individual reaction samples to indicate the presence or absence of fetal chromosomes that are presumed to be positive polyploid in the reaction samples. It may involve a first number of results, and a second number of binary results indicating the presence or absence of fetal chromosomes that may be aneuploid in the reaction sample. For example, any of the number of binary results can be calculated by an informatics technique that counts sequence reads that map to a particular chromosome, a particular region of a chromosome, a particular locus or a set of loci. This method may include the step of normalizing the number of binary events based on the length of the chromosome, the length of the region of the chromosome or the number of loci within the population. This method may involve calculating the predicted distribution of the number of binary results using the first number for the fetal chromosomes that are presumed to be positive polyploid in the reaction sample. This method is a step in calculating the predicted distribution of the number of binary results for a fetal chromosome that is presumed to be aneuploid in the reaction sample, and was found in the first number, and in the mixture. The estimated proportion of fetal DNA is, for example, (1 + n / 2) (n is the estimated fetal picture) in the predicted read number distribution of the number of binary results for the chromosomes of the fetus that are presumed to be positive polyploid. It may be accompanied by a step of calculation using by multiplying (in minutes). In some embodiments, sequence reads can be processed with probabilistic mapping rather than binary results, which provides higher accuracy but requires more computational power. The fetal fraction can be estimated by multiple methods, some of which are described elsewhere in the disclosure. This method uses maximum likelihood techniques to determine if the second number corresponds to a fetal chromosome that is or may be aneuploid, which is positive polyploid or aneuploid. May be accompanied by. This method may include the step of calling the ploidy state of the fetus, which is the ploidy state corresponding to the hypothesis that is accurate and has the highest likelihood, taking into account the measured data.

最尤モデルを用いて、胎児の倍数性状態を決定する任意の方法の正確度を上昇させることができることに留意されたい。同様に、胎児の倍数性状態を決定する任意の方法について信頼度を算出することができる。最尤モデルを用いることにより、単一仮説棄却法を用いて倍数性の決定を行う任意の方法の正確度が改善される。最尤モデルは、正常な場合と異常な場合の両方について尤度分布を算出することができる任意の方法に用いることができる。最尤モデルを用いることは、倍数性コールについての信頼度を算出する能力を意味する。 Note that the maximum likelihood model can be used to increase the accuracy of any method of determining the ploidy state of the fetus. Similarly, confidence can be calculated for any method of determining the ploidy state of the fetus. Using the maximum likelihood model improves the accuracy of any method of making ploidy determinations using the single hypothesis rejection method. The maximum likelihood model can be used for any method that can calculate the likelihood distribution for both normal and abnormal cases. Using the maximum likelihood model means the ability to calculate confidence for haploid calls.

方法のさらなる考察
ある実施形態では、本明細書に開示されている方法では、多型遺伝子座の各対立遺伝子の独立した観察の数の定量的尺度を利用し、ここで、これには対立遺伝子の比を算出するステップは包含されない。これは、遺伝子座の2つの対立遺伝子の比に関する情報をもたらすが、いずれかの対立遺伝子の独立した観察の数を定量化しない、一部のマイクロアレイに基づく方法などの方法とは異なる。当技術分野で公知のいくつかの方法では、独立した観察の数に関する定量的情報がもたらされ得るが、倍数性の決定をもたらす算出には対立遺伝子の比のみを利用し、定量的情報は利用しない。独立した観察の数に関する情報を保持することの重要性を例示するために、2つの対立遺伝子、AおよびBを有する試料の遺伝子座について考察する。第1の実験では20の対立遺伝子Aおよび20の対立遺伝子Bを観察し、第2の実験では200の対立遺伝子Aおよび200の対立遺伝子Bを観察する。どちらの実験でも、比(A/(A+B))は0.5と等しいが、第2の実験は、第1の実験よりも対立遺伝子AまたはBの頻度の確実性に関する多くの情報を伝える。当該方法では、対立遺伝子の比を利用するのではなく、定量的データを使用して、各多型遺伝子座における最も可能性が高い対立遺伝子頻度をより正確にモデリングする。
Further Discussion of Methods In certain embodiments, the methods disclosed herein utilize a quantitative measure of the number of independent observations of each allele at a polymorphic locus, wherein this is an allele. The step of calculating the ratio of is not included. This provides information about the ratio of the two alleles at the locus, but differs from methods such as some microarray-based methods that do not quantify the number of independent observations of any allele. While some methods known in the art can provide quantitative information about the number of independent observations, only allele ratios are used in the calculations that result in the determination of ploidy, and the quantitative information is available. Do not use. To illustrate the importance of retaining information about the number of independent observations, consider the loci of a sample with two alleles, A and B. In the first experiment, 20 alleles A and 20 alleles B are observed, and in the second experiment, 200 alleles A and 200 alleles B are observed. In both experiments, the ratio (A / (A + B)) is equal to 0.5, but the second experiment conveys more information about the certainty of the frequency of the allele A or B than the first experiment. Instead of utilizing allele ratios, the method uses quantitative data to more accurately model the most likely allele frequency at each polymorphic locus.

ある実施形態では、当該方法では、複数の多型遺伝子座からの測定値を総計するための遺伝子モデルを構築して、トリソミーとダイソミーをよりよく区別し、トリソミーの種類も決定する。さらに、当該方法では、遺伝連鎖情報を組み入れて、方法の正確度を増強する。これは、対立遺伝子の比を染色体上の多型遺伝子座の全てにわたって平均する、当技術分野で公知のいくつかの方法とは対照的である。本明細書に開示されている方法により、ダイソミーにおいて予測される対立遺伝子頻度分布、ならびに、減数分裂Iの間の染色体不分離、減数分裂IIの間の染色体不分離、および胎児発生の初期の有糸分裂の間の染色体不分離によって生じるトリソミーが明確にモデリングされる。なぜこれが重要であるかを例示すると、乗換えがなければ、減数分裂Iの間の染色体不分離により、2つの異なる相同体が一方の親から遺伝によって受け継がれたトリソミーがもたらされ、減数分裂IIの間、または胎児発生の初期の有糸分裂の間の染色体不分離により、一方の親由来の同じ相同体の2つのコピーがもたらされることになる。各筋書きにより、各多型遺伝子座において、および、一緒に考慮に入れたすべの物理的に連鎖した遺伝子座(すなわち同じ染色体上の遺伝子座)においても予測される対立遺伝子の異なる頻度がもたらされる。相同体間での遺伝物質の交換をもたらす乗換えにより、遺伝様式がより複雑になるが、当該方法は、遺伝連鎖情報、すなわち組換え率の情報および遺伝子座間の物理的な距離を使用することによってこれに対して適応する。減数分裂I時の染色体不分離と減数分裂IIまたは有糸分裂時の染色体不分離をよりよく区別するために、当該方法では、乗換えの確率の上昇をセントロメアからの距離の増加としてモデルに組み入れる。減数分裂IIおよび有糸分裂時の染色体不分離は、有糸分裂時の染色体不分離により、一般には、1つの相同体の同一またはほぼ同一のコピーがもたらされるが、一方、減数分裂II時の染色体不分離事象の後に存在する2つの相同体は、多くの場合、配偶子形成の間の1つまたは複数の乗換えに起因して異なるという事実によって区別することができる。 In one embodiment, the method constructs a genetic model for summing up measurements from multiple polymorphic loci to better distinguish between trisomy and disomy and also determine the type of trisomy. In addition, the method incorporates genetic linkage information to enhance the accuracy of the method. This is in contrast to some methods known in the art for averaging allele ratios across all polymorphic loci on the chromosome. By the methods disclosed herein, the predicted allogeneic frequency distribution in dysomy, as well as nondisjunction of chromosomes during meiosis I, nondisjunction of chromosomes during meiosis II, and early prevalence of fetal development. The trisomy caused by chromosomal nondisjunction during mitosis is clearly modeled. To illustrate why this is important, without crossover, chromosomal nondisjunction between meiosis I results in a trisomy in which two different homologues are inherited from one parent, resulting in meiosis II. Chromosome meiosis during, or during early mitosis of fetal development, results in two copies of the same homologue from one parent. Each scenario results in different frequencies of alleles predicted at each polymorphic locus and at all physically linked loci considered together (ie, loci on the same chromosome). .. Crossovers that result in the exchange of genetic material between homologues complicate the mode of inheritance, but the method uses genetic linkage information, ie, recombination rate information and the physical distance between loci. Adapt to this. To better distinguish between nondisjunction during meiosis I and chromosomal nondisjunction during meiosis II or mitosis, the method incorporates an increased probability of crossover as an increase in distance from the centromere. In meiosis II and mitotic nondisjunction, mitotic nondisjunction generally results in the same or nearly identical copy of one homologue, while at meiosis II. The two homologues that exist after a nondisjunction event can often be distinguished by the fact that they differ due to one or more crossovers during mitosis.

ある実施形態では、本開示の方法では、ダイソミーを仮定する場合、親のハプロタイプを決定することができない。ある実施形態では、トリソミーの場合、当該方法により、血漿が一方の親由来の2つのコピーを取り、親の相情報は、2つのコピーが問題の親から遺伝によって受け継がれたいずれによっても決定することができないという事実を用いることによって、一方の親または両親のハプロタイプに関する決定を行うことができる。詳細には、子は、親の2つの同じコピー(一致トリソミー)または親の両方のコピー(不一致トリソミー)のいずれかを遺伝によって受け継ぐことができる。各SNPにおいて、一致トリソミーの尤度および不一致トリソミーの尤度を算出することができる。乗換えを考慮している連鎖モデルを使用しない倍数性コール方法では、トリソミーの全体的な尤度を、染色体全体にわたって一致トリソミーおよび不一致トリソミーの単純な重み付けられた平均として算出する。しかし、乗換えが存在する場合にのみ、分離エラーおよび乗換えをもたらす生物学的な機構に起因して、トリソミーは、染色体上で一致から不一致に変化し得る(および逆もまた同じ)。当該方法は、確率的に、乗換えの尤度を考慮に入れ、その結果、乗換えの尤度を考慮に入れない方法よりも正確度が高い倍数性コールがもたらされる。 In certain embodiments, the methods of the present disclosure are unable to determine the parental haplotype when assuming disomy. In one embodiment, in the case of trisomy, the method causes the plasma to take two copies from one parent, and the parental phase information is determined by either of the two copies inherited from the parent in question. By using the fact that one cannot make a decision regarding the haplotype of one parent or parents. In particular, a child can inherit either two identical copies of a parent (matched trisomy) or both copies of a parent (mismatched trisomy). At each SNP, the likelihood of matching trisomy and the likelihood of disagreeing trisomy can be calculated. The polyploid call method, which does not use a linkage model that considers translocation, calculates the overall likelihood of trisomy as a simple weighted average of matched and unmatched trisomy across chromosomes. However, trisomy can change from coincident to disagreeable on the chromosome due to separation errors and the biological mechanisms that result in crossovers only in the presence of crossovers (and vice versa). The method stochastically takes into account the likelihood of transfer, resulting in a polyploid call that is more accurate than the method that does not take into account the likelihood of transfer.

ある実施形態では、参照染色体を使用して子の割合およびノイズレベルの量または確率分布を決定する。ある実施形態では、子の割合、ノイズレベル、および/または確率分布を、倍数性の状態が決定される染色体から入手可能な遺伝子情報のみを使用して決定する。当該方法は、参照染色体を伴わずに、ならびに特定の子の割合またはノイズレベルの固定を伴わずに機能する。これは、子の割合および染色体の挙動を較正するために参照染色体由来の遺伝子データが必要な、当技術分野で公知の方法の有意な改善であり、また、それと異なる点である。 In one embodiment, reference chromosomes are used to determine the proportion of offspring and the amount or probability distribution of noise levels. In one embodiment, the proportion of offspring, noise level, and / or probability distribution are determined using only genetic information available from the chromosome where the polyploidy state is determined. The method works without reference chromosomes and without fixation of specific offspring proportions or noise levels. This is a significant improvement and difference from the methods known in the art that require genetic data from the reference chromosome to calibrate the proportion of offspring and the behavior of the chromosome.

胎児画分を決定するために参照染色体を必要としないある実施形態では、仮説の決定を以下の通り行う:

Figure 0007027468000032
参照染色体を用いるアルゴリズムでは、一般には、参照染色体はダイソミーであると仮定し、次いで、(a)最も可能性が高い子の割合およびランダムなノイズレベルNを、この仮定および参照染色体のデータに基づいて固定し:
Figure 0007027468000033
とし、次いで、LIK(D|H)=LIK(D|H,cfr,N)として換算するか、または、
(b)この仮定および参照染色体のデータに基づいて、子の割合およびノイズレベルの分布を推定する。詳細には、cfrおよびNについてただ1つの値に固定しないが、確率p(cfr,N)を可能性のあるcfr、N値の広い範囲に割り当てる:
p(cfr,N)~LIK(D(ref.chrom)|H11,cfr,N)*priorprob(cfr,N)
式中、priorprob(cfr,N)が特定の子の割合およびノイズレベルの事前確率であり、以前の知見および実験によって決定される。場合によっては、cfr,Nの範囲にわたって一様にする。次いで、
Figure 0007027468000034
と書くことができる。上記のどちらの方法も良好な結果をもたらす。 In one embodiment that does not require a reference chromosome to determine the fetal fraction, the hypothesis determination is made as follows:
Figure 0007027468000032
Algorithms using reference chromosomes generally assume that the reference chromosome is disomy, and then (a) the proportion of the most likely offspring and a random noise level N are based on this assumption and the data on the reference chromosome. Fixed:
Figure 0007027468000033
Then, convert as LIK (D | H) = LIK (D | H, cfr * , N * ), or
(B) Based on this assumption and the data of the reference chromosome, the proportion of offspring and the distribution of noise level are estimated. Specifically, we do not fix to a single value for cfr and N, but assign the probabilities p (cfr, N) to a wide range of possible cfr, N values:
p (cfr, N) to LIK (D (ref.chrom) | H11, cfr, N) * priorprob (cfr, N)
In the equation, priorprob (cfr, N) is the prior probability of a particular child proportion and noise level, as determined by previous findings and experiments. In some cases, it is made uniform over the range of cfr and N. Then
Figure 0007027468000034
Can be written. Both of the above methods give good results.

いくつかの場合には、参照染色体を使用することは望ましくない、可能でない、または実行可能でないことがあることに留意されたい。そのような場合には、各染色体について最良の倍数性コールを別々に導くことが可能である。詳細には:

Figure 0007027468000035
p(cfr,N|H)は、各染色体について別々に、単に参照染色体についてダイソミーであると仮定するのではなく、仮説Hを仮定して、上記の通り決定することができる。この方法を用いて、固定されたノイズのパラメータと子の画分のパラメータ両方を保持すること、いずれかのパラメータを固定すること、または両方のパラメータを各染色体および各仮説について確率的な形態で保持することが可能である。 Note that in some cases it may not be desirable, impossible, or feasible to use a reference chromosome. In such cases, it is possible to derive the best ploidy call separately for each chromosome. In detail:
Figure 0007027468000035
p (cfr, N | H) can be determined separately for each chromosome, as described above, assuming hypothesis H, rather than simply assuming that it is a disomy for the reference chromosome. Using this method, hold both fixed noise parameters and child fraction parameters, fix one parameter, or both parameters in probabilistic form for each chromosome and each hypothesis. It is possible to hold.

DNAの測定、特にDNAの量が少ない場合、またはDNAが混入DNAと混在している場合の測定は、ノイズが入りかつ/または誤りがちである。このノイズにより、正確度が低い遺伝子型データ、および正確度が低い倍数性コールが得られる。いくつかの実施形態では、プラットフォームのモデリングまたはいくつかの他のノイズモデリングの方法を用いて、倍数性の決定に対するノイズの有害作用をカウントすることができる。当該方法では、両チャネルの同時モデル(joint model)を用い、入力DNAの量、DNAの質、および/またはプロトコールの質に起因するランダムなノイズを考慮する。 Measurements of DNA, especially when the amount of DNA is low or when DNA is mixed with contaminating DNA, are noisy and / or prone to error. This noise results in inaccurate genotype data and inaccurate haploid calls. In some embodiments, platform modeling or some other noise modeling method can be used to count the adverse effects of noise on ploidy determination. The method uses a simultaneous model of both channels and takes into account random noise due to the quantity of input DNA, the quality of DNA, and / or the quality of the protocol.

これは、遺伝子座における対立遺伝子の強度の比を用いて倍数性の決定を行う、当技術分野で公知のいくつかの方法とは対照的である。この方法は、正確なSNPノイズモデリングを妨げる。詳細には、測定におけるエラーは、一般には、測定されたチャネル強度比に特異的に依存せず、モデルを、一次元の情報を使用するように縮小する。ノイズ、チャネルの質およびチャネルの相互作用の正確なモデリングには、対立遺伝子の比を用いてモデリングすることができない2次元の同時モデルが必要である。 This is in contrast to some methods known in the art for making ploidy determinations using the ratio of allele intensities at the locus. This method interferes with accurate SNP noise modeling. In particular, the error in the measurement is generally independent of the measured channel intensity ratio and shrinks the model to use one-dimensional information. Accurate modeling of noise, channel quality and channel interactions requires a two-dimensional simultaneous model that cannot be modeled using allele ratios.

詳細には、2つのチャネル情報を、f(x,y)がr=x/yである比rに投影すること自体は、正確なチャネルノイズおよび偏りのモデリングに役立たない。特定のSNPにおけるノイズは、比率の関数ではない、すなわちノイズ(x,y)≠f(x,y)であるが、実際には、両方のチャネルの同時関数(joint function)である。例えば、二項式モデルでは、測定された比率のノイズはr(1-r)/(x+y)の分散を有し、これは、純粋にrの関数ではない。任意のチャネルの偏りまたはノイズが包含されるモデルでは、SNPiにおいて、観察されたチャネルX値はx=aX+bであると仮定し、ここで、Xは真のチャネル値であり、bは余分のチャネルの偏りおよびランダムなノイズである。同様に、y=cY+dと仮定する。(aX+b)/(cY+d)はX/Yの関数ではないので、観察された比r=x/yでは、真の比率X/Yを正確に予測することまたは残りのノイズをモデリングすることができない。 In particular, projecting the two channel information onto a ratio r where f (x, y) is r = x / y is not itself useful for accurate channel noise and bias modeling. The noise in a particular SNP is not a function of ratio, i.e. noise (x, y) ≠ f (x, y), but is actually a joint function of both channels. For example, in the binomial model, the measured ratio of noise has a variance of r (1-r) / (x + y), which is not purely a function of r. In a model that includes any channel bias or noise, in SNPi , the observed channel X value is assumed to be x = ai X + bi, where X is the true channel value and bi. Is extra channel bias and random noise. Similarly, it is assumed that y = c i Y + di . Since (a i X + bi) / ( ci Y + di ) is not a function of X / Y, the observed ratio r = x / y is an accurate prediction of the true ratio X / Y or the remaining noise. Cannot be modeled.

本明細書に開示されている方法には、個々の測定チャネルの全ての同時二項分布を使用したノイズおよび偏りの有効なモデリングの方法が記載されている。関連性のある式は、文書の他の箇所、SNPの挙動を有効に調整するSNP当たりの一貫した偏り、P(good)およびP(ref|bad)、P(mut|bad)について記載されているセクションに見いだすことができる。ある実施形態では、本開示の方法では、対立遺伝子の比のみに依拠する、実施による限定を回避し、その代わりに、挙動を両方のチャネル計数値に基づいてモデリングするベータ二項分布を使用する。 The methods disclosed herein describe a method of effective modeling of noise and bias using all simultaneous binomial distributions of individual measurement channels. Relevant equations are described elsewhere in the document, consistent bias per SNP that effectively regulates SNP behavior, P (good) and P (ref | bad), P (mut | bad). You can find it in the section you are in. In certain embodiments, the methods of the present disclosure use a beta-binomial distribution that relies solely on the ratio of alleles, avoids implementation limitations, and instead models behavior based on both channel counts. ..

ある実施形態では、本明細書に開示されている方法により、全ての利用可能な測定値を使用することによって、母系の血漿中に見いだされる遺伝子データから妊娠中の胎児の倍数性をコールすることができる。ある実施形態では、本明細書に開示されている方法により、親の状況のサブセットのみからの測定値を使用することによって、母系の血漿中に見いだされる遺伝子データから妊娠中の胎児の倍数性をコールすることができる。当技術分野で公知のいくつかの方法では、親の状況がAA|BB状況からのものである場合、すなわち所与の遺伝子座において親がどちらもホモ接合性であるが、対立遺伝子が異なる場合に測定された遺伝子データのみを使用する。この方法に伴う1つの問題は、AA|BB状況からの多型遺伝子座の割合が小さく、一般には、10%未満であることである。本明細書に開示されている方法のある実施形態では、方法は、親の状況がAA|BBである遺伝子座において行われた母系の血漿の遺伝子測定値を使用しない。ある実施形態では、当該方法では、親の状況がAA|AB、AB|AA、およびAB|ABである多型遺伝子座についてのみ血漿測定値を使用する。 In certain embodiments, the methods disclosed herein call the ploidy of a pregnant fetus from genetic data found in maternal plasma by using all available measurements. Can be done. In certain embodiments, the methods disclosed herein provide ploidy of a pregnant fetus from genetic data found in maternal plasma by using measurements from only a subset of the parental situation. You can call. In some methods known in the art, if the parental situation is from the AA | BB situation, i.e., both parents are homozygous at a given locus, but the alleles are different. Use only the genetic data measured in. One problem with this method is that the proportion of polymorphic loci from the AA | BB situation is small, generally less than 10%. In certain embodiments of the methods disclosed herein, the method does not use maternal plasma genetic measurements made at loci where the parental situation is AA | BB. In certain embodiments, the method uses plasma measurements only for polymorphic loci whose parental status is AA | AB, AB | AA, and AB | AB.

当技術分野で公知のいくつかの方法は、両親の遺伝子型が存在するAA|BB状況におけるSNPからの対立遺伝子の比を平均し、これらのSNPにおける平均の対立遺伝子の比から倍数性コールの決定を主張するステップを包含する。この方法は、示差的なSNPの挙動に起因して著しく不正確である。この方法では、両親の遺伝子型が既知であることを仮定することに留意されたい。対照的に、いくつかの実施形態では、当該方法では、親のいずれかの存在を仮定せず、均一なSNPの挙動を仮定しない、同時チャネル分布モデルを使用する。いくつかの実施形態では、当該方法では、異なるSNPの挙動/重み付けを考慮に入れる。いくつかの実施形態では、当該方法は、一方の親または両親の遺伝子型の知見を必要としない。当該方法がどのようにこれを実現するかの例は以下の通りである: Several methods known in the art are to average the ratio of alleles from SNPs in the AA | BB situation where the genotypes of the parents are present, and from the ratio of the average alleles in these SNPs to the polyploid call. Includes steps to assert a decision. This method is significantly inaccurate due to the differential SNP behavior. Note that this method assumes that the genotypes of the parents are known. In contrast, in some embodiments, the method uses a simultaneous channel distribution model that does not assume the presence of any of the parents and does not assume uniform SNP behavior. In some embodiments, the method takes into account the behavior / weighting of different SNPs. In some embodiments, the method does not require knowledge of the genotype of one parent or parent. Here is an example of how this method achieves this:

いくつかの実施形態では、仮説の対数尤度をSNPごとに決定することができる。特定のSNPiについて、胎児の倍数性についての仮説Hおよびパーセント胎児DNAcfを仮定すると、観察されたデータDの対数尤度は:

Figure 0007027468000036
と定義され、式中、mは可能性のある真の母親の遺伝子型であり、fは可能性のある真の父親の遺伝子型であり、m,f∈{AA,AB,BB}であり、cは、仮説Hを考慮した、可能性のある子の遺伝子型である。詳細には、モノソミーについてはc{A,B}であり、ダイソミーについてはc∈{AA,AB,BB}であり、トリソミーについてはc∈{AAA,AAB,ABB,BBB}である。親の遺伝子型データを含めることにより、一般には、より正確な倍数性の決定がもたらされるが、当該方法が良好に機能するために親の遺伝子型データは必須ではないことに留意されたい。 In some embodiments, the log-likelihood of the hypothesis can be determined on a per SNP basis. Assuming hypothesis H and percent fetal DNAcf for fetal ploidy for a particular SNPi, the log-likelihood of the observed data D is:
Figure 0007027468000036
In the formula, m is the genotype of the possible true mother, f is the genotype of the possible true father, and m, f ∈ {AA, AB, BB}. , C are genotypes of possible offspring, taking into account Hypothesis H. Specifically, for monosomy, c {A, B}, for disomy, c ∈ {AA, AB, BB}, and for trisomy, c ∈ {AAA, AAB, ABB, BBB}. It should be noted that although inclusion of parental genotype data generally results in more accurate ploidy determination, parental genotype data is not essential for the method to work well.

当技術分野で公知のいくつかの方法は、母親がホモ接合性であるが、血漿において異なる対立遺伝子が測定される(AA|ABまたはAA|BBの状況)SNPからの対立遺伝子の比を平均し、これらのSNPにおける平均の対立遺伝子の比から倍数性コールの決定を主張するステップを包含する。この方法は、父系の遺伝子型が入手不可能である場合を意図している。ホモ接合性で反対の父親BBの存在を伴わずに、血漿が特定のSNPにおいてヘテロ接合性であることをどのくらい正確に主張することができるかどうかは疑問であることに留意されたい:子の割合が少ない場合、対立遺伝子Bが存在するように見えるのは、単にノイズの存在である場合があり、さらに、Bが存在しないように見えるのは、胎児の測定値のうちの単純対立遺伝子のドロップアウトである場合もある。さらには、血漿のヘテロ接合性を実際に決定することができる場合であっても、この方法では、父系トリソミーを区別することができない。詳細には、母親がAAであるSNP、および血漿においていくらかのBが測定されるSNPについて、父親がGGである場合、生じた子の遺伝子型はAGGであり、平均の比は33%のAになる(子の割合=100%)。しかし、父親がAGである場合には、生じた子の遺伝子型は、一致トリソミーについてはAGGであってもよく、33%のAの比を与える、または不一致トリソミーについてはAAGであってもよく、平均の比についてさらに66%に近いAが得られる。多くのトリソミーが乗換えを伴って染色体上にあるとすれば、全体的な染色体は、不一致トリソミーが全くないところと全てが不一致トリソミーであるところとの間のいずれの場合もあり、この比率は、33~66%の間のいずれにも変動し得る。通常のダイソミーについては、比率は約50%であるはずである。連鎖モデルまたは平均の正確なエラーモデルを使用しないと、この方法では多くの場合、父系トリソミーが見落とされる。対照的に、本明細書に開示されている方法では、利用可能な遺伝子型の情報および母集団頻度に基づいて、各親の遺伝子型の候補に対して親の遺伝子型の確率を割り当て、親の遺伝子型を明確に必要としない。さらに、本明細書に開示されている方法により、親の遺伝子型データの不在下または存在下でさえもトリソミーを検出することができ、また、連鎖モデルを使用して可能性のある一致トリソミーから不一致トリソミーへの乗換えの点を同定することによって補償することができる。 Some methods known in the art are homozygous for mothers, but different alleles are measured in plasma (AA | AB or AA | BB status), averaging the ratio of alleles from the SNP. And it comprises the step of claiming the determination of polyploid call from the ratio of the average alleles in these SNPs. This method is intended when the paternal genotype is not available. Note that it is questionable how accurately plasma can be claimed to be heterozygous at a particular SNP without the presence of a homozygous and opposite paternal BB: of the offspring. At low proportions, the appearance of allele B may simply be the presence of noise, and the absence of B may be the presence of the simple allele of the fetal measurements. It may be a dropout. Furthermore, even if the plasma heterozygotes can actually be determined, this method cannot distinguish paternal trisomy. Specifically, for SNPs where the mother is AA, and for SNPs where some B is measured in plasma, if the father is GG, the genotype of the offspring produced is AGG, with an average ratio of 33% A. (Ratio of children = 100%). However, if the father is AG, the genotype of the resulting offspring may be AGG for matched trisomy, give a ratio of A of 33%, or may be AAG for mismatched trisomy. A, which is closer to 66% of the average ratio, is obtained. Given that many trisomy are on the chromosome with crossover, the overall chromosome can be between no trisomy of mismatch and trisomy of all mismatch, and this ratio is It can vary between 33 and 66%. For normal disomy, the ratio should be about 50%. Without the use of a chained model or an accurate error model of the mean, this method often overlooks paternal trisomy. In contrast, the methods disclosed herein assign a parent genotype probability to each parent genotype candidate based on available genotype information and population frequency, and the parent. Does not explicitly require the genotype of. In addition, the methods disclosed herein allow trisomy to be detected in the absence or even in the presence of parental genotype data, and from possible matching trisomy using a linkage model. It can be compensated by identifying the point of transfer to the discrepancy trisomy.

当技術分野で公知のいくつかの方法は、母系の遺伝子型も父系の遺伝子型も未知であるSNPからの対立遺伝子の比を平均するため、および、これらのSNPにおける平均の比から倍数性コールを決定するための方法を主張する。しかし、これらの目的を実現する方法は開示されていない。本明細書に開示されている方法により、そのような状況において正確な倍数性コールを行うことができ、同時確率最尤法を用い、必要に応じて、SNPノイズおよび偏りのモデル、ならびに連鎖モデルを利用する実施化が本文書の他の箇所に開示されている。 Several methods known in the art are for averaging the ratio of alleles from SNPs of unknown maternal and paternal genotypes, and polyploid calls from the ratio of the averages in these SNPs. Insist on a method for determining. However, no method has been disclosed to achieve these objectives. The methods disclosed herein allow accurate haploid calls in such situations, using simultaneous probability maximum likelihood methods, and optionally SNP noise and bias models, as well as chaining models. Implementations that utilize are disclosed elsewhere in this document.

当技術分野で公知のいくつかの方法は、対立遺伝子の比を平均し、1つまたは少数のSNPにおける平均の対立遺伝子の比からの倍数性コールの決定を主張するステップを包含する。しかし、そのような方法では、連鎖の概念を利用しない。本明細書に開示されている方法にはこれらの欠点がない。 Some methods known in the art include averaging allele ratios and claiming the determination of ploidy calls from the average allele ratio in one or a few SNPs. However, such a method does not utilize the concept of chaining. The methods disclosed herein do not have these drawbacks.

DNAの起源を決定するための事前として配列の長さを使用すること
配列の長さの分布は母系DNAと胎児DNAで異なり、胎児の方が一般に短いことが報告されている。本開示のある実施形態では、以前の知見を経験的なデータの形態で用い、母親のDNA(P(X|母系))と胎児DNA(P(X|胎児))の両方の予測される長さの事前分布を構築することが可能である。長さxの新しい未確認のDNA配列を考慮すると、母系または胎児のいずれかを考慮したxの事前尤度に基づいて、DNAの所与の配列が母系DNAまたは胎児DNAのいずれかである確率を定めることが可能である。詳細には、P(x|母系)>P(x|胎児)である場合は、DNA配列を母系に分類することができ、P(x|母系)=P(x|母系)/[(P(x|母系)+P(x|胎児)]であり、p(x|母系)<p(x|胎児)である場合は、DNA配列を胎児に分類することができ、P(x|胎児)=P(x|胎児)/[(P(x|母系)+P(x|胎児)]である。本開示のある実施形態では、その試料に対して特異的である母系の配列の長さおよび胎児の配列の長さの分布を、高い確率で母系または胎児に割り当てることができる配列を考慮に入れることによって決定することができ、次いで、その試料に特異的な分布を、その試料についての予測されるサイズ分布として用いることができる。
Use sequence lengths as a precursor to determine the origin of DNA It has been reported that the distribution of sequence lengths differs between maternal and fetal DNA, with fetal being generally shorter. In one embodiment of the present disclosure, previous findings are used in the form of empirical data to predict the expected length of both maternal DNA (P (X | maternal)) and fetal DNA (P (X | fetal)). It is possible to construct a prior distribution of data. Given the new unidentified DNA sequence of length x, the probability that a given sequence of DNA is either maternal or fetal DNA, based on the pre-likelihood of x considering either maternal or fetal. It is possible to determine. Specifically, if P (x | maternal line)> P (x | fetus), the DNA sequence can be classified as a maternal line, and P (x | maternal line) = P (x | maternal line) / [(P). If (x | maternal line) + P (x | fetus)] and p (x | maternal line) <p (x | fetus), the DNA sequence can be classified as a fetus, and P (x | fetus). = P (x | fetus) / [(P (x | maternal) + P (x | fetus)]. In certain embodiments of the present disclosure, the length of the maternal sequence and the length of the maternal sequence that is specific to the sample. The distribution of the length of the fetal sequence can be determined by taking into account the sequences that can be assigned to the maternal line or the fetus with high probability, and then the sample-specific distribution is predicted for the sample. It can be used as a size distribution.

配列決定の費用を最小限にするための可変性のリード深度
診断薬に関する多くの臨床試験、例えば、ChiuらBMJ、2011年:342巻:c7401頁では、いくつものパラメータを用いるプロトコールを設定し、次いで、試験における患者のそれぞれに対して同じパラメータを用いて同じプロトコールを実行する。遺伝物質を測定するための方法として配列決定を用いて母親が妊娠中の胎児の倍数性の状態を決定する場合には、1つの関係するパラメータはリード数である。リード数とは、実際のリード数、意図されたリード数、シーケンサーの分割レーン、完全なレーンまたは完全なフローセルを指し得る。これらの試験では、リード数は、一般には、全てまたはほぼ全ての試料が正確度の所望のレベルを実現することを確実にするレベルで設定する。配列決定は、現在のところ費用のかかる技術であり、マッピング可能な500万リード当たりおよそ$200の費用がかかり、一方価格が下がると、同様のレベルの正確度で作動するがリードが少ない配列決定に基づく診断を可能にする任意の方法により、かなりの量の金が必ず節約される。
In many clinical trials on variable read depth diagnostics to minimize the cost of sequencing, such as Chiu et al. BMJ, 2011: 342: c7401, set a protocol with a number of parameters. The same protocol is then performed for each patient in the trial with the same parameters. If the mother uses sequencing as a method for measuring genetic material to determine the ploidy state of the fetus during pregnancy, one relevant parameter is the number of reads. The number of reads can refer to the actual number of reads, the intended number of reads, the sequencer's split lanes, the complete lanes, or the complete flow cell. In these tests, the number of reads is generally set at a level that ensures that all or almost all samples achieve the desired level of accuracy. Sequencing is currently a costly technique, costing approximately $ 200 per 5 million mappable reads, while at lower prices, it works with similar levels of accuracy but has fewer reads. Any method that enables a diagnostic based on will inevitably save a significant amount of money.

倍数性の決定の正確度は、一般には、リード数および混合物中の胎児DNAの割合を含めたいくつもの因子に左右される。正確度は、一般には、混合物中の胎児DNAの割合がより多いほどより高い。同時に、正確度は、一般には、リード数がより多いほどより高い。匹敵する正確度で倍数性の状態を決定する2つの場合を伴う状況を有することが可能であり、第1の場合には第2の場合よりも混合物中の胎児DNAの割合がより少なく、第1の場合には第2の場合よりも多くのリードが配列決定される。混合物中の胎児DNAの推定される割合を、所与のレベルの正確度を実現するために必要なリード数を決定することにおけるガイドとして使用することが可能である。 The accuracy of the ploidy determination generally depends on a number of factors, including the number of reads and the proportion of fetal DNA in the mixture. The accuracy is generally higher as the proportion of fetal DNA in the mixture is higher. At the same time, the accuracy is generally higher as the number of reads increases. It is possible to have a situation with two cases that determine the ploidy state with comparable accuracy, the first case having a lower proportion of fetal DNA in the mixture than the second case, the first. In the case of 1, more reads are sequenced than in the second case. The estimated proportion of fetal DNA in the mixture can be used as a guide in determining the number of reads required to achieve a given level of accuracy.

本開示のある実施形態では、試料の集合を、集合内の異なる試料が異なるリード深度に配列決定される場合に実行することができ、試料のそれぞれに対して実行されるリード数は、各混合物において算出された胎児DNAの割合を考慮して、所与のレベルの正確度が実現されるように選択する。本開示のある実施形態では、これは、混合物中の胎児DNAの割合を決定するために混合試料の測定を行うことを伴ってよく、この胎児画分の推定は、配列決定を用いて行うことができ、TAQMANを用いて行うことができ、qPCRを用いて行うことができ、SNPアレイを用いて行うことができ、所与の遺伝子座における異なる対立遺伝子を区別することができる任意の方法を用いて行うことができる。胎児画分を推定することの必要性は、実際の測定データと比較する際に考慮される仮説の集合内の全てのまたは選択された胎児画分の集合を包含する仮説を含めることによって排除することができる。混合物中の胎児DNAの割合を決定した後、各試料について読み取られる配列の数を決定することができる。 In one embodiment of the present disclosure, a set of samples can be performed when different samples in the set are sequenced at different read depths, and the number of reads performed for each of the samples is each mixture. Considering the proportion of fetal DNA calculated in, choose to achieve a given level of accuracy. In certain embodiments of the present disclosure, this may involve measuring the mixed sample to determine the proportion of fetal DNA in the mixture, and estimation of this fetal fraction is performed using sequencing. Any method that can be done with TAQMAN, can be done with qPCR, can be done with SNP arrays, and can distinguish different alleles at a given locus. Can be done using. The need to estimate the fetal fraction is eliminated by including hypotheses that include all or selected sets of fetal fractions within the set of hypotheses considered when comparing to actual measured data. be able to. After determining the proportion of fetal DNA in the mixture, the number of sequences read for each sample can be determined.

本開示のある実施形態では、妊娠中の女性100人が各人のOBに来診し、抗lysant(anti-lysant)および/またはDNAアーゼを不活化するものが入った血液チューブ中に各人の血液を採取する。該女性はそれぞれ、自身が妊娠中の胎児の父親が唾液試料を提供するためのキットを家に持ち帰る。100組の夫婦全てについての両者の遺伝物質の集合を検査室に送り返し、そこで母親の血液を遠心沈澱させ、血漿だけでなくバフィーコートも単離する。血漿は、母系DNAならびに胎盤に由来するDNAの混合物を含む。母系のバフィーコートおよび父系の血液についてSNPアレイを使用して遺伝子型決定し、母系の血漿試料中のDNAを、SURESELECTハイブリダイゼーションプローブを用いて標的とする。プローブを用いてプルダウンされたDNAを使用して、母体試料のそれぞれに対するものであり、各試料に異なるタグでタグ付けした、タグ付けしたライブラリーを100個生成する。各ライブラリーからの一部分を取り出し、それらの一部分のそれぞれを一緒に混合し、ILLUMINA HISEQ DNAシーケンサーの2つのレーンに多重様式で加え、各レーンからおよそ5,000万のマッピング可能なリードがもたらされ、100の多重化混合物においておよそ1億のマッピング可能なリード、または試料当たりおよそ100万のリードがもたらされた。シーケンスリードを使用して、各混合物中の胎児DNAの割合を決定した。50の試料が、混合物中15%超の胎児DNAを有し、100万のリードが、99.9%の信頼度で胎児の倍数性の状態を決定するために十分であった。 In one embodiment of the present disclosure, 100 pregnant women visit their OBs and each in a blood tube containing an anti-lysant (anti-lysant) and / or inactivated DNAase. Blood is collected. Each of the women brings home a kit for the father of the fetus, who is pregnant, to provide saliva samples. A collection of both genetics for all 100 couples is sent back to the laboratory where the mother's blood is centrifuged to isolate the buffy coat as well as the plasma. Plasma contains a mixture of maternal DNA as well as DNA derived from the placenta. Maternal buffy coats and paternal blood are genotyped using SNP arrays and DNA in maternal plasma samples is targeted using SURESELECT hybridization probes. DNA pulled down with a probe is used to generate 100 tagged libraries for each of the maternal samples, each sample tagged with a different tag. Extract parts from each library, mix each of those parts together and add to the two lanes of the ILLUMINA HISEQ DNA sequencer in multiplex fashion, resulting in approximately 50 million mapable reads from each lane. The result was approximately 100 million mapable leads in 100 multiplexed mixtures, or approximately 1 million reads per sample. Sequence reads were used to determine the proportion of fetal DNA in each mixture. Fifty samples had more than 15% fetal DNA in the mixture and one million reads were sufficient to determine fetal ploidy status with 99.9% confidence.

残りの混合物のうち、25個が10%から15%の間の胎児DNAを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの一部分を多重化し、HISEQの1つのレーンに流し、各試料についてさらなる200万のリードを生成した。10%から15%の間の胎児DNAを有する混合物のそれぞれについての配列データの2つの集合を一緒に加え、生じた試料当たり300万のリードは、それらの胎児の倍数性の状態を99.9%の信頼度で決定するために十分であった。 Of the remaining mixture, 25 have fetal DNA between 10% and 15%, multiplexing each portion of the relevant library prepared from these mixtures into one lane of HISEQ. The sink generated an additional 2 million leads for each sample. Two sets of sequence data for each of the mixtures with fetal DNA between 10% and 15% were added together and 3 million reads per sample produced 99.9 of the ploidy state of those fetuses. % Confidence was sufficient to determine.

残りの混合物のうち、13個が6%から10%の間の胎児DNAを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの画分を多重化し、HISEQの1つのレーンに流し、各試料についてさらなる400万のリードを生成した。6%から10%の間の胎児DNAを有する混合物のそれぞれについての配列データの2つの集合を一緒に加え、生じた混合物当たり500万の総リードは、それらの胎児の倍数性の状態を99.9%の信頼度で決定するために十分であった。 Of the remaining mixture, 13 had fetal DNA between 6% and 10%, multiplexing each fraction of the relevant library prepared from these mixtures and one lane of HISEQ. And generated an additional 4 million leads for each sample. Two sets of sequence data for each of the mixtures having fetal DNA between 6% and 10% were added together, and a total read of 5 million per resulting mixture 99. It was enough to make a decision with 9% confidence.

残りの混合物のうち、8つが4%から6%の間の胎児DNAを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの一部分を多重化し、HISEQの1つのレーンに流し、各試料についてさらなる600万のリードを生成した。4%から6%の間の胎児DNAを有する混合物のそれぞれについての配列データの2つの集合を一緒に加え、生じた混合物当たり700万の総リードは、それらの胎児の倍数性の状態を99.9%の信頼度で決定するために十分であった。 Of the remaining mixture, 8 had fetal DNA between 4% and 6%, and each portion of the relevant library prepared from these mixtures was multiplexed and flushed into one lane of HISEQ. , Generated an additional 6 million leads for each sample. Two sets of sequence data for each of the mixtures having fetal DNA between 4% and 6% were added together, and a total read of 7 million per resulting mixture 99. It was enough to make a decision with 9% confidence.

残りの4つの混合物のうちの全てが2%から4%の間の胎児DNAを有し、これらの混合物から調製された関連性のあるライブラリーのそれぞれの一部分を多重化し、HISEQの1つのレーンに流し、各試料についてさらなる1200万のリードを生成した。2%から4%の間の胎児DNAを有する混合物のそれぞれについての配列データの2つの集合を一緒に加え、生じた混合物当たり1300万の総リードは、それらの胎児の倍数性の状態を99.9%の信頼度で決定するために十分であった。 All of the remaining four mixtures have fetal DNA between 2% and 4%, multiplexing each portion of the relevant library prepared from these mixtures and one lane of HISEQ. And generated an additional 12 million leads for each sample. Two sets of sequence data for each of the mixtures having fetal DNA between 2% and 4% were added together, and a total read of 13 million per resulting mixture 99. It was enough to make a decision with 9% confidence.

この方法では、試料100個にわたって99.9%の正確度を実現するために、HISEQ機械で配列決定するための6レーンが必要であった。あらゆる試料に対して同じ数の実行が必要である場合、あらゆる倍数性の決定が99.9%の正確度で行われることを確実にするためには、配列決定に25レーンが取られ、4%のコールなしの比または誤差率を許容する場合、14レーンの配列決定で実現することができた。 This method required 6 lanes for sequencing on a HISEQ machine to achieve 99.9% accuracy over 100 samples. If the same number of runs are required for every sample, 25 lanes are taken for the sequencing to ensure that every ploidy determination is made with 99.9% accuracy, 4 If a% call-free ratio or error rate was tolerated, this could be achieved with a 14-lane sequencer.

未加工の遺伝子型決定データの使用
母系の血液中に見いだされる胎児DNAにおいて測定された胎児の遺伝子情報を使用してNPDを実現できるいくつもの方法が存在する。これらの方法のいくつかは、SNPアレイを使用して胎児DNAの測定を行うことを包含し、いくつかの方法は非標的化配列決定を包含し、いくつかの方法は標的化配列決定を包含する。標的化配列決定ではSNPを標的とすることができ、STRを標的とすることができ、他の多型遺伝子座を標的とすることができ、非多型の遺伝子座またはそのいくつかの組み合わせを標的とすることができる。これらの方法のいくつかは、測定を行う機械のセンサーによってもたらされる強度データから対立遺伝子の同一性をコールする、商業的なまたは専有の対立遺伝子コーラーを使用することを含めてよい。例えば、ILLUMINA INFINIUMシステムまたはAFFYMETRIX GENECHIPマイクロアレイシステムは、DNAの相補的なセグメントとハイブリダイズすることができるDNA配列を付着させたビーズまたはマイクロチップを含み、ハイブリダイゼーションすると、センサー分子の蛍光性が変化し、それを検出することができる。配列決定方法、例えば、ILLUMINA SOLEXA GENOME SEQUENCERまたはABI SOLID GENOME SEQUENCERもあり、これは、DNAの断片の遺伝子配列について配列決定し、配列決定される鎖と相補的なDNAの鎖が伸長すると、伸長したヌクレオチドの同一性が、一般には、相補的なヌクレオチドに付加した蛍光性タグまたは放射性タグを介して検出される。これらの方法の全てにおいて、遺伝子型データまたは配列決定データは、一般には、蛍光もしくは他のシグナルまたはそれがないことに基づいて決定される。これらのシステムは、一般には、蛍光または他の検出デバイスのアナログ出力(一次遺伝子データ)から特定の対立遺伝子のコール(二次遺伝子データ)を行う低レベルのソフトウェアパッケージと組み合わせる。例えば、SNPアレイ上の所与の対立遺伝子の場合には、該ソフトウェアにより、蛍光強度がある特定の閾値を上回る、または下回る量である場合に、特定のSNPが存在するまたは存在しないというコールを行う。同様に、シーケンサーの出力は、色素のそれぞれについて検出された蛍光のレベルを示すクロマトグラムであり、該ソフトウェアにより、特定の塩基対が、AもしくはTまたはCもしくはGであるというコールを行う。ハイスループットシーケンサーにより、一般には、リードと称される一連のそのような測定が行われ、配列決定された、最も可能性が高いDNA配列の構造が示される。クロマトグラムの直接的なアナログ出力は、本明細書では一次遺伝子データであると定義され、該ソフトウェアによって行われる塩基対/SNPのコールは、本明細書では二次遺伝子データとみなされる。ある実施形態では、一次データとは、遺伝子型決定プラットフォームの加工されていない出力である生の強度データを指し、遺伝子型決定プラットフォームとは、SNPアレイまたは配列決定プラットフォームを指し得る。二次遺伝子データとは、加工された遺伝子データであって、対立遺伝子のコールが行われている、または配列データが塩基対に割り当てられている、かつ/またはシーケンスリードがゲノムにマッピングされているデータを指す。
Use of Raw Genotyping Data There are a number of ways in which NPD can be achieved using fetal genetic information measured in fetal DNA found in maternal blood. Some of these methods involve making measurements of fetal DNA using SNP arrays, some include non-targeted sequencing, and some include targeted sequencing. do. Targeted sequencing can target SNPs, STRs, other polymorphic loci, non-polymorphic loci or some combinations thereof. Can be targeted. Some of these methods may include the use of commercial or proprietary allele callers that call allelic identity from intensity data provided by the sensor of the measuring machine. For example, the ILLUMINA INFINIUM system or the AFFYMETRIX GENECHIP microarray system includes beads or microchips attached with DNA sequences that can hybridize to complementary segments of DNA, and hybridization changes the fluorescence of the sensor molecule. , It can be detected. There are also sequencing methods, such as the ILLUMINA SOLEXA GENOME SEQUENCER or ABI SOLID GENOME SEQUENCER, which are sequenced for the gene sequence of a fragment of DNA and extended as the DNA strand complementary to the sequenced strand is extended. Nucleotide identity is generally detected via a fluorescent or radioactive tag attached to a complementary nucleotide. In all of these methods, genotyping or sequencing data is generally determined on the basis of fluorescence or other signals or the absence thereof. These systems are typically combined with low-level software packages that make calls for specific alleles (secondary gene data) from the analog output (primary gene data) of fluorescence or other detection devices. For example, in the case of a given allele on an SNP array, the software makes a call that a particular SNP is present or absent if the fluorescence intensity is above or below a certain threshold. conduct. Similarly, the output of the sequencer is a chromatogram showing the level of fluorescence detected for each of the dyes, and the software makes a call that a particular base pair is A or T or C or G. The high-throughput sequencer makes a series of such measurements, commonly referred to as reads, to show the structure of the most likely DNA sequence sequenced. The direct analog output of the chromatogram is defined herein as primary genetic data, and base pair / SNP calls made by the software are considered herein as secondary genetic data. In certain embodiments, the primary data refers to raw intensity data, which is the unprocessed output of the genotyping platform, and the genotyping platform can refer to an SNP array or sequencing platform. Secondary gene data is processed genetic data in which allele calls are made, sequence data is assigned to a base pair, and / or sequence reads are mapped to the genome. Refers to data.

多くのより高レベルの適用では、これらの対立遺伝子のコール、SNPのコールおよびシーケンスリード、すなわち遺伝子型決定ソフトウェアにより生じる二次遺伝子データを活用する。例えば、DNA NEXUS、ELANDまたはMAQでシーケンシングリードを取得し、それらをゲノムにマッピングする。例えば、非侵襲的な出生前診断との関連において、複雑なインフォマティクス、例えば、PARENTAL SUPPORT(商標)は、個体の遺伝子型を決定するための多数のSNPのコールに影響を及ぼし得る。また、着床前遺伝子診断との関連において、ゲノムにマッピングされるシーケンスリードの集合を取得することが可能であり、各染色体または染色体のセクションにマッピングされる正規化されたリード数を取得することにより、個体の倍数性の状態を決定することが可能であり得る。非侵襲的な出生前診断との関連において、母系の血漿中に存在するDNAにおいて測定されたシーケンスリードの集合を取得し、それらをゲノムにマッピングすることが可能であり得る。次いで、各染色体または染色体のセクションにマッピングされる正規化されたリード数を取得し、そのデータを使用して、個体の倍数性の状態を決定することができる。例えば、不釣り合いに多数のリードを有する染色体は、血液を抜き取った母親が妊娠中の胎児においてトリソミーであると結論づけることが可能であり得る。 Many higher levels of application utilize these allelic calls, SNP calls and sequence reads, ie, secondary genetic data generated by genotyping software. For example, obtain sequencing reads with DNA NEXUS, ELAND or MAQ and map them to the genome. For example, in the context of non-invasive prenatal diagnosis, complex informatics, such as PARENTAL SUPPORT ™, can affect multiple SNP calls to genotype an individual. It is also possible to obtain a set of sequence reads that are mapped to the genome in the context of preimplantation genetic diagnosis, and to obtain a normalized number of reads that are mapped to each chromosome or section of the chromosome. It may be possible to determine the polyploid state of an individual. In the context of non-invasive prenatal diagnosis, it may be possible to obtain a collection of sequence reads measured in DNA present in maternal plasma and map them to the genome. The normalized number of reads mapped to each chromosome or section of the chromosome can then be obtained and the data used to determine the ploidy state of the individual. For example, a chromosome with a disproportionately large number of reads may be able to conclude that the bleeding mother is trisomy in the pregnant fetus.

しかし、実際には、測定計器からの最初の出力は、アナログシグナルである。特定の塩基対を、配列決定ソフトウェアに関連するソフトウェア、例えば、塩基対Tをコールすることができるソフトウェアによってコールする場合、実際には、そのコールは、該ソフトウェアにより可能性が最も高いと考えられるコールである。しかし、いくつかの場合には、コールは低信頼度であってもよく、例えば、アナログシグナルにより、特定の塩基対が、Tである可能性が90%だけであり、Aである可能性が10%であることが示される場合もある。別の例では、SNPアレイリーダーに付随する遺伝子型コールソフトウェアにより、特定の対立遺伝子がGであることがコールされる場合もある。しかし、実際には、基礎をなすアナログシグナルにより、対立遺伝子がGである可能性が70%だけであり、対立遺伝子がTである可能性が30%であることが示される場合もある。これらの場合には、より高レベルの適用においてより低レベルのソフトウェアによって行った遺伝子型のコールおよび配列のコールを用いる場合、一部の情報が失われる。すなわち、遺伝子型決定プラットフォームによって直接測定される一次遺伝子データは、添付のソフトウェアパッケージによって決定される二次遺伝子データよりも厄介であり得るが、それはより多くの情報を含有する。二次遺伝子データ配列のゲノムへのマッピングにおいて、一部の塩基が十分に明瞭に読み取られていないので、または、マッピングが明瞭ではないので、多くのリードが捨てられる。一次遺伝子データシーケンスリードを使用する場合、二次遺伝子データシーケンスリードに最初に変換された際に捨てられた可能性があるリードの全てまたはその多くを、リードを確率的に処理することによって使用することができる。 However, in reality, the first output from the instrument is an analog signal. When a particular base pair is called by software associated with the sequencing software, such as software capable of calling base pair T, the call is, in fact, considered most likely by that software. It's a call. However, in some cases, the call may be unreliable, for example, due to an analog signal, a particular base pair is only 90% likely to be T and may be A. It may also be shown to be 10%. In another example, the genotype calling software associated with the SNP array reader may call that a particular allele is G. However, in practice, the underlying analog signal may indicate that the allele is only 70% likely to be G and the allele is 30% likely to be T. In these cases, some information is lost when using genotype and sequence calls made by lower level software in higher level applications. That is, the primary genetic data measured directly by the genotyping platform can be more troublesome than the secondary genetic data determined by the attached software package, but it contains more information. Many reads are discarded because some bases are not sufficiently clearly read or the mapping is not clear in the mapping of secondary gene data sequences to the genome. When using primary gene data sequence reads, all or many of the reads that may have been discarded when first converted to secondary gene data sequence reads are used by stochastically processing the reads. be able to.

本開示のある実施形態では、より高レベルのソフトウェアは、より低いレベルのソフトウェアによって決定される対立遺伝子のコール、SNPのコールまたはシーケンスリードに依拠しない。その代わりに、より高レベルのソフトウェアは、遺伝子型決定プラットフォームから直接測定されたアナログシグナルにその算出の基礎を置く。本開示のある実施形態では、インフォマティクスに基づく方法、例えば、PARENTAL SUPPORT(商標)を、胚/胎児/子の遺伝子データを再構築するその能力が、遺伝子型決定プラットフォームによって測定された一次遺伝子データを直接使用するように工学的に操作されるように改変する。本開示のある実施形態では、インフォマティクスに基づく方法、例えば、PARENTAL SUPPORT(商標)では、一次遺伝子データを使用し、二次遺伝子データを使用せずに、対立遺伝子のコール、および/または染色体コピー数のコールを行うことができる。本開示のある実施形態では、遺伝子のコール、SNPのコール、すべてのシーケンスリード、配列マッピングを、一次遺伝子データを二次的な遺伝子のコールに変換するのではなく、遺伝子型決定プラットフォームによって直接測定された生の強度データを使用することによって確率的に処理する。ある実施形態では、対立遺伝子数の確率を算出するステップおよび各仮説の相対的確率を決定するステップにおいて使用する調製された試料からのDNA測定値は、一次遺伝子データを含む。 In certain embodiments of the present disclosure, the higher level software does not rely on allelic calls, SNP calls or sequence reads determined by the lower level software. Instead, higher levels of software base their calculations on analog signals measured directly from genotyping platforms. In certain embodiments of the present disclosure, an informatics-based method, eg, PARENTAL SUPPORT ™, whose ability to reconstruct embryo / fetal / offspring genetic data is measured by a genotyping platform. Modify to be engineered for direct use. In certain embodiments of the present disclosure, informatics-based methods, such as PARENTAL SUPPORT ™, use primary gene data and without secondary gene data, call alleles and / or chromosomal copies. Can make a call. In one embodiment of the disclosure, gene calls, SNP calls, all sequence reads, sequence mappings are measured directly by a genotyping platform rather than converting primary gene data into secondary gene calls. Probabilistically processed by using the raw intensity data produced. In certain embodiments, the DNA measurements from the prepared samples used in the step of calculating the probability of the number of alleles and the step of determining the relative probability of each hypothesis include primary gene data.

いくつかの実施形態では、前記方法により、少なくとも1つの関連する個体の遺伝子データを組み入れる、標的個体の遺伝子データの正確度を上昇させることができ、前記方法は、標的個体のゲノムに特異的な一次遺伝子データおよび関連する個体(複数可)のゲノム(複数可)に特異的な遺伝子データを得るステップと、関連する個体(複数可)由来のどの染色体のセグメントが、標的個体のゲノム内のそれらのセグメントに対応する可能性があるかに関する1個または複数個の仮説の集合を作製するステップと、標的個体の一次遺伝子データおよび関連する個体(複数可)の遺伝子データを考慮して仮説のそれぞれの確率を決定するステップと、各仮説に関連する確率を用いて、実際の標的個体の遺伝物質の最も可能性が高い状態を決定するステップとを含む。いくつかの実施形態では、前記方法により、標的個体のゲノム内の染色体のセグメントのコピーの数を決定することができ、前記方法は、どのくらいの染色体セグメントのコピーが標的個体のゲノム内に存在するかに関するコピー数についての仮説の集合を作製するステップと、標的個体からの一次遺伝子データおよび1つまたは複数の関連する個体からの遺伝子情報をデータ集合に組み入れるステップと、データ集合に関連するプラットフォームの応答の特性を推定するステップであって、プラットフォームの応答が、ある実験と別の実験で変動し得るステップと、データ集合およびプラットフォームの応答特性を考慮して、コピー数についての仮説のそれぞれの相対的確率を計算するステップと、最も可能性の高いコピー数についての仮説に基づいて染色体セグメントのコピー数を決定するステップとを含む。ある実施形態では、本開示の方法は、標的個体の少なくとも1つの染色体の倍数性の状態を決定することができ、前記方法は、標的個体から、および1つまたは複数の関連する個体から、一次遺伝子データを得るステップと、標的個体の染色体のそれぞれについて、少なくとも1つの倍数性の状態についての仮説の集合を作製するステップと、1つまたは複数の専門技法を用いて、集合内の倍数性の状態についての仮説のそれぞれの統計的確率を決定するステップと、使用した専門技法のそれぞれについて、得られた遺伝子データを考慮して、倍数性の状態についての仮説のそれぞれについて、1つまたは複数の専門技法によって決定された統計的確率を組み合わせるステップと、標的個体の染色体のそれぞれについて、倍数性の状態についての仮説のそれぞれについての複合統計確率に基づいて倍数性の状態を決定するステップとを含む。ある実施形態では、本開示の方法は、対立遺伝子の集合において、標的個体において、および標的個体の一方の親または両親から、および必要に応じて、1つまたは複数の関連する個体から、対立遺伝子の状態を決定することができ、前記方法は、標的個体から、および一方の親または両親から、および任意の関連する個体から一次遺伝子データを得るステップと、標的個体について、および一方の親または両親について、および必要に応じて、1つまたは複数の関連する個体について、少なくとも1つの対立遺伝子についての仮説の集合を作製するステップであって、仮説が対立遺伝子の集合における可能性のある対立遺伝子の状態を記載するステップと、仮説の集合内の各対立遺伝子についての仮説について統計的確率を、得られた遺伝子データを考慮して決定するステップと、対立遺伝子の集合内の対立遺伝子のそれぞれについて、標的個体について、および一方の親または両親について、および必要に応じて、1つまたは複数の関連する個体について、対立遺伝子についての仮説のそれぞれの統計的確率に基づいて対立遺伝子の状態を決定するステップとを含む。 In some embodiments, the method can increase the accuracy of the genetic data of a target individual, incorporating the genetic data of at least one related individual, and the method is specific to the genome of the target individual. Steps to obtain primary genetic data and genetic data specific to the genome (s) of the relevant individual (s) and which chromosomal segment from the relevant individual (s) are those within the genome of the target individual. Each of the hypotheses, taking into account the primary genetic data of the target individual and the genetic data of the relevant individual (s), as well as the steps to create a set of one or more hypotheses as to whether they may correspond to a segment of It includes the steps of determining the probability of each hypothesis and the step of determining the most probable state of the genetic material of the actual target individual using the probabilities associated with each hypothesis. In some embodiments, the method can determine the number of copies of chromosomal segments in the genome of a target individual, the method of which is how many copies of chromosomal segments are present in the genome of the target individual. Steps to create a set of hypotheses about the number of copies, and steps to incorporate primary genetic data from the target individual and genetic information from one or more related individuals into the data set, and the platform associated with the data set. Relative to each of the hypotheses about the number of copies, taking into account the steps in which the response characteristics of the platform can fluctuate in one experiment and another, and the response characteristics of the data set and platform. It involves calculating the target probability and determining the number of copies of the chromosomal segment based on the hypothesis about the most likely copy number. In certain embodiments, the methods of the present disclosure can determine the ploidy state of at least one chromosome of a target individual, wherein the method is primary from the target individual and from one or more related individuals. The step of obtaining genetic data, the step of creating a set of hypotheses for at least one ploidy state for each of the chromosomes of the target individual, and the step of using one or more specialized techniques to make the ploidy within the set. One or more for each hypothesis about ploidic states, taking into account the genetic data obtained for each step of determining the statistical probability of each hypothesis about the state and for each of the expertise used. It includes a step of combining statistical probabilities determined by specialized techniques and a step of determining ploidy states based on compound statistical probabilities for each hypothesis about ploidy states for each of the chromosomes of the target individual. .. In certain embodiments, the methods of the present disclosure are allogenes in a set of allelic genes, in the target individual and from one parent or parent of the target individual, and optionally from one or more related individuals. The state of the gene can be determined, the method of obtaining primary genetic data from a target individual and from one parent or parent, and from any related individual, with respect to the target individual, and one parent or parent. And, optionally, for one or more related individuals, a step of creating a set of hypotheses for at least one allogen, where the hypothesis is a possible alleged set of allogens. For each of the steps to describe the state, the step to determine the statistical probability of the hypothesis for each allelic gene in the set of hypotheses, taking into account the obtained genetic data, and the alligator gene in the set of allelic genes. Steps to determine the status of an allelic gene for a target individual, for one parent or parent, and, optionally, for one or more related individuals, based on their respective statistical probabilities of hypotheses about allogenes. And include.

いくつかの実施形態では、混合試料の遺伝子データは、配列データを含んでよく、ここで、配列データは、ヒトゲノムに独自にマッピングされない場合がある。いくつかの実施形態では、混合試料の遺伝子データは、配列データを含んでよく、ここで、配列データは、ゲノム内の複数の場所にマッピングされ、ここで、可能性のあるマッピングのぞれぞれは、所与のマッピングが正確である確率を伴う。いくつかの実施形態では、シーケンスリードは、ゲノム内の特定の位置に関連づけられると仮定されない。いくつかの実施形態では、シーケンスリードは、ゲノム内の複数の位置に関連づけられ、付随する確率はその位置に属する。 In some embodiments, the genetic data of the mixed sample may include sequence data, where the sequence data may not be uniquely mapped to the human genome. In some embodiments, the genetic data of the mixed sample may include sequence data, where the sequence data is mapped to multiple locations within the genome, where each of the possible mappings. It involves the probability that a given mapping is accurate. In some embodiments, sequence reads are not assumed to be associated with a particular location in the genome. In some embodiments, sequence reads are associated with multiple positions within the genome, with associated probabilities belonging to that position.

染色体コピー数を決定する計数法
一態様では、本発明は、異なる染色体に整列させた配列タグの数を比較することにより、胎児染色体の異常分布を検査する方法を特徴とする(例えば、2012年4月20日出願の米国特許第8,296,076号を参照。この特許は、参照によりその全体が本明細書に組み込まれる)。当技術分野で知られているように、用語の「配列タグ」は、例えば、染色体またはゲノム領域または遺伝子にマップされる一定のより大きな配列を特定するために使用できる比較的短い(例えば、15~100)核酸配列を意味する。いくつかの実施形態では、前記方法は、(i)母系および胎児DNAの混合物を含む試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップであって、標的遺伝子座が複数の異なる染色体由来であり、複数の異なる染色体が試料中で異常分布を有すると疑われる少なくとも1個の第1の染色体および試料中で正常分布であると推定される少なくとも1個の第2の染色体を含むステップと、(ii)反応混合物をプライマー伸長反応条件に供して増幅産物を生成するステップと、(iii)増幅産物をシークエンシングして標的遺伝子座に整列した複数の、特異的標的遺伝子座を割り付けるのに十分な長の配列タグを得るステップと、(iv)コンピュータで複数の配列タグをそれらの対応する標的遺伝子座に割り付けるステップと、(v)第1の染色体の標的遺伝子座に整列した配列タグの数および第2の染色体の標的遺伝子座に整列した配列タグの数をコンピュータで決定するステップと、(vi)ステップ(v)からの数を比較して第1の染色体の異常分布の存在の有無を判定するステップとを含む。
Counting Method for Determining the Number of Chromosome Copies In one aspect, the invention features a method of examining the abnormal distribution of fetal chromosomes by comparing the number of sequence tags aligned on different chromosomes (eg, 2012). See U.S. Pat. No. 8,296,076 filed April 20, which is incorporated herein by reference in its entirety. As is known in the art, the term "sequence tag" can be used, for example, to identify certain larger sequences that map to a chromosome or genomic region or gene (eg, 15). ~ 100) Means a nucleic acid sequence. In some embodiments, the method comprises (i) a sample containing a mixture of maternal and fetal DNA at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; It is a step of contacting with a primer library that simultaneously hybridizes to 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different target gene loci to generate a reaction mixture. The target locus is derived from a plurality of different chromosomes, and at least one first chromosome suspected to have an abnormal distribution in the sample and at least presumed to have a normal distribution in the sample. A step containing one second chromosome, (ii) a step of subjecting the reaction mixture to primer extension reaction conditions to produce an amplification product, and (iii) a plurality of sequences in which the amplification product is sequenced at a target loci. To obtain sequence tags long enough to assign specific target loci, (iv) to assign multiple sequence tags to their corresponding target loci on a computer, and (v) first. The step of computer-determining the number of sequence tags aligned with the target locus of the chromosome and the number of sequence tags aligned with the target locus of the second chromosome is compared with the number from (vi) step (v). It includes a step of determining the presence or absence of an abnormal distribution of the first chromosome.

一態様では、本発明は、染色体間の標的増幅産物の相対度数を比較することにより、胎児の異数性の存在の有無を検出する方法を提供する(例えば、2012年1月23日出願の国際公開第WO2012/103031号を参照。この特許は、参照によりその全体が本明細書に組み込まれる)。いくつかの実施形態では、前記方法は、(i)母系および胎児DNAの混合物を含む試料を、複数の異なる染色体由来の少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる非多形標的遺伝子座に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、(ii)反応混合物をプライマー伸長反応条件に供して標的増幅産物を含む増幅産物を生成するステップと、(iii)第1と第2の対象染色体由来の標的増幅産物の相対度数をコンピュータで定量化するステップと、(iv)第1と第2の対象染色体由来の標的増幅産物の相対度数をコンピュータで比較するステップと、(v)第1と第2の対象染色体の比較結果の相対度数に基づいて異数性の存在の有無を特定するステップとを含む。いくつかの実施形態では、第1の染色体は、正倍数体と疑われる染色体である。いくつかの実施形態では、第2の染色体は、異数性であると疑われる染色体である。 In one aspect, the invention provides a method of detecting the presence or absence of fetal aneuploidy by comparing the relative frequencies of target amplification products between chromosomes (eg, filed January 23, 2012). See WO2012 / 103031; this patent is incorporated herein by reference in its entirety). In some embodiments, the method comprises (i) sampling a sample containing a mixture of maternal and fetal DNA at least 1,000; 2,000; 5,000; 7,500; 10, from a plurality of different chromosomes. Contact with a primer library that simultaneously hybridizes to 000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different non-polymorphic target loci. (Ii) A step of subjecting the reaction mixture to primer extension reaction conditions to generate an amplification product containing a target amplification product, and (iii) target amplification derived from the first and second target chromosomes. The step of quantifying the relative frequency of the product by computer, (iv) the step of comparing the relative frequency of the target amplification product derived from the first and second target chromosomes by computer, and (v) the first and second targets. It includes the step of identifying the presence or absence of aneuploidy based on the relative frequency of the comparison result of chromosomes. In some embodiments, the first chromosome is a chromosome suspected to be a positive polyploid. In some embodiments, the second chromosome is a chromosome suspected to be aneuploidy.

出生前診断の組み合わせ方法
異数性または他の遺伝的欠陥を出生前診断または出生前スクリーニングするために用いることができる多くの方法が存在する。本文書の他の箇所、ならびに、2006年11月28日に出願された米国実用新案出願第11/603,406号;2008年3月17日に出願された米国実用新案出願第12/076,348号、およびPCT出願第PCT/S09/52730号に、関連する個体の遺伝子データを使用して、胎児などの標的個体の遺伝子データが公知であるまたは推定される正確度を上昇させる方法の1つが記載されている。出生前診断のために用いる他の方法は、母系の血液中の、種々の遺伝子の異常と相関する特定のホルモンのレベルを測定するステップを包含する。この例はトリプルテストと称される、母系の血液中のいくつか(一般に、2つ、3つ、4つまたは5つ)の異なるホルモンのレベルを測定する検査である。複数の方法を用いて所与の転帰の尤度を決定し、どの方法もそれ自体が決定的でない場合には、これらの方法によって生じる情報を組み合わせて、個々の方法のいずれよりも正確な予測を行うことが可能である。トリプルテストでは、3つの異なるホルモンから生じる情報を組み合わせることにより、個々のホルモンレベルにより予測され得るよりも正確な遺伝子の異常の予測がもたらされ得る。
Combination Methods of Prenatal Diagnosis There are many methods that can be used for prenatal diagnosis or prenatal screening for aneuploidy or other genetic defects. Other parts of this document, as well as US Utility Model Application No. 11 / 603,406, filed November 28, 2006; US Utility Model Application No. 12/076, filed March 17, 2008, 1 of a method for increasing the accuracy of known or estimated genetic data of a target individual, such as a fetus, using the genetic data of the relevant individuals in 348 and PCT application PCT / S09 / 52730. One is described. Other methods used for prenatal diagnosis include measuring the levels of specific hormones in the blood of the maternal line that correlate with abnormalities in various genes. An example of this is a triple test, a test that measures the levels of several (generally two, three, four, or five) different hormones in the blood of a maternal line. Multiple methods are used to determine the likelihood of a given outcome, and if none of them are deterministic in their own right, the information produced by these methods is combined to make a more accurate prediction than any of the individual methods. It is possible to do. The triple test can combine information from three different hormones to provide more accurate predictions of genetic abnormalities than can be predicted by individual hormone levels.

本明細書には、胎児の遺伝子の状態、詳細には、胎児における遺伝子の異常の可能性に関してより正確な予測を行うための方法であって、種々の方法を用いて行った胎児における遺伝子の異常の予測を組み合わせること含む方法が開示されている。「より正確な」方法とは、所与の偽陽性率において、偽陰性率がより低い、異常を診断するための方法を指し得る。好ましい本開示の実施形態では、予測のうちの1つまたは複数を、胎児に関する公知の遺伝子データに基づいて行い、遺伝子の知見はPARENTAL SUPPORT(商標)法を使用して決定した、すなわち、胎児に関連する個体の遺伝子データを使用して、胎児の遺伝子データをより高い正確度で決定した。いくつかの実施形態では、遺伝子データは、胎児の倍数性の状態を含んでよい。いくつかの実施形態では、遺伝子データとは、胎児のゲノムにおける対立遺伝子のコールの集合を指し得る。いくつかの実施形態では、予測のいくつかは、トリプルテストを用いて行われた。いくつかの実施形態では、予測のいくつかを、母系の血液中の他のホルモンレベルの測定値を用いて行った。いくつかの実施形態では、診断を考慮する方法によって行われる予測を、スクリーニングを考慮する方法によって行われる予測と組み合わせることができる。いくつかの実施形態では、前記方法は、アルファ-フェトプロテイン(AFP)の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、コンジュゲートしていないエストリオール(UE)の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、ベータヒト絨毛性ゴナドトロピン(ベータ-hCG)の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、浸潤性トロホブラスト抗原(ITA)の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、インヒビンの母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、妊娠関連血漿タンパク質A(PAPP-A)の母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、前記方法は、他のホルモンまたは母系の血清マーカーの母系の血中レベルを測定するステップを包含する。いくつかの実施形態では、予測のいくつかは、他の方法を用いて行なわれてもよい。いくつかの実施形態では、予測のいくつかは、完全に組み込まれた検査、例えば、妊娠の約12週における超音波検査および血液検査ならびに約16週における第2の血液検査を組み合わせた検査を用いて行なわれてもよい。いくつかの実施形態では、前記方法は、胎児の項部浮腫(NT)を測定するステップを包含する。いくつかの実施形態では、前記方法は、予測を行うために、測定された上述のホルモンのレベルを使用するステップを包含する。いくつかの実施形態では、前記方法は、上述の方法の組み合わせを包含する。 The present specification is a method for making a more accurate prediction regarding the state of a gene in a fetus, in particular, the possibility of a gene abnormality in the fetus, and the gene in the fetus is subjected to various methods. Methods are disclosed that include combining anomaly predictions. A "more accurate" method can refer to a method for diagnosing an abnormality with a lower false negative rate at a given false positive rate. In a preferred embodiment of the present disclosure, one or more of the predictions are made based on known genetic data for the fetus and the genetic findings were determined using the PARENTAL SUPPORT ™ method, i.e. to the fetus. The genetic data of the relevant individuals was used to determine the genetic data of the fetus with higher accuracy. In some embodiments, the genetic data may include a ploidic state of the fetus. In some embodiments, genetic data can refer to a set of allelic calls in the fetal genome. In some embodiments, some of the predictions were made using triple tests. In some embodiments, some of the predictions were made using measurements of other hormone levels in the maternal blood. In some embodiments, the predictions made by the method considering diagnosis can be combined with the predictions made by the method considering screening. In some embodiments, the method comprises measuring the maternal blood level of alpha-fetoprotein (AFP). In some embodiments, the method comprises measuring the maternal blood levels of unconjugated estriol (UE 3 ). In some embodiments, the method comprises measuring the maternal blood levels of beta-human chorionic gonadotropin (beta-hCG). In some embodiments, the method comprises measuring the maternal blood level of an invasive trophoblast antigen (ITA). In some embodiments, the method comprises measuring blood levels of activin maternal lineage. In some embodiments, the method comprises measuring the maternal blood level of pregnancy-related plasma protein A (PAPP-A). In some embodiments, the method comprises measuring the maternal blood levels of other hormones or maternal serum markers. In some embodiments, some of the predictions may be made using other methods. In some embodiments, some of the predictions use a fully integrated test, eg, a combination of ultrasonography and blood tests at about 12 weeks of gestation and a second blood test at about 16 weeks. May be done. In some embodiments, the method comprises the step of measuring fetal neck edema (NT). In some embodiments, the method comprises the step of using the measured hormone levels described above to make a prediction. In some embodiments, the method comprises a combination of the methods described above.

予測を組み合わせるための多くの方法が存在し、例えば、ホルモンの測定値を、中央値の倍数(multiple of the median)(MoM)に変換し、次いで、尤度比(LR)に変換することができる。同様に、他の測定値を、NT分布の混合モデルを使用してLRに変換することができる。NTおよび生化学的マーカーについてのLRに、年齢および妊娠に関連するリスクを掛けて、21トリソミーなどの種々の状態に対するリスクを導くことができる。検出率(DR)および偽陽性率(FPR)を、所与のリスク閾値を上回るリスクを有する割合を取ることによって算出することができる。 There are many ways to combine predictions, for example, hormone measurements can be converted to multiple of the median (MoM) and then to likelihood ratio (LR). can. Similarly, other measurements can be converted to LR using a mixed model of NT distribution. LR for NT and biochemical markers can be multiplied by age and pregnancy-related risks to derive risks for various conditions such as trisomy 21. The detection rate (DR) and false positive rate (FPR) can be calculated by taking the percentage at risk above a given risk threshold.

ある実施形態では、倍数性の状態をコールするための方法は、同時分布モデルおよび対立遺伝子数の確率を用いて決定される倍数性についての仮説のそれぞれの相対的確率と、これらに限定されないが、リード数解析、ヘテロ接合率の比較、親の遺伝子情報を使用する場合にのみ利用可能な統計量、特定の親の状況に対して正規化された遺伝子型シグナルの確率、第1の試料または調製された試料における推定される胎児画分を用いて算出される統計量、およびそれらの組み合わせを含めた、胎児がトリソミーであるリスクスコアを決定する他の方法から選択される統計学的技法を用いて算出された倍数性についての仮説のそれぞれの相対的確率とを組み合わせるステップを包含する。 In certain embodiments, the methods for calling the statistic state are, but are not limited to, the relative probabilities of the joint probabilities and the probabilities of the statistic determined using the probability of the joint distribution model and the number of allogenes. , Read number analysis, heterojunction rate comparison, statistics available only when using parental genetic information, probability of genotype signal normalized to a particular parental situation, first sample or Statistical techniques selected from other methods of determining the risk score for a trisomy of the fetus, including statistics calculated using the estimated fetal fractions in the prepared samples, and combinations thereof. Includes steps to combine with the respective relative probabilities of the hypothesis about multipliers calculated using.

別の方法は、4つの測定されたホルモンレベルを伴う状況であって、これらのホルモンのまわりの確率分布が既知である状況を包含し得:正倍数性の場合はp(x、x、x、x|e)、異数性の場合はp(x、x、x、x|a)である。次いで、DNA測定値についての確率分布を測定することができ、正倍数性の場合および異数性の場合、それぞれg(y|e)およびg(y|a)である。これらは、正倍数性/異数性の仮定を考慮して、独立していると仮定すると、p(x、x、x、x|a)g(y|a)およびp(x、x、x、x|e)g(y|e)として組み合わせ、次いで、母系の年齢を考慮して、それぞれに事前p(a)およびp(e)を掛けることができる。次いで、最も高いものを選択することができる。 Another method can include situations involving four measured hormone levels, where the probability distribution around these hormones is known: p (x 1 , x 2 for positive ploidy). , X 3 , x 4 | e), and in the case of aneuploidy, p (x 1 , x 2 , x 3 , x 4 | a). The probability distributions for the DNA measurements can then be measured, g (y | e) and g (y | a) for positive ploidy and aneuploidy, respectively. These are p (x 1 , x 2 , x 3 , x 4 | a) g (y | a) and p (x 1, x 2, x 3, x 4 | a) g (y | a), assuming they are independent, taking into account the assumptions of positive ploidy / aneuploidy. They can be combined as x 1 , x 2 , x 3 , x 4 | e) g (y | e) and then pre-multiplied by p (a) and p (e), taking into account the age of the maternal line. .. Then you can choose the highest one.

ある実施形態では、中心極限定理を惹起して、g(y|aまたはe)の分布がガウス分布であると仮定し、多数の試料について調べることによって平均値および標準偏差を測定することが可能である。別の実施形態では、転帰を考慮して、これらが独立していないと仮定し、同時分布p(x、x、x、x|aまたはe)を推定するために十分な試料を収集することができる。 In one embodiment, it is possible to elicit a central limit theorem, assume that the distribution of g (y | a or e) is Gaussian, and measure the mean and standard deviation by examining a large number of samples. Is. In another embodiment, considering the outcome, assuming that they are not independent, sufficient samples to estimate the joint distribution p (x 1 , x 2 , x 3 , x 4 | a or e). Can be collected.

ある実施形態では、標的個体が倍数性の状態であると決定されるための倍数性の状態は、最大の確率を有する仮説に関連づけられる。いくつかの場合には、1つの仮説は、90%超の正規化された複合確率を有する。各仮説は1つの倍数性の状態または倍数性の状態の集合に関連づけられ、その正規化された複合確率が90%超であるかまたはいくつかの他の閾値、例えば、50%、80%、95%、98%、99%または99.9%を超えている仮説に関連づけられる倍数性の状態を、決定された倍数性の状態として仮説がコールされるのに必要な閾値として選択することができる。 In certain embodiments, the haploid state for determining that the target individual is haploid is associated with the hypothesis with the highest probability. In some cases, one hypothesis has a normalized compound probability of greater than 90%. Each hypothesis is associated with one ploidic state or a set of ploidy states, the normalized composite probability of which is greater than 90% or some other threshold, such as 50%, 80%, etc. The ploidy state associated with the hypothesis above 95%, 98%, 99% or 99.9% can be selected as the threshold required for the hypothesis to be called as the determined ploidy state. can.

母系の血液中の、以前の妊娠由来の子由来のDNA 非侵襲的な出生前診断の1つの難しさは、現行の妊娠由来の胎児の細胞と以前の妊娠由来の胎児の細胞を鑑別することである。一部では、前の妊娠由来の遺伝物質(genetic matter)はいくらかの時間の後に消えると考えられているが、決定的な証拠は示されていない。本開示のある実施形態では、PARENTAL SUPPORT(商標)(PS)法、および父系のゲノムの知見を使用して、母系の血液中に存在する父系起源の胎児DNA(すなわち胎児が父親から遺伝によって受け継いだDNA)を決定することが可能である。この方法では、相が特定された親の遺伝子情報を利用することができる。相が特定されていない遺伝子型の情報から、祖父母の遺伝子データ(例えば、祖父の精子から測定された遺伝子データ)を使用して、または、他の生まれた子からの遺伝子データ、または流産の試料から親の遺伝子型の相を特定することが可能である。父系の細胞のHapMapに基づく相の特定またはハプロタイピングによって、相が特定されていない遺伝子情報の相を特定することもできる。上首尾のハプロタイピングは、染色体が緊密な束である有糸分裂の相にある細胞を静止させ、マイクロフルイディクスを使用して別々の染色体を別々のウェルに入れることによって実証されている。別の実施形態では、相が特定された親のハプロタイプデータを使用して、父親由来の2種以上の相同体の存在を検出することが可能であり、これは、2人以上の子由来の遺伝物質が血液中に存在することを意味する。胎児において正倍数性であることが予測される染色体に焦点を当てることにより、胎児がトリソミーを患っている可能性を除外することができる。また、胎児DNAが現在の父親由来でないかどうかを決定することが可能であり、その場合、他の方法、例えば、トリプルテストを用いて遺伝子の異常を予測することができる。 DNA from previous pregnancy-derived offspring in maternal blood One difficulty in non-invasive prenatal diagnosis is to distinguish between current pregnancy-derived fetal cells and previous pregnancy-derived fetal cells. Is. Some believe that genetic matter from the previous pregnancy disappears after some time, but no conclusive evidence has been shown. In one embodiment of the present disclosure, the PARENTAL SUPPORT ™ (PS) method and paternal genomic findings are used to inherit paternally-origin fetal DNA present in maternal blood (ie, the fetus is inherited from the father). It is possible to determine the DNA). In this method, the genetic information of the parent whose phase has been identified can be utilized. From genotype information for which the phase has not been identified, using genetic data from the grandparents (eg, genetic data measured from the sperm of the grandfather), or from genetic data from other born offspring, or samples of abortion. It is possible to identify the genotype phase of the parent from. HapMap-based phase identification or haplotyping of paternal cells can also identify the phase of genetic information for which the phase has not been identified. Successful haplotyping has been demonstrated by quiescing cells in the mitotic phase, where chromosomes are tightly bundled, and using microfluidics to put separate chromosomes into separate wells. In another embodiment, phase-identified parental haplotype data can be used to detect the presence of two or more homologues from the father, which are from two or more offspring. It means that the genetic material is present in the blood. By focusing on chromosomes that are predicted to be positive polyploid in the fetus, the possibility that the fetus suffers from trisomy can be ruled out. It is also possible to determine if the fetal DNA is not of current paternal origin, in which case other methods, such as triple tests, can be used to predict genetic abnormalities.

採血以外の方法によって入手可能な、胎児の遺伝物質の他の供給源があり得る。母系の血液において入手可能な胎児の遺伝物質の場合には、2つの主要なカテゴリー:(1)胎児の細胞全体、例えば、胎児有核赤血球または赤芽球、および(2)浮動性胎児DNAがある。胎児の細胞全体の場合には、胎児の細胞が母系の血液中で長期間存続することができ、したがって、妊娠中の女性から、前の妊娠由来の子または胎児由来のDNAを含有する細胞を単離することが可能であるといういくつかの証拠が存在する。浮動性胎児DNAは、数週間のうちに系から取り除かれるという証拠も存在する。1つの難題は、その遺伝物質が細胞に含有される個体の同一性をどのように決定するか、すなわち、測定された遺伝物質が前の妊娠由来の胎児由来でないことをどのように確実にするかである。本開示のある実施形態では、母系遺伝物質の知見を用いて、問題の遺伝物質が母系遺伝物質ではないことを確実にすることができる。本文書または本文書において参照されているいずれかの特許に記載の通り、インフォマティクスに基づく方法、例えば、PARENTAL SUPPORT(商標)を含めた、この目的を実現するためのいくつもの方法が存在する。 There may be other sources of fetal genetic material available by methods other than blood sampling. In the case of fetal genetics available in maternal blood, there are two main categories: (1) whole fetal cells, such as fetal nucleated red blood cells or erythroblasts, and (2) floating fetal DNA. be. In the case of whole fetal cells, fetal cells can survive for a long time in the blood of the maternal line, thus from pregnant women, cells containing DNA from pre-pregnancy-derived offspring or fetuses. There is some evidence that it is possible to isolate. There is also evidence that floating fetal DNA is removed from the system within a few weeks. One challenge is how to determine the identity of the individual whose genetic material is contained in the cell, i.e., how to ensure that the measured genetic material is not of fetal origin from a previous pregnancy. Is it? In certain embodiments of the present disclosure, the knowledge of maternal genetic material can be used to ensure that the genetic material in question is not the maternal genetic material. As described in this document or any patent referenced herein, there are a number of methods to achieve this goal, including informatics-based methods, such as PARENTAL SUPPORT ™.

本開示のある実施形態では、妊娠中の母親から抜き取った血液を、浮動性胎児DNAを含む画分、および有核赤血球を含む画分に分離することができる。浮動性DNAは必要に応じて富化することができ、DNAの遺伝子型の情報を測定することができる。浮動性DNAから測定された遺伝子型の情報から、母系の遺伝子型の知見を使用して、胎児の遺伝子型の態様を決定することができる。これらの態様は、倍数性の状態、および/または対立遺伝子の集合の同一性を指し得る。次いで、個々の有核赤血球について、本文書の他の箇所および他の参考特許に記載されている方法、特に本文書の最初のセクションに記載の方法を用いて遺伝子型決定することができる。母系ゲノムの知見により、任意の所与の単一の血液細胞が遺伝的に母系かどうかを決定することが可能になる。また、上記の通り決定された胎児の遺伝子型の態様により、単一の血液細胞が、現在妊娠中の胎児に遺伝的に由来するかどうかを決定することが可能になる。本質的に、本開示のこの態様により、母親の遺伝子の知見、および場合によっては他の関連する個体、例えば、父親からの遺伝子情報を、母系の血液中に見いだされる浮動性DNAから測定された遺伝子情報と一緒に使用して、母系の血液中に見いだされる単離された有核細胞が、(a)遺伝的に母系であるか、(b)遺伝的に現在妊娠中の胎児由来であるか、または(c)遺伝的に前の妊娠由来の胎児由来であるかのいずれかを決定することが可能になる。 In one embodiment of the present disclosure, blood drawn from a pregnant mother can be separated into a fraction containing floating fetal DNA and a fraction containing nucleated red blood cells. Floating DNA can be enriched as needed and information on the genotype of the DNA can be measured. From the genotype information measured from the floating DNA, the genotype knowledge of the maternal line can be used to determine the genotypic aspect of the fetus. These embodiments may refer to a ploidic state and / or the identity of a set of alleles. Individual nucleated red blood cells can then be genotyped using the methods described elsewhere in this document and in other reference patents, in particular the methods described in the first section of this document. Knowledge of the maternal genome makes it possible to determine whether any single blood cell is genetically maternal. Also, the aspects of the fetal genotype determined as described above make it possible to determine whether a single blood cell is genetically derived from the currently pregnant fetus. In essence, by this aspect of the present disclosure, genetic findings of the mother and, in some cases, genetic information from other related individuals, such as the father, were measured from the floating DNA found in the blood of the maternal line. The isolated nucleated cells found in the blood of the maternal lineage, used in conjunction with genetic information, are either (a) genetically maternal or (b) genetically derived from the currently pregnant fetus. It will be possible to determine whether (c) it is genetically derived from a fetus from a previous pregnancy.

出生前の性染色体異数性の決定
当技術分野で公知の方法では、妊娠中の胎児の性別を、母親の血液からを決定することを試みる人は、胎児の浮動性DNA(fffDNA)が母親の血漿中に存在するという事実を用いている。母系の血漿中のY特異的遺伝子座を検出することができれば、これは、妊娠中の胎児が男であることを意味する。しかし、当技術分野で既知の方法を用いる場合、いくつかの場合には、fffDNAの量が、男の胎児の場合にY特異的遺伝子座が検出されることを確実にするには低すぎるので、血漿中のY特異的遺伝子座が検出されないことでは、妊娠中の胎児が女であることは必ずしも保証されない。
Determining Prenatal Sex Chromosome Alinessity In methods known in the art, those who attempt to determine the sex of a pregnant fetus from the mother's blood will find that the fetal floating DNA (fffDNA) is the mother. It uses the fact that it is present in the plasma of the fetus. If the Y-specific locus in maternal plasma can be detected, this means that the pregnant fetus is male. However, when using methods known in the art, in some cases the amount of fffDNA is too low to ensure that the Y-specific locus is detected in the case of a male fetus. The lack of detection of a Y-specific locus in plasma does not necessarily guarantee that the pregnant fetus is female.

本明細書では、Y特異的核酸、すなわち排他的に父系的に由来する遺伝子座由来であるDNAを測定することを必要としない新規の方法が提示される。以前に開示されたParental Support方法では、乗換え頻度データ、親の遺伝子型データ、および妊娠中の胎児の倍数性の状態を決定するためのインフォマティクス技法を用いる。胎児の性別は、単に性染色体における胎児の倍数性の状態である。XXである子は女であり、およびXYは男である。本明細書に記載の方法により、胎児の倍数性の状態を決定することもできる。性判別は性染色体の倍数性の決定と有効に同義であることに留意されたい;性判別の場合には、仮定は、多くの場合、子が正倍数性であるとして立てられ、したがって、可能性のある仮説が少ない。 Here, a novel method is presented that does not require the measurement of Y-specific nucleic acids, that is, DNAs derived exclusively from paternally derived loci. The previously disclosed Parental Support method uses crossover frequency data, parental genotype data, and informatics techniques for determining the ploidy state of the fetus during pregnancy. Fetal sex is simply the ploidy state of the fetus on the sex chromosomes. The child who is XX is a woman, and XY is a man. The ploidy state of the fetus can also be determined by the method described herein. It should be noted that sex determination is effectively synonymous with determining sex chromosome polyploidy; in the case of sex determination, assumptions are often made assuming that the offspring are positive polyploid, and therefore possible. There are few sexual hypotheses.

本明細書に開示されている方法は、X染色体とY染色体の両方に共通する遺伝子座について調べて、胎児について予測される存在する胎児DNAの量に関するベースラインを作製するステップを包含する。次いで、X染色体のみに特異的な領域を調べて、胎児が女であるか男であるかを決定することができる。男の場合には、X染色体に特異的な遺伝子座由来の胎児DNAが、XとYの両方に特異的な遺伝子座由来の胎児DNAよりも少ないと認められることが予想される。対照的に、女の胎児では、これらの群のそれぞれのDNAの量が同じであることが予想される。問題のDNAは、試料に存在するDNAの量を定量することができる任意の技法、例えば、qPCR、SNPアレイ、遺伝子型決定アレイまたは配列決定によって測定することができる。排他的に1個体に由来するDNAについては、以下が認められることが予想される:

Figure 0007027468000037
胎児由来のDNAが母親由来のDNAと混在しており、混合物中の胎児DNAの割合がFであり、混合物中の母系DNAの割合がMであり、したがってF+M=100%である場合、以下が認められることが予想される:
Figure 0007027468000038
FおよびMが既知である場合には、予測比を計算することができ、観察されたデータを、予測データと比較することができる。MおよびFが未知である場合には、閾値を過去のデータに基づいて選択することができる。どちらの場合でも、XとYの両方に特異的な遺伝子座において測定されたDNAの量をベースラインとして用いることができ、胎児の性別の検査は、X染色体のみに特異的な遺伝子座において観察されたDNAの量に基づいてよい。その量がベースラインよりも、およそ1/2Fと等しい量だけ低い、またはそれが予め定義された閾値未満になる量だけ低ければ、胎児は男であることが決定され、その量がベースラインとほとんど等しい、またはそれが予め定義された閾値未満になる量だけ低くなければ、胎児は女であることが決定される。 The methods disclosed herein include examining loci common to both the X and Y chromosomes to create a baseline for the predicted amount of fetal DNA present for the fetus. The region specific to the X chromosome alone can then be examined to determine if the fetus is female or male. In the case of males, it is expected that there will be less fetal DNA from the X chromosome-specific locus than fetal DNA from both the X and Y loci. In contrast, in female fetuses, the amount of DNA in each of these groups is expected to be the same. The DNA in question can be measured by any technique that can quantify the amount of DNA present in the sample, such as qPCR, SNP array, genotyping array or sequencing. For DNA exclusively derived from one individual, the following is expected to be observed:
Figure 0007027468000037
If the fetal DNA is mixed with the maternal DNA, the proportion of fetal DNA in the mixture is F, the proportion of maternal DNA in the mixture is M, and therefore F + M = 100%, then: Expected to be accepted:
Figure 0007027468000038
If F and M are known, the prediction ratio can be calculated and the observed data can be compared with the prediction data. If M and F are unknown, the threshold can be selected based on historical data. In either case, the amount of DNA measured at both X and Y specific loci can be used as the baseline, and fetal sex testing is observed at the X chromosome-specific locus only. It may be based on the amount of DNA produced. If the amount is lower than the baseline by an amount equal to approximately 1 / 2F, or by an amount that is below a predefined threshold, then the fetus is determined to be male and that amount is with the baseline. A fetus is determined to be female if it is not almost equal or lower by an amount that is less than a predefined threshold.

別の実施形態では、多くの場合Z染色体と称される、X染色体とY染色体に共通である遺伝子座のみを調べることができる。Z染色体上の遺伝子座のサブセットは、一般には、常にX染色体上のA、およびY染色体上のBである。Z染色体由来のSNPがB遺伝子型を有することが見いだされた場合は、胎児は男であるとコールされ、Z染色体由来のSNPがA遺伝子型のみを有することが見いだされた場合には、胎児は女であるとコールされる。別の実施形態では、X染色体においてのみ見いだされる遺伝子座を調べることができる。AA|Bなどの状況は、Bが存在することにより、胎児が父親由来のX染色体を有することが示されるので、特に情報価値がある。AB|Bなどの状況も、女の胎児の場合には、男の胎児と比較して、多くの場合、Bが半分しか存在しないことが認められると予想されるので、情報価値がある。別の実施形態では、対立遺伝子AとBの両方がX染色体とY染色体の両方に存在し、どのSNPが父系のY染色体由来であるか、およびどれが父系のX染色体由来であるかが既知であるZ染色体上のSNPを調べることができる。 In another embodiment, only loci common to the X and Y chromosomes, often referred to as the Z chromosome, can be examined. A subset of loci on the Z chromosome is generally always A on the X chromosome and B on the Y chromosome. If the Z chromosome-derived SNP is found to have the B genotype, the fetus is called a man, and if the Z chromosome-derived SNP is found to have only the A genotype, the fetus is called. Is called a woman. In another embodiment, loci found only on the X chromosome can be investigated. Situations such as AA | B are particularly informative as the presence of B indicates that the fetus has a paternally-derived X chromosome. Situations such as AB | B are also informative, as it is often expected that female fetuses will have only half of B as compared to male fetuses. In another embodiment, both the allelic genes A and B are present on both the X and Y chromosomes, and it is known which SNPs are from the paternal Y chromosome and which are from the paternal X chromosome. The SNP on the Z chromosome can be examined.

ある実施形態では、Y染色体とX染色体によって共有される相同な非組換え(HNR)領域間で変動することが公知の一塩基位置を増幅することが可能である。このHNR領域内の配列は、X染色体とY染色体の間でほとんど同一である。この同一の領域内に、母集団内のX染色体の間およびY染色体の間では不変であるが、X染色体とY染色体の間では異なる一塩基位置がある。各PCRアッセイによりX染色体とY染色体の両方に存在する遺伝子座由来の配列を増幅することができる。増幅された配列のそれぞれの内部に、配列決定またはいくつかの他の方法を用いて検出することができる単一の塩基がある。 In certain embodiments, it is possible to amplify a single nucleotide position known to vary between homologous non-recombinant (HNR) regions shared by the Y and X chromosomes. The sequences within this HNR region are almost identical between the X and Y chromosomes. Within this same region, there is a single base position that is unchanged between the X and Y chromosomes within the population, but differs between the X and Y chromosomes. Each PCR assay can amplify sequences from loci present on both the X and Y chromosomes. Inside each of the amplified sequences is a single base that can be detected using sequencing or some other method.

ある実施形態では、胎児の性別を、母系の血漿中に見いだされる胎児の浮動性DNAから決定することができ、方法は以下のステップの一部または全部を含む:1)HNR領域内のX/Y変異体一塩基位置を増幅するPCR(通常のPCRまたはmini-PCRのいずれか、所望であればそれに加えて多重化)プライマーを設計するステップ、2)母系の血漿を得るステップ、3)母系の血漿由来の標的を、HNRX/Y PCRアッセイを用いてPCR増幅するステップ、4)増幅産物について配列決定するステップ、5)配列データを、増幅された配列のうちの1個または複数個の内部のY対立遺伝子の存在について検査するステップ。1個または複数個の存在により、男の胎児が示される。全ての増幅産物由来の全てのY対立遺伝子が存在しないことにより、女の胎児が示される。 In certain embodiments, the sex of the fetal can be determined from the floating DNA of the fetal found in the plasma of the maternal line, the method comprising some or all of the following steps: 1) X / within the HNR region. Steps to design PCR (either regular PCR or mini-PCR, if desired, and multiplexing if desired) primers that amplify the Y variant single base position, 2) Obtain maternal plasma, 3) Maternal PCR amplification of plasma-derived targets using the HNRX / Y PCR assay, 4) Sequencing of amplification products, 5) Sequencing data inside one or more of the amplified sequences. Steps to test for the presence of the Y allelic gene. The presence of one or more indicates a male fetus. The absence of all Y alleles from all amplification products indicates a female fetus.

ある実施形態では、標的化配列決定を用いて、母系の血漿中のDNAおよび/または親の遺伝子型を測定することができる。ある実施形態では、父系的に供給されたDNAを起源とすることが明白な配列を全て無視することができる。例えば、状況AA|ABでは、A配列の数を計数し、B配列の全てを無視することができる。上記のアルゴリズムについてヘテロ接合性率を決定するために、所与のプローブについて、観察されたA配列の数と総配列の予測数を比較することができる。試料ごとに各プローブについて配列の予測数を算出することができる多くの方法がある。ある実施形態では、過去のデータを使用して、全てのシーケンスリードのどの画分が特異的なプローブのそれぞれに属するかを決定し、次いで、この経験的な画分をシーケンスリードの総数と組み合わせて使用して、各プローブにおける配列の数を推定することが可能である。別の手法では、一部の公知のホモ接合性の対立遺伝子を標的とし、次いで、過去のデータを使用して、各プローブにおけるリード数と既知のホモ接合性の対立遺伝子におけるリード数を関連づけることができる。次いで、各試料について、ホモ接合性の対立遺伝子におけるリード数を測定し、次いで、この測定値を経験的に導かれた関連性と一緒に使用して、各プローブにおけるシーケンスリード数を推定することができる。 In certain embodiments, targeted sequencing can be used to determine the DNA and / or genotype of the parent in maternal plasma. In certain embodiments, all sequences apparently originating from paternally fed DNA can be ignored. For example, in situations AA | AB, the number of A sequences can be counted and all of the B sequences can be ignored. To determine the heterozygous rate for the above algorithm, the number of observed A sequences and the predicted number of total sequences can be compared for a given probe. There are many methods that can calculate the predicted number of sequences for each probe for each sample. In one embodiment, historical data is used to determine which fraction of all sequence reads belongs to each of the specific probes, and then this empirical fraction is combined with the total number of sequence reads. Can be used to estimate the number of sequences in each probe. Another approach is to target some known homozygous alleles and then use historical data to correlate the number of reads in each probe with the number of reads in known homozygous alleles. Can be done. For each sample, the number of reads in homozygous alleles should then be measured and then used in conjunction with empirically derived associations to estimate the number of sequence reads in each probe. Can be done.

いくつかの実施形態では、複数の方法によって行われた予測を組み合わせることによって胎児の性別を決定することが可能である。いくつかの実施形態では、複数の方法は、本開示に記載の方法から選択される。いくつかの実施形態では、複数の方法の少なくとも1つは本開示に記載の方法から選択される。 In some embodiments, it is possible to determine the sex of the fetus by combining predictions made by multiple methods. In some embodiments, the method is selected from the methods described in the present disclosure. In some embodiments, at least one of the plurality of methods is selected from the methods described in the present disclosure.

いくつかの実施形態では、本明細書に記載の方法を用いて、妊娠中の胎児の倍数性の状態を決定することができる。ある実施形態では、倍数性コール方法では、X染色体に特異的な遺伝子座またはX染色体とY染色体の両方に共通する遺伝子座を使用するが、いかなるY特異的遺伝子座も使用しない。ある実施形態では、倍数性コール方法では、以下の1つまたは複数を使用する:X染色体に特異的な遺伝子座、X染色体とY染色体の両方に共通する遺伝子座、およびY染色体に特異的な遺伝子座。ある実施形態では、性染色体の比が同様である場合、例えば、45,X(ターナー症候群)、46,XX(正常な女性)および47,XXX(Xトリソミー)、鑑別は、種々の仮説に従って対立遺伝子分布と予測される対立遺伝子分布とを比較することによって実現することができる。別の実施形態では、これは、性染色体についてのシーケンスリードの相対的な数と、正倍数性であることが仮定される1個または複数個の参照染色体とを比較することによって実現することができる。これらの方法は、異数性の場合を含むように拡大することができることにも留意されたい。 In some embodiments, the methods described herein can be used to determine the ploidy state of the fetus during pregnancy. In certain embodiments, the multiple call method uses a locus specific for the X chromosome or a locus common to both the X and Y chromosomes, but does not use any Y-specific locus. In certain embodiments, the multiple call method uses one or more of the following: X-chromosome-specific loci, loci common to both X and Y chromosomes, and Y-chromosome-specific loci. Chromosome. In certain embodiments, if the sex chromosome ratios are similar, eg, 45, X (Turner's syndrome), 46, XX (normal female) and 47, XXX (trisomy X), differentiation is allelic according to various hypotheses. This can be achieved by comparing the gene distribution with the predicted allelic distribution. In another embodiment, this can be achieved by comparing the relative number of sequence reads for a sex chromosome with one or more reference chromosomes that are supposed to be positive polyploid. can. It should also be noted that these methods can be expanded to include aneuploidy cases.

単一遺伝子疾患スクリーニング
ある実施形態では、胎児の倍数性の状態を決定するための方法は、単一遺伝子障害についての同時検査が可能になるように拡張することができる。単一遺伝子疾患の診断は、異数性試験のために用いる同じ標的化手法に影響を及ぼし、さらなる特異的な標的を必要とする。ある実施形態では、単一遺伝子NPD診断は連鎖解析による。多くの場合、cfDNA試料の直接的な試験は、母系DNAが存在することにより、胎児が母親の変異を遺伝によって受け継いだかどうかを決定することが実質的に不可能になるので、信頼できない。独自の父系的に由来する対立遺伝子を検出することは困難が少ないが、疾患が優性であり、父親が保有する場合にのみ完全に情報価値があり、それによりこの手法の有用性が限定される。ある実施形態では、前記方法は、PCRまたは関連する増幅手法を包含する。
Monogenic Disease Screening In certain embodiments, the method for determining the ploidy state of the fetus can be extended to allow simultaneous testing for monogenic disorders. Diagnosis of monogenic diseases affects the same targeting techniques used for aneuploidy testing and requires more specific targets. In certain embodiments, the single gene NPD diagnosis is by linkage analysis. In many cases, direct testing of cfDNA samples is unreliable because the presence of maternal DNA makes it virtually impossible to determine whether the fetus has inherited the maternal mutation. It is less difficult to detect alleles of unique paternal origin, but the disease is dominant and is completely informative only if it is carried by the father, thereby limiting the usefulness of this technique. .. In certain embodiments, the method comprises PCR or related amplification techniques.

いくつかの実施形態では、前記方法は、親において、周囲に非常にしっかりと連鎖したSNPがある異常な対立遺伝子について、第一度近親者からの情報を用いて相を特定するステップを包含する。次いで、これらのSNPから得られた標的化配列決定データに対してParental Supportを実行して、正常な相同体または異常な相同体のいずれを、両親から胎児が遺伝によって受け継いだかを決定することができる。SNPが十分に連鎖している限りは、胎児の遺伝子型の遺伝を非常に確実に決定することができる。いくつかの実施形態では、方法は、(a)日常病の特定の集合を密に隣接させるためのSNP遺伝子座の集合を、異数性を試験するための本発明者らの多重プールに付加するステップと;(b)正常な対立遺伝子および異常な対立遺伝子を有する、付加したこれらのSNPから、種々の近親者からの遺伝子データに基づいて、対立遺伝子について確実に相の特定をするステップと、(c)疾患遺伝子座の周囲の領域内の遺伝によって受け継がれた母系の相同体および父系の相同体における胎児のハプロタイプまたは相が特定されたSNP対立遺伝子の集合を再構築して、胎児の遺伝子型を決定するステップとを含む。いくつかの実施形態では、疾患連鎖遺伝子座に確実に結合するさらなるプローブを、異数性試験のために用いる多型遺伝子座の集合に加える。 In some embodiments, the method comprises the step of identifying a phase in a parent with information from a first-degree relative for an abnormal allele with a very tightly linked SNP around it. .. A Partal Support can then be performed on the targeted sequencing data obtained from these SNPs to determine whether the fetus has inherited normal or abnormal homologues from the parents. can. As long as the SNPs are well linked, the inheritance of fetal genotypes can be determined with great certainty. In some embodiments, the method (a) adds a set of SNP gene loci for closely adjoining a particular set of routine diseases to our multiple pools for testing variability. And; (b) reliably phase-identify alleles from these added SNPs with normal and aberrant alleles based on genetic data from various close relatives. , (C) Reconstructing a set of fetal haplotypes or phase-identified SNP alleles in the inherited maternal and paternal homologues within the region surrounding the disease locus of the fetal. Includes steps to determine the genotype. In some embodiments, additional probes that reliably bind to the disease chain locus are added to the set of polymorphic loci used for aneuploidy testing.

試料は母系DNAと胎児DNAの混合物であるので、胎児のディプロタイプを再構築することは困難である。いくつかの実施形態では、前記方法では、近親者の情報を組み入れて、SNPおよび疾患対立遺伝子の相を特定し、次いで、場所特異的な組換え尤度からのSNPおよび組換えデータと母系の血漿の遺伝子測定値から観察されたデータの物理的な距離を考慮に入れて、最も可能性が高い胎児の遺伝子型を得る。 Since the sample is a mixture of maternal DNA and fetal DNA, it is difficult to reconstruct the fetal diplomat. In some embodiments, the method incorporates information from relatives to identify phases of SNPs and disease alleles, and then SNPs and recombinant data from location-specific recombination likelihood and the maternal lineage. The most probable fetal genotype is obtained, taking into account the physical distance of the data observed from the genotypes of the plasma.

ある実施形態では、疾患連鎖遺伝子座あたりいくつものさらなるプローブを標的の多型遺伝子座の集合に含める;疾患連鎖遺伝子座あたりのさらなるプローブの数は、4個から10個の間、11個から20個の間、21個から40個の間、41個から60個の間、61個から80個の間、またはそれらの組み合わせであってよい。 In one embodiment, a number of additional probes per disease-linked locus are included in the set of targeted polymorphic loci; the number of additional probes per disease-linked locus is between 4 and 10, between 11 and 20. It may be between 21 pieces, between 21 pieces, between 41 pieces and 60 pieces, between 61 pieces and 80 pieces, or a combination thereof.

親由来の二倍体データの相の特定が困難な場合があり、これを行うことができる多くの方法がある。いくつかは本開示で考察されており、他のものは、別の開示でさらに詳細に記載されている(例えば、2009年2月9日出願の国際公開第WO2009105531号、および2009年8月4日出願の同WO2010017214号を参照。これらの特許は、参照によりその全体が本明細書に組み込まれる)。一実施形態では、親由来の半数体組織を測定することにより、例えば、1個または複数個の精子または卵子を測定することにより、親の相を推測して特定できる。一実施形態では、第一度近親者、例えば、親の親または同胞の測定遺伝子型データを使って推測して親の相を特定できる。一実施形態では、それぞれのウェル中に約1個以下のそれぞれのハプロタイプのコピーとなることが予測されるまで1個または複数個のウェル中でDNAを希釈し、その後、1個または複数個のウェル中のDNAを測定することにより親の相を特定できる。一実施形態では、集団ベースハプロタイプ頻度を使用して最も可能性のある相を推測するコンピュータプログラムを使って親の遺伝子型の相の特定ができる。一実施形態では、親の遺伝学的子孫の1個または複数個の相の未特定遺伝子データに加えて、相の特定がなされたハロタイプデータがもう一方の親で既知である場合、親の相の特定ができる。いくつかの実施形態では、親の遺伝学的子孫は、1個または複数個の胚、1人または複数人の胎児、および/または産まれた子供であってもよい。一方の親または両親の相の特定に関するいくつかのこれらの方法のおよび他の方法は、例えば、2010年8月19日出願の米国特許公開第2011/0033862号;2011年2月3日出願の同2011/0178719号;2006年11月22日出願の同2007/018446号;2008年3月17日出願の同2008/0243398号、にさらに詳細に開示されている。これらの特許は、参照によりその全体が本明細書に組み込まれる。 It can be difficult to identify the phase of diploid data from the parent, and there are many ways this can be done. Some are discussed in this disclosure, others are described in more detail in another disclosure (eg, WO 2009105531 filed February 9, 2009, and August 4, 2009). See WO20100017214 of the Japanese filing; these patents are incorporated herein by reference in their entirety). In one embodiment, the parental phase can be inferred and identified by measuring haploid tissue from the parent, for example, by measuring one or more sperms or eggs. In one embodiment, first-degree relatives, such as parental or sibling measured genotype data, can be used to infer and identify the parental phase. In one embodiment, the DNA is diluted in one or more wells until it is predicted that there will be no more than one copy of each haplotype in each well, followed by one or more. The parental phase can be identified by measuring the DNA in the wells. In one embodiment, a computer program that infers the most probable phase using population-based haplotype frequency can be used to identify the phase of the parental genotype. In one embodiment, if unspecified genetic data for one or more phases of a parent's genetic progeny, as well as phase-identified halotype data, is known for the other parent, the parent's. The phase can be specified. In some embodiments, the genetic progeny of the parent may be one or more embryos, one or more fetuses, and / or a child born. Some of these and other methods relating to the identification of one parent or parental phase are described, for example, in US Patent Publication No. 2011/0033862 filed August 19, 2010; filed February 3, 2011. It is disclosed in more detail in No. 2011/017879; No. 2007/018446 filed on November 22, 2006; No. 2008/0243398 filed on March 17, 2008. These patents are incorporated herein by reference in their entirety.

胎児のゲノム再構築
一態様では、本発明は、胎児のハプロタイプを決定する方法を特徴とする。種々の実施形態では、前記方法は、どの多形遺伝子座(例えば、SNP)が胎児に遺伝したか判定し、胎児中に存在する相同体を再構築(組換えイベントを含む)すること(および、それにより、多形遺伝子座間の配列を補間すること)を可能とする。必要に応じ、実質的に胎児の全ゲノムを再構築できる。胎児のゲノムにいくつかの曖昧さ(例えば、乗換え間隔)が残されている場合、この曖昧さは、必要に応じ、追加の多形遺伝子座を解析することにより最小化できる。種々の実施形態では、所望レベルに対する全ての曖昧さを減らすために、多形遺伝子座は、1個または複数個の染色体の範囲にわたり一定の密度になるように選択される。前記方法は、胎児ゲノム中の対象多型または他の変異の直接検出ではなく連鎖(例えば、胎児ゲノム中に連鎖多形遺伝子座の存在)に基づくそれらの検出を可能とするために、胎児における対象の多型または他の変異の検出に関し重要な用途がある。例えば、親が嚢胞性線維症(CF)に関連する変異の保持者である場合、胎児の母親由来の母系DNAおよび胎児由来の胎児DNAを含む核酸試料を分析して、胎児DNAがCF変異を有するハプロタイプを含むかどうかを判定できる。特に、胎児DNA中のCF変異それ自体を検出することを必要とせずに、多形遺伝子座を分析して、胎児DNAがCF変異を有するハプロタイプを含むかどうかを判定できる。
Fetal Genome Reconstruction In one aspect, the invention features a method of determining fetal haplotypes. In various embodiments, the method determines which polymorphic locus (eg, SNP) is inherited in the fetus and reconstructs (and includes recombination events) the homologues present in the fetus. , Thereby interpolating the sequences between polymorphic loci). If desired, virtually the entire fetal genome can be reconstructed. If some ambiguity remains in the fetal genome (eg, crossover intervals), this ambiguity can be minimized by analyzing additional polymorphic loci, if desired. In various embodiments, the polymorphic loci are selected to have a constant density over a range of one or more chromosomes in order to reduce all ambiguity to the desired level. The method is in the fetus to allow detection of subject polymorphisms or other mutations in the fetal genome based on linkage (eg, the presence of linked polymorphic loci in the fetal genome) rather than direct detection. It has important uses for the detection of polymorphisms or other mutations in the subject. For example, if the parent is a carrier of a mutation associated with cystic fibrosis (CF), the fetal DNA will have a CF mutation by analyzing a nucleic acid sample containing maternal DNA from the fetal mother and fetal DNA from the fetus. It can be determined whether or not the haplotype to be contained is included. In particular, the polymorphic locus can be analyzed to determine if the fetal DNA contains a haplotype carrying the CF mutation, without the need to detect the CF mutation itself in the fetal DNA.

いくつかの実施形態では、前記方法は、親のハプロタイプ(例えば、胎児の母および父のハプロタイプ)を決定するステップを含む。いくつかの実施形態では、この決定は、母親または父親の親類由来のデータを使うことなく行われる。いくつかの実施形態では、本明細書および別の文献で記載(例えば、2010年8月19日出願の米国特許公開第2011/0033862号を参照。この特許は、参照によりその全体が本明細書に組み込まれる)のように、親のハプロタイプは、希釈手法に続くSNP遺伝子型解析またはシークエンシングを使って決定される。DNAが希釈されるために、1個超のハプロタイプが同じ部分(またはチューブ)中に存在することはないであろう。これにより、事実上チューブ中にDNA単一分子が存在し得る状態となり、単一DNA分子上のハプロタイプを決定できる。いくつかの実施形態では、前記方法は、DNA試料を複数の部分に分割して、少なくとも1つの部分が染色体対由来の1個の染色体または1個の染色体セグメントを含み、少なくとも1つの部分中のDNA試料の遺伝子型解析を行い(例えば、2個以上の多形遺伝子座の存在の決定)、それにより、親のハプロタイプを決定するステップを含む。いくつかの実施形態では、遺伝子型解析は、シークエンシング(例えば、ショットガンシークエンシング)を行うステップを含む。いくつかの実施形態では、遺伝子型解析は、SNPアレイを使用して、多形遺伝子座、例えば、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座を検出するステップを含む。いくつかの実施形態では、遺伝子型解析は、多重PCRを使用するステップを含む。いくつかの実施形態では、前記方法は、分割試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座(例えば、SNP)に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、反応混合物をプライマー伸長反応条件に供して、ハイスループットシーケンサーで測定して配列決定データを生成する増幅産物を得るステップとを含む。 In some embodiments, the method comprises determining the parental haplotype (eg, fetal mother and father haplotype). In some embodiments, this determination is made without the use of data from relatives of the mother or father. In some embodiments, it is described herein and elsewhere (see, eg, US Patent Publication No. 2011/0033862, filed August 19, 2010, which is hereby in its entirety by reference. The parental haplotype is determined using SNP genotyping or sequencing following the dilution procedure. No more than one haplotype will be present in the same moiety (or tube) due to the dilution of the DNA. This effectively results in the presence of a single DNA molecule in the tube, allowing the haplotype on the single DNA molecule to be determined. In some embodiments, the method divides a DNA sample into multiple portions, wherein at least one portion comprises one chromosome or one chromosomal segment derived from a chromosomal pair, in at least one portion. It comprises the step of performing genotyping of a DNA sample (eg, determining the presence of two or more polymorphic loci), thereby determining the parental haplotype. In some embodiments, genotyping comprises the step of performing sequencing (eg, shotgun sequencing). In some embodiments, genotyping uses SNP arrays to use polymorphic loci, eg, at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000. 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different polymorphic loci. In some embodiments, genotyping comprises the step of using multiplex PCR. In some embodiments, the method comprises at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40, A step of contacting with a primer library that simultaneously hybridizes to 000; 50,000; 75,000; or 100,000 different polymorphic loci (eg, SNPs) to generate a reaction mixture, and the reaction mixture as a primer. It includes a step of obtaining an amplification product that is subjected to elongation reaction conditions and measured with a high-throughput sequencer to generate sequencing data.

いくつかの実施形態では、母親のハプロタイプは、母親の親類由来のデータを使って本明細書で記載の方法のいずれかにより決定される。いくつかの実施形態では、父親のハプロタイプは、父親の親類由来のデータを使って本明細書で記載の方法のいずれかにより決定される。いくつかの実施形態では、父親と母親の両方に対するハプロタイプが決定される。いくつかの実施形態では、SNPアレイを使って、母親(または父親)および母親(または父親)の親類由来のDNA試料中の少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座の存在が決定される。いくつかの実施形態では、前記方法は、母親(または父親)および/または母親(または父親)の親類由来のDNA試料を、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座(例えば、SNP)に同時にハイブリダイズするプライマーライブラリーと接触させて反応混合物を生成するステップと、反応混合物をプライマー伸長反応条件に供し、ハイスループットシーケンサーで測定して配列決定データを生成する増幅産物を得るステップとを含む。親のハプロタイプは、SNPアレイまたは配列決定データに基づいて決定できる。いくつかの実施形態では、本文書で記載されているか、または本文書の他の場所で参照されている方法により親のデータの相の特定を行うことができる。 In some embodiments, the maternal haplotype is determined by any of the methods described herein using data from the mother's relatives. In some embodiments, the haplotype of the father is determined by any of the methods described herein using data from the father's relatives. In some embodiments, the haplotype for both the father and the mother is determined. In some embodiments, SNP arrays are used to at least 1,000; 2,000; 5,000; 7,500; 10 in DNA samples from mother (or father) and mother (or father) relatives. The presence of 000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different polymorphic loci is determined. In some embodiments, the method comprises at least 1,000; 2,000; 5,000; 7,500; 10 DNA samples from mother (or father) and / or mother (or father) relatives. Primer live that simultaneously hybridizes to 000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different polymorphic loci (eg, SNPs). It comprises contacting with a rally to generate a reaction mixture and subjecting the reaction mixture to primer extension reaction conditions and measuring with a high throughput sequencer to obtain an amplification product that produces sequencing data. The parent haplotype can be determined based on the SNP array or sequencing data. In some embodiments, the phase of the parental data can be identified by methods described in this document or referenced elsewhere in this document.

この親のハプロタイプデータを使って、胎児が親のハプロタイプを受け継いでいるかどうかを判定できる。いくつかの実施形態では、胎児の母親由来の母系DNAおよび胎児由来の胎児DNAを含む核酸試料がSNPアレイを使って分析されて、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座が検出される。いくつかの実施形態では、胎児の母親由来の母系DNAおよび胎児由来の胎児DNAを含む核酸試料は、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座(例えば、SNP)に同時にハイブリダイズするプライマーライブラリーと試料を接触させて反応混合物を生成することにより分析される。いくつかの実施形態では、反応混合物は、プライマー伸長反応条件に供されて増幅産物を生成する。いくつかの実施形態では、増幅産物は、ハイスループットシーケンサーで測定され、配列決定データが生成される。種々の実施形態では、SNPアレイまたは配列決定データを使って、染色体中の種々の部位での染色体乗換え確率に関するデータを使うことにより(例えば、ハップマップデータベース中で見つけることができるような組換えデータを使って任意の間隔に対する組換えリスクスコアを生成することにより)染色体上の多形対立遺伝子間の依存性をモデル化することにより親のハプロタイプが決定される。いくつかの実施形態では、多形遺伝子座での対立遺伝子数は、配列決定データに基づいてコンピュータで計算される。いくつかの実施形態では、それぞれ異なる可能な染色体の倍数性状態に関する複数の倍数性仮説がコンピュータで生成され、染色体上の多形遺伝子座で予測される対立遺伝子数に対するモデル(例えば、同時分布モデル)がそれぞれの倍数性仮説に対しコンピュータで構築され、同時分布モデルおよび対立遺伝子数を使って、それぞれの倍数性仮説の相対的確率がコンピュータで算出され、最大確率を有する仮説に対応する倍数性状態を選択することにより胎児の倍数性状態がコールされる。いくつかの実施形態では、対立遺伝子数についての同時分布モデルを構築するステップおよび各仮説の相対的確率を決定するステップを、参照染色体を使用することを必要としない方法を用いて行う。 This parental haplotype data can be used to determine if the fetus inherits the parental haplotype. In some embodiments, nucleic acid samples containing maternal DNA from the fetal mother and fetal DNA from the fetus are analyzed using an SNP array and at least 1,000; 2,000; 5,000; 7,500. 10,000; 20,000; 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different polymorphic loci are detected. In some embodiments, the nucleic acid sample comprising maternal DNA from the fetal mother and fetal DNA from the fetus is at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000. Contact the sample with a primer library that simultaneously hybridizes to 25,000; 30,000; 40,000; 50,000; 75,000; or 100,000 different polymorphic loci (eg, SNP). Is analyzed by producing a reaction mixture. In some embodiments, the reaction mixture is subjected to primer extension reaction conditions to produce an amplification product. In some embodiments, the amplification product is measured on a high-throughput sequencer to generate sequencing data. In various embodiments, SNP arrays or sequencing data are used to recombined data as can be found in a haplomap database, for example, by using data on chromosome crossover probabilities at different sites in the chromosome. The parental haplotype is determined by modeling the dependence between polymorphic alleles on the chromosome (by generating a recombination risk score for any interval). In some embodiments, the number of alleles at the polymorphic locus is calculated computerized based on the sequencing data. In some embodiments, multiple ploidy hypotheses for different possible ploidy states of the chromosome are computer-generated and a model for the number of alleles predicted at the polymorphic locus on the chromosome (eg, a co-distribution model). ) Is computer-constructed for each ploidy hypothesis, and using the co-distribution model and the number of alleles, the relative probability of each ploidy hypothesis is computer-calculated, and the ploidy corresponding to the hypothesis with the maximum probability. The ploidy state of the fetal is called by selecting the state. In some embodiments, the steps of constructing a joint distribution model for the number of alleles and determining the relative probabilities of each hypothesis are performed using methods that do not require the use of reference chromosomes.

いくつかの実施形態では、胎児のハプロタイプが、染色体13、18、21、X、およびYからなる群より選択される1個または複数個の染色体に対し決定される。いくつかの実施形態では、胎児のハプロタイプは、全ての胎児染色体に対し決定される。種々の実施形態では、前記方法は、実質的に胎児の全ゲノムを決定する。いくつかの実施形態では、ハプロタイプは、少なくとも30、40、50、60、70、80、90、または95%の胎児のゲノムに対し決定される。いくつかの実施形態では、胎児のハプロタイプ決定は、少なくとも1,000;2,000;5,000;7,500;10,000;20,000;25,000;30,000;40,000;50,000;75,000;または100,000個の異なる多形遺伝子座に対しどの対立遺伝子が存在するかに関する情報を含む。 In some embodiments, the fetal haplotype is determined for one or more chromosomes selected from the group consisting of chromosomes 13, 18, 21, X, and Y. In some embodiments, the fetal haplotype is determined for all fetal chromosomes. In various embodiments, the method determines substantially the entire fetal genome. In some embodiments, the haplotype is determined for at least 30, 40, 50, 60, 70, 80, 90, or 95% of the fetal genome. In some embodiments, fetal haplotyping is at least 1,000; 2,000; 5,000; 7,500; 10,000; 20,000; 25,000; 30,000; 40,000; Contains information on which alleles are present for 50,000; 75,000; or 100,000 different polymorphic loci.

DNAの組成
胎児に関するゲノムの情報、例えば、胎児の倍数性状態を決定するために、胎児の血液と母系の血液の混合物について測定された配列決定データに対してインフォマティクス分析を実施する場合、対立遺伝子の集合における対立遺伝子分布を測定することが有利であり得る。残念ながら母系の血液試料の血漿において見いだされるDNA混合物から胎児の倍数性状態を決定することを試みる場合などの多くの場合、利用可能なDNAの量は、混合物において優良な忠実度で対立遺伝子分布を直接測定するためには十分でない。これらの場合には、DNA混合物を増幅することにより、所望の対立遺伝子分布を優良な忠実度で測定することができる十分な数のDNA分子がもたらされる。しかし、配列決定するためのDNAの増幅に一般に用いられる増幅の現行の方法は、多くの場合、非常に偏りがある、つまり、多型遺伝子座の両方の対立遺伝子が同じ量で増幅されない。偏りのある増幅の結果、元の混合物における対立遺伝子分布とかなり異なる対立遺伝子分布がもたらされ得る。ほとんどの目的のためには、多型遺伝子座に存在する対立遺伝子の相対的な量を非常に正確に測定することは必要とされない。対照的に、本開示のある実施形態では、多型対立遺伝子を特異的に富化し、対立遺伝子の比を保存する増幅または富化方法は有利である。
DNA Composition Alleles when performing informatics analysis on genomic information about the fetus, eg, sequencing data measured for a mixture of fetal blood and maternal blood to determine the ploidy state of the fetus. It may be advantageous to measure the distribution of alleles in the set of. Unfortunately, in many cases, such as when attempting to determine the ploidy state of a fetal from a DNA mixture found in the plasma of a maternal blood sample, the amount of DNA available is allelic distribution with good fidelity in the mixture. Is not enough to measure directly. In these cases, amplifying the DNA mixture results in a sufficient number of DNA molecules capable of measuring the desired allele distribution with good fidelity. However, current methods of amplification commonly used for amplifying DNA for sequencing are often highly biased, that is, both alleles at the polymorphic locus are not amplified in the same amount. Biased amplification can result in an allelic distribution that is significantly different from the allelic distribution in the original mixture. For most purposes, it is not necessary to measure the relative amount of alleles present at the polymorphic locus very accurately. In contrast, in certain embodiments of the present disclosure, amplification or enrichment methods that specifically enrich polymorphic alleles and conserve the ratio of alleles are advantageous.

対立遺伝子の偏りが最小限になるようにDNAの試料を複数の遺伝子座で優先的に富化するために用いることができるいくつもの方法が本明細書に記載されている。いくつかの例では、複数の遺伝子座を標的とするために環状化プローブを使用し、環状化前プローブの3’末端および5’末端が、標的の対立遺伝子の多型部位から1つまたは少数の位置離れた塩基とハイブリダイズするように設計されている。別の例は、3’末端PCRプローブが標的の対立遺伝子の多型部位から1つまたは少数の位置離れた塩基とハイブリダイズするように設計されているPCRプローブを使用するというものである。別の例は、スプリットアンドプール手法を用いて、優先的に富化された遺伝子座が、対立遺伝子の偏りが少なく、直接的な多重化の欠点を伴わずに富化されているDNAの混合物を作製するというものである。別の例は、標的の多型部位に隣接しているDNAとハイブリダイズするように設計されている捕捉プローブの領域が、多型部位と1つまたは少数の塩基で隔てられるように捕捉プローブが設計されているハイブリッド捕捉手法を用いるというものである。 A number of methods have been described herein that can be used to preferentially enrich DNA samples at multiple loci so that allelic bias is minimized. In some examples, circularized probes are used to target multiple loci, with the 3'and 5'ends of the pre-cyclized probe being one or a few from the target allele polymorphic site. It is designed to hybridize to distant bases. Another example is to use a PCR probe in which the 3'end PCR probe is designed to hybridize to a base one or a few positions away from the polymorphic site of the target allele. Another example is a mixture of DNA in which the preferentially enriched loci are enriched using the split-and-pool technique with less allele bias and without the drawbacks of direct multiplexing. Is to be produced. Another example is that the capture probe is designed so that the region of the capture probe that is designed to hybridize to the DNA adjacent to the target polymorphic site is separated from the polymorphic site by one or a few bases. It uses the designed hybrid capture method.

多型遺伝子座の集合における測定された対立遺伝子分布を使用して個体の倍数性状態を決定する場合には、遺伝子測定のためにDNAの試料が調製されるとき該DNA試料における対立遺伝子の相対的な量を保存することが望ましい。この調製は、WGA増幅、標的化増幅、選択的富化技法、ハイブリッド捕捉法、環状化プローブまたはDNAの量を増幅し、かつ/または特定の対立遺伝子に対応するDNA分子の存在を選択的に増強することを意図した他の方法を包含し得る。 When using the measured allele distribution in a set of polymorphic loci to determine the multiple state of an individual, when a DNA sample is prepared for gene measurement, the relatives of the alleles in the DNA sample It is desirable to store a suitable amount. This preparation amplifies the amount of WGA amplification, targeted amplification, selective enrichment techniques, hybrid capture methods, cyclized probes or DNA, and / or selectively the presence of DNA molecules corresponding to specific alleles. It may include other methods intended to be augmented.

本開示のいくつかの実施形態では、マイナー対立遺伝子頻度が最大である遺伝子座を標的とするように設計されたDNAプローブの集合が存在する。本開示のいくつかの実施形態では、胎児がそれらの遺伝子座において情報価値が高いSNPを有する尤度が最大である遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、プローブが所与の母集団サブグループに対して最適化された遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、プローブが母集団サブグループの所与の混合物に対して最適化された遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、プローブが、異なるマイナー対立遺伝子頻度プロファイルを有する異なる母集団サブグループに由来する所与の親の対に対して最適化された遺伝子座を標的とするように設計されたプローブの集合が存在する。本開示のいくつかの実施形態では、胎児起源のDNAの一部分とアニーリングした少なくとも1つの塩基対を含む環状化DNA鎖が存在する。本開示のいくつかの実施形態では、胎盤起源のDNAの一部分とアニーリングした少なくとも1つの塩基対を含む環状化DNA鎖が存在する。本開示のいくつかの実施形態では、環状化し、その一方でヌクレオチドの少なくとも一部が胎児起源のDNAとアニーリングした環状化DNA鎖が存在する。本開示のいくつかの実施形態では、環状化し、その一方でヌクレオチドの少なくとも一部が胎盤起源のDNAとアニーリングした環状化DNA鎖が存在する。本開示のいくつかの実施形態では、いくつかが単一のタンデム反復を標的とし、いくつかが一塩基多型を標的とするプローブの集合が存在する。いくつかの実施形態では、非侵襲的な出生前診断のために遺伝子座を選択する。いくつかの実施形態では、非侵襲的な出生前診断のためにプローブを使用する。いくつかの実施形態では、環状化プローブ、MIP、ハイブリダイゼーションプローブによる捕捉、SNPアレイ上のプローブ、またはそれらの組み合わせを含んでよい方法を用いて遺伝子座を標的とする。いくつかの実施形態では、プローブを環状化プローブ、MIP、ハイブリダイゼーションプローブによる捕捉、SNPアレイ上のプローブ、またはそれらの組み合わせとして使用する。いくつかの実施形態では、非侵襲的な出生前診断のために遺伝子座について配列決定する。 In some embodiments of the present disclosure, there is a set of DNA probes designed to target the locus with the highest minor allele frequency. In some embodiments of the present disclosure, there is a set of probes designed to target the loci with the highest likelihood that the fetus has a highly informative SNP at those loci. In some embodiments of the present disclosure, there is a set of probes designed for the probe to target a locus optimized for a given population subgroup. In some embodiments of the present disclosure, there is a set of probes designed for the probe to target a locus optimized for a given mixture of population subgroups. In some embodiments of the present disclosure, the probe targets a locus optimized for a given parent pair from different population subgroups with different minor allele frequency profiles. There is a set of designed probes. In some embodiments of the present disclosure, there is a circularized DNA strand containing at least one base pair annealed with a portion of DNA of fetal origin. In some embodiments of the present disclosure, there is a circularized DNA strand containing at least one base pair annealed with a portion of DNA of placental origin. In some embodiments of the present disclosure, there is a circularized DNA strand that is circularized while at least a portion of the nucleotide is annealed with DNA of fetal origin. In some embodiments of the present disclosure, there is a cyclized DNA strand that is cyclized while at least a portion of the nucleotide is annealed with placental-origin DNA. In some embodiments of the present disclosure, there is a set of probes, some targeting a single tandem repeat and some targeting single nucleotide polymorphisms. In some embodiments, loci are selected for non-invasive prenatal diagnosis. In some embodiments, probes are used for non-invasive prenatal diagnosis. In some embodiments, loci are targeted using methods that may include circularization probes, MIPs, captures with hybridization probes, probes on SNP arrays, or combinations thereof. In some embodiments, the probe is used as a cyclized probe, MIP, capture by a hybridization probe, a probe on an SNP array, or a combination thereof. In some embodiments, loci are sequenced for non-invasive prenatal diagnosis.

配列の相対的(relative)情報価値が、関連する親の状況と組み合わせるとより大きくなる場合には、親の状況が既知であるSNPを含有するシーケンスリード数を最大にすることにより、混合試料についてのシーケンシングリードの集合の情報価値が最大になり得る。ある実施形態では、親の状況が既知であるSNPを含有するシーケンスリード数は、qPCRを用いて特定の配列を優先的に増幅することによって増強することができる。ある実施形態では、親の状況が既知であるSNPを含有するシーケンスリード数を、環状化プローブ(例えば、MIP)を用いて特定の配列を優先的に増幅することによって増強することができる。ある実施形態では、親の状況が既知であるSNPを含有するシーケンスリード数を、ハイブリダイゼーション法による捕捉(例えば、SURESELECT)を用いて特定の配列を優先的に増幅することによって増強することができる。異なる方法を用いて、親の状況が既知であるSNPを含有するシーケンスリード数を増強することができる。ある実施形態では、標的化は、伸長ライゲーション、伸長を伴わないライゲーション、ハイブリダイゼーションによる捕捉またはPCRによって実現することができる。 For mixed samples, by maximizing the number of sequence reads containing SNPs for which the parental situation is known, if the relative information value of the sequence is greater when combined with the relevant parental situation. The information value of the set of sequencing leads of can be maximized. In certain embodiments, the number of sequence reads containing SNPs whose parental status is known can be enhanced by preferentially amplifying specific sequences using qPCR. In certain embodiments, the number of sequence reads containing SNPs whose parental status is known can be enhanced by preferentially amplifying specific sequences using a circularized probe (eg, MIP). In certain embodiments, the number of sequence reads containing SNPs whose parental status is known can be enhanced by preferentially amplifying specific sequences using hybridization capture (eg, SURESELECT). .. Different methods can be used to increase the number of sequence reads containing SNPs whose parental status is known. In certain embodiments, targeting can be achieved by extended ligation, non-extended ligation, hybridization capture or PCR.

断片化されたゲノムDNAの試料において、DNA配列のある一部分(fraction)が個々の染色体に独自にマッピングされ、他のDNA配列は異なる染色体上に見いだされる。血漿中に見いだされるDNAは、母体起源であろうと胎児起源であろうと、一般には、多くの場合、500bpを下回る長さに断片化されていることに留意されたい。典型的なゲノム試料では、マッピング可能な配列のおよそ3.3%が第13染色体にマッピングされ、マッピング可能な配列の2.2%が第18染色体にマッピングされ、マッピング可能な配列の1.35%が第21染色体にマッピングされ、女性ではマッピング可能な配列の4.5%がX染色体にマッピングされ、マッピング可能な配列の2.25%がX染色体にマッピングされ(男性では)、マッピング可能な配列の0.73%がY染色体にマッピングされる(男性では)。これらは胎児において異数性である可能性が最も高い染色体である。また、dbSNPに含まれるSNPを使用すると、短い配列の中では20配列のうちおよそ1つがSNPを含有する。この割合は、発見されていない多くのSNPが存在し得るとすれば、より高くなり得る。 In a sample of fragmented genomic DNA, one fraction of the DNA sequence is uniquely mapped to an individual chromosome and the other DNA sequence is found on a different chromosome. It should be noted that the DNA found in plasma, whether of maternal or fetal origin, is generally fragmented to lengths below 500 bp. In a typical genomic sample, approximately 3.3% of the mappable sequence is mapped to chromosome 13 and 2.2% of the mappable sequence is mapped to chromosome 18 and 1.35 of the mappable sequence. % Is mapped to chromosome 21, 4.5% of the mappingable sequences are mapped to the X chromosome in women, 2.25% of the mappingable sequences are mapped to the X chromosome (in men), and mapping is possible. 0.73% of the sequence is mapped to the Y chromosome (in men). These are the chromosomes most likely to be aneuploid in the fetus. Further, when the SNP contained in the dbSNP is used, about one out of 20 sequences in the short sequence contains the SNP. This percentage can be higher if there can be many undiscovered SNPs.

本開示のある実施形態では、標的化方法を用いて、所与の染色体にマッピングされるDNAの試料中のDNAの一部分を、その一部分が、上に列挙されているゲノム試料に典型的な百分率を有意に超えるように増強することができる。本開示のある実施形態では、標的化方法を用いて、DNAの試料中のDNAの一部分を、SNPを含有する配列の百分率が、ゲノム試料に典型的に見出され得る百分率を有意に超えるように増強することができる。本開示のある実施形態では、出生前診断のために、標的化方法を用いて、母系DNAと胎児DNAの混合物中の染色体由来のDNAまたはSNPの集合由来のDNAを標的とすることができる。 In one embodiment of the present disclosure, a targeting method is used to capture a portion of the DNA in a sample of DNA that is mapped to a given chromosome, the portion of which is a percentage typical of the genomic samples listed above. Can be enhanced to significantly exceed. In one embodiment of the present disclosure, a targeting method is used such that a percentage of a sequence containing SNP in a portion of DNA in a DNA sample significantly exceeds the percentage that can be typically found in a genomic sample. Can be enhanced to. In certain embodiments of the present disclosure, targeting methods can be used to target chromosome-derived DNA or DNA from a collection of SNPs in a mixture of maternal DNA and fetal DNA for prenatal diagnosis.

疑わしい染色体にマッピングされるリード数を計数し、それを、参照染色体にマッピングされるリード数と比較し、疑わしい染色体上のリードの存在量が過剰であることは、その染色体における胎児の三倍体性に対応するという仮定を用いることによって胎児の異数性を決定するための方法が報告されていることに留意されたい(米国特許第7,888,017号)。これらの出生前診断のための方法では、いかなる種類の標的化も使用されず、また、出生前診断のための標的化の使用については記載されていない。 Count the number of reads mapped to the suspicious chromosome and compare it to the number of reads mapped to the reference chromosome, and the excess of leads on the suspicious chromosome is the fetal triploid on that chromosome. Note that methods for determining fetal aneuploidy by using the assumption of sex correspondence have been reported (US Pat. No. 7,888,017). These methods for prenatal diagnosis do not use any kind of targeting and do not describe the use of targeting for prenatal diagnosis.

混合試料の配列決定において標的化手法を用いることにより、少ないシーケンスリードを用いて特定のレベルの正確度を実現することが可能であり得る。正確度とは感度を指す場合があり、正確度とは特異度を指す場合があり、または正確度はそのいくつかの組み合わせを指す場合がある。正確度の所望のレベルは、90%から95%の間であってもよく、正確度の所望のレベルは、95%から98%の間であってもよく、正確度の所望のレベルは、98%から99%の間であってもよく、正確度の所望のレベルは、99%から99.5%の間であってもよく、正確度の所望のレベルは、99.5%から99.9%の間であってもよく、正確度の所望のレベルは、99.9%から99.99%の間であってもよく、正確度の所望のレベルは、99.99%から99.999%の間であってもよく、正確度の所望のレベルは、99.999%から100%の間であってもよい。95%を上回る正確度のレベルを、高い正確度と称することができる。 By using targeting techniques in the sequencing of mixed samples, it may be possible to achieve a certain level of accuracy with a small number of sequence reads. Accuracy may refer to sensitivity, accuracy may refer to specificity, or accuracy may refer to some combination thereof. The desired level of accuracy may be between 90% and 95%, the desired level of accuracy may be between 95% and 98%, and the desired level of accuracy may be. It may be between 98% and 99%, the desired level of accuracy may be between 99% and 99.5%, and the desired level of accuracy may be between 99.5% and 99%. It may be between 9.9%, the desired level of accuracy may be between 99.9% and 99.99%, and the desired level of accuracy may be between 99.99% and 99%. It may be between .999% and the desired level of accuracy may be between 99.999% and 100%. A level of accuracy above 95% can be referred to as high accuracy.

母系DNAと胎児DNAの混合試料からどのように胎児の倍数性状態を決定することができるかについて実証している、いくつもの公開された先行技術の方法、例えば:G.J. W. LiaoらClinical Chemistry 2011年;57巻(1号)92~101頁が存在する。これらの方法は、各染色体に沿った数千もの場所に焦点を当てる。標的とすることができ、一方ではNAの混合試料から、所与の数のシーケンスリードについて、胎児における倍数性の決定を高い正確度でもたらす染色体に沿った場所の数は予想外に少ない。本開示のある実施形態では、任意の標的化の方法、例えば、qPCR、リガンド媒介性PCR、他のPCR法、ハイブリダイゼーションによる捕捉または環状化プローブを用いた標的化配列決定を用いることによって正確な倍数性の決定を行うことができ、ここで、標的とする必要がある染色体に沿った遺伝子座の数は、5,000個から2,000個の間の遺伝子座であってもよく、2,000個から1,000個の間の遺伝子座であってもよく、1,000個から500個の間の遺伝子座であってもよく、500個から300個の間の遺伝子座であってもよく、300個から200個の間の遺伝子座であってもよく、200個から150個の間の遺伝子座であってもよく、150個から100個の間の遺伝子座であってもよく、100個から50個の間の遺伝子座であってもよく、50個から20個の間の遺伝子座であってもよく、20個から10個の間の遺伝子座であってもよい。最適には、標的とする必要がある染色体に沿った遺伝子座の数は、100個から500個の間の遺伝子座であり得る。高レベルの正確度は、少数の遺伝子座を標的とし予想外に少数のシーケンスリードを実行することによって実現することができる。リード数は、1億個から5000万個の間のリードであってもよく、リード数は、5000万個から2000万個の間のリードであってもよく、リード数は、2000万個から1000万個の間のリードであってもよく、リード数は、1000万個から500万個の間のリードであってもよく、リード数は、500万個から200万個の間のリードであってもよく、リード数は、200万個から100万個の間であってもよい;リード数は、100万個から500,000個の間であってもよい;リード数は、500,000個から200,000個の間であってもよく、リード数は、200,000個から100,000個の間であってもよく、リード数は、100,000個から50,000個の間であってもよく、リード数は、50,000個から20,000個の間であってもよく、リード数は、20,000個から10,000個の間であってもよく、リード数は、10,000個未満であってもよい。より大量の入力DNAに対してはより少数のリードが必要である。 A number of published prior art methods demonstrating how the ploidy state of the fetus can be determined from a mixed sample of maternal and fetal DNA, eg: G.M. J. W. Liao et al. Clinical Chemistry 2011; Vol. 57 (No. 1), pp. 92-101. These methods focus on thousands of locations along each chromosome. It can be targeted, while from a mixed sample of NA, for a given number of sequence reads, the number of locations along the chromosome that provides high accuracy in determining ploidy in the fetus is unexpectedly small. In certain embodiments of the present disclosure, accurate by using any method of targeting, eg, qPCR, ligand-mediated PCR, other PCR methods, targeted sequencing using a hybridization-captured or cyclized probe. Multiple determinations can be made, where the number of loci along the chromosome that needs to be targeted may be between 5,000 and 2,000 loci. It may be between 000 and 1,000 gene loci, it may be between 1,000 and 500 gene loci, and it may be between 500 and 300 gene loci. It may be a locus between 300 and 200, a locus between 200 and 150, and a locus between 150 and 100. , 100 to 50 gene loci, 50 to 20 loci, or 20 to 10 loci. Optimally, the number of loci along the chromosome that needs to be targeted can be between 100 and 500. A high level of accuracy can be achieved by targeting a small number of loci and performing an unexpectedly small number of sequence reads. The number of leads may be between 100 million and 50 million, the number of leads may be between 50 million and 20 million, and the number of reads may be from 20 million. The number of leads may be between 10 million, the number of leads may be between 10 million and 5 million, and the number of leads may be between 5 million and 2 million. There may be, the number of reads may be between 2 million and 1 million; the number of reads may be between 1 million and 500,000; the number of reads may be 500, It may be between 000 and 200,000, the number of reads may be between 200,000 and 100,000, and the number of reads may be between 100,000 and 50,000. The number of reads may be between 50,000 and 20,000, and the number of reads may be between 20,000 and 10,000. The number may be less than 10,000. Fewer reads are needed for larger amounts of input DNA.

いくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、第13染色体に独自にマッピングされる配列のパーセントが4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超、20%超、25%超または30%超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、第18染色体に独自にマッピングされる配列のパーセントが3%超、4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超、20%超、25%超または30%超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、第21染色体に独自にマッピングされる配列のパーセントが2%超、3%超、4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超、20%超、25%超または30%超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、独自にX染色体にマッピングされる配列のパーセントが6%超、7%超、8%超、9%超、10%超、12%超、15%超、20%超、25%超または30%超である組成物が存在する。本開示のいくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、独自にY染色体にマッピングされる配列のパーセントが1%超、2%超、3%超、4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超、20%超、25%超または30%超である組成物が存在する。 In some embodiments, the composition comprises a mixture of fetal and maternal DNA, wherein the percentage of sequences uniquely mapped to chromosome 13 is greater than 4%, greater than 5%, greater than 6%. There are compositions that are greater than 7%, greater than 8%, greater than 9%, greater than 10%, greater than 12%, greater than 15%, greater than 20%, greater than 25%, or greater than 30%. In some embodiments of the present disclosure, the composition comprises a mixture of fetal and maternal DNA, wherein the percentage of sequences uniquely mapped to chromosome 18 is greater than 3% and greater than 4%. There are compositions that are greater than 5%, greater than 6%, greater than 7%, greater than 8%, greater than 9%, greater than 10%, greater than 12%, greater than 15%, greater than 20%, greater than 25%, or greater than 30%. .. In some embodiments of the present disclosure, the composition comprises a mixture of fetal and maternal DNA, wherein the percentage of sequences uniquely mapped to chromosome 21 is greater than 2% and greater than 3%. Compositions of more than 4%, more than 5%, more than 6%, more than 7%, more than 8%, more than 9%, more than 10%, more than 12%, more than 15%, more than 20%, more than 25% or more than 30% There are things. In some embodiments of the present disclosure, the composition comprises a mixture of fetal and maternal DNA, wherein the percentage of sequences that are uniquely mapped to the X chromosome is> 6%,> 7%, 8. There are compositions that are greater than%, greater than 9%, greater than 10%, greater than 12%, greater than 15%, greater than 20%, greater than 25%, or greater than 30%. In some embodiments of the present disclosure, the composition comprises a mixture of fetal and maternal DNA, wherein the percentage of sequences that are uniquely mapped to the Y chromosome is greater than 1%, greater than 2%, and 3%. More than%, more than 4%, more than 5%, more than 6%, more than 7%, more than 8%, more than 9%, more than 10%, more than 12%, more than 15%, more than 20%, more than 25% or more than 30% There is a composition that is.

いくつかの実施形態では、組成物は、胎児起源のDNAと母体起源のDNAの混合物を含むと記載され、ある染色体に独自にマッピングされ少なくとも1つの一塩基多型を含有する配列のパーセントは、0.2%超、0.3%超、0.4%超、0.5%超、0.6%超、0.7%超、0.8%超、0.9%超、1%超、1.2%超、1.4%超、1.6%超、1.8%超、2%超、2.5%超、3%超、4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超または20%超であり、染色体は13、18、21、XまたはYの群から選択される。本開示のいくつかの実施形態では、胎児起源のDNAと母体起源のDNAの混合物を含む組成物であって、ある染色体に独自にマッピングされ一塩基多型の集合からの少なくとも1つの一塩基多型を含有する配列のパーセントは0.15%超、0.2%超、0.3%超、0.4%超、0.5%超、0.6%超、0.7%超、0.8%超、0.9%超、1%超、1.2%超、1.4%超、1.6%超、1.8%超、2%超、2.5%超、3%超、4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超または20%超であり、染色体は第13染色体、第18染色体、第21染色体、X染色体およびY染色体の集合から選択され、一塩基多型の集合内の一塩基多型の数は、1個から10個の間、10個から20個の間、20個から50個の間、50個から100個の間、100個から200個の間、200個から500個の間、500個から1,000個の間、1,000個から2,000個の間、2,000個から5,000個の間、5,000個から10,000個の間、10,000個から20,000個の間、20,000個から50,000個の間、および50,000個から100,000個の間である組成物が存在する。 In some embodiments, the composition is described as comprising a mixture of DNA of fetal origin and DNA of maternal origin, and the percentage of sequences that are uniquely mapped to a chromosome and contain at least one single base polymorphism is Over 0.2%, over 0.3%, over 0.4%, over 0.5%, over 0.6%, over 0.7%, over 0.8%, over 0.9%, 1% Super, over 1.2%, over 1.4%, over 1.6%, over 1.8%, over 2%, over 2.5%, over 3%, over 4%, over 5%, 6% Super,> 7%,> 8%,> 9%,>> 10%,> 12%,> 15% or> 20%, and chromosomes are selected from the group 13, 18, 21, X or Y. In some embodiments of the present disclosure, a composition comprising a mixture of embryonic and maternal origin DNA, at least one single nucleotide polymorphism from a set of single nucleotide polymorphisms that is uniquely mapped to a chromosome. The percentage of sequences containing molds is greater than 0.15%, greater than 0.2%, greater than 0.3%, greater than 0.4%, greater than 0.5%, greater than 0.6%, greater than 0.7%, More than 0.8%, more than 0.9%, more than 1%, more than 1.2%, more than 1.4%, more than 1.6%, more than 1.8%, more than 2%, more than 2.5%, More than 3%, more than 4%, more than 5%, more than 6%, more than 7%, more than 8%, more than 9%, more than 10%, more than 12%, more than 15% or more than 20%, and the chromosome is thirteenth. The number of single nucleotide polymorphisms selected from the set of chromosomes, 18th chromosome, 21st chromosome, X chromosome and Y chromosome is between 1 and 10 and 10 to 20 in the set of single nucleotide polymorphisms. Between 20 and 50, between 50 and 100, between 100 and 200, between 200 and 500, between 500 and 1,000, from 1,000 Between 2,000, between 2,000 and 5,000, between 5,000 and 10,000, between 10,000 and 20,000, between 20,000 and 50, There are compositions between 000 and between 50,000 and 100,000.

理論上は、増幅の各サイクルにより、存在するDNAの量が倍増するが、実際には、増幅の程度は2倍よりわずかに低い。理論上は、標的化増幅を含めた増幅により、偏りのないDNA混合物の増幅がもたらされるが、実際には、異なる対立遺伝子は他の対立遺伝子と異なる程度で増幅される傾向がある。DNAを増幅する場合、対立遺伝子の偏りの程度は、一般には増幅ステップの数に伴って上昇する。いくつかの実施形態では、本明細書に記載の方法は、低レベルの対立遺伝子の偏りでDNAを増幅するステップを包含する。対立遺伝子の偏りはさらに別のサイクルのそれぞれで複合されるので、全体的な偏りのn乗根を算出することによってサイクル当たりの対立遺伝子の偏りを決定することができ、ここで、nは富化の程度の、底を2とする対数である。いくつかの実施形態では、第2のDNAの混合物を含む組成物が存在し、該第2のDNAの混合物は、第1のDNAの混合物からの複数の多型遺伝子座に優先的に富化されており、富化の程度は、少なくとも10、少なくとも100、少なくとも1,000、少なくとも10,000、少なくとも100,000または少なくとも1,000,000であり、第2のDNAの混合物での各遺伝子座における対立遺伝子の比は、第1のDNAの混合物でのその遺伝子座における対立遺伝子の比とは、平均で、1,000%未満、500%、200%、100%、50%、20%、10%、5%、2%、1%、0.5%、0.2%、0.1%、0.05%、0.02%または0.01%の係数だけ異なる。いくつかの実施形態では、第2のDNAの混合物を含む組成物が存在し、第2のDNAの混合物は、第1のDNAの混合物からの複数の多型遺伝子座に優先的に富化されており、ここで、サイクル当たりの複数の多型遺伝子座についての対立遺伝子の偏りは、平均で、10%未満、5%、2%、1%、0.5%、0.2%、0.1%、0.05%または0.02%である。いくつかの実施形態では、複数の多型遺伝子座は、少なくとも10個の遺伝子座、少なくとも20個の遺伝子座、少なくとも50個の遺伝子座、少なくとも100個の遺伝子座、少なくとも200個の遺伝子座、少なくとも500個の遺伝子座、少なくとも1,000個の遺伝子座、少なくとも2,000個の遺伝子座、少なくとも5,000個の遺伝子座、少なくとも10,000個の遺伝子座、少なくとも20,000個の遺伝子座、または少なくとも50,000個の遺伝子座を含む。 Theoretically, each cycle of amplification doubles the amount of DNA present, but in practice the degree of amplification is slightly less than double. In theory, amplification, including targeted amplification, results in the amplification of an unbiased DNA mixture, but in practice, different alleles tend to be amplified to a different extent than other alleles. When amplifying DNA, the degree of allele bias generally increases with the number of amplification steps. In some embodiments, the methods described herein include the step of amplifying DNA with low levels of allele bias. Since the allele bias is compounded in each of yet another cycles, the allele bias per cycle can be determined by calculating the nth root of the overall bias, where n is wealth. It is a logarithm with a base of 2 for the degree of conversion. In some embodiments, a composition comprising a mixture of second DNA is present, the mixture of second DNA preferentially enriching multiple polymorphic loci from the mixture of first DNA. The degree of enrichment is at least 10, at least 100, at least 1,000, at least 10,000, at least 100,000 or at least 1,000,000, and each gene in the second DNA mixture. The ratio of allogens at the locus averages less than 1,000%, 500%, 200%, 100%, 50%, 20% with the ratio of allogens at that locus in the first DNA mixture. Only the coefficients of 10%, 5%, 2%, 1%, 0.5%, 0.2%, 0.1%, 0.05%, 0.02% or 0.01% are different. In some embodiments, there is a composition comprising a mixture of second DNA, which is preferentially enriched with multiple polymorphic loci from the mixture of first DNA. Here, the allele bias for multiple polymorphic loci per cycle is, on average, less than 10%, 5%, 2%, 1%, 0.5%, 0.2%, 0. .1%, 0.05% or 0.02%. In some embodiments, the plurality of polymorphic loci is at least 10 loci, at least 20 loci, at least 50 loci, at least 100 loci, at least 200 loci, At least 500 loci, at least 1,000 loci, at least 2,000 loci, at least 5,000 loci, at least 10,000 loci, at least 20,000 genes Contains loci, or at least 50,000 loci.

いくつかの実施形態
いくつかの実施形態では、妊娠中の胎児における染色体についての決定された倍数性の状態が開示されている報告を作製するための方法が本明細書に開示されており、前記方法は、胎児の母親由来のDNAおよび胎児由来のDNAを含有する第1の試料を得るステップと、胎児の一方の親または両親から遺伝子型データを得るステップと、調製された試料が得られるようにDNAを単離することによって第1の試料を調製するステップと、複数の多型遺伝子座において調製された試料中のDNAを測定するステップと、調製された試料に対して得たDNA測定値から、対立遺伝子数または複数の多型遺伝子座における対立遺伝子数の確率をコンピュータで算出するステップと、染色体における可能性のある異なる倍数性の状態について、染色体上の複数の多型遺伝子座における予測される対立遺伝子数の確率に関する、倍数性についての複数の仮説をコンピュータで作製するステップと、倍数性についての仮説のそれぞれについて、胎児の一方の親または両親からの遺伝子型データを使用して、染色体上の各多型遺伝子座の対立遺伝子数確率についての同時分布モデルをコンピュータで構築するステップと、調製された試料についての同時分布モデルおよび算出された対立遺伝子数の確率を用いて、倍数性についての仮説のそれぞれの相対的確率をコンピュータで決定するステップと、最大の確率を有する仮説に対応する倍数性の状態を選択することによって胎児の倍数性の状態をコールするステップと、決定された倍数性の状態が開示されている報告を作製するステップとを含む。
Some Embodiments In some embodiments, methods for making a report disclosing a determined multiple state of a chromosome in a pregnant fetus are disclosed herein, said. The method is to obtain a first sample containing DNA from the mother of the fetal and DNA from the fetal, a step to obtain genotypic data from one parent or parent of the fetal, and a prepared sample. The step of preparing the first sample by isolating the DNA in the gene, the step of measuring the DNA in the sample prepared at multiple polymorphic loci, and the DNA measurement value obtained for the prepared sample. From the computerized step of calculating the number of allogens or the probability of allogens at multiple polymorphic loci, and the prediction of possible different multiple states on the chromosome at multiple polymorphic loci on the chromosome. Using genotypic data from one parent or parent of the fetus, for each of the steps to computerize multiple hypotheses about the number of allogens to be made, and for each of the hypotheses about the polymorphism, Multiplier using the steps to computerize a co-distribution model for the probability of allogens at each polymorphic locus on the chromosome, the co-distribution model for the prepared sample, and the calculated probability of allogens. The step of computer-determining the relative probability of each of the hypotheses about the gene and the step of calling the chromosomal state of the fetal by selecting the chromosomal state corresponding to the hypothesis with the highest probability. Includes steps to produce a report in which the polymorphic state is disclosed.

いくつかの実施形態では、前記方法を用いて、複数のそれぞれの母親における複数の妊娠中の胎児の倍数性の状態を決定し、前記方法は、調製された試料のそれぞれにおける胎児起源のDNAのパーセントを決定するステップをさらに含み、ここで、調製された試料中のDNAを測定するステップは、各調製された試料中のいくつものDNA分子についてシークエンシングによって行い、より大きな胎児DNAの画分を有する調製された試料よりも、より小さな胎児DNAの画分を有する調製された試料由来のDNA分子について多く配列決定する。 In some embodiments, the method is used to determine the polymorphic state of multiple pregnant fetuses in each of the plurality of mothers, wherein the method is of DNA of fetal origin in each of the prepared samples. Further including a step of determining the percentage, where the steps of measuring the DNA in the prepared sample are performed by sequencing a number of DNA molecules in each prepared sample to obtain a larger fraction of fetal DNA. More sequenced DNA molecules from the prepared sample with a smaller fraction of fetal DNA than the prepared sample with.

いくつかの実施形態では、前記方法を用いて、複数のそれぞれの母親における複数の妊娠中の胎児の倍数性の状態を決定し、ここで、調製された試料中のDNAを測定するステップは、各胎児に対して、DNAの調製された試料の第1の画分について配列決定して第1の測定値の集合を得ることによって行い、前記方法は、第1のDNA測定値の集合を考慮して、各胎児の倍数性についての仮説のそれぞれに対して第1の相対的確率の決定を行うステップと、倍数性についての仮説のそれぞれに対する第1の相対的確率の決定が、異数体の胎児に対応する倍数性についての仮説が有意であるが決定的ではない確率を有することを示す、その胎児からの調製された試料の第2の画分について再び配列決定して、第2の測定値の集合を得るステップと、第2の測定値の集合および必要に応じて、第1の測定値の集合も使用して、胎児の倍数性についての仮説に対して第2の相対的確率の決定を行うステップと、第2の相対的確率の決定によって決定された通り最大の確率を有する仮説に対応する倍数性の状態を選択することによって第2の試料を再び配列決定した、その胎児の倍数性の状態をコールするステップとをさらに含む。 In some embodiments, the method is used to determine the polymorphic state of a plurality of pregnant fetuses in each of the plurality of mothers, wherein the step of measuring the DNA in the prepared sample is: For each fetus, the first fraction of the sample prepared with DNA is sequenced to obtain a set of first measurements, the method of which takes into account the set of first DNA measurements. Then, the step of determining the first relative probability for each of the hypothesis about the multipleness of each fetus and the determination of the first relative probability for each of the hypothesis about the polymorphism are aneuploids. The second fraction of the prepared sample from the fetal, showing that the hypothesis about the polypality corresponding to the fetal has a significant but inconclusive probability, is reordered and the second A second relative probability to the hypothesis about fetal multiples, using the step of obtaining a set of measurements and, optionally, a set of second measurements and, if necessary, a set of first measurements. The second sample was reordered by selecting the step of making the determination and the polymorphic state corresponding to the hypothesis with the highest probability as determined by the determination of the second relative probability, the fetus. Further includes a step of calling a state of multiples of.

いくつかの実施形態では、優先的に富化されたDNAの試料を含む組成物であって、優先的に富化されたDNAの試料が、第1のDNAの試料からの複数の多型遺伝子座において優先的に富化されており、第1のDNAの試料が母系の血漿に由来する母系DNAと胎児DNAの混合物からなり、富化の程度が少なくとも2倍であり、第1の試料と優先的に富化された試料の間の対立遺伝子の偏りが、平均で、2%未満、1%未満、0.5%未満、0.2%未満、0.1%未満、0.05%未満、0.02%未満、および0.01%未満からなる群から選択される組成物が開示されている。いくつかの実施形態では、そのような優先的に富化されたDNAの試料を作製するための方法が開示されている。 In some embodiments, the composition comprises a sample of preferentially enriched DNA, wherein the sample of preferentially enriched DNA is a plurality of polymorphic genes from the first sample of DNA. It is preferentially enriched at the locus, and the sample of the first DNA consists of a mixture of maternal DNA and fetal DNA derived from maternal plasma, the degree of enrichment is at least twice that of the first sample. On average, alligator bias between preferentially enriched samples is less than 2%, less than 1%, less than 0.5%, less than 0.2%, less than 0.1%, 0.05%. A composition selected from the group consisting of less than, less than 0.02%, and less than 0.01% is disclosed. In some embodiments, methods for making samples of such preferentially enriched DNA are disclosed.

いくつかの実施形態では、胎児のゲノムDNAおよび母系のゲノムDNAを含む母系の組織試料において胎児の異数性の存在または不在を決定するための方法であって、(a)前記母系の組織試料から、胎児のゲノムDNAと母系のゲノムDNAの混合物を得るステップと、(b)胎児DNAと母系DNAの混合物を複数の多型対立遺伝子において選択的に富化するステップと、(c)ステップaにおける胎児のゲノムDNAと母系のゲノムDNAの混合物から選択的に富化された断片を分布させて、単一のゲノムDNA分子または単一のゲノムDNA分子の増幅産物を含む反応試料をもたらすステップと、(d)ステップc)における反応試料中の選択的に富化されたゲノムDNAの断片についての大規模並行DNA配列決定を行って、前記選択的に富化された断片の配列を決定するステップと、(e)ステップd)において得られた配列が属する染色体を同定するステップと、(f)ステップd)からのデータを分析して、i)母親および胎児の両方において二倍体であると推測される、少なくとも1つの最初の標的の染色体に属する、ステップd)からのゲノムDNAの断片の数、およびii)胎児において異数体であることが疑われる第2の標的染色体に属する、ステップd)からのゲノムDNAの断片の数を決定するステップと、(g)第2の標的染色体が正倍数性である場合、第2の標的染色体について、ステップf)パートi)において決定された数を使用してステップd)からのゲノムDNAの断片の数の予測される分布を算出するステップと、(h)第2の標的染色体が異数体である場合、第2の標的染色体について、ステップf)パートi)である第1の数およびステップb)の混合物において見いだされる胎児DNAの推定される割合を用いてステップd)からのゲノムDNAの断片の数の予測される分布を算出するステップと、(i)最尤法または最大事後法を用いて、ステップf)パートii)において決定されたゲノムDNAの断片の数が、ステップg)で算出された分布またはステップh)で算出された分布のどちらの一部である可能性がより高いかを決定し、それにより、胎児の異数性の存在または不在を示すステップとを含む方法が開示されている。 In some embodiments, it is a method for determining the presence or absence of fetal variability in a maternal tissue sample comprising fetal genomic DNA and maternal genomic DNA, wherein (a) the maternal tissue sample. From the steps of obtaining a mixture of fetal genomic DNA and maternal genomic DNA, (b) selectively enriching the mixture of fetal DNA and maternal DNA in a plurality of polymorphic allogens, and (c) step a. With the step of selectively distributing enriched fragments from a mixture of fetal and maternal genomic DNA in a reaction sample containing a single genomic DNA molecule or an amplification product of a single genomic DNA molecule. , (D) A step of performing large-scale parallel DNA sequencing on a fragment of selectively enriched genomic DNA in a reaction sample in step c) to determine the sequence of the selectively enriched fragment. And (e) the step of identifying the chromosome to which the sequence obtained in step d) belongs, and (f) the data from step d) are analyzed to determine that i) is diploid in both the mother and the fetus. Inferred, the number of pieces of genomic DNA from step d) belonging to at least one first target chromosome, and ii) belonging to a second target chromosome suspected to be aneuploid in the fetal step. The step of determining the number of pieces of genomic DNA from d) and (g) the number determined in step f) part i) for the second target chromosome if the second target chromosome is positive multiple. To calculate the predicted distribution of the number of pieces of genomic DNA from step d), and (h) for the second target chromosome if the second target chromosome is aneuploid. f) A step of calculating the predicted distribution of the number of pieces of genomic DNA from step d) using the first number of part i) and the estimated proportion of fetal DNA found in the mixture of step b). And (i) the number of pieces of genomic DNA determined in step f) part ii) using the most probable or maximal ex post facto method was calculated in step g) distribution or step h). Methods are disclosed that include a step of determining which part of the distribution is more likely to be, thereby indicating the presence or absence of fetal chromosomal chromosomal.

代表的癌診断法
宿主において生存しているがんを起源とするDNAを、宿主の血液中に見いだすことができることが実証されていることに留意されたい。母系の血液中に見いだされる混合DNAを測定することによって遺伝子診断を行うことができるのと同様に、宿主血液中に見いだされる混合DNAを測定することによって同等に良好に遺伝子診断を行うことができる。遺伝子診断は、異数性状態または遺伝子変異を含み得る。母系の血液に対して行った測定からの胎児の倍数性状態または遺伝子の状態を決定することにおいて読み取る当該開示における任意の主張は、宿主血液に対する測定からがんの倍数性状態または遺伝子の状態を決定することにおいて、同等に良好に読み取ることができる。
Typical Cancer Diagnostic Methods It should be noted that it has been demonstrated that DNA originating from a living cancer in the host can be found in the host's blood. Just as a genetic diagnosis can be made by measuring the mixed DNA found in the maternal blood, a genetic diagnosis can be made equally well by measuring the mixed DNA found in the host blood. .. Genetic diagnosis can include aneuploidy states or genetic mutations. Any claim in the disclosure that reads in determining fetal ploidy or genetic status from measurements made on maternal blood is the cancer's ploidy or genetic status from measurements on host blood. In determining, it can be read equally well.

いくつかの実施形態では、本開示の方法により、がんの倍数性状態を決定することが可能になり、前記方法は、宿主由来の遺伝物質を含有する混合試料、およびがん由来の遺伝物質を得るステップと、混合試料中のDNAを測定するステップと、混合試料中のがん起源のDNAの割合を算出するステップと、混合試料に対して得た測定値および算出された割合を用いてがんの倍数性状態を決定するステップとを含む。いくつかの実施形態では、前記方法は、がんの倍数性状態の決定に基づいてがん治療を施すステップをさらに含んでよい。いくつかの実施形態では、前記方法は、がんの倍数性状態の決定に基づいてがん治療を施すステップをさらに含んでよく、がん治療は、医薬品、生物学的治療薬、および抗体に基づく治療およびそれらの組み合わせを含む群から選択される。 In some embodiments, the methods of the present disclosure allow the determination of a multiple state of cancer, wherein the method comprises a mixed sample containing a host-derived genetic material, and a cancer-derived genetic material. Using the steps obtained, the step of measuring the DNA in the mixed sample, the step of calculating the proportion of DNA of cancer origin in the mixed sample, and the measured values obtained and the calculated proportion for the mixed sample. Includes steps to determine the multiple status of the cancer. In some embodiments, the method may further comprise the step of giving cancer treatment based on the determination of the ploidy state of the cancer. In some embodiments, the method may further comprise the step of giving the cancer treatment based on the determination of the multiple state of the cancer, the cancer treatment being a drug, a biotherapeutic agent, and an antibody. Selected from groups that include based treatments and combinations thereof.

代表的実装方法
本明細書に開示されている実施形態はいずれも、デジタル電子回路、集積回路、特別に設計されたASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェアにおいて、またはそれらの組み合わせにおいて実行することができる。ここで開示されている実施形態の装置は、プログラム可能なプロセッサによって実行するための機械可読記憶デバイスに実体的に具体化されたコンピュータプログラム産物において実行することができ、ここで開示されている実施形態の方法のステップは、入力データを操作し、出力を生成することによってここで開示されている実施形態の機能を実施するための命令のプログラムを実行するプログラム可能なプロセッサによって実施することができる。ここで開示されている実施形態は、少なくとも1つのプログラム可能なプロセッサを含むプログラム可能なシステムにおいて実行可能かつ/または解釈可能な1つまたは複数のコンピュータプログラムで有利に実行することができ、該少なくとも1つのプログラム可能なプロセッサは、特別または汎用であり得る、データおよび命令を受け、データおよび命令を伝達するための記憶システム、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスと連結している。各コンピュータプログラムは、所望であれば、高レベルの手続き型のまたはオブジェクト指向のプログラミング言語で、またはアセンブリ言語または機械語で実装することができ、どんな場合でも、言語はコンパイラ型言語またはインタープリタ型言語であってよい。コンピュータプログラムは、独立型プログラムとして、またはモジュール、コンポーネント、サブルーチンまたはコンピュータ環境において使用するために適した他のユニットとしてのものを含めた、任意の形態で展開することができる。コンピュータプログラムは、1か所の、または複数か所にわたって分布した、および通信網により相互接続された1台のコンピュータまたは複数のコンピュータで実行または解釈されるように展開することができる。
Typical Implementation Methods Any of the embodiments disclosed herein are in or on digital electronic circuits, integrated circuits, specially designed ASICs (application specific integrated circuits), computer hardware, firmware, software, or them. It can be executed in the combination of. The apparatus of the embodiments disclosed herein can be performed in a computer program product materially embodied in a machine-readable storage device for execution by a programmable processor, the embodiment disclosed herein. The steps of the method of embodiment can be performed by a programmable processor that executes a program of instructions for performing the functions of the embodiments disclosed herein by manipulating the input data and producing the output. .. The embodiments disclosed herein can be advantageously executed in one or more computer programs executable and / or interpretable in a programmable system comprising at least one programmable processor, said at least. One programmable processor is coupled with a storage system, at least one input device, and at least one output device for receiving and transmitting data and instructions, which may be special or general purpose. Each computer program can be implemented in a high-level procedural or object-oriented programming language, or in assembly or machine language, if desired, and in any case the language is a compiler or interpreted language. May be. The computer program can be deployed in any form, including as a stand-alone program or as a module, component, subroutine or other unit suitable for use in a computer environment. Computer programs can be deployed to be executed or interpreted on a single computer or multiple computers distributed in one place or across multiple places and interconnected by a communication network.

コンピュータ可読の記憶媒体とは、本明細書で使用される場合、物理的なまたは有形の記憶装置(シグナルとは対照的に)を指し、これらに限定することなく、情報の有形の記憶装置、例えば、コンピュータ可読の命令、データ構造、プログラムモジュールまたは他のデータの任意の方法または技術において実装される揮発性のおよび不揮発性の、取り外し可能なおよび取り外し不可能な媒体を指す。コンピュータ可読の記憶媒体としては、これらに限定されないが、所望の情報またはデータまたは命令を実体的に保存するために使用することができ、コンピュータまたはプロセッサがアクセスすることができるRAM、ROM、EPROM、EEPROM、フラッシュメモリまたは他のソリッドステート記憶技術、CD-ROM、DVDまたは他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶デバイスまたは任意の他の物理的なまたは有形の媒体が挙げられる。 Computer-readable storage medium, as used herein, refers to, but is not limited to, a physical or tangible storage device (as opposed to a signal), a tangible storage device for information. For example, it refers to volatile and non-volatile, removable and non-removable media implemented in any method or technique of computer-readable instructions, data structures, program modules or other data. Computer-readable storage media include, but are not limited to, RAMs, ROMs, EPROMs, which can be used to substantially store desired information or data or instructions and can be accessed by a computer or processor. EEPROM, flash memory or other solid state storage technology, CD-ROM, DVD or other optical storage device, magnetic cassette, magnetic tape, magnetic disk storage device or other magnetic storage device or any other physical or tangible The medium of.

本明細書に記載の方法のいずれかは、コンピュータスクリーンまたは紙への印刷などの物理的形式でデータを出力するステップを含んでよい。本文書の他の箇所の任意の実施形態の記載では、記載されている方法を、医師がそれに基づいて行動することができる形式のすぐに使用可能なデータを出力するステップと組み合わせることができることが理解されるべきである。さらに、記載されている方法を、臨床処置、または措置を行わないという臨床的決定の実行をもたらす臨床的決定の実際の実行と組み合わせることができる。標的個体に関係する遺伝子データを決定するための本文書に記載の実施形態のいくつかを、IVFとの関連において、1個または複数個の胚を移入するために選択する決定と組み合わせ、必要に応じて、胚を将来の母親の子宮に移入するプロセスと組み合わせることができる。標的個体に関係する遺伝子データを決定するための本文書に記載の実施形態のいくつかを、潜在的な染色体異常またはそれがないことの医療専門家による通知と組み合わせ、必要に応じて、出生前診断との関連において、胎児を流産するか流産しないかの決定と組み合わせることができる。本明細書に記載の実施形態のいくつかを、すぐに使用可能なデータを出力すること、および臨床処置、または措置を行わないという臨床的決定の実行をもたらす臨床的決定を実行することと組み合わせることができる。 Any of the methods described herein may include outputting data in physical form, such as printing on a computer screen or paper. The description of any embodiment elsewhere in this document may be combined with the steps described to output ready-to-use data in a format that allows the physician to act on it. Should be understood. In addition, the methods described can be combined with clinical treatment, or the actual execution of a clinical decision that results in the execution of a clinical decision not to take action. Some of the embodiments described in this document for determining genetic data relating to a target individual are required in combination with the decision selected to transfer one or more embryos in the context of IVF. Accordingly, it can be combined with the process of transferring the embryo into the uterus of a future mother. Some of the embodiments described in this document for determining genetic data associated with a target individual are combined with a medical professional's notification of a potential chromosomal abnormality or its absence, and if necessary, prenatal. In the context of diagnosis, it can be combined with the decision to miscarriage or not miscarriage the fetus. Some of the embodiments described herein are combined with the output of readily available data and the execution of clinical decisions that result in the execution of clinical treatments or clinical decisions not to be taken. be able to.

代表的診断ボックス
ある実施形態では、本開示は、本開示に記載の方法のいずれかを部分的にまたは完全に実行することができる診断ボックスを含む。ある実施形態では、診断ボックスは、診察室、病院の検査室または患者をケアする場所に合理的に近い任意の適切な場所に置かれてよい。ボックスは、方法全体を完全に自動化された様式で実行することを可能にし得る、またはボックスは、技師が手動で完了するための、1つまたはいくつものステップを必要とする場合がある。ある実施形態では、ボックスは、少なくとも母系の血漿について測定された遺伝子型データを解析することを可能にし得る。ある実施形態では、ボックスは、診断ボックスで測定された遺伝子型データを、次いで遺伝子型データを解析し、場合によっては報告の作製も行う外部の計算設備に伝達する手段と連結することができる。診断ボックスは、水性試料または液体試料を1つの容器から別の容器に移すことができるロボットユニットを含んでよい。診断ボックスは、固体と液体の両方のいくつもの試薬を含んでよい。診断ボックスは、ハイスループットシーケンサーを含んでよい。診断ボックスは、コンピュータを含んでよい。
Representative Diagnostic Box In certain embodiments, the present disclosure includes a diagnostic box capable of partially or completely performing any of the methods described in the present disclosure. In certain embodiments, the diagnostic box may be placed in any suitable location reasonably close to the examination room, hospital laboratory or place of care for the patient. The box may allow the entire method to be performed in a fully automated manner, or the box may require one or more steps for the technician to complete manually. In certain embodiments, the box may be able to analyze genotype data measured at least for maternal plasma. In certain embodiments, the box can be coupled with a means of transmitting the genotype data measured in the diagnostic box to an external computing facility that then analyzes the genotype data and, in some cases, also produces reports. The diagnostic box may include a robotic unit capable of transferring an aqueous or liquid sample from one container to another. The diagnostic box may contain a number of reagents, both solid and liquid. The diagnostic box may include a high throughput sequencer. The diagnostic box may include a computer.

実験セクション
ここで開示されている実施形態は、以下の実施例に記載されており、これらは本開示の理解を補助するために記載され、その後に続く特許請求の範囲において定義されている本開示の範囲をいかなる形でも限定するものと解釈されるべきではない。以下の実施例は、当業者に、本記載した実施形態をどのように用いるかについての完全な開示および記載を提供するために提示されており、本開示の範囲を限定するものではなく、以下の実験が、実施した全ての実験または唯一の実験であることを示すものでもない。使用される数字(例えば、量、温度など)に関して正確さを確実にするための試みが行われているが、いくらかの実験的な誤差および偏差が考慮されるべきである。別段の指定のない限り、部分は体積による部分であり、温度は摂氏度である。記載されている方法の変形は、実験が例示することを意味する基本的な態様を変化させることなく行うことができることが理解されるべきである。
Experimental Section The embodiments disclosed herein are described in the following examples, which are described to aid in the understanding of the present disclosure and are defined in the claims that follow. Should not be construed as limiting the scope of. The following examples are presented to those skilled in the art to provide a complete disclosure and description of how the embodiments described herein are used, without limiting the scope of this disclosure to: It does not indicate that this experiment is all or the only experiment performed. Attempts have been made to ensure accuracy with respect to the numbers used (eg, quantity, temperature, etc.), but some experimental errors and deviations should be considered. Unless otherwise specified, parts are by volume and temperature is in degrees Celsius. It should be understood that modifications of the described method can be performed without altering the basic aspects that the experiment is meant to illustrate.

実験1
目的は、親の遺伝子型を使用して胎児画分を算出するベイズ最尤推定(MLE)アルゴリズムにより、公開された方法と比較して非侵襲的な出生前トリソミー診断の正確度が改善されることを示すことであった。
母系のcfDNAについてシミュレートされた配列決定データを、21トリソミーおよびそれぞれの母親の細胞系において得られたリードをサンプリングすることによって作製した。正確なダイソミーおよびトリソミーのコールの率を、公開された方法(ChiuらBMJ2011年:342巻:c7401頁)および本発明者らのMLEに基づくアルゴリズムについての種々の胎児画分における500のシミュレーションから決定した。IRBに承認されたプロトコールの下で収集した、4人の妊娠中の母親およびそれぞれの父親由来の500万のショットガンリードを得ることによってシミュレーションを検証した。親の遺伝子型を290KSNPアレイで得た(図14参照)。
Experiment 1
The goal is to improve the accuracy of non-invasive prenatal trisomy diagnosis compared to published methods by the Bayes maximum likelihood estimation (MLE) algorithm, which calculates the fetal fraction using the parental genotype. It was to show that.
Sequencing data simulated for maternal cfDNA was generated by sampling the reads obtained in trisomy 21 and each maternal cell line. Accurate disomy and trisomy call rates are determined from published methods (Chiu et al. BMJ 2011: 342: c7401) and 500 simulations of various fetal fractions for our MLE-based algorithms. did. Simulations were validated by obtaining 5 million shotgun leads from four pregnant mothers and their respective fathers collected under an IRB-approved protocol. Parental genotypes were obtained on a 290KSNP array (see Figure 14).

シミュレーションでは、MLEに基づく手法により、9%の低さの胎児画分に対して99.0%の正確度が実現され、全体的な正確度によく対応した信頼度が報告された。本発明者らは、これらの結果を、4つの実際の試料を用いて検証し、全て正確なコールが得られ、計算された信頼度は99%を超えた。対照的に、Chiuらの公開されたアルゴリズムを実行したところ、99.0%の正確度を実現するためには18%の胎児画分が必要であり、9%の胎児DNAでは87.8%の正確度しか実現されなかった。 In the simulation, the MLE-based method achieved 99.0% accuracy for a 9% low fetal fraction, reporting a reliability that corresponded well to the overall accuracy. We validated these results using four real samples, all with accurate calls and a calculated confidence of over 99%. In contrast, when the published algorithm of Chiu et al. Was run, 18% fetal fraction was required to achieve 99.0% accuracy, and 87.8% with 9% fetal DNA. Only the accuracy of was achieved.

MLEに基づく手法と併せて、親の遺伝子型から胎児画分を決定することにより、妊娠初期および妊娠中期の早期に予測される胎児画分において、公開されているアルゴリズムよりも高い正確度が実現される。さらに、本明細書に開示されている方法は、結果の信頼性の決定において、特に倍数性の検出がより難しい低胎児画分において、極めて重要な信頼度メトリックを生じる。公開された方法では、偽陽性率を予め定義する手法である、ダイソミートレーニングデータの大きな集合に基づく、倍数性をコールするための正確度が低い閾値方法を用いる。さらに、信頼度メトリックなしでは、公開された方法でコールを行うには胎児のcfDNAが不十分である場合に、偽陰性の結果を報告する危険性がある。いくつかの実施形態では、コールされた倍数性状態について信頼度推定値を算出する。 Determining the fetal fraction from the genotype of the parent in conjunction with an MLE-based approach provides higher accuracy than published algorithms for the predicted fetal fractions in early and mid-pregnancy. Will be done. Moreover, the methods disclosed herein give rise to a very important confidence metric in determining the reliability of the results, especially in the low fetal fraction where ploidy is more difficult to detect. The published method uses a less accurate threshold method for calling ploidy based on a large set of disomy training data, which is a method of predefining false positive rates. In addition, without confidence metrics, there is a risk of reporting false-negative results if the fetal cfDNA is insufficient to make calls in a published manner. In some embodiments, confidence estimates are calculated for the called ploidy state.

実験2
目的は、ベイズ最尤推定(MLE)アルゴリズムにおいて、標的化配列決定手法を親の遺伝子型およびHapmapデータと組み合わせて用いることによって、特に低胎児画分からなる試料における、胎児の18トリソミー、21トリソミー、およびXトリソミーの非侵襲的な検出を改善することであった。
Experiment 2
The purpose is to use targeted sequencing techniques in combination with parental genotype and HapMap data in the Bayesian maximum likelihood estimation (MLE) algorithm, especially in samples consisting of low fetal fractions, in trisomy 18 and trisomy 21 of the fetus. And to improve the non-invasive detection of trisomy X.

4つの正倍数性妊娠および2つのトリソミー陽性妊娠由来の母体試料およびそれぞれの父系の試料を、IRBに承認されたプロトコールの下で、胎児の核型が既知である患者から得た。母系のcfDNAを血漿から抽出し、標的の特定のSNPを優先的に富化した後、およそ1,000万のシーケンスリードを得た。親試料について同様に配列決定して、遺伝子型を得た。 Maternal and maternal samples from four positive polyploid pregnancies and two trisomy-positive pregnancies and their respective paternal samples were obtained from patients with known fetal karyotypes under IRB-approved protocols. Maternal cfDNA was extracted from plasma and preferentially enriched with specific SNPs of the target, after which approximately 10 million sequence reads were obtained. The parent sample was sequenced in the same manner to obtain a genotype.

記載されているアルゴリズムにより、正倍数性の試料および異数性の試料の正常な染色体の全てについて第18染色体ダイソミーおよび第21染色体ダイソミーが正確にコールされた。18トリソミーおよび21トリソミーのコールは正確であり、男の胎児および女の胎児におけるX染色体コピー数も正確であった。アルゴリズムによって生じる信頼度は、全ての場合において98%を超えた。 The algorithm described accurately called the chromosome 18 and chromosome 21 dysomy for all of the normal chromosomes of the positive polyploid and aneuploid samples. The calls for trisomy 18 and trisomy 21 were accurate, and the number of X-chromosome copies in male and female fetuses was also accurate. The confidence generated by the algorithm exceeded 98% in all cases.

記載されている方法により、妊娠初期の試料および妊娠中期の早期の試料のおよそ30%を占める、12%未満の胎児DNAで構成される試料を含めた、6つの試料由来の試験した染色体の全てについて倍数性が正確に報告された。当該MLEアルゴリズムと公開された方法の間の極めて重要な差異は、MLEアルゴリズムでは親の遺伝子型およびHapmapデータを活用して、正確度を改善し、信頼度メトリックを生成することである。低胎児画分では、全ての方法の正確度が低くなる;十分な胎児のcfDNAがない試料を正確に同定して、信頼できるコールを行うことが重要である。他のものは男の胎児の胎児画分を推定するためにY染色体特異的プローブを使用したが、同時に親の遺伝子型決定を行うことにより、両方の性について胎児画分を推定することができる。非標的化ショットガン配列決定を用いた公開された方法の別の固有の限界は、GCリッチなどの因子が異なることにより、倍数性コールの正確度が染色体間で変動することである。当該標的化配列決定手法は、そのような染色体規模の変動とはほとんど無関係であり、染色体間でより一貫した性能をもたらす。 All of the chromosomes tested from 6 samples, including samples composed of less than 12% fetal DNA, which account for approximately 30% of early and early pregnancy samples by the methods described. The ploidy was reported accurately for. A crucial difference between the MLE algorithm and the published method is that the MLE algorithm leverages parental genotype and HapMap data to improve accuracy and generate confidence metrics. With a low fetal fraction, the accuracy of all methods is low; it is important to accurately identify samples that do not have sufficient fetal cfDNA and make reliable calls. Others used a Y-chromosome-specific probe to estimate the fetal fraction of a male fetus, but by simultaneously genotyping the parent, the fetal fraction can be estimated for both sexes. .. Another inherent limitation of the published method using untargeted shotgun sequencing is that the accuracy of polyploid calls varies between chromosomes due to different factors such as GC rich. The targeted sequencing technique is largely independent of such chromosomal scale variations, resulting in more consistent performance between chromosomes.

実験3
目的は、母系の血漿中の浮動性胎児DNAのSNP遺伝子座を解析するための新規のインフォマティクスを用いて、三倍体の胎児においてトリソミーが高い信頼度で検出可能であるかどうかを決定することであった。
Experiment 3
The purpose is to determine whether trisomy can be reliably detected in triploid fetuses using novel informatics for analyzing the SNP loci of floating fetal DNA in maternal plasma. Met.

超音波異常の後に、血液20mLを妊娠中の患者から抜き取った。遠心分離した後、母系DNAをバフィーコートから抽出し(DNEASY、QIAGEN)、無細胞DNAを血漿から抽出した(QIAAMP QIAGEN)。両方のDNA試料において、第2染色体、第21染色体、およびX染色体上のSNP遺伝子座に標的化配列決定を適用した。最尤ベイズ推定により、全ての可能性のある倍数性の状態の集合から、最も可能性が高い仮説を選択した。前記方法により、胎児DNA割合、倍数性の状態および倍数性の決定における明確な信頼度を決定する。参照染色体の倍数性に関する仮定は行わない。診断では、現在の技術水準である、シーケンスリード数と無関係の検定統計量を使用する。 After ultrasound abnormalities, 20 mL of blood was withdrawn from the pregnant patient. After centrifugation, maternal DNA was extracted from the buffy coat (DNEASY, QIAGEN) and cell-free DNA was extracted from plasma (QIAAMP QIAGEN). Targeted sequencing was applied to the SNP loci on chromosomes 2, 21, and X in both DNA samples. Maximum likelihood Bayes estimation selected the most probable hypothesis from a set of all possible ploidic states. The method determines fetal DNA proportions, ploidy status and definite confidence in determining ploidy. No assumptions are made regarding the ploidy of the reference chromosome. The diagnosis uses the current state of the art, test statistic independent of the number of sequence reads.

当前記方法により、第2染色体および第21染色体のトリソミーが正確に診断された。子の割合は11.9%[CI11.7~12.1]と推定された。胎児は、第2染色体および第21染色体の1つの母系のコピーおよび2つの父系のコピーを有することが見いだされ、信頼度は有効に1(エラー確率<10-30)であった。これは、第2染色体および第21染色体のそれぞれ92,600リードおよび258,100リードを用いて実現された。 By this method, trisomy of chromosome 2 and chromosome 21 was accurately diagnosed. The proportion of offspring was estimated to be 11.9% [CI 11.7 to 12.1]. The fetus was found to have one maternal copy and two paternal copies of chromosomes 2 and 21 with a confidence of effectively 1 (error probability < 10-30 ). This was achieved using 92,600 and 258,100 reads on chromosomes 2 and 21, respectively.

これは、中期の核型によって確認されるように、母系の血液に由来するトリソミー染色体であって、その胎児が三倍体であるという非侵襲的な出生前診断の最初の実証である。非侵襲的な診断の現存の方法では、この試料において異数性は検出されない。現行の方法は、ダイソミー参照染色体と比較した、トリソミー染色体における余剰なシーケンスリードに依拠するが、三倍体の胎児はダイソミー参照を有さない。さらに、現存の方法では、この胎児DNAの割合およびシーケンスリード数を用いては同様に信頼度が高い倍数性の決定は実現されない。該手法を24の染色体全てに拡張することは簡単である。 This is the first demonstration of a non-invasive prenatal diagnosis that the fetus is triploid, a trisomy chromosome derived from maternal blood, as confirmed by the metaphase karyotype. Existing methods of non-invasive diagnosis do not detect aneuploidy in this sample. Current methods rely on extra sequence reads on the trisomy chromosome compared to the disomy reference chromosome, whereas triploid fetuses do not have a disomy reference. Moreover, existing methods do not provide similarly reliable ploidy determinations using this proportion of fetal DNA and the number of sequence reads. It is easy to extend the technique to all 24 chromosomes.

実験4
正倍数性の妊娠由来の母系の血漿から単離されたDNA、および同様に21三倍体性細胞系由来のゲノムDNAの、標準のPCR(ネスティングを使用しなかったことを意味する)を使用した800プレックス増幅のために以下のプロトコールを使用した。ライブラリーの調製および増幅は、単一チューブ平滑末端化、その後のA-テーリングを伴った。AGILENT SURESELECTキットに見いだされるライゲーションキットを使用してアダプタライゲーションを実行し、PCRを7サイクル実行した。次いで、第2染色体、第21染色体およびX染色体上のSNPを標的とする800の異なるプライマー対を使用して、STAを15サイクル行った(95℃で30秒間;72℃で1分間;60℃で4分間;65℃で1分間;72℃で30秒間)。12.5nMのプライマー濃度で反応を実行した。次いで、ILLUMINA IIGAXシーケンサーを用いてDNAについて配列決定した。シーケンサーにより190万のリードが出力され、その92%がゲノムにマッピングされ、ゲノムにマッピングされたリードのうち99%超が、標的のプライマーにより標的とされた領域のうちの1つにマッピングされた。数は血漿DNAとゲノムDNAの両方で基本的に同じであった。図15は、第21染色体において既知のトリソミーを有する細胞系から取得したゲノムDNAにおける、シーケンサーによって検出された約780SNPについての2つの対立遺伝子の比を示す。対立遺伝子分布は視覚的に読み取ることが簡単ではないので、ここでは可視化を容易にするために対立遺伝子の比がプロットされていることに留意されたい。丸印はダイソミー染色体上のSNPを示し、星印はトリソミー染色体上のSNPを示す。図16は、図Xの場合と同様に、同じデータの別の表示であり、Y軸は各SNPについて測定されたAとBの相対的な数であり、X軸は染色体によってSNPを分けたSNP数である。図16では、SNP1~312は、第2染色体上に見いだされ、SNP313~605は、トリソミーである第21染色体上に見いだされ、SNP606~800はX染色体上に見出される。第2染色体およびX染色体からのデータは、相対的な配列計数値が3つのクラスター内にあるとおり、ダイソミー染色体を示す:グラフの一番上がAAであり、グラフの一番下がBBであり、グラフの中央がABである。トリソミーである第21染色体からのデータは4つのクラスターを示す:グラフの一番上がAAAであり、0.65の線(2/3)の周辺がAABであり、.35の線(1/3)の周囲がABBであり、グラフの一番下がBBBである。
Experiment 4
Using standard PCR (meaning no nesting) of DNA isolated from maternal plasma from positive polyploid pregnancy, and genomic DNA from 21 triploid cell lines as well. The following protocol was used for the 800-plex amplification. Library preparation and amplification was accompanied by single tube blunting and subsequent A-tailing. Adapter ligation was performed using the ligation kit found in the Agilent SURESELECT kit and PCR was performed for 7 cycles. Then, 15 cycles of STA were performed using 800 different primer pairs targeting SNPs on chromosomes 2, 21 and X (95 ° C for 30 seconds; 72 ° C for 1 minute; 60 ° C. 4 minutes; 1 minute at 65 ° C; 30 seconds at 72 ° C). The reaction was carried out at a primer concentration of 12.5 nM. The DNA was then sequenced using the ILLUMINA IIGAX sequencer. The sequencer output 1.9 million reads, 92% of which were mapped to the genome, and more than 99% of the reads mapped to the genome were mapped to one of the regions targeted by the targeted primers. .. The numbers were basically the same for both plasma DNA and genomic DNA. FIG. 15 shows the ratio of two alleles for about 780 SNPs detected by the sequencer in genomic DNA obtained from a cell line with a known trisomy on chromosome 21. Note that the allele distribution is not easy to read visually, so the allele ratios are plotted here for ease of visualization. Circles indicate SNPs on the disomy chromosome, and stars indicate SNPs on the trisomy chromosome. FIG. 16 is another representation of the same data, as in FIG. X, where the Y-axis is the relative number of A and B measured for each SNP, and the X-axis separates the SNPs by chromosome. The number of SNPs. In FIG. 16, SNPs 1-312 are found on chromosome 2, SNPs 313-605 are found on the trisomy 21st chromosome, and SNPs 606-800 are found on the X chromosome. Data from chromosomes 2 and X show disomy chromosomes, as the relative sequence counts are within the three clusters: AA at the top of the graph and BB at the bottom of the graph. , The center of the graph is AB. Data from chromosome 21, trisomy, show four clusters: AAA at the top of the graph, AAA around the line (2/3) at 0.65 ,. ABB is around the line (1/3) of 35, and BBB is at the bottom of the graph.

図17A~Dは、同じ800プレックスプロトコールについてのデータであって、妊娠中の女性由来の4つの血漿試料から増幅したDNAに対して測定されたデータを示す。これらの4つの試料について、点について7つのクラスターが認められることが予想される:(1)グラフの一番上に沿っているのは、母親および胎児がどちらもAAである遺伝子座であり、(2)グラフの一番上のわずかに下は、母親がAAであり、胎児がABである遺伝子座であり、(3)0.5の線のわずかに上は、母親がABであり、胎児がAAである遺伝子座であり、(4)0.5の線に沿っているのは、母親および胎児がどちらもABである遺伝子座であり、(5)0.5の線のわずかに下は、母親がABであり、胎児がBBである遺伝子座であり、(6)グラフの一番下のわずかに上は、母親がBBであり、胎児がABである遺伝子座であり、(1)グラフの一番下に沿っているのは、母親および胎児がどちらもBBである遺伝子座である。胎児画分が小さいほど、クラスター(1)と(2)の間、クラスター(3)、(4)および(5)の間、ならびにクラスター(6)と(7)の間の分離が小さくなる。分離は、胎児起源のDNAの画分の半分であることが予想される。例えば、DNAの20%が胎児性であり、80%が母系である場合、(1)~(7)は、それぞれ1.0、0.9、0.6、0.5、0.4、0.1および0.0に集中することが予想される;例えば、図17D、POOL1_BC5_ref_rateを参照されたい。その代わりに、DNAの8%が胎児性であり、92%が母系である場合、(1)~(7)は、それぞれ1.00、0.96、0.54、0.50、0.46、0.04および0.00に集中することが予想される;例えば、図17B、POOL1_BC2_ref_rateを参照されたい。胎児DNAが検出されない場合は、(2)、(3)、(5)または(6)が認められることは予想されない;あるいは、分離は0であると言える、したがって(1)および(2)は互いに一番上にあり、(3)、(4)および(5)、ならびに、同様に(6)および(7)も同様である;例えば、図17C、POOL1_BC7_ref_rateを参照されたい。図17A、POOL1_BC1_ref_rateについて胎児画分は約25%であることに留意されたい。 17A-D show data for the same 800-plex protocol, measured for DNA amplified from four plasma samples from pregnant women. For these four samples, seven clusters of dots are expected to be found: (1) Along the top of the graph are loci where both the mother and the fetus are AA. (2) Slightly below the top of the graph is the locus where the mother is AA and the fetal is AB, and (3) Slightly above the line 0.5 is the mother is AB. The locus where the fetus is AA and (4) along the line 0.5 is the locus where both the mother and the fetus are AB and (5) slightly of the line 0.5. Below is the locus where the mother is AB and the fetus is BB, and (6) slightly above the bottom of the graph is the locus where the mother is BB and the fetus is AB. 1) At the bottom of the graph is the locus where both the mother and the fetus are BB. The smaller the fetal fraction, the smaller the separation between clusters (1) and (2), between clusters (3), (4) and (5), and between clusters (6) and (7). Separation is expected to be half the fraction of DNA of fetal origin. For example, if 20% of the DNA is fetal and 80% is maternal, (1)-(7) are 1.0, 0.9, 0.6, 0.5, 0.4, respectively. Expected to concentrate on 0.1 and 0.0; see, for example, Figure 17D, POOL1_BC5_ref_late. Instead, if 8% of the DNA is fetal and 92% is maternal, (1)-(7) are 1.00, 0.96, 0.54, 0.50, 0. Expected to concentrate on 46, 0.04 and 0.00; see, for example, Figure 17B, POOL1_BC2_ref_rate. If fetal DNA is not detected, then (2), (3), (5) or (6) is not expected to be present; or the separation can be said to be 0, so (1) and (2) are At the top of each other, (3), (4) and (5), as well as (6) and (7); see, for example, Figure 17C, POOL1_BC7_ref_rate. Note that for FIG. 17A, POOL1_BC1_ref_rate, the fetal fraction is about 25%.

実験5
DNAの増幅および測定の大多数の方法により、一般に遺伝子座において見いだされる2つの対立遺伝子が、DNAの試料中の対立遺伝子の実際の量を表さない強度または計数値で検出される、いくらかの対立遺伝子の偏りが生じる。例えば、単一の個体について、ヘテロ接合性遺伝子座において、ヘテロ接合性遺伝子座について予測される理論的な比である、2つの対立遺伝子の1:1の比が認められることが予想されるが、対立遺伝子の偏りに起因して、55:45または、さらには60:40が認められ得る。配列決定との関連において、リード深度が低い場合には、単純な確率論的ノイズにより、有意な対立遺伝子の偏りがもたらされる可能性があることにも留意されたい。ある実施形態では、各SNPの挙動をモデリングすることが可能であり、したがって、特定の対立遺伝子について一貫した偏りが観察される場合、この偏りを補正することができる。図18は、偏り補正の前後の、二項分散によって説明することができるデータの割合を示す。図18では、星印は、800プレックス実験について、生の配列データにおいて観察された対立遺伝子の偏りを示し、丸印は、補正後の対立遺伝子の偏りを示す。対立遺伝子の偏りが全くない場合には、データがx=yの線に沿うことが予想されることに留意されたい。150プレックス標的化増幅を用いてDNAを増幅することによって生じる同様のデータの集合により、偏り補正後に1:1の線のごく近傍に包含されるデータが生じた。
Experiment 5
By the majority of methods of DNA amplification and measurement, two alleles commonly found at loci are detected with intensities or counts that do not represent the actual amount of alleles in the DNA sample. Allele bias occurs. For example, for a single individual, at the heterozygous locus, a 1: 1 ratio of the two alleles, which is the expected theoretical ratio for the heterozygous locus, is expected. , 55:45 or even 60:40 can be observed due to the bias of alleles. It should also be noted that in the context of sequencing, simple stochastic noise can result in significant allele bias in low read depths. In certain embodiments, it is possible to model the behavior of each SNP, and thus if a consistent bias is observed for a particular allele, this bias can be corrected. FIG. 18 shows the percentage of data that can be explained by the binomial variance before and after the bias correction. In FIG. 18, the asterisk indicates the allele bias observed in the raw sequence data for the 800-plex experiment, and the circles indicate the corrected allele bias. Note that the data are expected to follow the x = y line if there is no allele bias. A similar set of data generated by amplifying DNA using 150-plex targeted amplification yielded data contained in the immediate vicinity of the 1: 1 line after bias correction.

実験6
プライマーのアニーリングおよび伸長の時間が数分に限られている、アダプタタグに特異的なプライマーとライゲーションしたアダプタを使用したDNAのユニバーサル増幅は、より短いDNA鎖の割合を富化する効果を有する。配列決定に適したDNAライブラリーを作製するために設計された大多数のライブラリープロトコールはそのようなステップを含み、プロトコールの例は公開されており、当業者に周知である。本発明のいくつかの実施形態では、ユニバーサルタグを有するアダプタを血漿DNAにライゲーションし、アダプタタグに特異的なプライマーを使用して増幅する。いくつかの実施形態では、ユニバーサルタグは、配列決定のために用いるものと同じタグであってよく、それはPCR増幅のためだけのユニバーサルタグであってよい、またはそれはタグの集合であってよい。胎児DNAは一般には、天然では短く、一方、母系DNAは天然では短いものと長いものの両方であり得るので、この方法は、混合物中の胎児DNAの割合を富化する効果を有する。アポトーシス性の細胞由来のDNAであると考えられ、胎児DNAと母系DNAの両方を含有する浮動性DNAは短く、大部分は200bp未満である。静脈切開後の一般的な現象である細胞溶解によって放出される細胞性DNAは、一般には、ほぼ排他的に母系であり、同様にかなり長く、大部分が500bpを超える。したがって、数分超放置した血液試料は、短い(胎児性+母系)DNAおよびより長い(母系)DNAの混合物を含有する。母系の血漿に対してユニバーサル増幅を比較的短い伸長時間で実施し、その後、標的化増幅することにより、胎児DNAの相対的な割合が、標的化増幅を単独で用いて増幅した血漿と比較して増大する傾向がある。これは、入力が血漿DNA(垂直方向の軸)である場合に測定された胎児のパーセント対入力DNAがILLUMINA GAIIxライブラリー調製プロトコールを用いて調製したライブラリーを有する血漿DNAである場合に測定された胎児のパーセントを示す図19において認めることができる。線の下に入る点は全て、ライブラリーの調製ステップにより胎児起源のDNAの割合(fraction)が富化されることを示す。赤色であった2つの血漿の試料は溶血を示し、したがって、細胞溶解によって存在する長い母系DNAの量が増大したことを示し、これは、標的化増幅の前にライブラリーの調製を実施した場合に、胎児画分(fetal fraction)が特に有意に富化されることを示す。本明細書に開示されている方法は、溶血があるまたは比較的長い鎖の混入DNAを含む細胞が溶解し、短いDNAと長いDNAが混合した試料に混入するいくつかの他の状況が生じている場合に特に有用である。一般には、比較的短いアニーリング時間および伸長時間は30秒間から2分間の間であるが、5秒または10秒以下の短さであってよく、または5分間または10分間の長さであってよい。
Experiment 6
Universal amplification of DNA using adapters ligated with adapter tag-specific primers, where primer annealing and elongation times are limited to minutes, has the effect of enriching the proportion of shorter DNA strands. The majority of library protocols designed to generate DNA libraries suitable for sequencing include such steps, and examples of the protocol are publicly available and well known to those of skill in the art. In some embodiments of the invention, an adapter with a universal tag is ligated to plasma DNA and amplified using primers specific for the adapter tag. In some embodiments, the universal tag may be the same tag used for sequencing, it may be a universal tag solely for PCR amplification, or it may be a collection of tags. This method has the effect of enriching the proportion of fetal DNA in the mixture, as fetal DNA is generally short in nature, while maternal DNA can be both short and long in nature. Floating DNA, which is thought to be of apoptotic cell-derived DNA and contains both fetal and maternal DNA, is short, mostly less than 200 bp. Cellular DNA released by cytolysis, a common phenomenon after venous incision, is generally almost exclusively matrilineal and is also fairly long, mostly above 500 bp. Therefore, blood samples left for more than a few minutes contain a mixture of short (fetal + maternal) DNA and longer (maternal) DNA. By performing universal amplification on maternal plasma with a relatively short elongation time and then targeting amplification, the relative proportion of fetal DNA is compared to plasma amplified using targeted amplification alone. Tends to increase. This is measured when the fetal percent vs. input DNA measured when the input is plasma DNA (vertical axis) is plasma DNA with a library prepared using the ILLUMINA GAIIx library preparation protocol. It can be seen in FIG. 19, which shows the percentage of plasma. All points below the line indicate that the library preparation step enriches the fraction of DNA of fetal origin. The two plasma samples that were red showed hemolysis, thus indicating that cytolysis increased the amount of long maternal DNA present, which was the case when library preparation was performed prior to targeted amplification. It is shown that the fetal fraction is particularly significantly enriched. The methods disclosed herein result in several other situations in which cells with hemolysis or containing relatively long strands of contaminated DNA are lysed and contaminate a sample containing a mixture of short and long DNA. Especially useful if you have one. Generally, the relatively short annealing and extension times are between 30 and 2 minutes, but may be as short as 5 or 10 seconds or less, or as long as 5 or 10 minutes. ..

実験7
正倍数性の妊娠由来の母系の血漿から単離されたDNA、および同様に21三倍体性細胞系由来のゲノムDNAの、直接PCRプロトコール、および同様にセミネステッド手法を用いた1,200プレックス増幅のために以下のプロトコールを使用した。ライブラリーの調製および増幅は、単一チューブ平滑末端化、その後のA-テーリングを伴った。AGILENT SURESELECTキットに見いだされるライゲーションキットの改変を用いてアダプタライゲーションを実行し、PCRを7サイクル実行した。標的のプライマープールでは、第21染色体由来のSNPについての550のアッセイ、ならびに第1染色体およびX染色体のそれぞれ由来のSNPについての325のアッセイを行った。どちらのプロトコールも、16nMのプライマー濃度を用いてSTAの15サイクルを伴った(95℃で30秒間;72℃で1分間;60℃で4分間;65℃で30秒間;72℃で30秒間)。セミネステッドPCRプロトコールは、29nMの内側のフォワードタグ濃度、および1μMまたは0.1μMのリバースタグ濃度を用いたSTA15サイクルの第2の増幅を伴った(95℃で30秒間;72℃で1分間;60℃で4分間;65℃で30秒間;72℃で30秒間)。次いで、ILLUMINA IIGAXシーケンサーを用いてDNAについて配列決定した。直接PCRプロトコールについては、リードの73%がゲノムにマッピングされ、セミネステッドプロトコールについては、シーケンスリードの97.2%がゲノムにマッピングされる。したがって、セミネステッドプロトコールにより、およそ30%多くの情報がもたらされ、これは、主に、プライマー二量体を引き起こす可能性が最も高いプライマーが排除されたことに起因すると推測される。
Experiment 7
A direct PCR protocol for DNA isolated from maternal plasma from a positive polyploid pregnancy, and genomic DNA from a similarly 21 triploid cell line, and a 1,200 plex using a semi-nested technique as well. The following protocol was used for amplification. Library preparation and amplification was accompanied by single tube blunting and subsequent A-tailing. Adapter ligation was performed using the modification of the ligation kit found in the Agilent SURESELECT kit, and PCR was performed for 7 cycles. In the target primer pool, 550 assays for SNPs from chromosome 21 and 325 assays for SNPs from chromosome 1 and X, respectively, were performed. Both protocols involved 15 cycles of STA with a primer concentration of 16 nM (95 ° C. for 30 seconds; 72 ° C. for 1 minute; 60 ° C. for 4 minutes; 65 ° C. for 30 seconds; 72 ° C. for 30 seconds). .. The semi-nested PCR protocol was accompanied by a second amplification of the STA15 cycle with a forward tag concentration inside 29 nM and a reverse tag concentration of 1 μM or 0.1 μM (30 seconds at 95 ° C; 1 minute at 72 ° C; 60 ° C. for 4 minutes; 65 ° C. for 30 seconds; 72 ° C. for 30 seconds). The DNA was then sequenced using the ILLUMINA IIGAX sequencer. For direct PCR protocols, 73% of reads are mapped to the genome, and for semi-nested protocols, 97.2% of sequence reads are mapped to the genome. Therefore, it is speculated that the semi-nested protocol provides approximately 30% more information, primarily due to the elimination of the primers most likely to cause primer dimers.

リード深度の変動性は、セミネステッドプロトコールを使用した場合、直接PCRプロトコールを使用した場合よりも高い傾向があり(図20参照)、ひし形はセミネステッドプロトコールを用いて実行した遺伝子座についてのリード深度を指し、四角はネスティングなしで実行した遺伝子座についてのリード深度を指す。SNPは、ひし形についてリード深度によって配置されており、したがって、ひし形は全て曲線上に置かれ、一方四角は、ゆるく相関するようである;SNPの配置は任意であり、リード深度を指すのは、ドットの左から右への場所ではなく、ドットの高さである。 Read depth variability tends to be higher when using the semi-nested protocol than when using the direct PCR protocol (see Figure 20), with diamonds being the read depth for loci performed using the semi-nested protocol. The square indicates the read depth for the locus performed without nesting. The SNPs are arranged by the lead depth for the diamonds, so all the diamonds are placed on the curve, while the squares appear to be loosely correlated; the placement of the SNPs is arbitrary and refers to the lead depth. It is the height of the dot, not the location from left to right of the dot.

いくつかの実施形態では、本明細書に記載の方法により、優れたリード深度(DOR)の分散を実現することができる。例えば、1,200アッセイの、ゲノムDNAの1,200プレックス直接PCR増幅を用いたこの実験の1つのバージョン(図21)において、1186アッセイでは、DORが10超であり、平均のリード深度が400であり、1063アッセイ(88.6%)では、リード深度が200から800の間であり、各対立遺伝子についてのリード数は、意味のあるデータを得るために十分に高いが、各対立遺伝子についてのリード数は、これらのリードの限界使用が特に小さい場合、それほど高くない、理想的なウィンドウを有した。12の対立遺伝子のみが、高いリード深度を有し、1035のリードが一番深かった。DORの標準偏差は290であり、平均DORは453であり、DORの変動係数は64%であり、950,000の総リードが存在し、およびリードの63.1%がゲノムにマッピングされた。1,200プレックスセミネステッドプロトコールを使用した別の実験(図22)では、DORはより高かった。DORの標準偏差は583であり、平均DORは630であり、DORの変動係数は93%であり、870,000の総リードが存在し、リードの96.3%がゲノムにマッピングされた。これらの場合のどちらにおいても、SNPは母親についてのリード深度によって配置され、したがって、曲線は母系のリード深度を示すことに留意されたい。子と父親の間の鑑別は重要でなく、それは単にこの説明のために重要であるトレンドである。 In some embodiments, the methods described herein can achieve excellent read depth (DOR) dispersion. For example, in one version of this experiment (FIG. 21) using 1,200-plex direct PCR amplification of genomic DNA in the 1,200 assay, the 1186 assay has a DOR greater than 10 and an average read depth of 400. And in the 1063 assay (88.6%), the read depth is between 200 and 800, and the number of reads for each allele is high enough to obtain meaningful data, but for each allele. The number of reads in these leads had an ideal window, not too high, especially if the limit usage of these leads was small. Only 12 alleles had high read depths, with 1035 reads being the deepest. The standard deviation of the DOR was 290, the mean DOR was 453, the coefficient of variation of the DOR was 64%, there were 950,000 total reads, and 63.1% of the reads were mapped to the genome. In another experiment using the 1,200 plex semi-nested protocol (FIG. 22), the DOR was higher. The standard deviation of DOR was 583, the mean DOR was 630, the coefficient of variation of DOR was 93%, there were 870,000 total reads, and 96.3% of the reads were mapped to the genome. Note that in both of these cases the SNPs are arranged by the lead depth for the mother and therefore the curve indicates the lead depth of the maternal line. The distinction between the child and the father is not important, it is just a trend that is important for this explanation.

実験8
実験において、セミネステッド1,200プレックスPCRプロトコールを用いて、1つの細胞由来のDNAおよび3つの細胞由来のDNAを増幅した。この実験は、母系の血液から単離された胎児の細胞を使用した出生前異数性試験と関連する、または生検割球または栄養外胚葉試料を使用した着床前遺伝子診断のためのものである。条件ごとに2個体(46XYおよび47XX+21)由来の1つの細胞および3つの細胞の3つの複製物が存在した。アッセイは、第1染色体、第21染色体およびX染色体を標的とした。3つの異なる溶解方法を使用した:ARCTURUS、MPERv2およびアルカリ溶解。1つの配列決定レーンにおいて多重化48試料に配列決定を実行した。アルゴリズムにより、3つの染色体のそれぞれについて、および複製物のそれぞれについての正確な倍数性コールが生じた。
Experiment 8
In the experiment, a semi-nested 1,200-plex PCR protocol was used to amplify DNA from one cell and DNA from three cells. This experiment is associated with prenatal aneuploidy testing using fetal cells isolated from maternal blood, or for preimplantation genetic diagnosis using biopsy blastomeres or vegetative ectoderm samples. Is. There were 3 replicas of 1 cell and 3 cells from 2 individuals (46XY and 47XX + 21) for each condition. The assay targeted chromosomes 1, 21 and X. Three different dissolution methods were used: ARCTURUS, MPERv2 and alkaline dissolution. Sequencing was performed on 48 multiplexed samples in one sequencing lane. The algorithm yielded exact ploidy calls for each of the three chromosomes and for each of the replicas.

実験9
1つの実験では、4つの母系の血漿試料を調製し、ヘミネステッド9,600プレックスプロトコールを使用して増幅した。試料を以下のように調製した:母系の血液最大40mLを遠心分離して、バフィーコートおよび血漿を単離した。母系試料のゲノムDNAをバフィーコートから調製し、父系のDNAを血液試料または唾液試料から調製した。母系の血漿中の無細胞DNAを、QIAGEN CIRCULATING NUCLEIC ACIDキットを使用して単離し、TE緩衝液45μLで製造者の指示に従って溶出した。ユニバーサルライゲーションアダプタを、精製された血漿DNA35μLの各分子の末端に付加し、ライブラリーを、アダプタ特異的プライマーを使用して7サイクルにわたって増幅した。ライブラリーを、AGENCOURT AMPUREビーズを使用して精製し、水50μlで溶出した。
Experiment 9
In one experiment, four maternal plasma samples were prepared and amplified using the Heminestized 9,600 plex protocol. Samples were prepared as follows: Up to 40 mL of maternal blood was centrifuged to isolate the buffy coat and plasma. Genomic DNA of maternal samples was prepared from buffy coats and paternal DNA was prepared from blood or saliva samples. Cell-free DNA in maternal plasma was isolated using the QIAGEN CIRCULATING nucleoIC ACID kit and eluted with 45 μL of TE buffer according to the manufacturer's instructions. A universal ligation adapter was added to the end of each molecule of 35 μL of purified plasma DNA and the library was amplified over 7 cycles using adapter-specific primers. The library was purified using AGECOUNT AMPURE beads and eluted with 50 μl of water.

9,600個の標的特異的タグを付けたリバースプライマーのプライマー濃度14.5nMおよび1つのライブラリーアダプタ特異的フォワードプライマーの500nMを使用し、15サイクルのSTAを用いて、3μlのDNAを増幅した(最初のポリメラーゼ活性化のために95℃で10分間、次いで、95℃で30秒間;72℃で10秒間;65℃で1分間;60℃で8分間;65℃で3分間および72℃で30秒間;を15サイクル、および72℃で2分間の最終の伸長)。 3 μl of DNA was amplified using 15 cycles of STA using a primer concentration of 14.5 nM for reverse primers with 9,600 target-specific tags and 500 nM for one library adapter-specific forward primer. (For the first polymerase activation at 95 ° C. for 10 minutes, then at 95 ° C. for 30 seconds; 72 ° C. for 10 seconds; 65 ° C. for 1 minute; 60 ° C. for 8 minutes; 65 ° C. for 3 minutes and 72 ° C. 30 seconds; 15 cycles, and final elongation at 72 ° C. for 2 minutes).

ヘミネステッドPCRプロトコールは、第1のSTA産物の希釈物の、1000nMのリバースタグ濃度、および9,600個の標的特異的フォワードプライマーのそれぞれについて16.6u nMの濃度を用いたSTAを15サイクルにわたる第2の増幅を伴った(最初のポリメラーゼ活性化のために95℃で10分間、次いで95℃で30秒間;65℃で1分間;60℃で5分間;65℃で5分間および72℃で30秒間;の15サイクル、および72℃で2分間の最終の伸長)。 The heminated PCR protocol is a 15-cycle STA with a dilution of the first STA product, a reverse tag concentration of 1000 nM, and a concentration of 16.6 unM for each of the 9,600 target-specific forward primers. With amplification of 2 (for the first polymerase activation at 95 ° C. for 10 minutes, then at 95 ° C. for 30 seconds; 65 ° C. for 1 minute; 60 ° C. for 5 minutes; 65 ° C. for 5 minutes and 72 ° C. for 30 seconds. 15 cycles of seconds; and final elongation at 72 ° C. for 2 minutes).

次いで、STA産物の一定分量を、標準のPCRによって、1μMのタグ特異的なフォワードプライマーおよびバーコードを付けたリバースプライマーを用いて10サイクルにわたって増幅し、バーコードを付けた配列決定ライブラリーを生成した。各ライブラリーの一定分量を異なるバーコードのライブラリーと混合し、スピンカラムを使用して精製した。 An aliquot of STA product was then amplified by standard PCR over 10 cycles with 1 μM tag-specific forward and barcoded reverse primers to generate a barcoded sequencing library. did. A fixed amount of each library was mixed with libraries of different barcodes and purified using a spin column.

このように、単一ウェル反応において9,600個のプライマーを使用した;プライマーは、第1染色体、第2染色体、第13染色体、第18染色体、第21染色体、X染色体およびY染色体上に見いだされるSNPを標的とするように設計した。次いで、増幅産物について、ILLUMINA GAIIXシーケンサーを用いて配列決定した。試料当たり、およそ390万のリードがシーケンサーによって生成され、370万のリードがゲノムにマッピングされ(94%)、それらのうち、290万のリード(74%)が標的のSNPにマッピングされ、平均のリード深度は344であり、リード深度の中央値は255であった。4つの試料についての胎児画分は、9.9%、18.9%、16.3%、および21.2%であることが見いだされた。 Thus, 9,600 primers were used in the single-well reaction; the primers were found on chromosomes 1, 2, 13, 13, 18, 21, 21, X and Y. Designed to target the SNPs. The amplified product was then sequenced using the ILLUMINA GAIIX sequencer. Approximately 3.9 million reads per sample are generated by the sequencer, 3.7 million reads are mapped to the genome (94%), of which 2.9 million reads (74%) are mapped to the target SNP, averaging. The lead depth was 344 and the median lead depth was 255. Fetal fractions for the four samples were found to be 9.9%, 18.9%, 16.3%, and 21.2%.

関連性のある母系のゲノムDNA試料および父系のゲノムDNA試料を、セミネステッド9600プレックスプロトコールを使用して増幅し、配列決定した。セミネステッドプロトコールは、第1のSTAにおいて9,600個の外側のフォワードプライマーおよびタグを付けたリバースプライマーを7.3nMで適用するという点で異なる。サーモサイクリング条件および第2のSTAの組成、およびバーコーディングPCRはヘミネステッドプロトコールについてのものと同じであった。 Relevant maternal and paternal genomic DNA samples were amplified and sequenced using a semi-nested 9600 plex protocol. The semi-nested protocol differs in that the first STA applies 9,600 outer forward and tagged reverse primers at 7.3 nM. The thermocycling conditions, the composition of the second STA, and the barcoding PCR were the same as for the heminated protocol.

配列決定データを、本明細書に開示されているインフォマティクス方法を用いて解析し、DNAが4つの母系の血漿試料中に存在した胎児について、6つの染色体において倍数性の状態をコールした。集団内の28個の染色体全てについての倍数性コールは正確にコールされ、信頼度は、正確にコールされたが、信頼度が83%であった1つの染色体以外は99.2%を超えた。 Sequencing data were analyzed using the informatics methods disclosed herein to call for polyploid states on 6 chromosomes for fetuses in which DNA was present in 4 maternal plasma samples. Ploidy calls for all 28 chromosomes in the population were called correctly and confidence was called correctly, but exceeded 99.2% except for one chromosome, which had a confidence of 83%. ..

図23は、9,600プレックスヘミネスティング手法のリード深度を、実験7に記載の1,200プレックスセミネステッド手法のリード深度と一緒に示すが、リード深度が100超、200超および400超であるSNPの数は1,200プレックスプロトコールにおけるそれよりも有意に多かった。第90パーセンタイルにおけるリード数を第10パーセンタイルにおけるリード数で割って、無次元のメトリックを得ることができ、それにより、リード深度の均一性が示され;その数が小さいほど、リード深度がより均一である(狭い)。平均の第90パーセンタイル/第10パーセンタイル比は、実験9において行った方法では11.5であるが、実験7において行った方法では5.6である。特定のリードの百分率がリード数の閾値を超えることを確実にするために、より少ないシーケンスリードが必要であるので、配列決定効率のためには、所与のプロトコールプレキシティ(plexity)に対してより狭いリード深度がより良い。 FIG. 23 shows the lead depth of the 9,600 plex heminesting method together with the lead depth of the 1,200 plex seminested method described in Experiment 7, with lead depths greater than 100, greater than 200 and greater than 400. The number of SNPs was significantly higher than that in the 1,200 plex protocol. The number of reads in the 90th percentile can be divided by the number of reads in the 10th percentile to obtain a dimensionless metric, which shows the uniformity of the lead depth; the smaller the number, the more uniform the lead depth. (Narrow). The average 90th percentile / 10th percentile ratio is 11.5 in the method performed in Experiment 9, but 5.6 in the method performed in Experiment 7. For sequencing efficiency, for a given protocol plexity, as less sequence reads are needed to ensure that the percentage of a particular read exceeds the read count threshold. Narrower lead depths are better.

実験10
1つの実験では、4つの母系の血漿試料を調製し、セミネステッド9,600プレックスプロトコールを使用して増幅した。実験10の詳細は実験9と非常に類似しており、例外はネスティングプロトコールであること、および4つの試料の同一性を含めたことであった。集団内の28個の染色体全てについての倍数性コールは正確にコールされ、信頼度は99.7%を超えた。760万(97%)のリードがゲノムにマッピングされ、リードの630万(80%)が標的のSNPにマッピングされた。平均のリード深度は751であり、リード深度の中央値は396であった。
Experiment 10
In one experiment, four maternal plasma samples were prepared and amplified using a semi-nested 9,600 plex protocol. The details of Experiment 10 were very similar to Experiment 9, with the exception of the nesting protocol and the inclusion of the identity of the four samples. Ploidy calls for all 28 chromosomes in the population were accurately called and confidence exceeded 99.7%. 7.6 million (97%) reads were mapped to the genome and 6.3 million (80%) of the reads were mapped to the target SNP. The average lead depth was 751 and the median lead depth was 396.

実験11
1つの実験では、3つの母系の血漿試料を5つの均等な部分に分割し、各部分を、2,400個の多重化プライマー(4つの部分)または1,200個の多重化プライマー(1つの部分)のいずれかを使用して増幅し、合計10,800個のプライマーについて、セミネステッドプロトコールを使用して増幅した。増幅した後、配列決定するために該部分を一緒にプールした。実験11の詳細は実験9と非常に類似しており、例外は、ネスティングプロトコール、およびスプリットアンドプール手法であった。集団内の21個の染色体の全てについて、倍数性コールは正確にコールされ、信頼度は、信頼度83%でコールが上手く行かなかった1つ以外は99.7%を超えた。340万のリードが標的のSNPにマッピングされ、平均のリード深度は404であり、リード深度の中央値は258であった。
Experiment 11
In one experiment, three maternal plasma samples were divided into five even portions, each portion being divided into 2,400 multiplexed primers (4 moieties) or 1,200 multiplexed primers (1). Amplification was performed using any of the moieties (partial), and a total of 10,800 primers were amplified using a semi-nested protocol. After amplification, the moieties were pooled together for sequencing. The details of Experiment 11 were very similar to Experiment 9, with the exception of the nesting protocol and the split-and-pool method. For all 21 chromosomes in the population, polyploid call was called correctly and confidence was over 99.7% except for one with a confidence of 83% and one that did not work. 3.4 million leads were mapped to the target SNP, with an average lead depth of 404 and a median lead depth of 258.

実験12
1つの実験では、4つの母系の血漿試料を、4つの均等な部分に分割し、各部分を、2,400個の多重化プライマーを使用して増幅し、合計9,600個のプライマーについて、セミネステッドプロトコールを使用して増幅した。増幅した後、配列決定するために該部分を一緒にプールした。実験12の詳細は実験9と非常に類似しており、例外は、ネスティングプロトコール、およびスプリットアンドプール手法であった。集団内の28個の染色体全てについての倍数性コールは正確にコールされ、信頼度は、信頼度78%でコールが上手く行かなかった1つ以外は97%を超えた。450万のリードが標的のSNPにマッピングされ、平均のリード深度は535であり、リード深度の中央値は412であった。
Experiment 12
In one experiment, four maternal plasma samples were divided into four even portions, each portion amplified using 2,400 multiplexed primers for a total of 9,600 primers. Amplified using a semi-nested protocol. After amplification, the moieties were pooled together for sequencing. The details of Experiment 12 were very similar to Experiment 9, with the exception of the nesting protocol and the split-and-pool method. Ploidy calls for all 28 chromosomes in the population were accurately called, and confidence was over 97% with a confidence of 78%, except for one that did not work. 4.5 million leads were mapped to the target SNP, with an average lead depth of 535 and a median lead depth of 412.

実験13
1つの実験では、4つの母系の血漿試料を調製し、合計9,600個のプライマーについて、9,600プレックス3重ヘミネステッドプロトコールを使用して増幅した。実験12の詳細は実験9と非常に類似しており、例外は、増幅の3つのラウンドを伴うネスティングプロトコールであり;該3つのラウンドは、それぞれ15サイクルのSTA、10サイクルのSTAおよび15サイクルのSTAを伴った。集団内の28個の染色体のうち27個についての倍数性コールは正確にコールされ、信頼度は、94.6%で正確にコールされた1つ、および信頼度80.8%でコールが上手く行かなかった1つ以外は99.9%を超えた。350万のリードが標的のSNPにマッピングされ、平均のリード深度は414であり、リード深度の中央値は249であった。
Experiment 13
In one experiment, four matrilineal plasma samples were prepared and amplified using a 9,600-plex triple hemmened protocol for a total of 9,600 primers. The details of Experiment 12 are very similar to Experiment 9, with the exception of the nesting protocol with three rounds of amplification; the three rounds are 15 cycles of STA, 10 cycles of STA and 15 cycles, respectively. Accompanied by STA. Ploidy calls on 27 of the 28 chromosomes in the population were called correctly, with a confidence of 94.6%, one that was called correctly, and a confidence of 80.8%. Except for the one that did not go, it exceeded 99.9%. 3.5 million leads were mapped to the target SNP, the average lead depth was 414, and the median lead depth was 249.

実験14 1つの実験では、細胞の集合45個を、1,200プレックスセミネステッドプロトコールを使用して増幅し、配列決定し、倍数性の決定を3つの染色体において行った。この実験は、3日目の胚由来の単一細胞生検材料または5日目の胚由来の栄養外胚葉生検材料において着床前遺伝子診断を実施する条件をシミュレートすることを意図していることに留意されたい。個々の単一細胞15個および3つの細胞の集合30個を、合計45の反応のために、45個の個々の反応チューブに入れ、各反応は、ただ1つの細胞系由来の細胞を含有したが、異なる反応は異なる細胞系由来の細胞を含有した。細胞を洗浄バッファー5μl中に調製し、ARCTURUS PICOPURE溶解緩衝液(APPLIED BIOSYSTEMS)5μlを加えることによって溶解させ、56℃で20分間、95℃で10分間インキュベートした。 Experiment 14 In one experiment, 45 cell aggregates were amplified and sequenced using a 1,200-plex seminested protocol, and ploidy determinations were made on three chromosomes. This experiment is intended to simulate the conditions under which preimplantation genetic diagnosis is performed in day 3 embryo-derived single cell biopsy material or day 5 embryo-derived ectodermal germ layer biopsy material. Please note that there is. Fifteen individual single cells and thirty aggregates of three cells were placed in 45 individual reaction tubes for a total of 45 reactions, each reaction containing cells from only one cell line. However, different reactions contained cells from different cell lines. Cells were prepared in 5 μl of wash buffer, lysed by adding 5 μl of ARCTURED BIOSYSTEMS, and incubated at 56 ° C for 20 minutes and 95 ° C for 10 minutes.

単一の細胞/3つの細胞のDNAを、1200個の標的特異的フォワードプライマーおよびタグを付けたリバースプライマーを50nMのプライマー濃度を使用して、25サイクルのSTAを用いて増幅した(最初のポリメラーゼ活性化のために95℃で10分間、次いで95℃で30秒間;72℃で10秒間;65℃で1分間;60℃で8分間;65℃で3分間および72℃で30秒間;を25サイクル、および72℃で2分間の最終の伸長)。 DNA from a single cell / 3 cells was amplified with 1200 target-specific forward and tagged reverse primers using a primer concentration of 50 nM using 25 cycles of STA (first polymerase). 25 ° C for 10 minutes at 95 ° C, then 95 ° C for 30 seconds; 72 ° C for 10 seconds; 65 ° C for 1 minute; 60 ° C for 8 minutes; 65 ° C for 3 minutes and 72 ° C for 30 seconds; Cycle, and final elongation for 2 minutes at 72 ° C.).

セミネステッドPCRプロトコールは、1000nMの濃度のリバースタグ特異的プライマー、および、それぞれ60nMの濃度の400個の標的特異的ネステッドフォワードプライマーを使用したSTAの20サイクル(最初のポリメラーゼ活性化のために95℃で10分間、次いで95℃で30秒間;65℃で1分間;60℃で5分間;65℃で5分間および72℃で30秒間;を15サイクル、および72℃で2分間の最終の伸長)にわたる、第1のSTA産物の希釈物の3つの並行した第2の増幅を伴った。したがって、3つの並行400プレックス反応では、第1のSTAにおいて増幅された合計1200個の標的が増幅された。 The semi-nested PCR protocol consists of 20 cycles of STA (95 ° C. for initial polymerase activation) using reverse tag-specific primers at a concentration of 1000 nM and 400 target-specific nested forward primers at a concentration of 60 nM each. 10 minutes, then 95 ° C. for 30 seconds; 65 ° C. for 1 minute; 60 ° C. for 5 minutes; 65 ° C. for 5 minutes and 72 ° C. for 30 seconds; 15 cycles, and 72 ° C. for 2 minutes final elongation). Along with three parallel second amplifications of the dilution of the first STA product. Therefore, in the three parallel 400-plex reactions, a total of 1200 targets amplified in the first STA were amplified.

次いで、STA産物の一定分量を、標準のPCRによって、1μMのタグ特異的なフォワードプライマーおよびバーコードを付けたリバースプライマーを用いて15サイクルにわたって増幅し、バーコードを付けた配列決定ライブラリーを生成した。各ライブラリーの一定分量を異なるバーコードのライブラリーと混合し、スピンカラムを使用して精製した。 An aliquot of STA product was then amplified by standard PCR over 15 cycles with 1 μM tag-specific forward and barcoded reverse primers to generate a barcoded sequencing library. did. A fixed amount of each library was mixed with libraries of different barcodes and purified using a spin column.

このように、単一細胞反応において1,200個のプライマーを使用した;プライマーは、第1染色体、第21染色体およびX染色体上に見いだされるSNPを標的とするように設計した。次いで、増幅産物について、ILLUMINA GAIIXシーケンサーを用いて配列決定した。試料当たりおよそ390万のリードがシーケンサーによって生成され、5000億~8000億のリードがゲノムにマッピングされた(試料当たりの全てのリードの74%~94%)。 Thus, 1,200 primers were used in the single cell reaction; the primers were designed to target SNPs found on chromosomes 1, 21 and X. The amplified product was then sequenced using the ILLUMINA GAIIX sequencer. Approximately 3.9 million reads per sample were generated by the sequencer and 500-800 billion reads were mapped to the genome (74% -94% of all reads per sample).

細胞系由来の関連性のある母系のゲノムDNA試料および父系のゲノムDNA試料を、同じセミネステッド1200プレックスアッセイプールを使用して、同様のプロトコールを用い、より少ないサイクルおよび1200プレックスの第2のSTAを用いて解析し、配列決定した。 Relevant maternal and paternal genomic DNA samples from the cell line, using the same semi-nested 1200-plex assay pool, using similar protocols, with fewer cycles and a second STA of 1200 plexes. Was analyzed and sequenced.

配列決定データを、本明細書に開示されているインフォマティクス方法を用いて解析し、試料について3つの染色体において倍数性の状態をコールした。 Sequencing data was analyzed using the informatics methods disclosed herein to call the haploid state on three chromosomes for the sample.

図24は、6つの試料について、3つの染色体(1=第1染色体;2=第21染色体;3=X染色体)における正規化されたリード深度の比(垂直方向の軸)を示す。比は、その染色体にマッピングされるリード数と等しくなるように設定し、正規化し、それぞれが3つの46XY細胞を含む3つのウェルにわたって平均した、その染色体にマッピングされるリード数で割った。46XY反応に対応する3つのデータ点の集合は、1:1の比を有することが予測される。47XX+21細胞に対応する3つのデータ点の集合は、第1染色体については1:1、第21染色体については1.5:1、およびX染色体については2:1の比を有することが予測される。 FIG. 24 shows the ratio of normalized read depths (vertical axis) on three chromosomes (1 = chromosome 1; 2 = chromosome 21; 3 = chromosome X) for the six samples. The ratio was set to be equal to the number of reads mapped to that chromosome, normalized and divided by the number of reads mapped to that chromosome, each averaging over 3 wells containing 3 46XY cells. The set of three data points corresponding to the 46XY reaction is expected to have a 1: 1 ratio. The set of three data points corresponding to 47XX + 21 cells is expected to have a ratio of 1: 1 for chromosome 1, 1.5: 1 for chromosome 21, and 2: 1 for chromosome X. ..

図25は、3つの反応に関して3つの染色体(1、21、X)についてプロットした対立遺伝子の比を示す。左下の反応は、3つの46XY細胞における反応を示す。左側の領域は第1染色体についての対立遺伝子の比であり、中央の領域は第21染色体についての対立遺伝子の比であり、右側の領域はX染色体についての対立遺伝子の比である。46XY細胞に関して、第1染色体については、SNP遺伝子型AA、ABおよびBBに対応する1、0.5および0の比が認められることが予想される。46XY細胞に関して、第21染色体については、SNP遺伝子型AA、ABおよびBBに対応する1、0.5および0の比が認められることが予想される。46XY細胞に関して、X染色体については、SNP遺伝子型A、およびBに対応する1および0の比が認められることが予想される。右下の反応は、3つの47XX+21細胞における反応を示す。対立遺伝子の比は、左下のグラフの場合と同様に染色体によって分離される。47XX+21細胞に関して、第1染色体については、SNP遺伝子型AA、ABおよびBBに対応する1、0.5および0の比が認められることが予想される。47XX+21細胞に関して、第21染色体については、SNP遺伝子型AAA、AAB、ABBおよびBBBに対応する1、0.67、0.33および0の比が認められることが予想される。47XX+21細胞に関して、X染色体については、SNP遺伝子型AA、AB、およびBBに対応する1、0.5および0の比が認められることが予想される。右上のプロットは、47XX+21細胞系由来のゲノムDNAを1ng含む反応に対して行われた。図26は、図25と同じグラフを示すが、ただ1つの細胞に対して実施された反応についてのものである。左側のグラフは、47XX+21細胞を含有する反応についてのグラフであり、右側のグラフは46XX細胞を含有する反応についてのグラフであった。 FIG. 25 shows the ratio of alleles plotted for three chromosomes (1, 21, X) for the three reactions. The reaction in the lower left shows the reaction in three 46XY cells. The region on the left is the allele ratio for chromosome 1, the central region is the allele ratio for chromosome 21, and the region on the right is the allele ratio for chromosome X. For 46XY cells, it is expected that for chromosome 1, ratios of 1, 0.5 and 0 corresponding to SNP genotypes AA, AB and BB will be observed. For 46XY cells, it is expected that for chromosome 21, ratios of 1, 0.5 and 0 corresponding to SNP genotypes AA, AB and BB will be observed. For 46XY cells, it is expected that for the X chromosome, ratios of 1 and 0 corresponding to SNP genotypes A and B will be observed. The reaction in the lower right shows the reaction in three 47XX + 21 cells. Allele ratios are separated by chromosome as in the lower left graph. For 47XX + 21 cells, it is expected that for chromosome 1, ratios of 1, 0.5 and 0 corresponding to SNP genotypes AA, AB and BB will be observed. For 47XX + 21 cells, it is expected that for chromosome 21, ratios of 1,0.67, 0.33 and 0 corresponding to SNP genotypes AAA, AAA, ABB and BBB will be observed. For 47XX + 21 cells, for the X chromosome, ratios of 1, 0.5 and 0 corresponding to SNP genotypes AA, AB, and BB are expected. The upper right plot was made for a reaction containing 1 ng of genomic DNA from the 47XX + 21 cell line. FIG. 26 shows the same graph as in FIG. 25, but for a reaction performed on only one cell. The graph on the left was a graph for a reaction containing 47XX + 21 cells, and the graph on the right was a graph for a reaction containing 46XX cells.

図25および図26に示されているグラフから、1および0の比が認められることが予想される染色体については点のクラスターが2つあること、1、0.5、および0の比が認められることが予想される染色体については点のクラスターが3つあること、および1、0.67、0.33および0の比が認められることが予想される染色体については点のクラスターが4つあることが視覚的に明白である。parental supportアルゴリズムにより、45反応全ての3つの染色体の全てについて正確なコールを行うことができた。 From the graphs shown in FIGS. 25 and 26, there are two clusters of dots for chromosomes for which a ratio of 1 and 0 is expected to be observed, and a ratio of 1, 0.5, and 0 is observed. There are 3 point clusters for chromosomes that are expected to be, and 4 point clusters for chromosomes that are expected to have ratios of 1, 0.67, 0.33 and 0. Is visually clear. The partial support algorithm allowed accurate calls to all three chromosomes in all 45 reactions.

実験15
1つの実験では、母系の血漿試料を調製し、ヘミネステッド19,488プレックスプロトコールを使用して増幅した。試料を以下のように調製した:母系の血液最大20mLを遠心分離して、バフィーコートおよび血漿を単離した。母系試料のゲノムDNAをバフィーコートから調製し、父系のDNAを血液試料または唾液試料から調製した。母系の血漿中の無細胞DNAを、QIAGEN CIRCULATING NUCLEIC ACIDキットを使用して単離し、TE緩衝液50μLで製造者の指示に従って溶出した。ユニバーサルライゲーションアダプタを、精製された血漿DNA40μLの各分子の末端に付加し、ライブラリーを、アダプタ特異的プライマーを使用して9サイクルにわたって増幅した。ライブラリーを、AGENCOURT AMPUREビーズを使用して精製し、50μlのでDNA懸濁緩衝液で溶出した。
Experiment 15
In one experiment, maternal plasma samples were prepared and amplified using the Heminestized 19,488 plex protocol. Samples were prepared as follows: Up to 20 mL of maternal blood was centrifuged to isolate the buffy coat and plasma. Genomic DNA of maternal samples was prepared from buffy coats and paternal DNA was prepared from blood or saliva samples. Cell-free DNA in maternal plasma was isolated using the QIAGEN CIRCULATING nucleoIC ACID kit and eluted with 50 μL of TE buffer according to the manufacturer's instructions. A universal ligation adapter was added to the end of each molecule of 40 μL of purified plasma DNA and the library was amplified over 9 cycles using adapter-specific primers. The library was purified using AGECOURT AMPURE beads and eluted with 50 μl DNA suspension buffer.

19,488個の標的特異的タグを付けたリバースプライマーのプライマー濃度7.5nMおよび1つのライブラリーアダプタ特異的フォワードプライマーの500nMを使用し、15サイクルのSTAR1を用いて、6μlのDNAを増幅した(最初のポリメラーゼ活性化のために95℃で10分間、次いで、96℃で30秒間;65℃で1分間;58℃で6分間;60℃で8分間;65℃で4分間および72℃で30秒間;を15サイクル、および72℃で2分間の最終の伸長)。 6 μl of DNA was amplified using 15 cycles of STAR1 using a primer concentration of 7.5 nM for the reverse primer with 19,488 target-specific tags and 500 nM for one library adapter-specific forward primer. (For the first polymerase activation at 95 ° C. for 10 minutes, then at 96 ° C. for 30 seconds; 65 ° C. for 1 minute; 58 ° C. for 6 minutes; 60 ° C. for 8 minutes; 65 ° C. for 4 minutes and 72 ° C. 30 seconds; 15 cycles, and final elongation at 72 ° C. for 2 minutes).

ヘミネステッドPCRプロトコールは、第1のSTAR1産物の希釈物の、1000nMのリバースタグ濃度、および19,488個の標的特異的フォワードプライマーのそれぞれについて20nMの濃度を用いた15サイクル(STAR2)の第2の増幅を伴った(最初のポリメラーゼ活性化のために95℃で10分間、次いで95℃で30秒間;65℃で1分間;60℃で5分間;65℃で5分間および72℃で30秒間;の15サイクル、および72℃で2分間の最終の伸長)。 The heminated PCR protocol is a second of 15 cycles (STAR2) with a dilution of the first STAR1 product, a reverse tag concentration of 1000 nM, and a concentration of 20 nM for each of the 19,488 target-specific forward primers. With amplification (for the first polymerase activation at 95 ° C. for 10 minutes, then at 95 ° C. for 30 seconds; 65 ° C. for 1 minute; 60 ° C. for 5 minutes; 65 ° C. for 5 minutes and 72 ° C. for 30 seconds; 15 cycles, and final elongation at 72 ° C. for 2 minutes).

次いで、STAR2産物の一定分量を、標準のPCRによって、1μMのタグ特異的なフォワードプライマーおよびバーコードを付けたリバースプライマーを用いて12サイクルにわたって増幅し、バーコードを付けた配列決定ライブラリーを生成した。各ライブラリーの一定分量を異なるバーコードのライブラリーと混合し、スピンカラムを使用して精製した。 An aliquot of STAR2 product was then amplified by standard PCR over 12 cycles with 1 μM tag-specific forward and barcoded reverse primers to generate a barcoded sequencing library. did. A fixed amount of each library was mixed with libraries of different barcodes and purified using a spin column.

このように、単一ウェル反応において19,488個のプライマーを使用した。プライマーは、第1染色体、第2染色体、第13染色体、第18染色体、第21染色体、X染色体およびY染色体上に認められるSNPを標的とするように設計した。次いで、増幅産物について、ILLUMINA GAIIXシーケンサーを用いて配列決定した。血漿試料に対し、およそ1000万のリードがシーケンサーによって生成され、940~960万のリードがゲノムにマッピングされ(94~96%)、それらのうち、99.95%が標的のSNPにマッピングされ、平均のリード深度は460であり、リード深度の中央値は350であった。比較のために計算してみると、完全に均等な分布は、1000万リード/19,488個の標的=513リード/標的となる。プライマー二量体に対しては、30,000リード(シーケンサーにより生成されたリードの0.3%)が配列決定されたプライマー二量体由来であった。ゲノム試料に対しては、99.4~99.7%のリードがゲノムにマップされ、この内の99.99%が標的SNPにマップされ、シーケンサーにより生成されたリードの0.1%がプライマー二量体であった。 Thus, 19,488 primers were used in the single-well reaction. Primers were designed to target SNPs found on chromosomes 1, 2, 13, 13, 18, 21, 21, X and Y. The amplified product was then sequenced using the ILLUMINA GAIIX sequencer. For plasma samples, approximately 10 million reads are generated by the sequencer, 9.4-9.6 million reads are mapped to the genome (94-96%), of which 99.95% are mapped to the target SNP. The average lead depth was 460 and the median lead depth was 350. Calculated for comparison, a perfectly even distribution is 10 million reads / 19,488 targets = 513 reads / targets. For the primer dimer, 30,000 reads (0.3% of the reads generated by the sequencer) were derived from the sequenced primer dimer. For genomic samples, 99.4-99.7% of the reads are mapped to the genome, 99.99% of which is mapped to the target SNP, and 0.1% of the reads generated by the sequencer are primers. It was a dimer.

1000万シークエンシングリードの血漿試料に対しては、通常、少なくとも19,488個の標的SNPの内の19,350個(99.3%)が増幅および配列決定される。200万シークエンシングリードのDNA試料に対しては、通常、少なくとも19,000標的SNP(97.5%)が増幅および配列決定される。数字が小さいのは、ランダムサンプリングノイズに起因する可能性がある。理由は、リード数が小さく、シーケンサーが一部の増幅産物を見逃すためである。必要があれば、シークエンシングリード数を多くして、増幅および配列決定される標的SNPの数を増やすことができる。 For plasma samples of 10 million sequencing reads, 19,350 (99.3%) of at least 19,488 target SNPs are typically amplified and sequenced. For DNA samples of 2 million sequencing reads, at least 19,000 target SNPs (97.5%) are typically amplified and sequenced. The small numbers may be due to random sampling noise. The reason is that the number of reads is small and the sequencer misses some amplification products. If necessary, the number of sequencing reads can be increased to increase the number of targeted SNPs to be amplified and sequenced.

関連性のある母系および父系ゲノムDNA試料を、STAR1中の7.5nMのセミネステッド19,488外側フォワードプライマーおよびタグ付加リバースプライマーを使って増幅した。サーモサイクリング条件およびSTAR2の組成、およびバーコーディングPCRはヘミネステッドプロトコールについてのものと同じであった。 Relevant maternal and paternal genomic DNA samples were amplified using 7.5 nM semi-nested 19,488 outer forward and tagged reverse primers in STAR1. The thermocycling conditions, the composition of STAR2, and the barcoding PCR were the same as for the heminated protocol.

407個の試料に対する平均胎児画分は、14.8%であることが明らかになった。配列決定データを本明細書で開示のインフォマティクス法を使って解析し、407個の母系血漿試料の378個中にDNAが存在していた胎児の4個の染色体(13、18、21、Y)、および407個の母系血漿試料の375個中の染色体Xの倍数性状態をコールした。集団内の1,887個の染色体全てについての倍数性コールは正確にコールされ、信頼度は90%を超えた。1887コールの内の1882は、95%を超える信頼度であり、1,887コールの内の1,862は99%を超える信頼度であった。 The average fetal fraction for 407 samples was found to be 14.8%. Sequencing data was analyzed using the informatics method disclosed herein and the four chromosomes of the fetal (13, 18, 21, Y) in which DNA was present in 378 of the 407 maternal plasma samples. , And the ploidy state of chromosome X in 375 of the 407 maternal plasma samples. Ploidy calls for all 1,887 chromosomes in the population were accurately called and confidence exceeded 90%. Of the 1887 calls, 1882 had a confidence of over 95%, and of the 1,887 calls, 1,862 had a confidence of over 99%.

血漿から抽出したDNAの代わりに水を使って、血漿PCRプロトコールにより類似の対照実験を行った。6種のこのような試行実験では、5~6%の配列決定リードがプライマー二量体であった。他の配列決定リードは、バックグラウンドノイズによるものであった。この実験は、プライマーがハイブリダイズする標的遺伝子座を有する核酸試料が存在しない場合であっても、(他のプライマーにハイブリダイズして増幅プライマー二量体が形成されないで)少量のプライマー二量体が形成されることを示す。 A similar control experiment was performed by plasma PCR protocol using water instead of DNA extracted from plasma. In 6 such trial experiments, 5-6% of the sequencing leads were primer dimers. The other arranging leads were due to background noise. In this experiment, a small amount of primer dimer (without hybridizing to other primers to form an amplified primer dimer) even in the absence of a nucleic acid sample with a target locus with which the primer hybridizes. Is formed.

実験16
次の実験は、本発明のいずれかの多重PCR法で使うことができるプライマーライブラリーの代表的設計および選択方法を示す。目的は、ただ1回の反応で大量の標的遺伝子座(または標的遺伝子座のサブセット)を同時に増幅するために使用できるプライマーを初期の候補プライマーライブラリーから選択することである。初期の候補標的遺伝子座集合に対しては、それぞれの標的遺伝子座に対するプライマーを設計または選択する必要はない。できるだけ多くの望ましい標的遺伝子座に対しプライマーが設計、選択されるの好ましい。
Experiment 16
The following experiments show a representative design and selection method of a primer library that can be used in any of the multiplex PCR methods of the invention. The goal is to select from the initial candidate primer library a primer that can be used to simultaneously amplify large numbers of target loci (or subsets of target loci) in a single reaction. For early candidate target locus sets, it is not necessary to design or select primers for each target locus. It is preferred that primers be designed and selected for as many desirable target loci as possible.

ステップ1
候補標的遺伝子座(例えば、SNP)の集合を、標的遺伝子座の望ましいパラメータ例えば、標的集団内のSNP頻度またはSNPのヘテロ接合率(ncbi.nlm.nih.gov/projects/SNP/のworldwide web;Sherry ST,Ward MH,Kholodov M,et al.dbSNP:遺伝的変異のNCBIデータベース、Nucleic Acids Res.2001 Jan 1;29(1):308-11。これらのそれぞれは、参照によりその全体が本明細書に組み込まれる)に関する公的に入手可能な情報に基づいて選択した。それぞれの候補遺伝子座に対し、Primer3プログラム(primer3.sourceforge.netのworldwide web;libprimer3 release 2.2.3。これらは、参照によりその全体が本明細書に組み込まれる)を使って、1個または複数個のPCRプライマー対が設計された。特定の標的遺伝子座のPCRプライマーに対する実行可能な設計が存在しなかった場合は、その標的遺伝子座をその後の検討から除外した。
Step 1
A set of candidate target loci (eg, SNPs) can be referred to as the desired parameter of the target loci, eg, SNP frequency within the target population or the heterozygous rate of SNPs (ncbi.nlm.nih.gov/projects/SNP/worldweb; Shery ST, Ward MH, Khorodov M, et al. DBSNP: NCBI Database of Genetic Variations, Nucleic Acids Res. 2001 Jan 1; 29 (1): 308-11. Selected based on publicly available information about (included in the book). For each candidate locus, one or one using the Primer3 program (worldwide web of primer3.sourceforge.net; libprimer3 release 22.3, which are incorporated herein by reference in their entirety). Multiple PCR primer pairs have been designed. If there was no viable design for the PCR primer for a particular target locus, that target locus was excluded from further review.

必要に応じ、ほとんど、または全ての標的遺伝子座に対し「標的遺伝子座スコア」(高いスコアは、高い望ましさを表す)、例えば、種々の標的遺伝子座に望ましいパラメータの加重平均をベースにして計算した標的遺伝子座スコアを計算してもよい。パラメータは、プライマーが使われる特定の用途に対するそれらの重要性に応じて異なる加重を割り付けることができる。代表的パラメータには、標的遺伝子座のヘテロ接合率、標的遺伝子座の配列(例えば、多型)に関連する有病率、標的遺伝子座の配列(例えば、多型)に関連する疾患浸透度、標的遺伝子座の増幅に使われる候補プライマーの特異性、標的遺伝子座の増幅に使われる候補プライマーのサイズ、および標的増幅産物のサイズが含まれる。 Calculated based on "target locus score" (high score represents high desirability), eg, weighted average of desirable parameters for various target loci, as needed for almost or all target loci The target locus score may be calculated. The parameters can be assigned different weights depending on their importance to the particular application in which the primer is used. Typical parameters include heterozygosity of the target locus, prevalence associated with the sequence of the target locus (eg, polymorphism), disease penetration associated with the sequence of the target locus (eg, polymorphism), Includes the specificity of the candidate primer used to amplify the target locus, the size of the candidate primer used to amplify the target locus, and the size of the target amplification product.

ステップ2
それぞれのプライマーと、ステップ1からの全てのその他の標的遺伝子座に対する全てのプライマーとの間で熱力学的相互作用スコアを計算した(例えば、Allawi,H.T.& SantaLucia,J.,Jr.(1998),「Thermodynamics of Internal C-T Mismatches in DNA」,Nucleic Acids Res.26,2694-2701;Peyret,N.,Seneviratne,P.A.,Allawi,H.T.& SantaLucia,J.,Jr.(1999),「Nearest-Neighbor Thermodynamics and NMR of DNA Sequences with Internal A-A,C-C,G-G,and T-T Mismatches」,Biochemistry 38,3468-3477;Allawi,H.T.& SantaLucia,J.,Jr.(1998),「Nearest-Neighbor Thermodynamics of Internal A-C Mismatches in DNA:Sequence Dependence and pH Effects),Biochemistry 37,9435-9444.;Allawi,H.T.& SantaLucia,J.,Jr.(1998),「Nearest Neighbor Thermodynamic Parameters for Internal G-A Mismatches in DNA」,Biochemistry 37,2170-2179;およびAllawi,H.T.& SantaLucia,J.,Jr.(1997),「Thermodynamics and NMR of Internal G-T Mismatches in DNA」,Biochemistry 36,10581-10594;MultiPLX2.1(Kaplinski L,Andreson R,Puurand T,Remm M.MultiPLX:automatic grouping and evaluation of PCR primers.Bioinformatics.2005 Apr 15;21(8):1701-2、を参照。これらの文献は参照によりその全体が本明細書に組み込まれる)。このステップは、相互作用スコアの2D行列を生成する。相互作用スコアにより、2個の相互作用プライマーを含むプライマー二量体の尤度を予測した。スコアは、下式のように計算された:
相互作用_スコア=max(-deltaG_2,0.8*(-deltaG_1))
式中、
deltaG_2=PCRにより両端で伸長可能な、すなわち、それぞれのプライマーの3’末端が他のプライマーにアニールする二量体に対するギブズエネルギー(二量体を破断するのに要するエネルギー);および
deltaG_1=少なくとも一端でPCRにより伸長可能な二量体に対するギブズエネルギー、である。
Step 2
Thermodynamic interaction scores were calculated between each primer and all primers for all other target loci from step 1 (eg, Allawi, HT & SantaLucia, J., Jr. (1998), "Thermodys of International C-T Mismatches in DNA", Nucleic Acids Res. 26, 2694-2701; Peyret, N., Seneviratne, PA, Allawi, H. Jr. (1999), "Nearest-Neigbor Thermodynamics and NMR of DNA Sequences with Internal A-A, CC, GG, and T-T Missitches, Bioche. & SantaLucia, J., Jr. (1998), "Nearest-Neigbor Thermodynamics of International AC Mismatches in DNA: Sequence Depensence J., Jr. (1998), "Nearest Negativer Thermodynamic Parameters for International GA Mismatches in DNA", Biochemistry 37, 2170-2179; and Allawi, H. et al. T. & Santa Lucia, J. Santa. , Jr. (1997), "Thermodynamics and NMR of International GT Missatures in DNA", Biochemistry 36, 10581-10594; MultiPLX2.1 (Kaplinski L, Andoleson R, Puru) Bioinformatics. 2005 Apr 15; 21 (8): 1701-2, all of which are incorporated herein by reference). This step produces a 2D matrix of interaction scores. The interaction score predicted the likelihood of a primer dimer containing two interaction primers. The score was calculated as follows:
Interaction_score = max (-deltaG_2,0.8 * (-deltaG_1))
During the ceremony
deltaG_1 = Gibbs energy for a dimer where the 3'end of each primer anneals to the other primer (energy required to break the dimer); and deltaG_1 = at least one end Gibbs energy for a dimer that can be extended by PCR in.

ステップ3:
それぞれの標的遺伝子座に対し、2個以上のプライマー対設計が存在する場合、下記の方法を使って1個の設計が選択される:
1 遺伝子座のそれぞれのプライマー対設計に対し、その設計の2個のプライマーおよびその他の全ての標的遺伝子座に対する全ての設計による全てのプライマーに対し、最悪の(最高の)相互作用スコアを見つける。
2 最悪相互作用スコア中で最良の(最低の)スコアを有する設計を選択する。
Step 3:
If there are more than one primer pair design for each target locus, one design is selected using the method below:
Find the worst (highest) interaction score for each primer pair design of one locus, for the two primers of that design and for all primers of all designs for all other target loci.
2 Select the design with the best (lowest) score among the worst interaction scores.

ステップ4
それぞれのノードが1個の遺伝子座およびその関連するプライマー対設計(例えば、最大クリーク問題)を表すようにグラフが構築された。それぞれのノード対間に1個のエッジをを形成した。それぞれのエッジに、エッジにより連結された2つのノードに関連するプライマーの内の最悪の(最高の)相互作用スコアに等しい加重を割り付けた。
Step 4
The graph was constructed so that each node represents one locus and its associated primer pair design (eg, the maximum creek problem). One edge was formed between each node pair. Each edge was assigned a weight equal to the worst (highest) interaction score of the primers associated with the two nodes linked by the edge.

ステップ5
必要に応じ、1つの設計による1個のプライマーと、別の設計による1個のプライマーが重複する標的領域にアニールすると思われる2個の異なる標的遺伝子座の全ての設計対に対して、2個の設計に対するノード間に追加のエッジを加えた。これらのエッジの加重を、ステップ4で割りつけられた最高加重と同じに設定した。従って、ステップ5は、重複する標的領域にアニールし、従って、多重PCR反応中に相互に干渉すると思われるプライマーがライブラリーに含まれるのを防ぐ。
Step 5
If necessary, one primer from one design and one primer from another design for all design pairs of two different target loci that are likely to anneal to overlapping target regions. Added an additional edge between the nodes for the design of. The weights of these edges were set to be the same as the maximum weights assigned in step 4. Therefore, step 5 anneals to overlapping target regions and thus prevents the library from including primers that may interfere with each other during the multiplex PCR reaction.

ステップ6
初期の相互作用スコア閾値は、次式で計算された:
加重_閾値=max(エッジ_加重)-0.05*(max(エッジ_加重)-min(エッジ_加重))
式中、
max(エッジ_加重)は、グラフ中の最大エッジ加重であり、
min(エッジ_加重)は、グラフ中の最小エッジ加重である。
閾値の開始点は、下記のように設定された:
max_加重_閾値=max(エッジ_加重)
min_加重_閾値=min(エッジ_加重)
Step 6
The initial interaction score threshold was calculated by:
Weight_threshold = max (edge_weight) -0.05 * (max (edge_weight) -min (edge_weight))
During the ceremony
max (edge_weight) is the maximum edge weight in the graph.
min (edge_weight) is the minimum edge weight in the graph.
The starting point of the threshold was set as follows:
max_weighted_threshold = max (edge_weighted)
min_weighted_threshold = min (edge_weighted)

ステップ7
加重_閾値を超える加重のエッジのみを有し、ステップ5のグラフと同じ設定のノードからなる新規グラフを構築した。従って、このステップは、加重_閾値以下のスコアの相互作用を無視している。
Step 7
A new graph was constructed with only weighted edges that exceed the weighted_threshold value and consisting of nodes with the same settings as the graph in step 5. Therefore, this step ignores the interaction of scores below the weighted _threshold.

ステップ8
残存エッジが無くなるまで、ノード(および除去されたノードに連結された全てのエッジ)をステップ7のフラグから除去した。それぞれ以下の手順を反復適用して、ノードを除去した:
1 最高角度の(最高数のエッジを持つ)ノードを見つける。2個以上ある場合は、任意の1個を選択する。
2 上記で選択したノードからなるノードおよびそれに連結した全てのノードの集合を定める(但し、上記で選択したものより小さい角度のノードは除く)。
3 ステップ1由来の最小標的遺伝子座スコア(より小さいスコアは、より低い望ましさを表す)を有する集合からノードを選択する。そのノードをグラフから除去する。
Step 8
Nodes (and all edges attached to the removed node) were removed from the flag in step 7 until there were no remaining edges. Each of the following steps was iteratively applied to remove the node:
1 Find the node with the highest angle (with the highest number of edges). If there are two or more, select any one.
2 Define a set of nodes consisting of the nodes selected above and all the nodes connected to them (excluding nodes with angles smaller than those selected above).
3 Select a node from the set with the lowest target locus score from Step 1 (a smaller score represents lower desirability). Remove that node from the graph.

ステップ9
グラフに残っているノードの数が多重PCRプール用として必要な標的遺伝子の数を満たす場合は(許容可能な誤差内で)、前記方法をステップ10で継続した。
Step 9
If the number of nodes remaining in the graph meets the number of target genes required for the multiplex PCR pool (within acceptable error), the method was continued in step 10.

グラフに残っているのが多すぎるか、または少なすぎる場合は、二分探索を行って何の閾値がグラフ中に残っている望ましい数のノードを生成したかを判定した。グラフ中に多すぎるノードがあった場合、加重閾値境界を下式のように調節した:
max_加重_閾値=加重_閾値
そうでない場合(グラフ中に少なすぎるノードしかない場合)、加重閾値境界を下式のように調節した:
min_加重_閾値=加重_閾値
次に、加重閾値を下式のように調節した:
加重_閾値=(max_加重_閾値+min_加重_閾値)/2
ステップ7~9を繰り返した。
If there was too much or too little left in the graph, a binary search was performed to determine what threshold generated the desired number of nodes remaining in the graph. If there were too many nodes in the graph, the weighted threshold boundaries were adjusted as shown below:
max_weight_threshold = weighted_threshold If not (if there are too few nodes in the graph), the weighted threshold boundary is adjusted as shown below:
min_weighted_threshold = weighted_threshold value Next, the weighted threshold was adjusted as shown in the following equation:
Weighted_threshold = (max_weighted_threshold value + min_weighted_threshold value) / 2
Steps 7-9 were repeated.

ステップ10
グラフ中に残っているノードに関連するプライマー対設計をプライマーライブラリー用に選択した。このプライマーライブラリーを本発明のいずれかの方法で使用できる。
Step 10
The primer pair design associated with the remaining nodes in the graph was selected for the primer library. This primer library can be used by any of the methods of the invention.

必要に応じ、このプライマー設計および選択方法は、1個のみのプライマー(プライマー対ではなく)が標的遺伝子座の増幅に使用されるプライマーライブラリーに対しても実行できる。この場合には、ノードは、(プライマー対ではなく)1個のプライマー当たりの標的遺伝子座を示す。 If desired, this primer design and selection method can also be performed on primer libraries where only one primer (rather than a primer pair) is used to amplify the target locus. In this case, the node indicates the target locus per primer (rather than the primer pair).

実験17
図27は、本発明の方法を使って設計された2種のプライマーライブラリーを比較するグラフである。このグラフは、それぞれのプライマーライブラリーの標的となる特定のマイナー対立遺伝子頻度を有する遺伝子座の数を示す。「新規プール」ライブラリーの選択中、より多くのプライマーが保持された。このライブラリーは、より多くの標的遺伝子座、特に、より多くの比較的大きなマイナー対立遺伝子頻度を有する標的遺伝子座(これは、本発明の一部の方法、例えば、胎児の染色体異常の検出に対しより高い情報価値のある対立遺伝子である)の増幅を可能とする。
Experiment 17
FIG. 27 is a graph comparing two primer libraries designed using the method of the invention. This graph shows the number of loci with a particular minor allele frequency targeted by each primer library. More primers were retained during the selection of the "new pool" library. This library contains more target loci, especially target loci with more relatively large minor allelic frequencies, for some methods of the invention, eg, detection of fetal chromosomal abnormalities. On the other hand, it enables amplification of alleles with higher information value).

これらのプライマーライブラリーを次の多重PCR法で使用した。血液(20~40mL)をそれぞれの対象から2個~4個のCELL-FREE(商標)DNAチューブ(Streck)中に採取した。血漿(最低限7mL)を、2,000gで20分間、続けて3,220gで30分間の二重遠心分離プロトコールによりそれぞれの試料から単離し、第1回目の遠心分離後に上清を移した。QIAGEN QIAamp Circulating Nucleic Acidキットを使ってcfDNAを7~20mLの血漿から単離し、45uLのTE緩衝剤で溶出した。純母系ゲノムDNAを第1回目の遠心分離後に得られたバフィーコートから単離し、純父系ゲノムDNAを血液,唾液または頬側試料から同様にして調製した。 These primer libraries were used in the following multiplex PCR method. Blood (20-40 mL) was collected from each subject into 2-4 CELL-FREE ™ DNA tubes (Streck). Plasma (minimum 7 mL) was isolated from each sample by a double centrifugation protocol at 2,000 g for 20 minutes followed by 3,220 g for 30 minutes and the supernatant was transferred after the first centrifugation. CfDNA was isolated from 7-20 mL plasma using the QIAGEN QIAamp Circulating Nucleic Acid kit and eluted with 45 uL of TE buffer. Pure maternal genomic DNA was isolated from the buffy coat obtained after the first centrifugation and pure paternal genomic DNA was similarly prepared from blood, saliva or buccal samples.

11,000標的特異的アッセイを使って、母系cfDNA、母系ゲノムDNA、および父系ゲノムDNA試料を15サイクル前増幅し、一定分量をネステッドプライマーを使った15サイクルの第2のPCR反応に移した。最終的に、第3の12サイクルラウンドのPCRでバーコード化タグを付加することにより試料をシークエンシング用に調製した。従って、1回の反応で11,000標的を増幅し、標的は、13、18、21、X、およびY染色体上に認められるSNPを含んでいた。その後、ILLUMINA GAIIxまたはHISEQシーケンサーを使って増幅産物を配列決定した。胎児の遺伝子型より浅いリード深度(cfDNAのリード深度の約20%)で親の遺伝子型を配列決定した。 Using the 11,000 target-specific assay, maternal cfDNA, maternal genomic DNA, and paternal genomic DNA samples were pre-amplified 15 cycles and aliquots were transferred to a 15-cycle second PCR reaction using nested primers. Finally, samples were prepared for sequencing by adding barcoded tags in a third 12-cycle round of PCR. Therefore, one reaction amplified 11,000 targets, which contained SNPs found on the 13, 18, 21, X, and Y chromosomes. The amplification products were then sequenced using an ILLUMINA GAIIx or HISEQ sequencer. Parental genotypes were sequenced at a read depth shallower than the fetal genotype (about 20% of the cfDNA read depth).

実験18
必要に応じ、標準的な方法、例えば、Agilent Technologies 2100 Bioanalyzer(図28A-M)を使ってPCR産物のサイズと量を分析できる。例えば、2,400プレックス(図28B-28G)および19,488プレックス実験(図28H~28M)に本明細書で記載のネスティングなしの直接PCR法を使用した。図28B~28Dと28H~28J用のプライマーの量は10nMであった。図28E~28Gと28K~28Mのプライマーの量は1nMであった。図28B、28E、28H、および28Kでは、入力DNAの量は24ng;図28C、28F、28I、および28Lでは、80ng;ならびに、図28D、28G、28J、および28Mでは250ngであった。より多くの入力DNAでは、より大きな比率の所望の180塩基対産物が生成した。140塩基対の位置のピークは、プライマー二量体産物である。
Experiment 18
If desired, standard methods such as Agilent Technologies 2100 Bioanalyzer (FIG. 28A-M) can be used to analyze the size and quantity of PCR products. For example, the direct PCR method without nesting described herein was used for 2,400 plexes (FIGS. 28B-28G) and 19,488 plex experiments (FIGS. 28H-28M). The amounts of primers for FIGS. 28B-28D and 28H-28J were 10 nM. The amounts of primers in FIGS. 28E-28G and 28K-28M were 1 nM. At FIGS. 28B, 28E, 28H, and 28K, the amount of input DNA was 24 ng; at FIGS. 28C, 28F, 28I, and 28L, 80 ng; and at FIGS. 28D, 28G, 28J, and 28M, 250 ng. With more input DNA, a larger proportion of the desired 180 base pair products was produced. The peak at the 140 base pair position is the primer dimer product.

実験19
原理証明調査は、全染色体にわたり等しく高い正確度でのT13,T18,T21,45,X,および47,XXYの検出を実証した。
Experiment 19
Principle proof studies have demonstrated the detection of T13, T18, T21, 45, X, and 47, XXY with equal high accuracy across all chromosomes.

患者
地域法に準じて施設内審査委員会により承認されたプロトコールに基づいて、妊娠中の夫婦を特殊出生前ケアセンター(specific prenatal care center)に登録した。選択規準は、少なくとも18才の年令、少なくとも9週間の妊娠期間、単胎妊娠、およびインフォームドコンセントへのサインであった。血液試料を妊娠中の母親から採取し、血液または頬側試料を父親から集めた。2例のT13(パトー症候群)を有する妊娠、2例のT18(エドワーズ症候群)を有する妊娠、2例のT21(ダウン症候群)を有する妊娠、2例の45,Xを有する妊娠、2例の47,XXYを有する妊娠、および90例の正常妊娠、由来の試料を、試験前に約500人の女性のコホートから選択し、その方法がどの染色体異常を検出するかを試験した。誕生後の子供組織が入手可能な場合、その試料に対し、正常胎児の核型を分子核型分析により確認した。低リスク女性の侵襲的検査の前に正倍数体試料を採取した。正倍数体試料を、侵襲的検査後少なくとも7日間採取し、別々の研究所での細胞遺伝学的核型分析または蛍光インサイツハイブリダイゼーションにより異数性を確認した。
Pregnant couples were enrolled in a special prenatal care center based on a protocol approved by the Institutional Review Board in accordance with the Patient Region Act. The selection criteria were at least 18 years of age, a gestation period of at least 9 weeks, a single pregnancy, and a sign of informed consent. Blood samples were taken from the pregnant mother and blood or buccal samples were collected from the father. 2 pregnancies with T13 (Pateau syndrome), 2 pregnancies with T18 (Edwards syndrome), 2 pregnancies with T21 (Down syndrome), 2 pregnancies with 45, X, 2 cases 47 Pregnancy with XXY, and 90 normal pregnancies, were selected from a cohort of approximately 500 women prior to the test to test which chromosomal abnormality the method would detect. If postnatal child tissue was available, the karyotype of the normal fetus was confirmed by molecular karyotype analysis on the sample. Positive polyploid samples were taken prior to invasive testing of low-risk women. Positive polyploid samples were taken for at least 7 days after invasive testing and confirmed aneuploidy by cytogenetic karyotyping or fluorescent insights hybridization in separate laboratories.

試料調製および多重PCR
図30A~E、30G、30H、および31A-31G中のデータに対しては、実験15で記載のように試料調製および19,488プレックスPCRを行った。図30F中のデータに関しては、実験17で記載のように試料調製および11,000プレックスPCRを行った。
Sample preparation and multiplex PCR
For the data in FIGS. 30A-E, 30G, 30H, and 31A-31G, sample preparation and 19,488 plex PCR were performed as described in Experiment 15. For the data in FIG. 30F, sample preparation and 11,000 plex PCR were performed as described in Experiment 17.

方法およびデータ解析
アルゴリズムは、親の遺伝子型および乗換え頻度データ(例えば、ハップマップデータベース由来のデータ)を考慮して、極めて多数の可能な胎児の倍数性状態、および、種々の胎児のcfDNA画分に対する19,488多形遺伝子座での予測される対立遺伝子分布を計算する(図29A~29C)。対立遺伝子比に基づく方法と異なり、アルゴリズムは、連鎖不平衡も考慮に入れ、非ガウス分布データモデルを使って、観察プラットフォーム特性および増幅の偏りを有するSNPに対する対立遺伝子測定の予測分布を示す。その後、アルゴリズムは、種々の予測対立遺伝子分布を、cfDNA試料で測定した実際の対立遺伝子分布と比較し(図29C)、配列決定データに基づいてそれぞれの仮説(モノソミー,ダイソミー,またはトリソミー、これらに対しては、種々の可能な乗換えに基づいて多くの仮説が存在する)の尤度を計算する。アルゴリズムは、それぞれの個別のモノソミー,ダイソミー,またはトリソミー仮説の尤度を合計し(図29D)、コピー数および胎児画分として最大合計尤度を有する倍数性状態をコールする(図29E)。研究室の研究者は、試料核型に対し盲検方式ではなかったが、アルゴリズムは、ヒトの介入なしに倍数性状態をコールするので、真実に対し盲検性が維持されている。
Methods and data analysis algorithms take into account parental genotype and transfer frequency data (eg, data from the Hapmap database), a large number of possible fetal multiple states, and various fetal cfDNA fractions. The predicted allelic distribution at the 19,488 polymorphic locus for is calculated (FIGS. 29A-29C). Unlike methods based on allelic ratios, the algorithm also takes into account linkage disequilibrium and uses a non-Gaussian distribution data model to show the predicted distribution of allelic measurements for SNPs with observation platform characteristics and amplification bias. The algorithm then compares the various predicted allele distributions to the actual allele distribution measured on the cfDNA sample (Fig. 29C) and based on the sequencing data to each hypothesis (monosomy, disomy, or trisomy, these). For that, there are many hypotheses based on various possible transfers). The algorithm sums the likelihoods of each individual monosomy, disomy, or trisomy hypothesis (FIG. 29D) and calls a ploidy state with maximum total likelihood as a copy count and fetal fraction (FIG. 29E). Lab researchers were not blind to the sample karyotype, but the algorithm calls the ploidy state without human intervention, so it remains blind to the truth.

データの解釈
生成データのグラフ表示
対象染色体の倍数性状態を決定するために、アルゴリズムは、染色体当たり3,000~4,000個のSNP位置のそれぞれの2個の可能な対立遺伝子の配列数の分布を考慮する。アルゴリズムは、可視化には役立たない手法を使って倍数性コールを行うことに留意することは重要である。従って、説明のために、本明細書では、データは単純化された方式で、AとBとして標識される2個の最も可能性のある対立遺伝子の比率として示され、それにより、関連する傾向がより容易に可視化できる。この単純化図示は、アルゴリズムの一部の特徴を考慮していない。例えば、対立遺伝子比率を提示する可視化の方法では説明できない2つの重要なアルゴリズムの側面は、1)連鎖不平衡、すなわち、1個のSNPでの測定が隣接するSNPの可能な固有の特性に与える影響を活用する能力、および、2)プラットフォーム特性および増幅偏りを有するSNPに対する予測される対立遺伝子測定値の分布を説明する非ガウス分布データモデルの使用である。また、アルゴリズムは、それぞれのSNP位置で2つの、最も頻度の高い対立遺伝子を考慮するのみで、他の可能な対立遺伝子を無視することにも留意されたい。
Interpretation of data Graph display of generated data To determine the ploidy state of the target chromosome, the algorithm is based on the number of sequences of two possible alleles at each of the 3,000 to 4,000 SNP positions per chromosome. Consider the distribution. It is important to note that the algorithm makes ploidic calls using techniques that are not useful for visualization. Therefore, for illustration purposes, the data are presented herein in a simplified manner as the ratio of the two most probable alleles labeled as A and B, thereby tending to be related. Can be visualized more easily. This simplified illustration does not take into account some features of the algorithm. For example, two important aspects of the algorithm that cannot be explained by the method of visualization that presents allele ratios are: 1) Linkage disequilibrium, that is, measurements at one SNP give possible unique properties of adjacent SNPs. The use of a non-Gaussian distribution data model to explain the ability to harness the effects and 2) the distribution of predicted allelic measurements for SNPs with platform characteristics and amplification bias. It should also be noted that the algorithm only considers the two most frequent alleles at each SNP position and ignores the other possible alleles.

図30A~30Hのグラフ表示は、2個、1個、または3個の胎児染色体が存在する試料を含む。通常、これらは、正倍数性(図30A~30C)、モノソミー(図30D)、およびトリソミー(図30E~30H)をそれぞれ示す。全てのプロットで、それぞれのスポットは、単一SNPを示し、標的SNPは、1個の染色体に対し左から右へ水平軸に沿って順次プロットされる。垂直軸は、A対立遺伝子に対するリード数を、そのSNPに対するAとB両方の対立遺伝子の合計リード数に対する比率として示す。測定は、母系血液から単離された合計cfDNAに対し行われ、cfDNAは、母系と胎児両方のcfDNAを含み、従って、それぞれのスポットは、そのSNPに対する胎児と母系DNAの寄与の組み合わせを表すことに留意されたい。従って、母系cfDNAの0%~100%の比率の増加は、いくつかのスポットを、母系と胎児の遺伝子型に応じてプロット内で徐々にに上下に移動させることになるであろう。 The graphs of FIGS. 30A-30H include samples with 2, 1, or 3 fetal chromosomes. Usually, they show positive ploidy (FIGS. 30A-30C), monosomy (FIGS. 30D), and trisomy (FIGS. 30E-30H), respectively. In all plots, each spot represents a single SNP, and the target SNPs are plotted sequentially along the horizontal axis from left to right for a single chromosome. The vertical axis shows the number of reads for the A allele as the ratio of the total number of reads for both A and B alleles to the SNP. Measurements are made on total cfDNA isolated from maternal blood, cfDNA containing both maternal and fetal cfDNA, so each spot represents a combination of fetal and maternal DNA contributions to that SNP. Please note. Therefore, an increase in the proportion of maternal cfDNA from 0% to 100% will gradually move some spots up and down in the plot depending on the genotype of the maternal and fetal.

可視化を容易にすることが必要な場合には、母系遺伝子型はそれぞれのスポットの局在化に多く寄与し、大部分のトリソミーは、母系遺伝であるため、母系遺伝子型に応じてスポットを色分けでき、これは倍数性状態の可視化に有用である。具体的には、母系遺伝子型がAAであるSNPは、赤色で示すことができ、母系遺伝子型がABであるSNPは緑色で示すことができ、母系遺伝子型がBBであるSNPは青色で示すことができる。 Where visualization needs to be facilitated, maternal genotypes contribute significantly to the localization of each spot, and most trisomy is maternally inherited, so spots are color-coded according to maternal genotype. It can, which is useful for visualization of ploidic states. Specifically, SNPs with a maternal genotype of AA can be shown in red, SNPs with a maternal genotype of AB can be shown in green, and SNPs with a maternal genotype of BB are shown in blue. be able to.

全てのケースで、A対立遺伝子に対し母親と胎児の両方由来のホモ接合(AA)であるSNPは、B対立遺伝子が存在しないはずのためA対立遺伝子リード比率が高いので、プロットの上限にぴったりと張り付いているのが認められる。逆に、B対立遺伝子に対し母親と胎児の両方由来のホモ接合であるSNPは、B対立遺伝子のみが存在するはずなのでA対立遺伝子リード比率が小さいために、プロットの下限にぴったりと張り付いているのが認められる。プロットの上限にも下限にもぴったりと張り付かないスポットは、母親、胎児、または両方がヘテロ接合であるSNPを示す。これらのスポットは、胎児の倍数性を特定するのに有用であるが、父系対母系遺伝の判定に対し情報価値のある場合もある。これらのスポットは、母系と胎児の遺伝子型および胎児画分の両方に基づいて分離し、従って、それぞれのy軸に沿った個別のスポットの詳細な位置は、化学量論および胎児画分の両方に依存する。例えば、母がAAで胎児がABである遺伝子座は、異なるA対立遺伝子リード比率を有し、従って、胎児画分に応じてy軸に沿った異なる位置を取ると予測される。 In all cases, SNPs that are homozygous (AA) from both the mother and the fetus to the A allele have a high A allele read ratio because the B allele should not be present, which is perfect for the upper limit of the plot. It is recognized that it is stuck. Conversely, SNPs that are homozygous for both the mother and fetus to the B allele should stick to the lower end of the plot because the A allele read ratio is small because only the B allele should be present. It is admitted that there is. Spots that do not stick to the upper and lower bounds of the plot indicate SNPs that are heterozygous for the mother, fetus, or both. While these spots are useful in identifying fetal ploidy, they can also be informative for determining paternal vs. maternal inheritance. These spots are separated based on both maternal and fetal genotypes and fetal fractions, so the detailed location of individual spots along each y-axis is both stoichiometric and fetal fractions. Depends on. For example, loci in which the mother is AA and the fetus is AB have different A allele read ratios and are therefore expected to take different positions along the y-axis depending on the fetal fraction.

2個の染色体の存在
図30A~30Cは、試料が完全に母系の場合(胎児のcfDNAが存在しない場合:図30A)、中程度の胎児のcfDNA画分を含む場合(図30B)、または高い胎児のcfDNA画分を含む場合(図30C)の2個の染色体の存在を示すデータである。
Presence of Two Chromosomes Figures 30A-30C show when the sample is completely maternal (no fetal cfDNA: FIG. 30A), contains a medium fetal cfDNA fraction (FIG. 30B), or is high. Data showing the presence of two chromosomes when the fetal cfDNA fraction is included (FIG. 30C).

図30Aは、非妊婦の血液から単離したcfDNAから得たデータを示す。胎児のcfDNAが存在せず、試料が母系cfDNAのみを含む場合、プロットは、純粋に正倍数体母系遺伝子型を表し、ホールマークパターンは、スポットの「クラスター」を含み、赤色クラスターがプロットの上端にぴったりと張り付いており(母系遺伝子型がAAであるSNP)、青色クラスターがプロットの下端にぴったりと張り付いており(母系遺伝子型がBBであるSNP)、さらに、単一の緑色クラスターが中央に存在する(母系遺伝子型がABであるSNP)(図では色を示さず)。 FIG. 30A shows data obtained from cfDNA isolated from the blood of non-pregnant women. If there is no fetal cfDNA and the sample contains only maternal cfDNA, the plot represents purely single nucleotide polymorphism, the whole mark pattern contains spot "clusters" and the red cluster is at the top of the plot. (SNPs with maternal genotype AA), blue clusters snugly attached to the bottom edge of the plot (SNPs with maternal genotype BB), and a single green cluster Centrally located (SNPs with maternal genotype AB) (not shown in color).

胎児のcfDNAが存在する場合は、スポットの位置は、クラスターが離散的「バンド」に分離するように移動する。0%の胎児画分の試料に対して、ひとまとまりのスポットは、「クラスター」と呼ばれ(図30Aのように)、また、0%を超える胎児画分の全ての試料に対しては、ひとまとまりのスポットは、「バンド」(図30B~30Jのように)と呼ばれることに留意されたい。胎児画分が十分大きい場合、これらの離散的バンドは、容易に目視可能となろう。具体的には、図30Bと30Cは、中程度および高い胎児画分がそれぞれ存在する2個の胎児染色体に関連する特徴的パターンを示す。このパターンは、母親中でヘテロ接合であるSNPに対応する3つの中央緑色バンド、および母親中でホモ接合であるSNPに対応するそれぞれプロットの上端(赤)および下端(青)の両方にある2つの「周辺」バンドを含む(図では色を示さず)。 If fetal cfDNA is present, the spot location shifts so that the clusters separate into discrete "bands". For a sample of 0% fetal fraction, a group of spots is called a "cluster" (as in Figure 30A) and for all samples of a fetal fraction greater than 0%. It should be noted that a group of spots is called a "band" (as in FIGS. 30B-30J). If the fetal fraction is large enough, these discrete bands will be readily visible. Specifically, FIGS. 30B and 30C show characteristic patterns associated with two fetal chromosomes, each with a medium and high fetal fraction. This pattern is located at both the top (red) and bottom (blue) plots corresponding to the heterozygous SNPs in the mother and the homozygous SNPs in the mother, respectively. Includes two "peripheral" bands (not shown in color in the figure).

図30Bは、正倍数体胎児保有女性由来で、12%胎児のcfDNA画分を含む血漿試料から単離したcfDNA由来のデータを示す。ここで、プロットの上端および下端にぴったり張り付いたスポットのクラスターは、それぞれ:プロットの上端または下端にぴったり張り付いたまま残っている1つの赤色および1つの青色外側周辺バンド、ならびにプロットの端部から離れた1つの赤色および1つの青色内側周辺バンド、の2つの離散的バンドに分離する(図では色を示さず)。これらの0.92と0.08近傍を中心とする内側周辺バンドは、母系遺伝子型がAAで胎児の遺伝子型がAB(赤色で示す)であるSNP、および母系遺伝子型がBBで胎児の遺伝子型がABであるSNP(青色で示す)をそれぞれ表す。緑色のスポットの中央クラスターは広がっているが、この胎児画分では、明確なバンドへの分離は容易には視認できない。 FIG. 30B shows data from cfDNA derived from a plasma sample containing a 12% fetal cfDNA fraction from a female carrying a positive polyploid fetus. Here, the clusters of spots that stick tightly to the top and bottom of the plot are: one red and one blue outer peripheral band that remains tightly stuck to the top or bottom of the plot, as well as the edge of the plot. Separated into two discrete bands, one red and one blue inner peripheral band away from (color not shown in the figure). These inner peripheral bands centered around 0.92 and 0.08 are SNPs with a maternal genotype of AA and a fetal genotype of AB (shown in red), and a fetal gene with a maternal genotype of BB. Represents SNPs (shown in blue) of type AB, respectively. The central cluster of green spots is widespread, but in this fetal fraction, the separation into clear bands is not readily visible.

高い胎児のcfDNA画分では、2個の染色体の存在を示す典型的パターン(3組の緑色のバンド、ならびに2つの赤色および2つの青色周辺バンド)が容易に見てとれる(図では色を示さず)。図30Cは、26%の胎児のcfDNA画分の場合の、正倍数体胎児を保有する女性由来の血漿試料から得たデータを示す。ここで、周辺バンドは、増加した胎児のcfDNA画分由来の変化したB対立遺伝子のレベルに起因して、内側バンドが分離してプロットの中心部へ向かって移動する。高い胎児画分で中央の緑色クラスターの3つの別々のバンドへの分離は、この時点でかなり容易に見てとれるのは意義深いことである。この中央の3組のバンドは、この場合、0.37、0.50および0.63近傍にクラスター化し、母系遺伝子型がABで、それぞれ、胎児の遺伝子型がBB(下部)、AB(中央)およびAA(上部)であるSNPに対応する。 In the high fetal cfDNA fraction, a typical pattern showing the presence of two chromosomes (three sets of green bands, and two red and two blue peripheral bands) is readily visible (colors shown in the figure). figure). FIG. 30C shows data obtained from a plasma sample from a female carrying a positive polyploid fetus for a 26% fetal cfDNA fraction. Here, the peripheral band separates the inner band and moves towards the center of the plot due to the altered level of the B allele from the increased fetal cfDNA fraction. It is significant that the separation of the central green cluster into three separate bands in the high fetal fraction is fairly easily visible at this point. The three central bands are clustered near 0.37, 0.50 and 0.63 in this case, with the maternal genotype AB and the fetal genotypes BB (bottom) and AB (center), respectively. ) And SNPs that are AA (upper).

これらのホールマークパターン、すなわち、3つの緑色バンドおよび四つの周辺バンド(2つの赤色および2つの青色)は、常染色体正倍数性の場合、または女性(XX)胎児中のX染色体の場合のように、2個の染色体の存在を示す。 These whole mark patterns, namely the three green bands and the four peripheral bands (two red and two blue), are as in the case of autosomal positive polyploidy or the X chromosome in a female (XX) fetus. Shows the existence of two chromosomes.

1個の染色体の存在
胎児が単一染色体のみを受け継ぎ、従って、単一の対立遺伝子のみを受け継ぐ場合、胎児のヘテロ接合性は、不可能である。従って、唯一の可能な胎児のSNPの識別情報は、AまたはBである。従って、母系遺伝モノソミー染色体は、母親がヘテロ接合であるSNPを示す2つの中央緑色バンド、および母親がホモ接合であるSNPを示し、プロットの上端および下端にぴったり張り付いたまま残っているそれぞれ唯一の赤色および青色周辺バンド(1と0のリード比率)(図30D)(図では色を示さず)の特徴的パターンを有する。内側周辺バンドが存在しないことに留意されたい。このパターンは、母系遺伝常染色体モノソミーの場合、または男性(XY)胎児のX染色体の場合のように、1個の染色体の存在を示す。
Existence of One Chromosome If the fetus inherits only a single chromosome and therefore only a single allele, then fetal heterozygosity is not possible. Therefore, the only possible fetal SNP identification information is A or B. Thus, the maternally inherited monosomy chromosome is the only one that remains tightly attached to the top and bottom of the plot, showing two central green bands showing the mother's heterozygous SNP and the mother's homozygous SNP, respectively. Has a characteristic pattern of red and blue peripheral bands (lead ratios of 1 and 0) (FIG. 30D) (colors not shown in the figure). Note that there is no inner peripheral band. This pattern indicates the presence of a single chromosome, as in the case of maternally inherited autosomal monosomy or the X chromosome of a male (XY) fetus.

3個の染色体の存在
トリソミー染色体は、3つの特徴的パターンを有する。第1のパターンは、母系遺伝減数分裂トリソミー(減数分裂エラー)を示し、胎児は相同性の、同一でない2個の染色体を母親から受け継いでいる(図30E)。このパターンは、それぞれ2つの赤色および青色周辺バンドを有する2つの中央緑色バンドを含む(図では色を示さず)。第2のパターンは、父親から受け継いでいる減数分裂トリソミーを示し、胎児は、2個の相同性の、同一でない父親由来染色体を受け継いでいる(図30F)。このパターンは、4つの中央緑色バンドおよびそれぞれ3つの赤色および青色周辺バンドを含む(図では色を示さず)。第3のパターンは、母親から(図30G)または父親から受け継いでいる(図30H)有糸分裂トリソミー(有糸分裂エラー)を示し、胎児は、2個の同一の母親または父親由来の染色体を受け継いでいる。このパターンは、それぞれ2つずつ赤色および青色周辺バンドを有する4つの中央緑色バンド含む。母親からおよび父親から受け継いだ有糸分裂トリソミーは、赤色および青色バンドに隣接した配置により識別できる。父親から受け継いでいる有糸分裂トリソミーでは、赤色および青色内側周辺バンド(プロットの端に張り付いていないバンド)が中央により近くなる(図では色を示さず)。これは、同一染色体の父系寄与が原因である。我々の以前の結果から、卵割球段階で、66.7%の母系遺伝トリソミーが減数分裂であり、10.2%のトリソミーのみが父系遺伝であることが示されることに留意されたい。
Existence of 3 Chromosomes Trisomy chromosomes have 3 characteristic patterns. The first pattern shows maternally inherited meiotic trisomy (meiotic error) in which the fetus inherits two homologous, non-identical chromosomes from the mother (Fig. 30E). This pattern contains two central green bands, each with two red and blue peripheral bands (colors not shown in the figure). The second pattern shows meiotic trisomy inherited from the father, where the fetus inherits two homologous, non-identical father-derived chromosomes (Fig. 30F). This pattern contains four central green bands and three red and blue peripheral bands, respectively (colors not shown in the figure). The third pattern shows mitotic trisomy (mitotic error) inherited from the mother (Fig. 30G) or father (Fig. 30H), where the fetus has two identical mother or father-derived chromosomes. It is inherited. This pattern contains four central green bands, each with two red and two blue peripheral bands. Mitotic trisomy inherited from the mother and father can be identified by the placement adjacent to the red and blue bands. In the mitotic trisomy inherited from the father, the red and blue medial peripheral bands (bands not attached to the edges of the plot) are closer to the center (color not shown in the figure). This is due to the paternal contribution of the same chromosome. Note that our previous results show that at the cleavage stage, 66.7% of maternal trisomy is meiotic and only 10.2% of trisomy is paternally inherited.

Y染色体に関しては、PS法は、別々の仮説セット:ゼロ個、1個、または2個の染色体の存在を考慮している。それぞれの遺伝子座でのシーケンスリードに母系の寄与が無い場合、ヘテロ接合遺伝子座は可能ではないので(2個のY染色体のケースは、必ず2個の同一染色体を含む)、バンドは、プロットの上端(A対立遺伝子)または下端(B対立遺伝子)にぴったり張り付いたまま残り(データは図示せず)、解析は極めて単純となり、定量的対立遺伝子数データに依存する。前記方法はSNPを調べるので、Y染色体由来の相同非組換え型SNPを使用し、従って、1個のプローブ対に対してXとYの両方上のデータを取得することに留意されたい。 For the Y chromosome, the PS method considers the existence of a separate hypothesis set: zero, one, or two chromosomes. If there is no maternal contribution to the sequence reads at each locus, heterozygous loci are not possible (two Y chromosome cases always contain two identical chromosomes), so the band is in the plot. It remains tightly attached to the upper end (A allogeneic gene) or the lower end (B alligator gene) (data not shown), making the analysis extremely simple and dependent on quantitative alligator number data. Note that since the method examines the SNP, a homologous non-recombinant SNP derived from the Y chromosome is used, thus obtaining data on both X and Y for a single probe pair.

異数性の特定
上述のように、このプロットベース可視化法を使った常染色体異数性の特定は、直接的に十分な胎児画分が与えられ、異常な数の染色体が存在するプロットを特定することが必要でなだけである。XとY染色体のコピー数の情報を合計することにより、性染色体異数性が存在するか否かが特定される。具体的には、47,XXX遺伝子型を有する胎児を表すプロットは、典型的な「3染色体」パターンを有し、47,XXY遺伝子型を有する胎児を表すプロットは、X染色体に対し典型的な「2染色体」パターンを有するが、また、1個のY染色体の存在を示す対立遺伝子リードも有する。同様に、前記方法は、47,XYYをコールすることもでき、この場合、「1染色体」パターンは、単一X染色体の存在を示し、また、対立遺伝子リードは、2個のY染色体の存在を示す。45,X遺伝子型を有する胎児は、X染色体に対して典型的な「1染色体」パターンを有し、データは、ゼロY染色体を示す。
Identification of Aneuploidy As mentioned above, identification of autosomal aneuploidy using this plot-based visualization method directly identifies plots with sufficient fetal fractions and an abnormal number of chromosomes. You just need to do it. By summing the information on the number of copies of the X and Y chromosomes, it is possible to identify whether or not sex chromosome aneuploidy exists. Specifically, plots representing fetuses with the 47, XXX genotype have a typical "three-chromosome" pattern, and plots representing fetuses with the 47, XXY genotype are typical for the X chromosome. It has a "two-chromosome" pattern, but also has an allogeneic read indicating the presence of one Y-chromosome. Similarly, the method can also call 47, XYY, where the "chromosome" pattern indicates the presence of a single X chromosome and the allelic read is the presence of two Y chromosomes. Is shown. 45, Fetuses with the X genotype have a "chromosome 1" pattern typical for the X chromosome, and the data show a zero Y chromosome.

胎児画分の影響
上記で考察のように、胎児由来シーケンスリード数は、プロットのy軸に沿ったそれぞれのスポットの正確な位置を与える。胎児画分は、胎児および母親由来のリードの比率に影響を与えるので、それぞれのスポットの位置取りにも影響を与える。図30C~30Eおよび図30Gと30Hの胎児のcfDNAの高い比率(通常約20%)では、スポットクラスターは、主に母系遺伝子型に基づいているが、遺伝子型が母系遺伝子型と異なる対立遺伝子由来の胎児DNAの存在により、クラスターが複数の別個のバンドに変化することが容易に見てとれる。しかし、胎児画分が減少するに伴い(図30Bおよび30Fの場合のように)、スポットは、プロットの両端および中心の方に戻り、より詰まったクラスターを生じる。具体的には、母系遺伝子型がAAである赤色周辺バンドの集合は、プロットの上端の方向に戻り、母系遺伝子型がBBの青色周辺バンドの集合は、下端の方向に戻り、母親がヘテロ接合の緑色中央バンドの集合は、プロット中心部の単一クラスターに圧縮される(図30Bと30Cとを比較されたい)(図では色を示さず)。低胎児画分の場合に対しこの可視化手法を使った場合には、異数性は容易に視認できないが、アルゴリズムは、非常に小さい胎児画分、例えば、3%胎児画分の場合の倍数性状態を特定できる。統計的技術を使って所与の試料パラメータセット(例えば、コピー数、親の遺伝子型、および胎児画分、など)に対し、観察データを、対立遺伝子分布を予測する極めて正確なデータモデルと比較することにより、これが可能となる。小胎児画分の場合には、異なる倍数性状態に対する対立遺伝子分布間の差異は胎児画分に比例するので、データモデル精度が重要である。さらに、アルゴリズムは、データセットに信頼性のある胎児の倍数性決定を行うために十分なデータが含まれない場合を判定できる。
Effects of fetal fractions As discussed above, the number of fetal-derived sequence reads gives the exact position of each spot along the y-axis of the plot. Since the fetal fraction affects the proportion of fetal and maternal leads, it also affects the positioning of each spot. At high proportions of fetal cfDNA in FIGS. 30C-30E and 30G and 30H (usually about 20%), spot clusters are primarily based on the maternal genotype, but are derived from alleles whose genotype is different from the maternal genotype. It is easy to see that the presence of fetal DNA in the cluster transforms the cluster into multiple distinct bands. However, as the fetal fraction decreases (as in FIGS. 30B and 30F), the spots return towards the ends and center of the plot, producing more packed clusters. Specifically, the set of red peripheral bands with maternal genotype AA returns toward the top of the plot, the set of blue peripheral bands with maternal genotype BB returns toward the bottom, and the mother is heterozygous. The set of green center bands in is compressed into a single cluster in the center of the plot (compare FIGS. 30B and 30C) (colors not shown in the figure). Aneuploidy is not easily visible when using this visualization technique for low fetal fractions, but the algorithm is polyploidy for very small fetal fractions, eg, 3% fetal fractions. The state can be identified. Using statistical techniques to compare observational data to a highly accurate data model that predicts allelic distribution for a given sample parameter set (eg, copy count, parent genotype, and fetal fraction, etc.) This makes this possible. In the case of small fetal fractions, the accuracy of the data model is important because the differences between allelic distributions for different ploidy states are proportional to the fetal fraction. In addition, the algorithm can determine if the dataset does not contain enough data to make a reliable fetal ploidy determination.

結果
標的SNPのマッピングされたシークエンシングリードは、情報価値があると見なされ、アルゴリズムで使用された。シークエンシング結果で、95%超の標的遺伝子座が観察された。重要な倍数性コールを可視化するプロットを、図31A~31Gに示す。図31Aは、正倍数体試料を示す。ここでは、染色体13、18、および21は、典型的な「2染色体」パターン(本明細書で記載のように)を有する。これは、3組の緑色中央バンド、および2つの赤色バンドおよび2つの青色周辺バンドを含む。これは、X染色体に対する2つの緑色中央バンドおよびプロットの端部に沿ったY染色体バンドの存在と一緒に、正倍数体XY遺伝子型を示す(図では色を示さず)。
Results The mapped sequencing reads of the target SNP were considered informative and used in the algorithm. In the sequencing results, over 95% of target loci were observed. Plots that visualize significant ploidy calls are shown in FIGS. 31A-31G. FIG. 31A shows a positive polyploid sample. Here, chromosomes 13, 18, and 21 have a typical "two-chromosome" pattern (as described herein). It contains three sets of green central bands, and two red bands and two blue peripheral bands. It shows a positive polyploid XY genotype (not shown in color in the figure), along with the presence of two green central bands for the X chromosome and a Y chromosome band along the edge of the plot.

最も一般的な常染色体トリソミーのT13、T18、およびT21は、図31B、31C、および31D中のプロットでそれぞれ示されている。具体的には、図31Bは、T13試料を示す。ここで、染色体18と21は典型的な「2染色体」パターンを示し、染色体Xは典型的な「1染色体」パターンを示し、Y染色体由来のリードが存在する。全体で、これは、染色体18および21でダイソミーを示し、胎児のXY遺伝子型を識別する。しかし、具体的には、染色体13は、典型的な「3染色体」パターンを示す。同様に、図31CはT18試料を示し、図31DはT21試料を示す。 The most common autosomal trisomy T13, T18, and T21 are shown in plots in FIGS. 31B, 31C, and 31D, respectively. Specifically, FIG. 31B shows a T13 sample. Here, chromosomes 18 and 21 show a typical "two-chromosome" pattern, chromosome X shows a typical "one-chromosome" pattern, and there are reads from the Y chromosome. Overall, it shows disomy on chromosomes 18 and 21 and identifies the fetal XY genotype. However, specifically, chromosome 13 exhibits a typical "three-chromosome" pattern. Similarly, FIG. 31C shows a T18 sample and FIG. 31D shows a T21 sample.

また、前記方法は、45,X(図31E),47,XXY(図31F),および47,XYY(図31G)を含む性染色体異数性を検出することができる。前記方法は、染色体13、18、21、X、およびYでのコピー数をコールしており、全体の染色体数は、残っている染色体にダイソミーを仮定して報告されていることに留意されたい。プロットの45、X試料を示すX染色体領域は、単一染色体の存在を示す。しかし、染色体13、18、および21に対する「2染色体」パターンに加えて、Y染色体由来のリードの欠如は、45,X遺伝子型を指し示す。逆に、47,XXY試料は、2X染色体の存在を示すプロットを生成する。また、データは、Y染色体由来の対立遺伝子のリードを示した。染色体13、18、および21の2コピーに加えて、これは、47,XXY遺伝子型を指し示す。47,XYY遺伝子型は、X染色体に対する「1染色体」パターン、および2個のY染色体の存在を表すリードの存在により示される。 The method can also detect sex chromosome aneuploidy, including 45, X (FIG. 31E), 47, XYY (FIG. 31F), and 47, XYY (FIG. 31G). Note that the method calls the number of copies on chromosomes 13, 18, 21, X, and Y, and the total number of chromosomes is reported assuming a disomy on the remaining chromosomes. .. 45 of the plot, the X chromosome region showing the X sample, indicates the presence of a single chromosome. However, in addition to the "two-chromosome" pattern for chromosomes 13, 18, and 21, the lack of reads from the Y chromosome points to the 45, X genotype. Conversely, the 47, XXY sample produces a plot showing the presence of the 2X chromosome. The data also showed reads for alleles from the Y chromosome. In addition to the two copies of chromosomes 13, 18, and 21, this points to the 47, XXY genotype. 47, XYY genotype is indicated by a "chromosome 1" pattern for the X chromosome and the presence of a read that represents the presence of two Y chromosomes.

考察
前記方法は、母系血液からT13、T18、T21、45,X、47,XXY、および47,XYYを非侵襲的に検出した。前記方法は、19,488個のSNPの標的多重PCR増幅および高スループットシークエンシングにより母系血漿からcfDNAを調べる。前記方法は、胎児画分およびDNA品質を含む親の遺伝子型情報および多くの試料パラメータを考慮に入れる前記方法の高度インフォマティクス解析と組み合わせて、より確実に胎児の前兆を検出し、7種の最も良く見られるタイプの出生時異数性(T13、T18、T21、45,X、47,XXX、47,XXY、および47,XYY)に関連する5個の染色体の全てで高度に正確な倍数性コールを行う。前記方法は、以前の方法に比べて、顕著に大きな臨床的適用範囲および高い試料特異的計算精度(個別化されたリスクスコアと同様に)などの多くの臨床的利点を提供する。
Discussion The above method non-invasively detected T13, T18, T21, 45, X, 47, XYY, and 47, XYY from maternal blood. The method examines cfDNA from maternal plasma by targeted multiplex PCR amplification and high throughput sequencing of 19,488 SNPs. The method, in combination with the advanced informatics analysis of the method, which takes into account parental genotype information including fetal fraction and DNA quality and many sample parameters, more reliably detects fetal precursors and is the most of the seven species. Highly accurate polyploidy on all five chromosomes associated with the common types of birth aneuploidy (T13, T18, T21, 45, X, 47, XXX, 47, XYY, and 47, XYY). Make a call. The method offers many clinical advantages such as significantly greater clinical coverage and higher sample-specific computational accuracy (as well as individualized risk scores) over previous methods.

臨床的適用範囲の拡大
常染色体トリソミーおよび性染色体異数性を正確に検出する能力を考慮すれば、前記方法は、臨床的に利用可能なNIPT法に比べて異数性適用範囲を2倍程度増加させる。本明細書で提示された方法は、性染色体の倍数性を高正確度でコールする非侵襲的検査に過ぎない。以前のDNA混合実験および我々の実験的アッセイで解析された別の血漿試料は、前記方法により47,XXXを含むより大きな性染色体異常コホートを検出できることを示唆している。また、本明細書で提示の方法により、染色体13、18、および21の異数性を高感度および高特異性で検出でき、また、適切なプライマー設計を行えば、残りの染色体でも同様にコピー数を検出できることが期待される。
Expanding clinical scope Considering the ability to accurately detect autosomal trisomy and sex chromosome aneuploidy, the method is about twice as wide as the clinically available NIPT method. increase. The method presented herein is merely a non-invasive test that calls the ploidy of the sex chromosomes with high accuracy. Previous plasma mixing experiments and another plasma sample analyzed in our experimental assay suggest that the method can detect a larger sex chromosome aberration cohort containing 47,XXX. In addition, the methods presented herein can detect aneuploidies of chromosomes 13, 18, and 21 with high sensitivity and specificity, and with appropriate primer design, copy the rest of the chromosomes as well. It is expected that the number can be detected.

試料特異的精度の計算
特に意味があるのは、前記方法がそれぞれの試料中のそれぞれの染色体の倍数性コールに関する試料特異的正確度を計算することである。前記方法で計算された正確度は、低い正確度の検定結果を生じる可能性のある悪い品質のDNAまたは低胎児画分を有する個別試料を特定し、印を付けることにより、間違ったコールの比率を大きく低減させることが期待される。対照的に、大規模ショットガンシークエンシング(MPSS)に基づく方法は、単一仮説棄却検定を使ったポジティブまたはネガティブコールを行い、それらの正確度推定は、個別試料の特徴ではなく、公表された調査コホートに基づいており、正確度がコホートと同じ正確度を有すると仮定されている。しかし、コホート分布の裾にあるパラメータを有する試料に対する個別の正確度は大きく異なる場合がある。早期妊娠期間の場合のような低胎児画分では、または低DNA品質の試料に対しては、この現象は悪化する。これらの試料は、通常、追跡観察用として特定およびタグ付けされず、この結果、コールが見逃される可能性がある。しかし、本発明は、胎児画分および多くのDNA品質尺度などの多くのパラメータを考慮に入れてそれぞれの染色体コピー数コールを行い、そのコールに対し試料特異的正確度を計算する。これにより、前記方法を使って、低い正確度を有する個別試料を追跡用として特定し、フラグ付加が可能となる。これにより、特に、胎児画分が通常少ない妊娠早期段階で、ほとんどのコールの見逃しがなくなることが期待される。この前提は、コールの無い場合には単に再採血と再分析をすればよいので、コールの見逃しよりもコールのない方がはるかに好ましいということである。
Calculation of Sample-Specific Accuracy Of particular significance is that the method calculates the sample-specific accuracy for the ploidy call of each chromosome in each sample. The accuracy calculated by the method is the wrong call ratio by identifying and marking individual samples with poor quality DNA or low fetal fractions that may yield low accuracy test results. Is expected to be greatly reduced. In contrast, methods based on large-scale shotgun sequencing (MPSS) make positive or negative calls using a single hypothesis rejection test, and their accuracy estimates are published rather than characteristic of individual samples. It is based on a survey cohort and is assumed to have the same accuracy as the cohort. However, the individual accuracy for samples with parameters at the tail of the cohort distribution can vary widely. This phenomenon is exacerbated in low fetal fractions, such as during early pregnancy, or for samples with low DNA quality. These samples are usually not identified and tagged for follow-up, which can result in missed calls. However, the present invention makes each chromosome copy number call taking into account many parameters such as fetal fractions and many DNA quality measures, and calculates sample-specific accuracy for that call. This allows individual samples with low accuracy to be identified and flagged for tracking using the method. This is expected to ensure that most calls are not overlooked, especially in the early stages of pregnancy when the fetal fraction is usually low. The premise is that without a call is much better than missing a call, as simply rebleeding and reanalyzing in the absence of a call.

計算された正確度の従来のリスクスコアへの変換
前記方法は、高リスク妊娠女性に対する異数性のリスクの調製済みリスクを提供でき、この場合、調製済みリスクには、事前リスクが考慮されている(BennP,Cuckle H,Pergament E.Non-invasive prenatal diagnosis for Down syndrome:the paradigm will shift,but slowly. Ultrasound Obstet Gynecol 2012;39:127-130。この文献は参照によりその全体が本明細書に組み込まれる)。前記方法は、それぞれの患者に合わせた計算正確度を提供するが、臨床用途に対しては、これらの正確度を従来のリスクスコアに変化できる。これは正倍数体妊娠のリスクも意味するが、割合として表される。従来のリスクスコアは、母体年齢関連性リスクおよび血清レベルの生化学マーカーなどの種々のパラメータを考慮してリスクスコアが提供され、その値を超えると母親は高リスクと見なされ、該当する母親に対して、追跡観察のための侵襲的診断手順が薦められる。前記方法は、このリスクスコアを大幅に正確化し、従って、擬陽性および偽陰性割合の両方を減らし、個別の母系リスクのより正確な評価を与える。本明細書で使われる計算正確度は、倍数性コールが正確である尤度であり、パーセントで表されるが、実験19で使われる計算正確度は、年齢関連リスクを含まない。リスクスコアの計算は、通常、年齢関連リスクを含むために、計算正確度および従来のリスクスコアは、互換性がなく、従来のリスクスコアに変換するためにそれらを組み合わせる必要がある。年齢関連リスクを計算正確度と組み合わせる式は:

Figure 0007027468000039
であり、式中、Rは前記方法により計算したリスクスコアで、Rは第1期スクリーニング(first trimester screening)により計算したリスクスコアである。 Converting Calculated Accuracy to a Traditional Risk Score The method can provide a pre-prepared risk of heterogeneous risk for high-risk pregnant women, in which case the pre-risk is taken into account. (BennP, Cuckle H, Pergament E. Non-invasive prenatal diagnosis for Down syndrome: the paradigm will shift, but sluary. Will be incorporated). The method provides computational accuracy tailored to each patient, but for clinical use these accuracy can be changed to traditional risk scores. This also means the risk of ploidy pregnancy, but is expressed as a percentage. Traditional risk scores are provided with a risk score that takes into account various parameters such as maternal age-related risk and biochemical markers of serum levels, above which the mother is considered high risk and the appropriate mother In contrast, invasive diagnostic procedures for follow-up are recommended. The method significantly improves this risk score and thus reduces both false positive and false negative rates, giving a more accurate assessment of individual maternal risk. The computational accuracy used herein is the likelihood that the polyploid call is accurate and is expressed as a percentage, whereas the computational accuracy used in Experiment 19 does not include age-related risk. Since risk score calculations typically include age-related risks, calculation accuracy and traditional risk scores are incompatible and need to be combined to convert to traditional risk scores. The formula for combining age-related risk with computational accuracy is:
Figure 0007027468000039
In the formula, R 1 is the risk score calculated by the above method, and R 2 is the risk score calculated by the first trimester screening.

SNPベースの方法は増幅変動に関する問題を解消する
他の一部の方法により使われる計数法の固有の欠点は、参照染色体にマッピングされるリード数に対する対象染色体(例えば、染色体21)にマッピングされるリード数の比率を測定することにより胎児の倍数性状態を決定することである。染色体13、X、およびYを含む高または低GC含量の染色体の増幅で大きな変動がある。これにより、胎児のcfDNA信号と同程度の大きさの信号変動を生ずる場合があり、この結果、参照染色体由来リードに対する対象染色体由来対立遺伝子リードの比率を変えることによるコピー数コールを間違える可能性がある。これが染色体13、X、およびYに対し低い正確度を生じる場合がある。重要なのは、この問題は、早期妊娠期間で起こりやすい低胎児cfDNA割合の場合に悪化することである。
SNP-based methods solve problems with amplification variability A unique drawback of the counting method used by some other methods is that it maps to the chromosome of interest (eg, chromosome 21) for the number of reads mapped to the reference chromosome. The polymorphic state of the fetal is determined by measuring the ratio of lead numbers. There are large variations in the amplification of chromosomes with high or low GC content, including chromosomes 13, X, and Y. This can result in signal variability as large as the fetal cfDNA signal, which can result in erroneous copy count calls by changing the ratio of target chromosome-derived allele reads to reference chromosome-derived reads. be. This may result in low accuracy for chromosomes 13, X, and Y. Importantly, this problem is exacerbated in the case of low fetal cfDNA rates, which are more likely to occur during early pregnancy.

対照的に、SNPベースの方法は、染色体間の一貫性のある増幅レベルに依存せず、従って、全染色体にわたり等しい精度の結果を与えることが期待される。前記方法は、定義によりただ一個のヌクレオチドが異なる多形遺伝子座にある別の対立遺伝子の相対数を検査するといった理由から、前記方法は参照染色体の使用を必要とせず、これにより、定量化リード数に依存する方法に固有の染色体間増幅変動に関する問題を防ぐ。正倍数体の参照染色体を必要とする定量的方法とは異なり、前記方法は、三倍体性、ならびに片親性ダイソミーのようなコピー数の変化を伴わない異常を検出できることが期待される。 In contrast, SNP-based methods do not depend on consistent amplification levels between chromosomes and are therefore expected to give results of equal accuracy across all chromosomes. The method does not require the use of a reference chromosome because, by definition, only one nucleotide tests for the relative number of another allele at a different polymorphic locus, thereby quantifying leads. Prevents problems with interchromosomal amplification variability inherent in number-dependent methods. Unlike quantitative methods that require a positive polyploid reference chromosome, the method is expected to be able to detect triploid and uniparental disomy-like abnormalities that do not involve changes in copy count.

早期検出の重要性
重大なのは、性染色体異数性の複合出生有病率が、最も一般的な常染色体異数性の場合より高いことである(図32)。しかし、信頼性良く性染色体異常を検出できるルーチン非侵襲的選別法は現状存在しない。従って、性染色体異常は、通常、ダウン症候群または他の常染色体異数性用のルーチン検査の副次的効用として出生前に検出され、大部分の症例が全く見逃される。早期治療介入により臨床的転帰が改善されるこれら内の多くの障害にとって、早期の正確な検出が非常に重要である。例えば、ターナー症候群の全体複合出生有病率は、2,500人の女性に1人であるが、ターナー症候群は、青年期まで診断されない場合が多い。成長ホルモン療法は、その障害が原因の低身長を防ぐことが知られているが、4才前に開始すれば、治療は顕著に高い効果がある。さらに、エストロゲン補充療法は、ターナー症候群の患者の第二次性徴を刺激可能であるが、この場合も、症候群が通例の通り検出される前の思春期直前に治療を開始すべきである。これらは全て、早期のルーチン的で安全な性染色体異数性の検出の重要性を強調するものである。前記方法は、性染色体異常に対するルーチンスクリーニングとして役立つ可能性を秘めた最初の手法を提供する。
Importance of Early Detection Importantly, the prevalence of complex births of sex chromosome aneuploidy is higher than that of the most common autosomal aneuploidy (Fig. 32). However, there is currently no routine non-invasive selection method that can reliably detect sex chromosome abnormalities. Therefore, sex chromosome abnormalities are usually detected prenatally as a side effect of routine testing for Down's syndrome or other autosomal aneuploidies, and most cases are totally overlooked. Early accurate detection is very important for many of these disorders where early intervention improves clinical outcomes. For example, the overall prevalence of combined births of Turner syndrome is 1 in 2,500 women, but Turner syndrome is often undiagnosed until adolescence. Growth hormone therapy is known to prevent short stature due to the disorder, but if started before the age of four, the treatment will be significantly more effective. In addition, estrogen replacement therapy can stimulate secondary sexual characteristics in patients with Turner syndrome, but again, treatment should be initiated shortly before puberty, before the syndrome is usually detected. All of these underscore the importance of early, routine and safe detection of sex chromosome aneuploidy. The method provides the first method that has the potential to serve as a routine screening for sex chromosome abnormalities.

追加の用途
前記方法は、標的増幅を利用するために、超顕微鏡的異常、例えば、微小欠失および微細重複を独特な方法で検出する準備ができた状態である。MPSSのような非標的方法により、ディジョージ微小欠失症候群を検出できることが明らかにされているが、前記方法は、実行困難な手法を行うために、十分に高いレベルの遺伝子カバレッジを必要とする。
これが、非常に少ない比率のシークエンシングリードが情報価値のあると思われる場合に、超顕微鏡的領域に対して、非標的増幅で効率が数桁悪い理由である。さらに、最近利用可能な方法は、性染色体に対して倍数性状態を正確に特定することに関し問題があるという事実は、より小さい染色体セグメントに対して、それらの方法も同様に変動性増幅問題に直面していることを示唆している。
Additional Uses The method is ready to detect ultramicroscopic anomalies, such as microdeletion and microduplication, in a unique way to take advantage of target amplification. Although non-targeted methods such as MPSS have been shown to be able to detect DiGeorge microdeletion syndrome, the method requires a sufficiently high level of gene coverage to perform difficult procedures. ..
This is the reason why non-targeted amplification is orders of magnitude less efficient for the ultramicroscopic region when very low proportions of sequencing reads appear to be informative. Moreover, the fact that recently available methods have problems in accurately identifying ploidic states for sex chromosomes, for smaller chromosomal segments, those methods also pose a variability amplification problem. It suggests that you are facing.

同様に、SNPベースの方法は、計数依存の現状の非侵襲的方法または羊水穿刺のような従来の侵襲的方法および細胞遺伝学的核型分析および/または蛍光インサイチューハイブリダイゼーションに依存するCVSでは検出できない、コピー数の変化を伴わない異常であるUPD障害を検出できる。これは、臨床的に利用可能なMPSSベースの標的化方法が非多形遺伝子座を増幅し、従って、例えば、対象染色体が同じ親由来であるかどうかを判定できない一方で、SNPベースの方法が個別ハプロタイプを特異的に識別できることが理由である。このことは、これらのプラダー・ウィリ、アンジェルマン、およびベックウィズ・ヴィーデマン症候群などの微小欠失/微細重複およびUPD症候群は、通常、出生前に診断されず、出生後の初期に誤診される場合が多いことを意味する。この結果、治療介入を著しく遅らせる。さらに、前記方法がSNPを標的とするために、前記方法はまた、親のハプロタイプの再構築を促進し、個別疾患連鎖遺伝子座の胎児遺伝の検出を可能とする(Kitzman JO,Snyder MW,Ventura M,et al.Noninvasive whole-genome sequencing of a human fetus.Sci Transl Med 2012;4:137ra76、この文献は、参照によりその全体が本明細書に組み込まれる)。 Similarly, SNP-based methods are detected in current non-invasive methods that are count-dependent or conventional invasive methods such as amniocentesis and in CVS that rely on cytogenetic karyotype analysis and / or fluorescence in situ hybridization. It is possible to detect an abnormal UPD failure that cannot be accompanied by a change in the number of copies. This is because clinically available MPSS-based targeting methods amplify non-polymorphic loci, and thus, for example, it is not possible to determine if a subject chromosome is of the same parental origin, whereas SNP-based methods The reason is that individual haplotypes can be specifically identified. This is because microdeletion / microduplication and UPD syndrome such as these Prader-Willi, Angelman, and Beckwith-Wiedemann syndromes are usually not diagnosed prenatally and are misdiagnosed early after birth. Means that there are many. As a result, treatment intervention is significantly delayed. In addition, because the method targets SNPs, the method also facilitates parental haplotype reconstruction and enables detection of fetal inheritance at individual disease chain loci (Kitzman JO, Snyder MW, Ventura). M, et al. Noninvasive whole-genome sequencing of a human fetus. Sci Transl Med 2012; 4: 137ra76, which is incorporated herein by reference in its entirety).

本明細書で提示の結果は、出生前異数性特定のために前記方法の範囲を拡大できることを立証している。具体的には、19,488個のSNPの増幅およびシークエンシングにより、前記方法は、染色体13、18、21、X、およびYのコピー数を決定でき、他の染色体異常、例えば、いずれか他の臨床的に利用可能な非侵襲的方法では検出されない三倍体性およびUPDを特異的に検出することが期待される。臨床的適用範囲の増加および強力な試料特異的計算正確度は、前記方法が、胎児の染色体異数性検出のために、侵襲的検査に対する有用な補助的手法を提供できることを示唆する。 The results presented herein demonstrate that the scope of the method can be expanded for prenatal aneuploidy identification. Specifically, by amplifying and sequencing 19,488 SNPs, the method can determine the number of copies of chromosomes 13, 18, 21, X, and Y, and other chromosomal abnormalities, such as any other. It is expected to specifically detect polyploidy and UPD, which are not detected by clinically available non-invasive methods. The increased clinical scope and strong sample-specific computational accuracy suggest that the method can provide a useful adjunct to invasive testing for the detection of fetal chromosomal aneuploidy.

本明細書において引用されている全ての特許、特許出願および刊行参考文献は、その全体が参照により本明細書に組み込まれる。本開示の方法はその特定の実施形態とともに記載されているが、さらに改変することができることが理解されよう。さらに、本出願は、本開示の方法が関する当技術分野における公知または通例の実施の範囲内に入る、および添付の特許請求の範囲の範囲内に入る本開示からの逸脱を含めた、本開示の方法の任意の変動、使用または適応を包含するものとする。例えば、本明細書でDNA用に開示されたいずれの方法も、リバース転写ステップを導入してRNAをDNAに変換することにより容易にRNAに適合させることができる。例示のために多形遺伝子座を使用する実施例は、必要に応じ、容易に非多形遺伝子座の増幅に適合させることができる。 All patents, patent applications and publication references cited herein are incorporated herein by reference in their entirety. It will be appreciated that the methods of the present disclosure are described with particular embodiments thereof, but can be further modified. Further, the present disclosure includes deviations from the present disclosure that fall within the scope of known or customary practice in the art relating to the methods of the present disclosure and within the scope of the appended claims. It shall include any variation, use or adaptation of the method of. For example, any of the methods disclosed herein for DNA can be readily adapted to RNA by introducing a reverse transcription step to convert RNA into DNA. Examples using polymorphic loci for illustration can be easily adapted to amplification of non-polymorphic loci, if desired.

Claims (11)

核酸試料内の標的遺伝子座を増幅する方法であって、
(a)標的遺伝子座を含む前記核酸試料を、第1のユニバーサルプライマー、及び、少なくとも50の標的遺伝子座にイブリダイズする少なくとも50標的特異的プライマー接触させて、反応混合物を生成し、
(b)前記反応混合物をプライマー伸長反応条件に供して、標的アンプリコンを含む増幅産物を生成し、ここで各標的特異的プライマーの濃度は20nM以下であり、前記反応条件のアニーリング工程の長さは10分間以上であり、ここで各標的特異的プライマーは、前記第1のユニバーサルプライマーとプライマー対を形成して、前記少なくとも50の標的遺伝子座のうち1つを増幅し、ここで前少なくとも50の標的遺伝子座が同時に増幅され、
(c)第2のユニバーサルプライマー及び少なくとも50の内側標的特異的プライマーを用いて第2のネステッド増幅を行うことにより、標的アンプリコンを含む増幅産物を取得し、ここで各内側標的特異的プライマーは、前記第2のユニバーサルプライマーとプライマー対を形成して、前記少なくとも50の標的遺伝子座のうち1つを増幅し、ここで前記少なくとも50の標的遺伝子座が同時に増幅され、
(d)前記標的遺伝子座を含む前記(c)の増幅産物の配列決定を行う
ことを含む方法。
A method of amplifying a target locus in a nucleic acid sample.
(A) The nucleic acid sample containing the target locus is contacted with a first universal primer and at least 50 target-specific primers that hybridize to at least 50 target loci to generate a reaction mixture.
(B) The reaction mixture was subjected to primer extension reaction conditions to produce an amplification product containing a target amplicon, where the concentration of each target-specific primer was 20 nM or less, and the length of the annealing step under the reaction conditions. Is 10 minutes or longer, where each target-specific primer forms a primer pair with the first universal primer to amplify one of the at least 50 target loci, where at least the said. 50 target loci are amplified simultaneously,
(C) Second nested amplification with a second universal primer and at least 50 inner target specific primers to obtain an amplification product containing the target amplicon, where each inner target specific primer is A primer pair is formed with the second universal primer to amplify one of the at least 50 target loci, where the at least 50 target loci are simultaneously amplified.
(D) A method comprising sequencing the amplification product of (c), which comprises the target locus .
前記アニーリング工程の長さが10~20分間である、請求項1に記載の方法。 The method of claim 1, wherein the annealing step has a length of 10 to 20 minutes. 前記ライブラリー中の各標的特異的プライマーの濃度が10nM以下である、請求項1に記載の方法。 The method of claim 1, wherein the concentration of each target-specific primer in the library is 10 nM or less. 前記アニーリング工程が、60~65℃の温度でのアニーリングを含む、請求項1に記載の方法。 The method of claim 1, wherein the annealing step comprises annealing at a temperature of 60-65 ° C. 前記増幅産物の少なくとも80%が標的アンプリコンである、請求項1に記載の方法。 The method of claim 1, wherein at least 80% of the amplification product is a target amplicon. 前記増幅産物の少なくとも90%が標的アンプリコンである、請求項1に記載の方法。 The method of claim 1, wherein at least 90% of the amplification product is a target amplicon. 各標的アンプリコンの長さが100bp以下である、請求項1に記載の方法。 The method of claim 1, wherein the length of each target amplicon is 100 bp or less. 各標的アンプリコンの長さが60~80bpである、請求項1に記載の方法。 The method of claim 1, wherein the length of each target amplicon is 60-80 bp. 標的遺伝子座がSNP遺伝子座である、請求項1に記載の方法。 The method of claim 1, wherein the target locus is the SNP locus. 前記核酸試料が、混合起源からの核酸を含む、請求項1に記載の方法。 The method of claim 1, wherein the nucleic acid sample comprises nucleic acid from a mixed origin. 前記核酸試料が、腫瘍からの核酸を含む、請求項10に記載の方法。 The method of claim 10 , wherein the nucleic acid sample comprises nucleic acid from a tumor.
JP2020005462A 2012-07-24 2020-01-16 Highly multiplex PCR method and composition Active JP7027468B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022020146A JP7348330B2 (en) 2012-07-24 2022-02-14 Advanced multiplex PCR method and composition

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261675020P 2012-07-24 2012-07-24
US61/675,020 2012-07-24
US13/683,604 2012-11-21
US13/683,604 US20130123120A1 (en) 2010-05-18 2012-11-21 Highly Multiplex PCR Methods and Compositions

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018153048A Division JP6916153B2 (en) 2012-07-24 2018-08-16 Advanced multiplex PCR method and composition

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022020146A Division JP7348330B2 (en) 2012-07-24 2022-02-14 Advanced multiplex PCR method and composition

Publications (2)

Publication Number Publication Date
JP2020058388A JP2020058388A (en) 2020-04-16
JP7027468B2 true JP7027468B2 (en) 2022-03-01

Family

ID=49997695

Family Applications (12)

Application Number Title Priority Date Filing Date
JP2015524243A Active JP6392222B2 (en) 2012-07-24 2012-11-21 Advanced multiplex PCR methods and compositions
JP2018153048A Active JP6916153B2 (en) 2012-07-24 2018-08-16 Advanced multiplex PCR method and composition
JP2020005470A Active JP6997813B2 (en) 2012-07-24 2020-01-16 Highly multiplex PCR method and composition
JP2020005502A Active JP6997815B2 (en) 2012-07-24 2020-01-16 Highly multiplex PCR method and composition
JP2020005493A Active JP6997814B2 (en) 2012-07-24 2020-01-16 Highly multiplex PCR method and composition
JP2020005462A Active JP7027468B2 (en) 2012-07-24 2020-01-16 Highly multiplex PCR method and composition
JP2021204979A Active JP7510913B2 (en) 2012-07-24 2021-12-17 Highly multiplexed PCR methods and compositions
JP2021205050A Active JP7503043B2 (en) 2012-07-24 2021-12-17 Highly multiplexed PCR methods and compositions
JP2021204905A Active JP7343563B2 (en) 2012-07-24 2021-12-17 Advanced multiplex PCR method and composition
JP2022020146A Active JP7348330B2 (en) 2012-07-24 2022-02-14 Advanced multiplex PCR method and composition
JP2024093017A Pending JP2024113133A (en) 2012-07-24 2024-06-07 Highly multiplexed PCR methods and compositions
JP2024101181A Pending JP2024111282A (en) 2012-07-24 2024-06-24 Highly multiplexed PCR methods and compositions

Family Applications Before (5)

Application Number Title Priority Date Filing Date
JP2015524243A Active JP6392222B2 (en) 2012-07-24 2012-11-21 Advanced multiplex PCR methods and compositions
JP2018153048A Active JP6916153B2 (en) 2012-07-24 2018-08-16 Advanced multiplex PCR method and composition
JP2020005470A Active JP6997813B2 (en) 2012-07-24 2020-01-16 Highly multiplex PCR method and composition
JP2020005502A Active JP6997815B2 (en) 2012-07-24 2020-01-16 Highly multiplex PCR method and composition
JP2020005493A Active JP6997814B2 (en) 2012-07-24 2020-01-16 Highly multiplex PCR method and composition

Family Applications After (6)

Application Number Title Priority Date Filing Date
JP2021204979A Active JP7510913B2 (en) 2012-07-24 2021-12-17 Highly multiplexed PCR methods and compositions
JP2021205050A Active JP7503043B2 (en) 2012-07-24 2021-12-17 Highly multiplexed PCR methods and compositions
JP2021204905A Active JP7343563B2 (en) 2012-07-24 2021-12-17 Advanced multiplex PCR method and composition
JP2022020146A Active JP7348330B2 (en) 2012-07-24 2022-02-14 Advanced multiplex PCR method and composition
JP2024093017A Pending JP2024113133A (en) 2012-07-24 2024-06-07 Highly multiplexed PCR methods and compositions
JP2024101181A Pending JP2024111282A (en) 2012-07-24 2024-06-24 Highly multiplexed PCR methods and compositions

Country Status (10)

Country Link
JP (12) JP6392222B2 (en)
KR (1) KR101890466B1 (en)
CN (1) CN104685064A (en)
AU (1) AU2012385961B9 (en)
CA (1) CA2877493C (en)
HK (1) HK1211058A1 (en)
IL (1) IL236435A0 (en)
RU (1) RU2650790C2 (en)
SG (1) SG11201408813VA (en)
WO (1) WO2014018080A1 (en)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
WO2010017214A1 (en) 2008-08-04 2010-02-11 Gene Security Network, Inc. Methods for allele calling and ploidy calling
ES2640776T3 (en) 2009-09-30 2017-11-06 Natera, Inc. Methods for non-invasively calling prenatal ploidy
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
EP2854057B1 (en) 2010-05-18 2018-03-07 Natera, Inc. Methods for non-invasive pre-natal ploidy calling
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
CA2821906C (en) 2010-12-22 2020-08-25 Natera, Inc. Methods for non-invasive prenatal paternity testing
JP6153874B2 (en) 2011-02-09 2017-06-28 ナテラ, インコーポレイテッド Method for non-invasive prenatal ploidy calls
EA027558B1 (en) 2011-05-19 2017-08-31 Эйджена Байосайенс, Инк. Process for multiplex nucleic acid identification
KR101890466B1 (en) * 2012-07-24 2018-08-21 내테라, 인코포레이티드 Highly multiplex pcr methods and compositions
US20140100126A1 (en) 2012-08-17 2014-04-10 Natera, Inc. Method for Non-Invasive Prenatal Testing Using Parental Mosaicism Data
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
US9499870B2 (en) 2013-09-27 2016-11-22 Natera, Inc. Cell free DNA diagnostic testing standards
WO2015164432A1 (en) * 2014-04-21 2015-10-29 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
CN106460070B (en) 2014-04-21 2021-10-08 纳特拉公司 Detection of mutations and ploidy in chromosomal segments
CA2953362A1 (en) 2014-06-23 2015-12-30 The General Hospital Corporation Genomewide unbiased identification of dsbs evaluated by sequencing (guide-seq)
PT3224376T (en) 2014-11-28 2019-10-25 Uniqure Ip Bv Dna impurities in a composition comprising a parvoviral virion
US20170349926A1 (en) * 2014-12-22 2017-12-07 DNAe Group Holdings LTD. Bubble primers
CN114540470A (en) * 2015-04-24 2022-05-27 基纳生物技术有限公司 Multiplexing method for identification and quantification of minor alleles and polymorphisms
EP4428863A2 (en) 2015-05-11 2024-09-11 Natera, Inc. Methods and compositions for determining ploidy
GB2539675B (en) * 2015-06-23 2017-11-22 Cs Genetics Ltd Libraries of multimeric barcoding reagents and kits thereof for labelling nucleic acids for sequencing
WO2017044843A1 (en) 2015-09-11 2017-03-16 The General Hospital Corporation Full interrogation of nuclease dsbs and sequencing (find-seq)
EP3420100B1 (en) 2016-02-25 2021-04-07 H. Hoffnabb-La Roche Ag Elimination of primer-primer interactions during primer extension
WO2017181202A2 (en) * 2016-04-15 2017-10-19 Natera, Inc. Methods for lung cancer detection
EP3490531A4 (en) * 2016-07-29 2020-06-03 The Regents of The University of California Adeno-associated virus virions with variant capsid and methods of use thereof
WO2018061638A1 (en) * 2016-09-30 2018-04-05 富士フイルム株式会社 METHOD FOR DETERMINING ORIGIN OF HUMAN GENOMIC DNA OF 100 pg OR LESS THEREFROM, METHOD FOR PERSONAL IDENTIFICATION, AND METHOD FOR ANALYZING DEGREE OF ENGRAFTMENT OF HEMATOPOIETIC STEM CELL
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
AU2018225348A1 (en) 2017-02-21 2019-07-18 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
WO2019010456A1 (en) * 2017-07-07 2019-01-10 Stephen Quake Noninvasive prenatal diagnosis of single-gene disorders using droplet digital pcr
KR101977976B1 (en) * 2017-08-10 2019-05-14 주식회사 엔젠바이오 Method for increasing read data analysis accuracy in amplicon based NGS by using primer remover
BR112020003596A2 (en) 2017-08-23 2020-09-01 The General Hospital Corporation engineered crispr-cas9 nucleases with altered pam specificity
EP3694993A4 (en) * 2017-10-11 2021-10-13 The General Hospital Corporation Methods for detecting site-specific and spurious genomic deamination induced by base editing technologies
US12084720B2 (en) 2017-12-14 2024-09-10 Natera, Inc. Assessing graft suitability for transplantation
CN108334745B (en) * 2018-03-19 2022-02-08 青岛理工大学 Nonlinear hybrid system modeling method in polymerase chain reaction process
CA3090426A1 (en) 2018-04-14 2019-10-17 Natera, Inc. Methods for cancer detection and monitoring by means of personalized detection of circulating tumor dna
WO2019204378A1 (en) 2018-04-17 2019-10-24 The General Hospital Corporation Sensitive in vitro assays for substrate preferences and sites of nucleic acid binding, modifying, and cleaving agents
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
BR112021002189A2 (en) * 2018-08-08 2021-05-04 Inivata Ltd. sequencing method using variable replication multiplex pcr
CN112080558B (en) * 2019-06-13 2024-03-12 杭州贝瑞和康基因诊断技术有限公司 Kit and method for simultaneously detecting HBA1/2 and HBB gene mutation
US20210118527A1 (en) * 2019-07-22 2021-04-22 Mission Bio, Inc. Using Machine Learning to Optimize Assays for Single Cell Targeted DNA Sequencing
WO2021122620A1 (en) * 2019-12-16 2021-06-24 Agilent Technologies, Inc. Genomic scarring assays and related methods
JP7320468B2 (en) 2020-03-10 2023-08-03 Ntn株式会社 HUB UNIT WITH STEERING FUNCTION AND VEHICLE INCLUDING THE SAME
CN113979895B (en) * 2020-07-08 2023-03-24 中国科学技术大学 Self-degradable polymer with controllable precise sequence and preparation method and application thereof
WO2022076574A1 (en) * 2020-10-08 2022-04-14 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
WO2022196781A1 (en) 2021-03-18 2022-09-22 キヤノン株式会社 Liquid injection method, liquid injection device, and liquid cartridge
WO2023034090A1 (en) 2021-09-01 2023-03-09 Natera, Inc. Methods for non-invasive prenatal testing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003521252A (en) 2000-02-07 2003-07-15 イルミナ インコーポレイテッド Nucleic acid detection method using universal priming
US20070059700A1 (en) 2003-05-09 2007-03-15 Shengce Tao Methods and compositions for optimizing multiplex pcr primers
JP2011508662A (en) 2007-12-21 2011-03-17 コンパニ・ジェルベ・ダノン Method for enriching water with oxygen by electrolysis, oxygen-enriched water or beverage and use thereof

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US300235A (en) 1884-06-10 Chaeles b
US6479235B1 (en) * 1994-09-30 2002-11-12 Promega Corporation Multiplex amplification of short tandem repeat loci
US6251604B1 (en) * 1999-08-13 2001-06-26 Genopsys, Inc. Random mutagenesis and amplification of nucleic acid
US7582420B2 (en) * 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
JP2004511210A (en) * 2000-05-23 2004-04-15 バリアジェニックス インコーポレーテッド Method for genetic analysis of DNA to detect sequence variation
US6977162B2 (en) 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
EP2159285B1 (en) * 2003-01-29 2012-09-26 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
US7892732B2 (en) * 2004-01-12 2011-02-22 Roche Nimblegen, Inc. Method of performing PCR amplification on a microarray
US7618777B2 (en) * 2005-03-16 2009-11-17 Agilent Technologies, Inc. Composition and method for array hybridization
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
US8515679B2 (en) 2005-12-06 2013-08-20 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
PL3002338T3 (en) 2006-02-02 2019-12-31 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
WO2007111937A1 (en) * 2006-03-23 2007-10-04 Applera Corporation Directed enrichment of genomic dna for high-throughput sequencing
JP2008125471A (en) 2006-11-22 2008-06-05 Olympus Corp Multiplex method of nucleic acid amplification
EA015913B1 (en) * 2007-01-17 2011-12-30 Учреждение Российской Академии Наук Институт Молекулярной Биологии Им. В.А. Энгельгардта Ран (Имб Ран) Method for genetically identifying a person according to the analysis of the single nucleotide polymorphism of a human genome by means of a oligonucleotide biological microchip (biochip)
EP2121983A2 (en) * 2007-02-02 2009-11-25 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
US20090023190A1 (en) 2007-06-20 2009-01-22 Kai Qin Lao Sequence amplification with loopable primers
WO2009032779A2 (en) * 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for the size-specific seperation of nucleic acid from a sample
CA2697640C (en) * 2007-09-21 2016-06-21 Katholieke Universiteit Leuven Tools and methods for genetic tests using next generation sequencing
EP2077337A1 (en) 2007-12-26 2009-07-08 Eppendorf Array Technologies SA Amplification and detection composition, method and kit
US20110033862A1 (en) 2008-02-19 2011-02-10 Gene Security Network, Inc. Methods for cell genotyping
WO2010017214A1 (en) 2008-08-04 2010-02-11 Gene Security Network, Inc. Methods for allele calling and ploidy calling
WO2009146335A1 (en) 2008-05-27 2009-12-03 Gene Security Network, Inc. Methods for embryo characterization and comparison
LT2562268T (en) 2008-09-20 2017-04-25 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
US8691509B2 (en) * 2009-04-02 2014-04-08 Fluidigm Corporation Multi-primer amplification method for barcoding of target nucleic acids
ES2640776T3 (en) 2009-09-30 2017-11-06 Natera, Inc. Methods for non-invasively calling prenatal ploidy
DK2496720T3 (en) * 2009-11-06 2020-09-28 Univ Leland Stanford Junior NON-INVASIVE DIAGNOSIS OF TRANSPLANT REJECTION IN ORGAN-TRANSPLANTED PATIENTS
AU2011207544A1 (en) * 2010-01-19 2012-09-06 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing
US20110312503A1 (en) * 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
US8574832B2 (en) * 2010-02-03 2013-11-05 Massachusetts Institute Of Technology Methods for preparing sequencing libraries
CA2796578C (en) * 2010-04-16 2021-11-23 Chronix Biomedical Breast cancer associated circulating nucleic acid biomarkers
WO2013052557A2 (en) 2011-10-03 2013-04-11 Natera, Inc. Methods for preimplantation genetic diagnosis by sequencing
EP2854057B1 (en) 2010-05-18 2018-03-07 Natera, Inc. Methods for non-invasive pre-natal ploidy calling
WO2011146942A1 (en) * 2010-05-21 2011-11-24 The Translational Genomics Research Institute Methods and kits to analyze microrna by nucleic acid sequencing
PL2576837T3 (en) * 2010-06-04 2018-04-30 Chronix Biomedical Prostate cancer associated circulating nucleic acid biomarkers
JP5449060B2 (en) * 2010-06-30 2014-03-19 三菱重工業株式会社 Wind power generator
EP2426217A1 (en) * 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
US8877442B2 (en) 2010-12-07 2014-11-04 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive determination of fetal inheritance of parental haplotypes at the genome-wide scale
CN110079588B (en) * 2010-12-17 2024-03-15 生命技术公司 Methods, compositions, systems, instruments and kits for nucleic acid amplification
CA2821906C (en) * 2010-12-22 2020-08-25 Natera, Inc. Methods for non-invasive prenatal paternity testing
KR20190002733A (en) * 2010-12-30 2019-01-08 파운데이션 메디신 인코포레이티드 Optimization of multigene analysis of tumor samples
WO2012103031A2 (en) 2011-01-25 2012-08-02 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
JP6153874B2 (en) 2011-02-09 2017-06-28 ナテラ, インコーポレイテッド Method for non-invasive prenatal ploidy calls
KR101890466B1 (en) 2012-07-24 2018-08-21 내테라, 인코포레이티드 Highly multiplex pcr methods and compositions

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003521252A (en) 2000-02-07 2003-07-15 イルミナ インコーポレイテッド Nucleic acid detection method using universal priming
US20070059700A1 (en) 2003-05-09 2007-03-15 Shengce Tao Methods and compositions for optimizing multiplex pcr primers
JP2011508662A (en) 2007-12-21 2011-03-17 コンパニ・ジェルベ・ダノン Method for enriching water with oxygen by electrolysis, oxygen-enriched water or beverage and use thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PLOS ONE,2012年,Vol.7, No.1,e22900

Also Published As

Publication number Publication date
AU2012385961A1 (en) 2015-02-12
JP2024113133A (en) 2024-08-21
JP6392222B2 (en) 2018-09-19
JP2020054402A (en) 2020-04-09
RU2650790C2 (en) 2018-04-17
CA2877493A1 (en) 2014-01-30
JP6997815B2 (en) 2022-02-10
JP7510913B2 (en) 2024-07-04
JP2015526073A (en) 2015-09-10
WO2014018080A1 (en) 2014-01-30
CN104685064A (en) 2015-06-03
SG11201408813VA (en) 2015-02-27
JP2018183189A (en) 2018-11-22
JP6997813B2 (en) 2022-02-10
JP7343563B2 (en) 2023-09-12
JP7503043B2 (en) 2024-06-19
AU2012385961B2 (en) 2017-04-13
JP2022051949A (en) 2022-04-01
JP2024111282A (en) 2024-08-16
JP2020054400A (en) 2020-04-09
KR20150038216A (en) 2015-04-08
JP7348330B2 (en) 2023-09-20
JP2020058388A (en) 2020-04-16
AU2012385961B9 (en) 2017-05-18
JP6997814B2 (en) 2022-02-10
IL236435A0 (en) 2015-02-26
JP2022037145A (en) 2022-03-08
RU2014152883A (en) 2016-09-10
JP2020054401A (en) 2020-04-09
KR101890466B1 (en) 2018-08-21
CA2877493C (en) 2020-08-25
HK1211058A1 (en) 2016-05-13
JP2022027971A (en) 2022-02-14
JP2022027975A (en) 2022-02-14
JP6916153B2 (en) 2021-08-11

Similar Documents

Publication Publication Date Title
JP7027468B2 (en) Highly multiplex PCR method and composition
US11390916B2 (en) Methods for simultaneous amplification of target loci
JP6153874B2 (en) Method for non-invasive prenatal ploidy calls
US20170051355A1 (en) Highly multiplex pcr methods and compositions
EP2847347B1 (en) Highly multiplex pcr methods and compositions
CN107988343A (en) The antenatal ploidy recognition methods of Noninvasive

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210309

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210824

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220104

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220216

R150 Certificate of patent or registration of utility model

Ref document number: 7027468

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150