JP2021182940A - METHODS FOR QUANTITATIVE GENETIC ANALYSIS OF CELL FREE DNA (cfDNA) - Google Patents

METHODS FOR QUANTITATIVE GENETIC ANALYSIS OF CELL FREE DNA (cfDNA) Download PDF

Info

Publication number
JP2021182940A
JP2021182940A JP2021139325A JP2021139325A JP2021182940A JP 2021182940 A JP2021182940 A JP 2021182940A JP 2021139325 A JP2021139325 A JP 2021139325A JP 2021139325 A JP2021139325 A JP 2021139325A JP 2021182940 A JP2021182940 A JP 2021182940A
Authority
JP
Japan
Prior art keywords
cfdna
library
dna
gene
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2021139325A
Other languages
Japanese (ja)
Other versions
JP2021182940A5 (en
Inventor
ケー. レイモンド クリストファー
k raymond Christopher
ピー. リム リー
P Lim Lee
ディー. アーマー クリストファー
D Armour Christopher
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Resolution Bioscience Inc
Original Assignee
Resolution Bioscience Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Resolution Bioscience Inc filed Critical Resolution Bioscience Inc
Priority to JP2021139325A priority Critical patent/JP2021182940A/en
Publication of JP2021182940A publication Critical patent/JP2021182940A/en
Publication of JP2021182940A5 publication Critical patent/JP2021182940A5/ja
Priority to JP2023142908A priority patent/JP2023159462A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

To provide methods for quantitative genetic analysis of cell free DNA (cfDNA).SOLUTION: The invention provides a method for genetic analysis in individuals that reveals both the genetic sequences and chromosomal copy number of targeted specific genomic loci in a single assay. The present invention further provides methods for sensitive specific detection of target gene sequences and gene expression profiles. In various embodiments, methods for genetic analysis of cell-free DNA (cfDNA) comprise treating cfDNA with one or more end-repair enzymes to generate end-repaired cfDNA.SELECTED DRAWING: None

Description

配列表に関する記述
本出願に関連する配列表は、紙コピーの代わりにテキスト形式で提供し、ここでは参照により本明細書に組み入れる。配列表を含むテキストファイルの名称は、CLFK_002_00US_ST25.txtである。このテキストファイルは117KBであり、2014年8月22日に作成したものであり、EFS−Web経由で電子的に提出される。
Description of Sequence Listing The sequence listings relevant to this application are provided in text form instead of paper copies and are incorporated herein by reference. The name of the text file including the sequence listing is CLFK_002_00US_ST25. It is txt. This text file is 117KB, created on August 22, 2014, and is submitted electronically via EFS-Web.

背景
技術分野
本発明は、一般に、無細胞DNA(cfDNA)の定量的遺伝子解析のための組成物および方法に関する。詳細には、本発明は、cfDNAの遺伝子特徴付けおよび解析のための改善された標的化配列捕捉組成物および方法に関する。
Background The present invention generally relates to compositions and methods for quantitative gene analysis of cell-free DNA (cfDNA). In particular, the invention relates to improved targeted sequence capture compositions and methods for gene characterization and analysis of cfDNA.

関連技術の記載
最もよく見られるヒトがんのすべてではないにせよ大部分はヒトゲノムの疾患であることが次第に明らかになってきている。個体の生涯の間に体細胞変異が蓄積し、それらの一部は、それらを有する細胞が腫瘍に進展しうる確率を増すという事実が明るみになりつつある(Vogelsteinら、Science 339巻(6127号):1546〜1558頁(20
13年))。蓄積された変異事象のまさに悪い組合せを有する前がん状態のものは、無制限増殖を抑制する制約を失い、その結果として生ずる細胞塊ががん化する。がんを引き起こすのに必要かつ十分な様々な変異は、まとめて「ドライバー変異」と呼ばれることが多い。最近の徹底した分子解析から浮上した論題の1つは、かつては単一の組織特異的疾患と考えられていたがんが、実際には、各々が特有の分子病態を有する関連疾患の群であるということである。ヒトゲノム計画は、がんのゲノムワイド解析の基礎を作った。
Description of Related Techniques It is becoming increasingly clear that most, if not all, of the most common human cancers are diseases of the human genome. The fact that somatic mutations accumulate during the life of an individual, some of which increase the probability that cells carrying them can develop into tumors (Vogelstein et al., Science 339 (6127)) is becoming apparent. ): Pages 1546 to 1558 (20)
13 years)). Those in a precancerous state with a very bad combination of accumulated mutational events lose the constraint of suppressing unlimited growth and the resulting cell mass becomes cancerous. The various mutations that are necessary and sufficient to cause cancer are often collectively referred to as "driver mutations." One of the themes that has emerged from recent thorough molecular analysis is that cancer, once thought to be a single tissue-specific disease, is actually a group of related diseases, each with its own unique molecular pathology. It means that there is. The Human Genome Project laid the foundation for genome-wide analysis of cancer.

例えば、次世代シークエンシング技術の導入(2004年現在)は、NSCLCの診断の根拠となる原因ゲノム因子の発見の速度を加速させ、その結果、NSCLCは、実際には、各々が異なる標的療法に応答しうる関連疾患のファミリーであることが明らかになった。 For example, the introduction of next-generation sequencing technology (as of 2004) has accelerated the rate of discovery of causative genomic factors that underlie the diagnosis of NSCLC, resulting in NSCLC being actually a different targeted therapy. It has become clear that it is a family of related diseases that can respond.

当技術分野には、遺伝疾患の解析のための信頼性のある頑強な分子解析方法がない。旧来、分子診断は、抗体ベースの試験(免疫組織化学)、DNAプローブを用いるインサイツハイブリダイゼーション(蛍光インサイツハイブリダイゼーション)、および特異的ヌクレオチド配列を照会するハイブリダイゼーションまたはPCRベースの試験からなっている。最近まで、分子診断ツールとしてのDNAシークエンシングは、一般に、1つまたは2つの遺伝子のコーディングエクソンに限られていた。DNAシークエンシングは、固形がんの診断および処置に使用されているが、これらの方法の最も重大な欠点の1つは、それらが腫瘍組織への直接到達を要することである。そのような材料は、疾患の診断に使用される初期生検から得ることが困難であることが多く、時間をかけて何度も繰り返して得ることは、事実上、不可能である。同様に、生検は、到達し難い腫瘍を有する患者では可能でなく、転移性疾患に罹患している個体には現実的でない。 There is no reliable and robust molecular analysis method in the art for the analysis of genetic disorders. Traditionally, molecular diagnostics consist of antibody-based tests (immunohistochemistry), in situ hybridization using DNA probes (fluorescent in situ hybridization), and hybridization or PCR-based tests that query specific nucleotide sequences. Until recently, DNA sequencing as a molecular diagnostic tool was generally limited to coding exons of one or two genes. DNA sequencing has been used in the diagnosis and treatment of solid tumors, but one of the most significant drawbacks of these methods is that they require direct access to tumor tissue. Such materials are often difficult to obtain from the initial biopsy used to diagnose the disease, and it is virtually impossible to obtain them over and over again over time. Similarly, biopsy is not possible in patients with inaccessible tumors and is not feasible for individuals suffering from metastatic disease.

したがって、遺伝疾患、胎児試験、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、メンデル型遺伝病、遺伝子モザイク、病原体スクリーニング、マイクロバイオームプロファイリングおよび臓器移植モニタリングのための分子診断の巨大な可能性は、まだ実現されていない。今までの、既存の分子診断アプローチには、個々のDNA分子のクローニングおよび増幅に対する効率的な解決策がなく、試料処理中に生ずる偽陽性シグナルと真の陽性試験結果を区別するのに十分な感度での、シークエンシングの特定のゲノム座位への効率的な標的化に対する解決策もない。 Therefore, a huge amount of molecular diagnostics for genetic disorders, fetal testing, paternity testing, prediction of response to drug treatment, diagnosis or monitoring of pathological conditions, Mendel-type genetic disorders, genetic mosaics, pathogen screening, microbiome profiling and organ transplant monitoring. The possibilities have not yet been realized. To date, existing molecular diagnostic approaches do not have an efficient solution for cloning and amplification of individual DNA molecules, sufficient to distinguish between false positive signals and true positive test results that occur during sample processing. There is also no solution for efficient targeting of sequencing to specific genomic loci with sensitivity.

Vogelsteinら、Science 339巻(6127号):1546〜1558頁(2013年)Vogelstein et al., Science 339 (6127): 1546-1558 (2013)

本発明は、一般に、cfDNAの遺伝子解析のための改善された組成物および方法のための組成物および方法に関する。 The present invention generally relates to compositions and methods for improved compositions and methods for genetic analysis of cfDNA.

様々な実施形態では、無細胞DNA(cfDNA)の遺伝子解析のための方法であって、cfDNAを1つまたは複数の末端修復酵素で処置して末端修復cfDNAを生成するステップ、末端修復cfDNAの各末端に1つまたは複数のアダプターをライゲーションしてcfDNAライブラリーを生成するステップ、cfDNAライブラリーを増幅させてcfDNAライブラリークローンを生成するステップ、cfDNAクローンライブラリー中のゲノム当量の数を決定するステップ、およびcfDNAライブラリークローン中の1つまたは複数の標的遺伝子座位の定量的遺伝子解析を行うステップを含む方法が提供される。 In various embodiments, a method for gene analysis of cell-free DNA (cfDNA), the step of treating cfDNA with one or more terminal repair enzymes to produce terminal repair cfDNA, each of terminal repair cfDNA. The step of ligating one or more adapters to the ends to generate a cfDNA library, the step of amplifying the cfDNA library to generate a cfDNA library clone, and the step of determining the number of genomic equivalents in the cfDNA clone library. , And a method comprising performing a quantitative gene analysis of one or more target gene loci in the cfDNA library clone.

特定の実施形態では、方法は、対象の生体試料からcfDNAを単離するステップをさらに含む。 In certain embodiments, the method further comprises the step of isolating cfDNA from the biological sample of interest.

追加の実施形態では、cfDNAは、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液(mucous)および汗からなる群から選択される生体試料から単離される。 In additional embodiments, the cfDNA is from a biological sample selected from the group consisting of amniotic fluid, blood, plasma, serum, semen, lymph, cerebrospinal fluid, ophthalmic fluid, urine, saliva, feces, mucous and sweat. Be isolated.

ある特定の実施形態では、1つまたは複数のアダプターは、複数のアダプター種を含む。 In certain embodiments, the one or more adapters comprises a plurality of adapter types.

特定の実施形態では、1つまたは複数のアダプター各々は、cfDNAライブラリーの増幅のためのプライマー結合部位を含む。 In certain embodiments, each of the adapters or adapters comprises a primer binding site for amplification of the cfDNA library.

さらなる実施形態では、1つまたは複数のアダプター各々は、1つまたは複数のユニークリードコードを含む。 In a further embodiment, each of the one or more adapters comprises one or more unique read cords.

追加の実施形態では、1つまたは複数のアダプター各々は、試料多重化のための1つまたは複数の試料コードを含む。 In additional embodiments, each of the adapters or adapters comprises one or more sample codes for sample multiplexing.

別の実施形態では、1つまたは複数のアダプター各々は、DNAシークエンシングのための1つまたは複数の配列を含む。 In another embodiment, each of the adapters or adapters comprises one or more sequences for DNA sequencing.

特定の実施形態では、qPCRをcfDNAクローンライブラリーに対して行い、qPCR測定値を既知ゲノム当量の標準と比較してcfDNAクローンライブラリーのゲノム当量を決定する。 In certain embodiments, qPCR is performed on the cfDNA clone library and the qPCR measurements are compared to a standard of known genomic equivalents to determine the genomic equivalent of the cfDNA clone library.

別の特定の実施形態では、Alu配列と結合するプライマーおよびアダプター中の配列と結合するプライマーを用いてqPCRを行う。 In another particular embodiment, qPCR is performed with a primer that binds to the Alu sequence and a primer that binds to the sequence in the adapter.

ある特定の実施形態では、定量的遺伝子解析を、cfDNAライブラリークローン中の複数の遺伝子座位に対して行う。 In certain embodiments, quantitative gene analysis is performed on multiple gene loci in the cfDNA library clone.

さらなる実施形態では、定量的遺伝子解析を、複数のcfDNAクローンライブラリー中の複数の遺伝子座位に対して行う。 In a further embodiment, quantitative gene analysis is performed on multiple gene loci in multiple cfDNA clone libraries.

追加の実施形態では、定量的遺伝子解析は、1つまたは複数の捕捉プローブを標的遺伝子座位にハイブリダイズさせて、捕捉プローブ−cfDNAクローン複合体を形成することを含む。 In additional embodiments, quantitative gene analysis involves hybridizing one or more capture probes to the target gene locus to form a capture probe-cfDNA clone complex.

特定の実施形態では、定量的遺伝子解析は、捕捉プローブ−cfDNAクローン複合体を単離することを含む。 In certain embodiments, quantitative genetic analysis comprises isolating a capture probe-cfDNA clone complex.

ある特定の実施形態では、定量的遺伝子解析は、単離されたハイブリダイズした捕捉プローブ−cfDNAクローン複合体中のcfDNAクローン配列の増幅を含む。 In certain embodiments, quantitative genetic analysis involves amplification of the cfDNA clone sequence in an isolated hybridized capture probe-cfDNA clone complex.

さらなる実施形態では、定量的遺伝子解析は、複数のシークエンシングリードを生成するためのDNAシークエンシングを含む。 In a further embodiment, the quantitative gene analysis comprises DNA sequencing to generate multiple sequencing reads.

別の実施形態では、定量的遺伝子解析は、複数のシークエンシングリードのバイオインフォマティック解析を含む。 In another embodiment, the quantitative genetic analysis comprises a bioinformatic analysis of multiple sequencing leads.

特定の実施形態では、バイオインフォマティクス解析は、cfDNAクローンライブラリー中の解析されるゲノム当量の数を定量するため、標的遺伝子座位における遺伝子バリアントを検出するため、標的遺伝子座位内の変異を検出するため、標的遺伝子座位内の遺伝子融合を検出するため、および標的遺伝子座位内のコピー数増減を測定するために使用される。 In certain embodiments, bioinformatics analysis is used to quantify the number of genomic equivalents analyzed in a cfDNA clone library, to detect gene variants at a target gene locus, to detect mutations within a target gene locus. , Used to detect gene fusions within the target gene locus, and to measure the increase or decrease in the number of copies within the target gene locus.

追加の実施形態では、対象は、遺伝疾患を有さない。 In additional embodiments, the subject does not have a genetic disorder.

ある特定の実施形態では、対象は、遺伝疾患と診断されていない。 In certain embodiments, the subject has not been diagnosed with a genetic disorder.

別のある特定の実施形態では、対象は、遺伝疾患と診断されている。 In another particular embodiment, the subject has been diagnosed with a genetic disorder.

別の実施形態では、定量的遺伝子解析は、遺伝疾患を引き起こすまたは遺伝疾患に関連する1つまたは複数の遺伝子病変を同定または検出するために使用される。 In another embodiment, quantitative genetic analysis is used to identify or detect one or more genetic lesions that cause or are associated with a genetic disorder.

ある特定の実施形態では、遺伝子病変は、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む。 In certain embodiments, genetic lesions include nucleotide transitions or transversions, nucleotide insertions or deletions, genomic rearrangements, copy count changes, or gene fusions.

特定の実施形態では、遺伝子病変は、ALK遺伝子の3’コード領域を別の遺伝子に融合させるゲノム再編成を含む。 In certain embodiments, the genetic lesion comprises a genomic rearrangement that fuses the 3'coding region of the ALK gene to another gene.

特定の実施形態では、ALK遺伝子の3’コード領域がEML4遺伝子に融合している。 In certain embodiments, the 3'coding region of the ALK gene is fused to the EML4 gene.

別の実施形態では、遺伝疾患はがんである。 In another embodiment, the genetic disorder is cancer.

さらなる実施形態では、対象は妊娠している。 In a further embodiment, the subject is pregnant.

追加の実施形態では、定量的遺伝子解析は、胎児cfDNA中の1つまたは複数の標的遺伝子座位の1つまたは複数の遺伝子バリアントまたは遺伝子病変を同定または検出するために使用される。 In additional embodiments, quantitative genetic analysis is used to identify or detect one or more genetic variants or lesions of one or more target gene loci in fetal cfDNA.

特定の実施形態では、対象は移植レシピエントである。 In certain embodiments, the subject is a transplant recipient.

追加の実施形態では、定量的遺伝子解析は、対象におけるドナーcfDNAを同定または検出するために使用される。 In additional embodiments, quantitative genetic analysis is used to identify or detect donor cfDNA in the subject.

様々な実施形態では、対象における遺伝疾患を予測、診断またはモニターする方法であって、対象の生体試料からcfDNAを単離するまたは得るステップ、cfDNAを1つまたは複数の末端修復酵素で処置して末端修復cfDNAを生成するステップ、末端修復cfDNAの各末端に1つまたは複数のアダプターをライゲーションしてcfDNAライブラリーを生成するステップ、cfDNAライブラリーを増幅させてcfDNAクローンライブラリーを生成するステップ、cfDNAクローンライブラリー中のゲノム当量の数を決定するステップ、およびcfDNAクローンライブラリー中の遺伝疾患に関連する1つまたは複数の標的遺伝子座位の定量的遺伝子解析を行うステップを含み、1つまたは複数の標的遺伝子座位における1つまたは複数の遺伝子病変の同定または検出が、遺伝疾患の予後を予測し、それを診断し、またはその進行をモニターする、方法が提供される。 In various embodiments, a method of predicting, diagnosing or monitoring a genetic disorder in a subject, the step of isolating or obtaining cfDNA from a biological sample of subject, treating cfDNA with one or more terminal repair enzymes. Step to generate terminal repair cfDNA, step to ligate one or more adapters to each end of terminal repair cfDNA to generate cfDNA library, step to amplify cfDNA library to generate cfDNA clone library, cfDNA One or more, including the step of determining the number of genomic equivalents in the clone library and the step of performing quantitative genetic analysis of one or more target gene loci associated with the genetic disorder in the cfDNA clone library. Identification or detection of one or more genetic lesions at a target gene locus provides a method of predicting the prognosis of a genetic disorder, diagnosing it, or monitoring its progression.

追加の実施形態では、cfDNAは、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液および汗からなる群から選択される生体試料から単離される。 In additional embodiments, cfDNA is isolated from a biological sample selected from the group consisting of amniotic fluid, blood, plasma, serum, semen, lymph, cerebrospinal fluid, ophthalmic fluid, urine, saliva, feces, mucus and sweat. ..

ある特定の実施形態では、遺伝子病変は、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む。 In certain embodiments, genetic lesions include nucleotide transitions or transversions, nucleotide insertions or deletions, genomic rearrangements, copy count changes, or gene fusions.

特定の実施形態では、遺伝子病変は、ALK遺伝子の3’コード領域を別の遺伝子に融合させるゲノム再編成を含む。 In certain embodiments, the genetic lesion comprises a genomic rearrangement that fuses the 3'coding region of the ALK gene to another gene.

さらなる実施形態では、ALK遺伝子の3’コード領域がEML4遺伝子に融合している。 In a further embodiment, the 3'coding region of the ALK gene is fused to the EML4 gene.

特定の実施形態では、遺伝疾患はがんである。 In certain embodiments, the genetic disorder is cancer.

様々な実施形態では、遺伝疾患のコンパニオン診断であって、対象の生体試料からcfDNAを単離するまたは得るステップ、cfDNAを1つまたは複数の末端修復酵素で処置して末端修復cfDNAを生成するステップ、末端修復cfDNAの各末端に1つまたは複数のアダプターをライゲーションしてcfDNAライブラリーを生成するステップ、cfDNAライブラリーを増幅させてcfDNAクローンライブラリーを生成するステップ、cfDNAクローンライブラリー中のゲノム当量の数を決定するステップ、およびcfDNAクローンライブラリー中の遺伝疾患に関連する1つまたは複数のバイオマーカーの定量的遺伝子解析を行うステップを含み、1つまたは複数のバイオマーカーの少なくとも1つの検出、または検出できないことが、対象を遺伝疾患について処置すべきかどうかを示す、コンパニオン診断が提供される。 In various embodiments, a companion diagnostic of a genetic disorder, the step of isolating or obtaining cfDNA from a biological sample of interest, the step of treating cfDNA with one or more terminal repair enzymes to produce terminal repair cfDNA. , A step of ligating one or more adapters to each end of the terminal repair cfDNA to generate a cfDNA library, a step of amplifying the cfDNA library to generate a cfDNA clone library, a genomic equivalent in the cfDNA clone library. Detection of at least one of the biomarkers, including the step of determining the number of biomarkers and the step of performing quantitative genetic analysis of one or more biomarkers associated with the genetic disorder in the cfDNA clone library. Or undetectable provides a companion diagnostic that indicates whether the subject should be treated for a genetic disorder.

特定の実施形態では、cfDNAは、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液および汗からなる群から選択される生体試料から単離される。 In certain embodiments, cfDNA is isolated from a biological sample selected from the group consisting of amniotic fluid, blood, plasma, serum, semen, lymph, cerebrospinal fluid, ophthalmic fluid, urine, saliva, feces, mucus and sweat. ..

追加の実施形態では、バイオマーカーは遺伝子病変である。 In additional embodiments, the biomarker is a genetic lesion.

特定の実施形態では、遺伝子病変は、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む。 In certain embodiments, genetic lesions include nucleotide transitions or transversions, nucleotide insertions or deletions, genomic rearrangements, copy count changes, or gene fusions.

追加の実施形態では、遺伝子病変は、ALK遺伝子の3’コード領域を別の遺伝子に融合させるゲノム再編成を含む。 In additional embodiments, the genetic lesion comprises a genomic rearrangement that fuses the 3'coding region of the ALK gene to another gene.

さらなる実施形態では、ALK遺伝子の3’コード領域がEML4遺伝子に融合している。 In a further embodiment, the 3'coding region of the ALK gene is fused to the EML4 gene.

ある特定の実施形態では、遺伝疾患はがんである。 In certain embodiments, the genetic disorder is cancer.

図1は、ユニークリードのフィルタリング不在下での混合希釈度の関数としての期待対観測バリアント頻度を示す図である。ユニークリードのフィルタリング不在下で、これら4つの選択位置でのランダムな塩基変化が、測定可能な非ゼロ頻度で発生した。このことから特定の一塩基バリアント(SNV)を検出するための感度を欠いていることが立証される。FIG. 1 shows the expected vs. observed variant frequency as a function of mixed dilution in the absence of unique read filtering. Random base changes at these four selected positions occurred at measurable non-zero frequencies in the absence of unique read filtering. This proves the lack of sensitivity to detect a particular single nucleotide variant (SNV).

図2は、図1で生成したデータに対して行ったユニークリードのフィルタリングを示す図である。左手のパネルは、ユニークリードのフィルタリングなしでのBRAF I326T SNVに関する図1からのデータを示す。右手のパネルは、同じデータのユニークリードフィルタリングの使用が、アッセイ感度を増加させ、真のシグナルと間違いの元となるノイズの区別を可能にしたことを示す。FIG. 2 is a diagram showing filtering of unique reads performed on the data generated in FIG. 1. The left-hand panel shows the data from FIG. 1 for BRAF I326T SNV without filtering of unique reads. The right-hand panel shows that the use of unique read filtering of the same data increased assay sensitivity and made it possible to distinguish between true signals and error-causing noise.

図3は、捕捉プローブ性能を長さおよび洗浄温度の関数として示す図である。y軸は、各捕捉プローブに関連するリードの総数を示す。棒グラフの棒は、2つのカテゴリーに分けられており、白棒は、意図した捕捉プローブ標的にアラインするオンターゲットリードに対応し、黒棒は、捕捉プローブに関連するがゲノムの意図せぬ領域にマッピングされるオフターゲットリードを示す。全体的に見て、40merおよび60mer捕捉プローブは、44℃および47℃の洗浄では実質的に同じように機能する。50℃の洗浄に関しては、40mer捕捉プローブは不規則に機能する。これらのデータは、約44℃〜約47℃の範囲の洗浄温度での40mer捕捉プローブの使用の正当性を立証する。FIG. 3 is a diagram showing capture probe performance as a function of length and wash temperature. The y-axis shows the total number of reads associated with each capture probe. The bars in the bar graph are divided into two categories, the white bars correspond to the on-target reads aligned to the intended capture probe target, and the black bars correspond to the unintended regions of the genome associated with the capture probe. Indicates the off-target read to be mapped. Overall, the 40mer and 60mer capture probes function substantially the same in washes at 44 ° C and 47 ° C. For washing at 50 ° C., the 40mer capture probe functions irregularly. These data justify the use of the 40mer capture probe at wash temperatures ranging from about 44 ° C to about 47 ° C.

図4は、ALK遺伝子の第19イントロンの標的化し配向させたシークエンシングの概略図を示す図である。A)「野生型」参照配列では、アンチセンス配向のALK捕捉プローブは、第19イントロンからの配列を同定する。B)病原性融合遺伝子の場合、一部のALK捕捉プローブは、遺伝子融合事象に関連するジャンクション配列を同定することになる。FIG. 4 is a schematic diagram of targeted and oriented sequencing of the 19th intron of the ALK gene. A) In the "wild-type" reference sequence, an antisense-oriented ALK capture probe identifies the sequence from the 19th intron. B) For pathogenic fusion genes, some ALK capture probes will identify junction sequences associated with the gene fusion event.

図5は、標的領域の完全シークエンシングのための高密度捕捉プローブ配置の概略図を示す図である。各捕捉プローブは、各塩基位置での累積カバレッジをもたらす一群の配列を捕捉する。ここでは、カバレッジを線によって表し、その線の振幅が、特定の捕捉プローブに由来するカバレッジの深度を示す。隣接する捕捉プローブからの重複するカバレッジによって、可能性のある両方の方向の標的領域の完全シークエンシングが提供される。加えて、相対する鎖の捕捉プローブのヘッドトゥーヘッド配置によって、すべての捕捉プローブ結合部位が確実にシークエンシングされる。FIG. 5 is a schematic diagram of a high density capture probe arrangement for complete sequencing of target regions. Each capture probe captures a set of sequences that provide cumulative coverage at each base position. Here, coverage is represented by a line, the amplitude of which line indicates the depth of coverage from a particular capture probe. Overlapping coverage from adjacent capture probes provides complete sequencing of target areas in both possible directions. In addition, the head-to-head arrangement of the capture probes on the opposing chains ensures that all capture probe binding sites are sequenced.

図6は、ライブラリー構築に使用した断片化DNAのサイズ分布の代表例を示す図である。FIG. 6 is a diagram showing a representative example of the size distribution of the fragmented DNA used for constructing the library.

図7は、代表実験における高密度40mer捕捉プローブの性能を示す図である。y軸は、リードの総数を示し、それがオンターゲットリード、オフターゲットリードおよびマッピング不能リードとして分割されている。x軸は、配列捕捉のためにこの実験で使用した105の捕捉プローブの各々を列挙するものである。FIG. 7 is a diagram showing the performance of a high-density 40mer capture probe in a representative experiment. The y-axis shows the total number of leads, which are divided into on-target leads, off-target leads and unmapping leads. The x-axis enumerates each of the 105 capture probes used in this experiment for sequence capture.

図8は、高密度40mer捕捉プローブを使用する標的領域の累積カバレッジの代表例を示す図である。ここに示されているのは、TP53コーディングエクソンの累積カバレッジである。FIG. 8 is a diagram showing a representative example of cumulative coverage of a target region using a high-density 40mer capture probe. Shown here is the cumulative coverage of TP53 coding exons.

図9Aは、無細胞DNA(cfDNA)ライブラリーのサイズ分布の代表例を示す図である。主要バンドは、90bpのアダプターにライゲーションした一群の170±10bp断片と一致する。FIG. 9A is a diagram showing a representative example of the size distribution of a cell-free DNA (cfDNA) library. The major band coincides with a group of 170 ± 10 bp fragments ligated to a 90 bp adapter. 図9Bは、cfDNAの公開されているゲル画像と、本明細書において開示および/または企図される方法を使用して生成した代表cfDNAライブラリーとを示す図である。定性的「ラダー」の外観は、ライブラリーに保存されるが、ライブラリーは、90bpのアダプター配列の付加によってより高い質量にシフトされる。FIG. 9B shows a published gel image of cfDNA and a representative cfDNA library generated using the methods disclosed and / or contemplated herein. The appearance of the qualitative "ladder" is stored in the library, but the library is shifted to a higher mass by the addition of a 90bp adapter sequence. 図9Cは、卵巣がん患者(OvC)および「健常ドナー」(HD)からのゲノム、血漿由来cfDNAライブラリーの代表例を示す図である。FIG. 9C is a diagram showing representative examples of genomic and plasma-derived cfDNA libraries from ovarian cancer patients (OvC) and "healthy donors" (HD).

図10は、4つの血漿試料から得た8つのcfDNAライブラリーにわたるユニークリード数を示す図である。この試料23407を用いたライブラリー構築前の断片化(frag)はライブラリー収量を2倍より大きく増加させた。FIG. 10 shows the number of unique reads across eight cfDNA libraries from four plasma samples. Fragmentation prior to library construction using this sample 23407 increased library yield more than 2-fold.

図11は、TP53遺伝子の領域全域のcfDNAの代表リードカバレッジを示す図である。「TP53_NM_000546_chr17:7579351:region_3:280nt:41:80:r」捕捉プローブ(配列番号201)によって捕捉された24個の131bpリードをランダムに選択し、UCSCゲノムブラウザ内のBLATアルゴリズムを使用してアラインした。21個のリードが標的領域にマッピングされ、カバレッジが重複するパターンでそのようにされる。これらのリードを捕捉するために使用したプローブに矢印を付けてある。FIG. 11 is a diagram showing representative read coverage of cfDNA over the entire region of the TP53 gene. "TP53_NM_000546_chr17: 7579351: region_3: 280nt: 41: 80: r" Twenty-four 131bp reads captured by the capture probe (SEQ ID NO: 201) were randomly selected and aligned using the BLAT algorithm within the UCSC Genome Browser. .. Twenty-one reads are mapped to the target area and so in a pattern of overlapping coverage. Arrows are attached to the probes used to capture these leads.

図12は、cfDNAゲノムライブラリーからのTP53遺伝子のコード領域の標的化DNAシークエンシングの大要を示す図である。カバレッジ(横軸)は、10個すべてのコード領域にわたって伸び、mRNAスプライシングに関与するイントロン領域を含む。シークエンシングの深度(縦軸)は、最大4851に達し、全コーディングエクソンにわたって均一である。FIG. 12 is a diagram illustrating the outline of targeted DNA sequencing of the coding region of the TP53 gene from the cfDNA genomic library. Coverage (horizontal axis) extends across all 10 coding regions and contains intron regions involved in mRNA splicing. Sequencing depth (vertical axis) reaches up to 4851 and is uniform across all coding exons.

図13は、ACA2ベースのアッセイにおけるqPCR推定ゲノム当量に対するユニークリード数のプロットを示す図である。Y軸のリード数に対してX軸にqPCR測定値を示す。これらの測定値間の完全な一致を対角線として示す。測定値間の相関は、特により低いゲノムインプットでは、あったとしても非常に不良であった。これらのデータは、ACA2ベースのqPCRアッセイが、ライブラリー複雑度を慢性的に過小推定し、ゲノム当量の測定に不適切であることを示す。FIG. 13 shows a plot of unique read numbers for qPCR estimated genomic equivalents in an ACA2-based assay. The qPCR measurement value is shown on the X-axis with respect to the number of reads on the Y-axis. The perfect match between these measurements is shown diagonally. Correlation between measurements was very poor, if any, especially at lower genomic inputs. These data indicate that the ACA2-based qPCR assay chronically underestimates library complexity and is unsuitable for measuring genomic equivalents.

図14は、ゲノム反復配列特異的プライマー(例えばAlu)と長いアダプター特異的プライマーを対にするqPCRゲノム当量測定アッセイのコアエレメントの概略図を示す図である。(A)ACA2という名の単一の25ntプライマー(プライマー1)を使用する標準ライブラリー増幅。(B)より長い、58ntバージョンACA2プライマー(プライマー2)は、ステム−ループ抑制のためゲノムライブラリーを増幅させない。(C)コンセンサスヒトAlu反復配列エレメントに指向されたフォワードおよびリバースプライマー(プライマー3および4)は、何千もの座位を認識し、ゲノムDNAを容易に増幅させる。(D)ロングACA2プライマー(プライマー2)と対にした、フォワードまたはリバースどちらか一方の単独の単一Aluプライマー(プライマー3またはプライマー4)は、ゲノムDNAを増幅させない。(E)(D)の場合と同じプライマー対は、Alu配列を含有するゲノムcfDNAライブラリークローンを容易に増幅させる。FIG. 14 is a schematic diagram of the core elements of a qPCR genome equivalence assay paired with a genomic repeat-specific primer (eg, Alu) and a long adapter-specific primer. (A) Standard library amplification using a single 25nt primer (primer 1) named ACA2. The 58nt version of the ACA2 primer (primer 2), which is longer than (B), does not amplify the genomic library due to stem-loop inhibition. (C) Consensus Forward and reverse primers (primers 3 and 4) directed to the human Alu repeat element recognize thousands of loci and easily amplify genomic DNA. (D) A single single Alu primer (primer 3 or primer 4) paired with a long ACA2 primer (primer 2), either forward or reverse, does not amplify genomic DNA. (E) The same primer pair as in (D) facilitates amplification of genomic cfDNA library clones containing the Alu sequence.

図15は、ゲノム当量のAluプラスアダプターベースのqPCRアッセイについての概念実証データを示す図である。(A)様々なPCRプライマーでの10pgの標準ゲノムライブラリーの増幅。x軸は、増幅に使用したPCRプライマーを特定し、Y軸(logスケール)は、測定したPCRシグナルを単位fg/μLで示す。標準ACA2プライマーは、予想通り、強いシグナルを生成した。ACA2ロングプライマーは、PCR抑制のためシグナルを生成できなかった。2つのAluプライマー対は両方とも、ACA2量の1%でシグナルを生成した。これは、クローンの1%が増幅可能なAlu配列を有することを示唆する。ロングACA2プライマーと任意のAluプライマーとの組合せも、クローンの約1%においてシグナルを生成した。(B)10pgのゲノムDNA(左側4試料)または10pgのライブラリーDNA(右側4クローン)に対する検証。Aluプライマー対は、ゲノムDNAまたはゲノムライブラリーから同等のシグナルを増幅させる。対照的に、AluプライマーおよびロングACA2プライマーからなるプライマー対は、ゲノムDNAをあまり増幅させない(L+A1F)か、全く増幅させない(L+A1R)。これらの同じ対は、Aluプライマー対からのシグナルをわずかに上回るライブラリー増幅を示す。FIG. 15 is a diagram showing proof-of-concept data for a genomic equivalent Alu Plus adapter-based qPCR assay. (A) Amplification of a 10 pg standard genomic library with various PCR primers. The x-axis identifies the PCR primers used for amplification and the Y-axis (log scale) indicates the measured PCR signal in units of fg / μL. The standard ACA2 primer, as expected, produced a strong signal. The ACA2 long primer was unable to generate a signal due to PCR suppression. Both of the two Alu primer pairs generated a signal at 1% of the ACA2 amount. This suggests that 1% of the clones have an amplifyable Alu sequence. The combination of the long ACA2 primer and any Alu primer also produced a signal in about 1% of the clones. (B) Verification of 10 pg genomic DNA (4 samples on the left side) or 10 pg library DNA (4 clones on the right side). The Alu primer pair amplifies the equivalent signal from genomic DNA or genomic library. In contrast, a primer pair consisting of an Alu primer and a long ACA2 primer does not amplify genomic DNA very much (L + A1F) or does not amplify it at all (L + A1R). These same pairs show library amplification that slightly exceeds the signal from the Alu primer pair.

図16は、ACA2プライマーqPCRアッセイとAlu−ACA2ロング−プライマーqPCRアッセイの直接比較を示す図である。Alu ACA2ロング−プライマーqPCRアッセイは、シークエンシングデータから導出されるユニークリード数とより一致する、検出可能なゲノム当量の8倍増加を示す。FIG. 16 is a diagram showing a direct comparison between the ACA2 primer qPCR assay and the Alu-ACA2 long-primer qPCR assay. The Alu ACA2 long-primer qPCR assay shows an 8-fold increase in detectable genomic equivalents that is more consistent with the number of unique reads derived from the sequencing data.

図17は、解析されるゲノム当量を正確に決定する高感度、定量的遺伝子アッセイのアダプター構造および機能の代表例を示す図である。(A)アダプターライゲーション鎖の詳細な構造。番号を付けた各エレメントに関する詳細は実施例4で提供する。(B)45ntライゲーション鎖および12ntパートナーオリゴ鎖とで形成された二本鎖は、末端修復cfDNA断片(黒棒)と適合性の平滑末端ライゲーション基質を生成する。(C)ライゲーション後、ライゲーション鎖の相補体がDNAポリメラーゼ媒介フィルイン反応によって生成される。FIG. 17 is a diagram showing representative examples of the adapter structure and function of a highly sensitive, quantitative gene assay that accurately determines the genomic equivalent to be analyzed. (A) Detailed structure of the adapter ligation chain. Details of each numbered element are provided in Example 4. (B) The double strand formed by the 45 nt ligation strand and the 12 nt partner oligo strand produces a blunt-ended ligation substrate compatible with the terminal-repaired cfDNA fragment (black bar). (C) After ligation, a complement of the ligation strand is produced by a DNA polymerase-mediated fill-in reaction.

図18は、cfDNAを模倣するように処理した2つのDNA試料(NA06994およびNCI−H2228)のサイズ分布の代表例を示す図である。FIG. 18 is a diagram showing a representative example of the size distribution of two DNA samples (NA06994 and NCI-H2228) treated to mimic cfDNA.

図19は、正常ゲノムDNA(N)と混合した腫瘍試料DNA(H2228)におけるTP53点変異Q331の検出感度の代表例を示す図である。最高感度の検出は、遺伝子の正常なコピー1000個中、TP53の変異体コピー約1個に相当する。FIG. 19 is a diagram showing a representative example of the detection sensitivity of the TP53 point mutation Q331 * in the tumor sample DNA (H2228) mixed with the normal genomic DNA (N). The most sensitive detection corresponds to about 1 mutant copy of TP53 out of 1000 normal copies of the gene.

図20は、本明細書において企図される組成物および方法を使用する、細胞株NCI−H2228内にあるEML4−ALK融合遺伝子についてのジャンクション配列の正確な決定を示す図である。FIG. 20 shows the exact determination of junction sequences for the EML4-ALK fusion gene within cell line NCI-H2228 using the compositions and methods contemplated herein.

図21は、正常ゲノムDNA(N)と混合したEML4−ALK融合遺伝子腫瘍試料DNA(H2228)の検出を示す図である。この融合体は、NCI−H2228細胞株中にヘテロ接合体として存在するので、最高感度の検出は、ALK遺伝子の正常染色体コピー約100個(50ゲノム当量)中、遺伝子融合体1個に相当する。FIG. 21 is a diagram showing the detection of EML4-ALK fusion gene tumor sample DNA (H2228) mixed with normal genomic DNA (N). Since this fusion is present as a heterozygot in the NCI-H2228 cell line, the most sensitive detection corresponds to one gene fusion out of about 100 normal chromosome copies of the ALK gene (50 genomic equivalents). ..

図22は、正常ヒトDNA(N)へと希釈される細胞株NCI−H69(H69)の混合物におけるMYCN遺伝子増幅の検出を示す図である。2つの正常二倍体コピーの閾値を赤い破線として示す。FIG. 22 shows the detection of MYCN gene amplification in a mixture of cell lines NCI-H69 (H69) diluted to normal human DNA (N). The thresholds for the two normal diploid copies are shown as dashed red lines.

図23は、3名の異なるがん患者のTP53遺伝子において検出されたDNA変異を示す図である。規範的遺伝子モデルを図の上部に示す。ピークは、DNA配列カバレッジ(X軸)および深度(Y軸)を表す。シークエンシングの深度は、解析したすべての試料について、>4000ゲノム当量であった。その遺伝子モデルの下の第7エクソンの拡大図は、検出されたすべての変異が局在定位された位置を示す。cfDNA(血漿)、腫瘍組織および正常隣接組織における変異体検出頻度を入手可能な場合は示す(NA−入手不能)。OVA1およびOVA2は、卵巣がん患者であり、CRC406およびCRC407は、結腸直腸がん患者である。OVA1試料のいずれにおいてもTP53の変異は見いだされなかった。FIG. 23 is a diagram showing DNA mutations detected in the TP53 gene of three different cancer patients. The normative genetic model is shown at the top of the figure. Peaks represent DNA sequence coverage (X-axis) and depth (Y-axis). Sequencing depth was> 4000 genomic equivalents for all samples analyzed. The magnified view of the 7th exon below the genetic model shows the location where all the detected mutations are localized. The frequency of mutation detection in cfDNA (plasma), tumor tissue and normal adjacent tissues, if available, is shown (NA-not available). OVA1 and OVA2 are patients with ovarian cancer, and CRC406 and CRC407 are patients with colorectal cancer. No mutations in TP53 were found in any of the OVA1 samples.

図24は、より大きい13遺伝子パネル(四角で囲われているもの)のDNAシークエンシングを示す図である。このシークエンシングによって、卵巣がん患者OVA1からのcfDNAおよび腫瘍においてKRAS変異が同定された。FIG. 24 is a diagram showing DNA sequencing of a larger 13 gene panel (enclosed in a square). This sequencing identified KRAS mutations in cfDNA and tumors from ovarian cancer patient OVA1.

図25は、より大きい12遺伝子パネルのDNAシークエンシングを示す図である。このシークエンシングによって、結腸直腸がん患者CRC407の血漿においてERBB2遺伝子増幅が同定された。FIG. 25 is a diagram showing DNA sequencing of a larger 12 gene panel. This sequencing identified ERBB2 gene amplification in the plasma of colorectal cancer patient CRC407.

A.大要
本発明は、一部には、無細胞DNA(cfDNA)を使用する個体の遺伝子状態の定量的遺伝子解析のための組成物および方法を企図している。本明細書で使用する場合、用語「遺伝子状態」は、遺伝性状態または遺伝疾患についての原因とならない正常配列に関係するまたは原因となる配列に関係するゲノムにおける1つまたは複数の標的ゲノム配列の配列を指す。一実施形態では、遺伝子状態の解析は、標的遺伝子座位における遺伝子バリアントの同定、定量またはモニタリングを指し、バリアントは参照配列(例えば、正常または変異配列)に対して異なる。本発明者らは、真の陽性を偽陽性と区別する感度の欠如、個々のDNA分子の非効率的なクローニングおよび増幅、ならびにシークエンシングの特異的ゲノム座位への非効率的な標的化に関連する、遺伝性状態または遺伝疾患の分子診断上の問題の解決策を提供した。本明細書において企図される解決策は、試料処理中に生ずる偽陽性シグナルと真の陽性試験結果を区別するのに十分な感度を有する信頼性のある頑強な定量的遺伝子解析のための組成物および方法を含む。
A. The present invention, in part, contemplates compositions and methods for quantitative genetic analysis of the genetic status of individuals using cell-free DNA (cfDNA). As used herein, the term "genetic state" refers to one or more target genomic sequences in a genome that are related to or are related to a normal sequence that is not causative for a hereditary state or genetic disorder. Refers to an array. In one embodiment, analysis of genetic status refers to the identification, quantification or monitoring of a gene variant at a target gene locus, where the variant differs relative to a reference sequence (eg, normal or mutated sequence). We relate to the lack of sensitivity to distinguish true positives from false positives, inefficient cloning and amplification of individual DNA molecules, and inefficient targeting of sequencing to specific genomic loci. Provided a solution to molecular diagnostic problems of hereditary status or genetic disorders. The solution contemplated herein is a composition for reliable and robust quantitative gene analysis that is sensitive enough to distinguish between false positive signals and true positive test results that occur during sample processing. And methods included.

次世代シークエンシング技術は、がん、胎児診断、親子鑑定、病原体スクリーニングおよび臓器移植モニタリングを含む様々なシナリオでの分子診断に広範なゲノム調査を加える機会を与えている。遺伝疾患との関連で、次世代シークエンシング情報は、遺伝子機能を変化させる可能性が高い遺伝子内の変異を同定するために、細胞内の遺伝物質の増加または減少を同定するため、および正常な健常細胞では見いだされないゲノム再編成を同定するために臨床の場で使用されている。これらの広範な診断調査の結果は、患者の処置を導出するために使用されることが多い。 Next-generation sequencing technology offers the opportunity to add extensive genomic research to molecular diagnostics in a variety of scenarios, including cancer, fetal diagnosis, paternity testing, pathogen screening and organ transplant monitoring. In the context of genetic disease, next-generation sequencing information is used to identify mutations in genes that are likely to alter gene function, to identify increases or decreases in intracellular genetic material, and to identify normal. It is used clinically to identify genomic rearrangements not found in healthy cells. The results of these extensive diagnostic studies are often used to derive patient treatment.

しかし、個体の遺伝子状態または遺伝性状態もしくは遺伝疾患の診断および処置におけるDNAシークエンシングの潜在的利点より、試料を得るために罹患組織に直接到達する必要性のほうが上回る。そのような材料は、疾患の診断に使用される初期生検から得ることが困難であることが多く、時間をかけて何度も繰り返して得ることは、事実上、不可能である。同様に、がん患者の場合、生検は、到達し難い腫瘍を有する患者では可能でなく、転移性疾患に罹患している個体には現実的でない。対照的に、本発明者らのアプローチは、すべての組織が生存するために脈管構造への到達を必要とし、結果としてこれらの塊が体液中にDNAを堆積させるという事実に由来する。罹病細胞のDNAを見つけられる体液の1つの主要な貯蔵所はヒト血液の血漿である。 However, the need to reach the affected tissue directly to obtain a sample outweighs the potential benefits of DNA sequencing in the diagnosis and treatment of an individual's genetic or hereditary status or genetic disease. Such materials are often difficult to obtain from the initial biopsy used to diagnose the disease, and it is virtually impossible to obtain them over and over again over time. Similarly, in the case of cancer patients, biopsy is not possible in patients with inaccessible tumors and is not feasible for individuals suffering from metastatic disease. In contrast, our approach derives from the fact that all tissues require access to vasculature for survival, and as a result these clumps deposit DNA in body fluids. One major reservoir of body fluid in which the DNA of affected cells can be found is the plasma of human blood.

浅いゲノムワイド配列カバレッジに依存する試験方法とは対照的に、個体の遺伝子状態、遺伝疾患、メンデル型遺伝病、遺伝子モザイク、胎児試験、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、病原体スクリーニング、マイクロバイオームプロファイリング、および臓器移植モニタリングのための本明細書において企図される分子診断は、cfDNAの入手可能性を活用して、選択された標的遺伝子の深い配列カバレッジをもたらす。加えて、本明細書において企図されるcfDNAベースのがん診断には、タンパク質機能を変化させる体細胞配列変動、キメラ遺伝子融合を生じさせる大規模染色体再編、および遺伝子コピーの減少または増加を含むコピー数変動を含む、様々な遺伝子変化を検出する能力がある。企図される組成物および方法を使用すると、健常組織内で起こる正常な代謝回転プロセスが一因となるcfDNA内の正常配列の有意な希釈またはそのような正常配列の混合にもかかわらず、これらの変化を検出でき、定量できる。本明細書において企図される組成物および方法は、疾患の原因となる低頻度遺伝子変化の検出に関連する大きな課題、すなわち、cfDNAが高度に断片化されること、cfDNAレベルが、異なる個体間で実質的に異なること、および正常配列に対する罹病配列の混合度が、患者間で、同じ分子病および病期に罹患している個体の中でさえ、高度に可変的であることにもうまく対処する。 In contrast to test methods that rely on shallow genome-wide sequence coverage, individual genetic status, genetic disorders, Mendel-type genetic disorders, genetic mosaics, fetal studies, parent-child identification, prediction of response to drug treatment, diagnosis or monitoring of pathology. The molecular diagnostics contemplated herein for pathogen screening, microbiome profiling, and organ transplant monitoring leverage the availability of cfDNA to provide deep sequence coverage of selected target genes. In addition, cfDNA-based cancer diagnostics contemplated herein include somatic cell sequence changes that alter protein function, large-scale chromosomal reorganizations that result in chimeric gene fusions, and copy reductions or increases in gene copy. It has the ability to detect various genetic changes, including number fluctuations. With the intended compositions and methods, these are despite a significant dilution of normal sequences in cfDNA or a mixture of such normal sequences, which is contributed by the normal turnover process that occurs in healthy tissue. Changes can be detected and quantified. The compositions and methods contemplated herein are the major challenges associated with the detection of low frequency genetic changes responsible for disease: highly fragmented cfDNA, between individuals with different cfDNA levels. It also copes well with the fact that it is substantially different and that the mix of diseased sequences with respect to normal sequences is highly variable between patients, even among individuals suffering from the same molecular disease and stage. ..

様々な実施形態では、遺伝子解析のための組成物および方法は、生体液試料および糞便試料中のDNA画分を調べることを含む。本明細書において企図される方法は、様々な生物源から入手できるcfDNAを使用する分子遺伝子解析に対処するための新規包括的フレームワークを提供する。精製cfDNAのクローニングは、下流の解析のための情報を与え、結果として生ずるクローンライブラリーの増幅を可能にするタグ付きcfDNA配列を導入する。標的特異的オリゴヌクレオチドを用いるハイブリッド捕捉が、その後の解析のための特異的配列を検索するために使用される。ライブラリー中に存在するゲノムの数の独立した測定が各試料に適用され、これらのアッセイが、そのアッセイの感度を推定するための手段を提供する。本明細書において企図されるアッセイは、遺伝子状態、遺伝性状態または遺伝疾患を解析、検出、診断またはモニターするための信頼性のある、再現性のある、頑強な方法を提供する。 In various embodiments, compositions and methods for genetic analysis include examining DNA fractions in biofluid and stool samples. The methods contemplated herein provide a novel comprehensive framework for addressing molecular genetic analysis using cfDNA available from a variety of biological sources. Cloning of purified cfDNA introduces a tagged cfDNA sequence that provides information for downstream analysis and allows amplification of the resulting clone library. Hybrid capture with target-specific oligonucleotides is used to search for specific sequences for subsequent analysis. Independent measurements of the number of genomes present in the library are applied to each sample, and these assays provide a means for estimating the sensitivity of that assay. Assays contemplated herein provide a reliable, reproducible, robust method for analyzing, detecting, diagnosing or monitoring a genetic state, hereditary state or genetic disorder.

本発明の特定の実施形態の実施は、特に相反する指示がない限り、当技術分野の技術の範囲内である化学、生化学、有機化学、分子生物学、微生物学、組換えDNA技術、遺伝学、免疫学および細胞生物学の従来の方法を利用することになり、これらの方法の多くを説明のために下に記載する。そのような技術は、文献で十分に説明されている。例えば、Sambrookら、Molecular Cloning: A Laboratory Manual(第3版、2001年);Sambrookら、Molecular Cloning: A Laboratory Manual(第2版、1989年);Maniatisら、Molecular Cloning: A Laboratory Manual(1982年);Ausubelら、Current Protocols in Molecular Biology(John Wiley and Sons、2008年7月
改定);Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology、Greene Pub.Associates and Wiley-Interscience;Glover、DNA Cloning: A Practical Approach、IおよびII巻
(IRL Press、Oxford、1985年);Anand、Techniques for the Analysis of Complex Genomes(Academic Press、New York、1992年);Transcription and Translation(B. HamesおよびS. Higgins編、1984年);Perbal、A Practical Guide to Molecular Cloning(1984年);ならびにHarlowおよびLane、Antibodies
(Cold Spring Harbor Laboratory Press、Cold Spring Harbor、N.Y.、1998
年)を参照されたい。
Implementation of a particular embodiment of the invention is within the scope of the art of the art, chemistry, biochemistry, organic chemistry, molecular biology, microbiology, recombinant DNA technology, genetics, unless otherwise contradictory. Traditional methods of chemistry, immunology and cell biology will be utilized, many of which are described below for illustration. Such techniques are well described in the literature. For example, Sambrook et al., Molecular Cloning: A Laboratory Manual (3rd edition, 2001); Sambrook et al., Molecular Cloning: A Laboratory Manual (2nd edition, 1989); Maniatis et al., Molecular Cloning: A Laboratory Manual (1982). ); Ausubel et al., Current Protocols in Molecular Biology (John Wiley and Sons, revised July 2008); Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Greene Pub.Associates and Wiley-Interscience; Glover , DNA Cloning: A Practical Approach, Volumes I and II (IRL Press, Oxford, 1985); Anand, Techniques for the Analysis of Complex Genomes (Academic Press, New York, 1992); Transcription and Translation (B. Hames and S. Higgins, 1984); Perbal, A Practical Guide to Molecular Cloning (1984); and Harlow and Lane, Antibodies
(Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1998
Year).

B.定義
別段の定義がない限り、本明細書において使用するすべての専門および科学用語は、本発明が属する技術分野の当業者によって一般に理解されているのと同じ意味を有する。本明細書に記載のものと同様または等価の任意の方法および材料を本発明の実施または試験に使用してもよいが、組成物、方法および材料の好ましい実施形態を本明細書に記載する。本発明のために、以下の用語を下で定義する。
B. Definitions Unless otherwise defined, all technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which the invention belongs. Any method and material similar to or equivalent to that described herein may be used in the practice or testing of the invention, but preferred embodiments of the composition, method and material are described herein. For the present invention, the following terms are defined below.

冠詞「a」、「an」および「the」は、その冠詞の文法上の目的語の1つまたは1つより多く(すなわち少なくとも1つ)を指すために本明細書では使用する。例として、「要素(an element)」は、1つの要素または1つより多くの要素を意味する。 The articles "a," "an," and "the" are used herein to refer to one or more (ie, at least one) of the grammatical objects of the article. As an example, "an element" means one element or more than one element.

選択肢(例えば「または」)の使用は、選択肢のどちらか一方、両方、またはそれらの任意の組合せを意味すると理解するべきである。 It should be understood that the use of choices (eg, "or") means either, both, or any combination of choices.

用語「および/または」は、選択肢のどちらか一方、または両方を意味すると理解するべきである。 It should be understood that the term "and / or" means one or both of the choices.

本明細書で使用する場合、用語「約」または「おおよそ」は、参照数量、レベル、値、数、頻度、百分率、寸法、サイズ、量、重量または長さに対して15%、10%、9%、8%、7%、6%、5%、4%、3%、2%または1%ほど変る数量、レベル、値、数、頻度、百分率、寸法、サイズ、量、重量または長さを指す。一実施形態では、用語「約」または「おおよそ」は、参照数量、レベル、値、数、頻度、百分率、寸法、サイズ、量、重量または長さについての±15%、±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%または±1%の数量、レベル、値、数、頻度、百分率、寸法、サイズ、量、重量または長さの範囲を指す。 As used herein, the term "about" or "approximate" refers to 15%, 10%, weight or length to a reference quantity, level, value, number, frequency, percentage, dimension, size, quantity, weight or length. 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% or 1% variable quantity, level, value, number, frequency, percentage, dimension, size, quantity, weight or length Point to. In one embodiment, the term "about" or "approximate" is ± 15%, ± 10%, ± 9 for reference quantity, level, value, number, frequency, percentage, dimension, size, quantity, weight or length. %, ± 8%, ± 7%, ± 6%, ± 5%, ± 4%, ± 3%, ± 2% or ± 1% quantity, level, value, number, frequency, percentage, dimension, size, Refers to a range of quantity, weight or length.

本明細書を通して、文脈上他の意味に解すべき場合を除き、語「〜を含む(comprise)」、「〜を含む(comprises)」および「〜を含むこと(comprising)」は、述べられているステップもしくは要素またはステップもしくは要素の群の包含を含意するが、他のいかなるステップもしくは要素またはステップもしくは要素の群の除外も含意しないと理解されるであろう。特定の実施形態では、用語「〜を含む(include)」、「〜を有する(has)」、「〜を含有する(contains)」および「〜を含む(comprise)」を同義で使用する。 Throughout this specification, the terms "comprise", "comprises" and "comprising" are stated, except where the context requires other meanings. It will be understood to imply the inclusion of a step or element or step or group of elements, but not the exclusion of any other step or element or step or group of elements. In certain embodiments, the terms "include", "has", "constains" and "comprise" are used interchangeably.

「〜からなる」は、その句「〜からなる」の後に続くものを何であれ含み、それに限定されることを意図する。したがって、句「〜からなる」は、挙げられている要素が必要とされ、または必須であること、および他の要素が存在し得ないことを示す。 "Consists of" is intended to include and be limited to whatever follows the phrase "consisting of". Therefore, the phrase "consisting of" indicates that the listed element is required or required, and that no other element can exist.

「〜から本質的になる」は、この句の後に挙げられており、その挙げられている要素についての開示の中で指定されている活性または作用に干渉も寄与もしない他の要素に限定されるあらゆる要素を含むことを意図する。したがって、句「〜から本質的になる」は、挙げられている要素が必要とされるまたは必須であるが、他の要素は、任意選択ではなく、挙げられている要素の活性または作用にそれらが影響を与えるか否かに応じて存在してもしなくてもよいことを示す。 "Being essential from" is listed after this phrase and is limited to other elements that do not interfere with or contribute to the activity or action specified in the disclosure of the listed element. Intended to include all elements. Therefore, the phrase "becomes essential from" is required or required for the listed elements, while the other elements are not optional, but rather for the activity or action of the listed elements. Indicates that may or may not be present, depending on whether or not it affects.

本明細書を通して「一実施形態」、「ある実施形態」、「特定の実施形態」、「関連実施形態」、「ある特定の実施形態」、「追加の実施形態」もしくは「さらなる実施形態」またはこれらの組合せへの言及は、その実施形態に関連して記載する特定の特徴、構造または特性が本発明の少なくとも一実施形態に含まれることを意味する。したがって、本明細書を通して様々な箇所での上述の句の出現は、必ずしもすべてが同じ実施形態に言及していない。さらに、特定の特徴、構造または特性を1つまたは複数の実施形態においていずれの好適な様式で組み合わせてもよい。 Throughout the present specification, "one embodiment", "an embodiment", "a specific embodiment", "a related embodiment", "a specific embodiment", "an additional embodiment" or "a further embodiment" or References to these combinations mean that the particular features, structures or properties described in connection with that embodiment are included in at least one embodiment of the invention. Therefore, the appearance of the above clauses at various points throughout the specification does not necessarily refer to the same embodiment. In addition, specific features, structures or properties may be combined in any suitable manner in one or more embodiments.

本明細書で使用する場合、用語「単離された」は、そのネイティブ状態で通常はそれに付随する成分が実質的にまたは本質的にない物質を意味する。特定の実施形態では、用語「得られた」または「由来する」を単離されたと同義で使用している。 As used herein, the term "isolated" means a substance in its native state that is normally or essentially free of associated components. In certain embodiments, the term "obtained" or "derived from" is used synonymously with isolated.

本明細書で使用する場合、用語「DNA」は、デオキシリボ核酸を指す。様々な実施形態では、用語DNAは、ゲノムDNA、組換えDNA、合成DNAまたはcDNAを指す。一実施形態では、DNAは、ゲノムDNAまたはcDNAを指す。特定の実施形態では、DNAは、「標的領域」を含む。本明細書において企図されるDNAライブラリーは、ゲノムDNAライブラリーおよびRNA(例えば、RNA発現ライブラリー)から構築されたcDNAライブラリーを含む。様々な実施形態では、DNAライブラリーは、1つまたは複数の追加のDNA配列および/またはタグを含む。 As used herein, the term "DNA" refers to deoxyribonucleic acid. In various embodiments, the term DNA refers to genomic DNA, recombinant DNA, synthetic DNA or cDNA. In one embodiment, DNA refers to genomic DNA or cDNA. In certain embodiments, the DNA comprises a "target region". The DNA libraries contemplated herein include genomic DNA libraries and cDNA libraries constructed from RNA (eg, RNA expression libraries). In various embodiments, the DNA library comprises one or more additional DNA sequences and / or tags.

「標的遺伝子座位」または「DNA標的領域」は、DNA配列内の目的の領域を指す。様々な実施形態では、標的化遺伝子解析は、標的遺伝子座位に対して行われる。特定の実施形態では、DNA標的領域は、特定の遺伝子状態、遺伝性状態、遺伝疾患、胎児試験、遺伝子モザイク、親子鑑定、薬物処置に対する応答の予測、病状の診断もしくはモニタリング、マイクロバイオームプロファイリング、病原体スクリーニング、または臓器移植モニタリングに関連する遺伝子の領域である。 The "target gene locus" or "DNA target region" refers to a region of interest within a DNA sequence. In various embodiments, the targeted gene analysis is performed on the target gene locus. In certain embodiments, the DNA target region is a particular genetic state, hereditary state, genetic disorder, fetal test, genetic mosaic, parent-child identification, prediction of response to drug treatment, diagnosis or monitoring of pathology, microbiome profiling, pathogens. A region of genes related to screening or organ transplant monitoring.

本明細書で使用する場合、用語「循環DNA」、「循環無細胞DNA」および「無細胞DNA」は、多くの場合、交換可能に使用しており、細胞外DNAであるDNA、細胞から押し出されたDNA、または壊死もしくはアポトーシス細胞から放出されたDNAを指す。 As used herein, the terms "circulating DNA," "circulating cell-free DNA," and "cell-free DNA" are often used interchangeably and are extracellular DNA, DNA, extruded from cells. DNA, or DNA released from necrotic or apoptotic cells.

本明細書で使用される「対象」、「個体」または「患者」は、本明細書において企図される組成物で検出または同定することができる状態の症状を示すあらゆる動物を含む。好適な対象は、実験動物(例えばマウス、ラット、ウサギまたはモルモット)、家畜(例えばウマ、ウシ、ヒツジ、ブタ)、および飼育動物またはペット(例えばネコまたはイヌ)を含む。特定の実施形態では、対象は哺乳動物である。ある特定の実施形態では、対象は非ヒト霊長類であり、好ましい実施形態では、対象はヒトである。 As used herein, "subject," "individual," or "patient" includes any animal that exhibits symptoms of a condition that can be detected or identified in the compositions herein. Suitable subjects include laboratory animals (eg mice, rats, rabbits or guinea pigs), livestock (eg horses, cows, sheep, pigs), and domestic animals or pets (eg cats or dogs). In certain embodiments, the subject is a mammal. In certain embodiments, the subject is a non-human primate, and in a preferred embodiment, the subject is a human.

C.無細胞DNAの遺伝子解析の方法
様々な実施形態では、cfDNAの遺伝子解析のための方法が提供される。
C. Methods for Gene Analysis of Cell-Free DNA In various embodiments, methods for gene analysis of cfDNA are provided.

特定の実施形態では、cfDNAの遺伝子解析のための方法は、cfDNAライブラリーを生成し、増幅させるステップ、cfDNAライブラリー中のゲノム当量の数を決定するステップ、および1つまたは複数のゲノム標的座位の定量的遺伝子解析を行うステップを含む。 In certain embodiments, methods for gene analysis of cfDNA include the steps of generating and amplifying a cfDNA library, determining the number of genomic equivalents in the cfDNA library, and one or more genomic target loci. Includes steps to perform quantitative genetic analysis of.

cfDNAの遺伝子解析のための方法は、cfDNAを1つまたは複数の末端修復酵素で処置して末端修復cfDNAを生成し、末端修復cfDNAの各末端に1つまたは複数のアダプターをライゲーションしてcfDNAライブラリーを生成するステップ、cfDNAライブラリーを増幅させてcfDNAライブラリークローンを生成するステップ、cfDNAライブラリークローンのゲノム当量の数を決定するステップ、およびcfDNAライブラリークローン中の1つまたは複数の標的遺伝子座位の定量的遺伝子解析を行うステップを含む。 The method for gene analysis of cfDNA is to treat cfDNA with one or more terminal repair enzymes to produce terminal repair cfDNA and ligate one or more adapters to each end of the terminal repair cfDNA to ligate the cfDNA live. A step to generate a rally, a step to amplify the cfDNA library to generate a cfDNA library clone, a step to determine the number of genomic equivalents of the cfDNA library clone, and one or more target genes in the cfDNA library clone. Includes steps to perform quantitative genetic analysis of the sitting position.

1.cfDNAライブラリーの生成
特定の実施形態では、本明細書において企図される遺伝子解析の方法は、cfDNAを1つまたは複数の末端修復酵素で処置して末端修復cfDNAを生成するステップ、および末端修復cfDNAの各末端に1つまたは複数のアダプターをライゲーションしてcfDNAライブラリーを生成するステップを含む、cfDNAライブラリーを生成するステップを含む。
1. 1. Generation of cfDNA Library In certain embodiments, the methods of genetic analysis contemplated herein are the steps of treating cfDNA with one or more terminal repair enzymes to produce terminal repair cfDNA, and terminal repair cfDNA. Includes a step to generate a cfDNA library, comprising ligating one or more adapters to each end of the to generate a cfDNA library.

(a)無細胞DNA(cfDNA)
本明細書において企図される方法および組成物は、無細胞DNA(cfDNA)を分析物として使用して遺伝子状態、遺伝性状態、遺伝疾患、遺伝子モザイク、胎児診断、親子鑑定、マイクロバイオームプロファイリング、病原体スクリーニングおよび臓器移植モニタリングを効率的に解析、検出、診断および/またはモニターするように設計される。cfDNAのサイズ分布は、約150bp〜約180bp断片の範囲である。断片化は、エンドヌクレアーゼ切断活性および/またはエキソヌクレアーゼ切断活性の結果でありえ、cfDNAの正確で信頼性のある頑強な解析に厄介な課題を提示する。cfDNAの解析のもう1つの課題は、約15分程度の血流中でのその短い半減期である。いかなる特定の理論にも拘束されることを望むものではないが、本発明は、一部には、cfDNAの解析が、「リキッドバイオプシー」のようなものであって、現状の生物学的過程のリアルタイムスナップショットであることを企図している。
(A) Cell-free DNA (cfDNA)
The methods and compositions contemplated herein use acellular DNA (cfDNA) as an analyte for genetic status, hereditary status, genetic disease, genetic mosaic, fetal diagnosis, paternity testing, microbiome profiling, pathogens. Designed to efficiently analyze, detect, diagnose and / or monitor screening and organ transplant monitoring. The size distribution of cfDNA ranges from about 150 bp to about 180 bp fragments. Fragmentation can be the result of endonuclease cleavage activity and / or exonuclease cleavage activity, presenting a daunting task for accurate, reliable and robust analysis of cfDNA. Another challenge in the analysis of cfDNA is its short half-life in the bloodstream of about 15 minutes. Although not bound by any particular theory, the present invention, in part, is such that the analysis of cfDNA is like "liquid biopsy" and is part of the current biological process. Intended to be a real-time snapshot.

さらに、cfDNAは細胞内では見いだされず、生体液および糞便試料を含むが、これらに限定されないいくつかの好適な源から得ることができるので、解析する組織への直接到達などの次世代シークエンシング解析を悩ませる既存の制限を受けない。 In addition, cfDNA is not found intracellularly and can be obtained from several suitable sources, including but not limited to biofluids and fecal samples, for next-generation sequencing analysis such as direct access to the tissue to be analyzed. Not subject to the existing restrictions that bother you.

特定の実施形態でのcfDNAを単離するための好適な源である生体液の実例としては、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、粘液および汗が挙げられるが、これらに限定されない。 Examples of biofluids that are suitable sources for isolating cfDNA in certain embodiments include amniotic fluid, blood, plasma, serum, semen, lymph, cerebrospinal fluid, ophthalmic fluid, urine, saliva, mucus and Sweat is mentioned, but not limited to these.

特定の実施形態では、生体液は、血液または血漿である。 In certain embodiments, the biological fluid is blood or plasma.

ある特定の実施形態では、市販のキットおよび当業者に公知の他の方法を使用して、患者の生体液から、あるいは以前に得た、例えば、凍結および/またはEDTA、EGTA、もしくは二価カチオンに特異的な他のキレート剤を含むがこれらに限定されない酵素キレート剤の添加によって必要に応じて安定化された生体試料から、直接cfDNAを単離することができる。 In certain embodiments, commercially available kits and other methods known to those of skill in the art are used to obtain, for example, freeze and / or EDTA, EGTA, or divalent cations from the patient's biofluid or previously. CfDNA can be isolated directly from biological samples that are optionally stabilized by the addition of enzyme chelating agents that include, but are not limited to, other chelating agents that are specific to.

(b)末端修復cfDNAの生成
特定の実施形態では、cfDNAライブラリーの生成は、単離されたcfDNAの末端修復を含む。断片化cfDNAを末端修復酵素によって処理して、平滑末端、5’−オーバーハングまたは3’−オーバーハングを有する、末端修復cfDNAを生成する。一部の実施形態では、末端修復酵素は、例えば産出することができる。一部の実施形態では、末端修復cfDNAは、平滑末端を含有する。一部の実施形態では、末端修復cfDNAは、平滑末端を含有するように処理される。一部の実施形態では、末端修復cfDNAの平滑末端は、単一塩基対オーバーハングを含有するようにさらに修飾される。一部の実施形態では、平滑末端を含有する末端修復cfDNAを、アデニン(A)/チミン(T)オーバーハングを含有するようにさらに処理することができる。一部の実施形態では、平滑末端を含有する末端修復cfDNAを、単一塩基対オーバーハングとしてアデニン(A)/チミン(T)オーバーハングを含有するようにさらに処理することができる。一部の実施形態では、末端修復cfDNAは、鋳型なし3’オーバーハングを有する。一部の実施形態では、末端修復cfDNAは、3’オーバーハングを含有するように処理される。一部の実施形態では、末端修復cfDNAは、3’オーバーハングを含有するようにターミナルトランスフェラーゼ(TdT)で処理される。一部の実施形態では、GテールをTdTによって付加させることができる。一部の実施形態では、末端修復cfDNAは、任意の公知の制限酵素で(例えば、酵素Sau3Aなどで)の部分消化を使用してオーバーハング末端を含有するように処理される。
(B) Generation of end-repaired cfDNA In certain embodiments, generation of the cfDNA library comprises end-repair of isolated cfDNA. Fragmented cfDNA is treated with a terminal repair enzyme to produce terminal repair cfDNA with a blunt end, 5'-overhang or 3'-overhang. In some embodiments, the terminal repair enzyme can be produced, for example. In some embodiments, the terminal repair cfDNA contains a blunt end. In some embodiments, the terminal repair cfDNA is processed to contain a blunt end. In some embodiments, the blunt ends of the terminal repair cfDNA are further modified to contain a single base pair overhang. In some embodiments, terminal repair cfDNA containing blunt ends can be further treated to contain an adenine (A) / thymine (T) overhang. In some embodiments, the blunt-ended terminal repair cfDNA can be further treated to contain an adenine (A) / thymine (T) overhang as a single base pair overhang. In some embodiments, the terminal repair cfDNA has an untemplated 3'overhang. In some embodiments, the terminal repair cfDNA is processed to contain a 3'overhang. In some embodiments, the terminal repair cfDNA is treated with terminal transferase (TdT) to contain a 3'overhang. In some embodiments, the G-tail can be added by TdT. In some embodiments, the terminal repair cfDNA is treated to contain an overhang terminal using partial digestion with any known restriction enzyme (eg, with the enzyme Sau3A, etc.).

(c)末端修復cfDNAへのアダプター分子のライゲーション
特定の実施形態では、cfDNAライブラリーの生成は、末端修復cfDNAの各末端への1つまたは複数のアダプターのライゲーションを含む。本発明は、一部には、cfDNAライブラリー中の多数のゲノム当量に対応するように設計されたアダプターモジュールを企図している。アダプターモジュールは、cfDNAライブラリー中に存在するゲノム当量の数、およびその延長で、配列変異を同定するために使用されるシークエンシングアッセイの感度を測定するように構成される。
(C) Ligation of adapter molecule to terminal repair cfDNA In certain embodiments, generation of the cfDNA library comprises ligation of one or more adapters to each terminal of the terminal repair cfDNA. The present invention, in part, contemplates an adapter module designed to accommodate a large number of genomic equivalents in a cfDNA library. The adapter module is configured to measure the sensitivity of the sequencing assay used to identify sequence mutations by the number of genomic equivalents present in the cfDNA library, and its extension.

本明細書で使用する場合、用語「アダプターモジュール」は、少なくとも5つのエレメント:(i)単一プライマーライブラリー増幅のためのPCRプライマー結合部位を含む第1のエレメント、(ii)一意的に同定された各シークエンシングリードに作用する5ヌクレオチドリードコードを含む第2のエレメント、(iii)異なる試料を識別し、シークエンシングラン中に試料多重化を可能にするための3ヌクレオチド試料コードを含む第3のエレメント、(iv)シークエンシングリードの中の適正な塩基コールの校正を可能にし、パートナーオリゴヌクレオチドへのハイブリダイゼーションのためのアンカーとして作用する、12ヌクレオチドアンカー配列を含む第4のエレメント、および(v)エレメント4の2つの3’末端ヌクレオチドを含む第5のエレメント(図17および表12〜16)を含むポリヌクレオチドを指す。アダプターモジュールを、エレメント4に相補的であるパートナーオリゴヌクレオチドにハイブリダイズさせて、cfDNA、必要に応じて末端修復され平滑末端化されたcfDNAの末端へのライゲーションに好適なアダプターを形成する。 As used herein, the term "adapter module" refers to at least five elements: (i) a first element containing a PCR primer binding site for amplification of a single primer library, (ii) uniquely identified. A second element containing a 5-nucleotide read code acting on each sequenced read, (iii) a third element containing a 3-nucleotide sample code to identify different samples and allow sample multiplexing during the sequencing run. Element 3, (iv) a fourth element containing a 12 nucleotide anchor sequence, which allows calibration of the proper base call in the sequencing read and acts as an anchor for hybridization to the partner oligonucleotide, and (V) Refers to a polynucleotide comprising a fifth element (FIGS. 17 and Tables 12-16) comprising two 3'terminal nucleotides of element 4. The adapter module is hybridized to a partner oligonucleotide that is complementary to element 4 to form an adapter suitable for ligation to the ends of cfDNA, optionally repaired and blunt-ended cfDNA.

特定の実施形態では、アダプターモジュールは、1つまたは複数のPCRプライマー配列、1つまたは複数のリードコード、1つまたは複数の試料コード、1つまたは複数のアンカー配列、および効率的ライゲーション基質である2つまたはそれ超の3’ヌクレオチドを含む。追加の実施形態では、アダプターモジュールは、1つまたは複数のシークエンシングプライマー結合部位をさらに含む。 In certain embodiments, the adapter module is one or more PCR primer sequences, one or more read codes, one or more sample codes, one or more anchor sequences, and an efficient ligation substrate. Contains 2 or more 3'nucleotides. In additional embodiments, the adapter module further comprises one or more sequencing primer binding sites.

特定の実施形態では、アダプターモジュールは、cfDNAライブラリーの単一プライマー増幅のための1つまたは複数のPCRプライマー結合配列を含む第1のエレメントを含む。一実施形態では、PCRプライマー結合配列は、約12〜約40ヌクレオチド、約18〜約40ヌクレオチド、約20〜約35ヌクレオチド、または約20〜約30ヌクレオチドである。別の実施形態では、PCRプライマー結合配列は、約12ヌクレオチド、約13ヌクレオチド、約14ヌクレオチド、約15ヌクレオチド、約16ヌクレオチド、約17ヌクレオチド、約18ヌクレオチド、約19ヌクレオチド、約20ヌクレオチド、約21ヌクレオチド、約22ヌクレオチド、約23ヌクレオチド、約24ヌクレオチド、約25ヌクレオチド、約26ヌクレオチド、約27ヌクレオチド、約28ヌクレオチド、約29ヌクレオチド、約30ヌクレオチド、約31ヌクレオチド、約32ヌクレオチド、約33ヌクレオチド、約34ヌクレオチド、約35ヌクレオチド、約36ヌクレオチド、約37ヌクレオチド、約38ヌクレオチド、約39ヌクレオチド、または約40ヌクレオチドまたはそれ超である。 In certain embodiments, the adapter module comprises a first element containing one or more PCR primer binding sequences for single primer amplification of the cfDNA library. In one embodiment, the PCR primer binding sequence is about 12 to about 40 nucleotides, about 18 to about 40 nucleotides, about 20 to about 35 nucleotides, or about 20 to about 30 nucleotides. In another embodiment, the PCR primer binding sequence is about 12 nucleotides, about 13 nucleotides, about 14 nucleotides, about 15 nucleotides, about 16 nucleotides, about 17 nucleotides, about 18 nucleotides, about 19 nucleotides, about 20 nucleotides, about 21. Nucleotides, about 22 nucleotides, about 23 nucleotides, about 24 nucleotides, about 25 nucleotides, about 26 nucleotides, about 27 nucleotides, about 28 nucleotides, about 29 nucleotides, about 30 nucleotides, about 31 nucleotides, about 32 nucleotides, about 33 nucleotides, About 34 nucleotides, about 35 nucleotides, about 36 nucleotides, about 37 nucleotides, about 38 nucleotides, about 39 nucleotides, or about 40 nucleotides or more.

一実施形態では、PCRプライマー結合配列は、約25ヌクレオチドである。 In one embodiment, the PCR primer binding sequence is about 25 nucleotides.

特定の実施形態では、アダプターモジュールは、1つまたは複数のリードコード配列を含む第2のエレメントを含む。本明細書で使用する場合、用語「リードコード」は、ユニークシークエンシングリードを同定するために使用されるポリヌクレオチドを指す。一実施形態では、リードコードは、ヌクレオチドのランダム配列である。一実施形態では、リードコードは、約1ヌクレオチド、約2ヌクレオチド、約3ヌクレオチド、約4ヌクレオチド、約5ヌクレオチド、約6ヌクレオチド、約7ヌクレオチド、約8ヌクレオチド、約9ヌクレオチド、約10ヌクレオチドまたはそれ超である。 In certain embodiments, the adapter module comprises a second element that includes one or more readcode sequences. As used herein, the term "read code" refers to a polynucleotide used to identify a unique sequencing read. In one embodiment, the read code is a random sequence of nucleotides. In one embodiment, the readcode is about 1 nucleotide, about 2 nucleotides, about 3 nucleotides, about 4 nucleotides, about 5 nucleotides, about 6 nucleotides, about 7 nucleotides, about 8 nucleotides, about 9 nucleotides, about 10 nucleotides or the like. It's super.

非限定的な例として、5ヌクレオチドコードは、可能性のある256のユニーク配列からなり、ここで選択される各コードは、そのセット内の他のすべてのコードと2ヌクレオチド異なる。この特徴によって、ユニークな別個のリードと、コード領域内のシークエンシングエラーのためユニークであるように見えるリードとを区別することが可能になる。特定の実施形態では、特定の配列の組合せのため、アダプター機能に干渉すると実験によって判定されたコードは使用から除外されることがあり、例えば、256のうちの7つのコードにはGヌクレオチドの過剰提示があったので除外した。 As a non-limiting example, the 5 nucleotide code consists of 256 possible unique sequences, and each code selected here is 2 nucleotides different from all other codes in the set. This feature makes it possible to distinguish between unique and distinct reads and reads that appear unique due to sequencing errors in the code area. In certain embodiments, due to a particular sequence combination, codes that are experimentally determined to interfere with adapter function may be excluded from use, for example, 7 of 256 codes have an excess of G nucleotides. I excluded it because it was presented.

他の実施形態では、5、6、7、8、9、10またはそれ超のヌクレオチドの各リードコードは、他のすべてのリードコードと2、3、4または5ヌクレオチド異なることがある。 In other embodiments, each read code of 5, 6, 7, 8, 9, 10 or more nucleotides may differ from all other read codes by 2, 3, 4 or 5 nucleotides.

一実施形態では、リードコードは、約5ヌクレオチドであり、他のすべてのリードコードと2ヌクレオチド異なる。 In one embodiment, the read code is about 5 nucleotides, which is 2 nucleotides different from all other read codes.

特定の実施形態では、アダプターモジュールは、1つまたは複数の試料コード配列を含む第3のエレメントを含む。本明細書で使用する場合、用語「試料コード」は、試料を識別するために使用されるポリヌクレオチドを指す。試料コードは、多重シークエンシング反応を確立するのにも有用である。なぜなら、各試料コードは試料に一意であり、したがって、各試料コードを使用して、多重シークエンシング反応物中の特定の試料からリードを識別することができるからである。 In certain embodiments, the adapter module comprises a third element containing one or more sample coding sequences. As used herein, the term "sample code" refers to a polynucleotide used to identify a sample. The sample code is also useful for establishing multiple sequencing reactions. This is because each sample code is unique to the sample and therefore each sample code can be used to identify leads from a particular sample in a multisequencing reactant.

一実施形態では、試料コードは、約1、約2ヌクレオチド、約3ヌクレオチド、約4ヌクレオチドもしくは約5ヌクレオチドまたはそれ超である配列を含む。別の実施形態では、2、3、4、5またはそれ超のヌクレオチドの各試料コードは、他のすべての試料コードと2、3、4または5ヌクレオチド異なることがある。 In one embodiment, the sample code comprises a sequence that is about 1, about 2 nucleotides, about 3 nucleotides, about 4 nucleotides or about 5 nucleotides or more. In another embodiment, each sample code of 2, 3, 4, 5 or more nucleotides may differ from all other sample codes by 2, 3, 4 or 5 nucleotides.

一実施形態では、試料コードは、約3ヌクレオチドであり、他の試料に使用される他のすべての試料コードと2ヌクレオチド異なる。 In one embodiment, the sample code is about 3 nucleotides, which is 2 nucleotides different from all other sample codes used for other samples.

特定の実施形態では、アダプターモジュールは、1つまたは複数のアンカー配列を含む第4のエレメントを含む。本明細書で使用する場合、「アンカー配列」は、少なくとも8ヌクレオチド、少なくとも10ヌクレオチド、少なくとも12ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも16ヌクレオチドのヌクレオチド配列であって、パートナーオリゴヌクレオチドにハイブリダイズし、以下の3つの特性を含むヌクレオチド配列を指す:(1)各アンカー配列が、伸長内の各部位における可能性のある4つのDNA塩基の各々を集合的に表すアンカー配列4つのファミリーの一部である(この特徴、バランスのとれた塩基提示は、特定の実施形態でのシークエンシングリードにおける適正な塩基コーリングの校正に有用である)、(2)各アンカー配列が、可能性のある4つの塩基のうちの2つだけからなり、これらが、同数のA+Cまたは同数のG+Tのどちらか一方であるように特異的に選択される(2つだけの塩基から形成されるアンカー配列は、適正なアダプター機能を不可能にすることになる二次構造形成にアンカー配列が関与する可能性を低下させる)、および(3)各アンカー配列は同数のA+CまたはG+Tからなるので、各アンカー配列が、4つ1セットの他のすべてのアンカー配列と大体同じ融解温度および二本鎖安定性を共有する。 In certain embodiments, the adapter module comprises a fourth element that includes one or more anchor arrays. As used herein, an "anchor sequence" is a nucleotide sequence of at least 8 nucleotides, at least 10 nucleotides, at least 12 nucleotides, at least 14 nucleotides, or at least 16 nucleotides, hybridizing to a partner oligonucleotide and below. Refers to a nucleotide sequence containing the three properties of: (1) Each anchor sequence is part of a family of four anchor sequences that collectively represent each of the four potential DNA bases at each site within the extension. (This feature, balanced base presentation, is useful for calibrating proper base calling in sequencing reads in certain embodiments), (2) Each anchor sequence has four possible bases. It consists of only two of them and is specifically selected so that they are either the same number of A + C or the same number of G + T (anchor sequences formed from only two bases are proper adapter functions. (3) Since each anchor sequence consists of the same number of A + C or G + T, each anchor sequence is four 1 It shares approximately the same melting temperature and double-stranded stability as all other anchor sequences in the set.

特定の実施形態では、アダプター分子は、エレメント4の2つの3’末端ヌクレオチドからなる第5のエレメントを含む。各アンカーの3’末端のこれら2つの塩基は、これら2つのヌクレオチドがcfDNAへのライゲーションに効率的な基質であることを示す実験による判定に基づいて選択される。特定の実施形態では、エレメント5は、AA、CC、TTおよびGGからなる群から選択される配列を含む。特定の実施形態では、エレメント5は、ジヌクレオチドの組合せCGまたはTGを含まない。本発明者らは、これらの組合せが効率的なライゲーション基質でないと判断したからである。 In certain embodiments, the adapter molecule comprises a fifth element consisting of two 3'terminal nucleotides of element 4. These two bases at the 3'end of each anchor are selected based on experimental determination that these two nucleotides are efficient substrates for ligation to cfDNA. In certain embodiments, element 5 comprises a sequence selected from the group consisting of AA, CC, TT and GG. In certain embodiments, element 5 does not include a combination of dinucleotides CG or TG. This is because the present inventors have determined that these combinations are not efficient ligation substrates.

特定の実施形態では、ライゲーションステップは、「タグ付き」cfDNAライブラリーを生成するために末端修復cfDNAにアダプターモジュールをライゲーションすることを含む。一部の実施形態では、単一のアダプターモジュールが利用される。一部の実施形態では、2、3、4または5つのアダプターモジュールが利用される。一部の実施形態では、同一配列のアダプターモジュールが、断片化された末端修復DNAの各末端にライゲーションされる。 In certain embodiments, the ligation step comprises ligating an adapter module to terminal repair cfDNA to generate a "tagged" cfDNA library. In some embodiments, a single adapter module is utilized. In some embodiments, 2, 3, 4 or 5 adapter modules are utilized. In some embodiments, an adapter module of the same sequence is ligated to each end of the fragmented end repair DNA.

一実施形態では、複数のアダプター種が末端修復cfDNAライブラリーにライゲーションされる。複数のアダプターの各々は、cfDNAライブラリーの増幅のための1つまたは複数のプライマー結合部位、1つまたは複数のリードコード配列、試料多重化のための1つまたは複数の配列、およびDNAシークエンシングのための1つまたは複数の配列を含むことがある。 In one embodiment, multiple adapter species are ligated to a terminal repair cfDNA library. Each of the adapters has one or more primer binding sites for amplification of the cfDNA library, one or more read-coding sequences, one or more sequences for sample multiplexing, and DNA sequencing. May contain one or more sequences for.

本明細書において企図される1つまたは複数のアダプターのライゲーションは、当業者に公知の方法によって行うことができる。特定の実施形態では、本明細書において企図される1つまたは複数のアダプターは、平滑末端を含む末端修復cfDNAにライゲーションされる。ある特定の実施形態では、本明細書において企図される1つまたは複数のアダプターは、用いられるライゲーション方法に適している相補末端を含む末端修復cfDNAにライゲーションされる。ある特定の実施形態では、本明細書において企図される1つまたは複数のアダプターは、3’オーバーハングを含む末端修復cfDNAにライゲーションされる。 Ligation of one or more adapters contemplated herein can be performed by methods known to those of skill in the art. In certain embodiments, one or more adapters contemplated herein are ligated to a terminal repair cfDNA containing a blunt end. In certain embodiments, one or more adapters contemplated herein are ligated to a terminal repair cfDNA containing complementary ends suitable for the ligation method used. In certain embodiments, one or more adapters contemplated herein are ligated to a terminal repair cfDNA containing a 3'overhang.

2.cfDNAライブラリー増幅
特定の実施形態では、本明細書において企図される遺伝子解析の方法は、cfDNAクローンライブラリーまたはcfDNAクローンのライブラリーを生成するためのcfDNAライブラリーの増幅を含む。cfDNAライブラリーの各分子は、末端修復cfDNAの各末端にライゲーションされたアダプターを含み、各アダプターは、1つまたは複数のPCRプライマー結合部位を含む。一実施形態では、異なるアダプターが末端修復cfDNAの異なる末端にライゲーションされる。
2. 2. cfDNA Library Amplification In certain embodiments, the methods of gene analysis contemplated herein include amplification of a cfDNA clone library or a cfDNA library to generate a library of cfDNA clones. Each molecule of the cfDNA library contains an adapter ligated to each end of the terminal repair cfDNA, and each adapter contains one or more PCR primer binding sites. In one embodiment, different adapters are ligated to different ends of the terminal repair cfDNA.

好ましい実施形態では、同じアダプターがcfDNAの両末端にライゲーションされる。末端修復cfDNAの両末端への同じアダプターのライゲーションは、単一プライマー配列でのPCR増幅を可能にする。特定の実施形態では、アダプターがライゲーションされたcfDNAライブラリーの一部は、標準PCR技術を使用して単一プライマー配列駆動増幅で増幅されることになる。一実施形態では、単一プライマー配列は、約25ヌクレオチドであり、場合によっては標準イオン強度条件下で55℃以上の推定Tmを有する。 In a preferred embodiment, the same adapter is ligated to both ends of cfDNA. Ligation of the same adapter to both ends of the terminal repair cfDNA allows PCR amplification with a single primer sequence. In certain embodiments, a portion of the adapter-ligated cfDNA library will be amplified by single primer sequence driven amplification using standard PCR techniques. In one embodiment, the single primer sequence is about 25 nucleotides and optionally has an estimated Tm of 55 ° C. or higher under standard ionic strength conditions.

特定の実施形態では、初期cfDNAライブラリーの数ピコグラムがcfDNAクローンの数マイクログラムに増幅され、これは、10,000倍増幅を含意する。増幅産物の量は、当技術分野において公知の方法、例えば、Qubit 2.0またはNanodrop装置での定量を使用して、測定することができる。 In certain embodiments, a few picograms of the initial cfDNA library are amplified to a few micrograms of cfDNA clones, which implies a 10,000-fold amplification. The amount of amplification product can be measured using methods known in the art, such as quantification with a Qubit 2.0 or Nanodrop device.

3.ゲノム当量の数の決定
様々な実施形態では、cfDNAの遺伝子解析のための方法は、cfDNAクローンライブラリー中のゲノム当量の数を決定するステップを含む。本明細書で使用する場合、用語「ゲノム当量」は、各ライブラリー中のゲノムコピーの数を指す。本明細書において企図される組成物および方法によって対処される重要な課題は、遺伝子配列における低頻度の遺伝子変異または差の検出および解析に十分なアッセイ感度を獲得することである。試料ごとにアッセイ感度値を決定するために、シークエンシングライブラリー中に存在するゲノム当量の数を測定することによって、各試料中に存在する異なる別個の配列の数を測定する。感度を確立するために、ゲノム当量の数を各試料ライブラリーについて測定しなければならない。
3. 3. Determining the number of genomic equivalents In various embodiments, the method for genetic analysis of cfDNA comprises determining the number of genomic equivalents in the cfDNA clone library. As used herein, the term "genome equivalent" refers to the number of genomic copies in each library. An important challenge addressed by the compositions and methods contemplated herein is to obtain sufficient assay sensitivity for the detection and analysis of infrequent gene mutations or differences in gene sequences. To determine the assay sensitivity value for each sample, the number of different distinct sequences present in each sample is measured by measuring the number of genomic equivalents present in the sequencing library. To establish sensitivity, the number of genomic equivalents must be measured for each sample library.

ゲノム当量の数は、qPCRアッセイによって、またはシークエンシングを行った後にバイオインフォマティクスベースの計数を使用することによって決定することができる。臨床試料のプロセスフローでは、ゲノム当量のqPCR測定が、cfDNAライブラリーのQCステップとして使用される。そのqPCR測定によって、配列解析前にアッセイ感度の期待値が確立され、試料を、その対応するcfDNAクローンライブラリーがゲノム当量の要求深度を欠く場合、解析から除外することができる。最後に、ゲノム当量のバイオインフォマティクスベースの計数も、所与のcfDNAクローンライブラリー各々についてのゲノム当量の同定に使用され、したがってアッセイ感度および偽陰性推定値の同定に使用される。 The number of genomic equivalents can be determined by the qPCR assay or by using bioinformatics-based counting after sequencing. In the clinical sample process flow, genomic equivalent qPCR measurements are used as the QC step in the cfDNA library. The qPCR measurement establishes the expected value of assay sensitivity prior to sequence analysis and the sample can be excluded from the analysis if its corresponding cfDNA clone library lacks the required depth of genomic equivalents. Finally, bioinformatics-based counting of genomic equivalents is also used to identify genomic equivalents for each given cfDNA clone library, and thus assay sensitivity and false negative estimates.

実験的qPCRアッセイと統計的計数アッセイは、よく相関するはずである。シークエンシングによってcfDNAクローンライブラリーの配列深度を明らかにすることができない場合、cfDNAクローンライブラリーの再処理および/または追加のシークエンシングが必要とされることがある。 The experimental qPCR assay and the statistical counting assay should correlate well. If sequencing cannot reveal the sequence depth of the cfDNA clone library, reprocessing and / or additional sequencing of the cfDNA clone library may be required.

一実施形態では、cfDNAクローンライブラリー中のゲノム当量は、定量的PCR(qPCR)アッセイを使用して決定される。特定の実施形態では、既知濃度の標準ライブラリーを使用して標準曲線を構築し、得られた標準曲線にqPCRアッセイからの測定値をフィッティングし、そのフィットからゲノム当量の値を導出する。驚くべきことに、本発明者らは、ゲノム内の共通配列、例えば反復配列に特異的にハイブリダイズする1つのプライマーと、アダプター内のプライマー結合部位と結合するもう1つのプライマーとを含むqPCR「反復配列ベースの」アッセイによって、(cfDNAクローンの両末端に存在する)アダプター特異的プライマーのみを使用する方法と比較して、ゲノム当量の8倍増加が測定されることを発見した。反復配列ベースのアッセイによって測定されるゲノム当量の数は、ライブラリー間でのより一貫した性能、およびゲノム当量のqPCR推定値とシークエンシングランでバイオインフォマティクスによって計数されるタグ当量とのより良好なアラインメントをもたらす。 In one embodiment, genomic equivalents in the cfDNA clone library are determined using a quantitative PCR (qPCR) assay. In certain embodiments, a standard library of known concentrations is used to construct a standard curve, the resulting standard curve is fitted with measurements from the qPCR assay, and genomic equivalent values are derived from the fit. Surprisingly, we have qPCRs that include one primer that specifically hybridizes to a common sequence in the genome, eg, a repeat sequence, and another primer that binds to a primer binding site in the adapter. Repeated sequence-based "assays have been found to measure an 8-fold increase in genomic equivalent compared to methods using only adapter-specific primers (present at both ends of the cfDNA clone). The number of genomic equivalents measured by the repeat sequence-based assay is better with more consistent performance across the libraries and better qPCR estimates of genomic equivalents and tag equivalents counted by bioinformatics in the sequencing run. Bring alignment.

本明細書において企図される反復配列ベースのゲノム当量アッセイでの使用に好適な反復配列の実例としては、短鎖散在反復配列(SINE)、例えばAlu反復配列;長鎖散在反復配列(LINE)、例えばLINE1、LINE2、LINE3;マイクロサテライト反復配列エレメント、例えば、短鎖タンデム反復配列(STR);単純配列反復(SSR);および哺乳類ワイド散在反復配列(MIR)が挙げられるが、これらに限定されない。 Examples of repetitive sequences suitable for use in the repetitive sequence-based genomic equivalence assay contemplated herein are short interspersed repeats (SINE), such as Alu repetitive sequences; long interspersed repetitive sequences (LINE). Examples include, but are not limited to, LINE1, LINE2, LINE3; microsatellite repetitive sequence elements such as short tandem repeats (STR); simple sequence repeats (SSR); and mammalian wide interspersed repeats (MIR).

一実施形態では、反復配列は、Alu反復配列である。 In one embodiment, the repetitive sequence is an Alu repetitive sequence.

4.定量的遺伝子解析
様々な実施形態では、cfDNAの遺伝子解析のための方法は、cfDNAライブラリークローンの1つまたは複数の標的遺伝子座位の定量的遺伝子解析を含む。定量的遺伝子解析は、以下のステップの1つもしくは複数、またはすべてを含む:標的遺伝子座位を含むcfDNAクローンを捕捉するステップ、捕捉された標的化遺伝子座位の増幅ステップ、捕捉され増幅された標的化遺伝子座位をシークエンシングするステップ、および得られた配列リードについてのバイオインフォマティック解析ステップ。
4. Quantitative Gene Analysis In various embodiments, methods for gene analysis of cfDNA include quantitative gene analysis of one or more target gene loci of the cfDNA library clone. Quantitative gene analysis involves one or more or all of the following steps: capturing a cfDNA clone containing a target gene locus, amplifying a captured target gene locus, capturing and amplifying targeting. Steps for sequencing gene loci and bioinformatic analysis steps for the resulting sequence reads.

(a)標的遺伝子座位の捕捉
本発明は、一部には、より大きいプローブの効率および信頼性を保持するように、しかしcfDNAクローンライブラリーにおける情報価値のない配列生成を最小にするように設計された捕捉プローブモジュールを企図している。「捕捉プローブモジュール」は、捕捉プローブ配列とテール配列とを含むポリヌクレオチドを指す。特定の実施形態では、捕捉プローブモジュール配列またはその一部分は、1つまたは複数のシークエンシングプライマーのためのプライマー結合部位として役立つ。
(A) Capturing target gene loci The invention is partly designed to maintain the efficiency and reliability of larger probes, but to minimize informative sequence generation in cfDNA clone libraries. The capture probe module is intended. "Capture probe module" refers to a polynucleotide comprising a capture probe sequence and a tail sequence. In certain embodiments, the capture probe module sequence or portion thereof serves as a primer binding site for one or more sequencing primers.

特定の実施形態では、捕捉プローブモジュールは、捕捉プローブを含む。本明細書で使用する場合、「捕捉プローブ」は、特異的DNA標的領域にハイブリダイズすることができる領域を指す。cfDNAの平均サイズは約150〜約170bpであり、高度に断片化されているので、本明細書において企図される組成物および方法は、目的のDNA標的領域を調べるための、高密度の比較的短い捕捉プローブの使用を含む。 In certain embodiments, the capture probe module comprises a capture probe. As used herein, "capture probe" refers to a region that can hybridize to a specific DNA target region. Since the average size of cfDNA is from about 150 to about 170 bp and is highly fragmented, the compositions and methods contemplated herein are relatively dense and relatively for investigating DNA target regions of interest. Includes the use of short capture probes.

高密度捕捉プローブの使用に伴う1つの特定の懸念は、一般に捕捉プローブが特異的「配列規則」を使用して設計されることである。例えば、冗長配列の領域、または極度の塩基組成の偏りを示す領域は、一般に、捕捉プローブの設計では除外される。しかし、本発明者らは、捕捉プローブ設計規則の柔軟性の欠如がプローブの性能に実質的に影響を及ぼさないことを発見した。対照的に、位置制約によって厳密に選択された捕捉プローブは、オンターゲット配列情報を提供し、オフターゲットのマッピング不能なリード捕捉を殆ど示さず、ほんの少数の例外はあるが均一で有用なオンターゲットリードをもたらす。さらに、接近したプローブ間隔での高い冗長性は、あまりよく機能しないこともある捕捉プローブを補って余りある。 One particular concern with the use of high density capture probes is that capture probes are generally designed using specific "sequence rules". For example, regions of redundant sequences, or regions that exhibit extreme base composition bias, are generally excluded in the design of capture probes. However, we have found that the inflexibility of the capture probe design rules does not substantially affect probe performance. In contrast, capture probes strictly selected by position constraints provide on-target sequence information, show little off-target unmapable read capture, and with only a few exceptions, uniform and useful on-target. Bring the lead. In addition, the high redundancy at close probe spacings more than compensates for capture probes that may not work very well.

特定の実施形態では、標的領域は複数の捕捉プローブによって標的とされ、ここで、任意の2つまたはそれ超の捕捉プローブは、互いに10ヌクレオチド以内、互いに15ヌクレオチド以内、互いに20ヌクレオチド以内、互いに25ヌクレオチド以内、互いに30ヌクレオチド以内、互いに35ヌクレオチド以内、互いに40ヌクレオチド以内、互いに45ヌクレオチド以内、もしくは互いに50ヌクレオチドまたはそれ超以内、およびすべての介在するヌクレオチド長で、標的領域と結合するように設計されている。 In certain embodiments, the target region is targeted by multiple capture probes, wherein any two or more capture probes are within 10 nucleotides of each other, within 15 nucleotides of each other, within 20 nucleotides of each other, and 25 of each other. Designed to bind to target regions within nucleotides, within 30 nucleotides of each other, within 35 nucleotides of each other, within 40 nucleotides of each other, within 45 nucleotides of each other, or within 50 or more nucleotides of each other, and with all intervening nucleotide lengths. ing.

一実施形態では、捕捉プローブは、約25ヌクレオチド、約26ヌクレオチド、約27ヌクレオチド、約28ヌクレオチド、約29ヌクレオチド、約30ヌクレオチド、約31ヌクレオチド、約32ヌクレオチド、約33ヌクレオチド、約34ヌクレオチド、約35ヌクレオチド、約36ヌクレオチド、約37ヌクレオチド、約38ヌクレオチド、約39ヌクレオチド、約40ヌクレオチド、約41ヌクレオチド、約42ヌクレオチド、約43ヌクレオチド、約44ヌクレオチド、または約45ヌクレオチドである。 In one embodiment, the capture probe is about 25 nucleotides, about 26 nucleotides, about 27 nucleotides, about 28 nucleotides, about 29 nucleotides, about 30 nucleotides, about 31 nucleotides, about 32 nucleotides, about 33 nucleotides, about 34 nucleotides, about. 35 nucleotides, about 36 nucleotides, about 37 nucleotides, about 38 nucleotides, about 39 nucleotides, about 40 nucleotides, about 41 nucleotides, about 42 nucleotides, about 43 nucleotides, about 44 nucleotides, or about 45 nucleotides.

一実施形態では、捕捉プローブは、約100ヌクレオチド、約200ヌクレオチド、約300ヌクレオチド、約400ヌクレオチド、または約100ヌクレオチドである。別の実施形態では、捕捉プローブは、約100ヌクレオチド〜約500ヌクレオチド、約200ヌクレオチド〜約500ヌクレオチド、約300ヌクレオチド〜約500ヌクレオチド、もしくは約400ヌクレオチド〜約500ヌクレオチド、またはこれらに介在する任意の範囲である。 In one embodiment, the capture probe is about 100 nucleotides, about 200 nucleotides, about 300 nucleotides, about 400 nucleotides, or about 100 nucleotides. In another embodiment, the capture probe is from about 100 nucleotides to about 500 nucleotides, from about 200 nucleotides to about 500 nucleotides, from about 300 nucleotides to about 500 nucleotides, or from about 400 nucleotides to about 500 nucleotides, or any intervening thereof. It is a range.

特定の実施形態では、捕捉プローブは、60ヌクレオチドではない。 In certain embodiments, the capture probe is not 60 nucleotides.

別の実施形態では、捕捉プローブは、60ヌクレオチドより実質的に小さいが、同じDNA標的領域を標的にする60ヌクレオチド捕捉プローブと同程度に、同様に、またはそれより良好にハイブリダイズする。 In another embodiment, the capture probe is substantially smaller than 60 nucleotides, but hybridizes as well as, or better than, to the same extent as a 60 nucleotide capture probe that targets the same DNA target region.

ある特定の実施形態では、捕捉プローブは、40ヌクレオチドである。 In certain embodiments, the capture probe is 40 nucleotides.

ある特定の実施形態では、捕捉プローブモジュールは、テール配列を含む。本明細書で使用する場合、用語「テール配列」は、特定の実施形態ではプライマー結合部位として役立つことができる、捕捉プローブモジュールの5’末端のポリヌクレオチドを指す。特定の実施形態では、シークエンシングプライマーは、テール領域内のプライマー結合部位と結合する。 In certain embodiments, the capture probe module comprises a tail sequence. As used herein, the term "tail sequence" refers to a polynucleotide at the 5'end of a capture probe module that can serve as a primer binding site in certain embodiments. In certain embodiments, the sequencing primer binds to a primer binding site within the tail region.

特定の実施形態では、テール配列は、約5〜約100ヌクレオチド、約10〜約100ヌクレオチド、約5〜約75ヌクレオチド、約5〜約50ヌクレオチド、約5〜約25ヌクレオチド、または約5〜約20ヌクレオチドである。ある特定の実施形態では、第3の領域は、約10〜約50ヌクレオチド、約15〜約40ヌクレオチド、約20〜約30ヌクレオチドもしくは約20ヌクレオチド、または介在する任意の数のヌクレオチドである。 In certain embodiments, the tail sequence is about 5 to about 100 nucleotides, about 10 to about 100 nucleotides, about 5 to about 75 nucleotides, about 5 to about 50 nucleotides, about 5 to about 25 nucleotides, or about 5 to about. It is 20 nucleotides. In certain embodiments, the third region is about 10 to about 50 nucleotides, about 15 to about 40 nucleotides, about 20 to about 30 nucleotides or about 20 nucleotides, or any number of intervening nucleotides.

特定の実施形態では、テール配列は、約30ヌクレオチド、約31ヌクレオチド、約32ヌクレオチド、約33ヌクレオチド、約34ヌクレオチド、約35ヌクレオチド、約36ヌクレオチド、約37ヌクレオチド、約38ヌクレオチド、約39ヌクレオチド、または約40ヌクレオチドである。 In certain embodiments, the tail sequence is about 30 nucleotides, about 31 nucleotides, about 32 nucleotides, about 33 nucleotides, about 34 nucleotides, about 35 nucleotides, about 36 nucleotides, about 37 nucleotides, about 38 nucleotides, about 39 nucleotides, Or about 40 nucleotides.

様々な実施形態では、捕捉プローブモジュールは、捕捉プローブにハイブリダイズするタグ付きおよび/または増幅cfDNAライブラリーの1つまたは複数の捕捉断片の単離および/または精製を可能にするための、結合対の特異的メンバーを含む。特定の実施形態では、捕捉プローブモジュールはビオチンまたは別の好適なハプテン、例えば、ジニトロフェノール、ジゴキシゲニンに結合している。 In various embodiments, the capture probe module is a binding pair to allow isolation and / or purification of one or more capture fragments of a tagged and / or amplified cfDNA library that hybridizes to the capture probe. Includes specific members of. In certain embodiments, the capture probe module is attached to biotin or another suitable hapten, such as dinitrophenol, digoxigenin.

様々な実施形態では、捕捉プローブモジュールを、必要に応じて増幅されたタグ付きのcfDNAライブラリーにハイブリダイズさせて複合体を形成する。一部の実施形態では、多官能性捕捉プローブモジュールは、cfDNAライブラリーの特異的ゲノム標的領域に実質的にハイブリダイズする。 In various embodiments, the capture probe module is hybridized to an optionally amplified tagged cfDNA library to form a complex. In some embodiments, the polyfunctional capture probe module substantially hybridizes to a specific genomic target region of the cfDNA library.

ハイブリダイゼーションまたはハイブリダイズ条件は、2つのヌクレオチド配列が安定な複合体を形成する、例えば、タグ付きcfDNAライブラリーと捕捉プローブモジュールが安定なタグ付きcfDNAライブラリー−捕捉プローブモジュール複合体を形成する、任意の反応条件を含むことができる。そのような反応条件は当技術分野において周知であり、そのような条件を適宜改変することができる、例えば、より短い長さの捕捉プローブを用いてアニーリング温度を低下させることができること、およびそのような条件が本発明の範囲内でありうることは、当業者には理解されるであろう。実質的なハイブリダイゼーションは、捕捉プローブ複合体の第2の領域がタグ付きcfDNAライブラリーの領域と100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、85%、80%、75%または70%の配列同一性、相同性または相補性を示すときに起こりうる。 Hybridization or hybridization conditions indicate that the two nucleotide sequences form a stable complex, eg, a tagged cfDNA library and a capture probe module form a stable tagged cfDNA library-capture probe module complex. Any reaction conditions can be included. Such reaction conditions are well known in the art and such conditions can be modified as appropriate, eg, the annealing temperature can be lowered using shorter length capture probes, and so on. It will be appreciated by those skilled in the art that such conditions may be within the scope of the present invention. Substantial hybridization is such that the second region of the capture probe complex is 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92 with the region of the tagged cfDNA library. It can occur when%, 91%, 90%, 89%, 88%, 85%, 80%, 75% or 70% show sequence identity, homology or complementarity.

特定の実施形態では、捕捉プローブは、約40ヌクレオチドであり、約44℃〜約47℃の最適アニーリング温度を有する。 In certain embodiments, the capture probe is about 40 nucleotides and has an optimal annealing temperature of about 44 ° C to about 47 ° C.

ある特定の実施形態では、本明細書において企図される方法は、タグ付きcfDNAライブラリー−捕捉プローブモジュール複合体を単離するステップを含む。特定の実施形態では、DNA複合体を単離する方法は当業者に周知であり、当業者によって適切と思われる任意の方法を本発明の方法とともに用いることができる(Ausubelら、Current Protocols in Molecular Biology、2007〜2012年)。特定の実施形態では、複合体
は、ビオチン−ストレプトアビジン単離技術を使用して単離される。
In certain embodiments, the method contemplated herein comprises the step of isolating a tagged cfDNA library-capture probe module complex. In certain embodiments, methods of isolating DNA complexes are well known to those of skill in the art and any method deemed appropriate by one of ordinary skill in the art can be used with the methods of the invention (Ausubel et al., Current Protocols in Molecular). Biology, 2007-2012). In certain embodiments, the complex is isolated using biotin-streptavidin isolation techniques.

特定の実施形態では、単離されたタグ付きcfDNAライブラリー−捕捉プローブモジュール複合体からの一本鎖3’末端の除去が企図される。ある特定の実施形態では、方法は、一本鎖3’末端を除去するための、単離されたタグ付きDNAライブラリー−多官能性捕捉プローブモジュール複合体の3’−5’エキソヌクレアーゼ酵素的処理を含む。 In certain embodiments, removal of the single-stranded 3'end from the isolated tagged cfDNA library-capture probe module complex is contemplated. In certain embodiments, the method is a 3'-5'exonuclease enzymatic of an isolated tagged DNA library-polyfunctional capture probe module complex for removing single-stranded 3'ends. Including processing.

ある特定の他の実施形態では、方法は、単離されたタグ付きDNAライブラリー断片を鋳型として利用して多官能性捕捉プローブの5’−3’DNAポリメラーゼ伸長を行うステップを含む。 In certain other embodiments, the method comprises the step of using the isolated tagged DNA library fragment as a template to perform 5'-3'DNA polymerase extension of the polyfunctional capture probe.

ある特定の他の実施形態では、方法は、5’FLAPエンドヌクレアーゼの協奏作用、DNA重合、およびDNAリガーゼによるニック閉鎖による、捕捉プローブと単離されたタグ付きcfDNAのハイブリッド標的分子を生成するステップを含む。 In certain other embodiments, the method produces a hybrid target molecule of capture probe and isolated tagged cfDNA by the concerted action of 5'FLAP endonuclease, DNA polymerization, and nick closure with DNA ligase. including.

単離されたタグ付きcfDNAライブラリー−多官能性捕捉プローブモジュール複合体の3’−5’エキソヌクレアーゼ酵素的処理に様々な酵素を利用することができる。特定の実施形態で利用することができる、3’−5’エキソヌクレアーゼ酵素活性を示す好適な酵素の実例としては、T4またはエキソヌクレアーゼI、III、Vが挙げられるが、これらに限定されない(Shevelev IV、Hubscher U.、「The 3' 5' exonucleases」
、Nat Rev Mol Cell Biol.、3巻(5号):364〜76頁(2002年)も参照されたい)。特定の実施形態では、3’−5’エキソヌクレアーゼ活性を含む酵素は、T4ポリメラーゼである。特定の実施形態では、3’−5’エキソヌクレアーゼ酵素活性を示し、プライマー鋳型伸長能力がある酵素を利用することができ、そのような酵素としては、例えば、T4またはエキソヌクレアーゼI、III、Vが挙げられる。同書。
Various enzymes can be utilized for the 3'-5'exonuclease enzymatic treatment of the isolated tagged cfDNA library-polyfunctional capture probe module complex. Examples of suitable enzymes exhibiting 3'-5'exonuclease enzyme activity that can be utilized in certain embodiments include, but are not limited to, T4 or exonucleases I, III, V. IV, Hubscher U., "The 3'5'exonucleases"
, Nat Rev Mol Cell Biol., Vol. 3, (No. 5): pp. 364-76 (2002)). In certain embodiments, the enzyme containing 3'-5'exonuclease activity is a T4 polymerase. In certain embodiments, enzymes exhibiting 3'-5'exonuclease enzyme activity and capable of extending the primer template can be utilized, such as T4 or exonucleases I, III, V. Can be mentioned. The same book.

一部の実施形態では、本明細書において企図される方法は、上記および本明細書中の他の箇所で論じられている3’−5’エキソヌクレアーゼで酵素的に処理された複合体に関するシークエンシングおよび/またはPCRを行うステップを含む。特定の実施形態では、捕捉プローブ分子のテール部分をコピーして、ハイブリッド核酸分子を生成する。一実施形態では、生成されるハイブリッド核酸分子は、捕捉プローブモジュールおよび捕捉プローブモジュールテール配列の相補体にハイブリダイズすることができる標的領域を含む。 In some embodiments, the method contemplated herein is a sequence for a complex enzymatically treated with a 3'-5'exonuclease discussed above and elsewhere herein. Includes steps to perform singing and / or PCR. In certain embodiments, the tail portion of the capture probe molecule is copied to produce a hybrid nucleic acid molecule. In one embodiment, the hybrid nucleic acid molecule produced comprises a target region that can hybridize to a capture probe module and a complement of the capture probe module tail sequence.

特定の実施形態では、遺伝子解析は、a)1つまたは複数の捕捉プローブモジュールを複数のcfDNAライブラリークローン中の1つまたは複数の標的遺伝子座位にハイブリダイズさせて、1つまたは複数の捕捉プローブモジュール−cfDNAライブラリークローン複合体を形成するステップ、b)a)からの1つまたは複数の捕捉プローブモジュール−cfDNAライブラリークローン複合体を単離するステップ、c)ステップb)からの1つまたは複数の単離された捕捉プローブモジュール−cfDNAライブラリークローン複合体を酵素的に処理するステップ、d)c)からの酵素的に処理された複合体に関するPCRを行うステップであって、捕捉プローブ分子のテール部分をコピーして増幅されたハイブリッド核酸分子を生成し、増幅されたハイブリッド核酸分子が、捕捉プローブおよび捕捉プローブモジュールテール配列の相補体にハイブリダイズすることができる標的ゲノム座位の標的配列を含むステップ、ならびにe)d)からの増幅されたハイブリッド核酸分子に関する定量的遺伝子解析を行うステップを含む。 In certain embodiments, the genetic analysis a) hybridizes one or more capture probe modules to one or more target gene loci in multiple cfDNA library clones and one or more capture probes. Module-CfDNA Library Clone Complex Forming Step, b) One or More Capture Probes from a) Module-cfDNA Library Clone Complex Isolation Step, c) One or More From Step b) A step of enzymatically treating a plurality of isolated capture probe modules-cfDNA library clone complexes, a step of performing PCR on the enzymatically treated complex from d) c), the capture probe molecule. Copies the tail portion of the gene to generate an amplified hybrid nucleic acid molecule, and the amplified hybrid nucleic acid molecule can hybridize to a complement of the capture probe and capture probe module tail sequence to a target sequence at the target genome locus. Including steps, as well as performing quantitative genetic analysis on the amplified hybrid nucleic acid molecule from e) d).

特定の実施形態では、特異的標的遺伝子座位のコピー数を決定する方法であって、a)1つまたは複数の捕捉プローブモジュールを複数のcfDNAライブラリークローン中の1つまたは複数の標的遺伝子座位にハイブリダイズさせて、1つまたは複数の捕捉プローブモジュール−cfDNAライブラリークローン複合体を形成するステップ、b)a)からの1つまたは複数の捕捉プローブモジュール−cfDNAライブラリークローン複合体を単離するステップ、c)ステップb)からの1つまたは複数の単離された捕捉プローブモジュール−cfDNAライブラリークローン複合体を酵素的に処理するステップ、d)c)からの酵素的に処理された複合体に関するPCRを行うステップであって、捕捉プローブ分子のテール部分をコピーして、増幅されたハイブリッド核酸分子を生成し、増幅されたハイブリッド核酸分子が、捕捉プローブおよび捕捉プローブモジュールテール配列の相補体にハイブリダイズすることができる標的遺伝子座位の標的配列を含むステップ、e)d)における増幅されたハイブリッド核酸分子のPCR増幅を行うステップ、ならびにf)e)におけるPCR反応を定量するステップであって、定量が、特異的標的領域のコピー数の決定を可能にするステップを含む方法が企図される。 In certain embodiments, it is a method of determining the number of copies of a specific target gene locus a) one or more capture probe modules in one or more target gene loci in multiple cfDNA library clones. Hybridize to form one or more capture probe module-cfDNA library clone complexes, b) Isolate one or more capture probe module-cfDNA library clone complexes from a) Step, c) Enzymatically treating one or more isolated capture probe module-cfDNA library clone complexes from step b), d) Enzymatically treated complex from c) In the step of performing PCR with respect to, the tail portion of the capture probe molecule is copied to generate an amplified hybrid nucleic acid molecule, and the amplified hybrid nucleic acid molecule becomes a complement to the capture probe and the capture probe module tail sequence. A step including a target sequence at a target gene locus that can be hybridized, a step of performing PCR amplification of the amplified hybrid nucleic acid molecule in e) d), and a step of quantifying the PCR reaction in f) e). A method is contemplated in which quantification involves a step that allows determination of the number of copies of a specific target region.

一実施形態では、ステップc)の酵素的処理は、3’−5’エキソヌクレアーゼ活性を使用してb)からの1つもしくは複数の捕捉プローブモジュール−cfDNAライブラリークローン複合体に関する3’−5’エキソヌクレアーゼ酵素的処理を行って、一本鎖3’末端を除去すること;5’FLAPエンドヌクレアーゼの協奏作用、DNA重合、およびDNAリガーゼによるニック閉鎖によって捕捉プローブモジュールとcfDNAライブラリークローンの1つもしくは複数のハイブリッド分子を生成すること;または複合体中の単離されたcfDNAクローンを鋳型として使用して捕捉プローブの5’−3’DNAポリメラーゼ伸長を行うことを含む。 In one embodiment, the enzymatic treatment of step c) is 3'-5 for one or more capture probe modules-cfDNA library clone complex from b) using 3'-5'exonuclease activity. 'Exonuclease Enzymatic treatment to remove single-stranded 3'ends; capture probe module and cfDNA library clone 1 by synergistic action of 5'FLAP end nuclease, DNA polymerization, and nick closure with DNA ligase Generating one or more hybrid molecules; or using an isolated cfDNA clone in the complex as a template to perform 5'-3'DNA polymerase extension of the capture probe.

一実施形態では、ステップc)の酵素的処理は、複合体中の単離されたcfDNAクローンを鋳型として使用して捕捉プローブの5’−3’DNAポリメラーゼ伸長を行うことを含む。 In one embodiment, the enzymatic treatment of step c) comprises using the isolated cfDNA clone in the complex as a template to perform 5'-3'DNA polymerase extension of the capture probe.

特定の実施形態では、PCRは、当業者に周知の任意の標準PCR反応条件を使用して行うことができる。ある特定の実施形態では、e)におけるPCR反応は、2つのPCRプライマーを利用する。一実施形態では、e)におけるPCR反応は、標的遺伝子座位内の反復配列にハイブリダイズする第1のPCRプライマーを利用する。特定の実施形態では、e)におけるPCR反応は、ハイブリッド核酸分子の標的遺伝子座位/テールジャンクションにハイブリダイズする第2のPCRプライマーを利用する。ある特定の実施形態では、e)におけるPCR反応は、標的遺伝子座位にハイブリダイズする第1のPCRプライマーと、増幅されたハイブリッド核酸分子の標的遺伝子座位/テールジャンクションにハイブリダイズする第2のPCRプライマーとを利用する。特定の実施形態では、第2のプライマーは、標的遺伝子座位/テールジャンクションに、プライマーの少なくとも1つまたは複数のヌクレオチドが標的遺伝子座位にハイブリダイズし、プライマーの少なくとも1つまたは複数のヌクレオチドがテール配列にハイブリダイズするように、ハイブリダイズする。 In certain embodiments, PCR can be performed using any standard PCR reaction conditions well known to those of skill in the art. In certain embodiments, the PCR reaction in e) utilizes two PCR primers. In one embodiment, the PCR reaction in e) utilizes a first PCR primer that hybridizes to a repetitive sequence within the target gene locus. In certain embodiments, the PCR reaction in e) utilizes a second PCR primer that hybridizes to the target gene locus / tail junction of the hybrid nucleic acid molecule. In certain embodiments, the PCR reaction in e) is a first PCR primer that hybridizes to the target gene locus and a second PCR primer that hybridizes to the target gene locus / tail junction of the amplified hybrid nucleic acid molecule. And use. In certain embodiments, the second primer hybridizes to the target gene locus / tail junction with at least one or more nucleotides of the primer hybridizing to the target gene locus and at least one or more nucleotides of the primer having a tail sequence. Hybridize as it hybridizes to.

ある特定の実施形態では、ステップe)から得られる増幅されたハイブリッド核酸分子がシークエンシングされ、それらの配列は水平方向にアラインされる、すなわち、互いにアラインされるが、参照配列にアラインされない。特定の実施形態では、ステップa)〜e)は、1つまたは複数の捕捉プローブモジュールを用いて1回または複数回反復される。捕捉プローブモジュールは、同じであってもまたは異なってもよく、標的遺伝子座位のcfDNA鎖のどちらか一方を標的にするように設計することができる。一部の実施形態では、捕捉プローブが異なる場合、それらは、タグ付きcfDNAクローンライブラリー中の標的遺伝子座位内の重複または隣接標的配列にハイブリダイズする。一実施形態では、複数の捕捉プローブが標的遺伝子座位にハイブリダイズし、複数の捕捉プローブの各々が、タグ付きcfDNAクローンライブラリー中の標的遺伝子座位にハイブリダイズする任意の他の捕捉プローブの約5、10、15、20、25、30、35、40、45、50、100、200bp以内(介在するすべての距離を含む)の標的遺伝子座位にハイブリダイズする、高密度捕捉プローブ戦略を使用する。 In certain embodiments, the amplified hybrid nucleic acid molecules obtained from step e) are sequenced and their sequences are horizontally aligned, i.e. aligned with each other, but not with reference sequences. In certain embodiments, steps a) to e) are repeated once or multiple times with one or more capture probe modules. The capture probe modules may be the same or different and can be designed to target either cfDNA strand at the target gene locus. In some embodiments, if the capture probes are different, they hybridize to duplicate or flanking target sequences within the target gene loci in the tagged cfDNA clone library. In one embodiment, a plurality of capture probes hybridize to a target gene locus, and each of the capture probes hybridizes to a target gene locus in a tagged cfDNA clone library of about 5 of any other capture probe. Use a high density capture probe strategy that hybridizes to target gene loci within 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200 bp (including all intervening distances).

一部の実施形態では、方法は、1つが標的領域の上流の「ワトソン」鎖(非コード鎖または鋳型鎖)にハイブリダイズし、1つが標的領域の下流の「クリック」鎖(コード鎖または非鋳型鎖)にハイブリダイズする、2つの捕捉プローブモジュールを、標的遺伝子座位1つにつき使用して行うことができる。 In some embodiments, the method hybridizes to the "Watson" strand (non-coding strand or template strand) upstream of the target region and one to the "click" strand (coding strand or non-coding strand) downstream of the target region. Two capture probe modules that hybridize to the template strand) can be used for each target gene locus.

特定の実施形態では、本明細書において企図される方法は、標的遺伝子座位1つにつき任意の数の捕捉プローブモジュール、例えば、2、3、4、5、6、7、8、9もしくは10またはそれ超の捕捉プローブモジュールであって、それらのうちの任意の数がワトソンまたはクリック鎖にハイブリダイズする捕捉プローブモジュールを任意の組合せで用いて、さらに何度も行うことができる。一部の実施形態では、得られた配列を互いにアラインして、いくつかの差のいずれかを同定することができる。 In certain embodiments, the methods contemplated herein are any number of capture probe modules per target gene locus, eg, 2, 3, 4, 5, 6, 7, 8, 9 or 10 or It can be done many more times with any combination of capture probe modules that are more than that and any number of them hybridize to Watson or Crick chains. In some embodiments, the resulting sequences can be aligned with each other to identify any of several differences.

ある特定の実施形態では、1つまたは複数の捕捉プローブモジュールを使用して、単一反応で複数の標的遺伝子座位、例えば、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、10000、50000、100000、500000またはそれ超の標的遺伝子座位が調べられる。 In certain embodiments, one or more capture probe modules are used to multiple target gene loci in a single reaction, eg, 100, 200, 300, 400, 500, 600, 700, 800, 900, Target gene loci of 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 10000, 50000, 100,000, 500,000 or more are examined.

(b)シークエンシング
特定の実施形態では、定量的遺伝子解析は、上記の、本明細書中の他の箇所で論じたような、複数のハイブリッド核酸分子を、複数のユニークシークエンシングリードを得るのに十分なシークエンシング深度を生じさせるようにシークエンシングするステップを含む。ユニークリードは、すべてがcfDNA内の同じリードコードおよび配列開始点を共有するリードの「ファミリー」からの単一のコンセンサスリードと定義する。各捕捉プローブは、ファミリーに分類することによって全リードから計算により抜き出される、1セットのユニークリードを生じさせる。次いで、所与の試料についてのユニークリードは、プローブごとに観測されたすべてのユニークリードの平均値として計算される。明らかなコピー数変化があるケースは、平均値の計算に使用されるデータセットから除外される。各ユニークリードをユニークcfDNAクローンから導出しなければならないので、ユニークリードは重要である。各ユニークリードは、ゲノムDNAの一倍体当量のインプットおよび解析を表す。ユニークリードの合計は、解析された一倍体ゲノムの合計である。そしてまた、解析されたゲノム数によって、シークエンシングアッセイの感度が定義される。非限定的な例として、平均ユニークリード数が100ゲノム当量である場合には、その特定のアッセイは、100個中の1個、すなわち1%の変異リードを検出することができる感度を有する。これ未満のいかなる観測も正当でない。
(B) Sequencing In certain embodiments, quantitative genetic analysis yields multiple unique sequencing reads of multiple hybrid nucleic acid molecules, as discussed elsewhere herein above. Includes the steps of sequencing to produce sufficient sequencing depth. A unique read is defined as a single consensus read from a "family" of reads that all share the same read code and sequence origin in the cfDNA. Each capture probe yields a set of unique reads that are computationally extracted from all reads by classifying them into families. Unique reads for a given sample are then calculated as the average of all unique reads observed per probe. Cases with obvious copy count changes are excluded from the dataset used to calculate the mean. Unique reads are important because each unique read must be derived from a unique cfDNA clone. Each unique read represents a haploid equivalent of genomic DNA input and analysis. The sum of unique reads is the sum of the analyzed haploid genomes. And again, the number of genomes analyzed defines the sensitivity of the sequencing assay. As a non-limiting example, when the average unique read count is 100 genomic equivalents, the particular assay has the sensitivity to detect 1 in 100, i.e., 1% of mutant reads. Any observation below this is not justified.

特定の実施形態では、定量的遺伝子解析は、複数の試料に由来するハイブリッド核酸分子の多重シークエンシングを含む。 In certain embodiments, quantitative genetic analysis involves multiple sequencing of hybrid nucleic acid molecules from multiple samples.

様々な実施形態では、定量的遺伝子解析は、1つもしくはそれ超または複数のタグ付きDNAライブラリークローンを得るステップであって、各クローンが、第1のDNA配列および第2のDNA配列を含み、第1のDNA配列が標的化遺伝子座位の配列を含み、第2のDNA配列が捕捉プローブ配列を含むステップ、1つもしくは複数のクローンに関する対の末端シークエンシング反応を行い、1つもしくは複数のシークエンシングリードを得るステップ、または約100、200、300、400、500もしくはそれ超のヌクレオチドより大きい単一の長いシークエンシングリードが得られる1つもしくは複数のクローンに関するシークエンシング反応を行うステップであって、リードが、第1のDNA配列と第2のDNA配列の両方を同定するのに十分であるステップ、ならびにシークエンシングリードのプローブ配列に従って1つまたは複数のクローンのシークエンシングリードを順序付けまたはクラスタリングするステップを含む。 In various embodiments, quantitative gene analysis is the step of obtaining one or more or more tagged DNA library clones, each clone comprising a first DNA sequence and a second DNA sequence. , A step in which the first DNA sequence contains the sequence of the target gene locus and the second DNA sequence contains the capture probe sequence, and one or more end sequencing reactions are performed on one or more clones. A step of obtaining a sequencing read, or a step of performing a sequencing reaction on one or more clones to obtain a single long sequencing read larger than about 100, 200, 300, 400, 500 or more nucleotides. Steps are sufficient for the read to identify both the first and second DNA sequences, as well as ordering or clustering the sequencing reads of one or more clones according to the sequencing read probe sequence. Includes steps to do.

(c)バイオインフォマティクス解析
様々な実施形態では、定量的遺伝子解析は、シークエンシングリードのバイオインフォマティック解析をさらに含む。バイオインフォマティック解析は、シークエンシングのための組成物または方法の不在下で行われる任意の純粋な精神分析を除外する。ある特定の実施形態では、バイオインフォマティクス解析は、配列アラインメント、ゲノム当量解析、一塩基バリアント(SNV)解析、遺伝子コピー数変動(CNV)解析、および遺伝子病変の検出を含むが、これらに限定されない。特定の実施形態では、バイオインフォマティクス解析は、cfDNAクローンライブラリー中の解析されるゲノム当量の数の定量に、標的遺伝子座位の遺伝子状態の検出に、標的遺伝子座位内の遺伝子病変の検出に、および標的遺伝子座位内のコピー数増減の測定に有用である。
(C) Bioinformatics Analysis In various embodiments, the quantitative gene analysis further comprises a bioinformatics analysis of the sequencing read. Bioinformatics analysis excludes any pure psychoanalysis performed in the absence of compositions or methods for sequencing. In certain embodiments, bioinformatics analysis includes, but is not limited to, sequence alignment, genomic equivalence analysis, single nucleotide variant (SNV) analysis, gene copy number variation (CNV) analysis, and detection of gene lesions. In certain embodiments, bioinformatics analysis is used to quantify the number of genomic equivalents analyzed in the cfDNA clone library, to detect the genetic status of the target gene locus, to detect gene lesions within the target gene locus, and It is useful for measuring the increase or decrease in the number of copies in the target gene locus.

配列アラインメントを配列リードと1つまたは複数のヒト参照DNA配列との間で行ってもよい。特定の実施形態では、シークエンシングアラインメントは、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化または遺伝子融合の検出を含むがこれらに限定されない、標的遺伝子座位での遺伝子病変の検出に使用することができる。原因または予後指標である遺伝子病変の検出は、特定の遺伝性状態または疾患の診断、予後予測、処置および/またはモニタリングに有用でありうる。 Sequence alignment may be performed between the sequence read and one or more human reference DNA sequences. In certain embodiments, sequencing alignments include, but are not limited to, detection of nucleotide transitions or transversions, nucleotide insertions or deletions, genomic rearrangements, copy count changes or gene fusions, but are not limited to genes at target gene loci. It can be used to detect lesions. Detection of genetic lesions, which are causes or prognostic indicators, may be useful in diagnosing, prognostic, treating and / or monitoring a particular hereditary condition or disease.

本明細書では水平配列解析と呼ぶ、参照配列へのアラインメントを必要とせずに行うことができる配列アラインメント解析の方法も本明細書において企図される。そのような解析を、本明細書において企図される方法または任意の他の方法によって生成された任意の配列に対して行うことができる。特定の実施形態では、配列解析は、本明細書において企図される方法によって得られるリードに関する配列アラインメントを行うことを含む。 Also herein is a method of sequence alignment analysis, called horizontal sequence analysis, which can be performed without the need for alignment to a reference sequence. Such analysis can be performed on any sequence generated by the method contemplated herein or by any other method. In certain embodiments, sequence analysis comprises performing sequence alignments for reads obtained by the methods contemplated herein.

一実施形態では、cfDNAクローンライブラリー中のゲノム当量は、シークエンシングを行った後にバイオインフォマティクスベースの計数を使用して決定される。各シークエンシングリードは特定の捕捉プローブと関連付けられ、各捕捉プローブに割り当てられた一群のリードは、グループに分別される。グループ内の個々のリードのセットは、同じリードコードおよびゲノム配列内の同じDNA配列開始位置を共有する。これらの個々のリードを「ファミリー」に分類し、このファミリーの単一のコンセンサス代表を「ユニークリード」として繰越す。ファミリーを構成する個々のリードのすべてが単一のライゲーション事象に由来し、したがって、それらは、互いに増幅由来の「同胞」である。各ユニークリードは、ユニークライゲーション事象と考えられ、ユニークリードの合計は、解析されるゲノム当量の数と等しいと考えられる。 In one embodiment, genomic equivalents in the cfDNA clone library are determined using bioinformatics-based counting after sequencing. Each sequencing read is associated with a particular capture probe, and the set of reads assigned to each capture probe is grouped. Individual sets of reads within a group share the same read code and the same DNA sequence starting position within the genomic sequence. These individual leads are classified as "family" and a single consensus representative of this family is carried forward as a "unique lead". All of the individual leads that make up the family are derived from a single ligation event, and thus they are "brothers" of amplification origin from each other. Each unique read is considered a unique ligation event, and the sum of the unique reads is considered equal to the number of genomic equivalents analyzed.

ユニーククローン数が可能性のある配列の組合せの総数に近づくと、確率により、同じコードおよび開始部位の組合せが独立事象によって生じることになり、これらの独立事象が単一ファミリー内で不適切にグループ化されることになることが決定される。最終結果は、解析されるゲノム当量の過小推定となり、低頻度の変異リードは、同じ識別子を有する野生型リードと重複するので、シークエンシングエラーとして処分されることがある。 When the number of unique clones approaches the total number of possible sequence combinations, the probability is that the same code and origin combination will result from independent events, and these independent events are improperly grouped within a single family. It is decided that it will be transformed. The end result is an underestimation of the genomic equivalents analyzed, and infrequent mutant reads overlap with wild-type reads with the same identifier and may be disposed of as a sequencing error.

特定の実施形態では、cfDNAクローンライブラリーの正確な解析をもたらすために、解析されるゲノム当量の数は、可能性のあるユニーククローンの数の約1/10、約1/12、約1/14、約1/16、約1/18、約1/20、約1/25またはそれ未満である。上で概要を述べた手順は、説明に役立つものに過ぎず、限定ではないことを理解するべきである。 In certain embodiments, the number of genomic equivalents analyzed is about 1/10, about 1/12, about 1/1 of the number of possible unique clones to result in accurate analysis of the cfDNA clone library. 14, about 1/16, about 1/18, about 1/20, about 1/25 or less. It should be understood that the procedure outlined above is only informative and not limiting.

一部の実施形態では、解析されるゲノム当量の数を増加させる必要があることもある。ゲノム当量の深度を拡大するために少なくとも2つの解決策が企図される。第1の解決策は、試料1つにつき1つより多くのアダプターセットを使用することである。アダプターを組み合わせることにより、可能性のあるクローンの総数を乗法的に拡大することが可能であり、したがって、ゲノムインプットの満足のいく限界を拡大することが可能である。第2の解決策は、リードコードを1、2、3、4、または5もしくはそれ超の塩基、拡大することである。他のすべてのリードコードと少なくとも2塩基異なる、可能性のあるリードコードの数は、4(n−1)となり、式中、nは、リードコード内の塩基の数である。したがって、非限定的な例では、リードコードが5ヌクレオチドである場合、4(5−1)=256。したがって、追加の塩基を含めることで利用可能なレパートリーは追加の塩基ごとに4倍拡大される。 In some embodiments, it may be necessary to increase the number of genomic equivalents analyzed. At least two solutions are planned to increase the depth of genomic equivalents. The first solution is to use more than one adapter set per sample. By combining adapters, it is possible to multiply the total number of possible clones in a multiplicative manner, thus expanding the satisfactory limits of genomic input. The second solution is to expand the read code by 1, 2, 3, 4, or 5 or more bases. The number of possible read codes that differ from all other read codes by at least 2 bases is 4 (n-1) , where n is the number of bases in the read code. Therefore, in a non-limiting example, if the read code is 5 nucleotides, 4 (5-1) = 256. Therefore, by including additional bases, the available repertoire is expanded by a factor of 4 for each additional base.

一実施形態では、定量的遺伝子解析は、低頻度の一塩基バリアント(SNV)を同定するためのシークエンシングリードのバイオインフォマティック解析を含む。 In one embodiment, quantitative genetic analysis comprises bioinformatic analysis of sequencing reads to identify infrequent single nucleotide variants (SNVs).

次世代シークエンシングは、およそ0.02〜0.02%の固有エラー率を有し、これは、1/200〜1/500塩基コールが不正確であることを意味する。これより低い頻度で、例えば1000配列に1配列の頻度で発生するバリアントおよび他の変異を検出するために、分子アノテーション戦略を行使する必要がある。非限定的な例として、標的化配列捕捉技術を使用する5000のユニーク分子の解析は、各ユニークリードが、すべてが同じリードコードを有するリードの「ファミリー」に属する一群の5000ユニークリードを、50,000リードを超える十分なシークエンシング深度で生成する。ファミリー内で発生するSNVは、低頻度バリアントであることの候補である。この同じバリアントが1つより多くのファミリーで観測された場合、それは、出発試料内に存在する低頻度バリアントであることの非常に強い候補になる。対照的に、ファミリー内で散発的に発生するバリアントは、シークエンシングエラーである可能性が高く、1つのおよび1つだけのファミリー内で発生するバリアントは、低頻度であるか、エクスビボで発生する塩基の変化(例えば、DNA塩基の酸化またはPCR導入エラー)の結果である。 Next-generation sequencing has an inherent error rate of approximately 0.02-0.02%, which means that 1/200 to 1/500 base calls are inaccurate. Molecular annotation strategies need to be exercised to detect variants and other mutations that occur at a lower frequency, eg, 1 in 1000 sequences. As a non-limiting example, analysis of 5000 unique molecules using targeted sequence capture techniques shows that each unique read has 50 unique reads, a group of 5000 unique reads that belong to a "family" of reads, all having the same read code. Generate with sufficient sequencing depth to exceed 000 leads. SNVs that occur within the family are candidates for low frequency variants. If this same variant is observed in more than one family, it is a very strong candidate for a low frequency variant present in the starting sample. In contrast, variants that occur sporadically within a family are more likely to have sequencing errors, and variants that occur within one and only one family are infrequent or occur in Exvivo. It is the result of base changes (eg, DNA base oxidation or PCR introduction errors).

一実施形態では、SNVを検出する方法は、アッセイの所望の標的感度に応じて10倍を超えるゲノムインプット(ゲノムまたはゲノム当量)を導入するステップを含む。1つの非限定的な例では、所望の感度が2%(100中2)である場合には、実験標的は、2000ゲノムのインプットである。 In one embodiment, the method of detecting SNV comprises introducing more than 10-fold genomic input (genome or genomic equivalent) depending on the desired target sensitivity of the assay. In one non-limiting example, if the desired sensitivity is 2% (2 out of 100), the experimental target is an input of 2000 genomes.

特定の実施形態では、シークエンシングデータのバイオインフォマティクス解析は、遺伝子状態、遺伝性状態または遺伝疾患、遺伝子モザイク、胎児試験、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、マイクロバイオームプロファイリング、病原体スクリーニングおよび臓器移植のモニタリングに関連するSNVを検出または同定するために使用する。 In certain embodiments, bioinformatics analysis of sequencing data includes genetic status, hereditary status or genetic disease, genetic mosaic, fetal testing, paternity testing, prediction of response to drug treatment, diagnosis or monitoring of pathology, microbiome profiling. , Used to detect or identify SNVs associated with pathogen screening and monitoring of organ transplantation.

様々な実施形態では、コピー数決定解析のための方法であって、1つもしくはそれ超または複数のクローンを得るステップを含み、各クローンが、第1のDNA配列および第2のDNA配列を含み、第1のDNA配列が標的化遺伝子座位の配列を含み、第2のDNA配列が捕捉プローブ配列を含む方法が提供される。関連実施形態では、1つまたは複数のクローンに関する対の末端シークエンシング反応を行い、1つまたは複数のシークエンシングリードを得る。別の実施形態では、1つまたは複数のクローンに関するシークエンシング反応であって、約100より多いヌクレオチドの単一の長いシークエンシングリードが得られ、リードが第1のDNA配列と第2のDNA配列の両方を同定するのに十分である、シークエンシング反応を行う。1つまたは複数のクローンのシークエンシングリードを、該シークエンシングリードのプローブ配列に従って順序付けまたはクラスタリングすることができる。 In various embodiments, it is a method for copy number determination analysis, comprising the step of obtaining one or more or more clones, each clone comprising a first DNA sequence and a second DNA sequence. , A method is provided in which the first DNA sequence comprises the sequence of the target gene locus and the second DNA sequence comprises the capture probe sequence. In a related embodiment, a pair of terminal sequencing reactions for one or more clones is performed to obtain one or more sequencing reads. In another embodiment, a sequencing reaction for one or more clones results in a single long sequencing read of about 100 or more nucleotides, with the reads being the first DNA sequence and the second DNA sequence. Perform a sequencing reaction, which is sufficient to identify both. Sequencing reads of one or more clones can be ordered or clustered according to the probe sequence of the sequencing reads.

コピー数解析は、所与のゲノムDNA試料中で発生する特定の遺伝子または変異のコピー数を調査する解析であって、所与の試料中の所与の遺伝子のコピー数または配列差異の定量的判定をさらに含むことができる解析を含むが、これらに限定されない。特定の実施形態では、コピー数解析は、遺伝子状態、遺伝性状態または遺伝疾患、胎児試験、遺伝子モザイク、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、マイクロバイオームプロファイリング、病原体スクリーニングおよび臓器移植のモニタリングに関連する遺伝子増幅を検出または同定するために使用される。 Copy count analysis is an analysis that examines the number of copies of a particular gene or mutation that occurs in a given genomic DNA sample, quantitatively the number of copies or sequence differences of a given gene in a given sample. Includes, but is not limited to, analyzes that can further include verdicts. In certain embodiments, copy count analysis includes genetic status, hereditary status or disease, fetal testing, genetic mosaic, paternity testing, prediction of response to drug treatment, diagnosis or monitoring of pathology, microbiome profiling, pathogen screening and Used to detect or identify gene amplification associated with organ transplant monitoring.

特定の実施形態では、シークエンシングデータのバイオインフォマティクス解析は、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化または遺伝子融合の検出を含むがこれらに限定されない、標的遺伝子座位での1つまたは複数の配列または遺伝子病変の検出または同定に使用される。原因または予後指標である遺伝子病変の検出は、特定の遺伝性状態または遺伝疾患の診断、予後予測、処置および/またはモニタリングに有用でありうる。一実施形態では、遺伝子病変は、遺伝子状態、遺伝性状態または遺伝疾患、胎児試験、遺伝子モザイク、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、マイクロバイオームプロファイリング、病原体スクリーニングおよび臓器移植のモニタリングに関連する。 In certain embodiments, bioinformatics analysis of sequencing data includes, but is not limited to, detection of nucleotide transitions or transversions, nucleotide insertions or deletions, genomic rearrangements, copy count changes or gene fusions. Used for the detection or identification of one or more sequences or genetic lesions in the sitting position. Detection of genetic lesions, which are causes or prognostic indicators, may be useful in diagnosing, prognostic, treating and / or monitoring a particular hereditary condition or disorder. In one embodiment, the genetic lesion is genetic status, hereditary or genetic disease, fetal testing, genetic mosaic, paternity testing, prediction of response to drug treatment, diagnosis or monitoring of pathology, microbiome profiling, pathogen screening and organ transplantation. Related to monitoring.

D.定量的遺伝子解析の臨床的応用
様々な実施形態では、本発明は、対象における状態または疾患を検出、同定、予測、診断またはモニターする方法を企図している。
D. Clinical Applications of Quantitative Genetic Analysis In various embodiments, the present invention contemplates methods of detecting, identifying, predicting, diagnosing or monitoring a condition or disease in a subject.

特定の実施形態では、対象における遺伝子状態、遺伝性状態または遺伝疾患を検出、同定、予測、診断またはモニターする方法は、cfDNAクローンライブラリー中の1つまたは複数の標的遺伝子座位の定量的遺伝子解析を行って、1つまたは複数の標的遺伝子座位における配列の変化を検出または同定するステップを含む。 In certain embodiments, methods for detecting, identifying, predicting, diagnosing or monitoring genetic status, hereditary status or genetic disease in a subject include quantitative genetic analysis of one or more target gene loci in a cfDNA clone library. To detect or identify sequence changes at one or more target gene loci.

一実施形態では、遺伝子状態、遺伝性状態または遺伝疾患を検出、同定、予測、診断またはモニターする方法は、対象の生体試料からcfDNAを単離するまたは得るステップ、cfDNAを1つまたは複数の末端修復酵素で処置して末端修復cfDNAを生成するステップ、末端修復cfDNAの各末端に1つまたは複数のアダプターをライゲーションしてcfDNAライブラリーを生成するステップ、cfDNAライブラリーを増幅させてcfDNAクローンライブラリーを生成するステップ、cfDNAクローンライブラリー中のゲノム当量の数を決定するステップ、およびcfDNAクローンライブラリー中の1つまたは複数の標的遺伝子座位の定量的遺伝子解析を行って、1つまたは複数の標的遺伝子座位における配列の変化を検出または同定するステップを含む。 In one embodiment, a method of detecting, identifying, predicting, diagnosing or monitoring a genetic state, hereditary state or genetic disorder is a step of isolating or obtaining cfDNA from a biological sample of interest, one or more ends of cfDNA. The step of treating with a repair enzyme to generate terminal repair cfDNA, the step of ligating one or more adapters to each end of the terminal repair cfDNA to generate a cfDNA library, and the step of amplifying the cfDNA library to generate a cfDNA clone library. To generate one or more targets, to determine the number of genomic equivalents in the cfDNA clone library, and to perform quantitative gene analysis of one or more target gene loci in the cfDNA clone library to perform one or more targets. Includes steps to detect or identify sequence changes at loci.

特定の実施形態では、遺伝疾患、遺伝子モザイクからなる群から選択される遺伝子状態、または遺伝性状態または遺伝疾患の検出、同定、予測、診断またはモニタリング、胎児試験、親子鑑定、親子鑑定、薬物処置に対する応答の予測、病状の診断またはモニタリング、マイクロバイオームプロファイリング、病原体スクリーニングおよび臓器移植モニタリングの方法であって、対象の生体試料からcfDNAを単離するまたは得るステップ、cfDNAを1つまたは複数の末端修復酵素で処置して末端修復cfDNAを生成するステップ、末端修復cfDNAの各末端に1つまたは複数のアダプターをライゲーションしてcfDNAライブラリーを生成するステップ、cfDNAライブラリーを増幅させてcfDNAクローンライブラリーを生成するステップ、cfDNAクローンライブラリー中のゲノム当量の数を決定するステップ、およびcfDNAクローンライブラリー中の1つまたは複数の標的遺伝子座位の定量的遺伝子解析を行って、1つまたは複数の標的遺伝子座位の配列におけるヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化または遺伝子融合を検出または同定するステップを含む方法。 In certain embodiments, a genetic disorder, a genetic state selected from the group consisting of a genetic mosaic, or a hereditary state or genetic disorder detection, identification, prediction, diagnosis or monitoring, fetal testing, parent-child identification, parent-child identification, drug treatment. Methods of predicting response to, diagnosing or monitoring pathology, microbiome profiling, pathogen screening and organ transplant monitoring, the step of isolating or obtaining cfDNA from a biological sample of interest, repairing one or more ends of cfDNA. The step of treating with an enzyme to generate a terminal repair cfDNA, the step of ligating one or more adapters to each end of the terminal repair cfDNA to generate a cfDNA library, and the step of amplifying the cfDNA library to obtain a cfDNA clone library. One or more target genes are generated, the step of determining the number of genomic equivalents in the cfDNA clone library, and the quantitative gene analysis of one or more target gene loci in the cfDNA clone library. A method comprising detecting or identifying a nucleotide transition or transversion, a nucleotide insertion or deletion, a genome rearrangement, a change in copy count or a gene fusion in a locus sequence.

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる遺伝疾患の実例としては、がん、アルツハイマー病(APOE1)、シャルコー・マリー・トゥース病、レーバー遺伝性視神経萎縮症(LHON)、アンジェルマン症候群(UBE3A、ユビキチン−タンパク質リガーゼE3A)、プラダー・ウィリー症候群(15番染色体内の領域)、β−サラセミア(HBB、β−グロビン)、ゴーシェ病(I型)(GBA、グルコセレブロシダーゼ)、嚢胞性線維症(CFTR上皮クロライドチャネル)、鎌状赤血球症(HBB、β−グロビン)、テイ・サックス病(HEXA、ヘキソサミニダーゼA)、フェニルケトン尿症(PAH、フェニルアラニンヒドロリアーゼ)、家族性高コレステロール血症(LDLR、低密度リポタンパク質受容体)、成人型嚢胞腎(PKD1、ポリシスチン)、ハンチントン病(HDD、ハンチンチン)、神経線維腫症I型(NF1、NF1腫瘍抑制遺伝子)、筋強直性ジストロフィー(DM、ミオトニン)、結節性硬化症(TSC1、ツベリン)、軟骨無形成症(FGFR3、線維芽細胞増殖因子受容体)、脆弱X症候群(FMR1、RNA結合タンパク質)、デュシェンヌ型筋ジストロフィー(DMD、ジストロフィン)、血友病A(F8C、血液凝固第VIII因子)、レッシュ・ナイハン症候群(HPRT1、ヒポキサンチングアニンリボシルトランスフェラーゼ1)、および副腎白質ジストロフィー(ABCD1)が挙げられるが、これらに限定されない。 Examples of genetic disorders that can be detected, identified, predicted, diagnosed or monitored using the compositions and methods contemplated herein include cancer, Alzheimer's disease (APOE1), Sharko Marie Tooth's disease, and the like. Lever hereditary optic nerve atrophy (LHON), Angelman syndrome (UBE3A, ubiquitin-protein ligase E3A), Prader Willy syndrome (region within chromosome 15), β-salasemia (HBB, β-globin), Gauche disease (HBB, β-globin) Type I) (GBA, glucocerebrosidase), cystic fibromatosis (CFTR epithelial chloride channel), sickle erythema (HBB, β-globin), Teisax disease (HEXA, hexosaminidase A), phenylketone Urology (PAH, phenylalanine hydrolyase), familial hypercholesterolemia (LDLR, low density lipoprotein receptor), adult cystic kidney (PKD1, polycystin), Huntington's disease (HDD, huntingtin), neurofibromatosis Type I (NF1, NF1 tumor suppressor gene), muscle tonic dystrophy (DM, myotonin), nodular sclerosis (TSC1, tuberin), chondrosis aplasia (FGFR3, neurofibromatosis factor receptor), fragile X syndrome (FMR1, RNA-binding protein), Duchenne-type muscle dystrophy (DMD, dystrophin), hemophilia A (F8C, blood coagulation factor VIII), Resh-Naihan syndrome (HPRT1, hypoxanthing anninribosyltransferase 1), and adrenal white dystrophy (ABCD1), but is not limited to these.

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができるがんの実例としては、B細胞がん、例えば多発性骨髄腫、黒色腫、乳がん、肺がん(例えば、非小細胞肺癌またはNSCLC)、気管支がん、結腸直腸がん、前立腺がん、膵がん、胃がん(stomach cancer)、卵巣がん、膀胱がん、脳または中枢神経系のがん、末梢神経系のがん、食道がん、子宮頸がん、子宮または子宮内膜がん、口腔または咽頭のがん、肝臓がん、腎臓がん、精巣がん、胆道がん、小腸または虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液組織のがん、腺癌、炎症性筋線維芽細胞性腫瘍、消化管間質腫瘍(GIST)、結腸がん、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性疾患(MPD)、急性リンパ球性白血病(ALL)、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、慢性リンパ球性白血病(CLL)、真正赤血球増加症、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨原性肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮癌、基底細胞癌、腺癌、汗腺癌、皮脂腺癌、乳頭癌、乳頭状腺癌、髄様癌、気管支原性肺癌、腎細胞癌、ヘパトーマ、胆管癌、絨毛癌、精上皮腫、胎児性癌、ウィルムス腫瘍、膀胱癌、上皮癌、神経膠腫、星細胞腫、髄芽腫、頭蓋咽頭腫、脳室上衣腫、松果体腫、血管芽細胞腫、聴神経腫瘍、乏突起神経膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型B細胞性リンパ腫、マントル細胞リンパ腫、肝細胞癌、甲状腺がん、胃がん(gastric cancer)、頭頸部がん、小細胞がん、本態性血小板血症、原因不明の骨髄化生、好酸球増加症候群、全身性肥満細胞症、家族性過好酸球増加症、慢性好酸球性白血病、神経内分泌がん、カルチノイド腫瘍などが挙げられるが、これらに限定されない。 Examples of cancers that can be detected, identified, predicted, diagnosed or monitored using the compositions and methods contemplated herein include B-cell cancers such as multiple myeloma, melanoma, breast cancer. Lung cancer (eg, non-small cell lung cancer or NSCLC), bronchial cancer, colorectal cancer, prostate cancer, pancreatic cancer, stomach cancer, ovarian cancer, bladder cancer, brain or central nervous system Cancer of the peripheral nervous system, esophageal cancer, cervical cancer, uterine or endometrial cancer, oral or pharyngeal cancer, liver cancer, kidney cancer, testis cancer, biliary tract cancer, small intestine Or worm drop cancer, salivary adenocarcinoma, thyroid cancer, adrenal cancer, osteosarcoma, chondrosarcoma, blood tissue cancer, adenocarcinoma, inflammatory myofibroblastic tumor, gastrointestinal stromal tumor (GIST), Colon cancer, multiple myeloma (MM), myelodystrophy syndrome (MDS), myeloproliferative disease (MPD), acute lymphocytic leukemia (ALL), acute myeloid leukemia (AML), chronic myeloid leukemia ( CML), Chronic lymphocytic leukemia (CLL), True erythrocytosis, Hodgkin lymphoma, Non-Hodgkin lymphoma (NHL), Soft tissue sarcoma, Fibrosarcoma, Mucinosarcoma, Fat sarcoma, Osteogenic sarcoma, Spinal sarcoma, Angiosarcoma , Endocardial sarcoma, Lymphatic sarcoma, Lymphatic endothelial sarcoma, Luminous tumor, Medium dermatoma, Ewing tumor, Smooth muscle tumor, Lacterial myoma, Squamous epithelial cancer, Basal cell cancer, Adenocarcinoma, Sweat adenocarcinoma, Sebaceous adenocarcinoma, Papillary cancer, papillary adenocarcinoma, medullary cancer, bronchial lung cancer, renal cell cancer, hepatoma, bile duct cancer, chorionic villus cancer, sperm epithelioma, fetal cancer, Wilms tumor, bladder cancer, epithelial cancer, glioma, Astral cell tumor, myelblastoma, cranial pharyngeal tumor, ventricular lining tumor, pine fruit tumor, hemangioblastoma, acoustic nerve tumor, oligodendroglioloma, meningitis, neuroblastoma, retinal blastoma, Follicular lymphoma, diffuse large B-cell lymphoma, mantle cell lymphoma, hepatocellular carcinoma, thyroid cancer, gastric cancer, head and neck cancer, small cell cancer, essential thrombocytosis, unknown cause Myelination, eosinophilia syndrome, systemic obesity cytosis, familial hypereocytosis, chronic eosinophilia, neuroendocrine cancer, cartinoid tumors, etc., but are not limited to these. ..

一実施形態では、遺伝子病変は、Cosmicデータベース(病変および配列データをcancer.sanger.ac.uk/cosmic/censusからダウンロードすることができる)でアノテーシ
ョンされている病変、またはCancer Genome Atlas(病変および配列データをtcga-data.nci.nih.gov/tcga/tcgaDownload.jspからダウンロードすることがで
きる)でアノテーションされている病変である。
In one embodiment, the genetic lesion is a lesion annotated in a Cosmic database (lesion and sequence data can be downloaded from cancer.sanger.ac.uk/cosmic/census), or Cancer Genome Atlas (lesion and sequence). The lesion is annotated with data (which can be downloaded from tcga-data.nci.nih.gov/tcga/tcgaDownload.jsp).

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができるがんに関連する1つまたは複数の遺伝子病変を有する遺伝子の実例としては、ABCB1、ABCC2、ABCC4、ABCG2、ABL1、ABL2、AKT1、AKT2、AKT3、ALDH4A1、ALK、APC、AR、ARAF、ARFRP1、ARID1A、ATM、ATR、AURKA、AURKB、BCL2、BCL2A1、BCL2L1、BCL2L2、BCL6、BRAF、BRCA1、BRCA2、Clorf144、CARD11、CBL、CCND1、CCND2、CCND3、CCNE1、CDH1、CDH2、CDH20、CDH5、CDK4、CDK6、CDK8、CDKN2A、CDKN2B、CDKN2C、CEBPA、CHEK1、CHEK2、CRKL、CRLF2、CTNNB1、CYP1B1、CYP2C19、CYP2C8、CYP2D6、CYP3A4、CYP3A5、DNMT3A、DOT1L、DPYD、EGFR、EPHA3、EPHA5、EPHA6、EPHA7、EPHB1、EPHB4、EPHB6、EPHX1、ERBB2、ERBB3、ERBB4、ERCC2、ERG、ESR1、ESR2、ETV1、ETV4、ETV5、ETV6、EWSR1、EZH2、FANCA、FBXW7、FCGR3A、FGFR1、FGFR2、FGFR3、FGFR4、FLT1、FLT3、FLT4、FOXP4、GATA1、GNA11、GNAQ、GNAS、GPR124、GSTP1、GUCY1A2、HOXA3、HRAS、HSP90AA1、IDH1、IDH2、IGF1R、IGF2R、IKBKE、IKZF1、INHBA、IRS2、ITPA、JAK1、JAK2、JAK3、JUN、KDR、KIT、KRAS、LRP1B、LRP2、LTK、MAN1B1、MAP2K1、MAP2K2、MAP2K4、MCL1、MDM2、MDM4、MEN1、MET、MITF、MLH1、MLL、MPL、MRE11A、MSH2、MSH6、MTHFR、MTOR、MUTYH、MYC、MYCL1、MYCN、NF1、NF2、NKX2−1、NOTCH1、NPM1、NQO1、NRAS、NRP2、NTRK1、NTRK3、PAK3、PAX5、PDGFRA、PDGFRB、PIK3CA、PIK3R1、PKHD1、PLCG1、PRKDC、PTCH1、PTEN、PTPN11、PTPRD、RAF1、RARA、RB1、RET、RICTOR、RPTOR、RUNX1、SLC19A1、SLC22A2、SLCO1B3、SMAD2、SMAD3、SMAD4、SMARCA4、SMARCB1、SMO、SOD2、SOX10、SOX2、SRC、STK11、SULT1A1、TBX22、TET2、TGFBR2、TMPRSS2、TNFRSF14、TOP1、TP53、TPMT、TSC1、TSC2、TYMS、UGT1A1、UMPS、USP9X、VHLおよびWT1が挙げられるが、これらに限定されない。 Examples of genes with one or more genetic lesions associated with cancer that can be detected, identified, predicted, diagnosed or monitored using the compositions and methods contemplated herein are ABCB1, ABCC2. ABCC4, ABCG2, ABL1, ABL2, AKT1, AKT2, AKT3, ALDH4A1, ALK, APC, AR, ARAF, ARFRP1, ARID1A, ATM, ATR, AURKA, AURKB, BCL2, BCL2A1, BCL2 , BRCA2, Clorf144, CARD11, CBL, CCND1, CCND2, CCND3, CCNE1, CDH1, CDH2, CDH20, CDH5, CDK4, CDK6, CDK8, CDKN2A, CDKN2B, CDKN2C, CEBPA, CHEK2, CDKN2B, CDKN2C, CEBPA, CHEK1 , CYP2C19, CYP2C8, CYP2D6, CYP3A4, CYP3A5, DNMT3A, DOT1L, DPYD, EGFR, EPHA3, EPHA5, EPHA6, EPHA7, EPHB1, EPHB4, EPHB6, EPHX1, ERBBER2 , ETV4, ETV5, ETV6, EWSR1, EZH2, FANCA, FBXW7, FCGR3A, FGFR1, FGFR2, FGFR3, FGFR4, FLT1, FLT3, FLT4, FOXP4, GATA1, GNA11, GNAQ, GNAQ, GNAQ, GNAQ , HSP90AA1, IDH1, IDH2, IGF1R, IGF2R, IKBKE, IKZF1, INHBA, IRS2, ITPA, JAK1, JAK2, JAK3, JUN, KDR, KIT, KRAS, LRP1B, LRP2, LTK, MAN1B , MDM2, MDM4, MEN1, MET, MITF, MLH1, MLL, MPL, MRE11A, MSH2, MSH6, MTHFR, MTOR, MUTYH, MYC, MYCL1, MYCN, NF1, NF2, NKX2-1, NOTCH1, NPM1 , NRP2, NTRK1, NTRK3, PAK3, PAX5, PDGFRA, PDGFRB, PIK3CA, PIK3R1, PKHD 1, PLCG1, PRKDC, PTCH1, PTEN, PTPN11, PTPRD, RAF1, RARA, RB1, RET, RICTOR, RPTOR, RUNX1, SLC19A1, SLC22A2, SLCO1B3, SMAD2, SMAD3, SMAD4, SMARCA4, SMARCB1 SOX2, SRC, STK11, SULT1A1, TBX22, TET2, TGFBR2, TMPRSS2, TNFRSF14, TOP1, TP53, TPMT, TSC1, TSC2, TYMS, UGT1A1, UMPS, USP9X, VHL and WT1.

特定の実施形態では、遺伝子病変は、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む。 In certain embodiments, genetic lesions include nucleotide transitions or transversions, nucleotide insertions or deletions, genomic rearrangements, copy count changes, or gene fusions.

一実施形態では、遺伝子病変は、ALK遺伝子の3’コード領域を別の遺伝子に融合させる遺伝子融合である。 In one embodiment, the gene lesion is a gene fusion that fuses the 3'coding region of the ALK gene to another gene.

一実施形態では、遺伝子病変は、ALK遺伝子の3’コード領域をEML4遺伝子に融合させる遺伝子融合である。 In one embodiment, the gene lesion is a gene fusion that fuses the 3'coding region of the ALK gene to the EML4 gene.

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる胎児試験に好適な状態の実例としては、ダウン症候群(トリソミー21)、エドワーズ症候群(トリソミー18)、パトー症候群(トリソミー13)、クラインフェルター症候群(XXY)、トリプルX症候群、XYY症候群、トリソミー8、トリソミー16、ターナー症候群(XO)、ロバートソン型転座、ディ・ジョージ症候群およびウォルフ・ヒルショルン症候群が挙げられるが、これらに限定されない。 Examples of conditions suitable for fetal testing that can be detected, identified, predicted, diagnosed or monitored using the compositions and methods contemplated herein include Down Syndrome (Trisomy 21), Edwards Syndrome (Trisomy 18). ), Pateau Syndrome (Trisomy 13), Klinefelter Syndrome (XXY), Trisomy X Syndrome, XYY Syndrome, Trisomy 8, Trisomy 16, Turner Syndrome (XO), Robertson's Translocation, Di George Syndrome and Wolf Hirschorn Syndrome However, it is not limited to these.

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる親子鑑定に好適な対立遺伝子の実例は、D20S1082、D6S474、D12ATA63、D22S1045、D10S1248、D1S1677、D11S4463、D4S2364、D9S1122、D2S1776、D10S1425、D3S3053、D5S2500、D1S1627、D3S4529、D2S441、D17S974、D6S1017、D4S2408、D9S2157、アメロゲニン、D17S1301、D1GATA113、D18S853、D20S482およびD14S1434のうちの16またはそれ超を含むが、これらに限定されない。 Examples of alleles suitable for paternity testing that can be detected, identified, predicted, diagnosed or monitored using the compositions and methods contemplated herein are D20S1082, D6S474, D12ATA63, D22S1045, D10S1248, D1S1677, etc. D11S4463, D4S2364, D9S1122, D2S1776, D10S1425, D3S3053, D5S2500, D1S1627, D3S4529, D2S441, D17S974, D6S1017, D4S2408, D9S2157, D4S2408, D9S2157, D4S2408, D9S2157, Amelogenin, D17S3147 Not limited to these.

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる薬物処置に対する応答の予測に好適な遺伝子の実例は、次の遺伝子の1つまたは複数を含むが、これらに限定されない:ABCB1(ATP結合カセット、サブファミリーB(MDR/TAP)、メンバー1)、ACE(アンジオテンシンI転換酵素)、ADH1A(アルコールデヒドロゲナーゼ1A(クラスI)、アルファポリペプチド)、ADH1B(アルコールデヒドロゲナーゼIB(クラスI)、ベータポリペプチド)、ADH1C(アルコールデヒドロゲナーゼ1C(クラスI)、ガンマポリペプチド)、ADRB1(アドレナリン作用性、ベータ−1−、受容体)、ADRB2(アドレナリン作用性、ベータ−2−、受容体、表面)、AHR(アリール炭化水素受容体)、ALDH1A1(アルデヒドデヒドロゲナーゼ1ファミリー、メンバーA1)、ALOX5(アラキドン酸5−リポキシゲナーゼ)、BRCA1(乳がん1、早期発症型)、COMT(カテコール−O−メチルトランスフェラーゼ)、CYP2A6(チトクロムP450、ファミリー2、サブファミリーA、ポリペプチド6)、CYP2B6(チトクロムP450、ファミリー2、サブファミリーB、ポリペプチド6)、CYP2C9(チトクロムP450、ファミリー2、サブファミリーC、ポリペプチド9)、CYP2C19(チトクロムP450、ファミリー2、サブファミリーC、ポリペプチド19)、CYP2D6(チトクロムP450、ファミリー2、サブファミリーD、ポリペプチド6)、CYP2J2(チトクロムP450、ファミリー2、サブファミリーJ、ポリペプチド2)、CYP3A4(チトクロムP450、ファミリー3、サブファミリーA、ポリペプチド4)、CYP3A5(チトクロムP450、ファミリー3、サブファミリーA、ポリペプチド5)、DPYD(ジヒドロピリミジンデヒドロゲナーゼ)、DRD2(ドーパミン受容体D2)、F5(凝固第V因子)、GSTP1(グルタチオンS−トランスフェラーゼパイ)、HMGCR(3−ヒドロキシ−3−メチルグルタリル補酵素Aレダクターゼ)、KCNH2(カリウム電位依存性チャネル、サブファミリーH(eag関連)、メンバー2)、KCNJ11(内向き整流性カリウムチャネル、サブファミリーJ、メンバー11)、MTHFR(5,10−メチレンテトラヒドロ葉酸レダクターゼ(NADPH))、NQO1(NAD(P)Hデヒドロゲナーゼ、キノン1)、P2RY1(プリン受容体P2Y、Gタンパク質結合型、1)、P2RY12(プリン受容体P2Y、Gタンパク質結合型、12)、PTGIS(プロスタグランジンI2(プロスタサイクリン)シンターゼ)、SCN5A(ナトリウムチャネル、電圧依存性、V型、アルファ(QT延長症候群3))、SLC19A1(溶質輸送体ファミリー19(葉酸トランスポーター)、メンバー1)、SLCO1B1(溶質輸送体有機アニオントランスポーターファミリー、メンバー1B1)、SULT1A1(スルホトランスフェラーゼファミリー、サイトゾル性、1A、フェノール選択性、メンバー1)、TPMT(チオプリンS−メチルトランスフェラーゼ)、TYMS(チミジル酸シンセターゼ)、UGT1A1(UDPグルクロノシルトランスフェラーゼ1ファミリー、ポリペプチドA1)、VDR(ビタミンD(1,25−ジヒドロキシビタミンD3)受容体)、VKORC1(ビタミンKエポキシドレダクターゼ複合体、サブユニット1)。 Examples of genes suitable for predicting response to drug treatment that can be detected, identified, predicted, diagnosed or monitored using the compositions and methods contemplated herein include one or more of the following genes: Including, but not limited to: ABCB1 (ATP binding cassette, subfamily B (MDR / TAP), member 1), ACE (angiotensin I converting enzyme), ADH1A (alcohol dehydrogenase 1A (class I), alpha polypeptide), ADH1B (alcohol dehydrogenase IB (class I), beta polypeptide), ADH1C (alcohol dehydrogenase 1C (class I), gamma polypeptide), ADRB1 (adrenaline action, beta-1-, receptor), ADRB2 (adrenaline action) , Beta-2-, receptor, surface), AHR (aryl hydrocarbon receptor), ALDH1A1 (aldehyde dehydrogenase 1 family, member A1), ALOX5 (arachidonic acid 5-lipoxygenase), BRCA1 (breast cancer 1, early-onset type) , COMT (Catecol-O-Methyltransferase), CYP2A6 (Cytochrome P450, Family 2, Subfamily A, Polypeptide 6), CYP2B6 (Cytochrome P450, Family 2, Subfamily B, Polypeptide 6), CYP2C9 (Cytochrome P450, Family 2, subfamily C, polypeptide 9), CYP2C19 (cytochrome P450, family 2, subfamily C, polypeptide 19), CYP2D6 (cytochrome P450, family 2, subfamily D, polypeptide 6), CYP2J2 (cytochrome P450) , Family 2, Subfamily J, Polypeptide 2), CYP3A4 (Cytochrome P450, Family 3, Subfamily A, Polypeptide 4), CYP3A5 (Cytochrome P450, Family 3, Subfamily A, Polypeptide 5), DPYD (Dihydro) Pyrimidine dehydrogenase), DRD2 (dopamine receptor D2), F5 (coagulation factor V), GSTP1 (glutathione S-transferase pie), HMGCR (3-hydroxy-3-methylglutaryl coenzyme A reductase), KCNH2 (potassium potential) Dependent channel, subfamily H (eg-related), member 2), KCNJ11 (inwardly rectifying potassium channel, subfamily J, member 11), M THFR (5,10-methylenetetrahydrofolate reductase (NADPH)), NQO1 (NAD (P) H dehydrogenase, quinone 1), P2RY1 (purinergic receptor P2Y, G protein-bound type, 1), P2RY12 (purinergic receptor P2Y, G protein bound type, 12), PTGIS (prostaglandin I2 (prostacycline) synthase), SCN5A (sodium channel, voltage dependent, V type, alpha (QT prolongation syndrome 3)), SLC19A1 (solute transporter family 19 (solute transporter family 19) Folic acid transporter), member 1), SLCO1B1 (solute transporter organic anion transporter family, member 1B1), SULT1A1 (sulfotransferase family, cytosolic, 1A, phenol selectivity, member 1), TPMT (thiopurin S-methyl) Transtransferase), TYMS (thymidylate synthase), UGT1A1 (UDP glucuronosyl transferase 1 family, polypeptide A1), VDC (vitamin D (1,25-dihydroxyvitamin D3) receptor), VKORC1 (vitamin K epoxy drductase complex) , Subunit 1).

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる病状の実例としては、脳卒中、一過性虚血発作、外傷性脳損傷、心疾患、心臓発作、狭心症、アテローム動脈硬化症および高血圧が挙げられるが、これらに限定されない。 Examples of medical conditions that can be detected, identified, predicted, diagnosed or monitored using the compositions and methods contemplated herein include stroke, transient ischemic attacks, traumatic brain injury, heart disease, and the like. Examples include, but are not limited to, heart attack, angina, atherosclerosis and hypertension.

本明細書において企図される組成物および方法を用いてスクリーニングすることができる病原体の実例としては、細菌、真菌およびウイルスが挙げられるが、これらに限定されない。 Examples of pathogens that can be screened using the compositions and methods contemplated herein include, but are not limited to, bacteria, fungi and viruses.

本明細書において企図される組成物および方法を用いてスクリーニングすることができる細菌種の実例としては、Mycobacterium spp.、Pneumococcus spp.、Escherichia spp.、Campylobacter spp.、Corynebacterium spp.、Clostridium spp.、Streptococcus spp.、Staphylococcus spp.、Pseudomonas spp.、Shigella spp.、Treponema spp.、またはSalmonella spp.が挙げられるが、これらに限定されない。 Examples of bacterial species that can be screened using the compositions and methods contemplated herein are Mycobacterium spp. , Pneumococcus spp. , Escherichia spp. , Campylobacter spp. , Corynebacterium spp. , Clostridium spp. , Streptococcus spp. , Staphylococcus spp. , Pseudomonas spp. , Shigella spp. , Treponema spp. , Or Salmonella spp. However, it is not limited to these.

本明細書において企図される組成物および方法を用いてスクリーニングすることができる真菌種の実例としては、Aspergillis spp.、Blastomyces
spp.、Candida spp.、Coccicioides spp.、Cryptococcus spp.、皮膚糸状菌、Tinea spp.、Trichophyton spp.、Microsporum spp.、Fusarium spp.、Histoplasma spp.、Mucoromycotina spp.、Pneumocystis spp.、Sporothrix spp.、Exserophilum spp.またはCladosporium spp.が挙げられるが、これらに限定されない。
Examples of fungal species that can be screened using the compositions and methods contemplated herein include Aspergillis spp. , Blastomyces
spp. , Candida spp. , Coccioides spp. , Cryptococcus spp. , Dermatophytes, Tinea spp. , Trichophyton spp. , Microsporum spp. , Fusarium spp. , Histoplasma spp. , Mucoromycotina spp. , Pneumocystis spp. , Sporothlix spp. , Excellophylum spp. Or Cladosporium spp. However, it is not limited to these.

本明細書において企図される組成物および方法を用いてスクリーニングすることができるウイルスの実例としては、A型インフルエンザ、例えばH1N1、H1N2、H3N2およびH5N1(鳥インフルエンザ)、B型インフルエンザ、C型インフルエンザウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、D型肝炎ウイルス、E型肝炎ウイルス、ロタウイルス、ノーウォークウイルス群のあらゆるウイルス、腸内アデノウイルス、パルボウイルス、デング熱ウイルス、サルポックス、モノネガウイルス、ラッサウイルス、例えば狂犬病ウイルス、ラゴスコウモリウイルス、モコラウイルス、ドゥベンヘイジウイルス、ヨーロッパコウモリウイルス1および2ならびにオーストラリアコウモリウイルス、エフェメロウイルス、ベシクロウイルス、水疱性口内炎ウイルス(VSV)、ヘルペスウイルス、例えば単純ヘルペスウイルス1および2型、水痘帯状疱疹、サイトメガロウイルス、エプスタイン・バーウイルス(EBV)、ヒトヘルペスウイルス(HHV)、ヒトヘルペスウイルス6および8型、モロニーマウス白血病ウイルス(M−MuLV)、モロニーマウス肉腫ウイルス(MoMSV)、ハーベイマウス肉腫ウイルス(HaMuSV)、マウス乳癌ウイルス(MuMTV)、テナガザル白血病ウイルス(GaLV)、ネコ白血病ウイルス(FLV)、スプーマウイルス、フレンドマウス白血病ウイルス、マウス幹細胞ウイルス(MSCV)およびラウス肉腫ウイルス(RSV)、HIV(ヒト免疫不全ウイルス;HIV1型およびHIV2型を含む)、ビスナ・マエディウイルス(VMV)ウイルス、ヤギ関節炎脳炎ウイルス(CAEV)、ウマ伝染性貧血ウイルス(EIAV)、ネコ免疫不全ウイルス(FIV)、ウシ免疫不全ウイルス(BIV)およびサル免疫不全ウイルス(SIV)、パピローマウイルス、マウスガンマヘルペスウイルス、アレナウイルス、例えばアルゼンチン出血熱ウイルス、ボリビア出血熱ウイルス、サビア関連出血熱ウイルス、ベネズエラ出血熱ウイルス、ラッサ熱ウイルス、マチュポウイルス、リンパ球性脈絡髄膜炎ウイルス(LCMV)、Bunyaviridiae、例えばクリミア・コンゴ出血熱ウイルス、ハンタウイルス、腎症候性出血熱原因ウイルス、リフトバレー熱ウイルス、Filoviridae(フィロウイルス)(エボラ出血熱およびマールブルグ出血熱を含む)、Flaviviridae(キャサヌル森林病ウイルス、オムスク出血熱ウイルス、マダニ媒介脳炎原因ウイルスを含む)、ならびにParamyxoviridae、例えばヘンドラウイルスおよびニパウイルス、大痘瘡および小痘瘡(天然痘)、アルファウイルス、例えばベネズエラウマ脳炎ウイルス、東部ウマ脳炎ウイルス、西部ウマ脳炎ウイルス、SARS関連コロナウイルス(SARS−CoV)、西ナイルウイルスおよび任意の脳炎原因ウイルスが挙げられるが、これらに限定されない。 Examples of viruses that can be screened using the compositions and methods contemplated herein include virus A, eg, H1N1, H1N2, H3N2 and H5N1 (bird flu), influenza B, influenza C virus. , Hepatitis A virus, hepatitis B virus, hepatitis C virus, hepatitis D virus, hepatitis E virus, rotavirus, all viruses of the no-walk virus group, intestinal adenovirus, parvovirus, dengue fever virus, salpox, Mononegavirus, Lassavirus, eg mad dog disease virus, Lagos bat virus, mocolavirus, Dubenhage virus, European bat virus 1 and 2, and Australian bat virus, ephemerovirus, becyclovirus, bullous stomatitis virus (VSV), Herpesviruses such as simple herpesvirus types 1 and 2, varicella herpes, cytomegalovirus, Epstein barvirus (EBV), human herpesvirus (HHV), human herpesviruses 6 and 8, Moloney mouse leukemia virus (M-). MuLV), Moloney mouse sarcoma virus (MoMSV), Harvey mouse sarcoma virus (HaMuSV), mouse breast cancer virus (MuMTV), tenagazal leukemia virus (GaLV), cat leukemia virus (FLV), spumavirus, friend mouse leukemia virus, mouse stem cells. Virus (MSCV) and Raus sarcoma virus (RSV), HIV (human immunodeficiency virus; including HIV1 and HIV2 types), Bisna maedivirus (VMV) virus, goat arthritis encephalitis virus (CAEV), horse-borne anemia Virus (EIAV), feline immunodeficiency virus (FIV), bovine immunodeficiency virus (BIV) and monkey immunodeficiency virus (SIV), papillomavirus, mouse gamma herpesvirus, arenavirus, such as Argentine hemorrhagic fever virus, Bolivian hemorrhagic fever virus , Savior-related hemorrhagic fever virus, Venezuelan hemorrhagic fever virus, Lassa fever virus, Machupo virus, lymphocytic choriomenelitis virus (LCMV), Bunyaviridiae, eg Crimea Congo hemorrhagic fever virus, Hunter virus, Nephropathy hemorrhagic fever Cause virus, Lift Valley fever virus, Filoviridae (Ebola hemorrhagic fever and Malburg hemorrhagic fever), Flaviviridae (including Kasanul forest disease virus, Omsk hemorrhagic fever virus, tick-borne encephalitis-causing virus), and Paramyxoviridae, such as Hendra virus and nipavirus, large and small pox (natural pox), alpha virus. Examples include, but are not limited to, Venezuelan encephalitis encephalitis virus, eastern horse encephalitis virus, western horse encephalitis virus, SARS-related coronavirus (SARS-CoV), western Nile virus and any encephalitis-causing virus.

本明細書において企図される組成物および方法を用いて検出、同定、予測、診断またはモニターすることができる移植レシピエントにおける臓器移植のモニタリングに好適な遺伝子の実例は、次の遺伝子の1つまたは複数を含むが、これらに限定されない:HLA−A、HLA−B、HLA−C、HLA−DR、HLA−DPおよびHLA−DQ。 Examples of genes suitable for monitoring organ transplantation in transplant recipients that can be detected, identified, predicted, diagnosed or monitored using the compositions and methods contemplated herein are one of the following genes or Including, but not limited to, HLA-A, HLA-B, HLA-C, HLA-DR, HLA-DP and HLA-DQ.

特定の実施形態では、バイオインフォマティック解析は、cfDNAクローンライブラリー中の解析されるゲノム当量の数を定量するために、標的遺伝子座位の遺伝子バリアントを検出するために、標的遺伝子座位内の変異を検出するために、標的遺伝子座位内の遺伝子融合を検出するために、または標的遺伝子座位内のコピー数増減を測定するために使用される。 In certain embodiments, bioinformatic analysis involves mutations within the target gene locus to detect gene variants at the target gene locus to quantify the number of genomic equivalents analyzed in the cfDNA clone library. It is used to detect, to detect gene fusions within the target gene locus, or to measure the increase or decrease in the number of copies within the target gene locus.

E.コンパニオン診断
様々な実施形態では、遺伝疾患のコンパニオン診断であって、対象の生体試料からcfDNAを単離するまたは得るステップ、cfDNAを1つまたは複数の末端修復酵素で処置して末端修復cfDNAを生成するステップ、末端修復cfDNAの各末端に1つまたは複数のアダプターをライゲーションしてcfDNAライブラリーを生成するステップ、cfDNAライブラリーを増幅させてcfDNAクローンライブラリーを生成するステップ、cfDNAクローンライブラリー中のゲノム当量の数を決定するステップ、およびcfDNAクローンライブラリー中の遺伝疾患に関連する1つまたは複数のバイオマーカーの定量的遺伝子解析を行うステップを含み、1つまたは複数のバイオマーカーの少なくとも1つの検出、または検出できないことが、対象を遺伝疾患について処置すべきかどうかを示す、コンパニオン診断が提供される。
E. Companion diagnostics In various embodiments, a companion diagnostic of a genetic disorder, the step of isolating or obtaining cfDNA from a biological sample of interest, treating cfDNA with one or more terminal repair enzymes to produce terminal repair cfDNA. Steps to generate a cfDNA library by ligating one or more adapters to each end of the terminal repair cfDNA, a step to amplify the cfDNA library to generate a cfDNA clone library, in the cfDNA clone library At least one of one or more biomarkers, including the step of determining the number of genomic equivalents and the step of performing quantitative genetic analysis of one or more biomarkers associated with the genetic disorder in the cfDNA clone library. Companion diagnostics are provided that indicate whether a subject should be treated for a genetic disorder if detected or undetectable.

本明細書で使用する場合、用語「コンパニオン診断」は、特定の抗がん療法に結びつけられる診断検査を指す。特定の実施形態では、これらの診断方法は、生体試料中の関連するバイオマーカーに関する遺伝子病変の検出を含み、それによって抗がん療法で処置すべきまたはすべきでない患者の迅速な同定が可能になる。 As used herein, the term "companion diagnostic" refers to a diagnostic test associated with a particular anti-cancer therapy. In certain embodiments, these diagnostic methods include the detection of genetic lesions associated with relevant biomarkers in biological samples, thereby allowing rapid identification of patients who should or should not be treated with anticancer therapy. Become.

抗がん療法は、外科手術、放射線、化学療法薬、抗がん薬および免疫調節薬を含むが、これらに限定されない。 Anti-cancer therapies include, but are not limited to, surgery, radiation, chemotherapeutic agents, anti-cancer agents and immunomodulators.

抗がん薬の実例としては、アルキル化剤、例えば、チオテパおよびシクロホスファミド(CYTOXAN(商標));アルキルスルホン酸、例えばブスルファン、インプロスルファンおよびピポスルファン;アジリジン、例えば、ベンゾドーパ、カルボコン、メツレドーパおよびウレドーパ;エチレンイミンおよびメチルメラミン(methylamelamines)(アルトレタミン、トリエチレンメラミン、トリエチレンホスホラミド、トリエチレンチオホスホラミドおよびトリメチロールメラミン(trimethylolomelamine)レジュメを含む);ナイトロジェンマスタード、例えば、クロラムブシル、クロルナファジン、コロホスファミド、エストラムスチン、イホスファミド、メクロレタミン、メクロレタミンオキシド塩酸塩、メルファラン、ノベムビチン、フェネステリン、プレドニムスチン、トロホスファミド、ウラシルマスタード;ニトロソウレア、例えば、カルムスチン、クロロゾトシン、ホテムスチン、ロムスチン、ニムスチン、ラニムスチン;抗生物質、例えば、アクラシノマイシン(aclacinomysins)、アクチノマイシン、アントラマイシン(authramycin)
、アザセリン、ブレオマイシン、カクチノマイシン、カリケアマイシン、カラビシン、カルミノマイシン、カルジノフィリン、クロモマイシン、ダクチノマイシン、ダウノルビシン、デトルビシン、6−ジアゾ−5−オキソ−L−ノルロイシン、ドキソルビシンおよびそのPEG化製剤、エピルビシン、エソルビシン、イダルビシン、マルセロマイシン、マイトマイシン、ミコフェノール酸、ノガラマイシン、オリボマイシン、ペプロマイシン、ポトフィロマイシン、ピューロマイシン、クエラマイシン、ロドルビシン、ストレプトニグリン、ストレプトゾシン、ツベルシジン、ウベニメクス、ジノスタチン、ゾルビシン;代謝拮抗薬、例えば、メトトレキサートおよび5−フルオロウラシル(5−FU);葉酸類似体、例えば、デノプテリン、メトトレキサート、プテロプテリン、トリメトレキサート;プリン類似体、例えば、フルダラビン、6−メルカプトプリン、チアミプリン、チオグアニン;ピリミジン類似体、例えば、アンシタビン、アザシチジン、6−アザウリジン、カルモフール、シタラビン、ジデオキシウリジン、ドキシフルリジン、エノシタビン、フロクスウリジン、5−FU;アンドロゲン、例えば、カルステロン、プロピオン酸ドロモスタノロン、エピチオスタノール、メピチオスタン、テストラクトン;抗副腎薬(anti-adrenals)、例えば、アミノグルテチミド、ミトタン、トリロスタン;葉酸補充薬、例
えば、フォリン酸(frolinic acid);アセグラトン;アルドホスファミドグリコシド;アミノレブリン酸;アムサクリン;ベストラブシル;ビスアントレン;エダトレキサート(edatraxate);デフォファミン;デメコルシン;ジアジコン;エルフォルミチン;酢酸エリプチニウム;エトグルシド;硝酸ガリウム;ヒドロキシウレア;レンチナン;ロニダミン;ミトグアゾン;ミトキサントロン;モピダモール;ニトラクリン;ペントスタチン;フェナメット;ピラルビシン;ポドフィリン酸;2−エチルヒドラジド;プロカルバジン;PSK(登録商標);ラゾキサン;シゾフィラン;スピロゲルマニウム;テヌアゾン酸;トリアジコン;2,2’,2”−トリクロロトリエチルアミン;ウレタン;ビンデシン;ダカルバジン;マンノムスチン;ミトブロニトール;ミトラクトール;ピポブロマン;ガシトシン;アラビノシド(「Ara−C」);シクロホスファミド;チオテパ;タキソイド、例えば、パクリタキセル(TAXOL(登録商標)、Bristol−Myers Squibb Oncology、Princeton、N.J.)およびドセタキセル(doxetaxel)(TAXOTERE(登録商標)、Rhne−Poulenc Ro
rer、Antony、France);クロラムブシル;ゲムシタビン;6−チオグアニン;メルカプトプリン;メトトレキサート;白金類似体、例えば、シスプラチンおよびカルボプラチン;ビンブラスチン;白金;エトポシド(VP−16);イホスファミド;マイトマイシンC;ミトキサントロン;ビンクリスチン;ビノレルビン;ナベルビン;ノバントロン;テニポシド;アミノプテリン;ゼローダ;イバンドロネート;CPT−11;トポイソメラーゼ阻害剤RFS 2000;ジフルオロメチルオルニチン(difluoromethylomithine)(DMFO);レチノイン酸誘導体、例えば、Targretin(商標)(ベキサロテン)、Panretin(商標)(アリトレチノイン);ONTAK(商標)(デニロイキンジフチトクス);エスペラミシン;カペシタビン;ならびに上記のいずれかの薬学的に許容される塩、酸または誘導体が挙げられるが、これらに限定されない。がんに対するホルモン作用を調節または阻害するように作用する抗ホルモン剤、例えば、抗エストロゲン剤、例えば、タモキシフェン、ラロキシフェン、4(5)−イミダゾールを阻害するアロマターゼ、4−ヒドロキシタモキシフェン、トリオキシフェン、ケオキシフェン、LY117018、オナプリストン、およびトレミフェン(フェアストン)など;ならびに抗アンドロゲン剤、例えば、フルタミド、ニルタミド、ビカルタミド、ロイプロリドおよびゴセレリン;ならびに上記のいずれかの薬学的に許容される塩、酸または誘導体もこの定義に含まれる。
Examples of anti-cancer drugs include alkylating agents such as thiotepa and cyclophosphamide (CYTOXAN ™); alkyl sulfonic acids such as busulfan, improsulfan and piposulfan; aziridines such as benzodopa, carbocon, methuredopa. And uredopa; ethyleneimine and methylamelamines (including altretamine, triethylenemelamine, triethylenephosphoramide, triethylenethiophosphoramide and trimethylolomelamine resume); nitrogenmastered, eg, chlorambucil, chlorna Fazin, clophosphamide, estramstin, iposfamide, chlormethine, chlormethine oxide hydrochloride, melphalan, novemubitin, phenesterin, predonimustine, trophosphamide, urasylmasterd; Antibiotics such as aclacinomysins, actinomycin, authramycin
, Azaseline, bleomycin, cactinomycin, calikeamycin, carabicin, carminomycin, cardinophylline, chromomycin, dactinomycin, daunorbisin, detorbisin, 6-diazo-5-oxo-L-norroicin, doxorubicin and its PEGylation Formulations, epirubicin, esorbicin, idarubicin, marcelomycin, mitomycin, mycophenolic acid, nogalamycin, olivomycin, pepromycin, potophilomycin, puromycin, queramicin, rodorbisin, streptnigrin, streptosocin, tubersidine, ubenimex, dinostatin; Metabolic antagonists such as methotrexate and 5-fluorouracil (5-FU); folic acid analogs such as denopterin, methotrexate, pteropterin, trimetrexate; purine analogs such as fludalabine, 6-mercaptopurine, thiamipulin, thioguanine; Pyrimidin analogs such as ancitabine, azacitidine, 6-azauridine, carmofur, cytarabine, dideoxyuridine, doxiflulysine, enocitabine, floxuridine, 5-FU; androgen such as carsterone, dromostanolone propionate, epithiostanol, mepitiostane, test. Lactone; anti-adrenals, eg, aminoglutetimid, mitotan, trilostane; folic acid replacement agents, eg, frolinic acid; acegraton; aldphosphamide glycoside; aminolevulinic acid; amsacrine; best love Syl; bisanthren; edatraxate; defofamine; demecorcin; diadicon; elformitin; elliptinium acetate; etoglucid; gallium nitrate; hydroxyurea; lentinan; lonidamine; mitogazone; mitoxanthron; mopidamole; nitraclin; pentostatin; phenamet; Pirarubicin; podophylphosphate; 2-ethylhydrazide; procarbazine; PSK®; razoxane; cyzophyllane; spirogermanium; tenazonoic acid; triazicon; 2,2', 2 "-trichlorotriethylamine;urethane;bindesin;dacarbazine;mannomustin; mitobronitol Methotrexate; Pipobroman; Gasitocin; Arabinoside ("Ara-C");Cyclophosphamide;thiotepa; taxoids, such as paclitaxel (TAXOL®, Bristol-Myers Squibb Oncology, Princeton, N. et al. J. ) And docetaxel (TAXOTIRE®, Rhne-Poulenc Ro)
rer, Antony, France); chlorambusyl; gemcitabine; 6-thioguanine; mercaptopurine; methotrexate; platinum analogs such as cisplatin and carboplatin; vinbrostin; platinum; etoposide (VP-16); ifofamide; mitomycin C; mitoxanthrone; Vinorelbine; Vinorelbine; Navelbine; Novantron; Teniposide; Aminopterin; Xeloda; Ivandronate; CPT-11; Topoisomerase inhibitor RFS 2000; Difluoromethylomithine (DMFO); Retinoic acid derivatives such as Targretin ™ (trademark). Bexarotene), Panretin ™ (Alitretinoin); ONTAK ™ (Deniroykin diftytox); Esperamicin; Capecitabine; and any of the above pharmaceutically acceptable salts, acids or derivatives. Not limited to these. Anti-hormonal agents that act to regulate or inhibit hormonal effects on cancer, such as anti-estrogen agents, such as tamoxifen, raloxifene, 4 (5) -imidazole-inhibiting aromatase, 4-hydroxytamoxifen, trioxyfen, Chemoxifen, LY117018, onapristone, and toremifene (fairstone), etc .; and antiandrogen agents such as flutamide, niltamide, bicalutamide, leuprolide and goseleline; and also pharmaceutically acceptable salts, acids or derivatives of any of the above. Included in this definition.

免疫調節薬の実例としては、シクロスポリン、タクロリムス、トレスペリムス、ピメクロリムス、シロリムス、ベロリムス、ラフルニムス、ラキニモドおよびイミキモド、ならびにこれらの類似体、誘導体、塩、イオンおよび複合体が挙げられるが、これらに限定されない。 Examples of immunomodulators include, but are not limited to, cyclosporine, tacrolimus, tresperimus, pimecrolimus, sirolimus, verolimus, raflunimus, lacinimod and imiquimod, as well as analogs, derivatives, salts, ions and complexes thereof.

本明細書に引用されているすべての出版物、特許出願および発行特許は、個々の出版物、特許出願または発行特許各々が参照により組み入れられていると具体的にかつ個々に示されているかのごとく、参照により本明細書に組み入れられている。 Whether all publications, patent applications and issuance patents cited herein are specifically and individually indicated that each individual publication, patent application or issuance patent is incorporated by reference. As such, it is incorporated herein by reference.

上述の発明は、理解を明確にする目的で説明および例としてある程度詳細に記載されているが、本発明の教示を考慮して、添付の特許請求の範囲の趣旨または範囲を逸脱することなく、ある特定の変更および改変をそこに加えることができることは、当業者には容易に明らかであろう。以下の実施例は、単に説明として与えるものであり、限定として与えるものではない。当業者は、本質的に同様の結果が得られるように変更または改変することができる、様々な重要性の低いパラメータに容易に気付くであろう。 The invention described above has been described in some detail as description and examples for the purpose of clarifying understanding, but in view of the teachings of the present invention, without departing from the spirit or scope of the appended claims. It will be readily apparent to those skilled in the art that certain changes and modifications can be made therein. The following examples are given merely as an explanation and not as a limitation. One of skill in the art will readily notice a variety of less important parameters that can be modified or modified to achieve essentially similar results.

(実施例1)
標的化配列捕捉技術を使用する低頻度変異の正確な検出
目的
本実験の目的は、標的化配列捕捉技術を使用する低頻度バリアント検出の原理証明を直接実証することであった。
(Example 1)
Accurate detection of low-frequency mutations using targeted sequence capture technology The purpose of this experiment was to directly demonstrate the principle of low-frequency variant detection using targeted sequence capture technology.

背景
標的配列捕捉技術は、核酸の定量的な配列ベースの遺伝子解析をもたらし、この技術を活用して、薬物代謝遺伝子の変異数とコピー数の組合せ解析を行うことができる。本発明者らは、標的化配列捕捉技術およびその後の遺伝子解析を使用して、低頻度配列バリアントを検出した。
Background Target sequence capture technology results in quantitative sequence-based gene analysis of nucleic acids, which can be utilized to perform combined analysis of mutations and copies of drug-metabolizing genes. We used targeted sequence capture techniques and subsequent genetic analysis to detect low frequency sequence variants.

ゲノムDNAインプットは、低頻度バリアント検出に中心的な役割を果たすが、ゲノムインプットの定量的解析および制御によって、低頻度バリアント解析の推定感度の限界値がおかれる。本発明者らはゲノムインプットを推定するためにゲノムqPCRアッセイを使用した。 Genomic DNA inputs play a central role in the detection of infrequent variants, but quantitative analysis and control of genomic inputs puts limits on the estimated sensitivity of infrequent variant analysis. We used the genomic qPCR assay to estimate genomic input.

低頻度バリアント解析の1つの実験目標は、アッセイの標的感度に対して10倍多いゲノムインプットの導入である。言い換えると、1%(100中1)の感度でバリアントを測定するためには、実験標的は、1000ゲノムのインプットとなる。シークエンシングの下流でバイオインフォマティクス解析がユニークリード数を明らかにし、これは、ゲノムインプットの直交的測定とより直接的な測定の両方であるという望ましい品質を有する。 One experimental goal of infrequent variant analysis is the introduction of genomic inputs that are 10-fold greater than the target sensitivity of the assay. In other words, in order to measure the variant with a sensitivity of 1% (1 in 100), the experimental target is the input of 1000 genomes. Downstream of sequencing, bioinformatics analysis reveals unique read numbers, which have the desired quality of being both orthogonal and more direct measurements of genomic input.

概要
SNVが既知である細胞株(ZR75−30)と生殖系列DNA試料(NA12878)とを1対1〜1対1000の範囲の希釈系列で混合した。既知の配列差に対応する標的領域を、標的化配列捕捉技術を使用して検索し、シークエンシングした。1000配列につき1未満の頻度で発生する配列バリアントを検出した。
Summary Cell lines with known SNV (ZR75-30) and germline DNA samples (NA12878) were mixed in a dilution range ranging from 1: 1 to 1: 1000. Target regions corresponding to known sequence differences were searched and sequenced using targeted sequence capture techniques. Sequence variants that occur less than 1 per 1000 sequences were detected.

方法
捕捉プローブ
次の表は、この実験で使用した一群の62捕捉プローブを示す。

Figure 2021182940
Figure 2021182940
Figure 2021182940
Methods Capturing probes The following table shows a group of 62 capturing probes used in this experiment.
Figure 2021182940
Figure 2021182940
Figure 2021182940

捕捉プローブモジュールをストックプレートからプールし、パートナーオリゴ#138(配列番号63)(GTGAAAACCAGGATCAACTCCCGTGCCAGTCACAT/3BioTEG/)と併せ、1nMの最終作業濃度に希釈した。 The capture probe module was pooled from the stock plate and combined with partner oligo # 138 (SEQ ID NO: 63) (GTGAAAACCAGGTCAACTCCCGTGCCAGTCACAT / 3BioTEG /) and diluted to a final working concentration of 1 nM.

ゲノム試料
生殖系列試料NA12878および細胞株ZR75−30からの商業的に購入したゲノムDNAを、Covaris超音波処理装置で、10〜20ng/μlの濃度で500bpの標的断片サイズに断片化した。そのDNAを1:1濃度のDNA精製ビーズで精製し、New England Biolabs(NEB)Quick bluntキットを使用して15〜30ng/μLの最終濃度で末端修復した。生殖系列DNAと細胞株DNAをそれぞれ1:1、10:1、100:1および1000:1の比でブレンドした。ライブラリーを構築し、精製し、定量した。ライブラリー構築に使用した試料コード、ライブラリー定量およびインプットを表2に示す。

Figure 2021182940
Genome Samples Commercially purchased genomic DNA from germline sample NA12878 and cell line ZR75-30 was fragmented with a Covaris sonicator to a target fragment size of 500 bp at a concentration of 10-20 ng / μl. The DNA was purified with 1: 1 concentration of purified DNA beads and terminally repaired at a final concentration of 15-30 ng / μL using the New England Biolabs (NEB) Quick bluet kit. Germline DNA and cell line DNA were blended in ratios of 1: 1, 10: 1, 100: 1 and 1000: 1, respectively. A library was constructed, purified and quantified. Table 2 shows the sample code, library quantification and inputs used to build the library.
Figure 2021182940

ゲノムライブラリーをプールし、変性させ、プローブと併せ、ハイブリダイズし、洗浄した。洗浄した捕捉プローブ−タグ付きゲノムライブラリー複合体をフォワードおよびリバース完全長プライマーで増幅させ、精製し、Pippin−prep装置で225〜600bp断片をサイズ選択した。最後に、150−V3 Illuminaシークエンシングキットを使用して、捕捉された物質をシークエンシングした。 Genomic libraries were pooled, denatured, combined with probes, hybridized and washed. The washed capture probe-tagged genomic library complex was amplified with forward and reverse full-length primers, purified, and size-selected for 225-600 bp fragments with a Pippin-prep device. Finally, the 150-V3 Illumina sequencing kit was used to sequence the captured material.

結果
BRAF(2つの座位で)、MYCNおよびCDH1を標的にする対の捕捉プローブを使用して、これらの座位におけるSNVを解析した。結果を表3に示す。

Figure 2021182940
Figure 2021182940
Results A pair of capture probes targeting BRAF (in two loci), MYCN and CDH1 were used to analyze SNV in these loci. The results are shown in Table 3.
Figure 2021182940
Figure 2021182940

縦列3は、ユニークリード数の総数を示し、そしてまたその数によってアッセイの感度における限界値が提供される。推定および測定ゲノムインプットは、十分に互いの範囲内であった。薄い影を付けたボックスは、細胞株配列が生殖系列配列とは異なっていたSNVを強調する。表の右の部分に示した、ユニークリードのフィルタリング不在下では、これら4つの選択位置で、測定可能な、非ゼロ頻度の、ランダムな塩基変化が発生した。図1。変化がユニークリードファミリー内で発生することを要求することにより、間違いの元となるノイズから真のシグナルを選別することが可能になった。図2。 Column 3 shows the total number of unique reads, which also provides a limit on the sensitivity of the assay. Estimated and measured genomic inputs were well within range of each other. The lightly shaded box highlights the SNV whose cell line sequence was different from the germline sequence. In the absence of unique read filtering shown in the right part of the table, measurable, non-zero frequency, random base changes occurred at these four selection positions. FIG. 1. By requiring the change to occur within the unique read family, it was possible to sort out the true signal from the noise that caused the error. FIG. 2.

(実施例2)
高度に断片化されたgDNA内の標的領域の包括的シークエンシングに有効な新規プローブ設計
目的
これらの実験の目的は、循環DNAを確実にかつ再現可能に調べるためのアッセイシステムを開発することである。
(Example 2)
New probe design effective for comprehensive sequencing of target regions in highly fragmented gDNA Objective The purpose of these experiments is to develop an assay system for reliable and reproducible examination of circulating DNA. ..

背景
体液からの循環DNAの解析は、分子診断の胸の高鳴るような、しかしまだ実現されていない機会を意味する。ゲノムDNAは、非常にインタクトである。文献は、循環DNAの平均サイズが、単一ヌクレオソームヒストン複合体に巻き付いているDNAのサイズに十分に相関する約150bpであることを示唆している。
Analysis of circulating DNA from background fluid represents a thrilling, but not yet realized opportunity for molecular diagnostics. Genomic DNA is very intact. The literature suggests that the average size of circulating DNA is about 150 bp, which correlates well with the size of DNA wrapped around a single nucleosome histone complex.

概要
本明細書において企図される標的化配列捕捉技術の技術パラメータは、高度に断片化されたDNAに対応するように、および標的化DNAの広範囲にわたる配列カバレッジを生じさせる能力を保持するように設計した。捕捉プローブ密度を増加させ、捕捉プローブ配列の長さを60ヌクレオチドから40ヌクレオチドに短縮して、クローンライブラリーにおける情報価値のない配列の生成を最小にした。ヒトゲノムには、反復配列、および塩基組成の極端な増減が多く存在するので、より高い捕捉プローブ密度およびより短い捕捉プローブを実装することの適切性は認められておらず、この新規アッセイの実験による検証を要した。
Summary The technical parameters of the targeted sequence capture technique contemplated herein are designed to accommodate highly fragmented DNA and retain the ability to generate extensive sequence coverage of the targeted DNA. bottom. The capture probe density was increased and the length of the capture probe sequence was shortened from 60 nucleotides to 40 nucleotides to minimize the generation of non-informational sequences in the clone library. Due to the large number of repetitive sequences and extreme changes in base composition in the human genome, the suitability of implementing higher capture probe densities and shorter capture probes has not been found to be appropriate and is based on experiments with this novel assay. Verification required.

より短い40mer捕捉プローブ配列が信頼性のある頑強なアッセイ性能を示す条件を確立した。実験の第1のセットでは、アッセイを使用して、2つの大きな領域−腫瘍抑制遺伝子TP53のコード領域とALKがん遺伝子の長い連続する第19イントロン(これらの両方ががん診断の中核をなすものである)−を照会した。実験の第2のセットでは、より短い40ヌクレオチド捕捉プローブ配列を有する、いくつかの高密度の対での捕捉プローブを使用して、NCI−H69細胞株中に存在する既知のSNVを調べた。 Conditions have been established for shorter 40mer capture probe sequences to exhibit reliable and robust assay performance. In the first set of experiments, the assay was used to use two large regions-the coding region of the tumor suppressor gene TP53 and the long, contiguous 19th intron of the ALK oncogene, both of which form the core of cancer diagnosis. )-Inquired. In the second set of experiments, several dense paired capture probes with shorter 40 nucleotide capture probe sequences were used to examine known SNVs present in the NCI-H69 cell line.

この新規の高密度でより短い捕捉プローブを使用して短い断片化DNAの照会に成功し、結果は、このアッセイ設計が血液の血漿画分において見いだされる循環DNAのシークエンシングによく適していることを示した。 This novel high-density, shorter capture probe was successfully queried for short fragmented DNA, and the results show that this assay design is well suited for sequencing circulating DNA found in blood plasma fractions. showed that.

方法−改変型40mer捕捉プローブ
40mer捕捉プローブの性能を実験により検証するために使用した捕捉プローブ配列を表4に示す。

Figure 2021182940
Figure 2021182940
Figure 2021182940
Figure 2021182940
Figure 2021182940
Method-Modified 40mer capture probe Table 4 shows the capture probe sequences used to experimentally verify the performance of the 40mer capture probe.
Figure 2021182940
Figure 2021182940
Figure 2021182940
Figure 2021182940
Figure 2021182940

40mer捕捉プローブの性能を60mer捕捉プローブのものと比較した。60merの5’末端から20ヌクレオチド除去することによって、60merから40merを設計した。両方の捕捉プローブセットの3’末端は、捕捉されたゲノムクローンからコピーされる配列に関して同一であるが、プローブ配列シグネチャー(対合末端リードのリード2)は、60merプローブセットと40merプローブセット間で異なる。この設計は、捕捉プローブをシークエンシング中に多重化することが可能であり、その後、それらの性能を下流のバイオインフォマティクスデコンボリューション(deconvolution)中に
解析することが可能であるので、有用である。
The performance of the 40mer capture probe was compared with that of the 60mer capture probe. By removing 20 nucleotides from the 5'end of 60 mer, 60 mer to 40 mer was designed. The 3'ends of both capture probe sets are identical for the sequences copied from the captured genomic clones, but the probe sequence signature (lead 2 of the paired terminal read) is between the 60mer and 40mer probe sets. different. This design is useful because it allows the capture probes to be multiplexed during sequencing and then their performance analyzed during downstream bioinformatics deconvolution.

ゲノム試料
12のゲノムDNA試料(112ヒトゲノムDNAのCoriellヒトパネルから選択したもの)のプールを標的DNAとして使用した。それらの12試料を、表5に詳細に示すように各々が試料4つの4セットに分けた。

Figure 2021182940
Genomic Samples A pool of 12 genomic DNA samples (selected from the Coriell human panel of 112 human genomic DNAs) was used as the target DNA. The 12 samples were divided into 4 sets of 4 samples each, as detailed in Table 5.
Figure 2021182940

ハイブリダイゼーション、洗浄およびシークエンシング
6つの異なるハイブリダイゼーション条件を使用して、60merおよび40merプローブをゲノム標的DNAにハイブリダイズした:
1)60merプローブを50℃で洗浄
2)40merプローブを50℃で洗浄
3)60merプローブを47℃で洗浄
4)40merプローブを47℃で洗浄
5)60merプローブを44℃で洗浄
6)40merプローブを44℃で洗浄。
Hybridization, Washing and Sequencing Six different hybridization conditions were used to hybridize 60mer and 40mer probes to genomic target DNA:
1) Cleaning the 60mer probe at 50 ° C 2) Cleaning the 40mer probe at 50 ° C 3) Cleaning the 60mer probe at 47 ° C 4) Cleaning the 40mer probe at 47 ° C 5) Cleaning the 60mer probe at 44 ° C 6) Cleaning the 40mer probe at 44 ° C Washed at 44 ° C.

実験ごとに、捕捉プローブオリゴをパートナーオリゴと併せた。二本鎖捕捉プローブの最終濃度は、各捕捉プローブについて1nMであった。 For each experiment, capture probe oligos were combined with partner oligos. The final concentration of double-stranded capture probes was 1 nM for each capture probe.

各ハイブリダイゼーション反応は、全体積40μl中に約2.5μgのゲノムライブラリーを有した。各試料を2分間、98℃に加熱し、次いで、氷で冷却した。20μlの捕捉プローブおよび90μlのハイブリダイゼーションバッファーを添加し、そのハイブリダイゼーション混合物を、80℃で出発して48分ごとに1度低下させて50℃にする24時間のインキュベーションに付した。複合体を全体積1mLのTEzeroバッファー+0.05%Tween20(TT)中の20ulのストレプトアビジンビーズと結合させた。ビーズを200ulのTTで各々5分間、3回洗浄し、45℃で5分間、洗浄バッファー中で1回洗浄した。次いで、ビーズをTEzeroで洗浄し、反応ごとに20μl
TEzeroに再懸濁させた。次いで、複合体を、完全長フォワード(ACA2_FLFP;配列番号152;AATGATACGGCGACCACCGAGATCTACACGTCATGCAGGACCAGAGAATTCGAATACA)および完全長リバース(CAC3_FLRP;配列番号153;CAAGCAGAAGACGGCATACGAGATGTGACTGGCACGGGAGTTGATCCTGGTTTTCAC)プライマーでPCR増幅させた。
Each hybridization reaction had an approximately 2.5 μg genomic library in a total volume of 40 μl. Each sample was heated to 98 ° C. for 2 minutes and then cooled with ice. 20 μl of capture probe and 90 μl of hybridization buffer were added and the hybridization mixture was subjected to a 24-hour incubation starting at 80 ° C. and lowered once every 48 minutes to 50 ° C. The complex was bound to 20 ul of streptavidin beads in 1 mL of TEzero buffer + 0.05% Tween 20 (TT) in total volume. The beads were washed 3 times with 200 ul TT for 5 minutes each and washed once in wash buffer at 45 ° C. for 5 minutes. The beads were then washed with TEzero and 20 μl per reaction.
It was resuspended in Tezero. The complex is then subjected to full-length forward (ACA2_FLFP; SEQ ID NO: 152; AATTGATACGGGCACCGAGAATTACACCGTCATGCAGGAGACGAGAATTCCGAATACA) and full-length reverse (CAC3_FLRP; SEQ ID NO: 153; CAAGCAGAAGGCGGCATGAGTGAGTGAGTGAGTGATCGGGTgACTGACTGACT.

増幅および精製後、得られた産物の質量を測定し、等しい質量をシークエンシングのためにプールした。 After amplification and purification, the masses of the resulting products were measured and equal masses were pooled for sequencing.

結果−改変型40merプライマー
長さおよび洗浄温度の関数として捕捉プローブ性能を図3に図示する。全体として、40mer捕捉プローブは、44℃および47℃洗浄で60mer捕捉プローブと同様によく機能した。50℃洗浄では、40mer捕捉プローブは散発的な挙動を示す。これらのデータは、これらの試薬を使用する場合の40mer捕捉プローブおよび44℃〜47℃の範囲の洗浄温度の使用を実験により検証するものである。
Results-The capture probe performance as a function of modified 40mer primer length and wash temperature is illustrated in FIG. Overall, the 40 mer capture probe worked as well as the 60 mer capture probe with 44 ° C and 47 ° C washes. At 50 ° C. washing, the 40mer capture probe behaves sporadically. These data experimentally validate the use of 40mer capture probes and wash temperatures in the 44 ° C. to 47 ° C. range when using these reagents.

方法−高密度40mer
一般に、配列捕捉プローブは、特異的「規則」を使用して設計する。例えば、冗長配列の領域、または極度の塩基組成の偏りを示す領域を一般に避ける。高いプローブ密度および標的領域に沿った近いプローブ間隔の要件の1つの重要な含意は、あらゆるそのようなプローブ設計規則に対応するためにプローブを移動させる許容範囲が殆どまたは全くないことである。この研究では、プローブを、プローブ結合配列を一切考慮せずに、互いに対するそれらの位置にのみ基づいて設計したため、この高密度アプローチの使用は、ハイブリダイゼーション方法および処理方法がそのような一群のプローブに対応することを実験により検証することを必要とする。
Method-High Density 40mer
In general, sequence capture probes are designed using specific "rules". For example, regions of redundant sequences, or regions that exhibit extreme base composition bias, are generally avoided. One important implication of the requirement for high probe density and close probe spacing along the target area is that there is little or no tolerance for moving the probe to accommodate any such probe design rules. In this study, the probes were designed based only on their position relative to each other, without any consideration of probe binding sequences, so the use of this high density approach is such a group of probes with hybridization and processing methods. It is necessary to verify by experiment that it corresponds to.

ヒトALK遺伝子は、早期発生に重要なプロテインキナーゼをコードするが、正常なALK遺伝子発現は、正常な成人では本質的に検出できない。発がん性ALK融合体は、ALKの第19イントロンが、ALKのキナーゼコード部分を別の遺伝子の5’末端に融合させる非正統組換えを受けたとき生成される。そのような遺伝子融合体は、ALKキナーゼの異所性発現を引き起こすことが多く、そしてまたこの異所性発現は、肺腫瘍で観察される不適切な細胞増殖の駆動に重要である。肺がんの場合、この「他の遺伝子」はEML4であることが多いが、他の融合パートナーも検出されている。可能性のあるあらゆるALK遺伝子融合事象を検出することができるアッセイを作成するために、ALKの第19イントロンに80ヌクレオチド間隔で配置される40ヌクレオチドプローブを設計した。これらのプローブを遺伝子に対してアンチセンスになるように配向させた(図4)。これは、それらの3’末端が伸長し、それらのハイブリダイゼーション部位に対して5’にある遺伝子領域をコピーすることを意味する。融合遺伝子が存在する場合、融合ジャンクション付近に位置するプローブからのプローブ伸長は、ジャンクション配列をコピーする。これらのジャンクションクローンから得られるDNA配列は、それらの5’末端に融合パートナー配列を有し、融合ジャンクション配列を有し、そしてそれらの3’末端にALK第19イントロン配列を有する(図4B)。 The human ALK gene encodes a protein kinase that is important for early development, but normal ALK gene expression is essentially undetectable in normal adults. A carcinogenic ALK fusion is produced when the 19th intron of ALK undergoes an unorthodox recombination that fuses the kinase coding portion of ALK to the 5'end of another gene. Such gene fusions often cause ectopic expression of ALK kinase, and this ectopic expression is also important in driving the inappropriate cell proliferation observed in lung tumors. In the case of lung cancer, this "other gene" is often EML4, but other fusion partners have also been detected. To create an assay capable of detecting any possible ALK gene fusion event, a 40 nucleotide probe was designed placed at 80 nucleotide intervals in the 19th intron of ALK. These probes were oriented antisense to the gene (Fig. 4). This means that their 3'ends are elongated and copy the gene region at 5'to their hybridization site. If a fusion gene is present, probe extension from a probe located near the fusion junction copies the junction sequence. The DNA sequences obtained from these junction clones have a fusion partner sequence at their 5'end, a fusion junction sequence, and an ALK 19th intron sequence at their 3'end (FIG. 4B).

がんにおけるもう1つの重要な診断標的は、TP53遺伝子である。この遺伝子は、腫瘍抑制因子をコードし、がんにおいて、多くの場合、変異によって不活性化される。遺伝子機能を不活性化することができる変異はこの遺伝子全体にわたって散在するので、TP53不活性化変異についての配列ベースの包括的アッセイは、この遺伝子の全コード領域および非翻訳領域(UTR)に対処しなければならない。循環DNA断片は短いので、高密度プローブを使用してTP53遺伝子のすべての標的領域を調べた。ALKとは異なり、TP53についてのプローブを可能性のある両方の配向で配置する(図5)。高いプローブ密度では、複数のプローブからの累積カバレッジが標的領域の均一な深いシークエンシングカバレッジをもたらす。 Another important diagnostic target in cancer is the TP53 gene. This gene encodes a tumor suppressor and is often inactivated by mutations in cancer. Since mutations capable of inactivating gene function are scattered throughout this gene, a sequence-based comprehensive assay for TP53 inactivating mutations addresses the entire coding region and untranslated region (UTR) of this gene. Must. Since the circulating DNA fragment is short, a high density probe was used to examine all target regions of the TP53 gene. Unlike ALK, the probe for TP53 is placed in both possible orientations (Fig. 5). At high probe densities, cumulative coverage from multiple probes results in uniform, deep sequencing coverage of the target area.

この研究に使用した一連の105プローブを表6に示す。ALKの融合しやすい領域およびTP53のコード領域を標的にするプローブに加えて、細胞株DNAにおける既知のSNVを包括するプローブも含めた。 The series of 105 probes used in this study is shown in Table 6. In addition to probes targeting the Flux-friendly region of ALK and the coding region of TP53, we also included probes that include known SNVs in cell line DNA.

Figure 2021182940
Figure 2021182940
Figure 2021182940
Figure 2021182940
Figure 2021182940
Figure 2021182940
Figure 2021182940
Figure 2021182940
Figure 2021182940
Figure 2021182940

ゲノム試料
ゲノムDNAの3つの試料を解析した:
1)生殖系列試料NA 06994 − Coriellレポジトリから得た正常ヒト試料、
2)がん細胞株NCI−H69 − TP53に変異があり、MYCN座位の増幅があり、標的プローブセット内に含めたALDH4A1、BRCA1、BRCA2、CDKN2A、DPYD、EPHX1、MYC、RB1およびTNFRSF14にSNVがあることが既知の細胞株、
3)がん細胞株ZR−75−1、この細胞株はEML4−ALK融合遺伝子を有することが報告されている(Linら、Mol.Cancer Res.、7巻(9号):1466頁、2009
年)。
Genome Samples Three samples of genomic DNA were analyzed:
1) Germline sample NA 06994-Normal human sample obtained from Coriell repository,
2) There is a mutation in the cancer cell line NCI-H69-TP53, amplification of the MYCN locus, and SNV in ALDH4A1, BRCA1, BRCA2, CDKN2A, DPYD, EPHX1, MYC, RB1 and TNFRSF14 included in the target probe set. Cell lines known to exist,
3) Cancer cell line ZR-75-1, which is reported to have the EML4-ALK fusion gene (Lin et al., Mol. Cancer Res., Vol. 7 (9): 1466, 2009).
Year).

DNAシークエンシングライブラリーは、一般に、共有DNA断片から構築される。音響分解を使用して、サイズが200〜>500bpの範囲であるDNA断片を生成した。ヌクレオソームの約150bp断片で構成されていると考えられる循環DNAを模倣する目的で、音響によって断片化されたDNAの酵素的断片化を行った。簡単に言うと、20〜40ng/μlのDNAを200bp設定で超音波処理し、サイズが150bp〜400bpの範囲である広いスメアの断片を得た。0.01および0.02μlのDNAse酵素(New England Biolabs組換えウシDNAse)をDNAseバッファー(10mM Tris pH8.0、2.5mM MnCl、0.5mM CaCl)中のDNAの50μlアリコートに添加することによって、DNAをさらに断片化した。DNAse反応を37℃で10分間インキュベートし、0.5M EDTAを25mMの最終濃度まで添加することで反応を停止させた。150bpの平均サイズを有するDNAを、最初に0.9体積のビーズを1体積のDNAに添加することにより「両側」ビーズ選択によって精製した。ビーズは望ましくないより大きい断片に結合するので、それらのビーズを廃棄し、追加の1.6体積のビーズをその上清に添加する。次いで、結合物質を精製し、定量する。ライブラリー構築に使用した、結果として生じた高度に断片化された短いDNAのアガロースゲルを図6に示す。 DNA sequencing libraries are generally constructed from shared DNA fragments. Acoustic decomposition was used to generate DNA fragments ranging in size from 200 to> 500 bp. Enzymatic fragmentation of acoustically fragmented DNA was performed to mimic circulating DNA believed to be composed of approximately 150 bp fragments of nucleosomes. Briefly, 20-40 ng / μl of DNA was sonicated at a setting of 200 bp to give broad smear fragments ranging in size from 150 bp to 400 bp. 0.01 and 0.02 μl of DNAse enzyme (New England Biolabs recombinant bovine DNAse) is added to a 50 μl aliquot of DNA in a DNAse buffer (10 mM Tris pH 8.0, 2.5 mM MnCl 2 , 0.5 mM CaCl 2). This further fragmented the DNA. The DNAse reaction was incubated at 37 ° C. for 10 minutes and the reaction was stopped by adding 0.5 M EDTA to a final concentration of 25 mM. DNA with an average size of 150 bp was purified by "bilateral" bead selection by first adding 0.9 volumes of beads to 1 volume of DNA. Since the beads bind to larger pieces that are not desirable, discard the beads and add an additional 1.6 volumes of beads to the supernatant. The binding agent is then purified and quantified. The resulting highly fragmented short DNA agarose gel used to build the library is shown in FIG.

断片化されたDNAを、NEBからのQuick Bluntキットを使用して末端修復し、表7に示す比でブレンドした。次いで、10ナノグラムのブレンドDNAを、表7に示す配列を有するアダプターにライゲーションした。混合物9および15については、各々10ngを用いる2回のライゲーション反応を行い、その後、プールした。混合物16については、4回の反応を行った。qPCRアッセイを使用する各ライブラリーへのゲノムインプットの推定値も表7に示す。

Figure 2021182940
Figure 2021182940
Fragmented DNA was terminally repaired using the Quick Blunt kit from NEB and blended in the ratios shown in Table 7. Then, 10 nanograms of blended DNA was ligated to an adapter having the sequences shown in Table 7. Mixtures 9 and 15 were subjected to two ligation reactions using 10 ng each and then pooled. The mixture 16 was reacted four times. Estimates of genomic input to each library using the qPCR assay are also shown in Table 7.
Figure 2021182940
Figure 2021182940

標的化シークエンシング
表7に示した16のDNAライブラリー各々の1マイクログラムをプールし、160μLの最終体積になるように調整した。8つの同一の20μLアリコートを98℃で変性させ、氷上で冷却し、1nM/プローブでの20μLのプローブ(表6)と50μLのCF
hybバッファーとを添加した。試料を24時間、80℃〜50℃でアニールし、洗浄し、増幅させた。結果として生じた捕捉され処理された断片の増幅後、175〜400bpのサイズ選択でPippin Prep(商標)装置を使用して最終シークエンシングライブラリーをサイズ選択した。150リードV3キットを使用してIllumina MiSeqでライブラリーをシークエンシングした。
Targeted Sequencing 1 microgram of each of the 16 DNA libraries shown in Table 7 was pooled and adjusted to a final volume of 160 μL. Eight identical 20 μL aliquots were denatured at 98 ° C., cooled on ice, 20 μL probe at 1 nM / probe (Table 6) and 50 μL CF.
With hyb buffer was added. The sample was annealed at 80 ° C. to 50 ° C. for 24 hours, washed and amplified. After amplification of the resulting captured and processed fragments, the final sequencing library was sized using a Pippin Prep ™ device with a size selection of 175-400 bp. Libraries were sequenced on Illumina MiSeq using a 150-lead V3 kit.

結果
位置に基づいて選択した高密度捕捉プローブの標的配列に関する捕捉プローブ性能をモニターした。各捕捉プローブの性能のグラフ表示を図7に示す。これらのデータは、
1)位置拘束によって厳密に選択したすべての捕捉プローブによってオンターゲット配列情報が得られたこと、
2)大部分の捕捉プローブがオフターゲットのマッピング不能なリード捕捉を殆ど示さないこと、および
3)有用なオンターゲットリードの収量が実質的に均一であったこと
を立証する。
The capture probe performance for the target sequence of the high density capture probe selected based on the result position was monitored. A graph showing the performance of each capture probe is shown in FIG. These data are
1) On-target sequence information was obtained by all capture probes strictly selected by position constraint.
2) Prove that most capture probes show little off-target unmappable read capture, and 3) yields of useful on-target reads were substantially uniform.

大きな割合のオフターゲットでマッピング不能なリードを捕捉した捕捉プローブをさらに解析した。これらの捕捉プローブは、一般に、低い配列複雑度/高い配列冗長性の領域に位置した。しかし、ここで、そのような捕捉プローブは、シークエンシング深度に有意な有害な影響を与えなかった。なぜなら、高レベルのプローブ冗長性(高密度プローブ)は、いくつかのプローブに由来するリードによってすべての領域が包括されることを意味するからである。正味の効果は、カバレッジの優れた均一性であった。例えば、図8、40mer捕捉プローブを使用するTP53遺伝子のプローブカバレッジを参照されたい。 Further analysis was performed on capture probes that captured unmapping leads with a large percentage of off-targets. These capture probes were generally located in areas of low complexity / high sequence redundancy. However, here, such a capture probe did not have a significant detrimental effect on the sequencing depth. This is because a high level of probe redundancy (high density probe) means that all regions are covered by reads from several probes. The net effect was excellent uniformity of coverage. See, for example, Figure 8, probe coverage of the TP53 gene using a 40 mer capture probe.

結論
総合すると、これらのデータは、(捕捉洗浄温度を調整すると)プローブ性能の識別可能な損失が殆どまたは全くなく捕捉プローブ長を60ヌクレオチドから40ヌクレオチドに短縮することができることを立証する。これらのデータは、プローブ設計が位置拘束に従うことができ、一般に配列関係および組成を無視してもよいことも示す。この方法論が、あまりよく機能しないこともあるプローブを生じさせたとしても、近いプローブ間隔での高い冗長性は、個々のプローブの欠損を補って余りある。
Conclusion Taken together, these data demonstrate that the capture probe length can be reduced from 60 nucleotides to 40 nucleotides with little or no discernible loss of probe performance (adjusting the capture wash temperature). These data also indicate that the probe design can be constrained and that sequence relationships and composition can generally be ignored. Even if this methodology results in probes that may not work very well, the high redundancy at close probe intervals more than compensates for the lack of individual probes.

(実施例3)
循環DNAの遺伝子解析
目的
この実施例の目的は、cfDNAおよび標的検索システムの効率的クローニング手順を使用してcfDNAの遺伝子解析を評価することであった。
(Example 3)
Objectives of Gene Analysis of Circulating DNA The purpose of this example was to evaluate genetic analysis of cfDNA using an efficient cloning procedure for cfDNA and a target search system.

背景
科学および医療団体の「リキッドバイオプシー」−潜在的疾患状態に関連するマーカーについての循環DNA(cfDNA)の解析−に対する意気込みはとてつもなく大きいが、この潜在的分析物についての実際の情報は著しく少ない。
Background The enthusiasm of scientific and medical organizations for "liquid biopsy" -analysis of circulating DNA (cfDNA) for markers associated with potential disease states-is enormous, but the actual information about this potential analysis is significantly scarce.

概要
健常ドナーおよび卵巣がんまたは結腸がんのどちらか一方に罹患している個体から採取した血漿試料を使用して、循環DNAの遺伝子解析を行った。循環cfDNAの量および全般的特徴は、個体によって大きく異なりうる。驚くべきことに、本発明者らは、cfDNAを高度に精製された断片化ゲノムDNAと区別できない効率で容易にクローニングすることができること、断片サイズが(7/8試料で)170±10bpの平均クローンインサートサイズで顕著に一致していたこと、およびそのような試料からのゲノム提示が均一であり、精製gDNAを使用して行った実験と同等であったことを見いだした。ユニークリードを計数することによって、各ライブラリーにおける提示の深度により、罹病患者のcfDNA中に存在する腫瘍マーカーについての小さい対立遺伝子頻度の推定値が得られることをさらに確証した。この研究は、本明細書において企図される組成物および標的検索システムがcfDNAの定量的遺伝子解析に有効に適用されることを確証した。
Summary Genetic analysis of circulating DNA was performed using plasma samples taken from healthy donors and individuals suffering from either ovarian cancer or colon cancer. The amount and general characteristics of circulating cfDNA can vary widely from individual to individual. Surprisingly, we can easily clone cfDNA with an efficiency indistinguishable from highly purified fragmented genomic DNA, with an average fragment size of 170 ± 10 bp (in 7/8 sample). We found that there was a marked match in clone insert size, and that the genomic presentation from such samples was uniform, comparable to experiments performed using purified gDNA. Counting unique reads further confirmed that the depth of presentation in each library yielded small allele frequency estimates for tumor markers present in the cfDNA of affected patients. This study confirmed that the compositions and target search systems contemplated herein are effectively applied for quantitative genetic analysis of cfDNA.

方法
DNA精製
8セットの血漿試料をProteogenex,Inc.、Culver City、CAから購入した(表8)。QiagenからのCirculating Nucleic Acid Purificationキットを使用して循環DNAを試料から(別々に2回)抽出した。遠心分離を使用して試料をDNA miniカラムに通した。検体IDおよびDNAの収量を表8に示す。

Figure 2021182940
Method DNA purification Eight sets of plasma samples were prepared from Proteinex, Inc. , Culver City, purchased from CA (Table 8). Circulating DNA was extracted from the sample (twice separately) using the Circulating Nucleic Acid Purification Kit from Qiagen. The sample was passed through a DNA mini column using centrifugation. Table 8 shows the sample ID and the yield of DNA.
Figure 2021182940

ライブラリー構築
4mLの血漿からの精製DNAを100μlの溶出バッファーに採取した。結腸がん患者(CRC)から採取した4つの試料について、DNAを半分に分け、各患者からの50μlアリコート1つを超音波処理して200bpにした。未処置cfDNAの50μlアリコート1つおよび各患者(各患者からの全試料)からの50μl断片化cfDNA1つを、
・6μlの10X quick bluntバッファー(New England Biolabs(NEB))
・0.6μlの10mM dNTP
・2.4μlのquick blunt酵素ミックス
・1.2μlのPreCR酵素ミックス
を(試料ごとに)添加することによって末端修復した。
試料を20℃で30分間および70℃で10分間インキュベートした。
・60μl 末端修復cfDNA
・12μl アダプター二本鎖(10μM)
・10μl 10X リガーゼバッファー(NEB)
・15μl 50%PEG8000
・3μl HC T4 DNAリガーゼ
を併せることによってアダプター(表2)とのライゲーションを行った。

Figure 2021182940
Library construction 4 mL of purified DNA from plasma was collected in 100 μl of elution buffer. For four samples taken from a colon cancer patient (CRC), the DNA was split in half and one 50 μl aliquot from each patient was sonicated to 200 bp. One 50 μl aliquot of untreated cfDNA and one 50 μl fragmented cfDNA from each patient (all samples from each patient).
6 μl of 10X quick blunt buffer (New England Biolabs (NEB))
-0.6 μl of 10 mM dNTP
-2.4 μl quick brant enzyme mix-End repair by adding 1.2 μl PreCR enzyme mix (per sample).
Samples were incubated at 20 ° C for 30 minutes and at 70 ° C for 10 minutes.
60 μl end-repaired cfDNA
・ 12 μl adapter double chain (10 μM)
10 μl 10X ligase buffer (NEB)
15 μl 50% PEG 8000
-Ligation with the adapter (Table 2) was performed by combining 3 μl HC T4 DNA ligase.
Figure 2021182940

反応物を22℃で1時間および65℃で10分間インキュベートした。ライゲーション産物を、100μlのビーズの添加、洗浄および40μlのTEzeroでの溶出によって精製した。40μlのライゲーション産物すべてをプライマーACA2(配列番号283)でのPCRによって増幅させ、標的化捕捉のために同質量で併せた。 The reaction was incubated at 22 ° C. for 1 hour and 65 ° C. for 10 minutes. The ligation product was purified by addition of 100 μl beads, washing and elution with 40 μl TEzero. All 40 μl of ligation products were amplified by PCR with primer ACA2 (SEQ ID NO: 283) and combined at the same mass for targeted capture.

標的化配列捕捉およびシークエンシング
4つの非断片化および4つの断片化結腸血漿試料(図9C)を、TP53、ALKを特に標的にする本発明者らの高密度、40ヌクレオチドプローブセットとハイブリダイズした。上の実施例2で説明したように捕捉複合体を処理した。
Targeted sequence capture and sequencing Four unfragmented and four fragmented colonic plasma samples (FIG. 9C) were hybridized with our high-density, 40-nucleotide probe set specifically targeting TP53, ALK. .. The capture complex was treated as described in Example 2 above.

結果
ライブラリーの外観
50ngの各ライブラリーを負荷した2%アガロースゲルの着色写真を図9Aに示す。平均断片サイズは、260±20bpの狭い範囲であった。これらのデータは、cfDNAのクローニング可能画分が主にヌクレオソーム断片として存在することを示した。加えて、cfDNAライブラリーのサイズは、cfDNAライブラリーがアダプター配列の付加によってより高い質量にシフトしたことを除いて、腎臓透析患者のcfDNA(Atamaniukら、Clinical Chemistry 52巻(3号):523〜26頁(2006年))と同じ基本的表面外観を有した(図9B)。対照的に、cfDNAライブラリーは、広いスメアとして現れる超音波処理したgDNAライブラリーとは劇的に異なっていた。
Results Library Appearance A colored photograph of a 2% agarose gel loaded with 50 ng of each library is shown in FIG. 9A. The average fragment size was in the narrow range of 260 ± 20 bp. These data showed that the cloneable fraction of cfDNA was predominantly present as a nucleosome fragment. In addition, the size of the cfDNA library is cfDNA of renal dialysis patients (Atamaniuk et al., Clinical Chemistry Vol. 52 (3): 523-, except that the cfDNA library was shifted to a higher mass by the addition of the adapter sequence. It had the same basic surface appearance as on page 26 (2006) (Fig. 9B). In contrast, the cfDNA library was dramatically different from the sonicated gDNA library, which appeared as a broad smear.

cfDNAライブラリーの追加の4セットを、2つの卵巣がん患者血漿試料および健常ボランティアからの2つの血漿試料から構築した。50μlの全体積中、38μlのcfDNAアリコートを末端修復した。ライゲーションは、40μlの末端修復断片、16μlのアダプター(10μM)、8ulの10Xリガーゼバッファー、16μlの50%PEGおよび4μlのHC T4 DNAリガーゼを80μlの全体積で含んだ。ライゲーション反応を20℃で1時間および65℃で10分間インキュベートした。精製のために、20μlのTEzeroおよび150μlのビーズを添加した。精製されたライゲーション産物を40μlに再懸濁させ、そのすべてを、PCRによるその後の200μlライブラリー増幅に使用した。得られた増幅ライブラリーを図9Cに示す。 An additional four sets of the cfDNA library were constructed from two plasma samples from ovarian cancer patients and two plasma samples from healthy volunteers. 38 μl of cfDNA aliquot was terminally repaired in a total volume of 50 μl. The ligation contained 40 μl of terminal repair fragments, 16 μl of adapter (10 μM), 8 ul of 10X ligase buffer, 16 μl of 50% PEG and 4 μl of HC T4 DNA ligase in a total volume of 80 μl. The ligation reaction was incubated at 20 ° C. for 1 hour and at 65 ° C. for 10 minutes. For purification, 20 μl TEzero and 150 μl beads were added. The purified ligation product was resuspended in 40 μl, all of which was used for subsequent 200 μl library amplification by PCR. The obtained amplification library is shown in FIG. 9C.

シークエンシングデータ解析
8つのライブラリーの各々で観測された平均ユニークリード数は、約700ユニークリード〜>3000ユニークリードの範囲であり、これは、約0.15%〜約0.03%の感度の範囲を規定する。図10。低頻度変異リードは1回より多く観測される可能性が高く、これは、最低感度が上で算出したものより低いことを意味する。好ましい実施形態では、ユニークリードによって統計的に正当な観測頻度の下限が得られる。
Sequencing Data Analysis The average number of unique reads observed in each of the eight libraries ranges from about 700 unique reads to> 3000 unique reads, which is about 0.15% to about 0.03% sensitive. Specify the range of. FIG. 10. Infrequent mutant reads are more likely to be observed more than once, which means that the lowest sensitivity is lower than that calculated above. In a preferred embodiment, the unique read provides a statistically valid lower bound for observation frequency.

cfDNAクローニング効率
試料23407を基準として使用した。10ng/mLのcfDNAを血漿試料から回収し、20ngの単離されたcfDNAを2つのライブラリー構築の取り組みの各々に使用した。ユニークリード数は、本発明者らが非断片化DNA(図10の「23407」)から平均700のユニークリード(ゲノム当量)を回収したことを示した。各ゲノムが0.003ngのgDNAを含有することを考えると、このライブラリーにおける2.1ngのインプットDNA(10%クローニング効率)が回収された。
cfDNA cloning efficiency Sample 23407 was used as a reference. 10 ng / mL cfDNA was recovered from plasma samples and 20 ng of isolated cfDNA was used for each of the two library building efforts. The number of unique reads indicates that we recovered an average of 700 unique reads (genome equivalents) from unfragmented DNA (“23407” in FIG. 10). Given that each genome contains 0.003 ng of gDNA, 2.1 ng of input DNA (10% cloning efficiency) in this library was recovered.

この試料でのライブラリー構築前の断片化は、ライブラリー収量を2倍より大きく増加させた(図10の「23407 frag」)。これは、23407試料中に存在するDNAの多くが、クローニング可能であるために断片化を必要とする高分子量DNAであったことを示す。したがって、ライブラリークローニング効率は、10%よりはるかに高い可能性が高く、インプットcfDNAの20%の範囲である可能性が高かった。このクローニング効率は、高度に精製されたゲノムDNAと同等であり、cfDNAが、下流のクローニングの取り組みに有害であるいかなる形でも修飾されない可能性が高かったことを示す。 Fragmentation prior to library construction in this sample increased library yield by more than 2-fold (“23407 frag” in FIG. 10). This indicates that much of the DNA present in the 23407 sample was high molecular weight DNA that required fragmentation because it was cloneable. Therefore, library cloning efficiency was likely to be much higher than 10% and likely to be in the 20% range of input cfDNA. This cloning efficiency was comparable to highly purified genomic DNA, indicating that cfDNA was unlikely to be modified in any way that was detrimental to downstream cloning efforts.

ライブラリーカバレッジ
cfDNAライブラリーは、ランダムな標的領域カバレッジを有する1セットの個別バンドに似ていた。図11は、配列データのランダム抽出を示す。クローニング前に断片化しなかった(図10を参照)およびTP53プローブ「chr17:7579351:region_3:280nt:41:80:r」(配列番号201)によって捕捉された試料23407からのリードのランダムセットを、BLATを使用してアラインした。試料を調製した方法を考えると、これらは、一般にcfDNA断片の反映である可能性が高い。なぜなら、これらのリードの左側の部分(リード開始部位)が標的領域全体にわたってランダムに分布しているからである。このランダムな分布は、ゲノムDNAのランダム破壊を示し、cfDNAライブラリーのバンド様外観にもかかわらずシークエンシングアウトプットがランダムな標的領域カバレッジであったことを立証する。このランダムな分布は、本明細書において企図される技術を使用する有効な遺伝子解析に重要である。
Library coverage The cfDNA library resembled a set of individual bands with random target region coverage. FIG. 11 shows random sampling of sequence data. Random sets of reads from sample 23407 that were not fragmented prior to cloning (see FIG. 10) and were captured by the TP53 probe "chr17: 7579351: region_3: 280nt: 41: 80: r" (SEQ ID NO: 201). Aligned using BLAT. Given the method by which the samples were prepared, these are generally likely to be reflections of the cfDNA fragment. This is because the left part of these leads (lead start site) is randomly distributed over the entire target region. This random distribution indicates random disruption of genomic DNA, demonstrating that the sequencing output was random target region coverage despite the band-like appearance of the cfDNA library. This random distribution is important for effective genetic analysis using the techniques contemplated herein.

図12は、典型的なcfDNAライブラリーについてのTP53コード領域シークエンシングのより高い分解能の大要を提供する。標的シークエンシングのエレメント−すべての標的領域にわたるカバレッジおよびシークエンシングした各塩基での均一な深度−が一目瞭然である。塩基1つにつき4000を超えるユニークリードというこの深度で、および正統な候補塩基変化に少なくとも2回遭遇しなければならないという前提条件で、この特定のライブラリーについての変異検出感度は、2000配列中約1変異、すなわち0.05%であったと推定することが可能である。この感度レベルは、驚くべき、予想外の、極めて優れた技術成果を意味する。 FIG. 12 provides an overview of the higher resolution of TP53 coding region sequencing for a typical pfDNA library. The elements of target sequencing-coverage across all target areas and uniform depth at each sequenced base-are obvious. Mutation detection sensitivity for this particular library is approximately in 2000 sequences, at this depth of more than 4000 unique reads per base, and with the precondition that orthodox candidate base changes must be encountered at least twice. It is possible to estimate that it was one mutation, ie 0.05%. This sensitivity level represents amazing, unexpected, and exceptional technological achievements.

結論
細胞株から単離された、高度に精製されたgDNA(判断基準)と同等の効率で、血漿クローンからcfDNAを単離し、クローニングした。cfDNAライブラリーは、循環ヌクレオソームサイズのDNA断片+アダプターに似ており、末端は、効率的遺伝子解析を可能にする十分にランダムな特徴を有した。加えて、血漿cfDNAライブラリーに特有の高度に均一なサイズは、プローブ末端から120bp(=160−40)ほども遠い標的の信頼性のあるカバレッジを最大にするための捕捉戦略および基礎をなすプローブ配列の設計を可能にする。
Conclusion CfDNA was isolated and cloned from plasma clones with the same efficiency as highly purified gDNA (criteria) isolated from cell lines. The cfDNA library resembled a circulating nucleosome-sized DNA fragment + adapter, with sufficiently random features at the ends that allowed efficient gene analysis. In addition, the highly uniform size inherent in the plasma cfDNA library provides a capture strategy and underlying probe to maximize reliable coverage of targets as far as 120 bp (= 160-40) from the probe end. Allows array design.

(実施例4)
循環DNAライブラリーにおけるゲノム当量の測定
目的および背景
循環、無細胞DNAの解析における大きな課題の1つは、十分なアッセイ感度の達成である。十分な感度が達成されない場合には、cfDNAライブラリーの解析が交絡する。試料がシークエンシングされ、変異事象が検出されない場合、その結果は、変異が存在しないこと、または試料抽出深度が小さすぎるため有意な事象が見逃されたことを意味すると解釈されることがある。アッセイの感度は、統計用語で偽陰性率として定義される。循環、無細胞DNAのシークエンシングに関連して、有意な障害は、大過剰の参照配列に混ざっている低頻度配列の検出である。
(Example 4)
Measurement of Genome Equivalents in Circulating DNA Libraries Objective and Background One of the major challenges in the analysis of circulating and cell-free DNA is the achievement of sufficient assay sensitivity. If sufficient sensitivity is not achieved, analysis of the cfDNA library is confounded. If the sample is sequenced and no mutational events are detected, the result may be interpreted to mean that no mutations are present or that significant events were missed because the sample extraction depth was too small. Assay sensitivity is defined in statistical terms as a false negative rate. A significant impairment associated with circulating, cell-free DNA sequencing is the detection of infrequent sequences mixed in with a large excess of reference sequences.

アッセイ感度を判定する1つの方法は、変異配列を非変異参照配列へと徐々に希釈する1セットの試料における変異配列の出現率の測定である。変異配列がもはや検出されない希釈度によってアッセイ感度が規定される。この方法は、変異配列の正体と希釈度の両方が既知である場合に適している。残念なことに、臨床試料は、一般に、どちらのパラメータも提供しない。多くの場合、変異配列の正体は未知であり、希釈度は、試料によって異なる。この関連で、アッセイ感度は、試料ごとに確立される。 One method of determining assay sensitivity is to measure the incidence of mutant sequences in a set of samples that gradually dilute the mutant sequences into non-mutant reference sequences. Assay sensitivity is defined by the dilution at which the mutant sequence is no longer detected. This method is suitable when both the identity and dilution of the mutant sequence are known. Unfortunately, clinical samples generally do not provide either parameter. In many cases, the identity of the mutant sequence is unknown and the dilution will vary from sample to sample. In this regard, assay sensitivity is established on a sample-by-sample basis.

試料ごとに感度値を割り当てるために、シークエンシングライブラリー中に存在するゲノム当量の数を測定することによって各試料中に存在する異なる別個の配列の数を測定する。非限定的な例として、DNAシークエンシングライブラリーが、3ng(3000pg)のヒトゲノムDNAを含有することが分かっており、各ヒトゲノムが3pgの質量を有する場合には、そのライブラリーは、DNAの3000÷3=1000ゲノム当量を有する。統計的に有意であるために変異体DNA配列を2回検出しなければならない場合には、この特定のライブラリーの可能な最高検出感度は、2変異配列÷1000全配列=0.002=0.2%である。感度を確立するために、ゲノム当量の数を各試料ライブラリーについて測定しなければならない。 To assign sensitivity values to each sample, measure the number of different distinct sequences present in each sample by measuring the number of genomic equivalents present in the sequencing library. As a non-limiting example, a DNA sequencing library is known to contain 3 ng (3000 pg) of human genomic DNA, and if each human genome has a mass of 3 pg, the library is 3000 of DNA. ÷ 3 = 1000 genome equivalents. If the mutant DNA sequence must be detected twice for statistical significance, the highest possible detection sensitivity for this particular library is 2 mutant sequences ÷ 1000 full sequences = 0.002 = 0. .2%. To establish sensitivity, the number of genomic equivalents must be measured for each sample library.

概要
2つの方法を使用してゲノム当量を測定した。第1の方法は、定量的PCR(qPCR)に基づく。ゲノム断片へのアダプターのライゲーションと、1つが共通ゲノム配列(例えばAlu I反復配列)に特異的であり、1つがアダプターに特異的である、1対のPCRプライマーとを使用して、ゲノムライブラリーを構築した。これらのcfDNAライブラリーのライゲーションされたアダプター:断片配列の存在量を測定した。既知濃度の標準ライブラリーを使用して標準曲線を構築し、得られた標準曲線に測定値をフィッティングし、そのフィットからゲノム当量の値を導出した。
Summary Genome equivalents were measured using two methods. The first method is based on quantitative PCR (qPCR). A genomic library using a ligation of the adapter to the genomic fragment and a pair of PCR primers, one specific for a common genomic sequence (eg, Alu I repeats) and one specific for the adapter. Was built. The abundance of ligated adapter: fragment sequences in these cfDNA libraries was measured. A standard curve was constructed using a standard library of known concentrations, measurements were fitted to the resulting standard curve, and genomic equivalent values were derived from the fit.

ゲノム当量を測定するための第2の方法は、シークエンシングを行った後にバイオインフォマティクス計数を使用した。ライブラリー内の各ユニーク配列を、そのランダム配列標識およびゲノム配列の出発分子によって同定した。さらに、各ユニーク配列は、独立したゲノムに由来しなければならない。したがって、配列データ中に存在するユニーク配列の合計によって、試料中に存在するゲノム当量の数の正確な定量的測定が確立された。 A second method for measuring genomic equivalents used bioinformatics counting after sequencing. Each unique sequence in the library was identified by its random sequence label and the starting molecule of the genomic sequence. In addition, each unique sequence must be derived from an independent genome. Therefore, the sum of the unique sequences present in the sequence data established an accurate quantitative measure of the number of genomic equivalents present in the sample.

方法および結果
qPCRアッセイ開発
qPCRベースのゲノム当量アッセイの第1のバージョンは、ACA2プライマー(表10)を使用したが、このアッセイは、cfDNAライブラリー中に存在するゲノム当量の数を慢性的に過小報告する(図13)。

Figure 2021182940
Methods and Results qPCR Assay Development The first version of the qPCR-based genomic equivalent assay used ACA2 primers (Table 10), which chronically underestimated the number of genomic equivalents present in the cfDNA library. Report (Fig. 13).
Figure 2021182940

アッセイの改良バージョンは、ヒトゲノム全体にわたって非常に高頻度で見いだされる内在性反復配列(例えば、Alu反復配列)に基づいた。Alu特異的プライマーをアダプター特異的プライマーと対にすることによって、アダプターがゲノム断片に連結される頻度を確実に測定した。既知のゲノム当量のライブラリーを使用して標準曲線を作成し、クローニングしたライブラリー中のゲノム当量の数をその曲線へのフィッティングによって測定した。 An improved version of the assay was based on endogenous repetitive sequences (eg, Alu repetitive sequences) found very frequently throughout the human genome. By pairing the Alu-specific primer with the adapter-specific primer, the frequency with which the adapter was ligated to the genomic fragment was reliably measured. A standard curve was created using a library of known genomic equivalents, and the number of genomic equivalents in the cloned library was measured by fitting to that curve.

Alu+アダプターベースのqPCRアッセイを開発するために使用したPCRプライマーを表10に示す。Alu増幅のためのPCRプライマーは、プライマー3(Alu_F1およびAlu_R1、それぞれ配列番号285および286)を使用してコンセンサスヒトAlu配列(BatzerおよびDeininger、Nat Rev Genet.、3巻(5号)370〜
9頁(2002年))から設計した。残りの2つのAluプライマー(Alu_F2およびAlu_R2、それぞれ配列番号287および288)は、文献(Marulloら、Genome
Biology 11巻:R9(2010年))に報告されている。
Table 10 shows the PCR primers used to develop the Alu + adapter-based qPCR assay. PCR primers for Alu amplification are consensus human Alu sequences (Batzer and Deininger, Nat Rev Genet., Volume 3 (No. 5) 370-) using Primers 3 (Alu_F1 and Alu_R1, SEQ ID NOs: 285 and 286, respectively).
Designed from page 9 (2002). The remaining two Alu primers (Alu_F2 and Alu_R2, SEQ ID NOs: 287 and 288, respectively) are described in the literature (Marullo et al., Genome).
Biology Vol. 11: R9 (2010)).

アッセイ設計の概略図を図14に示す。単一PCRプライマーを使用してゲノムDNAライブラリーを増幅させることができる(図14A)ため、アダプター配列を認識するがゲノムクローンを増幅できないプライマーを使用した。58ヌクレオチドACA2−FLFPプライマー(これ以降AFと略記する、配列番号284)は、その長さが強いステム−ループPCR抑制を誘導する(図14B)ので、これらの基準を満たす。加えて、機能性Aluプライマー対を使用した(図14C)。さらに、ゲノムDNAを増幅させない、1つのAluプライマーとロングACA2プライマーとからなるプライマー対を使用した(図14D)。これらの同じプライマーは、ゲノムライブラリークローンも増幅させた(図14E)。 A schematic diagram of the assay design is shown in FIG. Since a single PCR primer can be used to amplify the genomic DNA library (FIG. 14A), a primer that recognizes the adapter sequence but cannot amplify the genomic clone was used. The 58 nucleotide ACA2-FLFP primer (hereinafter abbreviated as AF, SEQ ID NO: 284) meets these criteria as its length induces strong stem-loop PCR inhibition (FIG. 14B). In addition, a functional Alu primer pair was used (FIG. 14C). In addition, a primer pair consisting of one Alu primer and a long ACA2 primer that does not amplify genomic DNA was used (FIG. 14D). These same primers also amplified the genomic library clone (Fig. 14E).

機能性Aluベースのアッセイの必要エレメントのすべてを検証した。図15。具体的には、単独でのロングプライマーは不活性であり、Aluプライマー対の両方のセットがヒトゲノムDNAを認識し、1つのAluプライマーとロングACA2プライマーの任意の組合せがゲノムライブラリークローンを増幅させた(図15A)。最後に、ゲノムDNAとゲノムライブラリークローンとを区別するAluプライマー+ロングACA2プライマー対の能力を図15Bに示す。Alu_R1プライマーとAFプライマーの組合せを、新たに構築したライブラリー中のゲノム当量の測定に使用した。 All of the required elements of the functional Alu-based assay have been validated. FIG. 15. Specifically, long primers alone are inactive, both sets of Alu primer pairs recognize human genomic DNA, and any combination of one Alu primer and long ACA2 primer amplifies the genomic library clone. (Fig. 15A). Finally, FIG. 15B shows the ability of the Alu primer + long ACA2 primer pair to distinguish between genomic DNA and genomic library clones. The combination of Alu_R1 and AF primers was used to measure genomic equivalents in the newly constructed library.

ACA2ベースのqPCRアッセイとAluベースのqPCRアッセイとの直接比較を図16に示す。ゲノム当量の8倍差が見いだされた。加えて、Aluベースのアッセイは、ライブラリー間のより一貫した性能およびqPCR導出当量とシークエンシングランでバイオインフォマティクスによって計数されたタグ当量とのより良好なアラインメントをもたらした(表11)。

Figure 2021182940
A direct comparison between the ACA2-based qPCR assay and the Alu-based qPCR assay is shown in FIG. An eight-fold difference in genomic equivalent was found. In addition, the Alu-based assay resulted in more consistent performance between libraries and a better alignment of qPCR-derived equivalents with tag equivalents counted by bioinformatics in the sequencing run (Table 11).
Figure 2021182940

ゲノム当量の配列ベースの計数のための高感度ライブラリーアダプター
上で論じたように、変異配列が、他の大過剰の「正常」(生殖系列を意味する)DNA配列中の低頻度成分でありうるというのが、cfDNAを使用する疾患監視の現実である。したがって、高感度で定量可能なシークエンシングアッセイが必要とされている。シークエンシングライブラリー中に存在するユニーク配列の数を計数することによってアッセイ感度を生じさせることができた。しかし、そのような計数は、感度の偽の過小推定につながることになる。なぜなら、cfDNA断片はかなり短く(約165bp)、実際には独立したクローニング事象に由来した同一のリードをもたらすことがあるからである。この問題の1つの解決策は、例えば、ライブラリーを構築するために使用するアダプターに1セットのDNAタグを含めることによって、ライブラリー構築中に独立したシークエンシングクローン各々にマークを付けることである。
Sensitive Library Adapters for Sequence-Based Counting of Genome Equivalents As discussed above, mutant sequences are a low frequency component in other large excesses of "normal" (germline) DNA sequences. It is the reality of disease monitoring using cfDNA. Therefore, there is a need for highly sensitive and quantifiable sequencing assays. Assay sensitivity could be generated by counting the number of unique sequences present in the sequencing library. However, such counting would lead to false underestimation of sensitivity. This is because the cfDNA fragment is fairly short (about 165 bp) and can actually result in the same read from an independent cloning event. One solution to this problem is to mark each independent sequencing clone during library construction, for example, by including a set of DNA tags in the adapter used to build the library. ..

そのようなライブラリー構築アダプターセットを、具体的には、cfDNAライブラリー中に存在するゲノム当量の数、およびその延長で、変異配列をモニターするために使用されるシークエンシングアッセイの感度を測定するように設計した。 Such a library construction adapter set, specifically the number of genomic equivalents present in the cfDNA library, and its extension, measures the sensitivity of the sequencing assay used to monitor the mutant sequence. Designed to be.

cfDNAライブラリー中の多数のゲノム当量に対応するように構成した高感度ライブラリーアダプターの構造を図17に示す。末端修復cfDNA断片に結合される鎖である45ヌクレオチドライゲーション鎖内に工学的に作製された相当量の分子がある。アダプターは、少なくとも5つのエレメントを含む。 FIG. 17 shows the structure of a sensitive library adapter configured to accommodate a large number of genomic equivalents in the cfDNA library. Within the 45 nucleotide ligation strand, which is the strand bound to the terminally repaired cfDNA fragment, there is a significant amount of engineered molecules. The adapter contains at least 5 elements.

エレメント1は、単一プライマーライブラリー増幅プライマーACA2のためのPCRプライマー結合部位である(表12)。

Figure 2021182940
Element 1 is the PCR primer binding site for the single primer library amplification primer ACA2 (Table 12).
Figure 2021182940

エレメント2は、5ヌクレオチドリードコードである。このコードとゲノムDNA配列の組合せは、各リードを一意的に同定するために使用したDNAタグを構成する。5ヌクレオチドコードは、このセットの他のすべてのコードと2塩基変化異なるように選択した、可能性のある256のユニーク配列からなる。この特徴によって、ユニークな別個のリードと、コード領域内のシークエンシングエラーのためユニークであるように見えるリードとを区別することが可能になった。G残基が過剰提示される7つのコードであって、アダプター機能に干渉することが実験的に証明されたコードを除去することによって、249のランダムコードが残った。表13。

Figure 2021182940
Figure 2021182940
Figure 2021182940
Element 2 is a 5 nucleotide read code. The combination of this code and the genomic DNA sequence constitutes the DNA tag used to uniquely identify each read. The 5-nucleotide code consists of 256 possible unique sequences selected to differ by 2 bases from all other codes in this set. This feature makes it possible to distinguish between unique and distinct reads and reads that appear unique due to sequencing errors in the code area. By removing the seven codes that were over-presented with G residues and that were experimentally proven to interfere with adapter function, 249 random codes remained. Table 13.
Figure 2021182940
Figure 2021182940
Figure 2021182940

エレメント3は、少なくとも2塩基変化異なる3ヌクレオチド試料コードである。このエレメントは、異なる試料を同定するために使用し、シークエンシングラン中の試料多重化を可能にした。表14。

Figure 2021182940
Element 3 is a 3-nucleotide sample code that differs by at least 2 bases. This element was used to identify different samples and allowed sample multiplexing during sequencing runs. Table 14.
Figure 2021182940

エレメント4は、ライブラリー構築および下流のシークエンシングに関する3つの重要な特性を有する12ヌクレオチドアンカー配列である。表15。これらの特性は次の通りである:A)12塩基伸長の各々が、伸長内の各部位の可能性のある4つのDNA塩基の各々を集合的に表す4つの12塩基伸長のファミリーの一部である。この特徴、バランスのとれた塩基提示、は、シークエンシングリード中の適正な塩基コーリングを校正するためにIlluminaシークエンシング装置によって必要とされる。B)各伸長が、可能性のある4塩基のうちの2つだけからなり、これらが、6つのA+6つのCまたは6つのG+6つのTのどちらか一方であるように特異的に選択される。2つだけの塩基から形成されるこの伸長は、適正なアダプター機能を不可能にすることになる二次構造形成に伸長配列が関与する可能性を大幅に低下させる。C)各伸長が同数のA+CまたはG+Tからなるので、各伸長は、4つ1セットの他のすべての伸長と大体同じ融解温度および二本鎖安定性を共有する。 Element 4 is a 12 nucleotide anchor sequence with three important properties for library construction and downstream sequencing. Table 15. These properties are as follows: A) Part of a family of four 12-base extensions, where each of the 12-base extensions collectively represents each of the four possible DNA bases at each site within the extension. Is. This feature, balanced base presentation, is required by Illumina sequencing equipment to calibrate proper base calling in sequencing reads. B) Each extension consists of only two of the four possible bases, which are specifically selected to be either six A + six C or six G + six T. This extension, formed from only two bases, greatly reduces the likelihood that the extension sequence will be involved in secondary structure formation, which would make proper adapter function impossible. C) Since each extension consists of the same number of A + C or G + T, each extension shares approximately the same melting temperature and double-stranded stability as all other extensions in a set of four.

Figure 2021182940
Figure 2021182940

エレメント5は、エレメント4の3’末端で見いだされる2塩基配列である。特定の2塩基伸長を、これら2塩基配列がライゲーションのための効率的基質であることを示す実験データに基づいて選択した。表15。
4.
Element 5 is a two-base sequence found at the 3'end of element 4. Specific 2-base extensions were selected based on experimental data showing that these 2-base sequences are efficient substrates for ligation. Table 15.
4.

アダプターモジュールをパートナーオリゴヌクレオチドにハイブリダイズさせる。表16。エレメント4内の配列とパートナーオリゴヌクレオチドとのハイブリダイゼーションを行う。二本鎖アダプターを末端修復cfDNAにライゲーションした。

Figure 2021182940
Hybridize the adapter module to the partner oligonucleotide. Table 16. Hybridization of the sequence in element 4 with the partner oligonucleotide is performed. The double-stranded adapter was ligated to end-repaired cfDNA.
Figure 2021182940

独立して合成してプールしたライゲーション鎖256本(これらの各々が共通の試料コードを共有し、したがって、単一の試料アダプターセットを構成する)のセットを、ライゲーションに好適な二本鎖に変換するために、45ヌクレオチドライゲーション鎖を適切な相補12ヌクレオチドパートナー鎖と併せ、95℃に加熱し、5分間、65℃に冷却し、次いで、室温に冷却した。この二本鎖は、図17Bに示すように平滑末端ライゲーション基質を形成した。ライゲーションおよびDNA精製後、PCR増幅前に行うDNAポリメラーゼ媒介ステップによってパートナー鎖を置換し、ライゲーション鎖をコピーして、単一プライマーPCRによる指数関数的増幅に好適である二本鎖アダプターを形成した。 Convert a set of 256 independently synthesized and pooled ligation strands, each of which shares a common sample code and thus constitutes a single sample adapter set, into a double strand suitable for ligation. The 45 nucleotide ligation strand was combined with the appropriate complementary 12 nucleotide partner strand, heated to 95 ° C., cooled to 65 ° C. for 5 minutes, and then cooled to room temperature. The double strand formed a blunt-ended ligation substrate as shown in FIG. 17B. After ligation and DNA purification, the partner strand was replaced by a DNA polymerase-mediated step performed prior to PCR amplification and the ligation strand was copied to form a double-stranded adapter suitable for exponential amplification by single primer PCR.

次いで、標的化シークエンシングデータから導出したゲノム当量の定量的解析を行った。各ユニークリードをユニークライゲーション事象と考え、ユニークリードの合計を、解析されるゲノム当量の数と等しいと考えた。 Next, a quantitative analysis of genomic equivalents derived from targeted sequencing data was performed. Each unique read was considered a unique ligation event and the sum of the unique reads was considered equal to the number of genomic equivalents analyzed.

おおまかな、「たやすく計算できる」、「おおざっぱな」算定を行って、解析することができるゲノム当量の数を決定した。各cfDNAクローンは、おおよそ150塩基対であり、そのうちの50塩基対が捕捉プローブとの結合に必要であった。これによって、任意の捕捉されたcfDNAクローン中に可能性のあるおおよそ100の配列開始部位が残った。その可能性のある100の開始部位の各々に249のランダムコードを結合させることで、可能性のある約249,000のユニーククローンの全レパートリーを生成した。ユニーククローン数が可能性のある配列の組合せの総数に近づくと、確率により、同じコードおよび開始部位の組合せが独立事象によって生じることになり、これらの独立事象が単一ファミリー内で不適切にグループ化されることになることが決定される。最終結果は、解析されるゲノム当量の過小推定となり、低頻度の変異リードは、同じ識別子を有する野生型リードと重複するので、シークエンシングエラーとして処分されることがある。これを回避するために、qPCRアッセイを使用してゲノムインプットを可能性のあるユニーククローンの数の10分の1またはそれ未満に制約する取り組みを行った。例えば、単一アダプターは、可能性のある24,900のクローンを有し、したがって、2500またはそれ未満のゲノム当量からなるライブラリーの正確な解析をもたらす信頼性のある能力を有する。 Rough, "easy-to-calculate" and "rough" calculations were performed to determine the number of genomic equivalents that could be analyzed. Each cfDNA clone had approximately 150 base pairs, of which 50 base pairs were required for binding to the capture probe. This left approximately 100 possible sequence initiation sites in any captured cfDNA clone. By binding 249 random codes to each of the 100 potential initiation sites, a complete repertoire of approximately 249,000 potential unique clones was generated. When the number of unique clones approaches the total number of possible sequence combinations, the probability is that the same code and origin combination will result from independent events, and these independent events are improperly grouped within a single family. It is decided that it will be transformed. The end result is an underestimation of the genomic equivalents analyzed, and infrequent mutant reads overlap with wild-type reads with the same identifier and may be disposed of as a sequencing error. To avoid this, efforts were made to limit genomic input to one-tenth or less of the number of possible unique clones using the qPCR assay. For example, a single adapter has 24,900 potential clones and thus has the reliable ability to provide accurate analysis of a library consisting of 2500 or less genomic equivalents.

概要を述べる手順は、一例として提供するものであり、本明細書において企図される方法をこの実施例によって限定することを意図しない。場合によっては、解析されるゲノム当量の数は、前の段落で説明した限度2500を十分に超えることもある。ゲノム当量の深度を拡大するために、この問題の2つの解決策を容易に得ることができる。第1の解決策は、試料1つにつき1つより多くのアダプターセットを使用することである。アダプターを組み合わせることにより、可能性のあるクローンの総数を拡大することが可能であり、したがって、ゲノムインプットの満足のいく限度を拡大することが可能である。非限定的な例として、1つの試料に使用する4つのアダプターセットの組合せは、解析を可能性のある配列24,900x4=99,600に、および合理的に解析されるゲノム当量約10,000に拡大することになる。第2の解決策は、図17Aのエレメント2のコードを6、7またはそれ超の塩基に拡大することである。他のすべてのコードと少なくとも2塩基異なる、可能性のあるコードの数は、4(n−1)となり、式中、nは、エレメント2内の塩基の数である。したがって、ここで提示する非限定的な例では、n=5および4(5−1)=256。したがって、追加の塩基を含めることで利用可能なレパートリーは追加の塩基ごとに4倍拡大される。 The schematic procedure is provided by way of example and is not intended to limit the methods contemplated herein by this embodiment. In some cases, the number of genomic equivalents analyzed may well exceed the 2500 limit described in the previous paragraph. Two solutions to this problem can be readily obtained to increase the depth of genomic equivalents. The first solution is to use more than one adapter set per sample. By combining adapters, it is possible to increase the total number of possible clones, and thus to a satisfactory limit of genomic input. As a non-limiting example, a combination of four adapter sets used for one sample has a possible sequence of 24,900x4 = 99,600 for analysis, and a rationally analyzed genomic equivalent of about 10,000. Will be expanded to. The second solution is to extend the code for element 2 in FIG. 17A to 6, 7 or more bases. The number of possible codes that differ from all other codes by at least 2 bases is 4 (n-1) , where n is the number of bases in element 2. Therefore, in the non-limiting examples presented here, n = 5 and 4 (5-1) = 256. Therefore, by including additional bases, the available repertoire is expanded by a factor of 4 for each additional base.

結論
この実施例からの結果は、ゲノム当量の決定のための2つの独立した方法が試料を処理する作業の流れに役立つことを示した。第1の方法、qPCRは、cfDNA解析のライブラリー構築段階中に実施し、妥当な数のゲノム当量をライブラリー増幅、標的化配列捕捉およびDNAシークエンシングによって確実に動かす品質管理ステップとして使用した。他の方法は、情報科学の考慮事項に該当するゲノム当量の実際の数のより直接的な尺度として、ユニークリードの明確な計数を使用する。
CONCLUSIONS The results from this example showed that two independent methods for determining genomic equivalents helped the workflow of processing samples. The first method, qPCR, was performed during the library building phase of cfDNA analysis and used as a quality control step to ensure that a reasonable number of genomic equivalents were driven by library amplification, targeted sequence capture and DNA sequencing. Other methods use a clear count of unique reads as a more direct measure of the actual number of genomic equivalents that fall into the informatics considerations.

(実施例5)
定量的遺伝子解析
目的
この実施例の目的は、定量的遺伝子解析を、正常なDNAが混合されているがんゲノムにおよびがん患者の血漿から単離した特徴付けされていないcfDNAに適用することであった。
(Example 5)
Quantitative Gene Analysis Objectives The objective of this example is to apply quantitative genetic analysis to cancer genomes mixed with normal DNA and to uncharacterized cfDNA isolated from plasma of cancer patients. Met.

背景
3タイプのゲノム事象がヒトがんではよく見られる。これらは、罹患遺伝子およびその発現タンパク質産物の機能を変化させる体細胞変異;新規生物学的特性を有するキメラ遺伝子融合体およびしたがって発現融合タンパク質を生じさせるゲノム再編成;ならびに遺伝子減少および遺伝子産物の過小発現、または逆に遺伝子の増幅および対応する遺伝子産物の過剰提示につながる遺伝子コピー数の変化である。がん患者の循環DNAの場合、これらの異常な座位は、その多くが患者のケアを導出する上で非常に重要な意義を有し、患者の正常な生殖系列DNAと混合されている(混ざっている)。
Background Three types of genomic events are common in human cancer. These are somatic mutations that alter the function of the affected gene and its expressed protein products; genomic rearrangements that give rise to chimeric gene fusions with novel biological properties and thus expressed fusion proteins; and gene reduction and underproduction of gene products. Changes in gene copy count leading to expression, or conversely, gene amplification and overpresentation of the corresponding gene product. In the case of circulating DNA in cancer patients, many of these abnormal loci are of great significance in deriving patient care and are mixed (mixed) with the patient's normal germline DNA. ing).

概要
前の実施例では、がん監視を目的として、循環、無細胞DNA(cfDNA)の解析のために構成した技術を説明した。しかし、この技術は、これらに限定されないが遺伝疾患、胎児試験、メンデル型遺伝病、病原体スクリーニングおよび臓器移植のモニタリングを含む、循環DNAが可能性のある分析物であるあらゆる解析、診断およびモニタリングパラダイムに広く適用可能である。この実施例では、前の実施例で強調した技術的特徴を混合がん試料の解析に適用する。この検証の第1段階では、がん由来の細胞株を正常ヒトDNAと規定の希釈度で混合し、定量的遺伝子解析を行った。この研究の第2段階では、特徴付けされていないcfDNAをがん患者の血漿から単離し、その後、定量的遺伝子解析を使用して調査した。
Overview In the previous example, we described techniques configured for the analysis of circulating, cell-free DNA (cfDNA) for the purpose of cancer monitoring. However, this technique is an all-analysis, diagnostic and monitoring paradigm where circulating DNA is a potential analytical material, including but not limited to genetic disorders, fetal testing, Mendel-type genetic disorders, pathogen screening and organ transplant monitoring. It is widely applicable to. In this example, the technical features highlighted in the previous example are applied to the analysis of mixed cancer samples. In the first stage of this verification, cancer-derived cell lines were mixed with normal human DNA at a specified dilution and quantitative genetic analysis was performed. In the second phase of this study, uncharacterized cfDNA was isolated from the plasma of cancer patients and then investigated using quantitative genetic analysis.

方法
細胞株ゲノムDNAと正常ヒトDNAの混合
以下のDNA試料を使用した:
・NA06994 − 正常ヒトゲノムDNA(Coriellレポジトリ)、
・NCI−H2228 − 非法細胞肺がん細胞株(ATCC)、TP53の変異(Q331)およびEML4−ALK遺伝子融合(切断点不明)を有する、ならびに
・NCI−H69 − 小細胞肺がん細胞株(ATCC)、MYCN遺伝子の増幅(約100コピー)を有する。
Method Mixing cell line genomic DNA with normal human DNA The following DNA samples were used:
NA06994-Normal Human Genome DNA (Coriell Repository),
NCI-H2228-illegal cell lung cancer cell line (ATCC), TP53 mutation (Q331 * ) and EML4-ALK gene fusion (cutting point unknown), and NCI-H69-small cell lung cancer cell line (ATCC), Has amplification of the MYCN gene (about 100 copies).

ライブラリー調製:細胞株(上記3つすべて)から単離したゲノムDNAは、cfDNAの小さいサイズとは異なる高分子量物質である。これらの検証実験では、cfDNAを模倣するために、Covaris Acoustic Sonicatorを使用して「150bp」設定でゲノムDNAをまず断片化した。この超音波処理は、一般に、広いスメアを生じさせ、「両側」ビーズ選択を使用してそのDNAをさらに処理した。DNA精製ビーズの希薄溶液を試料に添加し、ビーズに付着する、より高分子質量の断片を廃棄した(精製DNAのサイズは、添加したビーズの量に比例する)。ビーズの追加のアリコートを残存上清に添加し、この第2ラウンドでは、ビーズに付着しているDNAに添加し、(より高い全濃度の結合バッファー中で)精製する。この「両側」精製は、cfDNAの合理的代用物である狭いサイズ分布を生じさせる(図18)。 Library preparation: Genomic DNA isolated from cell lines (all three above) is a high molecular weight substance that differs from the small size of cfDNA. In these validation experiments, genomic DNA was first fragmented at a "150 bp" setting using the Coveris Acoustic Sonicator to mimic cfDNA. This sonication generally produced wide smears and further processed the DNA using "bilateral" bead selection. A dilute solution of purified DNA beads was added to the sample and the higher molecular weight fragments adhering to the beads were discarded (the size of the purified DNA is proportional to the amount of beads added). An additional aliquot of the beads is added to the residual supernatant and in this second round it is added to the DNA attached to the beads and purified (in a higher total concentration of binding buffer). This "bilateral" purification results in a narrow size distribution that is a reasonable substitute for cfDNA (FIG. 18).

断片化されたゲノムDNAを末端修復し、定量し、表17に示した様々な比で混合し、下の結果の節で説明する。

Figure 2021182940
Fragmented genomic DNA is terminally repaired, quantified, mixed in various ratios shown in Table 17, and described in the Results section below.
Figure 2021182940

cfDNAライブラリーは、限られたDNAインプットを有しうる。患者血漿1mL当りの得られるcfDNAの量は広範に変動しうるが、下限(例えば、実施例3)は一般に約10ng/mLであり、これは3300ヒトゲノムと等価である。限られたcfDNA量に備えるために、混合実験は、患者から日常的に採取されるcfDNAの下限を反映するようにモデル化した。この制約を、最も極端な混合を除いてすべてに適用した。これらの後者の混合では、ライブラリーを、4mL(NA06994:H2228 1000:1)または8mL(NA06994:H69 500:1)の低収量患者cfDNAからのインプットを模倣するように作製した。混合した試料を、次いで、実施例4に記載のアダプターセットにライゲーションした。qPCRを使用する各精製ライブラリー中のゲノム当量の測定値(実施例4)も表17に示す。ライブラリーを増幅させ、定量し、各ライブラリーの等価質量(各々の500ng)をプールした。プールした試料を、実施例2の表6に収載した概念実証、高密度40mer捕捉プローブとハイブリダイズした。得られた複合体を、前の実施例に記載したように、ストレプトアビジン被覆ビーズ上に捕捉し、洗浄し、処理し、増幅させ、精製し、サイズ選択した。得られたライブラリーを、Illumina MiSeq装置でIllumina 150bp−V3 Miseqシークエンシングキットを使用して解析した。 The cfDNA library can have limited DNA input. The amount of cfDNA obtained per 1 mL of patient plasma can vary widely, but the lower limit (eg, Example 3) is generally about 10 ng / mL, which is equivalent to the 3300 human genome. To prepare for the limited amount of cfDNA, the mixed experiment was modeled to reflect the lower limit of cfDNA routinely harvested from the patient. This constraint was applied to everything except the most extreme mixes. In a mixture of these latter, the library was made to mimic the input from 4 mL (NA06994: H2228 1000: 1) or 8 mL (NA06994: H69 500: 1) low yield patient cfDNA. The mixed sample was then ligated to the adapter set described in Example 4. Genomic equivalent measurements (Example 4) in each purified library using qPCR are also shown in Table 17. Libraries were amplified and quantified, and the equivalent mass of each library (500 ng each) was pooled. The pooled sample was hybridized with the proof-of-concept, high density 40mer capture probe listed in Table 6 of Example 2. The resulting complex was captured on streptavidin-coated beads, washed, treated, amplified, purified and sized as described in the previous example. The resulting library was analyzed on an Illumina MiSeq device using the Illumina 150bp-V3 Miseq sequencing kit.

バイオインフォマティクス解析のために、低頻度体細胞バリアントコーラーを使用して変異を検出し、スプリットリードアライナを使用して融合遺伝子を検出し、タグを定量して統計的にフィッティングする自社解析を使用してコピー数変動(CNV)をコールした。 For bioinformatics analysis, use in-house analysis to detect mutations using a low-frequency somatic variant caller, detect fusion genes using a split read aligner, and quantify and statistically fit tags. Called copy number variation (CNV).

TP53遺伝子の混合点変異の検出を図19に示す。TP53がNCI−H2228細胞株ではヘミ接合性であることは公知であるので、「期待」頻度は混合比から外れる。自動ソフトウェアは、50:1混合の変異体対立遺伝子をコールすることができた。1000:1での変異事象をコールするにはマニュアルキュレーションが必要であった。特異性に関しては、実施例1に記載のタグフィルタリングを解析に適用し、このタグフィルターを適用後はTP53において他の変異コールは検出されなかった。 The detection of a mixed point mutation in the TP53 gene is shown in FIG. Since it is known that TP53 is hemizygous in the NCI-H2228 cell line, the "expected" frequency falls outside the mixing ratio. The automated software was able to call a 50: 1 mixed mutant allele. Manual curation was required to call the 1000: 1 mutation event. Regarding specificity, the tag filtering described in Example 1 was applied to the analysis, and no other mutant calls were detected in TP53 after applying this tag filter.

細胞株NCI−H2228がEML4とALKとの融合遺伝子を有することは公知であり、この細胞株は、蛍光インサイツハイブリダイゼーションにおいても、RT−PCRを使用する融合遺伝子転写物の検出においても陽性対照として役立つ。遺伝子融合ジャンクションの正確な位置についての報告は発表されていない。ALKの第19イントロン領域の高密度プローブカバレッジを使用して、配列解析は、2つの遺伝子が融合したときに形成されるジャンクションの正確な位置および配列を明らかにした(図20)。NCI−H2228細胞株における正常リードのジャンクションリードに対する頻度(それぞれ、378対249)は、融合遺伝子がALKの正常コピーとヘテロ接合体であることを示唆する。 It is known that the cell line NCI-H2228 has a fusion gene of EML4 and ALK, and this cell line is used as a positive control both in fluorescence in situ hybridization and in the detection of fusion gene transcripts using RT-PCR. Useful. No report has been published on the exact location of the gene fusion junction. Using high-density probe coverage of the 19th intron region of ALK, sequence analysis revealed the exact location and sequence of the junction formed when the two genes fused (FIG. 20). The frequency of normal reads to junction reads in the NCI-H2228 cell line (378 vs. 249, respectively) suggests that the fusion gene is heterozygous with a normal copy of ALK.

混合の関数としてのジャンクションリードの検出を図21に示す。点変異検出と同様に、変異体対立遺伝子が二倍体ゲノム1つにつき1コピーで見いだされることを反映するように期待値を調整した。1000:1の混合試料では融合リードは検出されなかった。 The detection of junction reads as a function of mixing is shown in FIG. As with point mutation detection, expectations were adjusted to reflect that mutant alleles are found in one copy per diploid genome. No fusion leads were detected in the 1000: 1 mixed sample.

図22は、MYCN遺伝子についてのCNV決定の結果を混合の関数として示す。NCI−H69細胞株は、高度に増幅されたMYCN遺伝子を有する。MYCNは、通常、単一コピー遺伝子として二倍体ゲノム1つにつき2つ見いだされるため、徐々に希釈した混合物について期待された結果は、タグ算出CNVが漸近的に2コピーに近づくべきであるというものである(漸近線を図中で強調する)。ここに示す検証実験は、本発明で説明されるアッセイシステムが高度に増幅された遺伝子に対する感度が頑強であることを示した。 FIG. 22 shows the results of CNV determination for the MYCN gene as a function of mixing. The NCI-H69 cell line has a highly amplified MYCN gene. Since MYCN is usually found twice per diploid genome as a single copy gene, the expected result for a gradually diluted mixture is that the tag calculation CNV should asymptotically approach 2 copies. (Emphasize the asymptote in the figure). The validation experiments presented herein have shown that the assay system described in the present invention is robust to highly amplified genes.

がん患者からのcfDNAにおけるバリアントの発見
本明細書において企図される技術の最も厳密な検証は、変異スペクトラムが不明であるcfDNA試料への該技術の適用である。解析は、2名の卵巣がん患者からのマッチしたcfDNA、腫瘍および正常隣接組織(NAT)試料をシークエンシングすることによって行った。加えて、結腸直腸がん(CRC)患者からの2つのcfDNA試料および健常ボランティアからの2つのcfDNA試料を解析した。どの場合も、変異、融合および異常CNVは、健常ボランティア試料では検出されなかった。
Finding Variants in cfDNA from Cancer Patients The most rigorous validation of the technique contemplated herein is the application of the technique to cfDNA samples whose mutation spectrum is unknown. The analysis was performed by sequencing matched cfDNA, tumor and normal adjacent tissue (NAT) samples from two ovarian cancer patients. In addition, two cfDNA samples from colorectal cancer (CRC) patients and two cfDNA samples from healthy volunteers were analyzed. In all cases, mutations, fusions and abnormal CNVs were not detected in healthy volunteer samples.

最初に、4名のがん患者からのcfDNAのライブラリーを、実施例2の表6に記載した標的化プローブを使用してスクリーニングした。これらのプローブは、主として、TP53遺伝子における点変異、ALKとの遺伝子融合、およびMYCNの増幅を検出するように構成した。この初期シークエンシングスクリーンの結果を図23に示す。同じ塩基位置で発生する点変異が1名の卵巣患者のcfDNA、腫瘍およびNATにおいて見いだされた。卵巣がん患者のマッチした試料の他のセットではTP53変異は見いだされなかった。マッチする組織を入手できない2つのCRC cfDNAライブラリーでも点変異が検出された。これらの点変異のすべてが腫瘍において以前に同定されており、すべては、腫瘍発生の原因駆動因子であることが公知である。0.9%のcfDNAライブラリーCRC406における変異配列検出は、十分にアッセイ感度の範囲内であった。感度は、すべてが変異配列を有する、タグ付きリードの複数のファミリーの存在によって定義される。これらのデータは、本明細書において企図されるシステムの臨床上の有用性を強調する。 First, a library of cfDNA from 4 cancer patients was screened using the targeted probes listed in Table 6 of Example 2. These probes were primarily configured to detect point mutations in the TP53 gene, gene fusion with ALK, and amplification of MYCN. The result of this initial sequencing screen is shown in FIG. Point mutations occurring at the same base position were found in cfDNA, tumor and NAT in one ovarian patient. No TP53 mutations were found in other sets of matched samples from patients with ovarian cancer. Point mutations were also detected in two CRC cfDNA libraries for which no matching tissue was available. All of these point mutations have been previously identified in tumors and all are known to be causative drivers of tumor development. Mutant sequence detection in the 0.9% cfDNA library CRC406 was well within assay sensitivity. Sensitivity is defined by the presence of multiple families of tagged reads, all with mutant sequences. These data underscore the clinical usefulness of the system contemplated herein.

cfDNAライブラリーおよび関連組織におけるがん関連変化の検出をさらに探求するために、同じライブラリーを、合計20の異なるがん関連遺伝子に指向されているプローブ679個のセット(表18)にハイブリダイズさせた。このプローブセットでは14遺伝子のコード領域のすべてを標的にしたが、残りの6遺伝子では選択座位を標的にした。

Figure 2021182940
To further explore the detection of cancer-related changes in the cfDNA library and related tissues, the same library is hybridized to a set of 679 probes directed to a total of 20 different cancer-related genes (Table 18). I let you. The probe set targeted the entire coding region of 14 genes, while the remaining 6 genes targeted the selective loci.
Figure 2021182940

図24に示したように、TP53の検出可能な変化が一切なかったOVA1試料は、KRASの変異を有し、この変異は、cfDNAにおいても対応する腫瘍においても見いだされた。この観測は、ここに記載するアッセイシステムの有意な特徴を強調する。cfDNAから生成したライブラリーを(この実施例でのように)何百もの、およびさらには何千もの標的化プローブで調べることができる。得られた標的化ライブラリーのシークエンシングは、腫瘍内に存在し、罹患個体の生殖系列の中には存在しない体細胞変異を明らかにした。これらの腫瘍関連体細胞マーカーは、(生殖系列配列を有するcfDNAに対して)腫瘍から排出される循環DNAの量を定量するためにも使用することができる。したがって、変異の発見によって、それらの生物学的意義に関係なく、混合cfDNA中の腫瘍含有量も推定される。 As shown in FIG. 24, the OVA1 sample with no detectable change in TP53 had a mutation in KRAS, which mutation was found in both cfDNA and the corresponding tumor. This observation highlights the significant features of the assay system described herein. Libraries generated from cfDNA can be examined with hundreds and even thousands of targeting probes (as in this example). Sequencing of the resulting targeted library revealed somatic mutations that were present in the tumor and not in the germline of the affected individual. These tumor-related somatic cell markers can also be used to quantify the amount of circulating DNA excreted from a tumor (relative to cfDNA having a germline sequence). Therefore, the discovery of mutations also estimates the tumor content in the mixed cfDNA, regardless of their biological significance.

多くの標的療法は、正常遺伝子の存在下で最も大きな成功を収めている(例えば、EGFR阻害剤は、野生型KRASの存在下でのみ機能する)。循環腫瘍DNAレベルの定量的評定は、遺伝子の変異が見いだされないこれらの場合に特に有意になる。言い換えると、特定の標的遺伝子での野生型シークエンシング結果と相まって循環腫瘍DNAの実証可能な存在は、標的遺伝子が腫瘍内では正常であることを示唆しており、そのような結果は、療法の選択の誘導に有意な影響をもたらすことができる。前述のことは、図24で強調されているOVA1試料にも当てはまる。cfDNAライブラリー中のKRAS変異の存在は、この患者の腫瘍が野生型TP53遺伝子を有することを示唆した。 Many targeted therapies have been most successful in the presence of normal genes (eg, EGFR inhibitors only work in the presence of wild-type KRAS). Quantitative assessment of circulating tumor DNA levels is especially significant in these cases where no gene mutations are found. In other words, the demonstrable presence of circulating tumor DNA, coupled with wild-type sequencing results at specific target genes, suggests that the target genes are normal within the tumor, and such results suggest that the therapy It can have a significant effect on the induction of selection. The above also applies to the OVA1 sample highlighted in FIG. The presence of KRAS mutations in the cfDNA library suggested that the patient's tumor had the wild-type TP53 gene.

異常な遺伝子発見のもう1つの例を図25に示す。標的化定量的遺伝子解析システムは、HER−2/neuと言い換えられる、ERBB2遺伝子における有意な増幅の存在を明らかにした。このタイプの増幅は、乳がんに関して多く公表されているが、結腸直腸癌でも同定されることがある。 Another example of abnormal gene discovery is shown in FIG. A targeted quantitative gene analysis system revealed the presence of significant amplification in the ERBB2 gene, paraphrased as HER-2 / neu. This type of amplification is widely published for breast cancer, but may also be identified for colorectal cancer.

結論
細胞株DNAでの検証実験は、がんにおける新生物成長の駆動の中核をなす3タイプの遺伝的変動の検出の閾値を明らかにした。がん患者に由来するcfDNAの特徴付けは、解析した4つすべての試料での再構成実験によって設定した閾値より十分上である腫瘍関連遺伝子変化を明らかにした。これらのデータは、本明細書において企図される定量的解析には、特に、リキッドバイオプシーが最も適切である状況で、臨床的有用性がありうることを示した。
CONCLUSIONS Verification experiments with cell line DNA have revealed thresholds for the detection of three types of genetic variation that are central to driving neoplasmic growth in cancer. Characterization of cfDNA from cancer patients revealed tumor-related gene changes well above the threshold set by reconstitution experiments in all four analyzed samples. These data indicate that the quantitative analysis contemplated herein may have clinical utility, especially in situations where liquid biopsy is most appropriate.

一般に、下記の特許請求の範囲において使用する用語は、本明細書および本特許請求の範囲において開示する特定の実施形態に本特許請求の範囲を限定すると解釈すべきでなく、そのような特許請求の範囲が権利を与えている均等物の全範囲とともにすべての可能な実施形態を含むと解釈すべきである。したがって、本特許請求の範囲は、本開示によって限定されない。
例えば、本発明は以下の項目を提供する。
(項目1)
無細胞DNA(cfDNA)の遺伝子解析のための方法であって、
(a)cfDNAを1つまたは複数の末端修復酵素で処置して末端修復cfDNAを生成するステップ、
(b)前記末端修復cfDNAの各末端に1つまたは複数のアダプターをライゲーションしてcfDNAライブラリーを生成するステップ、
(c)前記cfDNAライブラリーを増幅させてcfDNAライブラリークローンを生成するステップ、
(d)cfDNAクローンライブラリー中のゲノム当量の数を決定するステップ、および
(e)前記cfDNAライブラリークローン中の1つまたは複数の標的遺伝子座位の定量的遺伝子解析を行うステップ
を含む方法。
(項目2)
対象の生体試料からcfDNAを単離するステップをさらに含む、項目1に記載の方法。
(項目3)
前記cfDNAが、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液および汗からなる群から選択される生体試料から単離される、項目1または項目2に記載の方法。
(項目4)
前記1つまたは複数のアダプターが、複数のアダプター種を含む、項目1〜3のいずれか一項に記載の方法。
(項目5)
前記1つまたは複数のアダプター各々が、前記cfDNAライブラリーの増幅のためのプライマー結合部位を含む、項目1〜4のいずれか一項に記載の方法。
(項目6)
前記1つまたは複数のアダプター各々が、1つまたは複数のユニークリードコードを含む、項目1〜5のいずれか一項に記載の方法。
(項目7)
前記1つまたは複数のアダプター各々が、試料多重化のための1つまたは複数の試料コードを含む、項目1〜6のいずれか一項に記載の方法。
(項目8)
前記1つまたは複数のアダプター各々が、DNAシークエンシングのための1つまたは複数の配列を含む、項目1〜6のいずれか一項に記載の方法。
(項目9)
qPCRを前記cfDNAクローンライブラリーに対して行い、qPCR測定値を既知ゲノム当量の標準と比較して前記cfDNAクローンライブラリーのゲノム当量を決定する、項目1〜8のいずれか一項に記載の方法。
(項目10)
Alu配列と結合するプライマーおよびアダプター中の配列と結合するプライマーを用いて前記qPCRを行う、項目9に記載の方法。
(項目11)
前記定量的遺伝子解析を、前記cfDNAライブラリークローン中の複数の遺伝子座位に対して行う、項目1〜10のいずれか一項に記載の方法。
(項目12)
前記定量的遺伝子解析を、複数のcfDNAクローンライブラリー中の複数の遺伝子座位に対して行う、項目1〜11のいずれか一項に記載の方法。
(項目13)
前記定量的遺伝子解析が、1つまたは複数の捕捉プローブを標的遺伝子座位にハイブリダイズさせて、捕捉プローブ−cfDNAクローン複合体を形成することを含む、項目1〜12のいずれか一項に記載の方法。
(項目14)
前記定量的遺伝子解析が、前記捕捉プローブ−cfDNAクローン複合体を単離することを含む、項目13に記載の方法。
(項目15)
前記定量的遺伝子解析が、前記単離されたハイブリダイズした捕捉プローブ−cfDNAクローン複合体中の前記cfDNAクローン配列の増幅を含む、項目14に記載の方法。
(項目16)
前記定量的遺伝子解析が、複数のシークエンシングリードを生成するためのDNAシークエンシングを含む、項目1〜15のいずれか一項に記載の方法。
(項目17)
前記複数のシークエンシングリードのバイオインフォマティック解析をさらに含む、項目16に記載の方法。
(項目18)
バイオインフォマティクス解析が、
(a)前記cfDNAクローンライブラリー中の解析されるゲノム当量の数を定量するため、
(b)標的遺伝子座位における遺伝子バリアントを検出するため、
(c)標的遺伝子座位内の変異を検出するため、
(d)標的遺伝子座位内の遺伝子融合を検出するため、および
(e)標的遺伝子座位内のコピー数増減を測定するために
使用される、項目1〜17のいずれか一項に記載の方法。
(項目19)
前記対象が、遺伝疾患を有さない、項目2〜18のいずれか一項に記載の方法。
(項目20)
前記対象が、遺伝疾患と診断されていない、項目2〜18のいずれか一項に記載の方法。
(項目21)
前記対象が、遺伝疾患と診断されている、項目2〜18のいずれか一項に記載の方法。(項目22)
前記定量的遺伝子解析が、前記遺伝疾患を引き起こすまたは前記遺伝疾患に関連する1つまたは複数の遺伝子病変を同定または検出するために使用される、項目21に記載の方法。
(項目23)
前記遺伝子病変が、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む、項目22に記載の方法。
(項目24)
前記遺伝子病変が、ALK遺伝子の3’コード領域を別の遺伝子に融合させるゲノム再編成を含む、項目22に記載の方法。
(項目25)
前記ALK遺伝子の3’コード領域が、EML4遺伝子に融合される、項目24に記載の方法。
(項目26)
前記遺伝疾患ががんである、項目22〜25のいずれか一項に記載の方法。
(項目27)
前記対象が妊娠している、項目2〜18のいずれか一項に記載の方法。
(項目28)
前記定量的遺伝子解析が、胎児cfDNA中の1つまたは複数の標的遺伝子座位の1つまたは複数の遺伝子バリアントまたは遺伝子病変を同定または検出するために使用される、項目27に記載の方法。
(項目29)
前記対象が、移植レシピエントである、項目2〜18のいずれか一項に記載の方法。
(項目30)
前記定量的遺伝子解析が、前記対象におけるドナーcfDNAを同定または検出するために使用される、項目27に記載の方法。
(項目31)
対象における遺伝疾患を予測、診断またはモニターする方法であって、
(a)対象の生体試料からcfDNAを単離するまたは得るステップ、
(b)前記cfDNAを1つまたは複数の末端修復酵素で処置して末端修復cfDNAを生成するステップ、
(c)前記末端修復cfDNAの各末端に1つまたは複数のアダプターをライゲーションしてcfDNAライブラリーを生成するステップ、
(d)前記cfDNAライブラリーを増幅させてcfDNAクローンライブラリーを生成するステップ、
(e)前記cfDNAクローンライブラリー中のゲノム当量の数を決定するステップ、および
(f)前記cfDNAクローンライブラリー中の前記遺伝疾患に関連する1つまたは複数の標的遺伝子座位の定量的遺伝子解析を行うステップ
を含み、前記1つまたは複数の標的遺伝子座位における1つまたは複数の遺伝子病変の同定または検出が、前記遺伝疾患の予後を予測し、それを診断し、またはその進行をモニターする、方法。
(項目32)
前記cfDNAが、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液および汗からなる群から選択される生体試料から単離される、項目29に記載の方法。
(項目33)
前記遺伝子病変が、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む、項目29に記載の方法。
(項目34)
前記遺伝子病変が、ALK遺伝子の3’コード領域を別の遺伝子に融合させるゲノム再編成を含む、項目31に記載の方法。
(項目35)
前記ALK遺伝子の3’コード領域が、EML4遺伝子に融合される、項目32に記載の方法。
(項目36)
前記遺伝疾患ががんである、項目29〜32のいずれか一項に記載の方法。
(項目37)
遺伝疾患のコンパニオン診断であって、
(a)対象の生体試料からcfDNAを単離するまたは得るステップ、
(b)前記cfDNAを1つまたは複数の末端修復酵素で処置して末端修復cfDNAを生成するステップ、
(c)前記末端修復cfDNAの各末端に1つまたは複数のアダプターをライゲーションしてcfDNAライブラリーを生成するステップ、
(d)前記cfDNAライブラリーを増幅させてcfDNAクローンライブラリーを生成するステップ、
(e)前記cfDNAクローンライブラリー中のゲノム当量の数を決定するステップ、および
(f)前記cfDNAクローンライブラリー中の前記遺伝疾患に関連する1つまたは複数のバイオマーカーの定量的遺伝子解析を行うステップ
を含み、前記1つまたは複数のバイオマーカーの少なくとも1つの検出、または検出できないことが、前記対象を前記遺伝疾患について処置すべきかどうかを示す、コンパニオン診断。
(項目38)
前記cfDNAが、羊水、血液、血漿、血清、精液、リンパ液、脳脊髄液、眼液、尿、唾液、糞便、粘液および汗からなる群から選択される生体試料から単離される、項目35に記載の方法。
(項目39)
前記バイオマーカーが、遺伝子病変である、項目35に記載の方法。
(項目40)
前記遺伝子病変が、ヌクレオチドトランジションもしくはトランスバージョン、ヌクレオチド挿入もしくは欠失、ゲノム再編成、コピー数の変化、または遺伝子融合を含む、項目37に記載の方法。
(項目41)
前記遺伝子病変が、ALK遺伝子の3’コード領域を別の遺伝子に融合させるゲノム再編成を含む、項目37に記載の方法。
(項目42)
前記ALK遺伝子の3’コード領域が、EML4遺伝子に融合される、項目39に記載の方法。
(項目43)
前記遺伝疾患ががんである、項目35〜40のいずれか一項に記載の方法。
In general, the terms used in the claims below should not be construed as limiting the scope of the claims to the specific embodiments disclosed herein and in the claims, and such claims. It should be interpreted that the scope of is to include all possible embodiments as well as the entire range of equalities to which it is entitled. Therefore, the scope of the claims is not limited by the present disclosure.
For example, the present invention provides the following items.
(Item 1)
A method for gene analysis of cell-free DNA (cfDNA).
(A) A step of treating cfDNA with one or more terminal repair enzymes to produce terminal repair cfDNA.
(B) A step of ligating one or more adapters to each end of the terminal repair cfDNA to generate a cfDNA library.
(C) A step of amplifying the cfDNA library to generate a cfDNA library clone,
A method comprising: (d) determining the number of genomic equivalents in the cfDNA clone library and (e) performing quantitative gene analysis of one or more target gene loci in the cfDNA library clone.
(Item 2)
The method of item 1, further comprising the step of isolating cfDNA from a biological sample of interest.
(Item 3)
Item 1 or item, wherein the cfDNA is isolated from a biological sample selected from the group consisting of amniotic fluid, blood, plasma, serum, semen, lymph, cerebrospinal fluid, ophthalmic fluid, urine, saliva, feces, mucus and sweat. The method according to 2.
(Item 4)
The method according to any one of items 1 to 3, wherein the one or more adapters include a plurality of adapter types.
(Item 5)
The method of any one of items 1-4, wherein each of the one or more adapters comprises a primer binding site for amplification of the cfDNA library.
(Item 6)
The method of any one of items 1-5, wherein each of the one or more adapters comprises one or more unique read cords.
(Item 7)
The method of any one of items 1-6, wherein each of the adapters comprises one or more sample codes for sample multiplexing.
(Item 8)
The method of any one of items 1-6, wherein each of the adapters comprises one or more sequences for DNA sequencing.
(Item 9)
The method according to any one of items 1 to 8, wherein qPCR is performed on the cfDNA clone library and the qPCR measurement value is compared with a standard of known genomic equivalents to determine the genomic equivalent of the cfDNA clone library. ..
(Item 10)
9. The method of item 9, wherein the qPCR is performed using a primer that binds to the Alu sequence and a primer that binds to the sequence in the adapter.
(Item 11)
The method according to any one of items 1 to 10, wherein the quantitative gene analysis is performed on a plurality of gene loci in the cfDNA library clone.
(Item 12)
The method according to any one of items 1 to 11, wherein the quantitative gene analysis is performed on a plurality of gene loci in a plurality of cfDNA clone libraries.
(Item 13)
The item according to any one of items 1 to 12, wherein the quantitative gene analysis comprises hybridizing one or more capture probes to a target gene locus to form a capture probe-cfDNA clone complex. Method.
(Item 14)
13. The method of item 13, wherein the quantitative gene analysis comprises isolating the capture probe-cfDNA clone complex.
(Item 15)
14. The method of item 14, wherein the quantitative genetic analysis comprises amplifying the cfDNA clone sequence in the isolated hybridized capture probe-cfDNA clone complex.
(Item 16)
The method according to any one of items 1 to 15, wherein the quantitative gene analysis comprises DNA sequencing for generating a plurality of sequencing reads.
(Item 17)
16. The method of item 16, further comprising bioinformatic analysis of the plurality of sequencing leads.
(Item 18)
Bioinformatics analysis,
(A) To quantify the number of genomic equivalents analyzed in the cfDNA clone library.
(B) To detect gene variants at target gene loci
(C) To detect mutations in target gene loci
The method according to any one of items 1 to 17, which is used for (d) detecting gene fusion within a target gene locus and (e) measuring an increase or decrease in the number of copies within a target gene locus.
(Item 19)
The method according to any one of items 2 to 18, wherein the subject does not have a genetic disorder.
(Item 20)
The method according to any one of items 2 to 18, wherein the subject has not been diagnosed with a genetic disease.
(Item 21)
The method according to any one of items 2 to 18, wherein the subject has been diagnosed with a genetic disease. (Item 22)
21. The method of item 21, wherein the quantitative genetic analysis is used to identify or detect one or more genetic lesions that cause or are associated with the genetic disorder.
(Item 23)
22. The method of item 22, wherein the genetic lesion comprises a nucleotide transition or transversion, a nucleotide insertion or deletion, a genomic rearrangement, a change in the number of copies, or a gene fusion.
(Item 24)
22. The method of item 22, wherein the gene lesion comprises a genomic rearrangement that fuses the 3'coding region of the ALK gene to another gene.
(Item 25)
24. The method of item 24, wherein the 3'coding region of the ALK gene is fused to the EML4 gene.
(Item 26)
The method according to any one of items 22 to 25, wherein the genetic disease is cancer.
(Item 27)
The method according to any one of items 2 to 18, wherein the subject is pregnant.
(Item 28)
27. The method of item 27, wherein the quantitative gene analysis is used to identify or detect one or more gene variants or genetic lesions at one or more target gene loci in fetal cfDNA.
(Item 29)
The method according to any one of items 2 to 18, wherein the subject is a transplant recipient.
(Item 30)
27. The method of item 27, wherein the quantitative genetic analysis is used to identify or detect donor cfDNA in the subject.
(Item 31)
A method of predicting, diagnosing or monitoring a genetic disorder in a subject.
(A) A step of isolating or obtaining cfDNA from a biological sample of interest,
(B) A step of treating the cfDNA with one or more terminal repair enzymes to produce terminal repair cfDNA.
(C) A step of ligating one or more adapters to each end of the terminal repair cfDNA to generate a cfDNA library.
(D) A step of amplifying the cfDNA library to generate a cfDNA clone library.
(E) Steps to determine the number of genomic equivalents in the cfDNA clone library, and (f) Quantitative gene analysis of one or more target gene loci associated with the genetic disorder in the cfDNA clone library. A method of identifying or detecting one or more genetic lesions at said one or more target gene loci, comprising performing steps, predicting the prognosis of said genetic disorder, diagnosing it, or monitoring its progression. ..
(Item 32)
29. Item 29, wherein the cfDNA is isolated from a biological sample selected from the group consisting of amniotic fluid, blood, plasma, serum, semen, lymph, cerebrospinal fluid, ophthalmic fluid, urine, saliva, feces, mucus and sweat. the method of.
(Item 33)
29. The method of item 29, wherein the genetic lesion comprises a nucleotide transition or transversion, a nucleotide insertion or deletion, a genomic rearrangement, a change in copy count, or a gene fusion.
(Item 34)
31. The method of item 31, wherein the gene lesion comprises a genomic rearrangement that fuses the 3'coding region of the ALK gene to another gene.
(Item 35)
32. The method of item 32, wherein the 3'coding region of the ALK gene is fused to the EML4 gene.
(Item 36)
The method according to any one of items 29 to 32, wherein the genetic disease is cancer.
(Item 37)
Companion diagnostics for genetic disorders
(A) A step of isolating or obtaining cfDNA from a biological sample of interest,
(B) A step of treating the cfDNA with one or more terminal repair enzymes to produce terminal repair cfDNA.
(C) A step of ligating one or more adapters to each end of the terminal repair cfDNA to generate a cfDNA library.
(D) A step of amplifying the cfDNA library to generate a cfDNA clone library.
(E) Determine the number of genomic equivalents in the cfDNA clone library, and (f) perform quantitative genetic analysis of one or more biomarkers associated with the genetic disorder in the cfDNA clone library. Companion diagnostics comprising the step, the detection or failure to detect at least one of the one or more biomarkers indicates whether the subject should be treated for the genetic disorder.
(Item 38)
35. Item 35, wherein the cfDNA is isolated from a biological sample selected from the group consisting of amniotic fluid, blood, plasma, serum, semen, lymph, cerebrospinal fluid, ophthalmic fluid, urine, saliva, feces, mucus and sweat. the method of.
(Item 39)
35. The method of item 35, wherein the biomarker is a genetic lesion.
(Item 40)
37. The method of item 37, wherein the genetic lesion comprises a nucleotide transition or transversion, a nucleotide insertion or deletion, a genomic rearrangement, a change in the number of copies, or a gene fusion.
(Item 41)
37. The method of item 37, wherein the gene lesion comprises a genomic rearrangement that fuses the 3'coding region of the ALK gene to another gene.
(Item 42)
39. The method of item 39, wherein the 3'coding region of the ALK gene is fused to the EML4 gene.
(Item 43)
The method according to any one of items 35 to 40, wherein the genetic disease is cancer.

Claims (1)

明細書に記載の発明。The invention described in the specification.
JP2021139325A 2020-05-25 2021-08-27 METHODS FOR QUANTITATIVE GENETIC ANALYSIS OF CELL FREE DNA (cfDNA) Withdrawn JP2021182940A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021139325A JP2021182940A (en) 2020-05-25 2021-08-27 METHODS FOR QUANTITATIVE GENETIC ANALYSIS OF CELL FREE DNA (cfDNA)
JP2023142908A JP2023159462A (en) 2020-05-25 2023-09-04 METHODS FOR QUANTITATIVE GENETIC ANALYSIS OF CELL FREE DNA (cfDNA)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020090411A JP7441584B6 (en) 2014-08-22 2020-05-25 Method for quantitative genetic analysis of cell-free DNA (cfDNA)
JP2021139325A JP2021182940A (en) 2020-05-25 2021-08-27 METHODS FOR QUANTITATIVE GENETIC ANALYSIS OF CELL FREE DNA (cfDNA)

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020090411A Division JP7441584B6 (en) 2014-08-22 2020-05-25 Method for quantitative genetic analysis of cell-free DNA (cfDNA)

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023142908A Division JP2023159462A (en) 2020-05-25 2023-09-04 METHODS FOR QUANTITATIVE GENETIC ANALYSIS OF CELL FREE DNA (cfDNA)

Publications (2)

Publication Number Publication Date
JP2021182940A true JP2021182940A (en) 2021-12-02
JP2021182940A5 JP2021182940A5 (en) 2022-03-31

Family

ID=73453009

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2020090411A Active JP7441584B6 (en) 2014-08-22 2020-05-25 Method for quantitative genetic analysis of cell-free DNA (cfDNA)
JP2021139325A Withdrawn JP2021182940A (en) 2020-05-25 2021-08-27 METHODS FOR QUANTITATIVE GENETIC ANALYSIS OF CELL FREE DNA (cfDNA)
JP2023142908A Pending JP2023159462A (en) 2020-05-25 2023-09-04 METHODS FOR QUANTITATIVE GENETIC ANALYSIS OF CELL FREE DNA (cfDNA)

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020090411A Active JP7441584B6 (en) 2014-08-22 2020-05-25 Method for quantitative genetic analysis of cell-free DNA (cfDNA)

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023142908A Pending JP2023159462A (en) 2020-05-25 2023-09-04 METHODS FOR QUANTITATIVE GENETIC ANALYSIS OF CELL FREE DNA (cfDNA)

Country Status (1)

Country Link
JP (3) JP7441584B6 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013536679A (en) * 2010-09-03 2013-09-26 セントル ナショナル デ ラ ルシュルシュ サイエンティフィーク(シーエヌアールエス) Cell-free nucleic acid analysis methods and uses
JP2014512817A (en) * 2011-04-12 2014-05-29 ベリナタ ヘルス インコーポレイテッド Analysis of genomic fractions using polymorphic counts
WO2014093330A1 (en) * 2012-12-10 2014-06-19 Clearfork Bioscience, Inc. Methods for targeted genomic analysis
WO2014093825A1 (en) * 2012-12-14 2014-06-19 Chronix Biomedical Personalized biomarkers for cancer
JP2017525371A (en) * 2014-08-22 2017-09-07 レゾリューション バイオサイエンス, インコーポレイテッド Method for quantitative gene analysis of cell-free DNA (cfDNA)

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013536679A (en) * 2010-09-03 2013-09-26 セントル ナショナル デ ラ ルシュルシュ サイエンティフィーク(シーエヌアールエス) Cell-free nucleic acid analysis methods and uses
JP2014512817A (en) * 2011-04-12 2014-05-29 ベリナタ ヘルス インコーポレイテッド Analysis of genomic fractions using polymorphic counts
WO2014093330A1 (en) * 2012-12-10 2014-06-19 Clearfork Bioscience, Inc. Methods for targeted genomic analysis
WO2014093825A1 (en) * 2012-12-14 2014-06-19 Chronix Biomedical Personalized biomarkers for cancer
JP2017525371A (en) * 2014-08-22 2017-09-07 レゾリューション バイオサイエンス, インコーポレイテッド Method for quantitative gene analysis of cell-free DNA (cfDNA)

Also Published As

Publication number Publication date
JP7441584B2 (en) 2024-03-01
JP7441584B6 (en) 2024-03-15
JP2023159462A (en) 2023-10-31
JP2020188767A (en) 2020-11-26

Similar Documents

Publication Publication Date Title
JP6709778B2 (en) Method for quantitative gene analysis of cell-free DNA (cfDNA)
JP6913089B2 (en) Highly efficient construction of DNA library
US20180179578A1 (en) Methods for quantitative genetic analysis of cell free dna
KR102505122B1 (en) Methods for Detection of Genomic Copy Changes in DNA Samples
US11371090B2 (en) Compositions and methods for molecular barcoding of DNA molecules prior to mutation enrichment and/or mutation detection
US20220073906A1 (en) Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis
US20240191293A1 (en) Compositions and methods for simultaneous genetic analysis of multiple libraries
JP2021182940A (en) METHODS FOR QUANTITATIVE GENETIC ANALYSIS OF CELL FREE DNA (cfDNA)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220819

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221117

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230220

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230904

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230911

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20230914