CN109415764A - 用于检测核酸突变的组合物和方法 - Google Patents

用于检测核酸突变的组合物和方法 Download PDF

Info

Publication number
CN109415764A
CN109415764A CN201780041202.2A CN201780041202A CN109415764A CN 109415764 A CN109415764 A CN 109415764A CN 201780041202 A CN201780041202 A CN 201780041202A CN 109415764 A CN109415764 A CN 109415764A
Authority
CN
China
Prior art keywords
target
primer
specific
amplicon
artificial sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780041202.2A
Other languages
English (en)
Inventor
伯恩哈德·齐默尔曼
约书亚·巴比亚尔兹
拉赫勒·萨拉里
图德·庞皮利厄·康斯坦丁
奥努尔·萨卡里亚
丹尼斯·普罗森
亚历山大·奥尔森
斯科特·达什纳
尼古拉·谢尔盖耶夫
马修·迈卡·希尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Natera Inc
Original Assignee
Gene Security Network Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gene Security Network Inc filed Critical Gene Security Network Inc
Publication of CN109415764A publication Critical patent/CN109415764A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7023(Hyper)proliferation
    • G01N2800/7028Cancer

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供用于在样品或其部分(在某些实施例中,包括含有循环肿瘤DNA的部分)中检测靶基因中的突变的方法和组合物。该方法可以包括覆瓦式PCR反应,例如单边多重覆瓦式反应。实际上,可以用所述方法和组合物检测任何类型的突变。在某些实施方案中,检测基因融合。提供了改进的PCR方法,尤其是用于进行巢式多重PCR反应的方法。

Description

用于检测核酸突变的组合物和方法
相关申请的交叉引用
本申请要求2016年07月01日提交的美国临时申请序列号62/357,847的利益,该申请的全文以引用方式合并入本文。
序列表
本申请含有已经以ASCII格式电子递交的序列表,并且其全文以引用的方式合并入本文中。所述ASCII副本被创建于2017年06月29日,被命名为N_017_WO_01_SL.TXT,并且大小为83,468字节。
技术领域
所公开的本发明大体涉及使用例如聚合酶链式反应(PCR)的扩增方法来检测核酸突变和融合的方法。
背景技术
与疾病(包括癌症)相关的突变的检测,无论是在诊断之前、在做出诊断中用于疾病分期还是监测治疗效果,传统上都依赖于实体肿瘤活检样品。这样取样是高度侵入性的,并且并非没有潜在地促进转移或手术并发症的风险。对于疾病或发育异常是决定性的突变,可以被认为是染色体易位、中间缺失、单核苷酸变异(SNV)、倒位、单核苷酸多态性(SNP)、插入、缺失、取代、及其组合。染色体易位或基因融合可以与已知参与各种癌症的基因相关,该基因包括AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1及其他。
基因融合在某些癌症(例如肺癌)中是某些主要的驱动事件。在肿瘤活组织检查中通常由mRNA-Seq检测基因融合,但该方法不能应用于血浆中的融合检测。使用简单的抽血来检测突变的能力,可以避免高度侵入性的医疗程序和潜在的并发症(包括疤痕)。所公开的本发明利用了在无细胞DNA样品(例如在血液中提取的血清或血浆)中检测突变的能力。
发明内容
本发明提供了用于在样品或其部分中检测靶基因中的突变的方法和组合物,在某些例子中该部分包括包含循环肿瘤DNA的部分。该方法可以包括覆瓦式(tiling)PCR反应,例如单边多重覆瓦式反应。事实上,可以用该方法和组合物检测任何类型的突变。在某些实施方式中,检测基因融合。提供了改进的PCR方法,尤其是用于执行巢式多重PCR反应的方法。
在一个实施方式中,本发明所提供的是用于在来自哺乳动物的样品或其部分(例如包括循环肿瘤DNA的无细胞部分(例如血浆部分))中检测靶基因中的突变的方法。该方法包括:使用一系列的覆瓦式引物对来自该样品的DNA执行多重PCR反应,并且在说明性的实施方式中执行巢式多重PCR反应,其首先使用一系列的覆瓦式外部引物以形成外部引物靶扩增子,然后使用一系列的覆瓦式内部引物以从该外部引物靶扩增子形成内部引物靶扩增子。然后对该内部引物靶扩增子进行核酸测序(例如高通量核酸测序),以检测突变。在说明性的实施方式中,该突变是基因融合。
在另一个实施方式中,本发明提供用于在来自哺乳动物的样品或其部分中检测靶基因中的突变的方法。该方法包括以下步骤:通过将聚合酶、脱氧核苷三磷酸、来自由该样品生成的核酸文库(library)的核酸片段、一系列正向靶特异性外部引物以及正链反向外部通用引物进行组合,从而形成外部引物反应混合物,其中该核酸片段包括反向外部通用引物结合位点,其中该系列的正向靶特异性外部引物包括结合至一系列的覆瓦式靶特异性外部引物结合位点的5至250个引物,这些位点在靶基因上以10至100个核苷酸间隔开;使该外部引物反应混合物经受外部引物扩增条件,以生成使用引物对产生的外部引物靶扩增子,所述引物对包含该系列正向靶特异性外部引物中的引物中的一种和该反向外部通用引物;并且分析该外部引物靶扩增子中的至少一部分的核酸序列,从而检测该靶基因中的突变。
该方法可以在该分析步骤之前进一步包括:通过将外部引物靶扩增子、聚合酶、脱氧核苷三磷酸、反向内部通用引物和一系列的正向靶特异性内部引物进行组合,从而形成内部引物扩增反应混合物,该系列的正向靶特异性内部引物包含结合至一系列的覆瓦式靶特异性内部引物结合位点的5至250个引物,这些位点在靶基因上以10至100个核苷酸间隔开并且每个都在至少一个外部引物的靶扩增子上被发现,该系列的正向靶特异性内部引物被配置来在与该系列的外部靶特异性引物相同的方向上引发延伸反应;并且使该内部引物反应混合物经受内部引物扩增条件,以生成使用引物对产生的内部引物靶扩增子,所述引物对包含该正向靶特异性内部引物中的一种和该反向内部通用引物,其中其核苷酸序列被分析的扩增子包括该内部引物靶扩增子。
所述分析步骤可以包括使用大规模平行测序(massively parallel sequencing)来确定扩增子中的至少一部分的核酸序列。例如,该系列的覆瓦式靶特异性外部和/或内部引物结合位点可以在靶基因上以10至75个核苷酸或15至50个核苷酸间隔开。
在用于在来自哺乳动物的样品或其部分中检测靶基因中的突变的另外的实施方式中,该方法包括以下的步骤:通过将核酸样品以及聚合酶、例如脱氧核苷三磷酸的核苷酸、反向内部通用引物和一系列的正向靶特异性内部引物进行组合,以形成内部引物反应混合物,该核酸样品可以包括来自由样品或其部分(尤其是其无细胞部分)构建的文库的核酸片段或者在巢式PCR方法中可以是外部引物靶扩增子,该系列的正向靶特异性内部引物包含结合至一系列的覆瓦式靶特异性内部引物结合位点的5至1000个、5至500个或5至250个引物,这些位点在靶基因上以10至100个核苷酸间隔开并且任选地每个都在至少一个外部引物靶扩增子上被发现,该系列的正向靶特异性内部引物任选地被配置来在与该系列的靶特异性外部引物相同的方向上引发延伸反应;并且使该内部引物反应混合物经受内部引物扩增条件,以生成使用引物对产生的内部引物靶扩增子,所述引物对包含该正向靶特异性内部引物中的一种和反向内部通用引物,并且分析该内部引物靶扩增子中的至少一部分的核酸序列,从而检测该靶基因中的突变。该方法任选地可以在形成该内部引物反应混合物之前包括根据以下步骤生成一系列的外部引物扩增子:通过将聚合酶、例如脱氧核苷三磷酸的核苷酸、来自由样品生成的核酸文库的核酸片段、一系列的正向靶特异性外部引物和正链反向外部通用引物进行组合,以形成外部引物反应混合物,其中该核酸片段包含反向外部通用引物结合位点,其中该系列的正向外部靶特异性引物包含结合至一系列的覆瓦式外部靶引物结合位点的5至250个引物,这些位点在靶基因上以10至100个核苷酸间隔开;并且使该外部引物反应混合物经受外部引物扩增条件,以生成使用引物对产生的外部引物靶扩增子,所述引物对包含该系列的正向靶特异性外部引物中的一种引物和该反向外部通用引物。
在一个示例性的实施方式中,靶特异性内部引物结合位点与靶外部引物结合位点重叠5至20个核苷酸。在另外的实施方式中,所述重叠范围可以是0、1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个核苷酸(在范围的低端值上),以及2、3、4、5、6、7、8、9、10、11、12、13、14、15、20或25个核苷酸(在范围的高端值上)。反向外部通用引物可以包括与反向内部通用引物相同的核苷酸序列。该系列的覆瓦式靶特异性外部引物结合位点和靶特异性内部引物结合位点可以位于1至100种靶基因中的每一个的靶区域上。
在所述方法的另外的实施方式中,外部引物靶扩增子中的至少10%、20%、25%、50%、75%、80%、90%、95%、96%、97%、98%、99%和100%与外部引物靶扩增子中的至少一个其他扩增子具有重叠序列,其中靶区域包括500至10,000个核苷酸,并且其中该靶区域包括与疾病相关的已知突变。该方法可以包括具有重叠序列的外部引物靶扩增子,该重叠序列覆盖了在1至100种靶基因或5至50种靶基因中的每一种上的至少一种靶区域,其中每一种靶区域都包括500至10,000个核苷酸,并且其中该靶区域包括与疾病相关的已知突变。外部引物靶扩增子中的至少50%中的每一种及内部引物靶扩增子中的至少一种可以具有重叠序列。
所述方法可以进一步包括:通过将聚合酶、脱氧核苷三磷酸、来自由样品生成的核酸文库的核酸片段、一系列的负链正向靶特异性外部引物以及负链反向外部通用引物进行组合,从而形成负链外部引物反应混合物,其中该核酸片段包括负链反向外部通用引物结合位点,其中该系列的负链正向靶特异性外部引物包括结合至一系列的覆瓦式负链正向靶特异性外部引物结合位点的5至250个引物,其中这些位点在靶基因上以10至100个核苷酸间隔开,其中该负链正向靶特异性外部引物结合位点位于被该靶特异性外部引物结合位点靶定的链的负链上;使该负链反应混合物经受扩增条件,以生成使用引物对产生的负链靶外部扩增子,所述引物对包含该系列的负链正向靶特异性外部引物中的引物中的一种和该负链反向外部通用引物;并且分析负链靶外部扩增子中的至少一部分的核酸序列,从而检测该靶基因中的突变。
该方法还可以在分析之前进一步包括:通过将负链外部引物靶扩增子、聚合酶、脱氧核苷三磷酸、负链反向内部通用引物和一系列的正向负链靶特异性内部引物进行组合,以形成负链内部引物扩增反应混合物,该系列的正向负链靶特异性内部引物包含结合至一系列的覆瓦式的负链靶特异性内部引物结合位点的5至250个引物,这些位点在靶基因上以10至100个核苷酸间隔开并且每个都在至少一个负链外部引物靶扩增子上被发现,该系列的正向负链靶特异性内部引物被配置来在与该系列的负链靶特异性外部引物相同的方向上引发延伸反应;并且使该负链的反应混合物经受负链靶特异性内部引物扩增条件,以形成使用引物对产生的负链内部引物靶扩增子,所述引物对包含该负链正向靶特异性内部引物中的一种和该负链内部通用引物,其中其核酸序列被分析的该扩增子包括该负链内部引物靶扩增子。负链外部引物扩增条件可以与外部引物扩增条件相同,并且负链内部引物扩增条件可以与内部引物扩增条件相同。在该方法中,与突变相关的疾病是癌症。
在该方法的一个实施方式中,在外部引物靶扩增子和/或内部引物靶扩增子上,来自靶基因的至少10、20、25、30、40、50和100个连续的核酸的存在、以及没有在靶基因上被发现的来自哺乳动物的基因组的区域的至少10、20、25、30、40、50和100个连续核酸的存在,表明了包含该靶基因的基因融合。该系列的正向正链靶特异性外部引物包括至少一个结合至靶引物结合位点的引物,该位点与该靶基因的已知融合断裂点相距25至150个核苷酸,并且其中该外部引物靶扩增子包括长度为至少150个核苷酸的扩增子。
该方法检测来自至少一个或至少两个融合伴侣基因(fusion partner gene)的基因融合,该融合伴侣基因选自AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1,并且其中该系列的靶特异性外部引物包括至少一个结合至靶引物结合位点的引物,该位点与每一个靶基因的已知融合断裂点相距25至150个核苷酸,并且其中该外部引物靶扩增子包括长度为至少150个核苷酸的扩增子。该基因融合包括来自融合伴侣基因的染色体易位,该融合伴侣基因选自AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1。
该方法的该系列的正向靶特异性外部引物和该系列的正向靶特异性内部引物中的每一个都包括至少一个结合至靶引物结合位点的引物,该位点与靶基因的已知融合断裂点相距靶距离,并且其中外部引物靶扩增子包括至少一个与该靶距离一样长的扩增子。该靶基因选自AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1。该靶基因可以包括至少两种融合伴侣基因,其选自AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1,并且该系列的靶特异性外部引物和该系列的靶特异性内部引物的每一个都包括5至250个引物并且每一个都结合至在至少两个融合伴侣基因中的一个上的至少一个靶区域,并且其中至少一个引物结合至靶结合序列,其与该至少两个融合伴侣基因中的每一个的已知融合断裂点相距靶距离,并且其中该至少两个融合伴侣基因中的每一个的外部引物靶扩增子包括至少一个与该靶距离一样长的扩增子。
该系列的靶特异性外部引物和该系列的靶特异性内部引物中的每一个都可以包括至少一个结合至靶结合序列的引物,该靶结合序列:与每个靶基因的已知融合断裂点相距25至150个核苷酸,并且其中外部引物靶扩增子包括横跨已知基因融合断裂点的长度至少为150个核苷酸的扩增子;与每个靶基因的已知融合断裂点相距25至100个核苷酸,并且其中外部引物靶扩增子包括横跨已知的基因融合断裂点长度至少为100个核苷酸的扩增子;或与每个靶基因的已知融合断裂点相距25至50个核苷酸,并且其中外部引物靶扩增子包括横跨已知基因融合断裂点的长度至少为50个核苷酸的扩增子。
该方法的靶特异性外部引物扩增条件包括至少5个PCR循环,该循环具有在58℃至72℃下30至120分钟或60至90分钟的靶特异性外部引物退火步骤。
该方法可以包括两组靶特异性外部引物扩增条件,其中第一组为2至10个PCR循环,其具有在58℃至65℃下30至120分钟的外部引物退火步骤,而第二组为5至50个PCR循环,其具有在68℃至72℃下30至120分钟的靶特异性外部引物退火步骤。该组靶特异性外部引物的最高Tm可以是退火温度之下2至10度。该退火可以在组合的退火/延伸步骤中执行。
本发明提供了用于在来自哺乳动的样品或其部分中检测靶基因中的突变的方法的进一步的实施方式,其中靶特异性外部引物扩增条件包括至少5个PCR循环,其具有在58℃至72℃下长度为30至120分钟或60至90分钟的靶特异性外部引物退火步骤。该靶特异性外部引物扩增条件可以包括:第一组的2至10个PCR循环,该循环具有在58℃至65℃下30至120分钟的靶特异性外部引物退火步骤;以及第二组的5至50个PCR循环,该循环具有在68℃至72℃下30至120分钟的靶特异性外部引物退火步骤。靶特异性外部引物中的50%、75%、90%、95%或全部的最高Tm可以在用于扩增(例如PCR)反应的退火温度之下1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或20度(在范围的低端值上)至2、3、4、5、6、7、8、9、10、11、12、13、14、15或25度(在范围的高端值上)。组靶特异性外部引物最高Tm可以低于退火温度2至10度。该系列的靶特异性外部引物包括至少一种结合至靶结合序列的引物,该靶结合序列与靶基因的已知融合断裂点相距25至150个核苷酸,并且退火可以在组合的退火/延伸步骤中执行。
在另一个实施方式中,提供了用于在体外扩增靶核酸区域的方法。该方法可以包括下述步骤:通过将聚合酶、脱氧核苷三磷酸、来自文库的核酸片段、多个靶特异性引物的第一池和第一反向通用引物进行组合,以形成反应混合物,其中该文库的核酸片段包括通用反向引物结合位点,并且其中所述多个靶特异性引物包括能够结合至一系列的覆瓦式引物的结合位点的5至250个引物,这些位点在靶核酸区域上以10至50个核苷酸间隔开;并且使该反应混合物经受扩增条件,以形成长度为100至200个核苷酸的扩增子,其中扩增条件包括在58℃至72℃下30至120分钟的退火步骤,从而将靶核酸区域进行扩增。该靶特异性引物扩增的方法可以包括至少5个PCR循环,其具有在58℃至72℃下60至90分钟的靶特异性外部引物退火步骤。
该方法可以进一步包括靶特异性引物扩增条件,其中第一组为2至10个PCR循环,其具有在58℃至65℃下30至120分钟的靶特异性外部引物退火步骤,以及第二组的5至50个PCR循环,其具有在68℃至72℃下30至120分钟的靶特异性外部引物退火步骤。靶特异性外部引物中的50%、75%、90%、95%或全部的最高Tm可以在用于扩增(例如PCR)反应的退火温度之下1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或20度(在范围的低端值上)至2、3、4、5、6、7、8、9、10、11、12、13、14、15或25度(在范围的高端值上)。该组靶特异性引物的最高Tm可以低于退火温度2至10度。退火可以在组合的退火/延伸步骤中执行。
在另外的实施方式所提供的是,用于在来自哺乳动物的样品或其部分中检测涉及靶基因的融合的方法。该方法包括:使样品中的核酸经受跨过靶基因的靶区域的单边PCR覆瓦式反应,以生成外部靶扩增子,其中使用反向外部通用引物和5至250个正向靶特异性外部引物执行该覆瓦式反应,所述正向靶特异性外部引物结合至一系列的覆瓦式外部靶引物结合位点,这些位点在靶基因的靶区域上以10至100个核苷酸间隔开;并且分析该靶扩增子的至少一部分的核酸序列,从而检测在该靶基因中的突变。该方法进一步包括:通过使用反向内部通用引物和一系列的正向靶特异性内部引物将该外部靶扩增子进行扩增,从而执行第二单边PCR覆瓦式反应,以生成内部正向靶扩增子,该系列的正向靶特异性内部引物包含结合至一系列的靶内部引物结合位点的5至250种引物,这些位点在靶基因的靶区域上以10至100个核苷酸间隔开并且每个都在至少一个外部引物靶扩增子上被发现,其中该正向靶特异性内部引物被配置来引发在与该系列的外部靶特异性引物相同方向上的延伸反应,以及其中其核酸序列被分析的靶扩增子包括该内部正向靶扩增子。
该方法的靶特异性内部引物结合位点可以与靶特异性外部引物结合位点重叠5至20个核苷酸。该靶区域包括已知涉及基因融合的靶基因的区域。该系列的覆瓦式靶特异性外部引物结合位点可以在靶区域上以10至75个、或15至50个核苷酸间隔开。在2至50种靶基因中的每一种的靶区域上选择该系列的覆瓦式靶特异性外部引物结合位点以及靶特异性内部引物结合位点。
从以下详细的描述以及从权利要求中,发明的其他特征和优势将显而易见。
附图说明
图1:跨过基因融合的160bp基因融合探针(spike)的图示。
图2:人工合成的160bp基因融合探针的图示,其中基因融合位于“伴侣”第一基因和“靶标”第二基因之间,每个基因的比例不同。
图3:在连续的30bp窗口中成覆瓦式的靶特异性引物的图示,其被分组来选择内部+外部引物以用于在单边巢式PCR方法中汇集。
图4:用于选中的覆瓦式靶标的每个外部正链、内部正链、外部负链和内部负链引物组的引物设计池的图示。
图5:当使用用靶特异性覆瓦式引物的单边巢式多重PCR方法时,以读取内部引物的被扩增的读出序列(read)开始的数据分析的图示。
图6A-6B:示出了使用靶特异性覆瓦式引物的PCR方法的图解。图6A-6B示出了使用靶特异性引物的单边巢式多重PCR方法,其中初始被扩增的外部引物扩增子(图6A,PCRNo.1)是用于使用内部引物的第二轮巢式PCR的模板(图6B,PCR No.2)。
图7A-7B:示出了用于使用靶特异性覆瓦式引物的单边巢式多重PCR方法的实验的工作流程,其从文库制备和第一轮扩增(图7A,PCR No.1)、第二轮扩增(PCR No.2)到NGS测序和测序分析(图7B)。
图8A-8C:被测序的从使用靶特异性覆瓦式引物的单边巢式多重PCR方法生成的TP53基因扩增子的NGS测序的读出深度(DOR)的图示。图8A示出了被测序的使用正链靶特异性PCR引物池生成的扩增子的DOR。图8B示出了被测序的使用负链靶特异性PCR引物池生成的扩增子的DOR。图8C示出了被测序的使用正链和负链靶特异性PCR引物池两者生成的扩增子的组合的DOR。
图9A-9B:示出了两种用于检测基因融合的可能的方法。图9A示出了用于TPM4-ALK1的单边巢式多重PCR方法(Star1和Star2)及CD74(伴侣基因)和ROS1(靶基因)的双边一步多重PCR方法(OneStar)。图9B示出了成覆瓦式跨过可出现融合的ALK1基因区域的靶特异性覆瓦式引物。
图10A-10C:示出了三种基因融合探针的测序数据。图10A示出了上部泳道上的由单边巢式多重PCR生成的扩增子的野生型ALK序列读出,以及下部泳道上的从单边巢式多重PCR中衍生的扩增子中测序的被测序的TPM4-ALK9断裂点。图10B示出了在上部泳道上的来自单边巢式多重PCR的野生型ALK测序的扩增子,以及在下部泳道上的从单边巢式多重PCR中衍生的扩增子中测序的被测序的NPM1-ALK9断裂点。图10C示出了在下部泳道测序读出上的由用靶特异性覆瓦式引物的双边一步多重PCR方法PCR扩增的野生型CD74(没有扩增并且因此没有测序产物),以及在上部泳道测序读出上的由双边一步多重PCR方法扩增的被测序的CD74-ROS1_13断裂点。
图11:用于检测融合或SNV的分析的流程图。
图12:野生型ALK扩增的引物竞争的示意图。黑色为ALK序列,蓝色为EML4序列,红色为引物。
图13A-13H:用于ALK、染色体2、和ROS1、染色体6、靶区域(SEQ ID No.1-296)的PCR扩增的STAR1(148个正向靶特异性外部引物)和STAR 2(148个正向靶特异性内部引物)的示例性引物的表。栏标题为:名称(引物的名称);特异性(“真”对该基因是唯一序列,“假”则不是唯一的(仅为外部引物提供,因为所有内部引物为“真”));bp(碱基对数量);起始(在基因上的核苷酸引物结合序列的起始);Tm(结合的引物的熔解温度);SEQ ID NO.(引物的序列表ID编号);以及距离(在外部引物的起点和内部引物的起点之间的距离)。
图14:示出了四种不同基因融合对的探针设计的图示,所有探针具有相同断裂点但不同比例的靶基因和伴侣基因。
图15:示出了两种用于检测基因融合的不同方法的图示,即Star1-Star2和Onestar。
图16:正向引物中的4种以及它们各自的扩增子相对于ALK:TPM4的基因融合断裂点的位置的图示。
图17:相对于模板融合探针分子的正向内部引物2、3和4的相对位置的图示。
图18A:使用一系列的正向靶特异性引物的各种长度的覆瓦式多种靶标的图示。靶插入片段(insert)的长度(不含接头(adapter))被示出在括号之内。
图18B:第1阶段退火循环的被标记的引物荧光与扩增子长度的光谱的图。
图18C:第2阶段退火循环的被标记的引物荧光与扩增子长度的光谱的图。
图19A:通过8F9+5R4_RSQ模板(117bp靶插入片段)的扩增产生的产物的百分比图,该扩增使用30、60和90分钟退火循环和使用一系列的引物。
图19B:通过8F9+5R4_RSQ模板(靶121bp靶插入片段)的扩增产生的产物的百分比图,该扩增使用30、60和90分钟退火循环和使用一系列的引物。
图19C:通过8F9+5R4_RSQ模板(121bp靶插入片段)的扩增产生的产物的百分比图,该扩增使用90分钟退火循环和两种不同反应混合组合物和使用一系列的引物。
图19D:通过8F9+5R4_RSQ模板(232bp靶插入片段)的扩增产生的产物的百分比图,该扩增使用90分钟、60分钟和30分钟退火循环并使用一系列的引物。
通过代表性的而非限制性的方式提供了上述附图。
发明详述
在一个说明性实施方式中,本发明提供了利用多重PCR的用于在循环核酸中进行突变检测的策略。在说明性的实施方式中的方法,可以用于扫描已知与癌症相关的基因的已知或未知的突变;和/或它可以用于检测基因融合。用结合至靶基因的靶区域上的一系列覆瓦式结合位点的引物(即,使该引物成覆瓦式跨过该基因),执行所述多重PCR。该靶区域可以是疑似、认为或已知出现突变的区域。该多重PCR通常随后进行测序和生物信息学分析。例如,可以使PCR引物成覆瓦式跨过从先前的分析中已知会出现与癌症相关的基因融合的整个区域。在该方法中,该生物信息学分析可以识别映射两种基因(靶基因和融合伴侣)的序列的读出,从而检测基因融合事件。在说明性的实施方式中,本发明的该实施方式的方法是PCR方法,其利用单边引物覆瓦,尤其是巢式单边引物覆瓦。提供了对这种单边覆瓦式多重PCR方法的改进,其提供了具有更高产出及更高特异性的更大的扩增子。
相应地,提供了根据本发明的一个实施方式的方法,用于检测在来自哺乳动物的样品或其部分中的靶基因中的突变。在某些说明性的实施方式中,该突变是基因融合。该方法可以包括以下的步骤:形成单边多重PCR覆瓦式反应混合物,用于扩增由样品或其部分生成的核酸文库。在说明性的实施方式中,该单边多重PCR扩增是巢式的单边多重PCR扩增。该单边多重PCR反应使用结合至在靶基因的靶区域上的一系列覆瓦式结合位点的一系列正向引物。在说明性的实施方式中,该靶基因是癌症相关的基因,例如已知是在癌症动因的融合事件中的基因融合伴侣的基因。使该反应混合物经受扩增条件,并且分析被生成的扩增子中的至少一部分的核酸序列,以确定它们的核酸序列。
在更具体的例子中,用于检测靶基因中的突变的该实施方式的方法可以包括下述步骤:通过将聚合酶、脱氧核苷三磷酸、来自由样品生成的核酸文库的核酸片段、一系列的正向靶特异性外部引物和第一链反向外部通用引物进行组合,以形成外部引物反应混合物,其中该核酸片段包含反向外部通用引物结合位点,其中该系列的正向靶特异性外部引物包含结合至一系列的覆瓦式外部靶引物结合位点的5至250种引物,这些位点在靶基因上以10至100个核酸间隔开;使该外部引物反应混合物经受外部引物扩增条件,以生成使用引物对生成的外部引物靶扩增子,该引物对包含该系列的正向靶特异性外部引物中的引物中的一种和该反向外部通用引物;以及分析该外部引物靶扩增子中的至少一部分的核酸序列,从而检测靶基因中的突变。
在某些实施方式中,本发明提供的方法是用于检测基因融合(尤其是与癌症相关的基因融合)的方法。这样的融合可以包括以下融合伴侣基因中的至少1、2、3、4、5、6、7、8、9、10种或全部:AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1。在本发明所提供用于检测融合的方法中使用的引物,在范围的低端值上可以包括一系列的介于3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、50、75、100、125、150、200或250、500、1000、5000、10,000、20,000、25,000、50,0000、60,000或75,000个之间的引物,并且在范围的高端值上可以包括一系列的介于5、6、7、8、9、10、11、12、13、14、15、20、25、50、75、100、125、150、200或250、500、1000、5000、10,000、20,000、25,000、50,0000、60,000、75,000或100,000个之间的引物,其中1、2、3、4、5、6、7、8、9、10、15、20、25、50、75、100、150、200、250、300、400、500、750、1000、2500、5000或10,000个引物(在范围的低端值上)至2、3、4、5、6、7、8、9、10、15、20、25、50、75、100、150、200、250、300、400、500、750、1000、2500、5000、10,000或25,000个引物(在范围的高端值上),结合至与该靶基因中的每一个的已知融合断裂点相距25至150个核苷酸的靶结合序列;并且其中通过该方法生产的扩增子,包括平均长度为25至200个核苷酸(在某些实施方式中长度为50至150个核苷酸)的扩增子。在说明性的实施方式中,该基因融合包括来自融合伴侣基因的染色体易位,该融合伴侣基因选自下述:AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1。在一些实施方式中,本发明提供的方法被具体地设计来检测基因融合,该方法包括改进的PCR反应混合物和循环条件、以及单边巢式多重PCR,该单边巢式多重PCR使用包括本发明提供的说明性的引物位点间隔中的任一种的覆瓦式引物。
在本发明所提供的用于检测融合的方法中,靶区域可以是例如靶基因的0.5kb至10kb,并且在某些实施方式中靶基因的0.5kb至5kb。如实施例1所公开,用于检测融合的靶区域通过将公共数据库(例如COSMIC)的融合转录子映射至基因组的坐标(即,易位),但优选地使用外显子边界和被报道的融合。使用该方法,要成覆瓦式的区域将需要使三种示例性的靶标ALK、ROS1和RET中每一个的<3.6kb的序列成覆瓦式。实施例1的表2阐述了已知融合靶标ALK、ROS1和RET的具体的、示例性的靶区域。
在说明性的实施方式中,在本发明的方法中被分析的样品是血液样品或其部分。在某些实施方式中,本发明所提供的方法是体外方法。在某些实施方式中,本发明所提供的方法特异性地适合于扩增DNA片段,尤其是在循环肿瘤DNA(ctDNA)中发现的肿瘤DNA片段。这样的片段长度通常为约160个核苷酸。
本领域中已知的是,例如cfDNA的无细胞核酸(cfNA)可以通过各种形式的细胞死亡(例如凋亡、坏死、自噬和坏死性凋亡)而被释放进入循环。该cfDNA被片段化并且片段的大小分布从150-350bp至>10000bp变化。(参见Kalnina et al.World JGastroenterol.2015Nov 7;21(41):11636–11653)。例如,在肝细胞性肝癌(HCC)患者中的血浆DNA片段的大小分布横跨100-220bp长度的范围,该范围在约166bp处具有计数频率的峰以及在长度为150-180bp的片段中具有最高肿瘤DNA浓度(参见:Jiang et al.Proc NatlAcad Sci USA 112:E1317–E1325)。
在说明性的实施方式中,在通过离心移除细胞碎片和血小板之后,使用EDTA-2Na管将循环肿瘤DNA(ctDNA)从血液中分离。该血浆样品可以被储存在-80,直到使用例如QIAamp DNA Mini试剂盒(Qiagen,Hilden,Germany)提取DNA(例如,Hamakawa et al.,Br JCancer.2015;112:352–356)。Hamakava等报道了所有样品中的被提取的无细胞DNA的中值浓度为每ml血浆43.1ng(范围9.5-1338ng/ml)以及具有0.90%的中值的0.001–77.8%的突变部分的范围。
在某些说明性的实施方式中,所述样品是肿瘤。考虑到本文的教导,本领域中已知用于从肿瘤中分离核酸以及用于从这种DNA样品中创建核酸文库的方法。进一步,考虑到本文的教导,本领域技术人员将认识到如何从其他样品(例如除ctDNA样品之外的DNA自由浮动的其他液体样品)中创建适合本文方法的核酸文库。
在某些实施方式中,本发明的方法通常包括从样品中生成并扩增核酸文库的步骤(即文库制备)。在文库制备步骤期间来自该样品的核酸可以具有被附接的连接接头,其通常被称为文库标签或连接接头标签(LT),其中该连接接头含有通用引发序列,随后进行通用扩增。在一个实施方式中,可以使用被设计来在片段化之后创建测序文库的标准方案来将其完成。在一个实施方式中,该DNA样品可以是平末端的(blunt ended),然后A可以被添加在3’末端。可以添加和连接具有T-突出端的Y-接头。在一些实施方式中,除了A或T突出端之外,可以使用其他的粘性末端(sticky end)。在一些实施方式中,可以添加其他接头,例如环状连接接头。在一些实施方式中,接头可以具有被设计用于PCR扩增的标签。
引物尾部可以改进来自通用标记的文库的片段化DNA的检测。如果文库标签和引物尾部含有同源序列,则可以改进杂合(例如,降低熔解温度(Tm))并且只要引物靶序列的一部分在样品DNA片段中就可以延伸引物。在一些实施方式中,可以使用13或更多种靶特异性碱基对。在一些实施方式中,可以使用10至12种靶特异性碱基对。在一些实施方式中,可以使用8至9种靶特异性碱基对。在一些实施方式中,可以使用6至7种靶特异性碱基对。
因为本发明所提供的方法的说明性实施方式利用了单边多重PCR方法,所以,在文库制备期间在被连接至文库的核酸片段的接头上通常包括一种或多种通用引物结合位点(例如,反向外部通用引物结合位点、反向内部通用引物结合位点)。进一步,本领域的技术人员将会认识到,在文库制备步骤或任何随后的步骤期间,可以添加用于子序列核酸序列确定的测序引物结合位点。此外,在文库制备步骤期间,可以添加唯一或半唯一标识符(UID)来将核酸从样品中分离。
在本领域中已知许多试剂盒和方法用于核酸文库的生成,其包括用于子序列(subsequent)扩增(例如克隆扩增)和用于子序列测序的通用引物结合位点。为了帮助促进接头的连接,文库制备和扩增可以包括末端修复和腺苷酰化作用(即,A尾)。尤其地适合于从小核酸片段(尤其是循环游离DNA)中制备文库的试剂盒可以用于实践本发明所提供的方法。例如,可以从Bio Scientific(Austin,TX)购买的NEXTflex Cell Free试剂盒或NateraLibrary Prep试剂盒(在实施例9中进一步讨论,Natera,San Carlos,CA))。然而,这样的试剂盒通常将被修改,以包括被定制用于本发明所提供的方法的扩增和测序步骤的接头。可以使用商业上可购买的试剂盒(例如在Agilent SureSelect试剂盒(Agilent,CA)中发现的连接试剂盒)执行接头连接。
相应地,作为文库制备的结果,生成的核酸文库包括核酸片段,该核酸片段具有反向外部通用引物结合位点以及任选地用于巢式实施方式的反向内部通用引物结合位点,如本文所讨论。这样的通用引物结合位点被识别并且通常与通用引物互补,其被包括在发明所提供的方法的说明性实施方式的反应混合物中。本文所提供的实施例,说明了通用引物结合位点和通用引物的用途。
用于本发明的一系列的引物,例如反向或正向内部或外部靶特异性引物,在某些实施方式中,包括5、10、15、20、25、50、100、125、150、250、500、1000、2500、5000、10,000、20,000、25,000或50,000个(在范围的低端值上)至15、20、25、50、100、125、150、250、500、1000、2500、5000、10,000、20,000、25,000、50,000、60,000、75,000或100,000个(在范围的高端值上)引物,这些引物中的每一个都结合至一系列的外部靶引物结合位点中的一个,这些位点成覆瓦式跨过靶基因的靶区域。在本发明中,当一系列的引物被成覆瓦式跨过靶基因区域时,该系列中的每一个引物都结合至该系列的引物结合位点中的不同结合位点,其中在一系列之内的引物结合位点通常以1至100个核苷酸间隔开,并且能够在核酸链上在相同的5’至3’方向引发一系列的引物延伸反应,其中来自一系列的第一引物的引物延伸反应产物与被在该系列中的至少一个下一引物结合的靶基因的区域重叠。
在一系列中的引物结合位点可以包括至少2个引物结合位点,这些位点以10、15、20、25、30、40、50、60、70、75、80、90、100、125、150、175或200个(在范围的低端值上)核苷酸至10、15、20、25、30、40、50、60、70、75、80、90、100、125、150、175、200或250个(在范围的高端值上)核苷酸间隔开。在某些实施方式中,在一系列中的引物结合位点包括至少2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、100、125、150、175、200、250、500、1000、1500、10000、1500、2000、2500、3000、4000、5000、10,000、15,000、20,000、25,000或50,000个引物和引物结合位点(在范围的低端值上)至3、4、5、6、7、8、9、10、15、20、25、30、40、50、100、125、150、175、200、250、500、1000、1500、10000、1500、2000、2500、3000、4000、5000、10,000、15,000、20,000、25,000、50,000、60,000、70,000、75,000或100,000个引物和引物结合位点(在范围的高端值上)。在某些说明性的实施方式中,该系列的引物结合位点横跨目标基因的整个靶区域,并且以2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、75、100、125、150、175、200或250个核苷酸(在低端值上)至3、4、5、6、7、8、9、10、15、20、25、30、40、50、75、100、125、150、175、200、250或500个核苷酸(在高端值上)间隔开。
在某些说明性的实施例中,可以基于由结合覆瓦式结合位点的一系列引物产生的预期的扩增子大小,和/或基于被用于覆瓦式PCR的扩增条件,选择这样的引物结合位点间隔。例如,覆瓦式引物结合位点间隔可以是预期的、经验的或实际的平均扩增子长度的10%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%或90%(在范围的低端值上)至20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%或100%(在范围的高端值上)。在某些说明性的实施方式中,覆瓦式引物结合位点间隔处于在本文所提供的发明的方法期间生成的扩增子的平均实际扩增子长度25%至90%。在另外的说明性的实施方式中,覆瓦式引物结合位点间隔处于在本文所提供的发明的方法期间生成的扩增子的平均实际扩增子长度的25%至50%。在另外的说明性的实施方式中,覆瓦式引物结合位点间隔处于在本文所提供发明的方法期间生成的扩增子的实际平均扩增子长度的50%至90%。在本发明所提供的另外的实施方式中,覆瓦式引物结合位点间隔小于在本发明所提供的方法期间生成的扩增子的平均长度。
因此,在本发明所提供的用于检测基因融合的方法中,上述引物范围将帮助确保扩增子通过一定距离横跨融合断裂点,该距离小于或等于所提供的该范围的高端值。例如,在用于融合检测的某些说明性的实施方式中,引物结合位点将在从融合断裂点起的一定距离之内,该距离不大于平均扩增子长度。在用于融合检测的其他的说明性的实施方式中,引物结合位点将在从融合断裂点起的一定距离之内,该距离不大于平均扩增子长度的75%。当在本文中被讨论时,介于引物结合位点之间的间隔或距离,是基于第一引物结合位点的3’端和第二引物结合位点的5’端之间的距离,该第二引物结合位点结合的引物在与结合第一引物结合位点的引物相同的方向上引发并在其下游。
在某些说明性的实施例中,引物结合位点在靶基因的靶区域上以25至200个核苷酸间隔开。在某些说明性的实施例中,引物结合位点在靶基因的靶区域上以25至150个核苷酸间隔开。在某些说明性的实施例中,引物结合位点在靶基因的靶区域上以10至100个核苷酸间隔开。在其他说明性的实施例中,该系列的覆瓦式的靶特异性外部引物结合位点在靶基因上以10至75个核苷酸间隔开。在其他说明性的方法中,该系列的覆瓦式的靶特异性外部引物结合位点在靶基因的靶区域上以15至50个核苷酸间隔开。在涉及引物间隔的此部分中所讨论的引物结合位点可以是本发明的方法的靶特异性引物结合位点中的任一种。例如,所讨论的间隔可以用于正链或负链中的靶特异性外部或内部引物结合位点。
在说明性的实施方式中,本发明所提供的方法是单边巢式多重PCR方法,在本文也称为单边巢式多重PCR方法。因此,该方法通常包括使用巢式引物(即,作为一组内部引物中的一员的内部引物,以及作为一组外部引物中的一员的外部引物)的扩增反应。
本文的实施例3提供了关于设计用于本发明所提供的方法的覆瓦式引物的方法的细节。该引物结合一系列的覆瓦式的引物结合位点,这些位点被间隔跨过靶基因(即,目标基因)的靶区域。如其例证,引物可以被设计用于靶基因区域的正链和/或负链,其最佳的熔解温度(Tm)为55℃至65℃(例如58℃至61℃)(图4-6)。可以设计被设计具有宽松(ΔG-6、ΔG-5、ΔG-4)或严格(ΔG-3)引物组的引物。该宽松组通常将具有更多用引物覆盖的窗口,但也可以潜在地含有引起引物二聚体的有害引物。可以从供应的引物的任何公司(例如IDT(Integrated DNA Technologies,Inc.,San Diego,CA))中订购引物。可以设计引物具有或不具有标签。例如,可以设计外部引物不具有标签,并且可以设计内部引物具有标签,例如,但并不限于,ACACGACGCTCTTCCGATCT(SEQ ID NO:297)。
可以用Primer3生成引物设计(Untergrasser A,Cutcutache I,Koressaar T,YeJ,Faircloth BC,Remm M,Rozen SG(2012)“Primer3-new capabilities andinterfaces.”Nucleic Acids Research 40(15):e115以及Koressaar T,Remm M(2007)“Enhancements and modifications of primer design program Primer3.”Bioinformatics 23(10):1289-91)源代码可在primer3.sourceforge.net上找到)。可以通过BLAST评估引物特异性,并且将其添加至现有引物设计流水线。
可以针对所选择的靶区域生成正(+)链引物。可以在窗口中每20-50bp将靶区域序列进行靶定。每个引物设计窗口可以从该窗口的起点起长20-40bp。可以在两个连续的窗口中搜索引物用于将巢式外部和内部引物进行配对。可以使用Primer3设计外部引物,其靶定每个区域的最右侧5’(或在负链上的最左侧)的坐标。使用窗口的基本原理是,将从每两个窗口中选择内部引物,并且从相同的或先前的(3’)窗口(但不是更远的窗口)中选择匹配的外部引物(遵循下文中所述的规则)。可以使用单边的=真选项的RunPrimer3.java生成引物。该程序的该模式仅生成一组引物,而没有生成配对的负链引物。
可以使用来自ncbi-blast-2.2.29+程序包的BLASTn程序确定引物特异性。任务选项“blastn-short”可以用于针对hg19人类基因组映射引物。如果引物具有小于100个对该基因组的命中,并且最高命中是该基因组的靶互补的引物结合区域以及至少高于其他命中两分(由BLASTn程序界定的分数),则引物设计可以被确定为“特异性”。这样做是为对基因组产生独特的命中,并且从而不具有遍及该基因组的许多其他命中。
可以使用下述规则在每个连续的窗口上将引物分组成内部+外部对(参见例如图5):
a)每覆瓦式窗口都存在外部/内部引物对(示出的30bp窗口(参见例如图3))
b)每隔一个窗口,可以基于Primer3的输出顺序,试验特定的内部引物。
c)如果与已经选择的任何其他内部引物重叠>50%,则可以跳过该引物。
d)可以尝试识别外部引物,使得:
a.对来自当前和之前的窗口(来自内部引物的那个)的外部引物进行试验来寻找引物,使得:
1.引物的第一个碱基位于内部引物的第一个碱基之前(或对于负链引物在其之后)
2.内部引物的与外部引物不重叠的部分为5至20个碱基
3.外部引物是特异性的
4.以Primer3输出给出的顺序测试引物
b.如果(i)失败,则与(i)一样试验,不同之处在于外部引物是非特异性的
c.如果(ii)失败,则与(i)一样试验,不同之处在于距离为3至40个碱基
d.如果(iii)失败,则与(i)一样试验,不同之处在于距离为3至40个碱基,并且外部引物是非特异性的
e.如果(iv)失败,则与(i)一样试验,不同之处在于距离为40至100个碱基
f.如果(v)失败,则与(i)一样试验,不同之处在于距离为40至100个碱基,并且外部引物是非特异性的
e)与其他引物没有相互作用或最小相互作用(分别针对内部和外部引物进行测试)
f)内部引物与正链标签序列ACACGACGCTCTTCCGATCT”(SEQ ID NO:297)没有相互作用
g)外部引物与负链标签序列AGACGTGTGCTCTTCCGATCT(SEQ ID NO:298)没有相互作用
h)可以将最终选择的引物在IGV(Robinson et al.,Integrative GenomicsViewer.Nature Biotechnology 29,24–26(2011)和UCSC浏览器(Sugnet et al.,Thehuman genome browser at UCSC.Genome Res.2002Jun;12(6):996-1006)中可视化,使用bed文件和覆盖映射进行验证。
具有宽松和严格的ΔG(deltaG)阈值(-6与-3)的引物组可以被设计用于58和61种Tm设置中的每一个(包括正链/负链及内部/外部引物,例如每个设计4个池)。可以评估所选择的引物的最终组,来观看它们在每条链上以及在每条链的组合上(称为“双链”)每个靶区域的覆盖度。然后将可接受的引物组用于本发明所提供的方法中,用于巢式多重PCR。
本文的实施例4提供了关于用于识别靶区域及设计覆瓦式引物的方法的细节,用于在癌症相关基因(例如已知具有癌症驱动突变的各种突变的基因,例如TP53基因)中检测突变的方法中的用途。在实施例4的表9-11中提供了引物设计的参数及用于那些参数的设置的说明性的实施例。
如本文所讨论,对于本发明所提供的巢式单边PCR方法,使用了内部引物及外部引物。相应地,在具体的实施方式中,本发明的方法进一步在分析之前包括:通过将外部引物靶扩增子、聚合酶、例如脱氧核苷三磷酸的核苷酸、反向内部通用引物以及一系列的正向靶特异性内部引物进行组合,以形成内部引物扩增反应混合物,该系列的正向靶特异性内部引物包含结合至一系列的覆瓦式的靶特异性内部引物结合位点的5至250个引物,这些位点在靶基因上以10至100个核苷酸间隔开并且每个都被发现在至少一个外部引物靶扩增子上,该系列的正向靶特异性内部引物被配置来引发与该系列的外部靶特异性引物相同方向上的延伸反应;并且使该内部引物反应混合物经受内部扩增条件,以生成使用引物对生成的内部引物靶扩增子,所述引物对包含该正向靶特异性内部引物中的一种以及反向内部通用引物,其中其核酸序列被分析的扩增子包含该内部引物靶扩增子。在某些实施方式中,靶特异性内部引物结合位点与匹配的靶特异性外部引物的结合位点重叠0、1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个核苷酸(在范围的低端值上)至2、3、4、5、6、7、8、9、10、11、12、13、14、15、20或25个核苷酸(在范围的高端值上)。在一个说明性的实施方式中,靶特异性内部引物结合位点与至少一个靶特异性外部引物结合位点重叠5至20个核苷酸。在另外的说明性的实施方式中,靶特异性内部引物结合位点没有与外部引物结合位点重叠。对于单边方法,在PCR的扩增子的相对侧上的通用引物对于使用内部引物的PCR反应与使用外部引物的PCR反应可以相同或不同。
在某些实施方式中,本发明的方法包括形成扩增反应混合物。本发明所提供的反应混合物中的任一种,其本身在说明性的实施方式中形成,是本发明的单独方面。通过将聚合酶、例如脱氧核苷三磷酸的核苷酸、来自由样品(尤其是包含循环DNA的血液的无细胞部分)生成的核酸文库的核酸片段以及一系列的引物进行组合,以形成本发明的反应混合物。该系列的引物可以包括正链和/或负链正向靶特异性外部引物以及正链和/或负链反向外部通用引物,其中该核酸片段包含反向外部通用引物结合位点,其中该系列的正向外部靶特异性引物包含结合至一系列的覆瓦式外部靶引物结合位点的5至250个引物,这些位点在该靶基因上以10至100个核苷酸间隔开,并且每一个靶基因区域都包含500至10,000个核苷酸。在另外的示例性的组合物中,该系列的引物可以包括正链和/或负链正向靶特异性内部引物以及正链和/或负链反向内部通用引物,其中该核酸片段包含反向内部通用引物结合位点,其中该系列的正向内部靶特异性引物包含5至250个结合至一系列的覆瓦式外部靶引物的结合位点,这些位点在靶基因上以10至100个核苷酸间隔开,并且每个靶区域都包含500至10,000个核苷酸。该组合物可以包括直接源于ctDNA样品的核酸片段,该片段跨过基因融合断裂点。
有益于本发明的扩增反应混合物包括在本领域中已知用于核酸扩增(尤其是用于PCR扩增)的组分。例如,反应混合物通常包括脱氧核苷三磷酸、聚合酶和镁。有益于本发明的聚合酶可以包括可以用于扩增反应的任何聚合酶,尤其是在PCR反应中有益的聚合酶。在某些实施方式中,热启动的Taq聚合酶是尤其有益的。在本文所提供的实施例部分中提供了对实践本发明所提供的方法有益的扩增反应混合物(例如K23和AmpliTaq Gold反应混合物(Life Technologies,Carlsbad,CA))作为非限制性实施例。在本文的另一部分中将找到关于PCR反应混合物的更多细节。
用于PCR的扩增(例如温度循环)条件在本领域中是已知的。本发明所提供的方法可以包括导致靶核酸(例如来自文库的靶核酸)的扩增的任何PCR循环条件。在本文的实施例部分中提供了非限制性示例的循环条件。在本文另一部分中可找到更多关于PCR循环条件的细节。
本发明所提供的融合检测的方法的说明性实施方式,应用了使用示例性的Star1和Star2的方案的ctDNA的单边巢式多重扩增。Star1PCR程序是:95℃10min;15x[95℃30sec,63℃10min,72℃2min];72℃7min,4℃维持。Star2PCR程序是:95℃10min;15x[95℃30sec,63℃10min,72℃2min];72℃7min,4℃维持。
本发明的方法的说明性的实施方式,利用了在起始的变性步骤之后的延长的退火和/或延伸和/或组合的退火/延伸时间(例如95℃、5至15分钟),并且利用了循环参数,其包括变性步骤(例如95℃、15至120秒),30至240分钟的延长的退火步骤以及任选地70至75℃(例如72℃)、30至240秒的延伸步骤。退火步骤是在变性步骤之后并且在任选的延伸步骤之前的PCR循环中的步骤。任选地,PCR具有多个阶段(即,多个不同循环参数的组),例如PCR可以是如本文所提供的实施例12中所示的2阶段PCR。相应地,在一个实施方式中,本文所提供的是本发明的方法,其中扩增条件(例如靶特异性外部引物扩增条件)包括至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25或30个PCR循环,其退火步骤为在55、56、57、58、59、60、61、62、63、64或65℃(在范围的低端值上)至60、61、62、63、64、65或70℃(在范围的高端值上)的温度下30、35、40、45、50、55或60分钟(在范围的低端值上)至35、40、45、50、55、60、120、180或240分钟(在范围的高端值上)。在说明性的实施方式中,退火步骤为在58℃至72℃下30至120分钟。在相关的实施方式中,退火步骤的长度为在58℃至65℃下60至90分钟。
在相关的实施方式中,扩增条件包含第一组和第二组,第一组为2、3、4、5、6、7、8、9、10、11、12、13、14或15个循环(在范围的低端值上)至3、4、5、6、7、8、9、10、11、12、13、14、15、20、25或30个循环(在范围的高端值上),第二组为2、3、4、5、6、7、8、9、10、11、12、13、14、15、20或25个循环(在范围的低端值上)至3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、50或60个循环(在范围的高端值上)。在说明性的实施方式中,扩增条件包含2至10个PCR循环,其退火步骤(例如靶特异性外部引物退火步骤)为在40至60℃(例如58℃至65℃)下30至120分钟,并且还包含5至50个PCR循环的第二组,其靶特异性外部引物退火步骤为在55至75℃(例如58℃至72℃)下30至120分钟。在另外的实施方式中,一组靶特异性和/或通用引物中的50%、75%、90%、95%或全部的最高Tm在用于扩增(例如PCR)反应的退火温度之下1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或20度(在范围的低端值上)至2、3、4、5、6、7、8、9、10、11、12、13、14、15、20或25度(在范围的高端值上)。在说明性的实施方式中,该组引物中的至少50%的引物的Tm低于用于PCR反应的退火温度2至10度。
在具有延长的退火步骤或延伸步骤的实施方式中,该延长的步骤也可以是组合的退火/延伸步骤。在本文所提供的一些实施方式中,将包括本发明所提供的引物结合位点间隔中的任一个的实施方式,与包括本发明所提供的延伸的退火条件和/或延伸条件中的任一个进行组合。
在本文的实施例12中所提供的一个额外的惊人结果是,与商用AmpliTaq Gold反应混合物(Life Technologies,Carlsbad,CA)相比,较高离子强度的PCR反应混合物(K23)产生了显著更高百分比的产出,并且由于通过更短的引物进行扩增而具有更大选择性和更少副产物。相应地,在某些实施方式中,本发明所提供的是1X PCR反应混合物,其中离子强度的终浓度为75至1000mM、100至800mM、150至600mM、以及200至400mM。
当在进行PCR时有许多的可能的工作流程;本文提供了对于本发明所公开的方法的一些典型工作流程。本文所概括的步骤并不意为排除其他可能的步骤,也没有暗示本文所述的任何步骤对于正常工作的该方法是必需的。大量的参数变化或其他修饰在文献中是已知的,并且可以被做出而不会影响本发明的实质。
在一些实施方式中,本文所提供的方法可以被用来通过执行覆瓦式多重PCR从而扫描靶基因的突变,所述覆瓦式多重PCR跨过在哺乳动物疾病(例如癌症)中的已知将会突变的靶区域。相应地,在某些实施方式中,本发明所提供的是用于在来自哺乳动物的样品或其部分中检测靶基因中的突变的方法,其中任选地具有重叠序列的外部引物靶扩增子横跨靶基因的靶区域,其中该靶区域可以包括整个基因、基因的所有外显子或其任何片段。例如,长度为0、0.1、0.25、0.5和1.0k个(在范围的低端值上)至1.0、2.5、5和10k个核苷酸(在范围的高端值上)。靶区域可以包括与疾病相关的已知突变。本发明所提供的是一系列的引物,其对成覆瓦式跨过人类p53基因的所有外显子是有效的。对于本发明所提供的扫描靶基因的突变的方法,PCR方法可以是单边(在一边上的靶特异性引物(正向或反向)和在另一边上的通用引物)或双边(即,在两边上的靶特异性引物)。本发明所提供的实施例4,说明了用于检测TP53基因的突变的这样方法的实施例。例如,对于TP53,可以在外显子5至8之内发现靶区域,其在乳腺癌中含有大部分的它的突变(参见表4)。如图所示,为了确保完全的覆瓦式,可以用除了该引物的长度之外的各种读出长度(例如50bp、75bp、100bp、125bp、150bp、175bp或200bp)测试引物靶定覆盖范围。如表4-8中所例证,理想地当考虑两条链时,存在靶基因的靶区域的100%覆盖范围。
在该实施方式的某些实施例中,外部引物靶扩增子具有重叠序列,其覆盖在1、2、3、4、5、6、7、8、9、10、15、20、25、50和75个靶基因(在范围的低端值上)至2、3、4、5、6、7、8、9、10、15、20、25、50、75和100个靶基因(在范围的高端值上)中的每一个上的1、2、3、4、5、6、7、8、9或10个靶区域(在范围的低端值上)至2、3、4、5、6、7、8、9、10、15、20或25个靶区域(在范围的高端值上)。在一个说明性的实施方式中,外部引物靶扩增子具有重叠的序列,其覆盖2至5个靶基因上的2至5个靶区域。在另外的说明性的实施方式中,外部引物靶扩增子具有重叠序列,其覆盖2至10个靶基因上的1或2个靶区域。
在该实施方式的某种实施例中,外部引物靶扩增子和内部引物靶扩增子具有重叠序列,其覆盖在1、2、3、4、5、6、7、8、9、10、15、20、25、50和75个靶基因(在范围的低端值上)至2、3、4、5、6、7、8、9、10、15、20、25、50、75和100个靶基因(在范围的高端值上)中的每一个上的1、2、3、4、5、6、7、8、9或10个靶区域(在范围的低端值上)至2、3、4、5、6、7、8、9、10、15、20或25个靶区域(在范围的高端值上)。在一个说明性的实施方式中,外部引物靶扩增子和内部引物靶扩增子具有重叠序列,其覆盖2至5个靶基因上的2至5个靶基因。在另外的说明性的实施方式中,外部引物靶扩增子具有重叠序列,其覆盖2至10个靶基因上的1或2个靶区域。
在本发明所提供的方法的某些实施方式中,在两条链上以相反的方向执行用于覆瓦式PCR的方法。相应地,在一个实施方式中,该方法进一步包括,除了形成正链外部引物反应混合物并且使其经受正链扩增条件之外,形成负链外部引物反应混合物以及在一些实施方式中的负链内部引物反应混合物;并且使此/这些负链反应混合物经受扩增条件(即,将靶核酸片段进行扩增),并且分析负链外部引物靶扩增子以及在某些实施方式中的负链内部引物靶扩增子中的至少一部分的核酸序列。将会理解的是,将本文对于正链反应混合物、扩增条件以及序列分析的教导应用至负链正如它们应用至正链一样。
在本发明所提供的方法的某些实施方式中,确定了扩增子(例如用于包括巢式PCR反应的方法的内部引物靶扩增子)中的至少一部分序列及在说明性实施例中的整个序列。用于确定扩增子的序列的方法在本领域中是已知的。本领域中已知的测序方法(例如Sanger测序)中的任一种可以用于这样的序列确定。在说明性的实施方式中,例如包括但不限于在MYSEQ(Illumina)、HISEQ(Illumina,San Diego CA)、ION TORRENT(LifeTechnologies,Carlsbad,CA)、GENOME ANALYZER ILX(Illumina)、GS FLEX+(ROCHE 454)中使用的高通量下一代测序技术(在本文中又称为大规模平行测序技术)可以用于对由本发明所提供的方法产生的扩增子进行测序。
高通量基因测序仪服从条形码的应用(即,用区别性的核酸序列标记样品),从而从个体中识别具体的样品,从而允许在DNA测序仪的单次运行中的多个样品的同时分析。在文库制备物(或其他的目标核酸制备物)中的基因组的给定区域被测序的次数的数量(读出的数量),将会与在感兴趣的基因组中的该序列的拷贝数的数量(或在含有制备物的cDNA的情况中为表达水平)成正比。在这种定量测定中可以考虑扩增效率的偏差。
分析
在本发明所提供的方法的执行期间,为由覆瓦式多重PCR创建的扩增子生成核酸测序数据。算法设计工具是可用的,其可以用于和/或适用于分析该数据来确定在一定置信界限之内包括基因融合的突变是否存在于靶基因中,如在本文的实施例中所示。
图11提供了用于分析测序数据的示例性工作流程,该测序数据由使用靶特异性覆瓦式引物的单边巢式多重PCR方法或使用靶特异性覆瓦式引物的双边一步法多重PCR方法生成。可以使用Fastq分析测序数据(任选地用于正链和负链),以及可以将双端读出序列(paired end reads)进行组装。唯一标识符可以用于质量控制中以确认相同扩增子的测序读出序列的准确性。测序读出序列可以使用内部工具被多路解编、被组装以及使用Burrows-Wheeler比对软件的Bwa mem功能被映射至参比基因组,例如hg19基因组(参见LiH.and Durbin R.(2010)Fast and accurate long-read alignment with Burrows-Wheeler Transform.Bioinformatics,Epub.[PMID:20080505])。
可以利用QC度量来改善分析的质量。可以通过分析总读出序列、被映射的读出序列的数量、靶上的被映射的读出序列的数量以及被计算的读出序列的数量,执行覆瓦式扩增统计学的QC。在具体的非限制性的例子中,可以丢弃具有一定数量(例如,2、3、4、5、6、7、8、9或10)或更多的与参比人类基因组错配的读出序列。进一步,可以利用如本领域所知的映射质量分数,并且可以丢弃具有小于某一截点(例如25、20(200分之一的映射不正确)、15或10)的映射质量分数的读出序列。然后,可以计算读出序列的深度,并且可以计算其统计学。
然后如图11所示,分析通过QC分析的读出序列,以检测融合和/或检测SNV。如图11所示,根据该方法是否正在分析数据来检测融合或SNV,可以遵循不同的分析流程。对于融合检测,Bwa mem模式报告了补充比对作为读出序列的比对,其具有解释主要比对(primaryalignment)的映射部分的主要比对。可以存在用于每个主要比对的多个补充比对。通过建立主要-补充比对的配对的链接图,可以发现数据中的断裂点。可以检测到断裂点,因为序列彼此连接太远而不能通过局部突变来解释。它们可以是基因融合或伪迹。
某些说明性的实施方式利用了双端桥分析(paired-end brigde analysis),其中双端读出序列在它们被组装之前先被映射。对于分析测序读出序列可以在双端模式中被映射。如果发现测序的读取序列映射在融合基因上并且它的测序配对图确信地映射在融合伴侣上,那么该序列读出可以被算作是被检测到的融合桥的证据。桥状图可以被产生用于靶区域,并且可以以与补充性读出序列分析相似的方式被报道。可以首先比较和分析一个条形码的桥状读出序列与断裂点读出序列的计数,然后可以对于所有样品构建权值来报道它们。因此,可以验证断裂点的检测。
在检测融合的分析的具体例子中,在BWA将样品的测序读出序列映射至参比人类基因组之后,一些读出序列可以映射至基因组中的两个或更多个不同位点(如下文对于“补充读出序列分析”所讨论的)。这些是初始的起源性融合调用(seeding fusion calls),其可以是真融合调用,或者可以是假阳性。例如,读出序列可以映射至基因的两种同源物,该基因的两种同源物映射至该基因组的不同位点而不是融合事件的两种不同基因。为了帮助区分这些可能性,算法可以创建新的参比序列,其是最初参比基因组的修饰版本,其现在包括可能的融合事件,即建立用于每次调用的供体、受体、融合序列模板。甚至初始没有显示融合比对的读出序列也可以再一次运行通过该分析,该分析使用包括该可能的融合事件的参比基因组的修改版本。当它们被映射至推定的融合序列时,一些最初没有示出与融合伴侣的比对的读出序列现在可以示出比对。如果足够数量的读出序列(作为读出序列的数量或百分比)映射至特定融合事件,无论读出序列是否来自样品中相同的初始核酸片段,那么可以报道该融合。例如,如果来自具有1,000、2,000、2,500、5,000、10,000、20,000或25,000个核酸片段的样品的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、50或100个读出序列映射至融合,无论是否来自相同的起始核酸片段,那么可以报道融合。
相应地,本发明包括用于在来自哺乳动物的样品中检测基因融合的方法,其包括下述步骤:对来自该样品的核酸片段的已知是基因融合的位点的靶区域执行PCR,以生成扩增子;将该扩增子进行测序,以生成关于该核酸片段的序列信息;初始地将该序列信息映射至参比基因组,以确定任何核酸片段是否看上去跨过指示明显的基因融合的融合连接;将该序列信息重新映射至包含该明显的基因融合的融合基因组,其中映射至该明显在该融合基因中的基因融合的核酸片段的数量在截点值之上,指示了基因的融合。
在用于SNV检测的分析的一个具体的实施例中,可以遵循在图11中所示的流程图的SNV分支。首先,对在每一个测序读出序列的位置处检测到SNV的次数的数量进行覆瓦式计数,该测序读出序列来源于该样品中的相同的起始核酸片段。为了帮助对此进行促进,在将唯一标识符(UID)连接至来自样品的核酸片段之后,可以执行扩增反应。因此,可以通过识别及计数UID和片段末端(因为在样品中可以有比“UID”更多的核酸片段),从而执行分析。例如,如果超过来自样品的给出核酸的读出序列的某一百分比(5、10、20、25、30、40、50、60、70、75、80、90、95或99%),则可以调用SNV。这通过图11中的覆瓦式计数程序示出。对于非限制的例子,如果来自初始样品的给定的核酸片段的读出序列的10%揭示了SNV,那么可以对该起始核酸片段调用SNV。
接着,可以对给出的扩增子执行覆瓦式堆积分析(Tiling Pileup analysis),以确定截点是否超出对相同位置报告SNV的扩增子的绝对数或百分比。如果至少某一数量或某一百分比的横跨特定位置的扩增子在该位置报告了SNV(超过了截点),那么对该位置做出SNV的调用。例如,如果至少2、3、4、5、6、7、8、9或10种横跨靶位置的扩增子在该位置报告了SNV,那么对该位置调用该SNV。
靶基因
在示例性的实施方式中本发明的靶基因是癌症相关的基因。然而,本领域的技术人员将会理解,本发明所提供的方法可以用于在任何其他基因上检测相似的突变。癌症相关的基因涉及与癌症的改变风险或癌症的改变预后相关的基因。促进癌症的示例性的癌症相关的基因包括:原癌基因;增强细胞增、侵入或转移的基因;抑制凋亡的基因;以及促血管新生的基因。抑制癌症的癌症相关的基因包括但不限于:肿瘤抑制基因;抑制细胞增殖、侵入或转移的基因;促进凋亡的基因;以及抗血管新生的基因。
突变检测方法的实施方式以基因的区域的选择开始,该区域成为靶标。具有已知的突变和融合点的区域以及人工合成的基因融合(称为融合探针),被用于开发基因融合检测的方法以及用作为了诊断目的的基因融合的指纹图谱(fingerprint)。融合转录子至基因组坐标(即,易位)的COSMIC(癌症中的体细胞突变的目录,Sanger Institute atwww.sanger.ac.uk)数据库可以用于选择基于外显子边界的每一个被报告的融合的靶区域(即序列的范围)。可以识别融合伴侣,其对观测到的用于基因的融合的总数量贡献至少1%。
在示例性的实施方式中的本发明的方法,从1、2、3、4、5、6、7、8、9、10种或所有融合伴侣基因中检测基因融合,该融合伴侣基因选自:AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1。
除了基因融合检测,本发明所提供的方法可以用于实际地检测突变的任何类型,尤其是已知与癌症相关的突变。示例性的多态性或突变可以在以下的基因中的一种或多种中:TP53、PTEN、PIK3CA、APC、EGFR、NRAS、NF2、FBXW7、ERBBs、ATAD5、KRAS、BRAF、VEGF、EGFR、HER2、ALK、p53、BRCA、BRCA1、BRCA2、SETD2、LRP1B、PBRM、SPTA1、DNMT3A、ARID1A、GRIN2A、TRRAP、STAG2、EPHA3/5/7、POLE、SYNE1、C20orf80、CSMD1、CTNNB1、ERBB2、FBXW7、KIT、MUC4、ATM、CDH1、DDX11、DDX12、DSPP、EPPK1、FAM186A、GNAS、HRNR、KRTAP4-11、MAP2K4、MLL3、NRAS、RB1、SMAD4、TTN、ABCC9、ACVR1B、ADAM29、ADAMTS19、AGAP10、AKT1、AMBN、AMPD2、ANKRD30A、ANKRD40、APOBR、AR、BIRC6、BMP2、BRAT1、BTNL8、C12orf4、C1QTNF7、C20orf186、CAPRIN2、CBWD1、CCDC30、CCDC93、CD5L、CDC27、CDC42BPA、CDH9、CDKN2A、CHD8、CHEK2、CHRNA9、CIZ1、CLSPN、CNTN6、COL14A1、CREBBP、CROCC、CTSF、CYP1A2、DCLK1、DHDDS、DHX32、DKK2、DLEC1、DNAH14、DNAH5、DNAH9、DNASE1L3、DUSP16、DYNC2H1、ECT2、EFHB、RRN3P2、TRIM49B、TUBB8P5、EPHA7、ERBB3、ERCC6、FAM21A、FAM21C、FCGBP、FGFR2、FLG2、FLT1、FOLR2、FRYL、FSCB、GAB1、GABRA4、GABRP、GH2、GOLGA6L1、GPHB5、GPR32、GPX5、GTF3C3、HECW1、HIST1H3B、HLA-A、HRAS、HS3ST1、HS6ST1、HSPD1、IDH1、JAK2、KDM5B、KIAA0528、KRT15、KRT38、KRTAP21-1、KRTAP4-5、KRTAP4-7、KRTAP5-4、KRTAP5-5、LAMA4、LATS1、LMF1、LPAR4、LPPR4、LRRFIP1、LUM、LYST、MAP2K1、MARCH1、MARCO、MB21D2、MEGF10、MMP16、MORC1、MRE11A、MTMR3、MUC12、MUC17、MUC2、MUC20、NBPF10、NBPF20、NEK1、NFE2L2、NLRP4、NOTCH2、NRK、NUP93、OBSCN、OR11H1、OR2B11、OR2M4、OR4Q3、OR5D13、OR8I2、OXSM、PIK3R1、PPP2R5C、PRAME、PRF1、PRG4、PRPF19、PTH2、PTPRC、PTPRJ、RAC1、RAD50、RBM12、RGPD3、RGS22、ROR1、RP11-671M22.1、RP13-996F3.4、RP1L1、RSBN1L、RYR3、SAMD3、SCN3A、SEC31A、SF1、SF3B1、SLC25A2、SLC44A1、SLC4A11、SMAD2、SPTA1、ST6GAL2、STK11、SZT2、TAF1L、TAX1BP1、TBP、TGFBI、TIF1、TMEM14B、TMEM74、TPTE、TRAPPC8、TRPS1、TXNDC6、USP32、UTP20、VASN、VPS72、WASH3P、WWTR1、XPO1、ZFHX4、ZMIZ1、ZNF167、ZNF436、ZNF492、ZNF598、ZRSR2、ABL1、AKT2、AKT3、ARAF、ARFRP1、ARID2、ASXL1、ATR、ATRX、AURKA、AUR、AXL、BAP1、BARD1、BCL2、BCL2L2、BCL6、BCOR、BCORL1、BLM、BRIP1、BTK、CARD11、CBFB、CBL、CCND1、CCND2、CCND3、CCNE1、CD79A、CD79B、CDC73、CDK12、CDK4、CDK6、CDK8、CDKN1B、CDKN2B、CDKN2C、CEBPA、CHEK1、CIC、CRKL、CRLF2、CSF1R、CTCF、CTNNA1、DAXX、DDR2、DOT1L、EMSY(C11orf30)、EP300、EPHA3、EPHA5、EPHB1、ERBB4、ERG、ESR1、EZH2、FAM123B(WTX)、FAM46C、FANCA、FANCC、FANCD2、FANCE、FANCF、FANCG、FANCL、FGF10、FGF14、FGF19、FGF23、FGF3、FGF4、FGF6、FGFR1、FGFR2、FGFR3、FGFR4、FLT3、FLT4、FOXL2、GATA1、GATA2、GATA3、GID4(C17orf39)、GNA11、GNA13、GNAQ、GNAS、GPR124、GSK3B、HGF、IDH1、IDH2、IGF1R、IKBKE、IKZF1、IL7R、INHBA、IRF4、IRS2、JAK1、JAK3、JUN、KAT6A(MYST3)、KDM5A、KDM5C、KDM6A、KDR、KEAP1、KLHL6、MAP2K2、MAP2K4、MAP3K1、MCL1、MDM2、MDM4、MED12、MEF2B、MEN1、MET、MITF、MLH1、MLL、MLL2、MPL、MSH2、MSH6、MTOR、MUTYH、MYC、MYCL1、MYCN、MYD88、NF1、NFKBIA、NKX2-1、NOTCH1、NPM1、NRAS、NTRK1、NTRK2、NTRK3、PAK3、PALB2、PAX5、PBRM1、PDGFRA、PDGFRB、PDK1、PIK3CG、PIK3R2、PPP2R1A、PRDM1、PRKAR1A、PRKDC、PTCH1、PTPN11、RAD51、RAF1、RARA、RET、RICTOR、RNF43、RPTOR、RUNX1、SMARCA4、SMARCB1、SMO、SOCS1、SOX10、SOX2、SPEN、SPOP、SRC、STAT4、SUFU、TET2、TGFBR2、TNFAIP3、TNFRSF14、TOP1、TP53、TSC1、TSC2、TSHR、VHL、WISP3、WT1、ZNF217、ZNF703、及其组合。
扩增(例如PCR)反应混合物:
在某些实施方式中,本发明的方法包括形成扩增反应混合物。通常通过将聚合酶、脱氧核苷三磷酸、来自由由样品生成的核酸文库的核酸片段、一系列的正向靶特异性外部引物以及负链反向外部通用引物进行组合,以形成反应混合物。另一个说明性的实施方式的反应混合物包括正向靶特异性内部引物(而不是正向靶特异性外部引物)以及来自使用外部引物的第一PCR反应的扩增子(而不是来自核酸文库的核酸片段)。本发明所提供的反应混合物,其本身形成于说明性的实施方式中,是本发明的单独的一方面。在说明性的实施方式中,反应混合物是PCR反应混合物。PCR反应混合物通常包括镁。
在一些实施方式中,反应混合物包括乙二胺四乙酸(EDTA)、镁、四甲基氯化铵(TMAC)或其任意组合。在一些实施方式中,TMAC的浓度为20至70mM,包括端值。尽管不意味着受任何特定原理的束缚,但可以认为的是TMAC结合至DNA,稳定了双螺旋,增加了引物的特异性,和/或使不同引物的熔解温度相等。在一些实施方式中,TMAC增加了在不同的靶标的扩增产物的量中的均一性。在一些实施方式中,镁(例如来自氯化镁的镁)的浓度为1至8mM。
用于大量靶标的多重PCR的大量引物可以螯合许多镁(在引物中的2个磷酸盐螯合1个镁)。例如,如果使用了足够的引物从而来自该引物的磷酸盐的浓度为~9mM,那么该引物可以将有效的镁浓度减少~4.5mM。在一些实施方式中,EDTA被用于降低可用作为聚合酶的辅因子的镁的量,因为高浓度的镁可以导致PCR错误,例如非靶基因座的扩增。在一些实施方式中,EDTA的浓度将可用的镁的量降低至1至5mM(例如3至5mM)。
在一些实施方式中,pH为7.5至8.5,例如7.5至8、8至8.3、或8.3至8.5,包括端值。在一些实施方式中,例如以10至100mM的浓度(例如,10至25mM、25至50mM、50至75mM或25至75mM,包括端值)使用Tris。在一些实施方式中,这些浓度的Tris中任何一种在7.5至8.5的pH下使用。在一些实施方式中,使用了KCl和(NH4)2SO4的组合,例如50至150mM的KCl以及10至90mM的(NH4)2SO4,包括端值。在一些实施方式中,KCl的浓度为0至30mM、50至100mM、或100至150mM,包括端值。在一些实施方式中,(NH4)2SO4的浓度是10至50mM、50至90mM、10至20mM、20至40mM、40mM至60、或60mM至80mM的(NH4)2SO4,包括端值。在一些实施方式中,铵根[NH4 +]浓度为0至160mM,例如0至50mM、50至100mM、或100至160mM,包括端值。在一些实施方式中,钾离子和铵根([K+]+[NH4 +])的浓度的总和为0至160mM,例如包括端值的0至25mM、25至50mM、50至150mM、50至75mM、75至100mM、100至125mM、或125至160mM。一种示例性的具有[K+]+[NH4 +]=120mM的缓冲液是20mM KCl和50mM(NH4)2SO4。在一些实施方式中,缓冲液包含端值地包括25至75mM Tris、pH 7.2至8、0至50mM KCL、10至80mM硫酸铵以及3至6mM镁。在一些实施方式中,缓冲液包含端值地包括pH 7至8.5的25至75mM Tris、3至6mM MgCl2、10至50mMKCl以及20至80mM(NH4)2SO4。在一些实施方式中,使用100至200个单位/mL的聚合酶。在一些实施方式中,使用100mM KCl、50mM(NH4)2SO4、3mM MgCl2、7.5nM每种在文库中的引物、50mMTMAC以及7ul DNA模板,终体积20uL,pH 8.1。
在一些实施方式中,使用了拥挤试剂(crowding agent),例如聚乙二醇(PEG,例如PEG8,000)或甘油。在一些实施方式中,PEG(例如PEG8,000)的量为0.1至20%,例如包含端值的0.5至15%、1至10%、2至8%、或4至8%。在一些实施方式中,甘油的量为0.1至20%,例如包含端值的0.5至15%、1至10%、2至8%、或4至8%。在一些实施方式中,拥挤试剂允许使用低的聚合酶浓度和/或更短的退火时间。在一些实施方式中,拥挤试剂改善了DOR的均一性和/或降低丢失(未被检测到的等位基因)。
聚合酶
在一些实施方式中,使用了具有校对活性(proof-reading activity)的聚合酶、没有(或具有可忽略)校对活性的聚合酶、或具有校对活性的聚合酶和没有(或具有可忽略)校对活性的聚合酶的混合物。在一些实施方式中,使用了热启动聚合酶、非热启动聚合酶、或热启动聚合酶和非热启动聚合酶的混合物。在一些实施方式中,使用了HotStarTaq DNA聚合酶(参见,例如QIAGEN货号203203)。在一些实施方式中,使用了AmpliTaqDNA聚合酶。在一些实施方式中,使用了PrimeSTAR GXL DNA聚合酶(Takara Clontech,MountainView,CA),这是高保真性的聚合酶,当在反应混合物中有过量的模板时以及当扩增长产物时,其提供了有效的PCR扩增。在一些实施方式中,使用了KAPA Taq DNA聚合酶或KAPA TaqHotStart DNA聚合酶;它们是基于嗜热细菌水生栖热菌(Thermus aquaticus)的单一亚单位、野生型Taq DNA聚合酶。KAPA Taq和KAPA Taq HotStart DNA聚合酶具有5′-3′聚合酶及5′-3′核酸外切酶活性,而不具有3′至5′核酸内切酶(校对)活性(参见,例如KAPABIOSYSTEMS货号BK1000)。在一些实施方式中,使用了Pfu DNA聚合酶;其是来自超嗜热古菌强烈火球菌(hyperthermophilic archaeum Pyrococcus furiosus)的高度热稳定性的DNA聚合酶。该酶催化了在5’→3’方向中核苷酸的模板依赖性聚合反应成双螺旋DNA。Pfu DNA聚合酶也展示了3’→5’核酸外切酶(校对)活性,其使该聚合酶能够校正核苷酸的掺入错误。它没有5’→3’核酸外切酶活性(参见例如Thermo Scientific货号EP0501)。在一些实施方式中,使用了Klentaq1;它是Taq DNA聚合酶的Klenow-片段类似物,它没有核酸外切酶或核酸内切酶活性(参见例如,DNA POLYMERASE TECHNOLOGY,Inc,St.Louis,Missouri,货号100)。在一些实施方式中,聚合酶是PUSHION DNA聚合酶,例如PHUSION High Fidelity DNA聚合酶(M0530S,New England BioLabs,Inc.)或PHUSION Hot Start Flex DNA聚合酶(M0535S,New England BioLabs,Inc.)。在一些实施方式中,该聚合酶是DNA聚合酶,例如High-Fidelity DNA聚合酶(M0491S,New England BioLabs,Inc.)或Hot StartHigh-Fidelity DNA聚合酶(M0493S,New England BioLabs,Inc.)。在一些实施方式中,该聚合酶是T4DNA聚合酶(M0203S,New England BioLabs,Inc.)。
在一些实施方式中,使用了5至600个单位/mL(每1mL反应体积的单位数)的聚合酶,例如包括端值地5至100个单位/mL、100至200个单位/mL、200至300个单位/mL、300至400个单位/mL、400至500个单位/mL或500至600个单位/mL。
PCR方法
在一些实施方式中,热启动PCR被用于在PCR热循环之前减少或防止聚合反应。示例性的热启动PCR方法包括DNA聚合酶的起始抑制、或在该反应混合物达到更高温度之前物理分离的反应组分反应。在一些实施方式中,使用了镁的缓慢释放。DNA聚合酶为了活性而需要镁离子,所以通过结合至化学化合物而从反应中化学地分离镁,并且仅在高温时被释放进入溶液中。在一些实施方式中,使用了非共价结合的抑制剂。在该方法中,肽、抗体或适配子(aptamer)在低温下非共价地连接至酶并且抑制它的活性。在提高的温度的孵育之后,释放抑制剂并且反应开始。在一些实施方式中,使用了冷敏感的Taq聚合酶,例如在低温时几乎没有活性的修饰的DNA聚合酶。在一些实施方式中,使用了化学修饰。在该方法中,分子共价地连接至在DNA聚合酶的活性位点的氨基酸的侧链。在提升的温度下通过反应混合的孵育将该分子从酶中释放。一旦该分子被释放,则该酶被激活。
在一些实施方式中,模板核酸(例如RNA或DNA样品)的量为20至5,000ng,例如包括端值的20至200ng、200至400ng、400至600ng、600至1,000ng、1,000至1,500ng、或2,000至3,000ng。
在一些实施方式中,使用QIAGEN多重PCR试剂盒(QIAGEN货号206143)。对于100x50μl多重PCR反应,该试剂盒包括2x QIAGEN多重PCR反应混合物(提供了3mM终浓度的MgCl2,3x 0.85ml)、5x Q-溶液(1x 2.0ml)和无核糖核酸酶水(2x 1.7ml)。QIAGEN多重PCR反应混合物(MM)含有KCl和(NH4)2SO4的组合以及PCR添加物因子MP,其增加了在模板上的引物的局部浓度。因子MP稳定了特异性结合的引物,允许通过HotStarTaq DNA聚合酶进行有效的引物延伸。HotStarTaq DNA聚合酶是Taq DNA聚合酶的修饰形式,并且在环境温度下没有聚合酶活性。在一些实施方式中,在95℃下通过15分钟孵育激活HotStarTaq DNA聚合酶,可以将其并入任何现有的热循环程序中。
在一些实施方式中,使用1x QIAGEN MM的终浓度(推荐浓度)、7.5nM文库中的每一个引物、50mM TMAC、以及7ul DNA模板,20ul终体积。在一些实施方式中,PCR热循环条件包括:95℃持续10分钟(热启动);96℃持续30秒、65℃持续15分钟、72℃持续30秒的20次循环;随后72℃持续2分钟(最终延伸);然后4℃维持。
在一些实施方式中,使用2x QIAGEN MM终浓度(两倍的推荐浓度)、2nM文库中的每一个引物、70mM TMAC以及7ul DNA模板,20ul总体积。在一些实施方式中,还包括高达4mMEDTA。在一些实施方式中,PCR热循环条件包括:95℃持续10分钟(热启动);96℃持续30秒、65℃持续20、25、30、45、60、120或180分钟、并且任选地72℃持续30秒的25次循环;随后72℃持续2分钟(最终延伸);然后4℃维持。
条件的另外的示例性组,包括半巢式PCR方法。第一次PCR反应使用20ul反应体积,其具有2x QIAGEN MM终浓度、1.875nM文库中的每一个引物(外部正向和反向引物)和DNA模板。热循环参数包括:95℃持续10分钟;96℃持续30秒、65℃持续1分钟、58℃持续6分钟、60℃持续8分钟、65℃持续4分钟、并且72℃持续30秒的25次循环;随后72℃持续2分钟;然后4℃维持。接着,第二次PCR反应中将2ul生成的产物1:200稀释作为输入。该反应使用10ul反应体积,其具有1x QIAGEN MM终浓度、20nM每个内部正向引物以及1uM反向引物标签。热循环参数包括:95℃持续10分钟;96C持续30秒、65℃持续1分钟、60℃持续5分钟、65℃持续5分钟、并且72℃持续30秒的15次循环;随后72℃持续2分钟;然后4℃维持。如本文所讨论,退火温度可以任选地高于一些或所有引物的熔解温度(参见2015年10月20日提交的美国专利申请号14/918,544,该申请的全文以引用方式并入本文)。
熔解/解链温度(Tm)是一半(50%)的寡核苷酸的DNA双螺旋(例如引物)以及它的完全补体解离并且变成单链DNA的温度。退火温度(TA)是运行PCR方案的温度。对于先前的方法,它通常比所使用的引物的最低Tm低5C,因此形成接近所有可能的双螺旋(从而基本上所有引物分子结合模板核酸)。尽管这是高度有效的,但在较低温度时存在更多一定会发生的非特异性反应。具有太低的TA的一种结果是引物可以退火成不同于真正靶标的序列,因为可以容忍内部单碱基错配或部分的退火。在本发明的一些实施方式中,TA比Tm更高,其中在给定时刻仅小部分的靶标具有退火的引物(例如仅~1-5%)。如果这些得到延长,则可以从引物和靶标的退火及解离的平衡移除它们(因为延长快速地将Tm增加至70C以上),并且新的~1-5%的靶标具有引物。因此,通过给予反应用于退火的长的时间,可以在每个循环复制~100%的靶标。
在各种实施方式中,退火温度比非相同的引物中的至少25、50、60、70、75、80、90、95或100%的熔解温度(例如凭经验测定或计算的Tm)高1、2、3、4、5、6、7、8、9、10、11、12、13℃至2、3、4、5、6、7、8、9、10、11、12、13或15℃(在范围的高端上)。在各种实施方式中,退火温度比非相同的引物中的至少25、50、75、100、300、500、750、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000、100,000个或全部的熔解温度(例如凭经验测定或计算的Tm)高1至15℃(例如包括端值的1至10、1至5、1至3、3至5、5至10、5至8、8至10、10至12或12至15℃)。在各种实施方式中,退火温度比非相同的引物中的至少25%、50%、60%、70%、75%、80%、90%、95%或全部的熔解温度(例如凭经验测定或计算的Tm)高1至15℃(例如包含端值的1至10℃、1至5℃、1至3℃、3至5℃、3至8℃、5至10℃、5至8℃、8至10℃、10至12℃、或12至15℃),退火步骤的长度(每个PCR循环)为5至180分钟,例如包含端值的15至120分钟、15至60分钟、15至45分钟、或20至60分钟。
如本文所讨论,在说明性的实施方式中的本发明的方法,是使用覆瓦式引物(即,结合靶基因的靶区域上的一系列的覆瓦式引物结合位点的引物)的单边巢式多重PCR方法。在这样的方法中,可以使用在片段末端处具有接头的靶DNA(例如来自由ctDNA制成的核酸文库的核酸片段)。可以用多组巢式正向引物来执行特异性靶扩增(“STA”),并且使用连接接头标签作为通用反向引物结合位点。然后可以使用一组巢式正向引物和通用反向引物执行第二次STA,该通用反向引物可以与第一次PCR反应所使用的通用引物相同或不同。
本领域技术人员将认识到,可以使用其他扩增(例如PCR)变形来实施本发明的方法,其中说明性的实施方式包括一系列的覆瓦式引物。例如,PCR变形可以包括下述:
半巢式PCR(Semi-nest PCR):在STA 1之后,可以执行包括多组内部巢式正向引物和一种(或几种)标签特异性的反向引物的第二次STA。
完全巢式PCR(Fully-nest PCR):在STA步骤1之后,可能的是用两种带标签(A、a、B、b)的巢式引物执行第二次多重PCR(或降低复杂度的平行多重PCR)。
半巢式PCR(Hemi-nested PCR):可能的是使用在片段末端处具有接头的靶DNA。执行STA,其包含多组正向引物(B)和一种(或几种)标签特异性的反向引物(A)。可以使用通用标签特异性的正向引物和靶特异性的反向引物执行第二次STA。
三重半巢式PCR(Triply hemi-nested PCR):可能的是使用在片段末端出具有接头的靶DNA。执行STA,其包含多组正向引物的(B)和一种(或多种)标签特异性反向引物(A)和(a)。可以使用通用标签特异性正向引物和靶特异性反向引物执行第二次STA。
单边PCR(One-side PCR):可能的是使用在片段末端处具有接头的靶DNA。可以用多组正向引物和一种(或几种)靶特异性反向引物执行STA。
反向半巢式PCR(Reverse semi-nested PCR):可能的是使用在片段末端处具有接头的靶DNA。可以使用多组正向引物和一种(多种)标签特异性反向引物执行STA。
还可以存在更多变形,其是上述方法(例如双重巢式PCR)的简单迭代或组合,其中使用了三组引物。另一个变形是单边半巢式mini-PCR(one-and-half sided mini-PCR),其中也可以使用巢式多组正向引物和一种(或几种)靶特异性反向引物执行STA。
注意,在所有的这些变形中,正向引物和反向引物的同一性可以互换。注意在一些实施方式中,巢式变形可以在没有起始文库的制备和通用扩增步骤的情况下同样良好地运行,该起始文库的制备包含附加的接头标签。注意在一些实施方式中,可以包括额外的PCR循环,其具有额外正向和/或反向引物和扩增步骤,如果需要的是进一步增加DNA分子的百分比,该分子与来自循环肿瘤DNA的靶基因的靶区域对应,则这些额外的步骤可以是尤其有益的。
示例性的多重PCR方法
本发明所提供的覆瓦式PCR方法是多重PCR方法。相应地,在一个方面,本发明特征在于扩增靶标的方法,该靶标与来自核酸文库的核酸片段的样品中的靶基因的靶区域的区段重叠。该方法包括(i)将核酸样品与引物的文库接触,该引物的文库同时杂合至50、100、250、500、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000个引物结合位点(例如内部或外部引物结合位点)至100、250、500、1,000、2,000、5,000、7,500、10,000、15,000、19,000、20,000、25,000、27,000、28,000、30,000、40,000、50,000、75,000和100,000个引物结合位点;其中引物结合位点通常是一系列的覆瓦式引物结合位点。如上文所讨论,引物结合位点的组合通常在靶基因的靶区域上间隔一定距离,该距离等于或小于使用该引物的扩增反应的平均扩增子大小。在一些实施方式中,靶基因座中的至少50、60、70、80、90、95、96、97、98、99、99.5或100%被扩增至少5、10、20、40、50、60、80、100、120、150、200、300或400倍。在各种实施方式中,扩增产物中的小于60、50、40、30、20、10、5、4、3、2、1、0.5、0.25、0.1或0.05%是引物二聚体。在一些实施方式中,该方法涉及PCR,然后对多重扩增子测序(例如高通量测序)以确定突变,例如在靶基因中的基因融合。
在各种实施方式中,使用了长退火时间(如本文所讨论及在实施例12中所例证)和/或低引物浓度。在各种实施方式中,退火步骤的长度为15、20、25、30、35、40、45或60分钟(在范围的低端值上)至20、25、30、35、40、45、60、120或180分钟(在范围的高端值上)。在各种实施方式中,退火步骤的长度(每PCR循环)为30至180分钟。例如,退火步骤可以为30至60分钟,并且每一个引物的浓度可以低于20、15、10或5nM。
在高水平的多路复用处,由于大量引物在溶液中,溶液可以变得粘稠。如果溶液太粘稠,则可以将引物浓度降低至仍足够用于该引物来结合模板DNA的量。在各种实施方式中,使用1,000至100,000种不同引物,并且每一个引物的浓度少于20nM,例如小于10nM或包含端值的1至10nM。
提出了下述实施例,从而为本领域普通技术人员提供如何使用本文所提供的实施方式的完整公开和说明,并且不是旨在限制本发明的范围也不是旨在代表下述的实施例是所有或仅有被执行的实验。关于所使用的数字(例如数量、温度等)已经做出努力来确保准确性,但应该考虑一些实验错误和偏差。除非特别说明,否则部件是按体积计的,温度是摄氏度。应当理解的是,可以做出在所述方法中的变形,而不会改变实施例旨在说明的基本方面。
实施例
实施例1.鉴定用于覆瓦式分析的融合基因断裂点
本文提供了如何设计和选择用于本发明的方法的一系列覆瓦式引物的实施例,尤其是使用单边巢式PCR反应检测基因融合的方法。用于检测基因融合的覆瓦式引物的设计始于将COSMIC融合转录物映射到基因组坐标(即易位)。然而,发现转录水平信息的使用在断裂点位置引起不确定性,因为大部分是内含子的重排(并且因此从转录物中拼接出来)。因此,有必要基于外显子边界来覆盖每个所报告的融合的一系列序列。分子标记的鉴定可以有助于开发用于鉴定基因融合的癌症检测组,并且可以被应用于肺癌之外的其他癌症和疾病,例如造血的ALK、淋巴的组织、甲状腺癌中的RET。
已知所评估的靶基因具有几个融合伴侣。然而,靶断裂点的基因表达是一致的,因为融合产物是功能的增益事件,因此靶基因中断裂点的一致性被用于并入覆瓦式策略。例如,仅对靶基因的基因组DNA设计靶引物。这已经简洁地解释了多个融合伴侣和观察到的伴侣基因的融合断裂点更大。这将需要对三个靶标(ALK、ROS1和RET)中的每一个使<3.6kb的序列成覆瓦式。
或者,靶标和伴侣基因也都是被靶定的,其大体上增加了所需的覆瓦式(参见表1)。表1总结了靶基因及其共同伴侣基因(频率>1%)的断裂点,并总结了用于捕获经报告的融合事件的覆瓦式要求。表1的基因组坐标被用于定义易位测定的覆瓦式坐标。
表1:
基因 ALK ROS1 RET
经报告的NSCLC*发病率 3-7% 1% 1%
靶基因重排长度(碱基) 3393 2937 3520
伴侣基因重排长度(碱基) 110928 3238 78849
总的序列长度(碱基) 114321 6175 82369
基因融合频率至少为1%的显著融合事件的数量 44 2 11
所有基因的经报告的融合在这些坐标内的比例 0.961 1.000 0.983
融合事件的总的数量 1331 12 1921
*非小细胞肺癌(NSCLC)
三个靶基因中的每一个的域断裂点,以及对该基因在COSMIC中报道的融合转录物贡献超过1%的所有伴侣基因(例如,罕见的ALK的伴侣的长尾)如表2所示。基因组坐标来自人的GRCh37。
表2:
COSMIC融合在RNA转录物的水平上被注释;因此,潜在的基因组融合断裂点在大多数时间是未知的。因此,推测给出转录信息的断裂点的范围。COSMIC v70融合数据库的分析鉴定了54,290个经记录的融合。过滤融合事件使得i)用推测出的转录水平融合坐标相对于Ensembl转录物注释对融合进行注释(15,440个融合通过),ii)融合涉及一个且仅一个伴侣(54,063个融合通过),iii)融合不包括新序列的插入(54,236个融合通过),以及iv)对肺癌特异性样品没有限制。过滤后还存在15,182个融合。
接下来,对于每个靶基因,将对该基因观察到的融合的总数贡献至少1%的鉴定为伴侣。然后对于每个融合伴侣,用基因的外显子坐标记录靶标和其伴侣之间的融合的断裂点的最大基因组范围。值得注意的是,还考虑了链(正或负)。如果COSMIC中报道的转录物坐标与Ensembl坐标不匹配,则会发现不一致,并且不会对该转录物报道范围。
作为过滤标准的结果,122个报道的ROS1融合中有90%过滤失败(主要是由于转录物标记不一致)。CD74被识别为最普遍的伴侣。过滤去除了SCL34A2、EZR和GOPC。可以通过进一步的过滤改进来恢复额外的转录物。
实施例2A.合成的融合标准的发展
基因融合探针的设计
如本文所用,融合探针是指人工合成的基因融合,例如CD74:Ros1、NMP1:Alk1(x2)和TPM4:Alk1。第一个基因是伴侣(例如CD74、NMP1和TPM4),后者是靶标(Ros1、ALK1(两组)和Alk1)。将融合探针设计得对应于cfDNA的平均长度,选择160bp的长度。如图1中所示,该设计利用九个跨过该160融合探针“靶标”的覆瓦式引物。
如本文所用,融合探针被设计为跨越“接合点”,其可以指两个融合伴侣之间的融合断裂点。为了进行说明,考虑以下实施例,有两个基因A和B由序列{a_i}和{b_i}组成,在这两个基因之间发生融合。为了产生融合探针,我们首先鉴定每个基因中断裂点的位置,然后构建探针S:
S=a_{i-m},...,a_i,b_j,...,b{j+n}
其中S的总长度为160个碱基。然后指定m和n的值,使得在探针中表示基因A和基因B的不同比例。所公开的方法能够检测血液中的融合,因为它依赖于DNA作为样品材料,其通常以约50bp、约60bp、约70bp、约80bp、约90bp、约100bp、约110bp、约120bp、约130bp、约140bp、约150bp、以及至少约160bp的大约平均长度而被片段化。
实施例2B.合成的融合标准的发展
完成合成的融合探针的设计,从而开发允许检测基因融合谱的系统。基因融合谱的鉴定可以有助于在融合基因组DNA测序后鉴定用于重排的融合基因组序列。使用基因组序列(怀疑具有基因融合)来构建覆瓦式引物模板合成寡核苷酸,其覆瓦式跨过包含作为覆瓦式融合探针的断裂点的每个靶序列,每个长度为160bp。图1说明了构建融合探针的这些合成的寡核苷酸的覆瓦式。
对已公布的易位基因组序列的文献进行综述,以鉴定基因融合产物。这导致选择包含基因融合的六个区域(5个ALK,1个ROS),然后进行生物信息学计算来鉴定相应的基因组位置来统一结果。
在对六个融合区域中的每一个进行基因组位置鉴定之后,通过将探针以8个碱基的间隔覆瓦式跨过融合断裂点,从而将长度为160bp的双链合成寡核苷酸融合探针设计得跨过融合断裂点中的每一个。如图2-3所示,覆瓦式的范围从基因A的152个碱基和基因B的8个碱基开始,以基因A的8个碱基和基因B的152个碱基结束。
表3A和3B提供了所选区域的合成地设计的基因融合探针。列标题如下:表3A:SEQID NO(对应于序列表中的序列)、ID(参考所报道的重排的主要来源)、以及序列(报道的基因组序列填充到均匀长度以用于探针设计)。如果在基因外显子区域中发现特定序列,则表3A中的序列表中的核苷酸符号为大写,而如果在基因内含子区域中发现,则为小写。表3B:基因1(参与融合的第一基因的HUGO基因名称)、基因2(参与融合的第二基因的HUGO基因名称)、SEQ ID NO.、g1(对应于报道的序列内第一基因的基因组坐标)/g2(对应于报道的序列内第二基因的基因组坐标)、开始-cStart1/cStart2(“cStart1”-对应于报道的序列中第一基因的起始坐标,“cStart2”-对应于报道的序列中第二基因的起始坐标)、结束-cEnd1/cEnd2(“cEnd1”-对应于报道的序列中第一基因的末端坐标,“cEnd2”-对应于报道的序列中第二基因的末端坐标)、链-Strand1/Strand21(相对于参考序列(减号表示反向互补链)的链、间隔(cEnd1和cStart2之间的距离(值>0表示新序列,值<0表示微观同源性)、鉴定-Identity1/Identiy2(映射到人参考时的百分比)、得到的转录物(预测所得到的易位是否导致具有致癌活性的转录物(两种形式都可以存在用于平衡易位))、正(预测正链引物设计是否会捕获易位(主要因为单边设计是链特异性的))。
表3A
表3B
实施例3.用于本文提供的覆瓦式方法的引物选择的示例性规则和策略
引物设计
以下是选择引物的一种方法的详细的实施例,这些引物用于在使用引物(这些引物结合跨越靶基因(即目的基因)的靶区域的一系列覆瓦式引物结合位点)的单边巢式PCR方法中使用。引物被设计用于靶基因区域的正链和负链,其中熔解/解链温度(Tm)最佳为58℃和61℃(图4-6)。设计了宽松的(deltaG-6)和严格的(deltaG-3)引物组。宽松组有更多的窗口覆盖着引物,但也可能含有引起引物二聚体的潜在有害引物。引物从IDT(IntegratedDNA Technologies,Inc.,San Diego,CA)订购,外部引物上没有标签,内部引物上有标签ACACGACGCTCTTCCGATCT(SEQ ID NO:297)。
使用Primer3(Untergrasser A,Cutcutache I,Koressaar T,Ye J,FairclothBC,Remm M,Rozen SG(2012)“Primer3-new capabilities and interfaces.”NucleicAcids Research40(15):e115以及Koressaar T,Remm M(2007)“Enhancements andmodifications of primer design program Primer3.”Bioinformatics 23(10):1289-91)源代码可在primer3.sourceforge.net上找到))生成引物设计。通过BLAST评估引物特异性并将其添加到现有的引物设计途径标准中:
1.针对选择的靶区域产生正(+)链引物。靶区域序列在窗口中每20-50bp被靶定一次。每个引物设计窗口从窗口开始长20-40bp。在两个连续的窗口中搜索引物来配对巢式外部引物和内部引物。使用Primer3设计外部引物靶定每个区域的最右侧5'(或负链的最左侧)坐标。窗口的基本原理是,将从每隔一个窗口选择内部引物,并且将从相同的或先前的(3')的窗口(但不会隔的太远)中选择匹配的外部引物(遵循下面描述的规则)。使用单边为真选项的RunPrimer3.java生成引物。该程序的该模式仅产生一组引物而不产生配对的负引物。
2.使用来自ncbi-blast-2.2.29+程序包的BLASTn程序确定引物特异性。任务选项“blastn-short”被用于针对hg19人类基因组映射引物。如果引物对基因组的命中少于100次并且最高命中是基因组的靶互补引物结合区并且至少比其他命中高两分(分数由BLASTn程序定义),则引物设计被确定为“特异性”。这样做是为了对基因组产生独特的命中,并且在整个基因组中没有很多其他命中。
3.使用以下规则将引物在每个连续窗口上分组到内部+外部对(见图5):
a.每个覆瓦式窗口都存在外部/内部引物对(示为30bp窗口(图3))
b.每隔一个窗口,根据Primer3的输出顺序,尝试特定的内部引物。
i.如果与已经选择的任何其他内部部引物重叠>50%,将跳过引物。
c.试图鉴定外部引物,使得:
i.对来自当前和之前的窗口(来自内部引物的那个)的外部引物进行尝试以找到引物,使得:
1.引物的第一个碱基位于内部引物的第一个碱基之前(或对于负链引物在其之后)
2.内部引物的与外部引物不重叠的部分为5-20个碱基
3.外部引物是特异性的
4.按Primer3输出给出的顺序测试引物
ii.如果(i)失败,则与(i)一样试验,不同之处在于外部引物是非特异性的,
iii.如果(ii)失败,则与(i)一样试验,不同之处在于距离为3至40个碱基
iv.如果(iii)失败,则与(i)一样试验,不同之处在于距离为3至40个碱基以及外部引物是非特异性的
v.如果(iv)失败,则与(i)一样试验,不同之处在于距离为40至100个碱基
vi.如果(v)失败,则与(i)一样试验,不同之处在于距离为40至100个碱基以及外部引物是非特异性的
d.与其他引物的相互作用没有或最小(分别针对内部和外部引物进行测试)
e.内部引物与正链标签序列“ACACGACGCTCTTCCGATCT”(SEQ ID NO:297)无相互作用
f.外部引物与负链标签序列AGACGTGTGCTCTTCCGATCT(SEQ ID NO:298)无相互作用
g.最终选择的引物在IGV(James T.Robinson,Helga Thorvaldsdóttir,WendyWinckler,Mitchell Guttman,Eric S.Lander,Gad Getz,Jill P.Mesirov.IntegrativeGenomics Viewer.Nature Biotechnology 29,24–26(2011))和UCSC浏览器((Kent WJ,Sugnet CW,Furey TS,Roskin KM,Pringle TH,Zahler AM,Haussler D.The human genomebrowser at UCSC.Genome Res.2002 Jun;12(6):996-1006)中显示,使用bed文件和覆盖映射进行验证。
针对58和61个Tm设置中的每一个,设计具有宽松的和严格的deltaG阈值(-6对-3)的引物组(包括正/负链和内部/外部引物,每个设计4个池)。评估最终的一组选择的引物,来观察它们在每条链上的、以及每条链的组合上(称为“双链”)每个靶区域的覆盖率。
实施例4.用于识别卵巢癌中TP53的覆瓦式标靶区域的靶区域和引物的示例性方法
以下提供了如何设计引物用于本发明的方法的实施例,所述方法用于检测已知发生各种突变的癌基因区域中的癌基因突变。在该实施方案中,突变通常不是基因融合。如上所述设计引物。引物靶区域包括以下标准:包含编码外显子,其包含在TCGA卵巢研究TP53基因和COSMIC数据库中发现的95%的复发SNV和小的插入缺失。TCGA和COSMIC测序仅针对TP53的外显子区域。在TCGA中有316名患者,而在COSMIC中有233名患者,表4中显示了具有突变(SNV+小的插入缺失)的患者数量。对于TCGA患者队列,95.4%的患者在这些靶标中具有突变。
表4:TP53的选择的靶区域
还包括在TCGA中未测试的UTR区域,从而测试UTR区域中是否存在另外的突变,即使它们未被外显子组测试。文献表明,3'UTR上有潜在的诊断性的microRNA改变突变(Li etal.“Single nucleotide variation in the TP53 3′untranslated region in diffuselarge B-cell lymphoma treated with rituximab-CHOP:a report from theInternational DLBCL Rituximab-CHOP Consortium Program”,Blood 121(22):4529-40,2013)。
针对四个额外的基因的靶突变以及TP53的外显子5至8测试引物靶标覆盖率,所述TP53包含卵巢癌中的大部分突变(表5)。除引物外,用75bp和100bp读出序列测试覆盖率(只有插入被计入可用的覆盖范围)。表6-8提供了覆盖数据。表9-11提供了Primer3的示例性引物设计标准。
表5:其他靶基因区域
chr 开始 结束 基因_区域
chr12 25,398,280 25,398,285 KRAS_t1
chr3 178,936,081 178,936,094 PIK3CA_t1
chr3 178,952,084 178,952,085 PIK3CA_t2
chr10 89,692,903 89,692,905 PTEN_t1
chr10 89,717,715 89,717,717 PTEN_t2
chr10 89,720,816 89,720,818 PTEN_t3
chr7 140,453,135 140,453,145 BRAF_t1
chr17 7,579,300 7,579,600 TP53_t2s
chr17 7,578,170 7,578,560 TP53_t3s
chr17 7,577,490 7,577,620 TP53_t4s
chr17 7,576,840 7,577,160 TP53_t5s
chr17 7,573,980 7,574,040 TP53_t6s
表6:针对靶区域的正链设计覆盖范围
表7:针对靶区域的负链设计覆盖范围
表8:靶区域的组合设计覆盖范围
常见设计参数:
表9:RunPrimer3.java ini文件
表10:Primer-3配置文件
表11:其他设计参数
实施例5.具有靶特异性覆瓦式引物的示例性单边巢式多重PCR方法
基于引物相容性的计算机分析,产生多重的覆瓦式引物池(80-90个引物/池(没有配对的负链引物的单向正链引物))。考虑因素包括:将重叠的扩增子分成单独的引物池、最小化引物二聚体形成的可能性、以及确保单个池中鸟嘌呤、胞嘧啶(GC)含量的相似性。以等摩尔量合并引物。
在第一轮扩增中分别扩增外部正链引物池和合并的外部负链引物池。为了扩增合并的正或负链引物,以下PCR条件用于50uL反应体积:1.25单位的PrimeSTAR GXL DNA聚合酶、1-X PrimeSTAR GXL反应缓冲液(均来自Clonetech)、200uM的每种dNTP、25nM的每种特异性正或负链引物、2.5μM的通用反向引物和1μg的扩增文库作为模板。或者,也可以使用非扩增文库。该文库是双链DNA,用衔接子连接到DNA链的每个末端。第一轮PCR扩增在以下条件下进行:98℃1分钟、15x[98℃10秒、63℃15分钟、68℃1分钟]、68℃2分钟、4℃保存(PCRNo.1)。扩增产物在水中1:200稀释,并将2μl作为模板加入第二轮PCR扩增反应(总体积10μl)中。图6A说明在一侧用靶特异性引物和通用反向引物进行的第一轮PCR扩增反应。
随后使用第一轮扩增(PCR No.1)产生的扩增子,使用合并的内部正链引物池和合并的内部负链引物池分别进行第二次巢式PCR扩增。合并的内部正链引物和合并的内部负链引物池的第二轮PCR扩增循环包含:0.25单位的PrimeSTAR GXL DNA聚合酶、1-XPrimeSTAR GXL反应缓冲液、200uM的每种dNTP、每种特异性内部正链引物10nM或每种特异性内部负链引物10nM、1μM通用反向引物、以及2ul稀释的来自第一次扩增轮次的外部正链引物扩增产物或负链扩增产物。第二轮PCR扩增在以下条件下进行:98℃1分钟、15x[98℃10秒、63℃15分钟、68℃1分钟]、68℃2分钟、4℃保存(PCR No.2,巢式)。图6B说明在一侧用靶特异性引物和通用反向引物进行的第二轮巢式PCR扩增反应。在一侧上具有覆瓦式靶特异性引物的巢式PCR的工作流程示于图7A-7B中。
扩增产物被条形码化。进行一轮测序,每个样品具有大致相等数量的读出序列。
表12显示了使用不同文库输入浓度分析模拟cfDNA样品的测序结果。对于正链设计(图8A)和负链设计(图8B)显示了读出序列深度(DOR)均匀性,其中每个池具有约80-90个引物汇集并覆瓦式跨过基因组的靶区域。图8C说明了覆盖的均匀性,显示了用整个TP53基因的正和负链引物设计获得的组合覆盖度。图11提供了可用于检测任何基因中的SNV的示例性分析流程,包括基于高通量测序数据(例如在该实施例中产生的数据)的TP53基因(见右侧“SNV检测”)。在本说明书中提供了关于如何根据图11的方法执行该SNV检测分析的细节。
表12:使用不同输入量的血浆样品的测序结果
*有用的TP53读数的总分数(例如,94.6x 56.9/100=53.5%)
实施例6.具有靶特异性覆瓦式引物的示例性单边巢式一步多重PCR方法
基于引物相容性的计算机分析,产生多重的覆瓦式引物池(没有配对的负链引物的正链引物)。考虑因素包括:最小化引物二聚体形成的可能性并确保池中鸟嘌呤+胞嘧啶(GC%)含量的相似性。以等摩尔浓度合并引物。
为了用合并的引物扩增,以下PCR条件用于10uL反应体积:0.25单位的PrimeSTARGXL DNA聚合酶、1X PrimeSTAR GXL反应缓冲液(均来自Clonetech)、200uM的每种dNTP、10nM的每种引物、1μM通用反向引物和1ug扩增文库作为模板。或者,也可以使用非扩增文库。该文库是双链DNA,用衔接子连接到DNA链的每个末端。PCR扩增在以下条件下进行:98℃1分钟、15x[98℃10秒、63℃15分钟、68℃1分钟]、68℃2分钟、4℃保存。然后在随后的PCR步骤中对扩增产物进行条形码化并测序。进行一轮测序,每个样品具有大致相等数量的读出序列。
实施例7.在两侧具有覆瓦式靶特异性内部引物的示例性PCR
基于引物相容性的计算机分析,产生多重的覆瓦式引物池(80-90个引物/池(没有配对的负链引物的单向正链内部引物))。考虑因素包括:将重叠的扩增子分成单独的引物池、最小化引物二聚体形成的可能性、以及确保单个池中鸟嘌呤、胞嘧啶(GC)含量的相似性。以等摩尔量合并引物。
将含有内部正和内部负链引物池的两个PCR反应分别扩增,其中每个反应中池中的每个引物具有标签和通用反向引物。以下PCR条件用于50uL反应体积:1.25单位的PrimeSTAR GXL DNA聚合酶、1-X PrimeSTAR GXL反应缓冲液(均来自Clonetech)、200uM的每种dNTP、25nM每种特异性正或负链引物、2.5μM通用负链引物和1ug扩增文库作为模板。该文库是双链DNA,用衔接子连接到DNA链的每个末端。应注意,如果起始DNA的量相对较高,例如剪切基因组DNA,则起始DNA不是文库格式。第一轮PCR扩增在以下条件下进行:98℃1分钟、15x[98℃10秒、63℃15分钟、68℃1分钟]、68℃2分钟、4℃保存。扩增产物在水中1:200稀释。将2μl稀释的扩增产物作为模板加入第二轮PCR扩增反应(总体积10μl)中。图6A说明在一侧用靶特异性引物和通用反向引物进行的第一轮巢式PCR扩增反应。扩增产物被条形码化。进行一轮NGS测序,每个样品具有大致相等数量的读出序列。分析测序数据以鉴定确定性癌症突变或融合。
假设所有引物设计均有效,则可以对引物插入物计算出100bp的覆盖率,使其在整个TP53区域内可视化,并关注特定的外显子。
实施例8.通过使用覆瓦式基因特异性引物的PCR检测基因融合
图9A-9B说明了所公开的三种检测基因融合的方法。在一侧使用靶特异性引物的单边巢式多重PCR覆瓦式方法中,制备具有通用反向引物的外部和内部引物的多重PCR池,以提供用于跨染色体断裂点并因此跨基因融合进行测序的扩增子(图9A上图Star1-Star2)。如果没有断裂点并且因此没有基因融合,则在测序时仅读取野生型基因。在单边多重PCR方法中,它也在一侧使用靶特异性引物,并用通用反向引物的DNA引物的多重PCR池,用于跨染色体断裂点并因此跨基因融合进行测序(图9B)。同样,如果没有断裂点并且因此没有基因融合,则在测序时仅读取野生型基因。在具有靶特异性覆瓦式引物方法的两侧一步多重PCR中(图9A下图OneSTAR),如果基因融合已经发生,则将存在跨越断裂点的扩增PCR产物以通过测序进行读取。但如果没有基因融合,则没有测序读出,因为在左侧和右侧引物靶标的区域中没有扩增读数。使用160bp的融合探针进一步测试第一和第三种方法。
用于检测基因融合的具有靶特异性覆瓦式引物的单边巢式多重PCR方法如下进行。
合并的外部正链引物池和合并的外部负链引物池分别用于PCR扩增反应,如合并的巢式内部正链引物和合并的内部负链引物。为了扩增两个外部靶特异性引物池中的每一个,以下PCR条件用于20uL反应体积:具有200uM的每种dNTP的1x Master Mix、1-X MasterMix反应缓冲液、60-90+个引物的池中25nM的每种特异性外部引物-或60-90+个引物的池中25nM的每种特异性负链引物-、2.5μM通用反向引物和4uL稳定的文库作为模板。该文库是双链DNA,用衔接子连接到DNA链的每个末端。第一轮PCR扩增在以下条件下进行:95℃10分钟、15x[95℃30秒、63℃10分钟、72℃2分钟]、72℃7分钟、4℃保存。扩增产物在水中1:20稀释,并将2μl作为模板加入到第二轮巢式PCR扩增反应(10μl总体积)中。72℃?;
合并的内部正链巢式靶特异性引物池和合并的内部负链巢式靶特异性引物池分别用于PCR扩增。合并的内部巢式靶特异性引物的第二轮PCR扩增循环包含具有200uM的每种dNTP的1x Master Mix、1x Master Mix反应缓冲液、60-90+个引物的池中40nM的每种特异性内部正链引物-或60-90+个引物的池中25nM的每种特异性负链引物-、1μM通用反向引物和2μl稀释的外部正链引物扩增产物或外部负链引物扩增产物。来自使用外部正链引物池的第一轮PCR的扩增子与内部正链巢式靶特异性引物池一起使用,并且来自使用外部负链引物池的第一轮PCR的扩增子与内部负链巢式靶特异性引物池一起使用。第二轮PCR扩增在以下条件下进行:95℃10分钟、15x[95℃30秒、63℃10分钟、72℃2分钟]、72℃7分钟、4℃保存。
来自第二巢式PCR扩增反应的扩增产物在10uL反应体积中进行条形码化,所述反应体积包含1x Qiagen Master Mix、0.5uM Plus Strand Barcode、0.5uM Minus strandBarcode、来自第二轮PCR扩增的1uL扩增产物与合并的内部引物1:20稀释。条形码反应为95℃10分钟、12x[95℃30秒、62.5℃3分钟、72℃2分钟]、72℃7分钟、4℃保存。在条形码化之后,反应被合并、纯化并进行一次测序,每个样品具有大致相等数量的读出序列。
通过单边多重PCR的TMP4-ALK可视化的结果在图10A中示出。在顶部轨道测序读出上显示野生型ALK单边巢式多重PCR,并且在下部轨道测序读出上显示TPM4:ALK_9断裂点。很明显,融合探针跨过融合边界,而ALK野生型扩增产物不跨过断裂点(在断裂点的覆盖范围为33,855读出序列,野生型为34)。
通过单边多重PCR的NPM1-ALK_9可视化的结果在图10B中示出。在顶部轨道测序读出上显示野生型ALK单边巢式多重PCR,并且在下部轨道测序读出上显示TPM1-ALK_9断裂点。很明显,融合探针跨过融合边界,而ALK野生型扩增产物不跨过断裂点(在断裂点的覆盖范围为12,437读出序列,而野生型为33)。
如下进行使用用于检测基因融合的靶特异性覆瓦式引物的双边一步多重PCR方法:
将合并的内部正链靶特异性引物池和合并的内部负链靶特异性引物池组合,并扩增以检测CD74_ROS1_13融合。合并的内部正链和负引物的PCR扩增轮包含具有200uM的每种dNTP的1x Master Mix、1x Master Mix反应缓冲液、50nM每种特异性内部正链和负链引物、以及4uL稳定的文库,总共10uL体积。PCR扩增在以下条件下进行:95℃10分钟、30x[95℃30秒、63℃10分钟、72℃30秒]、72℃2分钟、4℃保存。
将扩增产物在10uL反应体积中进行条形码化,所述反应体积包含1x QiagenMaster Mix、0.5uM Plus Strand Barcode、0.5uM Minus strand Barcode、1uL OneSTAR扩增产物,以10μL总体积稀释为1:20。条形码反应为95℃10分钟、12x[95℃30秒、62.5℃3分钟、72℃2分钟]、72℃7分钟、4℃保存。在条形码化之后,反应被合并、纯化并进行一次测序,每个样品具有大致相等数量的读出序列。
通过具有靶特异性覆瓦式引物的双边一步多重PCR的CD74_ROS1_13可视化的结果在图10C中示出。通过具有靶特异性覆瓦式引物的双边PCR的野生型CD74在下部轨道测序读出上指示,并且CD74_ROS1_13断裂点显示在上部轨道测序读出上。很明显,融合探针跨过融合边界,而CD74野生型扩增产物不跨过断裂点(断裂点的覆盖率为17,386读出序列,野生型为4)。
数据分析
补充读出序列分析:
对于上述分析,如下进行比对:使用配对末端分析组装来自两条链(正fast1和负fast1)的测序读出。使用BWA Aligner程序将组装的序列映射到没有测试融合的公众可获得的参考基因组。BWA Aligner程序报告补充比对作为具有主要比对的读出序列的比对,其可以解释主要比对的未映射部分。有时每个主要比对有多个补充比对。通过构建主要-补充比对的链接图,发现了数据中的断裂点。如本文所用,断裂点是指两个序列的融合,否则它们彼此之间的距离太远而不会被连接,使得它们的融合不能通过局部突变来解释。在映射数据中识别的断裂点是基因融合或是伪影。背景噪声由负样品确定并消除。断裂点是通过确定断裂点读出序列的总数是否超过截止值来鉴定的。
初始的或种子融合细胞的进一步分析可以通过基于如图11中所示的接种融合细胞构建供体、受体融合模板来进行。然后可以将读出序列重新映射到供体、受体融合模板以代替没有融合的公众可获得的参考基因组。
配对末端桥分析
测序读出可以以配对末端模式进行映射,其中每个测序链分开映射,而不是它们在配对末端后分析中组合后再进行。如果测序读出被发现映射到一个融合基因上并且其测序配对图可靠地映射在融合伴侣上,则可以将序列读出序列作为检测到融合桥的证据。可以为靶区域生成桥图,并且桥图的报告类似于补充读出序列分析。可以首先分析和比较一个条形码的桥读出序列与断裂点读出序列的计数,然后可以构建度量以报告所有条形码。因此,可以验证断裂点的检测。
实施例9融合的单边PCR覆瓦式检测以评估检测的De Novo极限
进行巢式单边PCR覆瓦式方法以检测基因融合并评估该方法的检测极限。该实验集中于EML4-ALK、TPM4-ALK和CD74-ROS1融合,并使用de-novo检测分析算法测试在低输入百分比下这些基因之间的几种特异性重排的检测。在通过PCR扩增产生的两个独立基因融合构建体和从融合细胞系产生的单体DNA上进行滴定系列,然后使用本发明的巢式单边覆瓦式PCR实施方案测量检测到的融合,以及de novo融合检测算法。
方法
产生一系列合成多核苷酸以模拟体内部循环DNA中发生的核酸片段,其包括来自已知遗传融合断裂点的已知融合伴侣基因的核酸序列。为了产生模拟TPM4:ALK和CD74:ROS1融合事件的合成多核苷酸,在标准PCR条件下使用表13中所示的引物对具有指定融合序列的合成寡核苷酸模板进行PCR扩增。得到的扩增片段以每个输入百分比用于下面的滴定实验。
表13用于Spike PCR的引物
使用HS核酸定量试剂盒(Thermo Fisher,Carlsbad,CA)对融合探针进行定量,并在1ng/μl野生型单体DNA中稀释。将用微球菌核酸酶(MNase)消化的H2228融合细胞系DNA纯化成单体DNA(AG1677868ng/ul(B-淋巴细胞系),Coriell Institute for MedicalResearch,Camden,New Jersey,USA)。用NEB片段酶试剂盒(NEB,Ipswich,MA)将H2228融合细胞系基因组DNA(gDNA)片段化。在生物分析仪(Agilent Technologies,Santa Clara,CA)上对片段化和单体H2228融合细胞系DNA进行质量控制测定(QC)。使用用于核酸定量的dsDNA BR测定试剂盒(Thermo Fisher,Carlsbad,CA)对片段化和单体H2228融合细胞系DNA和野生型细胞系单体DNA(AG16778 68ng/ul)进行定量。共制备了27个样品。如上所述,制备两个融合探针,其中一个使用通过用上表13中的CD74:ROS1引物扩增模板DNA产生的扩增子来制备,另一个通过用表13中的TPM:ALK引物扩增模板DNA来制备。将两个融合探针扩增子分别以10%、1%、0.5%、0.1%和0.05%的输入添加至50,000个拷贝的野生型DNA(总共10个样品,5个样品/探针)。将单体H2228DNA以100%(10,000个拷贝)、10%、1%、0.5%、0.1%和0.05%的量加入到50,000个拷贝的野生型DNA中,一式两份(形成总共12个样品)。三个阴性样品含有单体DNA(50,000个拷贝)。值得注意的是,对于H228,假定细胞系对于基因融合是杂合的,其将可检测的百分比减半。
简而言之,使用Natera文库制备试剂盒(Natera,San Carlos,CA)制备来自上述公开的各种DNA模板样品的核酸文库。文库制备试剂被用于将无细胞DNA(cfDNA)片段转化到扩增的DNA分子文库中,每个DNA分子由侧翼为特定合成衔接子DNA的原始cfDNA序列组成。使用聚合酶将cfDNA片段的3'或5'突出部分转化为平末端,然后将单个3'A核苷酸添加至平末端的cfDNA片段以增强衔接子的退火和连接。合成的衔接子序列与A尾cfDNA片段两端的单个3'T核苷酸连接。然后使用与衔接子互补的正向和反向引物,通过PCR对用文库制备试剂产生的连接有接头的文库进行。PCR扩增在以下条件下进行:95℃2分钟、9x[95℃20秒、55℃20秒、68℃20秒]、68℃2分钟、4℃保存。使用Agencourt Ampure珠纯化PCR产物。纯化的cfDNA文库以-10℃至-30℃保存在DNA悬浮缓冲液(10mM Tris,pH 8.0,0.1mM EDTA)中。
使用LabChip DNA分析仪器(PerkinElmer,Waltham,MA)进行文库的质量控制。通过使用一系列的148个正向靶特异性外部引物和反向外部通用引物进行称为“Star1”的第一PCR来进行多重巢式单边PCR反应,以产生外部引物靶扩增子。然后,通过使用一系列的148个正向靶特异性内部引物和反向内部通用引物扩增外部引物靶扩增子中的一部分来进行称为“Star2”的第二次PCR。
然后通过对27个样品进行条形码PCR反应,以将条形码添加到内部引物靶扩增子中。通过组合来自27个样品中的每一个的2ul来制备用于内部引物靶扩增子的测序的合并样品。使用Qiagen PCR纯化试剂盒纯化测序样品,并使用Qubit BR定量。使用HiSeq 2500系统和TruSeq Rapid SBS试剂盒(200循环和50循环)(Illumina,San Diego,CA)对样品进行测序(100bp配对末端和单指数)。基于148次测定计算预期的平均DOR为~37,500个读出序列/测定,其中总共300,000,000个读出序列中的50%为靶读出序列、150,000,000个靶读出序列并且5,500,000个读出序列/样品。下面更详细地讨论该方法。
表14用于滴定的探针序列
STAR1方案:形成单边外部PCR反应混合物,其包括以下:25nM的每个融合1外部池引物(正向靶特异性外部引物)(见图13A-13H,用于该实验的靶特异性覆瓦式外部ALK和ROS引物的列表)、2.5μMRStar2_C3_Loop(外部通用引物)、4μl稳定的文库(核酸文库)加入到内部反应混合物中,有时在本文中称为K23主混合物。K23主混合物在最终的PCR反应混合物中包含以下浓度:75mM Tris pH 8.0(TekNova T1080)、5mM MgCl2、30mM KCl、60mM(NH4)2SO4、150U/mL AmpliTaq Gold360、每种dNTP(N0447S)0.2mM、以及3%甘油。随后的PCR扩增方案是:95℃10分钟、15x[95℃30秒、63℃10分钟、72℃2分钟]、72℃7分钟、以及4℃保存。
STAR2方案:形成单边内部PCR反应混合物,其包括以下:40nM的每个融合1内部池引物(正向、靶特异性内引物)(见图13A-13H,用于该实验的靶特异性覆瓦式内部ROS和ALK引物的列表)、1μMRStar2(内部通用引物)、2μlStar1产物(外部引物靶扩增子)1:20稀释。随后的PCR扩增方案是:95℃10分钟、15x[95℃30秒、63℃10分钟、72℃2分钟]、72℃7分钟、以及4℃保存。
条形码方案:形成以下条形码反应混合物:1X Qiagen Master Mix(Qiagen,Germany)、0.5μM F-BC条形码、以及1μlStar2产物(1:20稀释的内部引物靶扩增子)。随后的条形码PCR扩增方案是:95℃10分钟、12x[95℃30秒、62.5℃3分钟、72℃2分钟]、72℃7分钟、以及4℃保存。
样品合并和测序:通过组合来自27个样品中的每一个的2μl来制备测序池。该池使用Qiagen试剂盒进行PCR纯化,并使用BR Qubit定量。该池在一个HiSeq2500 100bp配对末端上运行,单索引运行。使用Qubit BR测定池浓度。该池浓度为377nM。
如实施例8所述进行分析。
结果
使用包含在本文的单边巢式多重覆瓦式PCR方法中的内部和外部覆瓦式ALK和ROS引物分析引物计数,产生以下读数:总共198,695,383个bamreads、总映射读数176,491,830、总映射靶读数为101,947,168、~89%映射读数、~51%映射靶读数、以及61的均匀性90th/10th百分位数。因此,总读数的约50%映射为靶读数,这与其他类似实验一致。对于均匀性也是如此,对于该融合池,均匀性约为60%。
基于针对各个引物检测的总融合读出序列,计算融合百分比。计算一个引物和多个cigarstrings的融合读出序列的总和并除以总引物计数。这包括野生型读出序列和对于替代映射太短的读出序列(断裂点后最小长度为31bp),这可以降低检测到的探针的融合百分比,其中引物位点远离融合断裂点。
使用单体H2228融合细胞系DNA,滴定EML4-ALK覆瓦式测定。值得注意的是,数据是针对映射到EML4的读出序列而预选的,所有“假阳性融合”都被排除在外。
表15.单体EML4_ALK的融合输入、检测、未指定的读出序列、融合读出序列和总引物计数。
如表15所示,来自融合细胞系的纯单体DNA(100%)达到70%的融合检测。有大约5000个未指定的读出序列,这些读出序列太短而不能映射到EML4和野生型ALK读出序列。值得注意的是,100%野生型样品具有对应于引物ALK_r201_i的平均4400个读出序列,这证明了未指定的读出序列是野生型读出序列的可能性。
不受理论限制,怀疑用于融合读出序列的扩增子产生具有更高的效率(融合读出序列17,000,野生型读出序列4400),因为融合基因的下游没有其他引物。另一方面,为了扩增野生型区域,引物必须与下游引物竞争,见图12。
通过引物ALK_r201_i检测EML4-ALK融合,并且根据百分比输入产生大小在62bp和155bp之间、具有1-60个cigarstrings的产物。断裂点在引物末端后11bp(总ALK扩增子长度为31bp)。在EML4外显子6-内含子6和ALK内含子19-外显子20之间检测到间断,其将EML4-外显子6与外显子20融合,产生变异体3。该变异体先前由Rikova等人(2007)对于H2228细胞系报道。
来自H2228细胞系的片段化DNA导致在100%融合样品中检测到20%的融合。与单体H2228DNA(其产生70%的融合读数)相比,这是一个低得多的百分比。对于所测试的100%片段化DNA样品、引物ALK_r201_i的读出序列数为~40,000,这比单体DNA样品(~17,500)高2倍以上。然而,这些样品未能显示出类似的性能。
使用ROS覆瓦式引物,未按预期量检测到滴定的ROS-CD74探针,见表16。在该实验中检测到非常低的百分比。有人认为其原因是成功映射该融合体所需的长扩增子长度。将ROS引物置于相对较大的距离处,使得在探针序列内结合的唯一引物距离断裂点68bp。这意味着,考虑到ROS引物的长度为24个核苷酸,CD74基因的约30个核苷酸需要进行测序以鉴定CD74基因,所需的最小扩增子长度约为120bp,即引物起始位点和合成探针的末端之间的距离。与测试的TPM4-ALK探针相比,这是扩增子长度的两倍,这可能解释了输入和检测到的ROS-CD74探针的百分比之间的差异。然而,ROS引物的DOR非常高,这允许检测0.01%ROS-CD74探针,见表16。
表16.探针ROS-CD74的融合输入、检测、未指定的读出序列、融合读出序列和总引物计数。
输入% 检测% 未指定的读出序列 融合读出序列 总引物计数 No.Cigarstrings
10.00 0.89% 76855 687 77542 9
1.00 0.07% 87618 65 87683 2
0.50 0.05% 75761 37 75798 1
0.10 0.01% 62462 6 62468 1
0.05 0.01% 82268 12 82280 1
使用代表性PCR扩增的探针滴定TPM4-ALK覆瓦式PCR测定,其中模板具有与ALK的112个核苷酸融合的TPM4的48个核苷酸。在误差范围内的预期百分比处检测到TPM4-ALK探针,见表16。该引物的低DOR不允许检测低于0.1%的输入融合DNA。由于扩增子长度短,该探针的百分比似乎是准确的。
表17.探针TMP4-ALK的融合输入、检测、wt读出序列、突变型读出序列和总读出序列
输入% 检测% 未指定的读出序列 融合读出序列 总引物计数 No.Cigarstrings
10.00 9.62% 3083 328 3411 1
1.00 1.40% 2896 41 2937 1
0.50 0.59% 2527 15 2542 1
0.10 0.30% 3028 9 3037 1
0.05 N/A N/A N/A N/A N/A
结论
使用本文提供的巢式单边PCR方法,低至0.05%输入核酸的单体DNA中EML4-ALK的从头基因融合检测是成功的。此外,使用该方法,在该实验中检测到0.1%TPM4-ALK探针(输入)。下一个较低的滴定点没有得到任何融合读出序列,可能是因为该引物的DOR为~3,000。使用巢式单边PCR方法检测到Ros-CD74探针低至0.05%输入。Ros测定法在60,000个总读出序列中检测到6个融合读出序列(0.01%被量化)。考虑进行测定的PCR条件,检测到ROS-CD74的低数量的融合读出序列是由于映射需要相对长的扩增子长度。与ALK分析(~41,000)相比,所有ROS分析平均具有更高的DOR(~58,000)和更好的均匀性。在该实施例中使用的分析方法不允许定量野生型读出序列,因为仅分析了分离读出序列。引物间距、引物性能和扩增子长度影响融合召集的灵敏度。
实施例10基因融合检测方法分析
本实施例中提供的实验说明了成功地进行检测涉及靶基因的融合的方法的细节,其使用巢式单边PCR覆瓦式反应,然后对在PCR覆瓦式反应中生成的内部引物扩增子进行大规模的平行的高通量核酸测序。该实施例中提供的实验说明了技术人员如何能够修改巢式单边PCR反应的参数来改善该方法的灵敏度和/或特异性。除非另有说明,否则试剂、仪器和方法如上述实施例9中所提供。
融合模板核酸用于测试巢式单边覆瓦式方法,在外部引物第一次PCR反应(即Star1)中有三个引物浓度和三个Star1循环数,然后在内部引物第二次PCR反应(即Star2)中使用三个引物浓度(即该方法的嵌套单边PCR步骤的Star2),以及三个Star2循环数以及Star1产物的三个稀释液输入Star2反应。合并样品并分析。
根据实施例9中提供的引物和模板,由90%TPM4:Alk探针和10%单体DNA制备野生型单体DNA中的TPM4:Alk1_7模板的混合物。从野生型细胞系(AG16778)制备单体DNA。用针对ROS1和ALK的148个测定(即148个正向靶特异性外部引物(见图13A-13H,用于该实验的靶特异性覆瓦式外部ALK和ROS引物的列表)和反向外部通用引物)进行Star1反应,引物浓度为5nM、10nM和25nM,以及循环数的三个变化:15、25和35个循环。用针对ROS1和ALK的148个测定(即148个正向靶特异性内部引物(见图13A-13H,用于该实验的靶特异性覆瓦式内部ALK和ROS引物的列表)和反向内部通用引物)进行Star2反应,三个引物浓度为10nM、20nM和40nM、三个不同的循环数(15、25和35个循环)、以及三个Star1稀释度:1:20、1:200和1:2000。除非如上所述,否则Star1和Star2反应在K23主混合物中进行并使用实施例9中提供的循环条件。使用实施例9中的方案对包含Star2反应的扩增子产物的243个所得样品进行条形码化。如实施例9中所提供,制备所有条形码样品的池并测序。如实施例9中提供的进行数据分析和质量控制。
为每种条件和引物提供了映射在靶读出序列上的所有引物计数的列表。使用该数据计算第90百分位数和第10百分位数的均匀度。第二个单独的分析提供了关于每个测试条件的总读数、映射读出序列%和靶读出序列%的信息。数据配对并列于表18中。共鉴定30个均匀度<10的条件。对于在该实验中测试的融合池,原始方案导致靶读出序列上33的均匀性为36.6%。改进的循环条件选择表明均匀性提高到~5的值(第90/第10百分位数),靶标上的百分比为~62%。表18中的条形码303行是关于良好均匀性和靶读出序列%的测试中特别值得注意的一组条件。
表18
改进的示例性方案鉴定如下:
Star1:1x K23(见实施例9)、10nM外部池、2.5μM RStar2_C3_Loop-Ryan、4μl稳定的文库,总体积20μl。
PCR程序:95℃10分钟、35x[95℃30秒、63℃10分钟、72℃2分钟]、72℃7分钟、4℃保存
Star2:1x K23、10nM内部池、1μM RStar2、2μl Star1产物1:20稀释,总体积10μl。
PCR程序:95℃10分钟、35x[95℃30秒、63℃10分钟、72℃2分钟]、72℃7分钟、4℃保存
BC反应:1x Qiagen MM、0.5μM R-BC条形码、0.5μM F-BC条形码、1μl Star2产物1:20稀释,总体积10μl
BC-PCR程序:95℃10分钟、12x[95℃30秒、62.5℃3分钟、72℃2分钟]、72℃7分钟,4℃保存。
该方案在均匀性和靶读出序列百分比方面进行了改进。均匀性从原始的33(第90/第10百分位数)减少到5,并且所有靶读出序列的均匀性加倍,即从36%增加到63%。因此,不仅再次成功地证明了使用巢式单边多重PCR反应检测融合的方法,而且例证了鉴定改进的PCR条件的方法。
实施例11.用于检测融合的覆瓦式PCR引物位置的进一步分析
该实施例提供了使用单边巢式PCR覆瓦式方法以及双边跨断裂点方案检测癌基因的基因融合的概念的另一个证据。
在用于进行血液或其部分中的融合检测的本发明的方法的这组实验中测试的策略依赖于使用覆瓦式引物结合位点的多重PCR,其中引物的扩增子位于已知会出现癌症相关靶基因融合的靶区域,然后进行测序和生物信息学分析。生物信息学分析将融合鉴定为映射到两个基因(靶基因和融合伴侣)的序列读出序列。
使用合成探针作为模拟来自融合基因的循环肿瘤DNA的靶标来测试用于融合检测的单边巢式覆瓦式方法。在该实验中选择了在肺癌中常见的四种基因融合对。对于每个融合对,产生具有相同的断裂点但靶标和伴侣基因的比例不同的9个不同的探针片段(见图14和表19)。
表19
融合对1 融合对2 融合对3 融合对4
探针1 CD74:ROS1_1 NPM1:ALK_1 NPM1:ALK_1 TPM4:ALK_1
探针2 CD74:ROS1_3 NPM1:ALK_3 NPM1:ALK_3 TPM4:ALK_3
探针3 CD74:ROS1_5 NPM1:ALK_5 NPM1:ALK_5 TPM4:ALK_5
探针4 CD74:ROS1_7 NPM1:ALK_7 NPM1:ALK_7 TPM4:ALK_7
探针5 CD74:ROS1_9 NPM1:ALK_9 NPM1:ALK_9 TPM4:ALK_9
探针6 CD74:ROS1_11 NPM1:ALK_11 NPM1:ALK_11 TPM4:ALK_11
探针7 CD74:ROS1_13 NPM1:ALK_13 NPM1:ALK_13 TPM4:ALK_13
探针8 CD74:ROS1_15 NPM1:ALK_15 NPM1:ALK_15 TPM4:ALK_15
探针9 CD74:ROS1_17 NPM1:ALK_17 NPM1:ALK_17 TPM4:ALK_17
根据实施例9进行融合探针和文库制备。输入DNA为0%(10,000个拷贝的WT-DNA)、90%(10,000个拷贝的WT+90,000个拷贝的探针)、或仅有探针(30ng所有9个探针)。
使用如实施例9中提供的STAR1/STAR2方案和本文提供的称为OneStar方案的双边跨断裂点方案进行单边巢式多重PCR扩增反应。对于OneStar方案,对混合物:融合1One-Star引物库、50nM 1x K23反应混合物、4μl 1:20稀释的Star1产物,总体积10μl,使用以下PCR程序扩增:95℃10分钟、30x[95℃30秒、63℃10分钟、72℃30秒]、72℃2min、4℃保存。
除了使用稀释的STAR2/OneStar产品代替Star 2产品之外,使用实施例9中提供的条形码方案对样品进行条形码编码。将样品合并到一个池中,使用Qubit纯化,并用配对末端、单索引、100个循环读出序列进行测序。每个融合分析9个模板,每个模板有两个条形码,每个分析提供18个条形码读数,例如表20和21。如实施例8中提供的那样分析数据。
融合的检测
两种不同的方法用于检测融合,称为Star1/Star2(单边巢式多重PCR)和OneStar(双边巢式覆瓦式PCR)。图15说明了每种方法。值得注意的是,单边巢式多重PCR覆瓦式方法(Star1-Star2方法)不需要几乎同样多的引物,因为PCR反应的一侧是通用引物,并且不需要两个融合伴侣的先验知识。
测序数据显示该实验中使用的ALK和ROS引物具有良好的覆盖率,大多数具有至少1,000个读出序列。对于ALK引物,67个中有2个测定丢失,对于ROS引物,27个中有1个测定丢失。测序数据的分析表明使用Star1/Star2和OneStar方法成功检测到融合(数据未显示)。
对测序数据的分析表明,对于Star1/Star2方案,靶读出序列的百分比约为35%,对于OneStar方案,约为10%。然而,对于Star1/Star2仅有大约1%的靶读出序列具有融合,而OneStar方案中的所有读出序列都具有ROS1:CD74的融合。
分析了在使用一系列覆瓦式内部和外部靶引物结合位点的单边巢式PCR方法进行的基因融合的检测中,靶结合位点位置相对于融合断裂点的作用。对于ROS1:CD74融合模板扩增的探针样品,设计用于单边PCR方法的三个内部ROS1引物来结合距离断裂点的506,396和91个核苷酸。只有使用结合距离断裂点91个核苷酸的靶引物结合位点的引物的PCR,产生可检测的融合读数,并且仅用于包括距离断裂点91个核苷酸的结合位点的重复的融合探针核酸文库分子。(见表20的样品11-18;样品1-10不包括距离断裂点91个核苷酸的结合位点)。检测到的最高融合百分比略高于60%,其可能更高,但在平均读取长度约为80个碱基对的这些条件下,结合位点似乎比理想的离断裂点更远。
表20.ROS1:CD74融合读出序列、总读出序列和平均读出序列长度数据。
对于ALK:TPM4融合探针文库,图16显示了测试的正向内部引物的4个的位置,以及它们各自的扩增子相对于断裂点的位置。图17显示了对于这些单边PCR扩增,内部引物2、3和4相对于模板融合探针分子的相对位置。最后七个模板应该用P3扩增并检测,以及最后三个模板应该用P4扩增。P2提供的结果较差。尽管不受理论限制,但是距离断裂点22个核苷酸处的引物P2似乎处于离断裂点太接近而不理想的距离。来自单边PCR扩增的数据显示在表21中。在距离断裂点36个核苷酸处的引物3似乎处于给出这些PCR条件特别有效的距离,其产生长度为约32个核苷酸的平均扩增子,对于一些探针模板具有超过85%的融合读出序列(表21)。对于距离断裂点107个核苷酸的P4引物,该引物的平均读出序列长度为50bp。因此,使用P4引物未检测到融合读出序列。在这些条件下,当产生49bp的读出长度时,107个核苷酸太远而无法检测到断裂点/融合。
表21.ALK:TPM4融合读出序列/总读出序列、以及总读出序列。
在另一个样品中,用距离断裂点21、36和58个核苷酸、平均扩增子长度为分别为37、41和38的三个内部引物(P1、P2和P3)(用于单边PCR),分析ALK:NPM1融合探针模板文库。在这个实验中,在这些条件下,P1没有被扩增,因为它似乎太靠近断裂点。P3被扩增但仅提供1%的融合检测。P2(距离断裂点36个核苷酸,平均扩增子长度为41个核苷酸)提供了对一些模板的融合的最高检测,产生超过70%的融合读出序列/总读出序列。
实施例12.单边PCR覆瓦式扩增子长度以及退火时间
除非另有说明,否则试剂、仪器和方法在上述实施例9中定义。
对根据本发明的用于检测基因融合的单边PCR覆瓦式方法进行测试,以确定退火/延伸时间对形成的最长扩增子产物的产量和大小的影响。
模板产生如下:如图18A中概略地所示,通过使用合适的靶特异性引物,在两个连续单重反应(即来自第一单重反应的扩增子用作第二反应的模板)中扩增284bp模板(SEQID NO:311),该模板包括人TP53外显子4的一部分,从而构建模板(T1=232bp(长对照)、T2=173bp、T3=154bp、T4=121bp、T5=117bp)。根据标准制造商的方案,使用Ampure 1.5X珠(Beckman Coulter)纯化模板,并以1:5稀释。使用BioAnalyzer 1K测定模板DNA的浓度。
五个模板用于分析PCR反应的退火/延伸步骤的不同时间长度,并分析1阶段与2阶段PCR反应,以鉴定在引物结合覆瓦式引物结合位点的反应中产生最大扩增子的条件。反应使用上述模板(长度约150个核苷酸)(图18A),以接近循环的肿瘤DNA片段。用于测试条件的PCR扩增混合物含有K23缓冲液(见实施例9)、AmpliTaq Gold 360(Life Technologies,Carlsbad,CA)、30单位/200ul反应混合物、50nM每种靶特异性引物和0.5ng模板。引物是一系列8个经标记的引物,其与最初的284bp模板上的覆瓦式系列的引物结合位点互补(图18A)。设计结合覆瓦式系列引物结合位点的8个正向引物,以产生如下与适当的模板的3'末端不同长度的扩增子:8F8(232bp)、8F3(200bp)、8F9(173bp)、8F10(154bp)、5F1(127bp)、5F8(94bp)、5F9(72bp)、5F3(51bp)。用于产生括号中的扩增子尺寸的反向引物如图18A所示(例如5R3、5R4或5R5)。如表23所示,测试的PCR扩增方案是1阶段和2阶段方案。正向和反向引物的序列数据显示在表22中。通过计算[nM长产物的浓度]/求和([nM所有产物的浓度])作为最长可用产物的样品的百分比。
表22
表23
使用具有8F10+5R3(154bp插入物)模板的1阶段和2阶段退火循环获得的扩增子的百分比和绝对产率,分别列于表24和25中。引物混合物包括8F10(154bp)、5F1(127bp)、5F8(94bp)、5F9(72bp)和5F3(51bp)正向引物和5R3反向引物。经标记的引物荧光与扩增子长度的1阶段和2阶段退火循环光谱示于图18B-18C中。使用覆瓦式引物结合位点的该多重PCR反应中长扩增子(154bp扩增子)的产率百分比,通过更长的退火时间而增加,使用1阶段方案,从13%增加到72%,而使用2阶段方案,从63%增加到80%(见表24和25)。通过短的51bp引物扩增的扩增子的百分比产率从70%降低到20%可以明显看出,长扩增子的选择性随着90分钟的长退火时间和2阶段方案而改善。
表24:1阶段退火
表25:2阶段退火
通过使用其他不同长度的起始模板(232bp模板、121bp模板和117bp模板)的长扩增子的百分比产率(见图19A-19D)可以明显看出,2阶段方案比1阶段方案有利于较长的扩增子。退火/延伸时间的增加增加了232bp模板和121bp模板的较长产物的百分比产率,而117bp模板的保持一致,约70%。通过较长的90分钟退火/延伸时间降低了51bp扩增子的长232bp模板扩增选择性。离子强度为300nM的K23Master Mix对较长的扩增子具有更高的选择性,并且比“Gold Master Mix”产生更少的副产物,后者具有65nM的较低的离子强度,TaqGold 0.3U/μl、2X Gold Buffer(Life Technologies,Carlsbad,CA,3mM MgCl2和0.4mMdNTP(见:例如图19B-19C)。
本领域技术人员可以在本发明公开的范围和精神内设计出许多修改和其他实施方案。实际上,本领域技术人员可以在不改变本发明所公开的基本方面的情况下,对所描述的材料、方法、附图、实验实施例和实施方案进行改变。任何公开的实施方案可以与任何其他公开的实施方案组合使用。
所公开的实施方案、实施例和实验不旨在限制本公开的范围,也不表示以下实验是全部或仅进行的实验。已经努力确保关于所使用的数字(例如,数量、温度等)的准确性,但是应该考虑一些实验误差和偏差。应当理解,可以在不改变实验旨在说明的基本方面的情况下进行所描述方法的变化。
序列表
<110> 纳特拉公司
<120> 用于检测核酸突变的组合物和方法
<130> 181203CN
<140>
<141>
<150> 62/357,847
<151> 2016-07-01
<160> 323
<170> PatentIn version 3.5
<210> 1
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 1
ggctagagga gtctgcggtg ct 22
<210> 2
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 2
aggagtctgc ggtgctgtga taa 23
<210> 3
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 3
gcggtgctgt gataacattc ag 22
<210> 4
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 4
tgtgataaca ttcagcccct acactg 26
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 5
ccgaatgagg gtgatgtttt tccg 24
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 6
tttttccgcg gcacctcctt 20
<210> 7
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 7
caggtcactg atggaggagg t 21
<210> 8
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 8
ctgatggagg aggtcttgcc a 21
<210> 9
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 9
gaggaggtct tgccagcaaa gc 22
<210> 10
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 10
tcttgccagc aaagcagtag ttgg 24
<210> 11
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 11
ttggggttgt agtcggtcat gat 23
<210> 12
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 12
ttgtagtcgg tcatgatggt cgag 24
<210> 13
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 13
cagctccatc tgcatggctt g 21
<210> 14
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 14
catggcttgc agctcctggt g 21
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 15
catggcttgc agctcctggt 20
<210> 16
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 16
cctggtgctt ccggcggta 19
<210> 17
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 17
ccggcggtac actgcaggt 19
<210> 18
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 18
gtacactgca ggtgggtggt ca 22
<210> 19
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 19
gggtggtcag ctgcaacat 19
<210> 20
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 20
ctgcaacatg gcctggca 18
<210> 21
<211> 16
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 21
ggcagcctgg cccttg 16
<210> 22
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 22
tggcccttga agcactacac agg 23
<210> 23
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 23
aagcactaca caggccactt c 21
<210> 24
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 24
acacaggcca cttcctacag g 21
<210> 25
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 25
tcctacagga agcctccctg gatc 24
<210> 26
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 26
aggaagcctc cctggatctc catat 25
<210> 27
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 27
atatcctccc ctgagctctg aacct 25
<210> 28
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 28
cccctgagct ctgaaccttt ccat 24
<210> 29
<211> 32
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 29
tttgtattat atagggcaga gtcatgttag tc 32
<210> 30
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 30
tagggcagag tcatgttagt ctggtt 26
<210> 31
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 31
ggttcctcca agaagcagac tggaga 26
<210> 32
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 32
ccaagaagca gactggagat ggga 24
<210> 33
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 33
aagaaatgcc catgagagga aat 23
<210> 34
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 34
agaggaaatg gggagggagc ca 22
<210> 35
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 35
ggagggagcc agggaagg 18
<210> 36
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 36
ccagggaagg ctgggtgaac c 21
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 37
tgggtgaacc agcagactgt 20
<210> 38
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 38
aaccagcaga ctgtgttgca ag 22
<210> 39
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 39
ggagggaggg aaggttggg 19
<210> 40
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 40
gggaaggttg ggtggaagca c 21
<210> 41
<211> 17
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 41
caccctgggt gccatgg 17
<210> 42
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 42
gggtgccatg gagcctaag 19
<210> 43
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 43
gggttctgga gccaaagtca gtca 24
<210> 44
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 44
agccaaagtc agtcatcaga ggagtc 26
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 45
tgtgctcagc cattgggtag 20
<210> 46
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 46
agccattggg tagggcagct t 21
<210> 47
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 47
tagggcagct tcagtgcaat ca 22
<210> 48
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 48
agtgcaatca cagcagtgga tttg 24
<210> 49
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 49
gtgcaatcac agcagtggat ttgagg 26
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 50
gtggatttga gggtgcagct 20
<210> 51
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 51
gatcttggtc agttgtgttt cctatagtt 29
<210> 52
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 52
ggtcagttgt gtttcctata gttggagaa 29
<210> 53
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 53
ggagaactgc caagccaca 19
<210> 54
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 54
gccaagccac agagttgga 19
<210> 55
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 55
tctgaattgg tgtctgggga tctg 24
<210> 56
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 56
tggtgtctgg ggatctgtgc tc 22
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 57
aagctgagcc atgaggacca 20
<210> 58
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 58
agccatgagg accaggtcac a 21
<210> 59
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 59
aggacctctt tggactgcag t 21
<210> 60
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 60
ctttggactg cagtttccct ctc 23
<210> 61
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 61
taggcaggga tggtaactcc tg 22
<210> 62
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 62
gggatggtaa ctcctgccct gtt 23
<210> 63
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 63
gccactcccc accctcta 18
<210> 64
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 64
ccctctaggg ttgtcaatga aatgaa 26
<210> 65
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 65
caaaattgtg attcagtggg tagattct 28
<210> 66
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 66
tgtgattcag tgggtagatt ctgtgtgt 28
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 67
caacacatgg gccagggcaa 20
<210> 68
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 68
tgggccaggg caaatgagtc a 21
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 69
tgagtcaccc gctatgtgct 20
<210> 70
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 70
acccgctatg tgctcagttc cc 22
<210> 71
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 71
tccctcctct atgcaatgga ccga 24
<210> 72
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 72
ctatgcaatg gaccgaccgt gatca 25
<210> 73
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 73
tggaccgacc gtgatcagat ta 22
<210> 74
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 74
accgtgatca gattagggtt acctgagga 29
<210> 75
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 75
gtgtaaattg ccgagcacgt agtaac 26
<210> 76
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 76
ccgagcacgt agtaaccatg ca 22
<210> 77
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 77
acgtagtaac catgcaacaa gtgtt 25
<210> 78
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 78
accatgcaac aagtgttagc tcctattatc c 31
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 79
atggggacac agtgtgtgct 20
<210> 80
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 80
agtgtgtgct gccatctccc tt 22
<210> 81
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 81
gctgccatct cccttctacc g 21
<210> 82
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 82
ctcccttcta ccggcagatc cc 22
<210> 83
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 83
accggcagat ccctttgcct 20
<210> 84
<211> 17
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 84
aggggcctgg cctgcga 17
<210> 85
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 85
gcctgcgagg gctctcaa 18
<210> 86
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 86
ctctcaagag cctttccctc tgc 23
<210> 87
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 87
caagagcctt tccctctgcc ctt 23
<210> 88
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 88
tccctctgcc cttttcaagc 20
<210> 89
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 89
agcctctgcc catctgtcct 20
<210> 90
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 90
tctgtcctgg gcatgtctct gc 22
<210> 91
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 91
agcagtaaga gctggttggg a 21
<210> 92
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 92
agctggttgg gaccacactg ag 22
<210> 93
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 93
cctgcaggtc agctcacctt 20
<210> 94
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 94
tcagctcacc ttggctcaca g 21
<210> 95
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 95
agaaaccgat tttcctatct ctctgc 26
<210> 96
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 96
tttcctatct ctctgcctgg agggt 25
<210> 97
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 97
tggtggaggg ctggtttgg 19
<210> 98
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 98
gggctggttt ggggaagagt g 21
<210> 99
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 99
tggtttgggg aagagtgggc tag 23
<210> 100
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 100
ggggaagagt gggctagtgc atta 24
<210> 101
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 101
agtgggctag tgcattacat agggt 25
<210> 102
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 102
tagtgcatta catagggtgg gagccaa 27
<210> 103
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 103
ctgcgccggt ggaagcatg 19
<210> 104
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 104
cggtggaagc atgtgggagc ta 22
<210> 105
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 105
gaagcatgtg ggagctagaa gt 22
<210> 106
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 106
tgtgggagct agaagtgacg tctag 25
<210> 107
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 107
ctaggggtgg gggcgagct 19
<210> 108
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 108
gtgggggcga gctttcacc 19
<210> 109
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 109
aaggagctcc ccaccccctg at 22
<210> 110
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 110
ctccccaccc cctgatcagc 20
<210> 111
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 111
ggatacacac ggggctgagg t 21
<210> 112
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 112
acggggctga ggtgcagaat 20
<210> 113
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 113
aggtgcagaa tcaggggctc ctc 23
<210> 114
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 114
agaatcaggg gctcctcagg ga 22
<210> 115
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 115
gaaggttggg agcttccgtt tt 22
<210> 116
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 116
tgggagcttc cgttttggct tg 22
<210> 117
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 117
ctgggctgcc ctaatcacca c 21
<210> 118
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 118
ccctaatcac caccccaccc a 21
<210> 119
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 119
caattccagg gactagcata acgaa 25
<210> 120
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 120
agggactagc ataacgaagt gaca 24
<210> 121
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 121
ggcacagcct gagacactat tcagt 25
<210> 122
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 122
cctgagacac tattcagtcc tgcctt 26
<210> 123
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 123
cttgggagtc cctggggctc t 21
<210> 124
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 124
agtccctggg gctctgtgc 19
<210> 125
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 125
atcatgatgc cggagaaagc ca 22
<210> 126
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 126
tgccggagaa agccaggacc a 21
<210> 127
<211> 17
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 127
gaccagggcg gccacga 17
<210> 128
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 128
ccacgagggc agaggtcacc 20
<210> 129
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 129
cgagggcaga ggtcaccac 19
<210> 130
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 130
ggtcaccaca gagaggatca gc 22
<210> 131
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 131
tgtggctccg gggtgggt 18
<210> 132
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 132
cggggtgggt gacactggaa gac 23
<210> 133
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 133
ggggtattga caaccacacc aggtct 26
<210> 134
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 134
ttgacaacca caccaggtct ccttt 25
<210> 135
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 135
ccacaccagg tctcctttga gttgg 25
<210> 136
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 136
caggtctcct ttgagttggt ccca 24
<210> 137
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 137
aaataacctc ccccactgag acaa 24
<210> 138
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 138
cctcccccac tgagacaaaa actac 25
<210> 139
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 139
ccactgagac aaaaactact tgctcctt 28
<210> 140
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 140
agacaaaaac tacttgctcc ttcccatcg 29
<210> 141
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 141
tccttcccat cgctggagac cttg 24
<210> 142
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 142
ccatcgctgg agaccttgtc acac 24
<210> 143
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 143
agcaggacca gactcatccc gat 23
<210> 144
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 144
accagactca tcccgatttg acagg 25
<210> 145
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 145
agcttttggg tgaagggaaa tttaacag 28
<210> 146
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 146
tgggtgaagg gaaatttaac agggatga 28
<210> 147
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 147
acagggatga atatcagtgg cgggat 26
<210> 148
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 148
ttggtttgaa acatgagctg cac 23
<210> 149
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 149
gagatgtggg ggccgcaggt ga 22
<210> 150
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 150
cgcaggtgac caaacaacag g 21
<210> 151
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 151
accaaacaac agggtgcgct gta 23
<210> 152
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 152
caacagggtg cgctgtaagt aacacc 26
<210> 153
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 153
ctgtaagtaa caccctctga ggctaa 26
<210> 154
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 154
gtaacaccct ctgaggctaa gttacttc 28
<210> 155
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 155
ctcacagtgg ggaggggtcc tg 22
<210> 156
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 156
gaggggtcct gtgccctctg 20
<210> 157
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 157
ctctgctggc cagaccaca 19
<210> 158
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 158
tggccagacc acacggaggt atcg 24
<210> 159
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 159
gaccacacgg aggtatcgtg cttgg 25
<210> 160
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 160
ggaggtatcg tgcttggtac tgg 23
<210> 161
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 161
acacatgcag aagagggaca ctg 23
<210> 162
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 162
actggtgggg cgggggaa 18
<210> 163
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 163
gtggggcggg ggaagagaca 20
<210> 164
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 164
cgggggaaga gacacaaaac tg 22
<210> 165
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 165
tgaactgctg caaacaaatg ggtt 24
<210> 166
<211> 32
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 166
gctgcaaaca aatgggttat ttagtctgaa ga 32
<210> 167
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 167
acaacagtga aactccgcct caa 23
<210> 168
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 168
aggaggagaa tgggagcact gt 22
<210> 169
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 169
gagaatggga gcactgtctt caa 23
<210> 170
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 170
actgtcttca aacactgcac atgc 24
<210> 171
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 171
cttcaaacac tgcacatgca cagc 24
<210> 172
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 172
acatgcacag ctgctgctgt aagga 25
<210> 173
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 173
aaacctagga gaggaaggtt aaggc 25
<210> 174
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 174
ggagaggaag gttaaggcaa caggt 25
<210> 175
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 175
gttaaggcaa caggtcccca gct 23
<210> 176
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 176
gcaacaggtc cccagctctg a 21
<210> 177
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 177
cagctctgaa actgcccaag gg 22
<210> 178
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 178
aaactgccca agggaacaga g 21
<210> 179
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 179
aagatccctg tcactgggca tg 22
<210> 180
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 180
ctgtcactgg gcatgtttaa gtgg 24
<210> 181
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 181
cactgggcat gtttaagtgg aggca 25
<210> 182
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 182
catgtttaag tggaggcagg atgg 24
<210> 183
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 183
caggatggcc ccttggtg 18
<210> 184
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 184
ccttggtggg ggtggtagag 20
<210> 185
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 185
gagccatgac ccacctttca cacag 25
<210> 186
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 186
gacccacctt tcacacagtg gtc 23
<210> 187
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 187
agtggtcaga gcactcgagc tg 22
<210> 188
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 188
agagcactcg agctgtggca 20
<210> 189
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 189
aggtagggga gggacagaaa gttta 25
<210> 190
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 190
ggagggacag aaagtttaca aaaccg 26
<210> 191
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 191
cagaaagttt acaaaaccga atccagggt 29
<210> 192
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 192
acaaaaccga atccagggtg ttctg 25
<210> 193
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 193
aacccagaaa ccatttgtgg tcatgg 26
<210> 194
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 194
aaaccatttg tggtcatggg ccaaa 25
<210> 195
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 195
cctggccctg ccccctta 18
<210> 196
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 196
cctgccccct taccaatgca g 21
<210> 197
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 197
cttaccaatg caggagacgc catc 24
<210> 198
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 198
tgcaggagac gccatcctca g 21
<210> 199
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 199
cgtggtcaca gaagcagatg accttg 26
<210> 200
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 200
cacagaagca gatgaccttg tggctt 26
<210> 201
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 201
gtggctttca gggtccatgt ga 22
<210> 202
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 202
cagggtccat gtgacattcg tctac 25
<210> 203
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 203
tccatgtgac attcgtctac ctcacagtg 29
<210> 204
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 204
cattcgtcta cctcacagtg actgc 25
<210> 205
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 205
taatgcttaa tattcacttc cccgtggcct t 31
<210> 206
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 206
taatattcac ttccccgtgg ccttcca 27
<210> 207
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 207
ccgtggcctt ccatcactag tgac 24
<210> 208
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 208
tccatcacta gtgacaagga ggga 24
<210> 209
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 209
gtgacaagga gggagggtca gtct 24
<210> 210
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 210
gtcagtcttg ggccgagcct 20
<210> 211
<211> 16
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 211
tgggccgagc ctgcct 16
<210> 212
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 212
gagcctgcct ccccactc 18
<210> 213
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 213
ccactcccag cctcagtact atgtc 25
<210> 214
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 214
cagcctcagt actatgtctc caggtg 26
<210> 215
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 215
ccaggtggtc actgtgggt 19
<210> 216
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 216
gtcactgtgg gtgctctggt g 21
<210> 217
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 217
actgtgggtg ctctggtggt c 21
<210> 218
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 218
tgctctggtg gtccctgttc c 21
<210> 219
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 219
gtccctgttc ctaggtccca tagcc 25
<210> 220
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 220
ttcctaggtc ccatagccac tggaag 26
<210> 221
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 221
aattttccat ccatcccagg tcacat 26
<210> 222
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 222
ccatccatcc caggtcacat ttgag 25
<210> 223
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 223
tggtataaac catgactgtc ttggg 25
<210> 224
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 224
aaaccatgac tgtcttgggc aatg 24
<210> 225
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 225
actgtcttgg gcaatgcgga attc 24
<210> 226
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 226
tgggcaatgc ggaattcata ggc 23
<210> 227
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 227
tactgttgcc caccctttgc ctagg 25
<210> 228
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 228
ccaccctttg cctaggtgct ccata 25
<210> 229
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 229
tgcctaggtg ctccataatg atg 23
<210> 230
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 230
gtgctccata atgatggcca aagct 25
<210> 231
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 231
gccagacctc gcagctcag 19
<210> 232
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 232
cctcgcagct cagccaactc t 21
<210> 233
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 233
tataagcact gtcacccctt cctt 24
<210> 234
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 234
cactgtcacc ccttccttgg c 21
<210> 235
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 235
agaaaaagta ttggaacgaa gcttaccaaa t 31
<210> 236
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 236
ttggaacgaa gcttaccaaa tgttagc 27
<210> 237
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 237
caataggatt gtcatctgta ctggactatt g 31
<210> 238
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 238
tgtcatctgt actggactat tggctcagaa 30
<210> 239
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 239
atgttctcac cacctcgctt cactt 25
<210> 240
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 240
accacctcgc ttcactttta aaggc 25
<210> 241
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 241
ttcactttta aaggcccaat gtaagc 26
<210> 242
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 242
aaggcccaat gtaagcccac a 21
<210> 243
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 243
ttcatatctg aacttgaaag actaattgcg 30
<210> 244
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 244
tctgaacttg aaagactaat tgcgcctct 29
<210> 245
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 245
tttaacacat atcttgctat ttgtcttccc a 31
<210> 246
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 246
catatcttgc tatttgtctt cccacacagg 30
<210> 247
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 247
aagctcctga ggtcagcagt tgtatt 26
<210> 248
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 248
ctgaggtcag cagttgtatt ttacaggt 28
<210> 249
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 249
aatcttttct catgcacaca cacgct 26
<210> 250
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 250
ttctcatgca cacacacgct ctt 23
<210> 251
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 251
agtaaaacca catgcactgc tgct 24
<210> 252
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 252
accacatgca ctgctgctaa aagc 24
<210> 253
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 253
gctaaaagca aagaaccgaa ttagct 26
<210> 254
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 254
agcaaagaac cgaattagct tagctagact 30
<210> 255
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 255
gtaggaaagc agacaagcag tcaa 24
<210> 256
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 256
aagcagacaa gcagtcaagc ct 22
<210> 257
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 257
gacaagcagt caagcctata tgcca 25
<210> 258
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 258
agtcaagcct atatgccaac tgcca 25
<210> 259
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 259
ctatatgcca actgccaaat atactgcagt 30
<210> 260
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 260
ccaactgcca aatatactgc agtcat 26
<210> 261
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 261
gtaagtctgg aggggctggc t 21
<210> 262
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 262
tggaggggct ggcttagtgg 20
<210> 263
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 263
ggctggctta gtggcaca 18
<210> 264
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 264
tagtggcaca aacatcagct gtgc 24
<210> 265
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 265
atacttagac tctctggaac cacagg 26
<210> 266
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 266
agactctctg gaaccacagg ttaaa 25
<210> 267
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 267
gaaccacagg ttaaaatcct ggcagggt 28
<210> 268
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 268
ggttaaaatc ctggcagggt cagctg 26
<210> 269
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 269
tttagctttc caagtttgct gaagga 26
<210> 270
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 270
tttccaagtt tgctgaagga gtttca 26
<210> 271
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 271
acagtaaagt gttggctgtc tttatcc 27
<210> 272
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 272
aagtgttggc tgtctttatc ctgaga 26
<210> 273
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 273
aactttccct tgtaacttac ccctac 26
<210> 274
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 274
cccttgtaac ttacccctac ttgtg 25
<210> 275
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 275
tgttggggac tctcaatatt agcaatagat 30
<210> 276
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 276
ggactctcaa tattagcaat agataggggt cca 33
<210> 277
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 277
aaactcggac agtttgggga at 22
<210> 278
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 278
ggacagtttg gggaatgaaa gaaag 25
<210> 279
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 279
agatgtctga aagcaagagt cgatc 25
<210> 280
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 280
ctgaaagcaa gagtcgatcc caca 24
<210> 281
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 281
agtcgatccc acaagccaga 20
<210> 282
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 282
tcccacaagc cagaaatgga tcttct 26
<210> 283
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 283
ccaaaccagc ctgtctgctt agaaa 25
<210> 284
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 284
cctgtctgct tagaaaccaa aactatccc 29
<210> 285
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 285
gaaaccaaaa ctatcccaat caaagattgt c 31
<210> 286
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 286
aaaactatcc caatcaaaga ttgtcactgg 30
<210> 287
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 287
aaaacatttg tatgcagcca atcagaaata aat 33
<210> 288
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 288
ttgtatgcag ccaatcagaa ataaatactg t 31
<210> 289
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 289
ctattatact taccaaaggt cagtggga 28
<210> 290
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 290
acttaccaaa ggtcagtggg attg 24
<210> 291
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 291
atagataaaa gctaagttgc cccagct 27
<210> 292
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 292
aaaagctaag ttgccccagc tctacc 26
<210> 293
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 293
ctctacctaa gcacacagag taatatagca 30
<210> 294
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 294
gcacacagag taatatagca gagctagct 29
<210> 295
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 295
aatatagcag agctagctac tactggattt ttg 33
<210> 296
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 296
gagctagcta ctactggatt tttgcaagc 29
<210> 297
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 297
acacgacgct cttccgatct 20
<210> 298
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 298
agacgtgtgc tcttccgatc t 21
<210> 299
<211> 304
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
基因融合探针多核苷酸"
<400> 299
tggttaggga aacagggcag gagttaccat ccctgcctac agagagggaa actgcagtcc 60
aaagaggtcc tgtgacctgg tcctcatggc tcagcttgta agtaacaaga ggcggaatta 120
gagcacagat ccccagacac caattcagat cctaggaagt ctcagttttt agagtattta 180
ctatcagtgt tctttttttt tctgacttct tgctgcttga gttttataat gtctaataaa 240
ttgtatttta gctgtggagg aagatgcaga gtcagaagat gaagaggagg aggatgtgaa 300
actc 304
<210> 300
<211> 304
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
基因融合探针多核苷酸"
<400> 300
aaagttcctt ttcccatgtg ctcttttttt tttttttttt aaatagaata gaagtctcag 60
tttttagagt atttactatc agtgttcttt ttttttctga ctctcagttt ttagagtcat 120
ttactatcag tgttcttttt tttctgaccc ctgggccagc tgcaccctca aatccactgc 180
tgtgattgca ctgaagctgc cctacccaat ggctgagcac agcagaaata ctaaggcagg 240
cccaattcct gggagtcatg ggactcctct gatgactgac tttggctcca gaacccctta 300
gggc 304
<210> 301
<211> 304
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解"人工序列的描述: 合成的
基因融合探针多核苷酸"
<400> 301
agtgttttgg tttctcccac agtattctga aaaggaggac aaatatgaag aaagaaatta 60
aacttctgtc tgacaaactg aaagaggctg agacccgtgc tgaatttgca gagagaacgg 120
ttgcaaaact ggaaaagaca attgatgacc tggaagtgta ccgccggaag caccaggagc 180
tgcaagccat gcagatggag ctgcagagcc ctgagtacaa gctgagcaag ctccgcacct 240
cgaccatcat gaccgactac aaaccccaac tactgctttg ctggcaagac ctcctccatc 300
agtg 304
<210> 302
<211> 304
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
基因融合探针多核苷酸"
<400> 302
aagccaggca gtgtaggggc ttggtggtgg ccatcgaacc tgacctccac ctctatccgt 60
attaggtctt tgagagctgg atgcaccatt ggctcctgtt tgaaatgagc aggcactcct 120
tggagcaaaa gcccactgac gctccaccga aagatgattt ttggatacca gaaacaagtt 180
tcatacttta ctattatagt tggaatattt ctggttgtta caatcccact gacctttggt 240
aagtataata gaatttttaa aataggcaac aaactgttta cttaatcata cctgattgat 300
ttat 304
<210> 303
<211> 62
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
基因融合探针多核苷酸"
<400> 303
ctgcagacaa gcataaagat gtcatcatca accaagtgta ccgccggaag caccaggagc 60
tg 62
<210> 304
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
基因融合探针多核苷酸"
<400> 304
atgtcaactc gcgaaaaaaa cagccaagtg taccgccgga agcaccagga gctg 54
<210> 305
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 305
caaaagccca ctgacgctc 19
<210> 306
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 306
ttaagtaaac agtttgttgc ctattttaaa aatt 34
<210> 307
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 307
gcagagagaa cggttgcaaa 20
<210> 308
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 308
ggggtttgta gtcggtcatg a 21
<210> 309
<211> 160
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
基因融合探针多核苷酸"
<400> 309
caaaagccca ctgacgctcc accgaaagat gatttttgga taccagaaac aagtttcata 60
ctttactatt atagttggaa tatttctggt tgttacaatc ccactgacct ttggtaagta 120
taatagaatt tttaaaatag gcaacaaact gtttacttaa 160
<210> 310
<211> 160
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
基因融合探针多核苷酸"
<400> 310
gcagagagaa cggttgcaaa actggaaaag acaattgatg acctggaagt gtaccgccgg 60
aagcaccagg agctgcaagc catgcagatg gagctgcaga gccctgagta caagctgagc 120
aagctccgca cctcgaccat catgaccgac tacaaacccc 160
<210> 311
<211> 284
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
模板多核苷酸"
<400> 311
acacgacgct cttccgattc tgtcatccaa atactccaca cgcaaatttc cttccactcg 60
gataagatgc tgaggagggg ccagacctaa gagcaatcag tgaggaatca gaggcctggg 120
gaccctgggc aaccagccct gtcgtctctc cagccccagc tgctcaccat cgctatctga 180
gcagcgctca tggtgggggc agcgcctcac aacctccgtc atgtgctgtg actgcttgta 240
gatggccatg agatcggaag agcacacgtc tgaactccag tcac 284
<210> 312
<211> 43
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 312
acacgacgct cttccgattc tgtcatccaa atactccaca cgc 43
<210> 313
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 313
acacgacgct cttccgatct cttccactcg gataagatgc 40
<210> 314
<211> 36
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 314
acacgacgct cttccgatgg gccagaccta agagca 36
<210> 315
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 315
acacgacgct cttccgattc agtgaggaat cagaggcctg 40
<210> 316
<211> 39
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 316
acacgacgct cttccgatct cctgggcaac cagccctgt 39
<210> 317
<211> 38
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物"
<400> 317
acacgacgct cttccgatca gctgctcacc atcgctat 38
<210> 318
<211> 35
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 318
acacgacgct cttccgatga gcagcgctca tggtg 35
<210> 319
<211> 39
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 319
acacgacgct cttccgatct cagcgcctca caacctccg 39
<210> 320
<211> 45
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 320
agacgtgtgc tcttccgatc tcatggccat ctacaagcag tcaca 45
<210> 321
<211> 43
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 321
agacgtgtgc tcttccgatc taccatgagc gctgctcaga tag 43
<210> 322
<211> 39
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 322
agacgtgtgc tcttccgatc tgatggtgag cagctgggg 39
<210> 323
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注解="人工序列的描述: 合成的
引物标签序列"
<400> 323
gtgactggag ttcagacgtg tgctcttccg atct 34

Claims (43)

1.一种用于在来自哺乳动物的样品或其部分中检测靶基因中的突变的方法,所述方法包含:
a)通过将聚合酶、脱氧核苷三磷酸、来自由所述样品产生的核酸文库的核酸片段、一系列正链正向靶特异性引物和正链反向通用引物进行组合,从而形成初始反应混合物,其中所述核酸片段包含反向通用引物结合位点,其中一系列正向靶特异性引物包含结合至一系列覆瓦式靶特异性引物结合位点的5至250个引物,所述靶特异性引物结合位点在所述靶基因上以10至100个核苷酸间隔开;
b)使所述初始反应混合物经历初始扩增条件,以产生使用引物对产生的靶扩增子,所述引物对包含所述一系列正向靶特异性引物中的引物中的一个和所述反向通用引物;以及
c)分析所述靶扩增子中的至少一部分的核酸序列,从而检测所述靶基因中的突变。
2.根据权利要求1所述的方法,其中所述分析包含:使用大规模平行测序来确定所述靶扩增子中的至少一部分的核酸序列。
3.根据权利要求1所述的方法,其中所述正链正向靶特异性引物是正链正向靶特异性外部引物,并且所述正链反向通用引物是正链反向通用外部引物,并且其中所述方法在所述分析之前还包括:
a)通过将外部引物靶扩增子、聚合酶、脱氧核苷三磷酸、反向内部通用引物和一系列正向靶特异性内部引物进行组合,从而形成内部引物反应混合物,所述靶特异性内部引物包含结合至一系列覆瓦式靶特异性内部引物结合位点的5至250个引物,所述靶特异性内部引物结合位点在靶基因上以10至100个核苷酸间隔开并且每个都在至少一个外部引物靶扩增子上被发现,所述一系列正向靶特异性内部引物被配置成在与一系列靶特异性外部引物相同的方向上引发延伸反应;以及
b)使所述内部引物反应混合物经历内部引物扩增条件,以产生使用引物对产生的内部引物靶扩增子,所述引物对包含所述正向靶特异性内部引物中的一个和所述反向内部通用引物,其中其核酸序列被分析的扩增子包含所述内部引物靶扩增子,其中被分析的核酸序列是所述外部引物靶扩增子的一部分。
4.根据权利要求3所述的方法,其中所述靶特异性内部引物结合位点与靶特异性外部引物结合位点重叠0至25个核苷酸。
5.根据权利要求3所述的方法,其中所述反向内部通用引物包含与反向外部通用引物相同的核苷酸序列。
6.根据权利要求3所述的方法,其中一系列覆瓦式靶特异性外部引物结合位点和所述靶特异性内部引物结合位点在1至100个靶基因中的每一个的靶区域上被发现。
7.根据权利要求6所述的方法,其中在1至100个靶基因中的每一个上,所述外部引物靶扩增子中的至少50%或至少75%与所述外部引物靶扩增子中的至少另外一个具有重叠序列,其中每个靶区域包含500至10,000个核苷酸并且其中所述靶区域包含与疾病相关的已知突变。
8.根据权利要求3所述的方法,其中所述外部引物靶扩增子中的至少50%和所述内部引物靶扩增子中的至少一个具有重叠序列。
9.根据权利要求7所述的方法,进一步包含:
a)通过将聚合酶、脱氧核苷三磷酸、来自由所述样品产生的核酸文库的核酸片段、一系列负链正向靶特异性外部引物和负链反向外部通用引物进行组合,从而形成负链外部引物反应混合物,其中所述核酸片段包含负链反向外部通用引物结合位点,其中所述一系列负链正向靶特异性外部引物包含结合至一系列覆瓦式负链正向靶特异性外部引物结合位点的5至250个引物,所述负链正向靶特异性外部引物结合位点在靶基因上以10至100个核苷酸间隔开,其中所述负链正向靶特异性外部引物结合位点位于被所述靶特异性外部引物靶定的链的负链上;
b)使所述负链外部引物反应混合物经历扩增条件,以产生使用引物对产生的负链外部引物靶扩增子,所述引物对包含所述一系列负链正向靶特异性外部引物中的引物中的一个和所述负链反向外部通用引物;以及
c)分析所述负链外部引物靶扩增子中的至少一部分的核酸序列,从而检测所述靶基因中的突变。
10.根据权利要求9所述的方法,其中所述方法在所述分析之前进一步包含:
a)通过将所述负链外部引物靶扩增子、聚合酶、脱氧核苷三磷酸、负链反向内部通用引物和一系列正向负链靶特异性内部引物进行组合,从而形成负链内部引物扩增反应混合物,所述正向负链靶特异性内部引物包含结合至一系列覆瓦式负链靶特异性内部引物结合位点的5至250个引物,所述负链靶特异性内部引物结合位点在靶基因上以10至100个核苷酸间隔开并且每个都在至少一个负链外部引物靶扩增子上被发现,所述正向负链靶特异性内部引物被配置成在与一系列负链靶特异性外部引物相同的方向上引发延伸反应;以及
b)使负链反应混合物经历负链靶特异性内部引物扩增条件,以形成使用引物对产生的负链内部引物靶扩增子,所述引物对包含负链正向靶特异性内部引物中的一个和负链内部通用引物,其中其核酸序列被分析的扩增子包含所述负链内部引物靶扩增子。
11.根据权利要求9所述的方法,其中负链外部引物扩增条件与外部引物扩增条件相同。
12.根据权利要求10所述的方法,其中负链内部引物扩增条件与所述内部引物扩增条件相同。
13.根据权利要求7-10中任一项所述的方法,其中所述疾病是癌症。
14.根据权利要求1或3所述的方法,其中在外部引物靶扩增子和/或内部引物靶扩增子上,来自所述靶基因的至少25个连续的核苷酸和没有在所述靶基因上被发现的来自所述哺乳动物的基因组的区域的至少25个连续的核苷酸的存在,表示包含所述靶基因的基因融合。
15.根据权利要求1或3所述的方法,其中一系列正链靶特异性外部引物包含至少一个结合至靶引物结合位点的引物,所述靶引物结合位点与所述靶基因的已知融合断裂点相距25至150个核苷酸,并且其中外部引物靶扩增子包含至少150个核苷酸长的扩增子。
16.根据权利要求14所述的方法,其中所述方法检测来自至少一种融合伴侣基因的基因融合,所述融合伴侣基因选自AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1。
17.根据权利要求16所述的方法,其中所述基因融合包含染色体易位。
18.根据权利要求14所述的方法,其中所述方法检测来自至少两种融合伴侣基因的基因融合,所述融合伴侣基因选自AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1,并且其中一系列靶特异性外部引物包含至少一个结合至靶引物结合位点的引物,所述靶引物结合位点与所述靶基因中的每一个的已知融合断裂点相距25至150个核苷酸,并且其中所述外部引物靶扩增子包含至少150个核苷酸长的扩增子。
19.根据权利要求3所述的方法,其中一系列正向靶特异性外部引物和所述一系列正向靶特异性内部引物每个都包含至少一个结合至靶引物结合位点的引物,所述靶引物结合位点与所述靶基因的已知融合断裂点相距靶距离,并且其中所述外部引物靶扩增子包含至少一个与所述靶距离一样长的扩增子。
20.根据权利要求19所述的方法,其中所述靶基因选自:AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1。
21.根据权利要求19所述的方法,其中所述靶基因包含选自以下的至少两个融合伴侣基因:AKT1、ALK、BRAF、EGFR、HER2、KRAS、MEK1、MET、NRAS、PIK3CA、RET和ROS1,并且其中所述一系列正向靶特异性外部引物和所述一系列正向靶特异性内部引物每个都包含5至250个引物并且每个都结合至所述至少两个融合伴侣基因中的一个上的至少一个靶区域,并且其中至少一个引物结合至靶引物结合位点,所述靶引物结合位点与所述至少两个融合伴侣基因中的每一个的已知融合断裂点相距靶距离,并且其中所述至少两个融合伴侣基因中的每一个的外部引物靶扩增子包含至少一个与所述靶距离一样长的扩增子。
22.根据权利要求19-21中任一项所述的方法,其中所述一系列正向靶特异性外部引物和所述一系列正向靶特异性内部引物每个都包含至少一个结合至靶引物结合位点的引物,所述靶引物结合位点与所述靶基因中的每一个的已知融合断裂点相距25至150个核苷酸或25至100个核苷酸或25至50个核苷酸,并且其中所述外部引物靶扩增子包含跨越已知基因融合断裂点的至少150个核苷酸长的扩增子。
23.根据权利要求22所述的方法,其中引物扩增条件包含至少5个PCR循环,所述PCR循环具有在58℃至72℃下30至120分钟的靶特异性外部引物退火步骤。
24.根据权利要求22所述的方法,其中引物扩增条件包含第一组和第二组,所述第一组为具有在58℃至65℃下30至120分钟的外部引物退火步骤的2至10个PCR循环,所述第二组为具有在68℃和72℃下30至120分钟的靶特异性外部引物退火步骤的5至50个PCR循环。
25.根据权利要求22所述的方法,其中所述一系列正向靶特异性外部引物和所述一系列正向靶特异性内部引物最高Tm为退火温度之下2至10度。
26.根据权利要求24所述的方法,其中所述退火在组合的退火/延伸步骤中进行。
27.根据权利要求1所述的方法,其中所述扩增条件包括至少5个PCR循环,所述PCR循环具有在58℃和72℃下30至120分钟的退火步骤。
28.根据权利要求27所述的方法,其中所述退火步骤为60至90分钟长。
29.根据权利要求27或28所述的方法,其中所述靶特异性引物中的至少50%的最高Tm为用于PCR反应的退火温度之下1至10℃。
30.根据权利要求27或28所述的方法,其中一组靶特异性引物的最高Tm为退火温度之下2至10度,并且其中所述退火在组合的退火/延伸步骤中进行。
31.根据权利要求27所述的方法,其中一系列靶特异性引物包含至少一个结合至靶引物结合位点的引物,所述靶引物结合位点与所述靶基因的已知融合断裂点相距25至150个核苷酸。
32.一种用于在体外扩增靶核酸区域的方法,所述方法包含:
a. 通过将聚合酶、脱氧核苷三磷酸、来自文库的核酸片段、多个靶特异性引物的第一池和第一反向通用引物进行组合,从而形成反应混合物,其中所述文库的核酸片段包含通用反向引物结合位点,并且其中所述多个靶特异性引物包含能够结合至一系列覆瓦式引物结合位点的5至250个引物,所述一系列覆瓦式引物结合位点在靶基因的靶区域上以10至50个核苷酸间隔开;以及
b. 使所述反应混合物经历扩增条件,以形成长度为100至200个核苷酸的扩增子,其中所述扩增条件包含在58℃至72℃下30至120分钟的退火步骤,从而扩增靶核酸区域。
33.根据权利要求1或32所述的方法,其中靶特异性引物扩增条件包含至少5个PCR循环,所述PCR循环具有在58℃至72℃下60至90分钟的靶特异性外部引物退火步骤。
34.根据权利要求1或32所述的方法,其中靶特异性引物扩增条件包含第一组和第二组,所述第一组为具有在58℃至65℃下30至120分钟的靶特异性外部引物退火步骤的2至10个PCR循环,所述第二组为在68℃和72℃下30至120分钟的靶特异性外部引物退火步骤的5至50个PCR循环。
35.根据权利要求33或34所述的方法,其中靶特异性外部引物中的50%的最高Tm为用于PCR反应的退火温度之下1至10度。
36.根据权利要求33或34所述的方法,其中一组靶特异性引物的最高Tm为退火温度之下2至10度。
37.根据权利要求36所述的方法,其中所述退火是在组合的退火/延伸步骤中进行。
38.一种用于在来自哺乳动物的样品或其部分中检测涉及靶基因的融合的方法,所述方法包含:
a. 使所述样品中的核酸经历跨过靶基因的靶区域的单边PCR覆瓦式反应,以产生外部引物靶扩增子,其中所述覆瓦式反应是使用反向外部通用引物和5至250个正向外部靶特异性引物进行的,所述正向外部靶特异性引物结合至在靶基因的靶区域上以10至100个核苷酸间隔开的一系列覆瓦式外部靶引物结合位点;以及
b. 分析所述靶扩增子中的至少一部分的核酸序列,从而检测所述靶基因中的突变。
39.根据权利要求38所述的方法,进一步包含:通过使用反向内部通用引物和一系列正向靶特异性内部引物来扩增所述外部引物靶扩增子,从而进行第二次单边PCR覆瓦式反应,以生成正向内部引物靶扩增子,所述正向靶特异性内部引物包含结合至一系列覆瓦式靶内部引物结合位点的5至250个引物,所述靶内部引物结合位点在靶基因的靶区域上以10至100个核苷酸间隔开并且每个都在至少一个外部引物靶扩增子上被发现,其中所述正向靶特异性内部引物被配置成在与一系列靶特异性外部引物相同的方向上引发延伸反应,并且其中其核酸序列被分析的所述靶扩增子包含所述正向内部引物靶扩增子。
40.根据权利要求39所述的方法,其中靶特异性内部引物结合位点与靶特异性外部引物结合位点重叠5至20个核苷酸。
41.根据权利要求39所述的方法,其中所述靶区域包含已知参与基因融合的靶基因的区域。
42.根据权利要求1或38所述的方法,其中一系列覆瓦式靶特异性外部引物结合位点在靶区域上以10至75个核苷酸或15至50个核苷酸间隔开。
43.根据权利要求39所述的方法,其中一系列覆瓦式靶特异性外部引物结合位点和靶特异性内部引物结合位点在2至50个靶基因的每一个的靶区域上进行选择。
CN201780041202.2A 2016-07-01 2017-06-30 用于检测核酸突变的组合物和方法 Pending CN109415764A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662357847P 2016-07-01 2016-07-01
US62/357,847 2016-07-01
PCT/US2017/040319 WO2018005983A1 (en) 2016-07-01 2017-06-30 Compositions and methods for detection of nucleic acid mutations

Publications (1)

Publication Number Publication Date
CN109415764A true CN109415764A (zh) 2019-03-01

Family

ID=60786702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780041202.2A Pending CN109415764A (zh) 2016-07-01 2017-06-30 用于检测核酸突变的组合物和方法

Country Status (7)

Country Link
US (1) US20190185913A1 (zh)
EP (2) EP3510171A4 (zh)
JP (1) JP2019526230A (zh)
CN (1) CN109415764A (zh)
AU (1) AU2017290809A1 (zh)
CA (1) CA3025956A1 (zh)
WO (1) WO2018005983A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110846394A (zh) * 2019-09-25 2020-02-28 广州医科大学附属第一医院(广州呼吸中心) 一种检测肺动脉高压病的alk1基因探针组及其应用
CN110957005A (zh) * 2019-08-19 2020-04-03 北京康普森生物技术有限公司 扩增子测序用引物的设计及扩增子测序文库的构建方法
CN112899152A (zh) * 2021-02-02 2021-06-04 中国科学院苏州纳米技术与纳米仿生研究所 核酸快速扩增和检测的微流控芯片、检测方法及系统
CN114550817A (zh) * 2022-01-25 2022-05-27 云南大学 基于多特征的ctcf介导染色质环预测方法
CN115927564A (zh) * 2022-09-29 2023-04-07 杭州联川基因诊断技术有限公司 一种检测生物样本中基因融合的引物组合、试剂盒及方法

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10113196B2 (en) 2010-05-18 2018-10-30 Natera, Inc. Prenatal paternity testing using maternal blood, free floating fetal DNA and SNP genotyping
EP2854056A3 (en) 2009-09-30 2015-06-03 Natera, Inc. Methods for non-invasive pre-natal ploidy calling
EP2572003A4 (en) 2010-05-18 2016-01-13 Natera Inc METHOD FOR NONINVASIVE PRANATAL PLOIDIE ASSIGNMENT
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
WO2016183106A1 (en) 2015-05-11 2016-11-17 Natera, Inc. Methods and compositions for determining ploidy
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
GB201709675D0 (en) 2017-06-16 2017-08-02 Inivata Ltd Method for detecting genomic rearrangements
CN112424374A (zh) * 2018-06-11 2021-02-26 莫诺匡特私人有限公司 扩增方法
CN110660451B (zh) * 2018-06-13 2023-04-28 广州华大基因医学检验所有限公司 确定生物样本中是否存在融合基因的方法、设备及应用
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
CA3111887A1 (en) 2018-09-27 2020-04-02 Grail, Inc. Methylation markers and targeted methylation probe panel
CN109234357B (zh) * 2018-10-12 2019-12-27 江苏先声医学诊断有限公司 一种用于检测靶基因是否发生融合突变的方法、引物组合、试剂盒及其应用
FR3088077B1 (fr) * 2018-11-05 2023-04-21 Centre Henri Becquerel Methode de diagnostic d'un cancer et kit associe
AU2019375136A1 (en) * 2018-11-05 2021-06-03 Centre Henri Becquerel Method for diagnosing a cancer and associated kit
US20220017970A1 (en) * 2018-12-12 2022-01-20 Inivata Ltd. Method for quantifying gene fusion dna
CN111235272B (zh) * 2020-01-10 2023-07-07 厦门艾德生物医药科技股份有限公司 一次性检测肺癌多重基因突变的组合物及其应用
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
WO2023282916A1 (en) * 2021-07-09 2023-01-12 Guardant Health, Inc. Methods of detecting genomic rearrangements using cell free nucleic acids
WO2022146773A1 (en) * 2020-12-29 2022-07-07 Nuprobe Usa, Inc. Methods and compositions for sequencing and fusion detection using ligation tail adapters (lta)
EP4291679A1 (en) * 2021-02-12 2023-12-20 Guardant Health, Inc. Methods and compositions for detecting nucleic acid variants

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002090505A2 (en) * 2001-05-09 2002-11-14 Virginia Commonwealth University Multiple sequencible and ligatible structures for genomic analysis
CN104053786A (zh) * 2011-11-29 2014-09-17 生命技术公司 用于多重pcr 的方法和组合物
CN104736722A (zh) * 2012-05-21 2015-06-24 斯克利普斯研究所 样品制备方法
CN104919056A (zh) * 2012-10-31 2015-09-16 巴塞尔大学医院 多个不同的核酸靶序列同时扩增的方法
WO2015148494A1 (en) * 2014-03-25 2015-10-01 Quest Diagnostics Investments Incorporated Detection of gene fusions by intragenic differential expression (ide) using average cycle thresholds
CN105229175A (zh) * 2013-03-15 2016-01-06 雅培分子公司 用于扩增和测定rna融合基因变体的方法、区分它们的方法以及有关的引物、探针和试剂盒
CN105296632A (zh) * 2015-11-03 2016-02-03 暨南大学 一种检测肿瘤组织中EGFRvIII的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103608818B (zh) * 2011-02-09 2017-12-08 纳特拉公司 非侵入性产前倍性识别装置
US10407722B2 (en) * 2014-06-06 2019-09-10 Cornell University Method for identification and enumeration of nucleic acid sequence, expression, copy, or DNA methylation changes, using combined nuclease, ligase, polymerase, and sequencing reactions

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002090505A2 (en) * 2001-05-09 2002-11-14 Virginia Commonwealth University Multiple sequencible and ligatible structures for genomic analysis
US20050175996A1 (en) * 2001-05-09 2005-08-11 Xiangning Chen Multiple sequencible and ligatible structures for genomic analysis
CN104053786A (zh) * 2011-11-29 2014-09-17 生命技术公司 用于多重pcr 的方法和组合物
CN104736722A (zh) * 2012-05-21 2015-06-24 斯克利普斯研究所 样品制备方法
CN104919056A (zh) * 2012-10-31 2015-09-16 巴塞尔大学医院 多个不同的核酸靶序列同时扩增的方法
CN105229175A (zh) * 2013-03-15 2016-01-06 雅培分子公司 用于扩增和测定rna融合基因变体的方法、区分它们的方法以及有关的引物、探针和试剂盒
WO2015148494A1 (en) * 2014-03-25 2015-10-01 Quest Diagnostics Investments Incorporated Detection of gene fusions by intragenic differential expression (ide) using average cycle thresholds
CN105296632A (zh) * 2015-11-03 2016-02-03 暨南大学 一种检测肿瘤组织中EGFRvIII的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
伊强等: "重叠延伸PCR构建EB病毒BMRF1-BZLF1N融合基因", 《临床检验杂志》 *
姜孟孟等: ""多重巢式RT-PCR对骨髓增殖性肿瘤中PDGFRα融合基因的快速检测"", 《中国实验血液学杂志》 *
王保平: ""实时定量聚合酶链反应与巢式聚合酶链反应在101例白血病融合基因检测中的比较"", 《中国卫生产业》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110957005A (zh) * 2019-08-19 2020-04-03 北京康普森生物技术有限公司 扩增子测序用引物的设计及扩增子测序文库的构建方法
CN110957005B (zh) * 2019-08-19 2023-03-24 北京康普森生物技术有限公司 扩增子测序用引物的设计及扩增子测序文库的构建方法
CN110846394A (zh) * 2019-09-25 2020-02-28 广州医科大学附属第一医院(广州呼吸中心) 一种检测肺动脉高压病的alk1基因探针组及其应用
CN112899152A (zh) * 2021-02-02 2021-06-04 中国科学院苏州纳米技术与纳米仿生研究所 核酸快速扩增和检测的微流控芯片、检测方法及系统
CN112899152B (zh) * 2021-02-02 2023-11-17 中国科学院苏州纳米技术与纳米仿生研究所 核酸快速扩增和检测的微流控芯片、检测方法及系统
CN114550817A (zh) * 2022-01-25 2022-05-27 云南大学 基于多特征的ctcf介导染色质环预测方法
CN114550817B (zh) * 2022-01-25 2022-12-23 云南大学 基于多特征的ctcf介导染色质环预测方法
CN115927564A (zh) * 2022-09-29 2023-04-07 杭州联川基因诊断技术有限公司 一种检测生物样本中基因融合的引物组合、试剂盒及方法
CN115927564B (zh) * 2022-09-29 2023-09-12 杭州联川基因诊断技术有限公司 一种检测生物样本中基因融合的引物组合、试剂盒及方法

Also Published As

Publication number Publication date
AU2017290809A1 (en) 2018-12-13
CA3025956A1 (en) 2018-01-04
JP2019526230A (ja) 2019-09-19
US20190185913A1 (en) 2019-06-20
WO2018005983A1 (en) 2018-01-04
EP3510171A4 (en) 2020-04-29
EP3792365A1 (en) 2021-03-17
EP3510171A1 (en) 2019-07-17

Similar Documents

Publication Publication Date Title
CN109415764A (zh) 用于检测核酸突变的组合物和方法
CN110036118B (zh) 用于识别核酸分子的组合物和方法
US20210257048A1 (en) Methods and systems for calling mutations
JP6905934B2 (ja) 腫瘍試料の多重遺伝子分析
US11390905B2 (en) Methods of nucleic acid sample preparation for analysis of DNA
CN107849600A (zh) 用于分子标记的方法、系统、组合物、试剂盒、装置和计算机可读媒体
US20220042087A1 (en) Polynucleotide barcodes for long read sequencing
JP2019532629A5 (zh)
US20220002802A1 (en) Compositions and methods for immune repertoire sequencing
CN114555827A (zh) 用于对相同单细胞中的蛋白质表达、单核苷酸变异和拷贝数变异进行多组学同时检测的方法、系统和设备
US20240060134A1 (en) Methods, systems and apparatus for copy number variations and single nucleotide variations simultaneously detected in single-cells
US20240026440A1 (en) Methods of labelling nucleic acids
WO2019014218A2 (en) SEQUENCING METHOD FOR DETECTION OF GENOMIC REARRANGEMENTS
US20220073983A1 (en) Compositions and methods for immune repertoire sequencing
US20220372566A1 (en) Immune repertoire profiling by primer extension target enrichment
JP2023511200A (ja) 自己免疫疾患および免疫不全疾患における免疫レパートリーバイオマーカー
TWI771847B (zh) 擴增和確定目標核苷酸序列的方法
US20230340602A1 (en) Compositions and methods for immune repertoire monitoring
Frio High-Throughput Technologies: DNA and RNA sequencing strategies and potential

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190301