通过分析甲基化DNA来检测肺肿瘤
本申请要求2016年5月5日提交的美国临时申请序列号62/332,295和2017年2月23日提交的美国临时申请序列号62/462,677的优先权,所述申请各自以引用方式并入本文。
技术领域
本文提供与检测肿瘤相关的技术,并且具体地而非排他地是与用于检测肿瘤诸如肺癌的方法、组合物和相关用途相关的技术。
背景技术
肺癌在美国仍为排行第一的癌症杀手,并且极度需要有效筛选方法。仅肺癌就每年造成221,000例死亡。DNA甲基化特征已在癌症的情况下在DNA启动子区域中显示独特的模式并且具有用于检测肺部恶性肿瘤的潜在应用。然而,需要最佳辨别的标记和标记小组。
发明内容
本文提供一种对组织测定的甲基化的甲基化标记的集合,所述集合对于所有类型的肺癌实现极高的辨别,同时在正常肺组织和良性结节中保持阴性。选自所述集合的标记可单独使用或以小组形式使用,例如以表征血液或体液,从而在肺癌筛选和恶性肿瘤与良性结节的辨别方面有应用。在一些实施方案中,来自所述小组的标记用于区别一种形式的肺癌与另一种形式的肺癌,例如用于区别肺腺癌或大细胞癌的存在与肺小细胞癌的存在,或用于检测混合型病变癌。本文提供用于筛选当从获自受试者的样品检测时提供高信噪比和低背景水平的标记的技术。
具有选自以下的标注的甲基化标记和/或标记小组(例如,一个或多个染色体区域)在研究中通过比较来自肺癌样品的甲基化标记与正常(非癌)样品中的对应标记的甲基化状态来鉴别:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329。
如本文所述,本技术提供对肺癌具有高辨别力并且在一些实施方案中具有在肺癌类型之间的辨别力的多种甲基化标记及其子集(例如,2、3、4、5、6、7、8、9、10、11、12或更多种标记的集合)。实验将选择筛选器应用于候选标记以出于表征生物样品的目的而鉴别提供高信噪比和低背景水平的标记以提供高特异性和选择性,例如用于癌症筛选或诊断。例如,如下文所述的,8种标记SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2和EMX1的组合的甲基化分析在100%特异性的情况下对于全部测试的癌症组织产生98.5%敏感性(134/136癌症)。在另一个实施方案中,6种标记的小组(SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI产生ROC)在93%特异性下产生92.2%敏感性,并且4种标记的小组(ZNF781、BARX1、EMX1和HOXA9)产生96%的总体敏感性和94%的特异性。
因此,本文提供与处理从受试者获得的样品的方法相关的技术,所述方法包括测定所述样品中一种或多种标记基因的甲基化状态。在优选的实施方案中,甲基化标记的甲基化状态通过测量样品中甲基化标记和参考标记的量并且将样品中甲基化标记的量与参考标记的量相比较以确定样品中甲基化标记的甲基化状态来确定。虽然本发明不限于任何一种或多种特定应用,但是所述方法用于例如当甲基化标记的甲基化状态不同于在未患有肿瘤的受试者中测定的该标记的甲基化状态时表征来自患有或疑似患有肺癌的受试者的样品。在优选的实施方案中,甲基化标记包含具有选自以下的标注的染色体区域:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAXchr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329。
在一些实施方案中,本技术包括测定多种标记,例如包括测定2至21种标记、优选2至8种标记、优选4至6种标记的甲基化状态。例如,在一些实施方案中,所述方法包括分析两种或更多种选自以下的标记的甲基化状况:SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2、EMX1、CYP26C1、SOBP、SUCLG2、SHOX2、ZDHHC1、NFIX、FLJ45983、HOXA9、B3GALT6、ZNF781、SP9、BARX1以及SKI。在一些优选的实施方案中,所述方法包括分析一个标记集合的甲基化状况,所述标记集合包含SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2以及EMX1。在一些实施方案中,所述方法包括分析选自以下的标记集合的甲基化状况:由ZNF781、BARX1和EMX1组成的组;由SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI组成的组;由SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2和EMX1组成的组;由SHOX2、SOBP、ZNF781、BTACT、CYP26C1和DLX4组成的组;以及由SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI组成的组。在某些实施方案中,至少一种甲基化标记包括选自ZNF781、BARX1和EMX1的组,并且还包括SOBP和/或HOXA9。
本技术不限于所评定的甲基化状态。在一些实施方案中,评定样品中甲基化标记的甲基化状态包括测定一种碱基的甲基化状态。在一些实施方案中,测定样品中标记的甲基化状态包括测定多种碱基的甲基化程度。此外,在一些实施方案中,标记的甲基化状态包括相对于标记的正常甲基化状态增加的标记的甲基化。在一些实施方案中,标记的甲基化状态包括相对于标记的正常甲基化状态减少的标记的甲基化。在一些实施方案中,标记的甲基化状态包括相对于标记的正常甲基化状态不同的标记甲基化模式。
在一些实施方案中,本技术提供一种生成报告受试者中的肺肿瘤的记录的方法,所述方法包括以下步骤:
a)在获自受试者的样品中测定来自受试者的样品的至少一种选自由以下组成的组的甲基化的甲基化标记基因的量:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329;
b)在所述样品中测定所述样品的参考标记的量;
c)比较所述样品中所述至少一种甲基化的甲基化标记的量与参考标记的量以确定所述样品中所述至少一种甲基化标记的甲基化状态;以及
d)生成报告所述样品中所述至少一种标记基因的甲基化状态的记录,其中所述甲基化标记的甲基化状态指示所述受试者中肺肿瘤的存在或不存在。
在一些实施方案中,测定所述样品中的至少两种标记,并且优选地至少两种甲基化标记基因选自由以下组成的组:SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2、EMX1CYP26C1、SOBP、SUCLG2、SHOX2、ZDHHC1、NFIX、FLJ45983、HOXA9、B3GALT6、ZNF781、SP9、BARX1以及SKI。在某些优选的实施方案中,所述方法包括分析选自以下的标记集合的甲基化状况:由ZNF781、BARX1和EMX1组成的组;由SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI组成的组;由SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2和EMX1组成的组;由SHOX2、SOBP、ZNF781、BTACT、CYP26C1和DLX4组成的组;以及由SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI组成的组。在某些实施方案中,至少一种甲基化标记包括选自ZNF781、BARX1和EMX1的组,并且还包括SOBP和/或HOXA9。在一些实施方案中,甲基化标记被选择来使得所述一种或多种标记的甲基化状况指示肺腺癌、大细胞癌、鳞状细胞癌或小细胞癌中的仅一种。在其他实施方案中,甲基化标记被选择来使得所述一种或多种标记的甲基化状况指示肺腺癌、大细胞癌、鳞状细胞癌和小细胞癌中的多于一种。在其他实施方案中,甲基化标记被选择来使得所述一种或多种标记的甲基化状况指示肺腺癌、大细胞癌、鳞状细胞癌、小细胞癌、一般非小细胞肺癌和/或未定义肺癌中的任一种或其组合。
在一些实施方案中,用于测定的方法包括从受试者获得包含DNA的样品并用选择性修饰所获得DNA中的未甲基化胞嘧啶残基的试剂处理从样品中获得的DNA以产生修饰的残基。在优选的实施方案中,试剂包括亚硫酸氢盐试剂。
在一些实施方案中,测定样品中甲基化标记的甲基化状态包括测定一种碱基的甲基化状态,而在其他实施方案中测定包括测定多个碱基的甲基化程度。在一些实施方案中,标记的甲基化状态包括相对于标记的正常甲基化状态增加或减少的标记的甲基化,例如当标记将出现于非癌样品中时,而在一些实施方案中,标记的甲基化状态包括相对于标记的正常甲基化状态不同的标记的甲基化模式。在优选的实施方案中,所述参考标记为甲基化参考标记。
本技术不限于特定样品类型。例如,在一些实施方案中,样品是组织样品、血液样品、血浆样品、血清样品或痰样品。在某些优选的实施方案中,组织样品包括肺样品。在某些优选的实施方案中,样品包括从血浆中分离的DNA。
本技术不限于测定来自样品的DNA的任何特定方法。例如,在一些实施方案中,测定包括使用聚合酶链反应、核酸测序、质谱、甲基化特异性核酸酶、基于质量的分离和/或靶标捕获。在某些优选的实施方案中,测定包括使用瓣状核酸内切酶测定。在特别优选的实施方案中,样品DNA和/或参考标记DNA是亚硫酸氢盐转化的并且用于测定DNA甲基化水平的测定通过一种技术来实现,本技术包括使用甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制性酶分析、定量亚硫酸氢盐焦磷酸测序、瓣状核酸内切酶测定(例如,QUARTS瓣状核酸内切酶测定)和/或亚硫酸氢盐基因组测序PCR。
本技术也提供试剂盒。例如,在一些实施方案中,本技术提供一种试剂盒,所述试剂盒包括a)至少一种寡核苷酸,其中所述寡核苷酸的至少一部分与选自由以下组成的组的标记特异性杂交:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329。在优选的实施方案中,所述寡核苷酸的与所述标记杂交的部分与包含甲基化标记的亚硫酸氢盐处理的DNA特异性杂交。在一些实施方案中,试剂盒包括至少一种另外的寡核苷酸,其中所述另外的寡核苷酸的至少一部分与参考核酸特异性杂交。在一些实施方案中,所述试剂盒包括至少两种另外的寡核苷酸并且在一些实施方案中,所述试剂盒还包括亚硫酸氢盐试剂。
在某些实施方案中,所述寡核苷酸的至少一部分与选自由以下组成的组的至少一种标记特异性杂交:SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2、EMX1CYP26C1、SOBP、SUCLG2、SHOX2、ZDHHC1、NFIX、FLJ45983、HOXA9、B3GALT6、ZNF781、SP9、BARX1以及SKI。在优选的实施方案中,试剂盒包括寡核苷酸的集合,每种寡核苷酸与标记集合中的一种标记杂交,所述标记集合选自:由ZNF781、BARX1和EMX1组成的组;由SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI组成的组;由SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2和EMX1组成的组;由SHOX2、SOBP、ZNF781、BTACT、CYP26C1和DLX4组成的组;以及由SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI组成的组。在某些实施方案中,甲基化标记的集合包括选自ZNF781、BARX1和EMX1的组,并且还包括SOBP和/或HOXA9。
在一些实施方案中,所述试剂盒中的至少一种寡核苷酸被选择为与指示肺癌例如肺腺癌、大细胞癌、鳞状细胞癌或小细胞癌中的仅一种类型的一种或多种甲基化标记杂交。在其他实施方案中,至少一种寡核苷酸被选择为与指示肺腺癌、大细胞癌、鳞状细胞癌和小细胞癌中的多于一种的一种或多种甲基化标记杂交。在其他实施方案中,至少一种寡核苷酸被选择为与指示肺腺癌、大细胞癌、鳞状细胞癌、小细胞癌和/或未定义肺癌中的任一种或其任何组合的一种或多种甲基化标记杂交。
在优选的实施方案中,试剂盒中提供的一种或多种寡核苷酸选自以下一种或多种:捕获寡核苷酸、核酸引物对、核酸探针和侵入性寡核苷酸。在优选的实施方案中,一种或多种寡核苷酸与包含所述一种或多种甲基化标记的亚硫酸氢盐处理的DNA特异性杂交。
在一些实施方案中,所述试剂盒还包括固体支持体、此磁珠或颗粒。在优选的实施方案中,固体支持体包含一种或多种捕获试剂,例如与所述一种或多种标记基因互补的寡核苷酸。
本技术也提供组合物。例如,在一些实施方案中,本技术提供一种组合物,所述组合物包含一种混合物,例如反应混合物,所述混合物包含选自由以下组成的组的靶标核酸和与所述靶标核酸特异性杂交的寡核苷酸的复合物:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12a、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329。在一些实施方案中,靶标核酸为亚硫酸氢盐转化的靶标核酸。在优选的实施方案中,所述混合物包含选自由以下组成的组的靶标核酸和与所述靶标核酸(无论是未转化还是亚硫酸氢盐转化)特异性杂交的寡核苷酸的复合物:SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2、EMX1、CYP26C1、SOBP、SUCLG2、SHOX2、ZDHHC1、NFIX、FLJ45983、HOXA9、B3GALT6、ZNF781、SP9、BARX1以及SKI。混合物中的寡核苷酸包括但不限于以下一种或多种:捕获寡核苷酸、核酸引物对、杂交探针、水解探针、瓣状测定探针和侵入性寡核苷酸。
在一些实施方案中,所述混合物中的靶标核酸包含选自由以下组成的组的核酸序列:SEQ ID NO:1、6、11、16、21、28、33、38、43、48、53、58、63、68、73、78、86、91、96、101、106、111、116、121、126、131、136、141、146、151、156、161、166、171、176、181、186、191、196、201、214、219、224、229、234、239、247、252、257、262、267、272、277、282、287、292、298、303、308、313、319、327、336、341、346、351、356、361、366、371、384以及403。
在一些实施方案中,所述混合物包含亚硫酸氢盐转化的靶标核酸,所述靶标核酸包含选自由以下组成的组的核酸序列:SEQ ID NO:2、7、12、17、22、29、34、39、44、49、54、59、64、69、74、79、87、92、97、102、107、112、117、122、127、132、137、142、147、152、157、162、167、172、177、182、187、192、197、202、210、215、220、225、230、235、240、248、253、258、263、268、273、278、283、288、293、299、304、309、314、320、328、337、342、347、352、357、362、367、372、385以及404。
在一些实施方案中,所述混合物中的寡核苷酸包含报告分子,并且在优选的实施方案中,所述报告分子包含荧光团。在一些实施方案中,所述寡核苷酸包含瓣状序列。在一些实施方案中,混合物还包含以下一种或多种:FRET盒;FEN-1核酸内切酶和/或热稳定性DNA聚合酶,优选细菌DNA聚合酶。
定义
为了有助于理解本技术,在下文中定义了大量术语和短语。附加的定义在整个详细描述中阐述。
在整个说明书和权利要求书中,除非上下文清楚地另有指明,以下术语采用与本文明确有关的含义。如本文所用的短语“在一个实施方案中”不一定指相同的实施方案,尽管它可能指相同的实施方案。此外,如本文所用的短语“在另一个实施方案中”不一定指不同的实施方案,尽管它可能指不同的实施方案。因此,如下文所述,在不脱离本发明的范围或精神的情况下,本发明的各种实施方案可容易地组合。
另外,除非上下文清楚地另有指明,否则如本文所用的术语“或”是包含性的“或”操作符,并且等于术语“和/或”。术语“基于”不是排他性的,并且允许基于未描述的附加因素,除非上下文清楚地另有指明。另外,在整个说明书中,“一个/种”和“所述”的含义包括复数引用。“在…中”的含义包括“在…中”和“在…上”。
如中本申请的权利要求书中所用的过渡短语“基本上由…组成”将权利要求的范围限制为指定材料或步骤“和不实质改变要求保护的发明的一种或多种基本和新颖特征的那些”,如In re Herz,537 F.2d 549,551-52,190 USPQ 461,463(CCPA 1976)中所讨论的。例如,“基本上由所陈述要素组成”的组合物可以含有一定水平的未陈述污染物,使得尽管存在,但是所述污染物不会改变所陈述组合物与纯组合物,即“基本上由所陈述组分组成”的组合物相比的功能。
如本文所用,“甲基化”是指在胞嘧啶的位置C5或N4处的胞嘧啶甲基化、腺嘌呤的N6位置处的甲基化、或其他类型的核酸甲基化。体外扩增的DNA通常是未甲基化的,因为典型体外DNA扩增方法不会保留扩增模板的甲基化模式。然而,“未甲基DNA”或“甲基化DNA”也可以是指扩增的DNA,其初始模板分别为未甲基化或甲基化的。
因此,如本文所用,“甲基化核苷酸”或“甲基化核苷酸碱基”是指甲基部分中核苷酸碱基上的存在,其中甲基部分不存在于所识别的典型核苷酸碱基中。例如,胞嘧啶在其嘧啶环上不含有甲基部分,但是5-甲基胞嘧啶在其嘧啶环的位置5处含有甲基部分。因此,胞嘧啶不是甲基化核苷酸并且5-甲基胞嘧啶是甲基化核苷酸。中另一个实例中,胸腺嘧啶在其嘧啶环的位置5处含有甲基部分;然而,出于本文中的目的,胸腺嘧啶当存在于DNA中时不被视为甲基化核苷酸,因为胸腺嘧啶是DNA的典型核苷酸碱基。
如本文所用,“甲基化核酸分子”是指含有一个或多个甲基化核苷酸的核酸分子。
如本文所用,核酸分子的“甲基化状态”、“甲基化特征”和“甲基化状况”是指一种或多种甲基化核苷酸碱基在核酸分子中的存在或不存在。例如,含有甲基化胞嘧啶的核酸分子被认为是甲基化的(例如核酸分子的甲基化状态是甲基化的)。不含有任何核苷酸的核酸分子被认为是未甲基化的。在一些实施方案中,如果核酸在特定基因座(例如特定单一CpG二核苷酸的基因座)或基因座特定组合处不是甲基化的,则核酸可表征为“未甲基化”,即使它在相同基因或分子的其他基因座处为甲基化的,也如此。
特定核酸序列(例如,如本文所述的基因标记或DNA区域)的甲基化状态可以指示序列中每个碱基的甲基化状态,或者可以指示序列内所述碱基(例如一个或多个胞嘧啶)的子集的甲基化状态,或者可以在提供或不提供序列内甲基化出现的位置的精确信息的情况下指示关于序列内的区域甲基化密度的信息。如本文所用,术语“标记基因”和“标记”可互换地用于是指与一种病状例如癌症相关的DNA,无论标记区域是否在DNA的编码区域内。标记可包括例如调控区域、侧接区域、基因间区域等。
核酸分子中核苷酸基因座的甲基化状态是指在核酸分子中的特定基因座处的甲基化核苷酸的存在或不存在。例如,当存在于核酸分子的第7个核苷酸处的核苷酸是5-甲基胞嘧啶时,在核酸分子中的第7核苷酸处的胞嘧啶的甲基化状态是甲基化的。类似地,当存在于核酸分子的第7个核苷酸处的核苷酸是胞嘧啶(并且不是5-甲基胞嘧啶)时,在核酸分子中的第7个核苷酸处的胞嘧啶的甲基化状态是未甲基化的。
甲基化状况可以任选地由“甲基化值”表示或指示(例如表示甲基化频率、分数、比率、存在等)。甲基化值可以例如通过定量在用甲基化依赖性限制性酶进行限制性消化之后存在的完整核酸的量或者通过比较亚硫酸氢盐反应之后的扩增特征或者通过比较亚硫酸氢盐处理的和未处理的核酸的序列来生成。因此,值(例如甲基化值)表示甲基化状况并且可因此用作跨越基因座的多个拷贝的甲基化状况的定量指示物。当希望比较样品中的序列的甲基化状况与阈值或参考值时,这是特别有用的。
如本文所用,“甲基化频率”或“甲基化百分比(%)”是指分子或基因座为甲基化的情况数目相对于分子或基因座为未甲基化的情况的数目。
这样,甲基化状态描述了核酸(例如基因组序列)的甲基化的状态。另外,甲基化状态是指在特定基因组基因座处的核酸区段与甲基化相关的特征。此类特征包括但不限于此DNA序列内的任何胞嘧啶(C)残基是否为甲基化的、一个或多个甲基化C残基的位置、贯穿核酸的任何特定区域的甲基化C的频率或百分比以及由于例如等位基因起点的差异而导致的甲基化等位基因差异。术语“甲基化状态”、“甲基化特征”和“甲基化状况”也是指在生物样品中贯穿核酸的任何特定区域的甲基化C或未甲基化C的相对浓度、绝对浓度或模式。例如,如果核酸序列内的一个或多个胞嘧啶(C)残基是甲基化的,则其可称为“超甲基化”或具有“增加的甲基化”,而如果DNA序列内的一个或多个胞嘧啶(C)残基是未甲基化的,则其可称为“去甲基化”或具有“减少的甲基化”。同样地,如果核酸序列内的一个或多个胞嘧啶(C)残基与另一个核酸序列(例如来自不同区域或来自不同个体等)相比是甲基化的,则该序列被认为与其他核酸序列相比是超甲基化的或具有增加的甲基化。或者,如果DNA序列内的一个或多个胞嘧啶(C)残基与另一个核酸序列(例如来自不同区域或来自不同个体等)相比是未甲基化的,则该序列被认为与其他核酸序列相比是去甲基化的或具有减少的甲基化。另外,如本文所用的术语“甲基化模式”是指在核酸的一个区域上的甲基化和未甲基化核苷酸的集合性位点。当甲基化和未甲基化核苷酸的数目贯穿所述区域是相同或类似的但是甲基化和未甲基化核苷酸的位置是不同的时,两种核酸可具有相同或类似的甲基化频率或甲基化百分比,但是具有不同的甲基化模式。当序列的甲基化程度(例如一个相对于另一个具有增加或减少的甲基化)、频率或模式不同时,所述序列被认为是“差异甲基化的”或具有“甲基化差异”或具有“不同的甲基化状态”。术语“差异甲基化”是指癌症阳性样品中的核酸甲基化水平或模式与癌症阴性样品中的核酸甲基化水平或模式相比的差异。其也可以是指在手术之后具有癌症复发的患者对比不具有复发的患者之间的水平或模式的差异。DNA甲基化的差异甲基化和特定水平或模式是预后和预测的生物标记,例如一旦已定义正确截止值或预测特征。
甲基化状态频率可以用于描述个体群体或来自单一个体的样品。例如,具有50%甲基化状态频率的核苷酸基因座在50%情况下是甲基化的并且在50%情况下是未甲基化的。此频率可以用于例如描述在个体群体或核酸集合中核苷酸基因座或核酸区域甲基化的程度。因此,当第一核酸分子群体或集合中的甲基化不同于第二核酸分子群体或集合中的甲基化时,第一群体或集合的甲基化状态或频率将不同于第二群体或集合的甲基化状态频率。此频率也可以用于例如描述在单一个体中核苷酸基因座或核酸区域甲基化的程度。例如,此频率可以用于描述来自组织样品的一组细胞在核苷酸基因座或核酸区域处是甲基化或未甲基化的程度。
如本文所用,“核苷酸基因座”是指核苷酸在核酸分子中的位置。甲基化核苷酸的核苷酸基因座是指甲基化核苷酸在核酸分子中的位置。
通常,人类DNA的甲基化出现于包括相邻鸟嘌呤和胞嘧啶的二核苷酸序列(也称为CpG二核苷酸序列)上,在所述二核苷酸序列中胞嘧啶位于鸟嘌呤的5'处。在人类基因组中CpG二核苷酸内的大部分胞嘧啶是甲基化的,然而一些胞嘧啶在富含特定CpG二核苷酸的基因组区域(也称为CpG岛)中保持未甲基化(参见例如Antequera等人(1990)Cell 62:503–514)。
如本文所用,“CpG岛”是指相对于总基因组DNA含有增加数目的CpG二核苷酸的基因组DNA的富含G:C的区域。CpG岛可为至少100、200或更多个碱基对长度,其中所述区域的G:C含量为至少50%并且所观察到的CpG频率相对于预期频率的比率为0.6;在一些情况下,CpG岛可为至少500个碱基对长度,其中所述区域的G:C含量为至少55%)并且所观察到的CpG频率相对于预期频率的比率为0.65。所观察到的CpG频率相对于预期频率可以根据Gardiner-Garden等人(1987)J.Mol.Biol.196:261–281中提供的方法来计算。例如,所观察到的CpG频率相对于预期频率可以根据公式R=(A×B)/(C×D)计算,其中R是所观察到的CpG频率相对于预期频率的比率,A是所分析序列中CpG二核苷酸的数目,B是所分析序列中核苷酸的总数目,C是所分析序列中C核苷酸的总数目,并且D是所分析序列中G核苷酸的总数目。通常确定在CpG岛中,例如在启动子区域处的甲基化状态。尽管应当理解,人类基因组中的其他序列易于DNA甲基化诸如CpA和CpT(参见Ramsahoye(2000)Proc.Natl.Acad.Sci.USA 97:5237–5242;Salmon和Kaye(1970)Biochim.Biophys.Acta.204:340–351;Grafstrom(1985)Nucleic Acids Res.13:2827–2842;Nyce(1986)Nucleic Acids Res.14:4353–4367;Woodcock(1987)Biochem.Biophys.Res.Commun.145:888-894)。
如本文所用,“甲基化特异性试剂”是指随着核酸分子甲基化状态的变化而修饰核酸分子的核苷酸的试剂,或者甲基化特异性试剂是指可以反映核酸分子的甲基化状态的方式改变核酸分子的核苷酸序列的化合物或组合物或其他试剂。用此试剂处理核酸分子的方法可包括将核酸分子与试剂接触,根据需要与额外步骤结合以实现核苷酸序列的所需改变。此类方法可以未甲基化核苷酸(例如每个未甲基化胞嘧啶)被修饰成不同核苷酸的方式应用。例如,在一些实施方案中,此试剂可以使未甲基化胞嘧啶核苷酸脱氨基以产生脱氧尿嘧啶残基。示例性试剂是亚硫酸氢盐试剂。
术语“亚硫酸氢盐试剂”是指包含亚硫酸氢盐、焦亚硫酸盐、酸式亚硫酸盐或其组合的试剂,如本文所公开的,适用于区分甲基化与未甲基化CpG二核苷酸序列。所述处理的方法在本领域中是已知的(例如,PCT/EP2004/011715和WO 2013/116375,其各自全文以引用方式并入)。在一些实施方案中,亚硫酸氢盐处理在变性试剂(诸如但不限于正亚烷基二醇或二乙二醇二甲基醚(DME))存在下进行或在二氧杂环己烷或二氧杂环己烷衍生物存在下进行。在一些实施方案中,变性试剂以1%与35%(v/v)之间的浓度使用。在一些实施方案中,亚硫酸氢盐反应在清除剂存在下进行,所述清除剂诸如但不限于苯并二氢吡喃衍生物,例如6-羟基-2,5,7,8,-四甲基苯并二氢吡喃2-羧酸或三羟基苯甲酸以及其衍生物,例如没食子酸(参见:PCT/EP2004/011715,其全文以引用方式并入)。在某些优选的实施方案中,亚硫酸氢盐反应包括用亚硫酸氢铵处理,例如,如WO 2013/116375所述的。
通过甲基化特异性试剂进行的核酸核苷酸序列的改变也产生每个甲基化核苷酸被修饰成不同核苷酸的核酸分子。
术语“甲基化测定”是指用于确定核酸序列内一个或多个CpG二核苷酸序列的甲基化状态的任何测定。
如本文所用,给定标记(或一起使用的标记集合)的“敏感性”是指报告DNA甲基化值高于阈值的样品百分比,所述阈值区分肿瘤与非肿瘤样品。在一些实施方案中,阳性被定义为报告DNA甲基化值高于阈值(例如,与疾病相关的范围)的组织学确认的肿瘤,并且假阴性被定义为报告DNA甲基化值低于阈值(例如,与无疾病相关的范围)的组织学确认的肿瘤。因此,敏感性值反映以下可能性:从已知患病样品获得的给定标记的DNA甲基化测量值将处于疾病相关性测量值的范围内。如在此所定义的,所计算的敏感性值的临床相关性表示以下可能性的估值:给定标记当应用于患有临床病状的受试者时将检测到该病状的存在。
如本文所用,给定标记(或一起使用的标记集合)的“特异性”是指报告DNA甲基化值低于阈值的非肿瘤样品百分比,所述阈值区分肿瘤与非肿瘤样品。在一些实施方案中,阴性被定义为报告DNA甲基化值低于阈值(例如,与无疾病相关的范围)的组织学确认的非肿瘤样品,并且假阳性被定义为报告DNA甲基化值高于阈值(例如,与疾病相关的范围)的组织学确认的非肿瘤样品。因此,特异性值反映以下可能性:从已知非肿瘤样品获得的给定标记的DNA甲基化测量值将处于非疾病相关性测量值的范围内。如在此所定义的,所计算的特异性值的临床相关性表示以下可能性的估值:给定标记当应用于未患有临床病状的受试者时将检测到该病状不存在。
如本文所用,“所选核苷酸”是指核酸分子中四种通常出现的核苷酸(对于DNA为C、G、T和A并且对于RNA为C、G、U和A)中的一种核苷酸,并且可包括通常出现的核苷酸的甲基化衍生物(例如,当C为所选的核苷酸时,值所选的核苷酸的含义内包括甲基化和未甲基化C),而甲基化所选核苷酸特别地是指通常甲基化的核苷酸并且未甲基化的所选核苷酸特别地是指通常以未甲基化形式出现的核苷酸。
术语“甲基化特异性限制性酶”或“甲基化敏感性限制性酶”是指根据其识别位点的甲基化状态选择性消化核酸的酶。在识别位点是未甲基化或半甲基化的时特异性切割的限制性酶的情况下,如果识别位点是甲基化的,则该切割将不会发生或者将以显著减小的效率发生。在识别位点是甲基化的时特异性切割的限制性酶的情况下,如果识别位点是未甲基化的,则该切割将不会发生或者将以显著减小的效率发生。优选甲基化特异性限制性酶,所述限制性酶的识别序列含有CG二核苷酸(例如识别序列,诸如CGCG或CCCGGG)。对于一些实施方案进一步优选的是在此二核苷酸中的胞嘧啶在碳原子C5处是甲基化的时不会切割的限制性酶。
术语“引物”是指下述寡核苷酸:所述寡核苷酸无论是作为例如来自限制性消化的核酸片段天然存在还是以合成方式产生,当置于其中诱导与核酸模板链互补的引物延伸产物的合成的条件下(例如,在核苷酸和诱导剂诸如DNA聚合酶存在下并且在适合的温度和pH下)时能够用作合成起始点。为了获得扩增中的最大效率,引物优选地是单链,但是可替代地是双链。如果为双链的,则引物首先进行处理来将其链分开,然后用于制备延伸产物。优选地,引物为寡脱氧核苷酸。引物必须足够长以在诱导剂存在下引发延伸产物的合成。引物的确切长度取决于许多因素,包括温度、引物来源和使用方法。
术语“探针”是指下述寡核苷酸(例如核苷酸的序列):所述寡核苷酸无论是在纯化的限制性消化中天然存在或合成、重组或通过PCR扩增产生,能够与另一种目标寡核苷酸杂交。探针可为单链或双链。探针适用于检测、鉴别和分离特定基因序列(例如“捕获探针”)。预期在一些实施方案中,本发明中所用的任何探针可以用任何“报告分子”标记,使得在任何检测系统中可检测,所述检测系统包括但不限于酶(例如ELISA以及酶基组织化学测定)、荧光、放射性和发光系统。不希望本发明限于任何特定系统或标签。
如本文所用的术语“靶标”是指旨在从其他核酸中分选出来的核酸,例如通过探针结合、扩增、分离、捕获等。例如,当参考聚合酶链反应使用时,“靶标”是指核酸的由用于聚合酶链反应的引物结合的区域,而当用于靶标DNA未扩增的测定中时,例如在侵入性裂解测定的一些实施方案中,靶标包含探针和侵入性寡核苷酸(例如INVADER寡核苷酸)结合以形成侵入性裂解结构,使得可以检测靶标核酸的存在的位点。“区段”被定义为在靶标序列内的核酸区域。
如本文所用的术语“标记”是指可以用于例如基于标记物质的存在、不存在或状况(例如甲基化状态)区分非正常细胞(例如癌细胞)与正常细胞(非癌细胞)的物质(例如核酸或核酸的区域或蛋白质)。如本文所用,标记的“正常”甲基化是指正常细胞,例如非癌细胞中通常可见的甲基化程度。
如本文所用的术语“肿瘤”是指任何新的和异常的组织生长。因此,肿瘤可以是恶化前的肿瘤或恶性肿瘤。
如本文所用的术语“肿瘤特异性标记”是指可以用于指示肿瘤的存在的任何生物材料或元素。生物材料的实例包括但不限于核酸、多肽、碳水化合物、脂肪酸、细胞组分(例如细胞膜和线粒体)以及全细胞。在一些情况下,标记是特别的核酸区域(例如基因、基因间区域、特定基因座等)。核酸的作为标记的区域可以称为例如“标记基因”、“标记区域”、“标记序列”、“标记基因座”等。
术语“样品”以其最广泛的意义使用。在一种意义中,其可以是指动物细胞或组织。在另一种意义上,其是指从任何来源获得的试样或培养物,以及生物和环境样品。生物样品可从植物或动物(包括人类)获得,并且涵盖流体、固体、组织和气体。环境样品包括环境材料诸如地表物质、土壤、水和工业样品。这些实例不能理解为限制适用于本发明的样品类型。
如本文所用,术语“患者”或“受试者”是指经历由本技术提供的各种测试的生物体。术语“受试者”包括动物,优选哺乳动物,包括人类。在一个优选实施方案中,受试者为灵长类动物。在甚至更优选的实施方案中,受试者是人类。此外,关于诊断方法,优选受试者是脊椎动物受试者。优选的脊椎动物是温血的;优选的温血脊椎动物是哺乳动物。优选的哺乳动物最优选地是人类。如本文所用,术语“受试者”包括人类和动物受试者二者。因此,本文中提供兽医治疗用途。因此,本技术提供了哺乳动物的诊断,诸如人类以及那些由于濒危而对人类具有重要意义的哺乳动物(诸如西伯利亚虎);对人类具有经济价值的哺乳动物(诸如农场饲养的用于人类消费的动物);和/或对人类具有社会价值的动物(诸如宠物或动物园中的动物)。这类动物的实例包括但不限于:食肉动物,诸如猫和狗;猪类,包括猪(pig)、猪(hog)和野猪;反刍动物和/或有蹄动物,诸如牛、公牛、绵羊、长颈鹿、鹿、山羊、野牛和骆驼;鳍足类动物;以及马。因此,还提供了家畜的诊断和治疗,包括但不限于驯养的猪类、反刍动物、有蹄动物、马(包括赛马)等等。目前公开的主题进一步包括一种用于诊断受试者中的肺癌的系统。所述系统可以例如作为商用试剂盒提供,所述商用试剂盒可用于在已收集生物样品的受试者中筛选肺癌的风险或诊断肺癌。根据本技术提供的示例性系统包括评定本文所述的标记的甲基化状态。
在核酸背景下术语“扩增(amplifying/amplification)”是指多核苷酸或所述多核苷酸的多个拷贝的一部分的产生,其通常由少量多核苷酸(例如单一多核苷酸分子)开始,其中扩增产物或扩增子通常是可检测的。多核苷酸的扩增涵盖多种化学和酶促过程。在聚合酶链反应(PCR)或连接酶链反应(LCR;参见例如美国专利号5,494,810;全文以引用方式并入本文中)期间由靶标或模板DNA分子的一个或几个拷贝生成多个DNA拷贝是扩增的形式。另外的扩增类型包括但不限于等位基因特异性PCR(参见例如美国专利号5,639,611;全文以引用的方式并入本文)、装配PCR(参见例如美国专利号5,965,408;全文以引用的方式并入本文)、解旋酶依赖性扩增(参见例如美国专利号7,662,594;全文以引用的方式并入本文)、热启动PCR(参见例如美国专利号5,773,258和5,338,671;其各自全文以引用的方式并入本文)、序列间特异性PCR、反向PCR(参见例如Triglia等人(1988)Nucleic Acids Res.,16:8186;全文以引用的方式并入本文)、连接介导的PCR(参见例如Guilfoyle,R.等人,Nucleic Acids Research,25:1854-1858(1997);美国专利号5,508,169;其各自全文以引用的方式并入本文),methylation-specific PCR(参见例如Herman等人,(1996)PNAS 93(13)9821-9826;全文以引用的方式并入本文)、微型引物PCR、多重连接依赖性探针扩增(参见例如Schouten等人,(2002)Nucleic Acids Research 30(12):e57;全文以引用的方式并入本文)、多重PCR(参见例如Chamberlain等人,(1988)Nucleic Acids Research 16(23)11141-11156;Ballabio等人,(1990)Human Genetics 84(6)571-573;Hayden等人,(2008)BMC Genetics 9:80;其各自全文以引用的方式并入本文)、嵌套式PCR、重叠延伸PCR(参见例如Higuchi等人,(1988)Nucleic Acids Research 16(15)7351-7367;全文以引用的方式并入本文)、实时PCR(参见例如Higuchi等人,(1992)Biotechnology 10:413-417;Higuchi等人,(1993)Biotechnology 11:1026-1030;其各自全文以引用的方式并入本文)、逆转录PCR(参见例如Bustin,S.A.(2000)J.Molecular Endocrinology 25:169-193;全文以引用的方式并入本文)、固相PCR、热不对称交错PCR以及递降PCR(参见例如Don等人,NucleicAcids Research(1991)19(14)4008;Roux,K.(1994)Biotechniques 16(5)812-814;Hecker等人,(1996)Biotechniques 20(3)478-485;其各自全文以引用的方式并入本文)。多核苷酸扩增也使用数字PCR实现(参见例如Kalinina等人,Nucleic Acids Research.25;1999-2004,(1997);Vogelstein和Kinzler,Proc Natl Acad Sci USA.96;9236-41,(1999);国际专利公布号WO05023091A2;美国专利公布号20070202525;其各自全文以引用的方式并入本文)。
术语“聚合酶链反应”(“PCR”)是指K.B.Mullis美国专利号4,683,195、4,683,202和4,965,188的方法,所述文献描述了一种用于在未克隆或扩增的情况下增加基因组或其他DNA或RNA的混合物中靶标序列区段的浓度的方法。这种用于扩增靶标序列的方法由以下各项组成:将大量的两种寡核苷酸引物引入到含有所需靶标序列的DNA混合物中,接着在DNA聚合酶存在下引入热循环的精确序列。两种引物与双链靶标序列的相应链互补。为了实现扩增,使混合物变性并且然后使引物退火到其在靶标分子内的互补序列上。在退火后,使用聚合酶延伸所述引物以便形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可重复许多次(即,变性、退火和延伸构成一个“循环”;可存在许多个“循环”),以获得高浓度的所需靶标序列的扩增区段。所需靶标序列的扩增区段的长度通过所述引物相对于彼此的相对位置来确定,并且因此,此长度为可控制的参数。通过重复所述过程的方面,所述方法被称为“聚合酶链反应”(“PCR”)。因为靶标序列的所需扩增区段在混合物中变成主要序列(就浓度而言),所以它们被称为“PCR扩增的”并且是“PCR产物”或“扩增子”。本领域技术人员将理解,术语“PCR”涵盖最初描述的使用例如实时PCR、嵌套式PCR、逆转录PCR(RT-PCR)、单一引物和任意引物PCR等的方法的许多变体。
如本文所用,术语“核酸检测测定”是指确定目标核酸的核苷酸组成的任何方法。核酸检测测定包括但不限于DNA测序方法、探针杂交方法、结构特异性裂解测定(例如,INVADER测定,(Hologic,Inc.)并且描述于例如美国专利号5,846,717、5,985,557、5,994,069、6,001,567、6,090,543和6,872,816;Lyamichev等人,Nat.Biotech.,17:292(1999),Hall等人,PNAS,USA,97:8272(2000),以及美国专利号9,096,893,其各自出于所有目的全文以引用的方式并入本文);酶错配裂解方法(例如,Variagenics,美国专利号6,110,684、5,958,692、5,851,770,其全文以引用的方式并入本文);以上所述的聚合酶链反应(PCR);分支杂交方法(例如,Chiron,美国专利号5,849,481、5,710,264、5,124,246和5,624,802,其全文以引用的方式并入本文);滚环式复制(例如,美国专利号6,210,884、6,183,960和6,235,502,其全文以引用的方式并入本文);NASBA(例如,美国专利号5,409,818,其全文以引用的方式并入本文);分子信标技术(例如,美国专利号6,150,097,其全文以引用的方式并入本文);E-传感器技术(Motorola,美国专利号6,248,229、6,221,583、6,013,170和6,063,573,其全文以引用的方式并入本文);环状探针技术(例如美国专利号5,403,711、5,011,769和5,660,988,其全文以引用的方式并入本文);Dade Behring信号扩增方法(例如美国专利号6,121,001、6,110,677、5,914,230、5,882,867和5,792,614,其全文以引用的方式并入本文);连接酶链反应(例如,Baranay Proc.Natl.Acad.Sci USA 88,189-93(1991));以及夹心杂交方法(例如,美国专利号5,288,609,其全文以引用的方式并入本文)。
在一些实施方案中,靶标核酸被扩增(例如,通过PCR)并且扩增的核酸同时使用侵入性裂解测定来检测。配置用于执行检测测定(例如侵入性裂解测定)的测定与扩增测定的组合描述于美国专利号9,096,893中,所述专利出于所有目的全文以引用的方式并入本文。额外扩增加上侵入性裂解检测配置(称为QuARTS方法)描述于例如美国专利号8,361,720;8,715,937;8,916,344;以及9,212,392,所述专利各自出于所有目的以引用的方式并入本文。如本文所用的术语“侵入性裂解结构”是指包含以下各项的裂解结构:i)靶标核酸、ii)上游核酸(例如,侵入性或“INVADER”寡核苷酸)以及iii)下游核酸(例如,探针),其中所述上游和下游核酸退火至靶标核酸的连续区域,并且其中重叠在上游核酸的3′部分与介于下游核酸与靶标核酸之间形成的双链体之间形成。在以下情况下发生重叠:来自上游和下游核酸的一个或多个碱基占据与靶标核酸碱基相同的位置,无论所述上游核酸的一个或多个重叠碱基是否与靶标核酸互补,并且无论那些碱基是否是天然碱基或非天然碱基。在一些实施方案中,上游核酸的与下游双链体重叠的3′部分是非碱基化学部分,诸如芳族环结构,例如,如美国专利号6,090,543所公开的,所述专利全文以引用的方式并入本文。在一些实施方案中,核酸中的一个或多个可彼此附接,例如通过共价键诸如核酸茎环,或者通过非核酸化学键(例如多碳链)。如本文所用,术语“瓣状核酸内切酶测定”包括如以上所述的“INVADER”侵入性裂解测定和QuARTS测定。
术语“探针寡核苷酸”或“瓣状寡核苷酸”当参考瓣状测定使用时是指与靶标核酸相互作用以在侵入性寡核苷酸存在下形成裂解结构的寡核苷酸。
术语“侵入性寡核苷酸”是指在与探针和靶标核酸之间的杂交区域相邻的位置处与靶标核酸杂交的寡核苷酸,其中侵入性寡核苷酸的3'端包含与探针和靶标之间的杂交区域重叠的部分(例如化学部分或一个或多个核苷酸)。侵入性寡核苷酸的3'端核苷酸可以或可以不与靶标中的核苷酸碱基配对。在一些实施方案中,侵入性寡核苷酸在其3'端含有与位于探针寡核苷酸的退火至靶链的部分的5'端处的序列基本上相同的序列。
如本文所用的术语“瓣状核酸内切酶”或“FEN”是指在具有含有单链5'突出部的双链体或在由核酸另一条链置换(例如,使得在单链和双链DNA之间的接合处存在重叠核苷酸)的一条链上具有瓣状物的DNA结构上用作结构特异性核酸内切酶的一类溶核酶,通常为5'核酸酶。FEN催化磷酸二酯键在单链和双链DNA的接点处水解裂解,从而释放突出部或瓣状物。瓣状核酸内切酶由Ceska和Savers(Trends Biochem.Sci.1998 23:331-336)和Liu等人(Annu.Rev.Biochem.200473:589-615;所述文献全文以引用方式并入本文)审查。FEN可为单个酶、多亚基酶,或者可作为另一种酶或蛋白质复合物(例如,DNA聚合酶)的活性而存在。
瓣状核酸内切酶可为热稳定性的。例如,来自归档的嗜热生物体的FEN-1瓣状核酸内切酶是典型热稳定性的。如本文所用,术语“FEN-1”是指来自真核生物或古细菌生物体的非聚合酶瓣状核酸内切酶。参见例如WO 02/070755和Kaiser M.W.等人(1999)J.Biol.Chem.,274:21387,所述文献出于所有目的全文以引用方式并入本文中。
如本文所用,术语“裂解瓣状物”是指为瓣状测定的裂解产物的单链寡核苷酸。
术语“盒”当参考瓣状裂解反应使用时是指配置成响应于瓣状物或探针寡核苷酸的裂解(例如在瓣状裂解测定中形成的初级结构或第一裂解结构)而生成可检测信号的寡核苷酸或寡核苷酸组合。在优选的实施方案中,所述盒与通过裂解瓣状寡核苷酸产生的非靶标裂解产物杂交以形成二级重叠裂解结构,使得所述盒然后可由同一酶例如FEN-1核酸内切酶裂解。
在一些实施方案中,所述盒是包含发夹部分的单一寡核苷酸(即,其中盒寡核苷酸的一个部分与同一寡核苷酸的第二部分在反应条件下杂交以形成双链体的区域)。在其他实施方案中,盒包含至少两个寡核苷酸,其包含可在反应条件下形成双链体的互补部分。在优选的实施方案中,盒包含标签,例如荧光团。在特别优选的实施方案中,盒包含产生FRET效应的标记部分。
如本文所用,术语“FRET”是指荧光共振能量转移,这是其中部分(例如荧光团)例如在其本身中或从荧光团到非荧光团(例如淬灭剂分子)转移能量的过程。在一些情况下,FRET涉及经由短范围(例如约10nm或更小)偶极-偶极相互作用将能量转移到低能量受体荧光团的激发的供体荧光团。在其他情况下,FRET涉及来自供体的荧光能量的损失和受体荧光团中的荧光增加。还在其他形式的FRET中,能量可以从激发的供体荧光团交换至非荧光分子(例如,“黑暗”淬火分子)。FRET为本领域技术人员已知的并且已得到描述(参见例如Stryer等人,1978,Ann.Rev.Biochem.,47:819;Selvin,1995,Methods Enzymol.,246:300;Orpana,2004 Biomol Eng 21,45-50;Olivier,2005Mutant Res 573,103-110,所述文献各自全文以引用方式并入本文)。
在示例性瓣状检测测定中,侵入性寡核苷酸和瓣状寡核苷酸与靶标核酸杂交以产生具有如上所述的重叠的第一复合物。在瓣状寡核苷酸的5'端上包含未配对“瓣状物”。第一复合物为瓣状核酸内切酶例如FEN-1核酸内切酶的底物,所述核酸内切酶裂解瓣状寡核苷酸以释放5'瓣状部分。在次级反应中,释放的5'瓣状产物用作FRET盒上的侵入性寡核苷酸,以再次形成由瓣状核酸内切酶识别的结构,使得FRET盒得到切割。当荧光团和淬灭剂通过裂解FRET盒来分离时,产生高于背景荧光的可检测荧光信号。
如本文参考核酸扩增或信号扩增的检测所用的术语“实时”是指在反应进行中时,例如在孵育或热循环期间反应中产物或信号积累的检测或测量。此检测或测量可同时发生,或者其可在扩增反应过程期间的多个离散点时发生,或者其可为组合。例如,在聚合酶链反应中,可在全部或部分热循环期间同时发生检测(例如荧光检测),或者可在一个或多个循环期间的一个或多个点时瞬时发生检测。在一些实施方案中,PCR或QuARTS反应的实时检测通过确定在多个循环中的每个循环中或在每个循环中的同一点(例如循环中的时间点或循环中的温度步骤)时的荧光水平来实现。扩增的实时检测也可称为在扩增反应“期间”的检测。
如本文所用,术语“定量扩增数据集”是指在靶标样品例如靶标DNA的定量扩增期间获得的数据。在定量PCR或QuARTS测定的情况下,定量扩增数据集为在扩增期间,例如在多个热循环或全部热循环期间获得的荧光值的集合。定量扩增的数据不限于在反应的任何特定点时收集的数据,并且应该可在每个循环的离散点时测量或贯穿每个循环连续测量。
如本文参考值实时PCR和PCR+INVADER测定期间收集的数据使用的缩写“Ct”和“Cp”是指跨越预定阈值的信号(例如荧光信号)指示正信号的循环。已使用各种方法计算用作信号对比浓度的决定因素的阈值,并且所述值通常表示为“跨越阈值”(Ct)或“跨越点”(Cp)。Cp值或Ct值可用于本文呈现的用于分析实时信号以确定测定或样品中变体和/或非变体组成的百分比的方法的实施方案中。
如本文所用,术语“试剂盒”是指递送材料的任何递送系统。在反应测定的情况下,这类输送系统包括允许存储、运输反应试剂(例如,适当容器中的寡核苷酸、酶等)和/或支持材料(例如,缓冲剂、执行测定的书面指令等)或将其从一个位置输送至另一个位置的系统。举例来说,试剂盒包括一个或多个套罩(例如,盒),其含有相关反应试剂和/或支持材料。如本文使用,术语“零散试剂盒”是指包括两个或更多个单独容器的输送系统,每个容器含有全部试剂盒组分的子部分。这些容器可共同或单独输送至预定接受者。举例来说,第一容器可含有用于测定的酶,而第二容器含有寡核苷酸。
如本文所用的术语“系统”是指出于特定目的使用的物品的集合。在一些实施方案中,物品包括使用说明书,作为例如物品、纸或可记录介质(例如DVD、CD、闪存驱动器等)上供应的信息。在一些实施方案中,说明书引导使用者到在线位置,例如网站。
如本文所用,术语“信息”是指事实或数据的任何集合。参考使用一个或多个计算机系统(包括但不限于因特网)储存或加工的信息,所述术语是指以任何格式(例如对话、数字、光等)存储的任何数据。如本文所用,术语“与受试者相关的信息”是指关于受试者(例如人类、植物或动物)的事实或数据。术语“基因组信息”是指关于基因组的信息,包括但不限于核酸序列、基因、甲基化百分比、等位基因频率、RNA表达水平、蛋白质表达、与基因型相关的表型等。“等位基因频率信息”是指关于等位基因频率的事实或数据,包括但不限于等位基因身份、等位基因的存在与受试者(例如人类受试者)的特征之间的统计相关性、个体或群体中等位基因的存在或不存在、等位基因存在于具有一种或多种特定特征的个体中的可能性百分比等。
附图简述
图1示出未转化形式和亚硫酸氢盐转化形式的标记靶标区域的示意图。示出用于检测亚硫酸氢盐转化的靶标DNA的瓣状测定引物和探针。
图2-5提供比较简化基因组甲基化测序(RRBS,Reduced RepresentationBisulfite Sequencing)结果以用于选择与肺癌相关的如实施例2所述的标记的表格,其中每行示出所指示的标记区域的平均值(通过染色体和起始和终止位置所鉴别)。对于每个区域示出每种组织类型(正常(Norm)、腺癌(Ad)、大细胞癌(LC)、小细胞癌(SC)、鳞状细胞癌(SQ)和未定义癌症(UND))的平均甲基化与来自正常受试者的血沉棕黄层样品(WBC或BC))的平均甲基化相比的比率,并且指示用每个区域标识的基因和转录物。
图2提供比较RRBS结果以用于选择与肺腺癌相关的标记的表格。
图3提供比较RRBS结果以用于选择与肺大细胞癌相关的标记的表格。
图4提供比较RRBS结果以用于选择与肺小细胞癌相关的标记的表格。
图5提供比较RRBS结果以用于选择与肺鳞状细胞癌相关的标记的表格。
图6提供具有对应SEQ ID NO的测定靶标和检测寡核苷酸的核酸序列的表格。
图7提供示出来自实施例3的使用标记SHOX2、SOBP、ZNF781、BTACT、CYP26C1和DLX4获得的数据的6标记逻辑拟合的图表。ROC曲线分析示出0.973的曲线下面积(AUC)。
图8提供示出来自实施例3的使用标记SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI获得的数据的6标记逻辑拟合的图表。ROC曲线分析示出0.97982的曲线下面积(AUC)。
具体实施方案
本文提供与选择用于测定中的核酸标记以用于检测和定量DNA例如甲基化DNA并中核酸检测测定中使用所述标记相关的技术。具体地,本技术设计使用甲基化测定检测肺癌。
在各种实施方案的该详细描述中,出于解释的目的,阐述了大量具体的细节,以提供对所公开的实施方案的透彻理解。然而,本领域的技术人员将理解,可利用或无需这些具体的细节来实践这些各种实施方案。在其他情况下,结构和设备以框图的形式示出。另外,本领域的技术人员能够容易地理解,方法呈现和执行的特定顺序是说明性的,并且可以设想所述顺序可以改变且仍保持在本文公开的各种实施方案的精神和范围内。
在一些实施方案中,标记为100个或更少个碱基的区域,标记为500个或更少个碱基的区域,标记为1000个或更少个碱基的区域,标记为5000个或更少个碱基的区域,或者在一些实施方案中标记为一个碱基。在一些实施方案中,标记为高CpG密度启动子。
本技术不受样品类型的限制。例如,在一些实施方案中,样品是粪便样品、组织样品、痰、血液样品(例如血浆、血清、全血)、排泄物或尿液样品。
另外,本技术不限于用于确定甲基化状态的方法。在一些实施方案中,测定包括使用甲基化特异性聚合酶链反应、核酸测序、质谱、甲基化特异性核酸酶、基于质量的分离或靶标捕获。在一些实施方案中,测定包括使用甲基化特异性寡核苷酸。在一些实施方案中,本技术使用大量平行测序(例如下一代测序)来确定甲基化状态,例如合成测序、实时(例如单分子)测序、珠粒乳液测序、纳米孔测序等。
本技术提供用于检测差异甲基化的区域(DMR)的试剂。在一些实施方案中,提供一种寡核苷酸,所述寡核苷酸包含以下序列:与具有选自BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329的标注的染色体区域互补,优选地与选自子集SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2、EMX1、CYP26C1、SOBP、SUCLG2、SHOX2、ZDHHC1、NFIX、FLJ45983、HOXA9、B3GALT6、ZNF781、SP9、BARX1和SKI的标记互补;或者与选自限定以下各项的任何标记子集的标记互补:选自由ZNF781、BARX1和EMX1组成的组;选自由SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI组成的组;选自由SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2和EMX1组成的组;选自由SHOX2、SOBP、ZNF781、BTACT、CYP26C1和DLX4组成的组;或者选自由SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI组成的组。
提供试剂盒实施方案,例如包含以下各项的试剂盒:亚硫酸氢盐试剂;以及对照核酸,所述对照核酸包含具有选自以下的标注的染色体区域:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329,优选地来自如上所述的任何标记子集,并且具有与未患有癌症(例如肺癌)的受试者相关的甲基化状态。在一些实施方案中,试剂盒包括亚硫酸氢盐试剂和如本文所述的寡核苷酸。在一些实施方案中,试剂盒包括亚硫酸氢盐试剂和对照核酸,所述对照核酸包含来自此染色体区域的序列并具有与患有肺癌的受试者相关的甲基化状态。
本技术涉及组合物(例如反应混合物)的实施方案。在一些实施方案中,提供一种包含核酸和亚硫酸氢盐试剂的组合物,所述核酸包含具有选自以下的标注的染色体区域:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329,优选地来自如上所述的任何标记子集。一些实施方案提供一种包含核酸和如本文所述的寡核苷酸的组合物,所述核酸包含具有选自以下的标注的染色体区域:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAXchr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329,优选地来自如上所述的任何标记子集。一些实施方案提供一种包含核酸和甲基化敏感性限制性酶的组合物,所述核酸包含具有选自以下的标注的染色体区域:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329,优选地来自如上所述的任何标记子集。一些实施方案提供一种包含核酸和聚合酶的组合物,所述核酸包含具有选自以下的标注的染色体区域:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329,优选地来自如上所述的任何标记子集。
提供用于在从受试者获得的样品中筛选肿瘤(例如肺癌)的另外相关方法实施方案,例如一种方法包括确定样品中标记的甲基化状态,所述标记包含具有选自以下的标注的染色体区域中的碱基:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1和ZNF329,优选地来自如上所述的任何标记子集;比较来自所述受试者样品的标记的甲基化状态与来自未患有肺癌的受试者的正常对照样品的标记的甲基化状态;以及确定所述受试者样品与正常对照样品的甲基化状态的差异的置信区间和/或p值。在一些实施方案中,置信区间为90%、95%、97.5%、98%、99%、99.5%、99.9%或者99.99%并且p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001或0.0001。方法的一些实施方案提供以下步骤:将包含具有选自以下的标注的染色体区域的核酸与亚硫酸氢盐试剂反应以产生亚硫酸氢盐反应的核酸:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1和ZNF329,优选地来自如上所述的任何标记子集;对所述亚硫酸氢盐反应的核酸进行测序以提供所述亚硫酸氢盐反应的核酸的核苷酸序列;比较所述亚硫酸氢盐反应的核酸的核苷酸序列与包含来自未患有肺癌的受试者的染色体区域的核酸的核苷酸序列以鉴别两种序列的差异;以及当存在差异时将所述受试者鉴别为患有肿瘤。
通过本技术提供用于在从受试者获得的样品中筛选肺癌的系统。系统的示例性实施方案包括例如一种用于在从受试者获得的样品中筛选肺癌的系统,所述系统包括被配置成确定样品的甲基化状态的分析部件、被配置成比较所述样品的甲基化状态与数据库中记录的对照样品或参考样品甲基化状态、以及被配置成警告使用者癌症相关的甲基化状态的警告。在一些实施方案中通过接收来自多个测定的结果的软件部件确定警告(例如,确定多种标记的甲基化状态,例如具有选自以下的标注的染色体区域,以及基于所述多个结果计算报告的值或结果:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329,优选地来自如上所述的任何标记子集。一些实施方案提供与具有选自以下的标注的每个染色体区域相关的加权参数的数据库,在本文中提供用于计算使用者(例如像外科医生、护士、临床医生等)报告的值或结果和/或警告:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAXchr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329,优选地来自如上所述的任何标记子集。在一些实施方案中,报告来自多个测定的全部结果,并且在一些实施方案中,使用一个或多个结果以基于来自多个测定的指示受试者肺癌风险的一个或多个结果的组合提供评分、值或结果。
在系统的一些实施方案中,样品包含核酸,所述核酸包含具有选自以下的标注的染色体区域:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329,优选地来自如上所述的任何标记子集。在一些实施方案中,所述系统还包括用于分离核酸的部件、用于收集样品的部件,诸如用于收集粪便样品的部件。在一些实施方案中,所述系统包含核酸序列,所述核酸序列包含具有选自以下的标注的染色体区域:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAXchr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329,优选地来自如上所述的任何标记子集。在一些实施方案中,数据集包含来自未患有肺癌的受试者的核酸序列。还提供核酸,例如核酸集合,每种核酸具有包含具有选自以下的标注的染色体区域的序列:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329,优选地来自如上所述的任何标记子集。
相关系统实施方案包括所述的核酸集合和与所述核酸集合相关的核酸序列的数据库。一些实施方案还包括亚硫酸氢盐试剂。而且,一些实施方案还包括核酸测序仪。
在某些实施方案中,提供用于表征从人类受试者获得的样品的方法,包括a)从人类受试者获得样品;b)测定所述样品中的一种或多种标记的甲基化状态,其中所述标记包含具有选自以下标记组的标注的染色体区域中的碱基:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329,优选地来自如上所述的任何标记子集;以及c)比较所测定标记的甲基化状态与在未患有肿瘤的受试者中测定的标记的甲基化状态。
在一些实施方案中,本技术涉及评定生物样品中一种或多种本文所鉴别的标记的存在和甲基化状态。这些标记包含如本文所讨论的一个或多个差异甲基化区域(DMR)。在本技术的实施方案中评定甲基化状态。这样,本文所提供的技术不限于测量基因甲基化状态的方法。例如,在一些实施方案中,通过基因组扫描方法测量甲基化状态。例如,一种方法涉及限制性地标基因组扫描(Kawai等人(1994)Mol.Cell.Biol.14:7421–7427)并且另一种方法涉及甲基化敏感性的任意引物PCR(Gonzalgo等人.(1997)Cancer Res.57:594–599)。在一些实施方案中,通过用甲基化敏感性限制性消化基因组DNA随后对目标区域进行DNA印迹分析(消化-DNA印迹法)来监测站特定CpG位点处的甲基化模式的改变。在一些实施方案中,分析甲基化模式的改变涉及基于PCR的过程,其涉及用甲基化敏感性限制性酶消化基因组DNA然后进行PCR扩增(Singer-Sam等人.(1990)Nucl.Acids Res.18:687)。另外,已报告其他技术,其利用DNA的亚硫酸氢盐处理作为甲基化分析的起始点。这些包括甲基化特异性PCR(MSP)(Herman等人.(1992)Proc.Natl.Acad.Sci.USA 93:9821–9826)和由亚硫酸氢盐转化的DNA扩增的PCR产物的限制性酶消化(Sadri和Hornsby(1996)Nucl.Acids Res.24:5058–5059;以及Xiong和Laird(1997)Nucl.Acids Res.25:2532–2534)。已开发用于检测基因突变(Kuppuswamy等人.(1991)Proc.Natl.Acad.Sci.USA 88:1143–1147)和定量等位基因特异性表达(Szabo和Mann(1995)Genes Dev.9:3097–3108;以及Singer-Sam等人.(1992)PCR Methods Appl.1:160–163)的PCR技术。此类技术使用内部引物,所述内部引物退火至PCR生成的模板并且在有待测定的单一核苷酸的5'处立即终止。在一些实施方案中使用如美国专利号7,037,650所述的使用“定量Ms-SNuPE测定”的方法。
在评价甲基化状态时,甲基化状态通常表示为在特定位点处(例如,在单一核苷酸处、在特定区域或基因座处、在更长目标序列处,例如多至约100-bp、200-bp、500-bp、1000-bp的DNA子序列或更长)甲基化的DNA单独链相对于样品中包含该特定位点的DNA的总群体的分数或百分比。传统上,通过PCR使用校准器测定未甲基化核酸的量。然后,已知量的DNA为亚硫酸氢盐处理的并且所得甲基化特异性序列使用实时PCR或其他指数扩增,例如QuARTS测定(例如,如美国专利号8,361,720;8,715,937;8,916,344;以及9,212,392所提供)来确定。
例如,在一些实施方案中,方法包括通过使用外部标准物生成未甲基化靶标的标准曲线。所述标准曲线由至少两个点构造并且使未甲基化DNA的实时Ct值与已知定量标准相关联。然后,甲基化靶标的第二标准化曲线由至少两个点和外部标准物构造。此第二标准曲线使甲基化DNA的Ct与已知定量标准物相关联。接着,确定甲基化和未甲基化群体的测试样品Ct值并且由通过前两个步骤产生的标准曲线计算DNA的基因组等效物。在目标位点处的甲基化百分比由甲基化DNA的量相对于群体中DNA的总量来计算,例如(甲基化DNA的数目)/(甲基化DNA的数目+未甲基化DNA的数目)×100。
本文还提供用于实践所述方法的组合物和试剂盒。例如,在一些实施方案中,单独或以集合形式提供对一种或多种标记有特异性的试剂(例如引物、探针)(例如,用于扩增多种标记的引物对集合)。还提供用于执行检测测定的额外试剂(例如,用于进行QuARTS、PCR、测序、亚硫酸氢盐或其他测定的酶、缓冲液、阳性和阴性对照)。在一些实施方案中,提供含有执行方法所必需、所足够或适用于执行方法的一种或多种试剂的试剂盒。还提供含有所述试剂的反应混合物。进一步提供含有多种试剂的主混合物试剂集合,所述试剂可以添加到彼此中和/或添加到测试样品中以完成反应混合物。
用于分离适用于这些测定技术的DNA的方法在本领域中是已知的。具体地,一些实施方案包括分离核酸,如美国专利申请序列号13/470,251(“Isolation of NucleicAcids”)所述的,所述申请全文以引用的方式并入本文。
基因组DNA可以通过任何手段分离,包括使用可商购获得的试剂盒。简言之,其中目标DNA由细胞膜封装,生物样品必须通过酶促、化学或机械手段破坏和裂解。然后可从DNA溶液中清除蛋白质和其他污染物,例如通过用蛋白酶K消化。然后从所述溶液中回收基因组DNA。这可以通过多种方法进行,包括盐析、有机提取、或将DNA结合到固相支持物。方法的选择将受到多种因素的影响,包括时间、成本和需要的DNA量。包含肿瘤物质或肿瘤前物质的全部临床样品类型适用于在本发明方法中使用,例如细胞系、组织玻片、活检物、石蜡包埋组织、体液、粪便、结肠流出物、尿液、血浆、血清、全血、分离的血细胞、从血液分离的细胞以及其组合。
本技术不限于用于准备样品并提供用于测试的核酸的方法。例如,在一些实施方案中,使用直接基因捕获(例如,如美国专利申请序列号61/485386所详述的)或通过相关方法从粪便样品或从血液或从血浆样品中分离DNA。
本技术涉及分析可能与肺癌相关的或可被检查来确定不存在肺癌的任何样品。例如,在一些实施方案中,样品包括从患者获得的组织和/或生物流体。在一些实施方案中,所述样品包括分泌物。在一些实施方案中,所述样品包括痰、血液、血清、血浆、胃分泌物、肺组织样品、从粪便回收的肺细胞或肺DNA。在一些实施方案中,受试者是人类。此类样品可以通过本领域已知的任何数目的手段获得,诸如技术人员将清楚的。
I.检测肺癌的甲基化测定
候选的甲基化DNA标记通过对所选肺癌病例和肺对照样品进行非偏置全甲基化组测序来鉴别。首先标记候选物进一步在具有119种对照的255位独立患者中评价,所述对照中37种来自良性结节,并且136个病例包括全部肺癌亚型。从患者组织样品提取的DNA是亚硫酸氢盐处理的并且然后作为归一化基因的候选标记和β-肌动蛋白(ACTB)通过定量等位基因特异性实时靶标和信号扩增(QuARTS扩增)来测定。QuARTS测定化学对于甲基化标记选择和筛选产生高辨别力。
在对个别标记候选物进行接收器操作者特征分析时,曲线下面积(AUC)的范围从0.512至0.941。在100%特异性下,8种甲基化标记(SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.12.526、HOXB2和EMX1)的组合小组跨越全部肺癌亚型产生98.5%的敏感性。另外,使用8种标记的小组,良性肺结节不会产生假阳性。
II.甲基化检测测定和试剂盒
本文所述的标记可用于多种甲基化检测测定。用于分析核酸是否存在5-甲基胞嘧啶的最频繁使用的方法是基于Frommer等人描述的用于检测DNA中的5-甲基胞嘧啶的亚硫酸氢盐方法(Frommer等人.(1992)Proc.Natl.Acad.Sci.USA 89:1827–31,出于所有目的全文以引用的方式明确并入本文)或其变型。映射5-甲基胞嘧啶的亚硫酸氢盐方法是基于以下观察:胞嘧啶而非5-甲基胞嘧啶与亚硫酸氢离子(也称为亚硫酸氢根)反应。所述反应通常根据以下步骤进行:首先,胞嘧啶与亚硫酸氢根反应以形成磺化嘧啶。接着,磺化反应中间体自发脱氨基产生磺化尿嘧啶。最终,磺化尿嘧啶在碱性条件下脱磺化以形成尿嘧啶。检测是可能的,因为尿嘧啶碱基与腺嘌呤配对(因此像胸腺嘧啶一样起作用),而5-甲基胞嘧啶与鸟嘌呤配对(因此像胞嘧啶一样起作用)。这使得甲基化胞嘧啶与未甲基化胞嘧啶的辨别可以通过例如亚硫酸氢盐基因组测序(Grigg G和Clark S,Bioessays(1994)16:431–36;Grigg G,DNA Seq.(1996)6:189–98)、甲基化特异性PCR(MSP)(如例如美国专利号5,786,146所公开)、或使用包括序列特异性探针裂解的测定例如QuARTS瓣状核酸内切酶测定(参见例如Zou等人.(2010)“Sensitive quantification of methylated markers with anovel methylation specific technology”Clin Chem 56:A199;以及美国专利号8,361,720;8,715,937;8,916,344;以及9,212,392来进行。
一些常规技术涉及包括以下的方法:将有待分析的DNA包封在琼脂糖基质中,从而防止DNA扩散和复性(亚硫酸氢盐仅与单链DNA反应),以及用快速渗析置换沉淀和纯化步骤(Olek A等人.(1996)“A modified and improved method for bisulfite basedcytosine methylation analysis”Nucleic Acids Res.24:5064-6)。因此可以分析个别细胞的甲基化状况,说明所述方法的实用性和敏感性。用于检测5-甲基胞嘧啶的常规方法的概述由Rein,T.等人.(1998)Nucleic Acids Res.26:2255提供。
亚硫酸氢盐技术通常涉及在亚硫酸氢盐处理之后扩增已知核酸的短特异性片段,然后通过测序(Olek和Walter(1997)Nat.Genet.17:275–6)或引物延伸反应(Gonzalgo和Jones(1997)Nucleic Acids Res.25:2529–31;WO 95/00669;美国专利号6,251,594)测定产物以分析个别胞嘧啶位置。一些方法使用酶促消化(Xiong和Laird(1997)Nucleic AcidsRes.25:2532–4)。在本领域中也已描述通过杂交进行的检测(Olek等人,WO 99/28498)。另外,已描述用于对个别基因进行甲基化检测的亚硫酸氢盐技术的使用(Grigg和Clark(1994)Bioessays 16:431–6;Zeschnigk等人(1997)Hum Mol Genet.6:387–95;Feil等人(1994)Nucleic Acids Res.22:695;Martin等人(1995)Gene 157:261–4;WO 9746705;WO9515373)。
各种甲基化测定程序可以与根据本技术的亚硫酸氢盐处理结合使用。这些测定允许确定核酸序列内一个或多个CpG二核苷酸(例如,CpG岛)的甲基化状态。除其他技术之外,此类测定涉及亚硫酸氢盐处理的核酸的测序、PCR(用于序列特异性扩增)、DNA印迹分析以及使用甲基化敏感性限制性酶。
例如,已简化基因组测序以用于通过使用亚硫酸氢盐处理来分析甲基化模式和5-甲基胞嘧啶分布(Frommer等人(1992)Proc.Natl.Acad.Sci.USA 89:1827–1831)。另外,由亚硫酸氢盐转化的DNA扩增的PCR产物的限制性酶消化可用于评定甲基化状态,例如,如Sadri和Hornsby(1997)Nucl.Acids Res.24:5058–5059所述的或者如称为COBRA(组合亚硫酸氢盐限制性分析)的方法中所体现的(Xiong和Laird(1997)Nucleic Acids Res.25:2532–2534)。
COBRATM分析时适用于测定少量基因组DNA中特定基因座处的DNA甲基化水平的定量甲基化测定(Xiong和Laird,Nucleic Acids Res.25:2532-2534,1997)。简言之,限制性酶消化用于揭示亚硫酸氢钠处理的DNA的PCR产物中的甲基化依赖性序列差异。甲基化依赖性序列差异首先通过根据Frommer等人描述的程序进行的标准亚硫酸氢盐处理引入到基因组DNA中(Proc.Natl.Acad.Sci.USA89:1827-1831,1992)。亚硫酸氢盐转化的DNA的PCR扩增然后使用对目标CpG岛有特异性的引物进行,随后进行限制性核酸内切酶消化、凝胶电泳和使用特异性标记的杂交探针的检测。初始DNA样品中的甲基化水平以线性定量方式跨越广谱的DNA甲基化水平由相对量的消化和未消化PCR产物表示。另外,此技术可以可靠地应用于从显微切割的石蜡包埋的组织样品获得的DNA。
用于COBRATM分析的典型试剂(例如,如典型基于COBRATM的试剂盒中可见的)可以包括但不限于:用于特定基因座(例如,特定基因、标记、基因区域、标记区域、亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;限制性酶和适当缓冲液;基因杂交寡核苷酸;对照杂交寡核苷酸;用于寡核苷酸探针的激酶标记试剂盒;以及标记的核苷酸。另外,亚硫酸氢盐转化试剂可包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和力柱);脱磺化缓冲液;以及DNA回收组分。
测定诸如“MethyLightTM”(基于荧光的实时PCR技术)(Eads等人.,Cancer Res.59:2302-2306,1999)、Ms-SNuPETM(甲基化敏感性单核苷酸引物延伸)反应(Gonzalgo和Jones,Nucleic Acids Res.25:2529-2531,1997)、甲基化特异性PCR(“MSP”;Herman等人,Proc.Natl.Acad.Sci.USA 93:9821-9826,1996;美国专利号5,786,146)以及甲基化CpG岛扩增(“MCA”;Toyota等人,Cancer Res.59:2307-12,1999)单独使用或与这些方法中的一种或多种组合使用。
“HeavyMethylTM”测定技术是用于基于亚硫酸氢盐处理的DNA的甲基化特异性扩增来评定甲基化差异的定量方法。覆盖扩增引物之间的CpG位置或者由扩增引物覆盖的甲基化特异性阻断探针(“阻断剂”)使得能够对核酸样品进行甲基化特异性选择性扩增。
术语“HeavyMethylTMMethyLightTM”测定是指MethyLightTM测定变型的HeavyMethylTMMethyLightTM测定,其中MethyLightTM测定与覆盖扩增引物之间的CpG位置的甲基化特异性阻断探针组合。HeavyMethylTM测定也可以与甲基化特异性扩增引物组合使用。
用于HeavyMethylTM分析的典型试剂(例如,如典型基于MethyLightTM的试剂盒中可见的)可以包括但不限于:用于特定基因座(例如,特定基因、标记、基因区域、标记区域、亚硫酸氢盐处理的DNA序列、CpG岛或亚硫酸氢盐处理的DNA序列或CpG岛等)的PCR引物;阻断寡核苷酸;优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
MSP(甲基化特异性PCR)允许独立于甲基化敏感性限制性酶的使用而评定CpG岛内事实上任何CpG位点组的甲基化状况(Herman等人Proc.Natl.Acad.Sci.USA 93:9821-9826,1996;美国专利号5,786,146)。简言之,DNA通过亚硫酸氢钠修饰,所述亚硫酸氢钠将未甲基化而非甲基化胞嘧啶转化成尿嘧啶,并且随后用对甲基化对比未甲基化DNA有特异性的引物扩增产物。MSP仅需要少量DNA,对给定CpG岛基因座的0.1%甲基化等位基因敏感,并且可以对从石蜡包埋的样品提取的DNA进行。用于MSP分析的典型试剂(例如,如典型基于MSP的试剂盒中可见的)可包括但不限于:用于特定基因座(例如,特定基因、标记、基因区域、标记区域、亚硫酸氢盐处理的DNA序列、CpG岛等)的甲基化和未甲基化PCR引物;优化的PCR缓冲液和脱氧核苷酸,以及特定探针。
MethyLightTM测定是利用基于荧光的实时PCR(例如)的高通量定量甲基化测定,其不需要在PCR步骤之后进一步操纵(Eads等人,Cancer Res.59:2302-2306,1999)。简言之,MethyLightTM过程以基因组DNA的混合样品开始,所述基因组DNA根据标准程序在亚硫酸氢钠反应中转化成甲基化依赖性序列差异的混合集合(亚硫酸氢盐过程将未甲基化胞嘧啶残基转化成尿嘧啶)。然后在“偏置的”反应中例如用重叠已知CpG二核苷酸的PCR引物进行基于荧光的PCR。在扩增过程的水平下并且在荧光检测过程的水平下进行序列辨别。
将MethyLightTM测定用作核酸(例如基因组DNA样品)中的甲基化模式的定量测试,其中序列辨别在探针杂交水平下发生。在定量型式中,PCR反应在重叠特定推定甲基化位点的荧光探针存在下提供甲基化特定扩增。其中引物和探针二者均不重叠任何CpG二核苷酸的反应提供一定量输入DNA的未偏置对照。或者,用于基因组甲基化的定性测试通过用不覆盖已知甲基化位点(例如,HeavyMethylTM和MSP技术的基于荧光的型式)的对照寡核苷酸或者用覆盖潜在甲基化位点的寡核苷酸探测偏置的PCR集合来实现。
MethyLightTM过程与任何适合探针(例如探针、探针等)一起使用。例如,在一些应用中,双链基因组DNA用亚硫酸氢钠处理并且经历使用探针,例如使用MSP引物和/或HeavyMethyl阻断剂寡核苷酸和探针进行的两组PCR反应之一。探针用荧光“报告基因”和“淬灭剂”分子双重标记并且被设计为对相对高GC含量的区域有特异性,使得其在PCR循环中在比正向或反向引物高约10℃的高温度下熔化。这允许探针在PCR退火/延长步骤期间保持完全杂交。随着Taq聚合酶在PCR期间酶促合成新链,它最终将到达退火的探针。Taq聚合酶5′至3′内切核苷酸活性将通过消化探针来置换所述探针以释放荧光报告分子,以使用实时荧光检测系统定量检测器新的未淬灭信号。
用于MethyLightTM分析的典型试剂(例如,如典型基于MethyLightTM的试剂盒中可见的)可以包括但不限于:用于特定基因座(例如,特定基因、标记、基因区域、标记区域、亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;或探针;优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
QMTM(定量甲基化)测定是用于基因组DNA样品中的甲基化模式的替代性定量测试,其中序列辨别在探针杂交水平下发生。在此定量型式中,PCR反应在重叠特定推定甲基化位点的荧光探针存在下提供未偏置扩增。其中引物和探针二者均不重叠任何CpG二核苷酸的反应提供一定量输入DNA的未偏置对照。或者,用于基因组甲基化的定性测试通过用不覆盖已知甲基化位点(HeavyMethylTM和MSP技术的基于荧光的型式)的对照寡核苷酸或者用覆盖潜在甲基化位点的寡核苷酸探测偏置的PCR集合来实现。
QMTM过程可以与任何适合的探针,例如探针、探针一起用于扩增过程中。例如,双链基因组DNA用亚硫酸氢钠处理并且经历未偏置引物和探针。探针用荧光“报告基因”和“淬灭剂”分子双重标记并且被设计为对相对高GC含量的区域有特异性,使得其在PCR循环中在比正向或反向引物高约10℃的高温度下熔化出来。这允许探针在PCR退火/延长步骤期间保持完全杂交。随着Taq聚合酶在PCR期间酶促合成新链,它最终将到达退火的探针。Taq聚合酶5′至3′内切核苷酸活性将通过消化探针来置换所述探针以释放荧光报告分子,以使用实时荧光检测系统定量检测器新的未淬灭信号。用于QMTM分析的典型试剂(例如,如典型基于QMTM的试剂盒中可见的)可以包括但不限于:用于特定基因座(例如,特定基因、标记、基因区域、标记区域、亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;或探针;优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
Ms-SNuPETM技术为用于基于DNA的亚硫酸氢盐处理评定在特定CpG位点处的甲基化差异的定量方法,随后进行单核苷酸引物延长(Gonzalgo和Jones,Nucleic Acids Res.25:2529-2531,1997)。简言之,基因组DNA与亚硫酸氢钠反应以将未甲基化胞嘧啶转化成尿嘧啶,同时留下5-甲基胞嘧啶未改变。然后使用对亚硫酸氢盐转化的DNA有特异性的PCR引物进行所需靶标序列的扩增,并且分离所得产物并将其用作在目标CpG位点处进行甲基化分析的模板。可以分析少量DNA(例如,显微切割病理切片)并且这避免利用限制性酶来确定CpG位点处的甲基化状况。
用于Ms-SNuPETM分析的典型试剂(例如,如典型基于Ms-SNuPETM的试剂盒中可见的)可以包括但不限于:用于特定基因座(例如,特定基因、标记、基因区域、标记区域、亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;优化的PCR缓冲液和脱氧核苷酸;凝胶提取试剂盒;阳性对照引物;用于特定基因座的Ms-SNuPETM引物;反应缓冲液(用于Ms-SNuPE反应);以及标记的核苷酸。另外,亚硫酸氢盐转化试剂可包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和力柱);脱磺化缓冲液;以及DNA回收组分。
简化基因组甲基化测序(RRBS)以核酸的亚硫酸氢盐处理开始,以将所有未甲基化胞嘧啶转化成尿嘧啶,随后进行限制性酶消化(例如,通过识别包括CG序列的位点的酶诸如MspI)并在偶合至衔接子配体之后对片段进行完全测序。限制性酶的选择丰富了CpG密集区域的片段,从而减少可在分析期间映射到多个基因位置的冗余序列的数目。这样,RRBS通过选择用于测序的限制性片段的子集(例如通过使用制备型凝胶电泳进行尺寸选择)来减小核酸样品的复杂性。与全基因组亚硫酸氢盐测序相反,通过限制性酶消化产生的每个片段含有至少一个CpG二核苷酸的DNA甲基化信息。这样,RRBS使样品富集在这些区域中具有高频率限制性酶切割位点的启动子、CpG岛和其他基因组特征部并且因此提供评定一个或多个基因组基因座的甲基化状态的测定。
RRBS的典型方案包括用限制性酶诸如MspI消化核酸样品、在突出部和A-尾部填充、连接衔接子、亚硫酸氢盐转化以及PCR的步骤。参见例如等人(2005)“Genome-scale DNAmethylation mapping of clinical samples at single-nucleotide resolution”NatMethods 7:133–6;Meissner等人(2005)“Reduced representation bisulfitesequencing for comparative high-resolution DNA methylation analysis”NucleicAcids Res.33:5868–77。
在一些实施方案中,使用定量等位基因特异性实时靶标和信号扩增(QuARTS)测定来评价甲基化状态。三种反应依次在每个QuARTS测定中发生,包括初级反应中的扩增(反应1)和靶标探针裂解(反应2);以及次级反应中的FRET裂解和荧光信号生成(反应3)。当用特定引物扩增靶标核酸时,具有瓣状序列的特定检测探针松散地结合扩增子。特定侵入性寡核苷酸在靶标结合位点处的存在使得5′核酸酶例如FEN-1核酸内切酶通过在检测探针与瓣状序列之间切割来释放瓣状序列。瓣状序列与对应FRET盒的非发夹部分互补。因此,瓣状序列用作FRET盒上的侵入性寡核苷酸并且在FRET盒荧光团与淬灭剂之间实现裂解,从而产生荧光信号。裂解反应可以每个靶标切割多个探针并且因此每个瓣状物释放多个荧光团,从而提供指数信号扩增。QuARTS可以在单个反应中通过使用具有不同染料的FRET盒良好检测多个靶标。参见例如,Zou等人(2010)“Sensitive quantification of methylatedmarkers with a novel methylation specific technology”Clin Chem 56:A199),以及美国专利号8,361,720;8,715,937;8,916,344;以及9,212,392,其各自出于所有目的以引用的方式并入本文。
在一些实施方案中,纯化亚硫酸氢盐处理的DNA,之后定量。这可以通过本领域已知的任何手段进行,诸如但不限于超滤,例如通过MicroconTM柱(由MilliporeTM制造)。根据修改的制造商方案进行纯化(参见例如,PCT/EP2004/011715,其全文以引用的方式并入本文)。在一些实施方案中,亚硫酸氢盐处理的DNA结合固体支持体,例如磁珠,并且在DNA结合支持体时进行脱磺化和洗涤。例如在WO2013/116375和美国专利号9,315,853中提供此类实施方案的实例。在某些优选的实施方案中,支持体结合的DNA准备好用于在支持体上进行脱磺化和洗涤之后立即进行甲基化测定。在一些实施方案中,在测定之前从支持体洗脱脱磺化DNA。
在一些实施方案中,使用根据本发明的引物寡核苷酸集合(例如参见图1)和扩增酶扩增处理的DNA的片段。若干DNA区段的扩增可以在同一个反应容器中同时进行。通常,扩增使用聚合酶链反应(PCR)进行。
用于分离适用于这些测定技术的DNA的方法在本领域中是已知的。具体地,一些实施方案包括分离核酸,如美国专利号9,000,146和9,163,278所述的,所述专利各自全文以引用的方式并入本文。
在一些实施方案中,本文所述的标记用于对粪便样品进行的QUARTS测定中。在一些实施方案中,提供用于产生DNA样品的方法并且具体地是用于产生包含小体积(例如小于100、小于60微升)的高度纯化的低丰度核酸并且基本上和/或有效地不含抑制用于测试DNA样品的测定(例如,PCR、INVADER、QuARTS测定等)的物质的DNA样品的方法。此类DNA样品可用于诊断测定中,所述诊断测定定性地检测存在于从患者采集的样品中的基因、基因变体(例如等位基因)或基因修饰(例如甲基化)的存在或者定量测量它们的活性、表达或量。例如,一些癌症与特定突变体等位基因或特定甲基化状态的存在相关,并且因此检测和/或定量此类突变体等位基因或甲基化状态在癌症的诊断和治疗方面具有预测价值。
许多有价值的基因标记以极低的量存在于样品中并且产生此类标记的许多事件是罕见的。因此,甚至敏感性检测方法诸如PCR需要大量DNA以提供足够的低丰度靶标以满足或取代测定的检测阈值。此外,甚至少量抑制性物质的存在会损害涉及检测此少量靶标的这些测定的准确性和精确性。因此,本文提供了提供体积和浓度的必需管理以产生此类DNA样品的方法。
在一些实施方案中,样品包括血液、血清、血浆或唾液。在一些实施方案中,受试者是人类。此类样品可以通过本领域已知的任何数目的手段获得,诸如技术人员将清楚的。无细胞或基本上无细胞样品可以通过使样品经历本领域技术人员已知的各种技术来获得,本技术包括但不限于离心和过滤。尽管通常优选的是不使用侵入性技术获得样品,但是获得诸如组织均质物、组织切片和活检物试样仍可为优选的。本技术不限于用于准备样品并提供用于测试的核酸的方法。例如,在一些实施方案中,使用直接基因捕获(例如,如美国专利号8,808,990和9,169,511以及WO 2012/155072所详述的)或通过相关方法从粪便样品或从血液或从血浆样品中分离DNA。
标记的分析可以单独进行或与一种测试样品内的额外标记同时进行。例如,若干种标记可以组合到用于有效处理多种样品并用于潜在提供更大诊断和/或预后准确性的一种测试中。另外,本领域技术人员将认识到测试来自同一位受试者的多个样品(例如,在连续时间点)的价值。系列样品的此测试可允许鉴别标记甲基化状态随着时间的改变。甲基化状态的改变以及甲基化状态的改变的不存在可以提供关于疾病状况的有用信息,包括但不限于鉴别从事件开始的近似时间、可挽救组织的存在和量、药物疗法的适当性、不同疗法的有效性以及受试者结果的鉴别,包括未来事件的风险。
生物标记的分析可以各种物理形式进行。例如,微升板或自动化的使用可以用于帮助处理大量测试样品。或者,可开发单一样品形式以例如在回廊走动或急诊室环境中及时帮助进行即时处理和诊断。
预期本技术的实施方案以试剂盒的形式提供。所述试剂盒包括本文所述的组合物、设备、装置等的实施方案和试剂盒的使用说明书。此类说明书描述了用于制备来自样品的分析物的适当方法,例如用于收集样品并由所述样品制备核酸的方法。试剂盒的个别组分被包装在适当容器和包装(例如,小瓶、箱、泡罩包装、安瓿、广口瓶、瓶、管等)中并且所述组分一起包装在适当容器(例如,一个或多个箱)中以方便存储、运输和/或由使用者使用试剂盒。应当理解,液体组分(例如缓冲液)可以冻干形式提供以由使用者重构。试剂盒可包括用于评定、验证和/或确保试剂盒的性能的对照或参考。例如,用于测定存在于样品中的核酸的量的试剂盒可包括对照,所述对照包括已知浓度的同一种或另一种用于比较的核酸并且在一些实施方案中为对于对照核酸有特异性的检测试剂(例如,引物)。试剂盒适用于在临床环境中使用并且在一些实施方案中适用于在使用者家中使用。在一些实施方案中,试剂盒的组分提供系统用于由样品制备核酸溶液的功能。在一些实施方案中,系统的某些组分由使用者提供。
III.应用
在一些实施方案中,诊断测定鉴别个体中疾病或病状的存在。在一些实施方案中,疾病为癌症(例如肺癌)。在一些实施方案中,使用异常甲基化与肺癌相关联的标记(例如一种或多种选自表1中所列出的标记的标记,或者优选以下一种或多种:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAXchr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1以及ZNF329)。在一些实施方案中,测定还包括参考基因(例如,β-肌动蛋白、ZDHHC1、B3GALT6的检测。参见例如12/11/2015提交的美国专利申请号14/966,617和07/19/2016提交的美国专利申请号62/364,082,其各自出于所有目的以引用的方式并入本文)。
在一些实施方案中,本技术应用于治疗患者(例如,患有肺癌、患有早期肺癌或可能发展肺癌的患者),所述方法包括确定如本文所提供的一种或多种标记的甲基化状态并基于确定所述甲基化状态的结果向患者施用治疗。所述治疗可为药物化合物、疫苗、执行手术、对患者成像、执行另一种测试的施用。优选地,所述使用是在临床筛选方法、预后评定方法、监测疗法的结果的方法中、鉴别最可能响应于特定治疗性治疗的患者的方法中、对患者或受试者成像的方法、以及用于药物筛选和开发的方法中。
在一些实施方案中,本技术应用于所提供的用于诊断受试者中的肺癌的方法。如本文所用的术语“诊断(diagnosing/diagnosis)”是指技术人员可以评估并且甚至确定受试者是否罹患给定疾病或病状或在未来可能发展给定疾病或病状的方法。技术人员通常基于一个或多个诊断指示因子例如像生物标记做出诊断,所述生物标记的甲基化状态指示病状的存在、严重性或不存在。
连同诊断一起,临床癌症预后涉及确定癌症的侵袭性和肿瘤复发的可能性以计划最有效的疗法。如果可以做出更准确的预后或者甚至可以评定发展癌症的潜在风险,则可以选择适当疗法并且在一些情况下为患者选择较不严重的疗法。癌症生物标记的评定(例如,确定甲基化状态)适用于区分具有良好预后和/或发展癌症的低风险并将不需要疗法或需要有限疗法的受试者与更可能发展癌症或遭遇癌症复发并受益于更强烈的治疗的那些受试者。
这样,如本文所用的“做出诊断”或“诊断”进一步包括基于本文所公开的诊断生物标记的测量来确定发展癌症的风险或确定预后(这可提供预测临床结果(使用或未使用医学治疗))、选择适当治疗(或治疗是否将有效)或监测当前治疗以及潜在地改变治疗。
另外,在本技术的一些实施方案中,可以随着时间对生物标记进行多次确定以帮助诊断和/或预后。生物标记的暂时改变可以用于预测临床结果、监测肺癌的进展、和/或监测针对癌症的适当疗法的功效。在此实施方案中,例如,可以预期在有效疗法过程期间看到生物样品中本文所公开的一种或多种生物标记(以及如果监测的话,潜在地一种或多种另外的生物标记)的甲基化状态的改变。
本技术进一步应用于用于确定在受试者中是否开始或继续癌症的预防或治疗的方法。在一些实施方案中,所述方法包括提供在一个时间段内来自受试者的一系列生物样品;分析所述系列生物样品以确定在每种生物样品中本文所公开的至少一种生物标记的甲基化状态;以及比较每种生物样品中一种或多种生物标记的甲基化状态的任何可测量改变。生物标记的甲基化状态随着时间段的任何改变可以用于预测发展癌症的风险、预测临床结果、确定是否开始或继续癌症的预防或疗法和当前疗法是否有效于治疗癌症。例如,第一时间点可以选择在治疗开始之前并且第二时间点可以选择在治疗开始之后的一些时间。甲基化状态可以在从不同时间点获得的每种样品中测量并且标注定性和/或定量差异。来自不同样品的生物标记水平的甲基化状态的改变可能与发展肺部的风险、预后、确定治疗功效和/或受试者中癌症的进展相关。
在优选的实施方案中,本发明的方法和组合物用于治疗或诊断早期阶段的疾病,例如在疾病症状出现之前的疾病。在一些实施方案中,本发明的方法和组合物用于治疗或诊断临床阶段的疾病。
如以上所注,在一些实施方案中,可以对一种或多种诊断或预后生物标记做出多次测定,并且标记的临时改变可以用于确定诊断或预后。例如,诊断标记可以在初始时间测定并且在第二个时间再次测定。在此类实施方案中,标记从初始时间到第二个时间的增加可以诊断癌症的特定类型或严重性或者给定的预后。同样,标记从初始时间到第二个时间的减少可以指示癌症的特定类型或严重性或者给定的预后。另外,一种或多种标记的改变程度可能与癌症的严重性和未来的不良事件相关。技术人员将理解的是,当在某些实施方案中可以在多个时间点对同一种生物标记进行比较性测量时,也可以在一个时间点测量给定生物标记,并且在第二时间点测量第二生物标记,并且这些标记的比较可以提供诊断信息。
如本文所用,短语“确定预后”是指技术人员可以预测受试者的病状的过程或结果的方法。术语“预后”并不是指以100%准确性预测病状的过程或结果的能力或者甚至给定的过程或结果是基于生物标记的甲基化状态可预测的以或多或少可以发生。相反,本领域技术人员将理解术语“预后”是指某一过程或结果将发生的可能性增加;也就是说,与未表现出病状的那些个体相比,在表现出给定病状的受试者中更容易出现所述过程或结果。例如,在未表现出病状的个体中,给定结果(例如罹患肺癌)的机会可能非常低。
在一些实施方案中,统计学分析使预后指示因子与不良结果的倾向相关联。例如,在一些实施方案中,与从未患有癌症的患者获得的正常对照样品中的甲基化状态不同的甲基化状态可以发信号表明受试者比具有更类似于对照样品中的甲基化状态的水平的受试者更可能罹患癌症,如通过统计学显著性水平所确定的。另外,甲基化状态相对于基线(例如“正常”)水平的改变可以反映受试者预后,并且甲基化状态的改变程度可能与不良事件的严重性相关。统计学显著性通常通过比较两个或更多个群体并且确定置信区间和/或p值来确定。参见例如Dowdy和Wearden,Statistics for Research,John Wiley&Sons,NewYork,1983,其全文以引用的方式并入本文。本发明主题的示例性置信区间为90%、95%、97.5%、98%、99%、99.5%、99.9%和99.99%,而示例性p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001和0.0001。
在其他实施方案中,可以确定本文所公开的预后或诊断生物标记的甲基化状态的改变阈值,并且生物样品中生物标记的甲基化状态的改变程度简单地与甲基化状态的改变阈值相比较。本文所提供的生物标记的甲基化状态的优选阈值改变为约5%、约10%、约15%、约20%、约25%、约30%、约50%、约75%、约100%以及约150%。在其他实施方案中,可以建立“诺模图”,通过它,预后或诊断指示因子(生物标记或生物标记的组合)的甲基化状态与朝向给定结果的相关处置直接相关。技术人员利用此类诺模图知道将两个数值与此测量中的不确定性与标记浓度中的不确定性相同的理解相关联,因为引用个别样品测量值,而非群体平均值。
在一些实施方案中,对照样品与生物样品同时分析,使得从生物样品获得的结果可以与从对照样品获得的结果相比较。另外,预期可以提供标准曲线,其可以与生物样品的测定结果相比较。如果使用荧光标签,则此类标准曲线存在作为测定单元(例如荧光信号强度)的函数的生物标记的甲基化状态。使用从多个供体获得的样品,可以提供正常组织中的一种或多种生物标记的对照甲基化状态以及从患有肺癌的供体获得的组织中的一种或多种生物标记的“风险”水平的标准曲线。
标记的分析可以单独进行或与一种测试样品内的额外标记同时进行。例如,若干种标记可以组合到用于有效处理多种样品并用于潜在提供更大诊断和/或预后准确性的一种测试中。另外,本领域技术人员将认识到测试来自同一位受试者的多个样品(例如,在连续时间点)的价值。系列样品的此测试可允许鉴别标记甲基化状态随着时间的改变。甲基化状态的改变以及甲基化状态的改变的不存在可以提供关于疾病状况的有用信息,包括但不限于鉴别从事件开始的近似时间、可挽救组织的存在和量、药物疗法的适当性、不同疗法的有效性以及受试者结果的鉴别,包括未来事件的风险。
生物标记的分析可以各种物理形式进行。例如,微升板或自动化的使用可以用于帮助处理大量测试样品。或者,可开发单一样品形式以例如在回廊走动或急诊室环境中及时帮助进行即时处理和诊断。
在一些实施方案中,如果当与对照甲基化状态相比较时样品中至少一种生物标记的甲基化状态存在可测量的差异,则受试者诊断为患有肺癌。相反,当在生物样品中鉴别甲基化状态无改变时,受试者可以鉴别为不含有肺癌、未处于癌症的风险下或者具有低癌症风险。关于这一点,患有肺癌或具有其风险的受试者可以与具有低癌症至基本上没有癌症或者没有癌症风险的患者区别开来。具有发展肺癌的风险的那些受试者可以置于更强烈和/或规则的筛选方案下。在另一方面,具有低风险至基本上不具有风险的那些受试者可以避免经历筛选程序,直到诸如未来筛选,例如根据本技术进行的筛选指示在那些受试者中出现肺癌的风险。
如以上所提及的,根据本技术的方法的实施方案,检测一种或多种生物标记的甲基化状态的改变可为定性测定或者其可为定量测定。这样,将受试者诊断为患有肺癌或处于发展肺癌的风险下的步骤指示进行某些阈值测量,例如生物样品中一种或多种生物标记的甲基化状态从预定对照甲基化状态发生改变。在所述方法的一些实施方案中,对照甲基化状态为生物标记的任何可检测甲基化状态。在其中对照样品与生物样品同时测试的所述方法的其他实施方案中,预定甲基化状态为对照样品中的甲基化状态。在所述方法的其他实施方案中,预定甲基化状态是基于标准曲线和/或由标准曲线鉴别。在所述方法的其他实施方案中,预定甲基化状态为明确的状态或状态范围。这样,可以部分基于正在实践的方法和所需特异性的实施方案等在本领域技术人员将清楚的可接受限制内选择预定甲基化状态。
在一些实施方案中,使用一种或多种甲基化标记和适合的测定方法筛选来自患有或疑似患有肺癌的受试者的样品,所述测定方法提供区分不同类型的肺癌例如非小细胞癌(腺癌、大细胞癌、鳞状细胞癌)和小细胞癌的数据。参见例如标记参考号AC27(图2;PLEC),其在腺癌和小细胞癌中为高度甲基化的(示出为与正常血沉棕黄层中的该基因座处的平均甲基化相比的平均甲基化),而在大细胞癌或鳞状细胞癌中并非如此;标记参考号AC23(图2;ITPRIPL1),其在腺癌中比在任何其他样品类型中更高度甲基化;标记参考号LC2(图3;DOCK2)),其在大细胞癌中比在任何其他样品类型中更高度甲基化;标记参考号SC221(图4;ST8SIA4),其在小细胞癌中比在任何其他样品类型中更高度甲基化;以及标记参考号SQ36(图5,DOK1),其在鳞状细胞癌中比在任何其他样品类型中更高度甲基化。
如本文所述地选择的甲基化标记可以单独使用或组合(例如,以小组形式)使用,使得来自受试者的样品的分析揭示肺肿瘤的存在并且还提供足够的信息来区分肺癌类型,例如小细胞癌对比非小细胞癌。在优选的实施方案中,标记或标记的组合进一步提供足以区分腺癌、大细胞癌和鳞状细胞癌;和/或表征未确定或混合病理的数据。在其他实施方案中,在没有区分数据的情况下选择甲基化标记或其组合以提供阳性结果(即结果指示肺肿瘤的存在),无论存在的肺癌类型如何。
在最近几年内,清楚的是在许多患有癌症的患者的血液中可以检测到表示转移性肿瘤细胞的循环上皮细胞。罕见细胞的分子谱在生物和临床研究中是重要的。应用范围从癌症患者的外周血液中用于疾病预后和个人化治疗的循环上皮细胞(CEpC)的表征开始(参见例如Cristofanilli M等人(2004)N Engl J Med 351:781–791;Hayes DF等人(2006)Clin Cancer Res 12:4218–4224;Budd GT等人,(2006)Clin Cancer Res 12:6403–6409;Moreno JG等人(2005)Urology 65:713–718;Pantel等人,(2008)Nat Rev 8:329–340;以及Cohen SJ等人(2008)J Clin Oncol 26:3213–3221)。因此,本公开的实施方案提供用于通过鉴别血浆或全血中甲基化标记的存在来检测受试者中转移性癌症的存在的组合物和方法。
实验实施例
实施例1
样品制备方法
用于DNA分离和QUARTS测定的方法
以下提供用于在分析和之前进行DNA分离的示例性方法和示例性QUARTS测定,诸如可以根据本技术的实施方案使用。在此实施例中描述了QuARTS技术对来自血液和不同组织样品的DNA的应用,但是本技术容易应用于其他核酸样品,如其他实施例中所示的。
来自细胞和血浆的DNA分离
对于细胞系,基因组DNA可以使用例如“ RSC ccfDNA血浆试剂盒(Promega Corp.,Madison,WI)从细胞条件培养基中分离。遵循试剂盒方案,使用1mL细胞条件培养基(CCM)替代血浆,并且根据试剂盒程序进行处理。洗脱体积为100μL,其中70μL通常用于亚硫酸氢盐转化。
用于从4mL血浆样品分离DNA的示例性程序如下:
·向4mL血浆样品中添加300μL蛋白酶K(20mg/mL)并将其混合。
·将3μL的1μg/μL鱼DNA添加到血浆蛋白酶K混合物中。
·将2mL血浆裂解缓冲液添加到血浆中。
血浆裂解缓冲液为:
-4.3M硫氰酸胍
-10%IGEPAL CA-630(辛基苯氧基聚(乙烯氧基)乙醇,支链)
(5.3g IGEPAL CA-630与45mL 4.8M硫氰酸胍组合)
·在55℃下在500rpm振荡下将混合物孵育1小时。
·添加3mL血浆裂解缓冲液并且混合。
·添加200μL磁二氧化硅结合珠粒(16μg珠粒/μL}并且再次混合。
·添加2mL 100%异丙醇并且混合。
·在30℃下在500rpm振荡下孵育30分钟。
·将一个或多个管置于磁体上并且使珠粒集中。抽出并丢弃上清液。
·将750μL GuHCl-EtOH添加到含有结合珠粒的容器中并且混合。
GuHCl-EtOH洗涤缓冲液为:
-3M GuHCl(盐酸胍)
-57%EtOH(乙醇)
·在400rpm下振荡1分钟。
·将样品转移到深孔板或2mL微量离心管中。
·将管置于磁体上并且使珠粒集中10分钟。抽出并丢弃上清液。
·将1000μL洗涤缓冲液(10mM Tris HCl、80%EtOH)添加到珠粒中,并且在30℃下在振荡下孵育3分钟。
·将管置于磁体上并且使珠粒集中。抽出并丢弃上清液。
·将500μL洗涤缓冲液添加到珠粒中,并且在30℃下在振荡下孵育3分钟。
·将管置于磁体上并且使珠粒集中。抽出并丢弃上清液。
·添加250μL洗涤缓冲液,并且在30℃下在振荡下孵育3分钟。
·将管置于磁体上并且使珠粒集中。抽出并丢弃其余缓冲液。
·添加250μL洗涤缓冲液,并且在30℃下在振荡下孵育3分钟。
·将管置于磁体上并且使珠粒集中。抽出并丢弃其余缓冲液。
·在70℃下将珠粒干燥15分钟,同时振荡。
·将125μL洗脱缓冲液(10mM Tris Hcl pH 8.0、0.1mM EDTA)添加到珠粒中,并且在65℃下在振荡下孵育25分钟。
·将管置于磁体上并且使珠粒集中10分钟。
·抽出含有DNA的上清液并且将其转移到新容器或管中。
亚硫酸氢盐转化
I.使用亚硫酸氢铵使DNA磺化
1.在每个管中,将64μL DNA、7μL 1N NaOH和9μL含有0.2mg/mL BSA和0.25mg/mL鱼DNA的载体溶液组合。
2.在42℃下孵育20分钟。
3.添加120μL 45%亚硫酸氢铵并在66°下孵育75分钟。
4.在4℃下孵育10分钟。
II.使用磁珠脱磺化
材料
·磁珠(Promega MagneSil Paramagnetic Particles,Promega目录号AS1050,16μg/μL)。
·结合缓冲液:6.5-7M盐酸胍。
·转化后洗涤缓冲液:80%乙醇和10mM Tris HCl(pH 8.0)。
·脱磺化缓冲液:70%异丙醇,选择0.1N NaOH用于脱磺化缓冲液。
使用任何适当的装置或技术混合样品以在基本上如下文所述的温度和混合速度下混合或孵育样品。例如,可以使用热混合器(Eppendorf)混合或孵育样品。示例性脱磺化如下:
1.通过将瓶涡旋1分钟来将珠粒原液彻底混合。
2.将50μL珠粒等分到2.0mL管中(例如,来自USA Scientific)。
3.将750μL结合缓冲液添加到珠粒中。
4.添加150μL来自步骤I的磺化DNA。
5.混合(例如,在30℃下1000RPM持续30分钟)。
6.将管置于磁体支架并且将其留在适当位置上5分钟。在将管置于支架上的情况下,移出并丢弃上清液。
7.添加1,000μL洗涤缓冲液。混合(例如,在30℃下1000RPM持续3分钟)。
8.将管置于磁体支架并且将其留在适当位置上5分钟。在将管置于支架上的情况下,移出并丢弃上清液。
9.添加250μL洗涤缓冲液。混合(例如,在30℃下1000RPM持续3分钟)。
10.将管置于磁道上;在1分钟后移出并丢弃上清液。
11.添加200μL脱磺化缓冲液。混合(例如,在30℃下1000RPM持续5分钟)。
12.将管置于磁道上;在1分钟后移出并丢弃上清液。
13.添加250μL洗涤缓冲液。混合(例如,在30℃下1000RPM持续3分钟)。
14.将管置于磁道上;在1分钟后移出并丢弃上清液。
15.将250μL洗涤缓冲液添加到管中。混合(例如,在30℃下1000RPM持续3分钟)。
16.将管置于磁道上;在1分钟后移出并丢弃上清液。
17.在30℃下在盖打开的情况下将所有管孵育15分钟。
18.从磁道移除管并且将70μL洗脱缓冲液直接添加到珠粒中。
19.用洗脱缓冲液孵育珠粒(例如,在40℃下1000RPM持续45分钟)。
20.将管置于磁道上约一分钟;移出并保存上清液。
然后将转化的DNA用于检测测定中,例如预扩增和/或瓣状核酸内切酶测定,如下文所述。
还参见2015年10月30日提交的美国专利申请序列号62/249,097;均在2016年10月26日提交的美国专利申请序列号15/335,111和15/335,096;以及2016年10月26日提交的国际申请序列号PCT/US16/58875,其各自出于所有目的全文以引用的方式并入本文。
QuARTS测定
QuARTS技术将基于聚合酶的靶标DNA扩增过程与侵入性基于裂解的信号扩增过程组合。本技术描述于例如美国专利号8,361,720;8,715,937;8,916,344;以及9,212,392,其各自以引用的方式并入本文。由QuARTS反应生成的荧光信号以与实时PCR类似的方式监测并且允许定量样品中靶标核酸的量。
示例性QuARTS反应通常包含约400–600nmol/L(例如,500nmol/L)每种引物和检测探针、约100nmol/L侵入性寡核苷酸、约600–700nmol/L每种FRET盒(FAM,例如,如由Hologic,Inc.在商业上供应;HEX,例如,如由BioSearch Technologies在商业上供应;以及Quasar 670,例如,如由BioSearch Technologies在商业上供应)、6.675ng/μL FEN-1核酸内切酶(例如,2.0,Hologic,Inc.)、30μL反应体积中的1个单元的Taq DNA聚合酶(例如, DNA聚合酶,Promega Corp.,Madison,WI)、10mmol/L 3-(正吗啉代)丙磺酸(MOPS)、7.5mmol/L MgCl2以及250μmol/L每种dNTP。示例性QuARTS循环条件如下表所示。在一些应用中,定量循环(Cq)的分析提供样品中靶标DNA链(例如,拷贝数)的初始数目的测量。
大体积亚硫酸氢盐转化的DNA的多种靶向预扩增
为了预先扩增大部分或所有来自输入样品的亚硫酸氢盐处理的DNA,可在单一大体积多重扩增反应中使用大体积的处理的DNA。例如,使用例如如上所述的MaxwellPromega血液试剂盒AS1400从细胞系(例如,DFCI032细胞系(腺癌);H1755细胞系(神经内分泌)提取DNA。DNA为亚硫酸氢盐转化的,例如,如上文所述的。
例如在含有以下各项的反应混合物中进行预先扩增:7.5mM MgCl2、10mM MOPS、0.3mM Tris-HCl pH 8.0、0.8mM KCl、0.1μg/μL BSA、0.0001%Tween-20,0、0001%IGEPALCA-630、250μM每种dNTP、寡核苷酸引物(例如,对于12种靶标、12个引物对/24个引物,以等摩尔量计(包括但不限于例如200-500nM每种引物的范围),或者其中个别引物浓度被调整以平衡不同靶标区域的扩增效率)、0.025个单位/μL HotStart GoTaq浓度以及20体积%至50体积%的亚硫酸氢盐处理的靶标DNA(例如,10μL靶标DNA到50μL反应混合物中或者50μL靶标DNA到125μL反应混合物中)。选择对于反应的体积和扩增容器而言适当的热循环时间和温度。例如,反应可如下循环
在热循环之后,将预扩增反应的等分试样(例如,10μL)在10mM Tris、0.1mM EDTA中在具有或不具有鱼DNA的情况下稀释到500μL。将稀释的预扩增的DNA的等分试样(例如,10μL)用于QuARTS PCR-瓣状测定中,例如,如上文所述的。还参见2015年10月30日提交的美国专利申请序列号62/249,097;2016年10月26日提交的美国专利申请序列号15/335,096;以及2016年10月26日提交的PCT/US16/58875,其各自出于所有目的全文以引用的方式并入本文。
实施例2
甲基化标记的选择和测试
标记选择过程:
对来自16个腺癌肺癌、11个大细胞肺癌、14个小细胞肺癌、24个磷状细胞肺癌和18个非癌肺的组织获得简化基因组甲基化测序(RRBS)结果以及从26位健康患者获得的血沉棕黄层样品的RRBS结果。
在与人类基因组序列的亚硫酸氢盐转化的形式比对后,计算每种样品(即组织或血沉棕黄层)中每个CpG岛处的平均甲基化并且基于以下标准选择标记区域:
·选择50个碱基对或更长的区域。
·对于QuARTS瓣状测定设计,选择在以下各项下具有最少1个甲基化CpG的区域:a)探针区域、b)正向引物结合区域以及c)反向引物结合区域。对于正向引物和反向引物,优选的是甲基化CpG接近于引物的3′端,而非在3’端核苷酸处。示例性瓣状核酸内切酶测定寡核苷酸示出在图1中。
·优选地,目标区域内的任何CpG处的血沉棕黄层甲基化不超过>0.5%。
·优选地,目标区域内的癌症组织甲基化>10%。
·对于设计用于组织分析的测定,目标区域内的正常组织甲基化优选地<0.5%。
不同肺癌组织类型的RRBS数据示出在图2-5中。基于以上标准,选择下表所示的标记并且设计它们的QuARTS瓣状测定,如图1所示。
表1
分析所选标记与血沉棕黄层的交叉反应性。
1)血沉棕黄层筛选
对从10mL健康患者血液获得的血沉棕黄层提取的DNA筛选以上列表的标记。使用Promega Maxwell RSC系统(Promega Corp.,Fitchburg,WI)提取DNA并且使用Zymo EZ DNAMethylationTM试剂盒(Zymo Research,Irvine,CA)转化。使用与亚硫酸氢盐转化的β-肌动蛋白DNA的双重反应(“BTACT”)并且使用大约40,000个靶标基因组DNA的链,使用如上所述的QuARTS瓣状核酸内切酶测试样品,以测试交叉反应性。这样,3种标记的测试显示显著的交叉反应性:
标记 |
交叉反应性% |
HIST1H2B |
72.93% |
chr7_636 |
3495.47% |
chr5_132 |
0.20% |
2)组织筛选
从不同商业和非商业来源获得264种组织样品(Asuragen、BioServe、ConversantBio、Cureline、Mayo Clinic、M D Anderson以及PrecisionMed),如下表2所示。
由组织学包围不同病变以指导显微切割的病理学家检查组织切片。使用PromegaMaxwell RSC系统进行总核酸提取。刮掉福尔马林固定的石蜡包埋的(FFPE)滑片并且使用 RSC DNA FFPE试剂盒(#AS1450)使用制造商程序但跳过RNA酶处理步骤来提取DNA。将相同程序用于FFPE卷曲。对于冷冻穿刺活检样品,利用使用来自RSC DNA FFPE试剂盒和 RSC Blood DNA试剂盒(#AS1400)且省略RNA酶步骤的修改程序。在10mMTris、0.1mM EDTA、pH 8.5中洗脱样品并且将10uL用于设置6次多重PCR反应。
以10X浓度(10X=2μM每种引物)制备以下多重PCR引物混合物:
·多重PCR反应1由每种以下标记组成:BARX1、LOC100129726、SPOCK2、TSC22D4、PARP15、MAX.chr8.145105646-145105653、ST8SIA1_22、ZDHHC1、BIN2_Z、SKI、DNMT3A、BCL2L11、RASSF1、FERMT3和BTACT。
·多重PCR反应2由每种以下标记组成:ZNF671、ST8SIA1、NKX6-2、SLC12A8、FAM59B、DIDO1、MAX_Chr1.110、AGRN、PRKCB_28、SOBP和BTACT。
·多重PCR反应3由每种以下标记组成:MAX.chr10.22624430-22624544、ZMIZ1、MAX.chr8.145105646-145105653、MAX.chr10.22541891-22541946、PRDM14、ANGPT1、MAX.chr16.50875223-50875241、PTGDR_9、ANKRD13B、DOCK2和BTACT。
·多重PCR反应4由每种以下标记组成:MAX.chr19.16394489-16394575、HOXB2、ZNF132、MAX.chr19.37288426-37288480、MA X.chr12.52652268-52652362、FLJ45983、HOXA9、TRH、SP9、DMR TA2和BTACT。
·多重PCR反应5由每种以下标记组成:EMX1、ARHGEF4、OPLAH、CYP26C1、ZNF781、DLX4、PTGDR、KLHDC7B、GRIN2D、chr17_737和BTACT。
·多重PCR反应6由每种以下标记组成:TBX15、MATK、SHOX2、BCAT1、SUCLG2、BIN2、PRKAR1B、SHROOM1、S1PR4、NFIX和BTACT。
每种多重PCR反应设置成0.2μM反应缓冲液、0.2μM每种引物、0.05μM Hotstart GoTaq(5U/μL)的最终浓度,从而得到40μL主混合物,其与10μL DNA模板组合成50μL最终反应体积。
多重PCR的热剖面需要95°持续5分钟的预孵育阶段、95°持续30秒、64°持续30秒、72°持续30秒的10个扩增循环、以及在进一步处理之前保持4°的冷却阶段。一旦完成多重PCR,使用20ng/μL鱼DNA的稀释液(例如,在水或缓冲液中,参见美国专利号9,212,392,以引用的方式并入本文中)以1:10稀释PCR产物并且将10μL稀释的扩增样品用于每个QuARTS测定方法。
每个QuARTS测定以三重形式配置,由2个甲基化标记和作为参考基因的BTACT组成。
·从多重PCR产物1,运行以下7种三重QuARTS测定:(1)BARX1、LOC100129726、BTACT;(2)SPOCK2、TSC22D4、BTACT;(3)PARP15、MAXchr8145105646-145105653、BTACT;(4)ST8SIA1_22、ZDHHC1、BTACT;(5)BIN2_Z、SKI、BTACT;(6)DNMT3A、BCL2L11、BTACT;(7)RASSF1、FERMT3和BTACT。
·从多重PCR产物2,运行以下5种三重QuARTS测定:(1)ZNF671、ST8SIA1、BTACT;(2)NKX6-2、SLC12A8、BTACT;(3)FAM59B、DIDO1、BTACT;(4)MAX_Chr1110、AGRN、BTACT;(5)PRKCB_28、SOBP和BTACT。
·从多重PCR产物3,运行以下5种三重QuARTS测定:(1)M AXchr1022624430-22624544、ZMIZ1、BTACT;(2)MAXchr8145105646-145105653、MAXchr1022541891-22541946、BTACT;(3)PRD M14、ANGPT1、BTACT;(4)MAXchr1650875223-50875241、PTG DR_9、BTACT;(5)ANKRD13B、DOCK2和BTACT。
·从多重PCR产物4,运行以下5种三重QuARTS测定:(1)M AXchr1916394489-16394575、HOXB2、BTACT;(2)ZNF132、MAX chr1937288426-37288480、BTACT;(3)MAXchr1252652268-52652362、FLJ45983、BTACT;(4)HOXA9、TRH、BTACT;(5)SP9、DM RTA2和BTACT.
·从多重PCR产物5,运行以下5种三重QuARTS测定:(1)EMX1、ARHGEF4、BTACT;(2)OPLAH、CYP26C1、BTACT;(3)ZNF781、DLX4、BTACT;(4)PTGDR、KLHDC7B、BTACT;(5)GRIN2D、chr17_737和BTACT。
·从多重PCR产物6,运行以下5种三重QuARTS测定:(1)TBX15、MATK、BTACT;(2)SHOX2、BCAT1、BTACT;(3)SUCLG2、BIN2、BTACT;(4)PRKAR1B、SHROOM1、BTACT;(5)S1PR4、NFIX和BTACT。
3)数据分析:
对于组织数据分析,包括具有正常组织中<0.5%甲基化且癌症组织中>10%甲基化的RRBS标准选择的标记。这产生51种标记用于进一步分析。
为了确定标记敏感性,进行以下各项:
1.通过将对每种特异性标记获得的链值除以ACTB(β-肌动蛋白)的链值来计算每种标记的甲基化%。
2.对正常组织测定每种标记的最大甲基化%。这定义为100%特异性。
3.将每种标记的癌症组织阳性确定为具有大于该标记的最大正常组织甲基化%的癌症组织数量。
下文示出51种标记的敏感性。
表2
标记的组合可以用于增加特异性和敏感性。例如,8种标记SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2和EMX1的组合在100%特异性的情况下对于所有测试的癌症组织产生98.5%敏感性(134/136癌症)。
在一些实施方案中,选择标记以用于例如通过使用对特定癌症类型或类型的组合显示敏感性和特异性的标记进行与特定类型的肺癌组织例如腺癌、大细胞癌、磷状细胞癌或小细胞癌相关的敏感性和特异性检测。
对组织测定的此甲基化DNA标记小组对于所有类型的肺癌实现极高的辨别同时在正常肺组织和良性结节中保持阴性。此标记小组的测定也可以阴阳眼基于血液或体液的测试,并且应用于例如肺癌筛选和恶性肿瘤与良性结节的辨别。
实施例3
测试对血浆样品设定的30种标记集合
从实施例2的标记列表中,选择30种标记用于测试来自295位受试者(64位患有肺癌,231位正常对照)的血浆样品的DNA。从来自每位受试者的2mL血浆提取DNA并且用如实施例1所述的亚硫酸氢盐处理。在两个多重QuARTS测定中使用亚硫酸氢盐转化的DNA的等分试样,如实施例1所述的。选择用于分析的标记为:
1.BARX1
2.BCL2L11
3.BIN2_Z
4.CYP26C1
5.DLX4
6.DMRTA2
7.DNMT3A
8.EMX1
9.FERMT3
10.FLJ45983
11.HOXA9
12.KLHDC7B
13.MAX.chr10.22624430-22624544
14.MAX.chr12.52652268-52652362
15.MAX.chr8.124173236-124173370
16.MAX.chr8.145105646-145105653
17.NFIX
18.OPLAH
19.PARP15
20.PRKCB_28
21.S1PR4
22.SHOX2
23.SKI
24.SLC12A8
25.SOBP
26.SP9
27.SUCLG2
28.TBX15
29.ZDHHC1
30.ZNF781
靶标序列、亚硫酸氢盐转化的靶标序列和用于这些标记的测定寡核苷酸如图1所示。用于每种转化的靶标的引物和瓣状寡核苷酸(探针)如下:
表3
*B3GALT6标记用作癌症甲基化标记和参考靶标。参见07/19/16提交的美国专利申请序列号62/364,082,其全文以引用的方式并入本文中。
对于斑马鱼参考DNA,参见07/19/16的美国专利申请序列号62/364,049,其全文以引用的方式并入本文。
在两个多重预扩增反应中扩增如以上所述的由血浆制备的DNA,如实施例1所述。多重预扩增反应包括试剂以扩增以下标记组合。
表4
在预扩增后,在10mM Tris HCl、0.1mM EDTA中1:10稀释预扩增的混合物的等分试样,然后在如实施例1所述的三重QuARTS PCR瓣状测定中测定。第1组三重反应使用来自多重混合物1的预扩增材料,并且第2组反应使用来自多重混合物2的预扩增材料。三重组合如下:
第1组:
ZF_RASSF1-B3GALT6-BTACT(ZBA三链体)
BARX1-SLC12A8-BTACT(BSA2三链体)
PARP15-MAX.chr8.124-BTACT(PMA三链体)
SHOX2-ZDHHC1-BTACT(SZA2三链体)
BIN2_Z-SKI-BTACT(BSA三链体)
DNMT3A-BCL2L11-BTACT(DBA三链体)
TBX15-FERMT3-BTACT(TFA三链体)
PRKCB_28-SOBP-BTACT(PSA2三链体)
第2组:
ZF_RASSF1-B3GALT6-BTACT(ZBA三链体)
MAX.chr8.145-MAX_chr10.226-BTACT(MMA2三链体)
MAX.chr12.526-FLJ45983-BTACT(MFA三链体)
HOXA9-EMX1-BTACT(HEA三链体)
SP9-DMRTA2-BTACT(SDA三链体)
OPLAH-CYP26C1-BTACT(OCA三链体)
ZNF781-DLX4-BTACT(ZDA三链体)
SUCLG2-KLHDC7B-BTACT(SKA三链体)
S1PR4-NFIX-BTACT(SNA三链体)
每个三首字母缩略词使用每个基因名称的第一个字母(例如,HOXA9-EMX1-BTACT的组合=“HEA”)。如果对于不同的标记组合或来自另一个实验的组合重复首字母缩略词,则具有该首字母缩略词的第二组包括数字2。对以上所列出的三链体的每个成员的FRET盒使用的染料报告基因分别为FAM-HEX-Quasar670。
使用含有靶标DNA序列的质粒校准定量反应。对于每个校准物质粒,制备鱼DNA稀释物(在10mM Tris-HCl、0.1mM EDTA中的20ng/mL鱼DNA)中每μl具有10至106个靶标链拷贝的一系列10X校准物稀释原液。对于三重反应,使用具有含有三链体靶标中的每一种的质粒的组合原液。制备具有1x105个拷贝/μL的每种质粒的混合物并且将其用于形成1:10稀释系列。未知样品中的链使用通过将Cp相对于Log作图来生成的标准曲线回算(质粒链)。
使用接收者操作特征(ROC)曲线分析,计算每种标记的曲线下面积(AUC)并且示出在下表中,通过上部95%覆盖区间分选。
表5
标记非常适用于区分来自癌症患者的样品与来自正常受试者的样品(参见以上ROC表)。使用标记的组合改进敏感性。例如,使用数据的逻辑拟合和六种标记拟合,ROC曲线分析显示AUC=0.973。
使用6种标记拟合,在93%特异性下获得92.2%的敏感性。一起产生最佳拟合的6种标记的组为SHOX2、SOBP、ZNF781、BTACT、CYP26C1和DLX4(参见图7)。使用SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI产生AUC为0.97982的ROC曲线(参见图8)。
实施例4
以盲方式测试来自第二独立研究组的归档血浆。平衡每个组的肺癌病例和对照(明显健康的吸烟者)的年龄和性别(23例,80个对照)。使用多重PCR接着进行如实施例1所述的QuARTS(定量等位基因特异性实时靶标和信号扩增)测定,对从血浆提取的DNA进行甲基化DNA标记的亚硫酸氢盐后定量。在此实验中测试来自实施例3的首先个别甲基化标记,以鉴别用于肺癌检测的最佳标记小组(2ml/患者)。
结果:测试13种高性能甲基化DNA标记(CYP26C1、SOBP、SUCLG2、SHOX2、ZDHHC1、NFIX、FLJ45983、HOXA9、B3GALT6、ZNF781、SP9、BARX1和EMX1)。使用两种方法分析数据:逻辑回归拟合和回归划分树方法。逻辑拟合模型鉴别具有0.96的AUC和91%总体敏感性和90%特异性的4种标记小组(ZNF781、BARX1、EMX1和SOBP)。使用回归划分树方法分析数据鉴别具有0.96的AUC和96%总体敏感性和94%特异性的4种标记(ZNF781、BARX1、EMX1和HOXA9)。对于两种方法,将B3GALT6用作总DNA输入的标准化标记。血浆中测定的甲基化DNA标记的这些小组对于所有类型的肺癌实现高敏感性和特异性。
实施例5
区分肺癌
使用以上所述的方法,选择在检测与肺癌特定类型相关的甲基化方面展示高性能的甲基化标记。
对于疑似患有肺癌的受试者,收集样品,例如血浆样品,并且从样品中分离DNA并用亚硫酸氢盐试剂处理,例如,如实施例1所述。使用多重PCR分析转化的DNA,接着进行如实施例1所述的QuARTS瓣状核酸内切酶测定,其配置成提供不同甲基化标记或甲基化标记的组合的不同可鉴别信号,从而提供被配置成特异性鉴别受试者中一种或多种不同类型的肺癌(例如,腺癌、大细胞癌、鳞状细胞癌和/或小细胞癌)的存在的数据集。在优选的实施方案中,生成指示一种测定结果的存在或不存在的报告,该测定结果指示肺癌存在并且在存在时指示一种或多种鉴别类型的肺癌的存在。在一些实施方案中,在时间段过程中或在治疗过程中收集来自受试者的样品,并且比较测定结果以监测癌症病理的改变。
对不同类型的肺癌敏感的标记和标记小组适用于例如将存在的癌症分成一种或多种类型、鉴别混合型病理和/或监测随着时间和/或响应于治疗的癌症进展。
本申请中引用的所有文献和类似的材料,包括但不限于专利、专利申请、文章、书籍、论文和因特网网页,出于任何目的以引用的方式明确地整体并入。除非另外定义,否则本文中使用的所有技术性和科学性术语具有与本文所描述的各种实施方案所属领域中的普通技术人员通常所理解的相同的含义。当引入的参考文献中的术语的定义与本教义中提供的定义不同时,以本教义中提供的定义为主。
本技术的所描述的组合物、方法和用途的各种修改和变化对于本领域技术人员是显而易知的,而不背离所描述的技术的范围和精神。虽然已结合具体的示例性实施方案描述了本技术,但应理解的是,要求保护的本发明不应不适当地局限于这些具体的实施方案。事实上,对药理学、生物化学、医学科学或相关领域的技术人员来说显而易见的用于执行本发明的所描述模式的各种修改意图在以下权利要求的范围内。
序列表
<110> 精密科学发展有限责任公司
梅奥医疗教育与研究基金会
<120> 通过分析甲基化DNA来检测肺肿瘤
<130> EXCT-34810/WO-1/ORD
<150> US 62/332,295
<151> 2016-05-05
<150> US 62/462,677
<151> 2017-02-23
<160> 404
<170> PatentIn 3.5版
<210> 1
<211> 116
<212> DNA
<213> 智人(Homo sapiens)
<400> 1
gttcccggaa cggcctcttg ggggcgttcc agccccacgg acccgcaggg agtccccgcc 60
gcaatttgca tggggctcat ttgcatgacc ccgccccgcg cgggagtcgg gggcgc 116
<210> 2
<211> 116
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 2
gttttcggaa cggttttttg ggggcgtttt agttttacgg attcgtaggg agttttcgtc 60
gtaatttgta tggggtttat ttgtatgatt tcgtttcgcg cgggagtcgg gggcgt 116
<210> 3
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 3
ggcgttttag ttttacggat tcg 23
<210> 4
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 4
acaaataaac cccatacaaa ttacgac 27
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 5
cgccgaggcg aaaactccct 20
<210> 6
<211> 126
<212> DNA
<213> 智人
<400> 6
cggattcaac atgggcaatg tgcctacact ttcattcttc cagaacacga tggcaactgt 60
cgtgagagta cgacagacca gtacaacaca aacgctctgc agagagatgc tccacacgtg 120
gaaccg 126
<210> 7
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 7
cggatttaat atgggtaatg tgtttatatt tttatttttt tagaatacga tggtaattgt 60
cgtgagagta cgatagatta gtataatata aacgttttgt agagagatgt tttatacgtg 120
gaatcg 126
<210> 8
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 8
ttttagaata cgatggtaat tgtcgt 26
<210> 9
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 9
acatctctct acaaaacgtt tatattatac taatc 35
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 10
cgccgaggct atcgtactct 20
<210> 11
<211> 109
<212> DNA
<213> 智人
<400> 11
ggagctacga cgagcagctg cggctggcga tggaactgtc ggcgcaggag caggaggaga 60
ggcggcggcg cgcgcgccag gaggaggagg agctggagcg catcctgag 109
<210> 12
<211> 109
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 12
ggagttacga cgagtagttg cggttggcga tggaattgtc ggcgtaggag taggaggaga 60
ggcggcggcg cgcgcgttag gaggaggagg agttggagcg tattttgag 109
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 13
agttacgacg agtagttgcg 20
<210> 14
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 14
tcctcctact cctacgcc 18
<210> 15
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 15
ccacggacgc gacaattcca t 21
<210> 16
<211> 143
<212> DNA
<213> 智人
<400> 16
ggtggcaacg gctggagtgc cgtcgcccgc gccactcacc ccggcgcggc gccctgcgcg 60
gccgctcagc ggaaggccag caggaagatc agtacgacgt tgatgagaac caggagcgcc 120
agcacggcgg agaccaccac gcg 143
<210> 17
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 17
ggtggtaacg gttggagtgt cgtcgttcgc gttatttatt tcggcgcggc gttttgcgcg 60
gtcgtttagc ggaaggttag taggaagatt agtacgacgt tgatgagaat taggagcgtt 120
agtacggcgg agattattac gcg 143
<210> 18
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 18
cgttcgcgtt atttatttcg gcg 23
<210> 19
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 19
gctcctaatt ctcatcaacg tcgt 24
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 20
cgccgagggc ggcgttttgc 20
<210> 21
<211> 100
<212> DNA
<213> 智人
<400> 21
ggcccggggc cgcctgggcc cctaggggct ggacgtcaac ctgttagata gagggcgtgg 60
gaccccccgc aggcggctgc tcggacgacc gcatccggag 100
<210> 22
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 22
ggttcggggt cgtttgggtt tttaggggtt ggacgttaat ttgttagata gagggcgtgg 60
gatttttcgt aggcggttgt tcggacgatc gtattcggag 100
<210> 23
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 23
cgttaatttg ttagatagag ggcg 24
<210> 24
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 24
acgatcgtcc gaacaacc 18
<210> 25
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 25
ccacggacgc gcctacgaaa a 21
<210> 26
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 26
tccgaacaac cgcctac 17
<210> 27
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 27
ccacggacgc gaaaaatccc a 21
<210> 28
<211> 119
<212> DNA
<213> 智人
<400> 28
gcttccagcc gcgcgctccg tgccactgcc gctctctgca gccccgcgtc cccgcagcct 60
ccccatggcc agcccgcttc gctccgctgc ggcccttgcc cgccaggtac ctcgaaccc 119
<210> 29
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 29
gtttttagtc gcgcgtttcg tgttattgtc gttttttgta gtttcgcgtt ttcgtagttt 60
ttttatggtt agttcgtttc gtttcgttgc ggtttttgtt cgttaggtat ttcgaattt 119
<210> 30
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 30
gtgttattgt cgttttttgt agtttcg 27
<210> 31
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 31
cgcaacgaaa cgaaacga 18
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 32
cgccgagggc gttttcgtag 20
<210> 33
<211> 140
<212> DNA
<213> 智人
<400> 33
gcccgccgca cgccgcaatg ctccgcgctc cccgcggggt cgggcgactc agacagggac 60
cggaaaagaa ccacgcagaa gaaagcccta tttcttgtcg tctgttcctg tgcagccttg 120
cagcctcgcc gcccccgcgt 140
<210> 34
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 34
gttcgtcgta cgtcgtaatg tttcgcgttt ttcgcggggt cgggcgattt agatagggat 60
cggaaaagaa ttacgtagaa gaaagtttta ttttttgtcg tttgtttttg tgtagttttg 120
tagtttcgtc gttttcgcgt 140
<210> 35
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 35
cgtaatgttt cgcgtttttc g 21
<210> 36
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 36
actttcttct acgtaattct tttccga 27
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 37
cgccgagggc ggggtcgggc 20
<210> 38
<211> 85
<212> DNA
<213> 智人
<400> 38
gccggggagt cgagaagcaa gtactagcgc tccaggaccg cgcgcgccgc cccgcgccgc 60
cccgcgccgc ccctcggtcc agagc 85
<210> 39
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 39
gtcggggagt cgagaagtaa gtattagcgt tttaggatcg cgcgcgtcgt ttcgcgtcgt 60
ttcgcgtcgt ttttcggttt agagt 85
<210> 40
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 40
agtattagcg ttttaggatc gcg 23
<210> 41
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 41
actctaaacc gaaaaacgac g 21
<210> 42
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 42
ccacggacgg cgaaacgacg c 21
<210> 43
<211> 74
<212> DNA
<213> 智人
<400> 43
gccgggagcc cgcacttcct cctcgggggc ctcagaaaac cacagggcgc ggggccaggg 60
cggcggcccc cagg 74
<210> 44
<211> 74
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 44
gtcgggagtt cgtatttttt tttcgggggt tttagaaaat tatagggcgc ggggttaggg 60
cggcggtttt tagg 74
<210> 45
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 45
tcgggagttc gtattttttt ttcgg 25
<210> 46
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 46
aaaaccgccg ccctaac 17
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 47
cgccgaggcc ccgcgcccta 20
<210> 48
<211> 78
<212> DNA
<213> 智人
<400> 48
cggggcctac cctcaggcag cgctcgctcg aggccagctt ccgagctcca acccctgccc 60
gaaacctcgg cctcactg 78
<210> 49
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 49
cggggtttat ttttaggtag cgttcgttcg aggttagttt tcgagtttta atttttgttc 60
gaaatttcgg ttttattg 78
<210> 50
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 50
gggtttattt ttaggtagcg ttcg 24
<210> 51
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 51
cgaaatttcg aacaaaaatt aaaactcga 29
<210> 52
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 52
ccacggacgg ttcgaggtta g 21
<210> 53
<211> 141
<212> DNA
<213> 智人
<400> 53
tgtcctgaca cgatggccac aggcacagtt tgtggtgatg cccaggggcc cgcgcggccc 60
cacggtggtc cagtttacac tcgggccccg cactcctgaa gttccgcgcg ggaggagaag 120
ggcgtccctt tcgcagctcg g 141
<210> 54
<211> 141
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 54
tgttttgata cgatggttat aggtatagtt tgtggtgatg tttaggggtt cgcgcggttt 60
tacggtggtt tagtttatat tcgggtttcg tatttttgaa gtttcgcgcg ggaggagaag 120
ggcgtttttt tcgtagttcg g 141
<210> 55
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 55
tgatgtttag gggttcgcg 19
<210> 56
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 56
cgaaacttca aaaatacgaa acccga 26
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 57
cgccgagggc ggttttacgg 20
<210> 58
<211> 112
<212> DNA
<213> 智人
<400> 58
ccggagcact cgccgctgcg cgccctgaag ccgctggcgg taggcggccc tcgaggccgg 60
cgggctgggc ggctcggcag cctgcgccgc ggcctccgcc tcggccgcca gc 112
<210> 59
<211> 112
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 59
tcggagtatt cgtcgttgcg cgttttgaag tcgttggcgg taggcggttt tcgaggtcgg 60
cgggttgggc ggttcggtag tttgcgtcgc ggttttcgtt tcggtcgtta gt 112
<210> 60
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 60
gtattcgtcg ttgcgcg 17
<210> 61
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 61
cctcgaaaac cgcctacc 18
<210> 62
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 62
ccacggacgc gccaacgact t 21
<210> 63
<211> 134
<212> DNA
<213> 智人
<400> 63
cgccgtgagt gttatagttc ttaaaggcgg cgtgtccgga gtttcttcct tctggtgggg 60
ttcgtggtct cgccggctca ggagtgaagc tgcagatctt cgcggtgagt gttacagctc 120
ctaaggcggc gcat 134
<210> 64
<211> 134
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 64
cgtcgtgagt gttatagttt ttaaaggcgg cgtgttcgga gttttttttt tttggtgggg 60
ttcgtggttt cgtcggttta ggagtgaagt tgtagatttt cgcggtgagt gttatagttt 120
ttaaggcggc gtat 134
<210> 65
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 65
taaaggcggc gtgttcg 17
<210> 66
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 66
caacttcact cctaaaccga c 21
<210> 67
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 67
ccacggacgc gaaaccacga a 21
<210> 68
<211> 107
<212> DNA
<213> 智人
<400> 68
aactggcctt ctggctactc cggaatcgcc aagcagatga ggccagaccg ccgccagcgc 60
tgatcacgcg cgctcccaca ggtcctggcg cgcgtgttca gccgcgc 107
<210> 69
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 69
aattggtttt ttggttattt cggaatcgtt aagtagatga ggttagatcg tcgttagcgt 60
tgattacgcg cgtttttata ggttttggcg cgcgtgttta gtcgcgt 107
<210> 70
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 70
tggttttttg gttatttcgg aatcgt 26
<210> 71
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 71
gcgcgtaatc aacgctaac 19
<210> 72
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 72
cgccgaggcg acgatctaac 20
<210> 73
<211> 85
<212> DNA
<213> 智人
<400> 73
ggagcgggca gaggaggagc ccagcgccga ggcccaggcg cgccccgccc tcgcccctcc 60
ccgtgcccct cccccgctgc tcccc 85
<210> 74
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 74
ggagcgggta gaggaggagt ttagcgtcga ggtttaggcg cgtttcgttt tcgttttttt 60
tcgtgttttt ttttcgttgt ttttt 85
<210> 75
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 75
gaggaggagt ttagcgtcg 19
<210> 76
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 76
cacgaaaaaa aacgaaaacg aaac 24
<210> 77
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 77
cgccgaggcg cgcctaaacc 20
<210> 78
<211> 107
<212> DNA
<213> 智人
<400> 78
gcggtctatc acgggcaccc ctaacacttg gtgagtgcgc agtgctctcg gcagtctctg 60
ggctccatac gatgcctacc gcacgcccta gcagaggagg tctctgt 107
<210> 79
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 79
gcggtttatt acgggtattt ttaatatttg gtgagtgcgt agtgttttcg gtagtttttg 60
ggttttatac gatgtttatc gtacgtttta gtagaggagg tttttgt 107
<210> 80
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 80
tgagtgcgta gtgttttcgg 20
<210> 81
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 81
ctcctctact aaaacgtacg ataaaca 27
<210> 82
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 82
cgccgaggat cgtataaaac 20
<210> 83
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 83
atatttggtg agtgcgtagt g 21
<210> 84
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 84
acgtacgata aacatcgtat aaaacc 26
<210> 85
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 85
cgccgagggt tttcggtagt 20
<210> 86
<211> 121
<212> DNA
<213> 智人
<400> 86
tactccactg ccggcttggt gcccacgctc ggcttccgcc cacccatgga ctacgccttt 60
agcgatctca tgcgtgaccg ctcggccgcc gctgctgcgg cggtgcacaa ggagccgacc 120
t 121
<210> 87
<211> 121
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 87
tattttattg tcggtttggt gtttacgttc ggttttcgtt tatttatgga ttacgttttt 60
agcgatttta tgcgtgatcg ttcggtcgtc gttgttgcgg cggtgtataa ggagtcgatt 120
t 121
<210> 88
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 88
tggtgtttac gttcggtttt cgt 23
<210> 89
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 89
ccgcaacaac gacgacc 17
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 90
cgccgaggcg aacgatcacg 20
<210> 91
<211> 106
<212> DNA
<213> 智人
<400> 91
aggccggtca cgaacaaagc gctggcgagt gcgcgcccgc ccacgcgcac aggtgcccgc 60
gacaagacgc cccgtccccg cccacgcggc ccccgcgggc tgagcc 106
<210> 92
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 92
aggtcggtta cgaataaagc gttggcgagt gcgcgttcgt ttacgcgtat aggtgttcgc 60
gataagacgt ttcgttttcg tttacgcggt tttcgcgggt tgagtt 106
<210> 93
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 93
gttacgaata aagcgttggc g 21
<210> 94
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 94
aacgaaacgt cttatcgcga 20
<210> 95
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 95
ccacggacgg agtgcgcgtt c 21
<210> 96
<211> 85
<212> DNA
<213> 智人
<400> 96
gccggccccg cagcatcctc ctgctcgcgg ctctcccgcc acctgtcccg ctccctgccg 60
cgccctgggg cccgcaccta cccac 85
<210> 97
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 97
gtcggtttcg tagtattttt ttgttcgcgg ttttttcgtt atttgtttcg ttttttgtcg 60
cgttttgggg ttcgtattta tttat 85
<210> 98
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 98
cggtttcgta gtattttttt gttcg 25
<210> 99
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 99
gaaccccaaa acgcgac 17
<210> 100
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 100
cgccgagggc ggttttttcg 20
<210> 101
<211> 134
<212> DNA
<213> 智人
<400> 101
cgcctcctgg gctccccccg gagtgggagg gagccgcggt cccgcctccg cgcccgttcc 60
ctcccaggcc cctcggccgc cgcgccgagc tttccgcgcg tggacagact gcccggccga 120
cggacggacg cagg 134
<210> 102
<211> 134
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 102
cgttttttgg gtttttttcg gagtgggagg gagtcgcggt ttcgttttcg cgttcgtttt 60
tttttaggtt tttcggtcgt cgcgtcgagt ttttcgcgcg tggatagatt gttcggtcga 120
cggacggacg tagg 134
<210> 103
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 103
gagtcgcggt ttcgttttc 19
<210> 104
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 104
gacgcgacga ccgaaaaac 19
<210> 105
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 105
cgccgaggcg cgttcgtttt 20
<210> 106
<211> 108
<212> DNA
<213> 智人
<400> 106
tccggcgccg cgttttctag agaaccgggt ctcagcgatg ctcatttcag ccccgtctta 60
atgcaacaaa cgaaacccca cacgaacgaa aaggaacatg tctgcgct 108
<210> 107
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 107
tcggcgtcgc gttttttaga gaatcgggtt ttagcgatgt ttattttagt ttcgttttaa 60
tgtaataaac gaaattttat acgaacgaaa aggaatatgt ttgcgtt 107
<210> 108
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 108
ggcgtcgcgt tttttagaga a 21
<210> 109
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 109
ttccttttcg ttcgtataaa atttcgtt 28
<210> 110
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 110
ccacggacga tcgggtttta g 21
<210> 111
<211> 128
<212> DNA
<213> 智人
<400> 111
gggcctgctg gccggggacc cgcgcgtcga gcgcctggtg cgcgacagcg cctcctactg 60
ccgcgagcgc ttcgaccccg acgagtactc cacggccgtg cgcgaggcgc cagcggagct 120
cgccgaag 128
<210> 112
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 112
gggtttgttg gtcggggatt cgcgcgtcga gcgtttggtg cgcgatagcg ttttttattg 60
tcgcgagcgt ttcgatttcg acgagtattt tacggtcgtg cgcgaggcgt tagcggagtt 120
cgtcgaag 128
<210> 113
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 113
cgatagcgtt ttttattgtc gcg 23
<210> 114
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 114
gcacgaccgt aaaatactcg tc 22
<210> 115
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 115
ccacggacgc gaaatcgaaa c 21
<210> 116
<211> 140
<212> DNA
<213> 智人
<400> 116
tagcagcagc cgcagccatg gcggggatga agacagcctc cggggactac atcgactcgt 60
catgggagct gcgggtgttt gtgggagagg aggacccaga ggccgagtcg gtcaccctgc 120
gggtcactgg ggagtcgcac 140
<210> 117
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 117
tagtagtagt cgtagttatg gcggggatga agatagtttt cggggattat atcgattcgt 60
tatgggagtt gcgggtgttt gtgggagagg aggatttaga ggtcgagtcg gttattttgc 120
gggttattgg ggagtcgtat 140
<210> 118
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 118
gttttcgggg attatatcga ttcg 24
<210> 119
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 119
cccaataacc cgcaaaataa cc 22
<210> 120
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 120
cgccgaggcg actcgacctc 20
<210> 121
<211> 104
<212> DNA
<213> 智人
<400> 121
gtcccagaga cgccctaggg tcagaggtca tctccgtggc aacggaaact tcccgcgcta 60
cggcggctcc aacgggccgc ttccgccgca ttgcgtagcg aagc 104
<210> 122
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 122
gttttagaga cgttttaggg ttagaggtta ttttcgtggt aacggaaatt tttcgcgtta 60
cggcggtttt aacgggtcgt tttcgtcgta ttgcgtagcg aagt 104
<210> 123
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 123
tttcgtggta acggaaattt ttcg 24
<210> 124
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 124
cgacgaaaac gacccgt 17
<210> 125
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 125
cgccgagggc gttacggcgg 20
<210> 126
<211> 107
<212> DNA
<213> 智人
<400> 126
gcgccccggc cgcaggcgga ggacagggag gagcgcacac gagaaagctc ccacgcgccc 60
gcgcctcgcc tccgacggga aggcgcctct tccgaccgtc ctggatg 107
<210> 127
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 127
gcgtttcggt cgtaggcgga ggatagggag gagcgtatac gagaaagttt ttacgcgttc 60
gcgtttcgtt ttcgacggga aggcgttttt ttcgatcgtt ttggatg 107
<210> 128
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 128
gagcgtatac gagaaagttt ttacg 25
<210> 129
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 129
aacgccttcc cgtcgaa 17
<210> 130
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 130
ccacggacgg cgttcgcgtt t 21
<210> 131
<211> 108
<212> DNA
<213> 智人
<400> 131
cgagagggcg cgagcacagc cgaggccatg gaggtgacgg cggaccagcc gcgctgggtg 60
agccaccacc accccgccgt gctcaacggg cagcacccgg acacgcac 108
<210> 132
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 132
cgagagggcg cgagtatagt cgaggttatg gaggtgacgg cggattagtc gcgttgggtg 60
agttattatt atttcgtcgt gtttaacggg tagtattcgg atacgtat 108
<210> 133
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 133
gggcgcgagt atagtcg 17
<210> 134
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 134
caacgcgact aatccgc 17
<210> 135
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 135
cgccgaggcc gtcacctcca 20
<210> 136
<211> 141
<212> DNA
<213> 智人
<400> 136
cgccccctca cctccccgat catgccgttc cagacgccat cgatcttctt tccgtgcttg 60
ccattggtga ccaggtagag gtcgtagctg aagccgatgg tatgcgccag ccgcttcaga 120
atgtcgatgc agaaaccctt g 141
<210> 137
<211> 141
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 137
cgttttttta ttttttcgat tatgtcgttt tagacgttat cgattttttt ttcgtgtttg 60
ttattggtga ttaggtagag gtcgtagttg aagtcgatgg tatgcgttag tcgttttaga 120
atgtcgatgt agaaattttt g 141
<210> 138
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 138
tcgattatgt cgttttagac gttatcg 27
<210> 139
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 139
tctacatcga cattctaaaa cgactaac 28
<210> 140
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 140
ccacggacgc gcataccatc g 21
<210> 141
<211> 93
<212> DNA
<213> 智人
<400> 141
cggcgaggct tcccgcctgg cgcattacaa caagcgctcg accatcacct ccagggagat 60
ccagacggcc gtgcgcctgc tgcttcccgg gga 93
<210> 142
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 142
cggcgaggtt tttcgtttgg cgtattataa taagcgttcg attattattt ttagggagat 60
ttagacggtc gtgcgtttgt tgtttttcgg gga 93
<210> 143
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 143
tggcgtatta taataagcgt tcg 23
<210> 144
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 144
aacaacaaac gcacgacc 18
<210> 145
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 145
ccacggacgc gtctaaatct c 21
<210> 146
<211> 101
<212> DNA
<213> 智人
<400> 146
gggcgggcca ggcgctgggc acggtgatgg ccaccactgg ggccctgggc aactactacg 60
tggactcgtt cctgctgggc gccgacgccg cggatgagct g 101
<210> 147
<211> 101
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 147
gggcgggtta ggcgttgggt acggtgatgg ttattattgg ggttttgggt aattattacg 60
tggattcgtt tttgttgggc gtcgacgtcg cggatgagtt g 101
<210> 148
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 148
ttgggtaatt attacgtgga ttcg 24
<210> 149
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 149
actcatccgc gacgtc 16
<210> 150
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 150
ccacggacgc gacgcccaac a 21
<210> 151
<211> 95
<212> DNA
<213> 智人
<400> 151
gggccattgc cagaagacgt cttctcgggg cgccaggatt cacctttcct tcccgacctc 60
aacttcttcg cggccgactc ctgtctccag ctatc 95
<210> 152
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 152
gggttattgt tagaagacgt tttttcgggg cgttaggatt tatttttttt tttcgatttt 60
aattttttcg cggtcgattt ttgtttttag ttatt 95
<210> 153
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 153
gttagaagac gttttttcgg gg 22
<210> 154
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 154
aaaacaaaaa tcgaccgcga 20
<210> 155
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 155
cgccgagggc gttaggattt 20
<210> 156
<211> 106
<212> DNA
<213> 智人
<400> 156
ggccccggaa gcccagctcc cgggccctgg agcccgccac ggcggcagcc ctgcggcggc 60
ggctggacct gggcagttgc ctggacgtgc tggcctttgc ccagca 106
<210> 157
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 157
ggtttcggaa gtttagtttt cgggttttgg agttcgttac ggcggtagtt ttgcggcggc 60
ggttggattt gggtagttgt ttggacgtgt tggtttttgt ttagta 106
<210> 158
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 158
agttttcggg ttttggagtt cgtta 25
<210> 159
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 159
ccaaatccaa ccgccgc 17
<210> 160
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 160
cgccgaggac ggcggtagtt 20
<210> 161
<211> 106
<212> DNA
<213> 智人
<400> 161
ggcggcgccg gcggctgcgc ggggggcgcc aggccctgct gctgctgctg ctgctgactg 60
cggtagtagg cggcggcggc cacggcggca aagttgtggg tctgga 106
<210> 162
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 162
ggcggcgtcg gcggttgcgc ggggggcgtt aggttttgtt gttgttgttg ttgttgattg 60
cggtagtagg cggcggcggt tacggcggta aagttgtggg tttgga 106
<210> 163
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 163
ttgattgcgg tagtaggcg 19
<210> 164
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 164
aacccacaac tttaccgcc 19
<210> 165
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 165
cgccgaggcg taaccgccgc 20
<210> 166
<211> 154
<212> DNA
<213> 智人
<400> 166
ggtttccccc caccccggcc tcggggtctc tccacgtctc cccgccgacg tgctcacctg 60
ctcagggggc gcccccgagc cgcgccccgc gcccgccccc aggagggcct ccgcgagccg 120
gctgcacacc ccgaggcggt cccggctgca caac 154
<210> 167
<211> 154
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 167
ggtttttttt tatttcggtt tcggggtttt tttacgtttt ttcgtcgacg tgtttatttg 60
tttagggggc gttttcgagt cgcgtttcgc gttcgttttt aggagggttt tcgcgagtcg 120
gttgtatatt tcgaggcggt ttcggttgta taat 154
<210> 168
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 168
gtttcggggt ttttttacgt tttttcg 27
<210> 169
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 169
aaacgcgact cgaaaacgc 19
<210> 170
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 170
cgccgagggt cgacgtgttt 20
<210> 171
<211> 95
<212> DNA
<213> 智人
<400> 171
ctccggtttt cgcggttctc agcgatatta ggcgcggcca gtgtctgaaa gctcctcggg 60
gttacgtcct ggggcgactg gaggcggctc acgac 95
<210> 172
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 172
tttcggtttt cgcggttttt agcgatatta ggcgcggtta gtgtttgaaa gtttttcggg 60
gttacgtttt ggggcgattg gaggcggttt acgat 95
<210> 173
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 173
cggtttttag cgatattagg cg 22
<210> 174
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 174
cccaaaacgt aaccccga 18
<210> 175
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 175
cgccgagggc ggttagtgtt 20
<210> 176
<211> 143
<212> DNA
<213> 智人
<400> 176
cgacggccgc ggaggaggaa ggccaggggg aaatttgcat ttcgtaaaac cgcggttaag 60
aaatgacgat gccacgtaga caagccagtt gtgacgttca gcacaacgtg ctactgaact 120
accgagatcc gccaccaaat ggc 143
<210> 177
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 177
cgacggtcgc ggaggaggaa ggttaggggg aaatttgtat ttcgtaaaat cgcggttaag 60
aaatgacgat gttacgtaga taagttagtt gtgacgttta gtataacgtg ttattgaatt 120
atcgagattc gttattaaat ggt 143
<210> 178
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 178
gggaaatttg tatttcgtaa aatcg 25
<210> 179
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 179
acaactaact tatctacgta acatcgt 27
<210> 180
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 180
ccacggacgg cggttaagaa a 21
<210> 181
<211> 116
<212> DNA
<213> 智人
<400> 181
ggcttggggt ccagccgccc gcccctgccg ccaccgcacc atgtcctgcc tctactcccg 60
cctcagcgcc ccctgcgggg tccgcgcctt cagctgcatc tcggcctgcg ggcccc 116
<210> 182
<211> 116
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 182
ggtttggggt ttagtcgttc gtttttgtcg ttatcgtatt atgttttgtt tttattttcg 60
ttttagcgtt ttttgcgggg ttcgcgtttt tagttgtatt tcggtttgcg ggtttt 116
<210> 183
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 183
tcgttcgttt ttgtcgttat cg 22
<210> 184
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 184
aaccgaaata caactaaaaa cgc 23
<210> 185
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 185
ccacggacgc gaaccccgca a 21
<210> 186
<211> 108
<212> DNA
<213> 智人
<400> 186
ggaaggctgc agcgagagat ttacatattc atccgagctt aaggaagccg cgataatgca 60
ggtacagccc gaaacccacg cccccagacc ttatctgcgc gccccgcc 108
<210> 187
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 187
ggaaggttgt agcgagagat ttatatattt attcgagttt aaggaagtcg cgataatgta 60
ggtatagttc gaaatttacg tttttagatt ttatttgcgc gtttcgtt 108
<210> 188
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 188
ttcgagttta aggaagtcg 19
<210> 189
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 189
tctaaaaacg taaatttcga act 23
<210> 190
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 190
ccacggacgg cgataatgta g 21
<210> 191
<211> 137
<212> DNA
<213> 智人
<400> 191
ggagttattt ttaaccatcg cctcccagaa cattacggag cttcctctct ccaacacgca 60
ggaaacccta cttggctgtg cttcctgcta acacgaggcc ctgcgattgc tgagaacaac 120
agccccgaga ctgcgcg 137
<210> 192
<211> 137
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 192
ggagttattt ttaattatcg ttttttagaa tattacggag tttttttttt ttaatacgta 60
ggaaatttta tttggttgtg ttttttgtta atacgaggtt ttgcgattgt tgagaataat 120
agtttcgaga ttgcgcg 137
<210> 193
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 193
tttaattatc gttttttaga atattacgga 30
<210> 194
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 194
actattattc tcaacaatcg caaaac 26
<210> 195
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 195
ccacggacgc ctcgtattaa c 21
<210> 196
<211> 117
<212> DNA
<213> 智人
<400> 196
ggcgggcgct tggccaaaca gcccaagact gcggaatcac actcgccact gtgtacctgg 60
acgccatctg cagacccagc gcctgcgggg attccggaaa cgggagagcg ggcttcc 117
<210> 197
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 197
ggcgggcgtt tggttaaata gtttaagatt gcggaattat attcgttatt gtgtatttgg 60
acgttatttg tagatttagc gtttgcgggg atttcggaaa cgggagagcg ggttttt 117
<210> 198
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 198
agtttaagat tgcggaatta tattcgt 27
<210> 199
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 199
ttccgaaatc cccgcaa 17
<210> 200
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 200
cgccgaggaa cgctaaatct 20
<210> 201
<211> 156
<212> DNA
<213> 智人
<400> 201
cgcaggctga ggccctcggg tccccagcgg gtcctcgcca tcagtcactc tctacgggcc 60
aggcctgggg gtcacggcct gcaggagcct ccctgcgcgg ccccactccc tcatctgcga 120
ccccgtgggg aggcgaccct gaccaccctc gttccg 156
<210> 202
<211> 156
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 202
cgtaggttga ggttttcggg tttttagcgg gttttcgtta ttagttattt tttacgggtt 60
aggtttgggg gttacggttt gtaggagttt ttttgcgcgg ttttattttt ttatttgcga 120
tttcgtgggg aggcgatttt gattattttc gtttcg 156
<210> 203
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 203
ggttgaggtt ttcgggtttt tag 23
<210> 204
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 204
cctccccacg aaatcgc 17
<210> 205
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 205
cgccgagggc gggttttcgt 20
<210> 206
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 206
aggagttttt ttgcgcgg 18
<210> 207
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 207
acgaaaataa tcaaaatcgc ctcc 24
<210> 208
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 208
cgccgaggcc cacgaaatcg 20
<210> 209
<211> 114
<212> DNA
<213> 智人
<400> 209
cgggggaggg cggcatcagc cagagcctca gccgacggcg ctccccaggt ccacttcccg 60
ctccgatacc ctccccctaa gcacgatacc cagggcccag ggctgctctt ggcg 114
<210> 210
<211> 114
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 210
cgggggaggg cggtattagt tagagtttta gtcgacggcg ttttttaggt ttatttttcg 60
tttcgatatt ttttttttaa gtacgatatt tagggtttag ggttgttttt ggcg 114
<210> 211
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 211
gcggtattag ttagagtttt agtcg 25
<210> 212
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 212
acaaccctaa accctaaata tcgt 24
<210> 213
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 213
ccacggacgg acggcgtttt t 21
<210> 214
<211> 107
<212> DNA
<213> 智人
<400> 214
ctccgctccc cgcaggcctg gccgcgcgac gggcacccag cgggttgtta tcaattattc 60
aggccccaag ttcacgggca ctgcatccat ttccctcgcg tgcgccc 107
<210> 215
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 215
tttcgttttt cgtaggtttg gtcgcgcgac gggtatttag cgggttgtta ttaattattt 60
aggttttaag tttacgggta ttgtatttat ttttttcgcg tgcgttt 107
<210> 216
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 216
tttcgtaggt ttggtcgcg 19
<210> 217
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 217
aacctaaata attaataaca acccgc 26
<210> 218
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 218
ccacggacgg cgacgggtat t 21
<210> 219
<211> 88
<212> DNA
<213> 智人
<400> 219
gtgggccggg cgtgacgcgc ggtcaaagtg caatgatttt tcagttcggt tggctaaaca 60
gggtcagagc tgagagcgaa gcagaagg 88
<210> 220
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 220
gtgggtcggg cgtgacgcgc ggttaaagtg taatgatttt ttagttcggt tggttaaata 60
gggttagagt tgagagcgaa gtagaagg 88
<210> 221
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 221
tggttcgggc gtgacgcg 18
<210> 222
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 222
tctaacccta tttaaccaac cga 23
<210> 223
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 223
cgccgagggc ggttaaagtg 20
<210> 224
<211> 94
<212> DNA
<213> 智人
<400> 224
ggacctcctc ggccccgccc catccgcctt cgggatgctg ctgagccccg tcacctccac 60
ccccttctcg gtcaaggaca tcctgcgact ggag 94
<210> 225
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 225
ggattttttc ggtttcgttt tattcgtttt cgggatgttg ttgagtttcg ttatttttat 60
ttttttttcg gttaaggata ttttgcgatt ggag 94
<210> 226
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 226
gattttttcg gtttcgtttt attcg 25
<210> 227
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 227
caatcgcaaa atatccttaa ccga 24
<210> 228
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 228
ccacggacgg ttttcgggat g 21
<210> 229
<211> 89
<212> DNA
<213> 智人
<400> 229
ctgtcagtgc tgaccgagcg ccgcgccttc cggccatacg ggctccacgg tgcgcggttc 60
cccagccctc gcggccctcc ccgcccccg 89
<210> 230
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 230
ttgttagtgt tgatcgagcg tcgcgttttt cggttatacg ggttttacgg tgcgcggttt 60
tttagttttc gcggtttttt tcgttttcg 89
<210> 231
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 231
cgtcgcgttt ttcggttata cg 22
<210> 232
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 232
cgcgaaaact aaaaaaccgc g 21
<210> 233
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 233
ccacggacgg caccgtaaaa c 21
<210> 234
<211> 114
<212> DNA
<213> 智人
<400> 234
cggagtatgg tgaggagcgc gggggacggg tgcgggaagg ggacagcagg gctgagcctg 60
gggcccgcaa gacccagcag cccgagcggg cgcagagacc ccacgccacg caca 114
<210> 235
<211> 114
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 235
cggagtatgg tgaggagcgc gggggacggg tgcgggaagg ggatagtagg gttgagtttg 60
gggttcgtaa gatttagtag ttcgagcggg cgtagagatt ttacgttacg tata 114
<210> 236
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 236
ggttgagttt ggggttcg 18
<210> 237
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 237
cgtaacgtaa aatctctacg ccc 23
<210> 238
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 238
ccacggacgc gctcgaacta c 21
<210> 239
<211> 95
<212> DNA
<213> 智人
<400> 239
ggagagcagc ccgcagaacc tggccgcgta ctacacgcct ttcccgtcct atggacacta 60
cagaaacagc ctggccaccg tggaggaaga cttcc 95
<210> 240
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 240
ggagagtagt tcgtagaatt tggtcgcgta ttatacgttt ttttcgtttt atggatatta 60
tagaaatagt ttggttatcg tggaggaaga ttttt 95
<210> 241
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 241
gagtagttcg tagaatttgg tcg 23
<210> 242
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 242
ccacgataac caaactattt ctataatatc c 31
<210> 243
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 243
ccacggacgg cgtattatac g 21
<210> 244
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 244
ggagagtagt tcgtagaatt tgg 23
<210> 245
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 245
ctatttctat aatatccata aaacgaaaaa aacgt 35
<210> 246
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 246
ccacggacgg tcgcgtatta t 21
<210> 247
<211> 92
<212> DNA
<213> 智人
<400> 247
gggaaggtgc cctgcgcgcg cgcgctcacc agatgaagtc ggtgcagtgg ctgcagaagg 60
tgggctgctt gaagaagcgg gcggtgaatt tg 92
<210> 248
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 248
gggaaggtgt tttgcgcgcg cgcgtttatt agatgaagtc ggtgtagtgg ttgtagaagg 60
tgggttgttt gaagaagcgg gcggtgaatt tg 92
<210> 249
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 249
ggaaggtgtt ttgcgcg 17
<210> 250
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 250
cttctacaac cactacaccg a 21
<210> 251
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 251
ccacggacgg cgcgcgttta t 21
<210> 252
<211> 107
<212> DNA
<213> 智人
<400> 252
gcctcggggc ccggggactc acaattacgg gcagagaaca catagtgaag agcacggtca 60
tcagcgccag cagcaggagg tgatccagct cctccagggg ctgaggg 107
<210> 253
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 253
gtttcggggt tcggggattt ataattacgg gtagagaata tatagtgaag agtacggtta 60
ttagcgttag tagtaggagg tgatttagtt tttttagggg ttgaggg 107
<210> 254
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 254
gggttcgggg atttataatt acgg 24
<210> 255
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 255
cctcctacta ctaacgctaa taacc 25
<210> 256
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 256
ccacggacgc gtactcttca c 21
<210> 257
<211> 80
<212> DNA
<213> 智人
<400> 257
ggcggctgca gcggcacccg cgctcctgca ccagggactg tgccgagccg cgcgcggacg 60
ggagggaagc gtcccctcag 80
<210> 258
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 258
ggcggttgta gcggtattcg cgtttttgta ttagggattg tgtcgagtcg cgcgcggacg 60
ggagggaagc gtttttttag 80
<210> 259
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 259
gttgtagcgg tattcgcg 18
<210> 260
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 260
cttctctccc gtccgcgc 18
<210> 261
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 261
cgccgaggcg cgactcgaca 20
<210> 262
<211> 143
<212> DNA
<213> 智人
<400> 262
tccagaaaca cgggtatctc cgcgtggtgc tttgcggtcg ccgtcgttgt ggccgtccgg 60
ggtggggtgt gaggagggga cgaaggaggg aaggaagggc aaggcggggg gggctctgcg 120
agagcgcgcc cagccccgcc ttc 143
<210> 263
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 263
tttagaaata cgggtatttt cgcgtggtgt tttgcggtcg tcgtcgttgt ggtcgttcgg 60
ggtggggtgt gaggagggga cgaaggaggg aaggaagggt aaggcggggg gggttttgcg 120
agagcgcgtt tagtttcgtt ttt 143
<210> 264
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 264
agaaatacgg gtattttcgc g 21
<210> 265
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 265
ccacaacgac gacgacc 17
<210> 266
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 266
ccacggacgc gcaaaacacc a 21
<210> 267
<211> 120
<212> DNA
<213> 智人
<400> 267
cggtcgggca ggcgggacgg agattacctg gctgtccagg ggaccttatg cagggtttgg 60
cccgagccca ggggcagcga ggggcgtctg cggatgcggc tccctgtgcg gcacaacacc 120
<210> 268
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 268
cggtcgggta ggcgggacgg agattatttg gttgtttagg ggattttatg tagggtttgg 60
ttcgagttta ggggtagcga ggggcgtttg cggatgcggt tttttgtgcg gtataatatt 120
<210> 269
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 269
gttcgagttt aggggtagcg 20
<210> 270
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 270
ccgcacaaaa aaccgca 17
<210> 271
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 271
ccacggacga tccgcaaacg c 21
<210> 272
<211> 55
<212> DNA
<213> 智人
<400> 272
ccggagcact cgccgctgcg cgccctgaag ccgctggcgg taggcggccc tcgag 55
<210> 273
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 273
tcggagtatt cgtcgttgcg cgttttgaag tcgttggcgg taggcggttt tcgag 55
<210> 274
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 274
ggagtattcg tcgttgcg 18
<210> 275
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 275
cgaaaaccgc ctaccgc 17
<210> 276
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 276
cgccgagggc gttttgaagt 20
<210> 277
<211> 96
<212> DNA
<213> 智人
<400> 277
cccgggccta cggtcctccc gccacctcca cggggcggct gttggggccc caccaggcag 60
agccgtgttc tcaggcgttg gctctcatgg aggtgg 96
<210> 278
<211> 96
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 278
ttcgggttta cggttttttc gttattttta cggggcggtt gttggggttt tattaggtag 60
agtcgtgttt ttaggcgttg gtttttatgg aggtgg 96
<210> 279
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 279
acggtttttt cgttattttt acggg 25
<210> 280
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 280
caacgcctaa aaacacgact c 21
<210> 281
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 281
cgccgagggg cggttgttgg 20
<210> 282
<211> 148
<212> DNA
<213> 智人
<400> 282
gggcctgtcc cgttccctgc tccccataca ggcgaggctg cgtgcacaca gcttcctgta 60
ccccaggagg gcctgcctgg cacgcacccg gtggctgcac catccacacg caagactgca 120
acttcagatg ctccgcacgc tggagatg 148
<210> 283
<211> 148
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 283
gggtttgttt cgttttttgt tttttatata ggcgaggttg cgtgtatata gttttttgta 60
ttttaggagg gtttgtttgg tacgtattcg gtggttgtat tatttatacg taagattgta 120
attttagatg tttcgtacgt tggagatg 148
<210> 284
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 284
ttatataggc gaggttgcgt 20
<210> 285
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 285
cttacgtata aataatacaa ccaccgaata 30
<210> 286
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 286
ccacggacga cgtaccaaac a 21
<210> 287
<211> 88
<212> DNA
<213> 智人
<400> 287
cggagctagg agggtggggc tcggagggcg caggaagagc ggctctgcga ggaaagggaa 60
aggagaggcc gcttctggga agggaccc 88
<210> 288
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 288
cggagttagg agggtggggt tcggagggcg taggaagagc ggttttgcga ggaaagggaa 60
aggagaggtc gtttttggga agggattt 88
<210> 289
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 289
ttaggagggt ggggttcg 18
<210> 290
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 290
ctttcctcgc aaaaccgc 18
<210> 291
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 291
ccacggacgg gagggcgtag g 21
<210> 292
<211> 59
<212> DNA
<213> 智人
<400> 292
gccccggcgg gccccgaggc ggccgcggcc tgcaacgtca tcgtgaacgg cacgcgcgg 59
<210> 293
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 293
gtttcggcgg gtttcgaggc ggtcgcggtt tgtaacgtta tcgtgaacgg tacgcgcgg 59
<210> 294
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 294
tttcggcggg tttcgag 17
<210> 295
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 295
cgtaccgttc acgataacgt 20
<210> 296
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 296
cgccgagggg cggtcgcggt 20
<210> 297
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 297
cgccgaggtt acaaaccgcg 20
<210> 298
<211> 89
<212> DNA
<213> 智人
<400> 298
ctaggcgaga tggtggaagg cgtgtccgta cgggggtggg ctggggtccc cgtgcagaag 60
ggcgcgcgag gacccaggct ggttttccc 89
<210> 299
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 299
ttaggcgaga tggtggaagg cgtgttcgta cgggggtggg ttggggtttt cgtgtagaag 60
ggcgcgcgag gatttaggtt ggttttttt 89
<210> 300
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 300
cgagatggtg gaaggcg 17
<210> 301
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 301
gcgcccttct acacgaa 17
<210> 302
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 302
ccacggacgg tgttcgtacg g 21
<210> 303
<211> 145
<212> DNA
<213> 智人
<400> 303
gcgctgctgc gccgccaggc aaggcgaggg tccgggagaa ggctcggctc cctcctaaac 60
atgtggcccg tggcgtcccc ttgtcccctc cgagcgatgc tcctgcgccc ttcgccgcct 120
cccgcgctgc tgcgccgcca ggcaa 145
<210> 304
<211> 123
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 304
ggcgagggtt cgggagaagg ttcggttttt ttttaaatat gtggttcgtg gcgttttttt 60
gtttttttcg agcgatgttt ttgcgttttt cgtcgttttt cgcgttgttg cgtcgttagg 120
taa 123
<210> 305
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 305
aaatatgtgg ttcgtggcgt t 21
<210> 306
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 306
acgcaacaac gcgaaaaac 19
<210> 307
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 307
cgccgaggcg acgaaaaacg 20
<210> 308
<211> 137
<212> DNA
<213> 智人
<400> 308
acgagaaaga gatcgtgcag ggggtgctgc aacagggcac ggcgtggagg aggaaccaga 60
ccgcggccag agcgttcagg tactcctgcc ctcgcggctc ctcccctcta gcgtcctttc 120
ctccccgagt gcagagg 137
<210> 309
<211> 137
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 309
acgagaaaga gatcgtgtag ggggtgttgt aatagggtac ggcgtggagg aggaattaga 60
tcgcggttag agcgtttagg tatttttgtt ttcgcggttt ttttttttta gcgttttttt 120
tttttcgagt gtagagg 137
<210> 310
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 310
ggggtgttgt aatagggtac g 21
<210> 311
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 311
ctaaacgctc taaccgcga 19
<210> 312
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 312
ccacggacgg gcgtggagga g 21
<210> 313
<211> 117
<212> DNA
<213> 智人
<400> 313
cgcgccgttg gtcacctcgc cggccgccag cgtcgaatgg aagcccgact tgtaccagga 60
ctcgtacggg tgcgccatgc ccacgcgcgg gtacagcccg tcggctgccg tcgtgtg 117
<210> 314
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 314
cgcgtcgttg gttatttcgt cggtcgttag cgtcgaatgg aagttcgatt tgtattagga 60
ttcgtacggg tgcgttatgt ttacgcgcgg gtatagttcg tcggttgtcg tcgtgtg 117
<210> 315
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 315
tagcgtcgaa tggaagttcg a 21
<210> 316
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 316
ggtcgttagc gtcgaatg 18
<210> 317
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 317
gcgcgtaaac ataacgcacc 20
<210> 318
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 318
ccacggacgc cgtacgaatc c 21
<210> 319
<211> 85
<212> DNA
<213> 智人
<400> 319
ggttccttcc cgtgggttct taatcgtctc gctgacttcc agaatgaaac tgcagaccct 60
cgcggtaaag atggcgtgac cagaa 85
<210> 320
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 320
ggtttttttt cgtgggtttt taatcgtttc gttgattttt agaatgaaat tgtagatttt 60
cgcggtaaag atggcgtgat tagaa 85
<210> 321
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 321
tcgtgggttt ttaatcgttt cg 22
<210> 322
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 322
tcacgccatc tttaccgc 18
<210> 323
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 323
ccacggacgc gaaaatctac a 21
<210> 324
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 324
ggtttttttt cgtgggtttt taatcg 26
<210> 325
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 325
ctaatcacgc catctttacc g 21
<210> 326
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 326
ccacggacgg tttcgttgat t 21
<210> 327
<211> 115
<212> DNA
<213> 智人
<400> 327
ggagtgagtg cctacaacgc gcaggccgga ctgatccccc gttgctgcag gttggtgccc 60
caagctgcgg gtgctcgggc gccaactaaa gccagctctg tccagacgcg gaaag 115
<210> 328
<211> 115
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 328
ggagtgagtg tttataacgc gtaggtcgga ttgatttttc gttgttgtag gttggtgttt 60
taagttgcgg gtgttcgggc gttaattaaa gttagttttg tttagacgcg gaaag 115
<210> 329
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 329
cgtaggtcgg attgattttt cgt 23
<210> 330
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 330
tctaaacaaa actaacttta attaacgccc 30
<210> 331
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 331
ccacggacgc gaacacccgc a 21
<210> 332
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 332
aggaaattgc gggttttcg 19
<210> 333
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 333
ggaaggaaat tgcgggtttt c 21
<210> 334
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 334
ccaaaaatcg tcgctaaaaa tcaac 25
<210> 335
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 335
ccacggacgc gcgcattcac t 21
<210> 336
<211> 100
<212> DNA
<213> 智人
<400> 336
ggcggccgcg acccctcccc gctgacctca ctcgagccgc cgcctggcgc agatataagc 60
ggcggcccat ctgaagaggg ctcggcaggc gcccggggtc 100
<210> 337
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 337
ggcggtcgcg attttttttc gttgatttta ttcgagtcgt cgtttggcgt agatataagc 60
ggcggtttat ttgaagaggg ttcggtaggc gttcggggtt 100
<210> 338
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 338
tttcgttgat tttattcgag tcg 23
<210> 339
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 339
tcttcaaata aaccgccgc 19
<210> 340
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 340
cgccgagggt cgtttggcgt 20
<210> 341
<211> 118
<212> DNA
<213> 智人
<400> 341
cgggtggtga agctgcccca cggcctggga gagccttatc gccgcggtcg ctggacgtgt 60
gtggatgttt atgagcgaga cctggagccc cacagcttcg gcggactcct ggagggaa 118
<210> 342
<211> 118
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 342
cgggtggtga agttgtttta cggtttggga gagttttatc gtcgcggtcg ttggacgtgt 60
gtggatgttt atgagcgaga tttggagttt tatagtttcg gcggattttt ggagggaa 118
<210> 343
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 343
gtttgggaga gttttatcgt cg 22
<210> 344
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 344
cctccaaaaa tccgccga 18
<210> 345
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 345
cgccgagggc ggtcgttgga 20
<210> 346
<211> 70
<212> DNA
<213> 智人
<400> 346
ggggcggggg ccgacagccc acgctggcgc ggcaggcgcg tgcgcccgcc gttttcgtga 60
gcccgagcag 70
<210> 347
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 347
ggggtcgggg tcgatagttt acgttggcgc ggtaggcgcg tgcgttcgtc gttttcgtga 60
gttcgagtag 70
<210> 348
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 348
gtcggggtcg atagtttacg 20
<210> 349
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 349
actcgaactc acgaaaacg 19
<210> 350
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 350
cgccgaggga cgaacgcacg 20
<210> 351
<211> 96
<212> DNA
<213> 智人
<400> 351
ggagccccca gccccacgcg ggcacacgca gggtgggtgg tcacgcccgc agggtccgcg 60
agcgcggcgc agagcgcggg ccgtgggaag tttctc 96
<210> 352
<211> 96
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 352
ggagttttta gttttacgcg ggtatacgta gggtgggtgg ttacgttcgt agggttcgcg 60
agcgcggcgt agagcgcggg tcgtgggaag tttttt 96
<210> 353
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 353
gtagggtggg tggttacg 18
<210> 354
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 354
aacttcccac gacccgc 17
<210> 355
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 355
cgccgagggt tcgtagggtt 20
<210> 356
<211> 127
<212> DNA
<213> 智人
<400> 356
ggcgccgcca ttgcggtcct cattttgctg ctggtgggtt gggctacagc aggcctctgg 60
agccacacca gggcacggga gtgggtgcag ggaccgtcac cgcgccttca cacgcaccat 120
agtgccc 127
<210> 357
<211> 127
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 357
ggcgtcgtta ttgcggtttt tattttgttg ttggtgggtt gggttatagt aggtttttgg 60
agttatatta gggtacggga gtgggtgtag ggatcgttat cgcgttttta tacgtattat 120
agtgttt 127
<210> 358
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 358
tggagttata ttagggtacg gga 23
<210> 359
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 359
acactataat acgtataaaa acgcgata 28
<210> 360
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 360
ccacggacga acgatcccta c 21
<210> 361
<211> 140
<212> DNA
<213> 智人
<400> 361
ggcggcgagg ggcgcgtccg cgggtgggtt tcacctgggt ggtgggcatg tcgggcccgc 60
tagggcgagg gtctggccag gggcgtagtt ctcctggtgg gtggggacgc tccgtggcga 120
ttggggtcac tcctctgagg 140
<210> 362
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 362
ggcggcgagg ggcgcgttcg cgggtgggtt ttatttgggt ggtgggtatg tcgggttcgt 60
tagggcgagg gtttggttag gggcgtagtt tttttggtgg gtggggacgt ttcgtggcga 120
ttggggttat ttttttgagg 140
<210> 363
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 363
ggtggtgggt atgtcgg 17
<210> 364
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 364
ccaatcgcca cgaaacg 17
<210> 365
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 365
ccacggacgg gttcgttagg g 21
<210> 366
<211> 117
<212> DNA
<213> 智人
<400> 366
ccgtgggcgc ggacagctgc cgggagcggc aggcgtctcg atcggggacg caggcacttc 60
cgtccctgca gagcatcaga cgcgtctcgg gacactgggg acaacatctc ctccgcg 117
<210> 367
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 367
tcgtgggcgc ggatagttgt cgggagcggt aggcgtttcg atcggggacg taggtatttt 60
cgtttttgta gagtattaga cgcgtttcgg gatattgggg ataatatttt tttcgcg 117
<210> 368
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 368
gttgtcggga gcggtagg 18
<210> 369
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 369
ccaatatccc gaaacgcgtc t 21
<210> 370
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 370
ccacggacgg cgtttcgatc g 21
<210> 371
<211> 120
<212> DNA
<213> 智人
<400> 371
aagctgcgcc cggagacgtg ggagcgttct cttgttttcc gagtgcgcgg actcatcggg 60
tcacagttta tgcttttatg acgcggtgag tccagccact gattcctaac ggtttagagt 120
<210> 372
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 372
aagttgcgtt cggagacgtg ggagcgtttt tttgtttttc gagtgcgcgg atttatcggg 60
ttatagttta tgtttttatg acgcggtgag tttagttatt gatttttaac ggtttagagt 120
<210> 373
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 373
cgtttttttg tttttcgagt gcg 23
<210> 374
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 374
tcaataacta aactcaccgc gtc 23
<210> 375
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 375
ccacggacgg cggatttatc g 21
<210> 376
<211> 224
<212> DNA
<213> 智人
<400> 376
ctctgacctg agtctccttt ggaactctgc aggttctatt tgctttttcc cagatgagct 60
ctttttctgg tgtttgtctc tctgactagg tgtctaagac agtgttgtgg gtgtaggtac 120
taacactggc tcgtgtgaca aggccatgag gctggtgtaa agcggccttg gagtgtgtat 180
taagtaggtg cacagtaggt ctgaacagac tccccatccc aaga 224
<210> 377
<211> 224
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 377
ttttgatttg agtttttttt ggaattttgt aggttttatt tgtttttttt tagatgagtt 60
ttttttttgg tgtttgtttt tttgattagg tgtttaagat agtgttgtgg gtgtaggtat 120
taatattggt ttgtgtgata aggttatgag gttggtgtaa agtggttttg gagtgtgtat 180
taagtaggtg tatagtaggt ttgaatagat tttttatttt aaga 224
<210> 378
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 378
ccatgaggct ggtgtaaag 19
<210> 379
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 379
ctactgtgca cctacttaat acac 24
<210> 380
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 380
cgccgagggc ggccttggag 20
<210> 381
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 381
gtgtttgttt ttttgattag gtgtttaaga 30
<210> 382
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 382
ctttacacca acctcataac cttatc 26
<210> 383
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 383
gacgcggaga tagtgttgtg g 21
<210> 384
<211> 139
<212> DNA
<213> 智人
<400> 384
ggccacacag gcccactctg gccctctgag cccccggcgg acccagggca ttcaaggagc 60
ggctctgggc tgccagcgca ggcctccgcg caaacacagc aggctggaag tggcgctcat 120
caccggcacg tcttcccag 139
<210> 385
<211> 139
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 385
ggttatatag gtttattttg gttttttgag ttttcggcgg atttagggta tttaaggagc 60
ggttttgggt tgttagcgta ggttttcgcg taaatatagt aggttggaag tggcgtttat 120
tatcggtacg tttttttag 139
<210> 386
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 386
ggtttatttt ggttttttga gttttcgg 28
<210> 387
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 387
tccaacctac tatatttacg cgaa 24
<210> 388
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 388
ccacggacgg cggatttagg g 21
<210> 389
<211> 171
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 389
tccacgtggt gcccactctg gacaggtgga gcagagggaa ggtggtggca tggtggggag 60
ggtggcctgg aggacccgat tggctgagtg taaaccagga gaggacatga ctttcagccc 120
tgcagccaga cacagctgag ctggtgtgac ctgtgtggag agttcatctg g 171
<210> 390
<211> 180
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 390
tttatcgtgg tgtttatttt ggataggtgg agtagaggga aggtggtgcg tatggtgggc 60
gagcgcgtgc gtttggagga tttcgattgg ttgacgtgta aattaggacg aggatatgat 120
ttttagtttt gtagttagat atagttgagt tggtgtgatt tgtgtggaga gtttatttgg 180
<210> 391
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 391
cgcatggtgg gcgag 15
<210> 392
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 392
acacgtcagc caatcggg 18
<210> 393
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 393
gacgcggagg cgcgtgcgcc 20
<210> 394
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 394
tgcgtatggt gggcgag 17
<210> 395
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 395
cctaatttac acgtcaacca atcgaa 26
<210> 396
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 396
gacgcggagg cgcgtgcgtt t 21
<210> 397
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 397
ccacggacgg cgcgtgcgtt t 21
<210> 398
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 398
agccggtttt ccggctgaga cctcggcg 28
<210> 399
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 399
agccggtttt ccggctgaga cctcggcg 28
<210> 400
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 400
agccggtttt ccggctgaga ctccgcgtc 29
<210> 401
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 401
agccggtttt ccggctgaga cgtccgtgg 29
<210> 402
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 402
agccggtttt ccggctgaga ggacgcgc 28
<210> 403
<211> 108
<212> DNA
<213> 智人
<400> 403
ggaaggaaat tgcgggttcc cgtctgcctt gtctccagct tctctgctga agcccggtag 60
cagtgaatgc gcgctgactt tcagcgacga ctcctggaag caacgcca 108
<210> 404
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成DNA
<400> 404
ggaaggaaat tgcgggtttt cgtttgtttt gtttttagtt tttttgttga agttcggtag 60
tagtgaatgc gcgttgattt ttagcgacga tttttggaag taacgtta 108