CN114908159A

CN114908159A - 结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒

Info

Publication number: CN114908159A
Application number: CN202110178812.5A
Authority: CN
Inventors: 周平红; 蔡明琰; 朱博群; 王辉; 刘蕊
Original assignee: Shanghai Fuyuan Biotechnology Co ltd; Zhongshan Hospital Fudan University
Current assignee: Shanghai Fuyuan Biotechnology Co ltd; Zhongshan Hospital Fudan University
Priority date: 2021-02-09
Filing date: 2021-02-09
Publication date: 2022-08-16
Also published as: WO2022170984A1

Abstract

本申请涉及结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒。具体而言，本申请提供一种用于诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的试剂盒，包含处理DNA的第一试剂、第一引物池和第二试剂，该第一引物池含用于预扩增以下两组目标标记物中每一组目标标记物中的至少一种目标标记物的引物对：(I)Septin9、BCAT1和IKZF1，和(II)PKNOX2、CRHBP、SOX1和基因间隔区A，所述引物对可与被第一试剂处理后的目标标记物的目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交，所述目标序列包含至少一个CpG位点。

Description

结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒

技术领域

本申请总体上涉及生物医学领域。具体来说，本申请涉及结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒。

背景技术

在癌变前的腺瘤晚期或癌症早期对结直肠瘤进行早期检测表明可以显著降低患者的死亡率。当前的结直肠瘤筛查手段包括结肠镜检查或对粪便、血液样品的分子检查，这些筛查手段都是侵入性的或只有极少的标记物，限制了患者对癌症筛查的配合度或检测灵敏度。

然而，虽然通过检测血浆游离DNA的高甲基化已被证实可用于结直肠肿瘤的筛查，但现有检测方法对进展期腺瘤的检出率较低。

因此，亟需开发一种方法和/或试剂盒，其可以从生物样品中数量极为有限的细胞外游离DNA高效地读取表观遗传学信息，而且可以在医院检验科里很容易地配置并可以可靠地应用。

发明内容

本发明通过不同检测靶点，联合血浆游离DNA高甲基化和低甲基化的方法，提高对结直肠进展期腺瘤的检测灵敏度。

在一个方面，本申请提供了一种在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法，所述方法包括如下步骤：

从所述个体获取含有DNA的生物样品；

用试剂处理所述生物样品中的DNA，所述试剂能够区分所述DNA中的甲基化和未甲基化的CpG位点，从而获得经处理的DNA；

定量分析目标标记物(target marker)的甲基化水平；其中，所述目标标记物包括以下两组目标标记物中每一组目标标记物中的至少一种目标标记物：(I)Septin9、BCAT1和IKZF1，(II)PKNOX2、CRHBP、SOX1和基因间隔区A；

分别比较所述目标标记物的甲基化水平和相应的参考水平，其中：组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平，且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤，或者所述个体有结直肠进展期腺瘤形成或形成的风险，或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加，或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。

在一些实施方式中，所述方法包括：

(a)从所述个体获取含有DNA的生物样品；

(b)用试剂处理步骤(a)中获取的所述生物样品中的DNA，所述试剂能够区分所述DNA中的甲基化和未甲基化的CpG位点，从而获得经处理的DNA；

(c)用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下两组目标标记物(target marker)中每一组目标标记物中的至少一种目标标记物：(I)Septin9、BCAT1和IKZF1，(II)PKNOX2、CRHBP、SOX1和基因间隔区A；其中所述目标标记物的至少一部分被预扩增以获得预扩增产物；

(d)基于步骤(c)获取的预扩增产物来分别定量分析所述被扩增的目标标记物的甲基化水平；

(e)分别比较步骤(d)中的所述被扩增的目标标记物的甲基化水平和相应的参考水平，其中：组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平，且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤，或者所述个体有结直肠进展期腺瘤形成或形成的风险，或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加，或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。

在一些实施方式中，上述方法的步骤(c)中，所述组(I)中的至少2个或全部3个目标标记物被扩增。

在一些实施方式中，上述方法的步骤(c)中，所述组(I)中的Septin9与BCAT1，BCAT1与IKZF1，或Septin9与IKZF1被扩增。

在一些实施方案中，上述方法的步骤(c)中，所述组(II)中的至少2个、至少3个或全部4个目标标记物被扩增。

在一些实施方案中，上述方法的步骤(c)中，所述组(II)中，PKNOX2与CRHBP，PKNOX2与SOX1，PKNOX2与基因间隔区A，CRHBP与基因间隔区A，或SOX1与基因间隔区A被扩增。

在一些实施方案中，上述方法的步骤(c)中，所述组(II)中，PKNOX2、CRHBP和SOX1，PKNOX2、CRHBP和基因间隔区A，PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A被扩增。

在一些实施方案中，上述方法的步骤(c)中，用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下目标标记物：Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A；其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。

在一些实施方式中，所述各个目标标记物包含或是：

a)如下所示的通过Hg19坐标定义的各个区域：Septin9，chr17:75276651-75496678；BCAT1，chr12:24964295-25102393；IKZF1，chr7:50343720-50472799；PKNOX2，chr11:125034583-125303285；CRHBP，chr5:76248538-76276983；SOX1，chr13:112721913-112726020；基因间隔区A，chr10:130082033-130087148；以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb；或

b)亚硫酸氢盐转化后的a)的对应区域；或

c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。

在一些实施方式中，从步骤(a)中获取的所述生物样本中的所述DNA包括基因组DNA或细胞外游离DNA。在一些实施方式中，所述细胞外游离DNA包括循环肿瘤DNA。在一些实施方式中，所述细胞外游离DNA中的所述目标标记物在所述生物样品中的数量不超过1ng、0.8ng、0.6ng、0.4ng、0.2ng、0.1ng、0.08ng或不超过0.04ng。在一些实施方式中，所述细胞外游离DNA中的所述目标标记物在所述生物样品中的浓度低于用于所述目标标记物的检测分析的灵敏度水平。

在一些实施方式中，步骤(c)中所述预扩增产物在步骤(d)之前使用稀释剂稀释。

在一些实施方式中，所述生物样品选自下组：组织学切片、组织活检、石蜡包埋的组织、体液、结肠流出物、手术切除样本、分离的血细胞、分离自血液的细胞，及其任意组合。在一些实施方式中，所述体液选自下组：全血、血清、血浆、尿液、粘液、唾液、腹膜液、胸腔液、胸膜积液、滑液、脑脊髓液、胸腔穿刺液、腹腔积液，及其任意组合。在一些实施方式中，从所述个体的血浆中获得所述生物样品。在一些实施方式中，所述结肠流出物选自下组：粪便样品和灌肠洗涤样品。

在一些实施方式中，步骤(b)的所述试剂在CpG位点选择性地修饰未甲基化的胞嘧啶残基以产生修饰的残基，但并不显著性地修饰甲基化的胞嘧啶残基。在一些实施方式中，步骤(b)的所述试剂包括亚硫酸氢盐试剂。在一些实施方式中，所述亚硫酸氢盐试剂选自下组：亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子，及其任意组合。

在一些实施方式中，步骤(b)的所述试剂选择性地切割未甲基化的残基但不切割甲基化的残基，或者选择性地切割甲基化的残基但不切割未甲基化的残基。在一些实施方式中，步骤(b)的所述试剂是甲基化敏感限制酶(MSRE)。在一些实施方式中，所述MSRE选自下组：HpaII酶、SalI酶、

酶、ScrFI酶、BbeI酶、NotI酶、SmaI酶、XmaI酶、MboI酶、BstBI酶、ClaI酶、MluI酶、NaeI酶、NarI酶、PvuI酶、SacII酶、HhaI酶及其任意组合。

在一些实施方式中，所述预扩增引物池包含甲基化特异性引物对。在一些实施方式中，其中所述甲基化特异性引物对包含一个正向引物和一个反向引物，所述引物均包含寡核苷酸序列，所述寡核苷酸序列与相应的目标标记物的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交，其中所述至少9个连续核苷酸包含至少一个CpG位点。

在一些实施方式中，所述预扩增引物池进一步包含用于扩增对照标记物的对照引物对。在一些实施方式中，所述对照标记物选自下组：ACTB、GAPDH、微管蛋白(tubulin)、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。

在一些实施方案中，用于扩增Septin9的引物对为SEQ ID NO:22/23；用于扩增BCAT1的引物对为SEQ ID NO:24/25；用于扩增IKZF1的引物对为SEQ ID NO:26/27；用于扩增PKNOX2的引物对为SEQ ID NO:28/29；用于扩增CRHBP的引物对为SEQ ID NO:30/31；用于扩增SOX1的引物对为SEQ ID NO:32/33；用于扩增基因间隔区A的引物对为SEQ ID NO:34/35。

在一些实施方式中，所述甲基化特异性引物对至少包含选自以下的引物对中的一对或多对：SEQ ID NO：22/23、24/25、26/27、28/29、30/31、32/33和34/35。优选地，所述甲基化特异性引物对包含选自下组(I)的至少一对、至少两对或全部三对引物对和下组(II)的至少一对、至少两对、至少三对引物对：(I)SEQ ID NO：22/23、24/25和26/27；(II)SEQ IDNO：28/29、30/31、32/33和34/35。优选地，所述甲基化特异性引物对包含SEQ ID NO：22/23、24/25、26/27、28/29、30/31、32/33和34/35。

在一些实施方式中，在步骤(c)中，所述目标标记物在一个或多个封闭寡核苷酸存在的情况下被扩增。

在一些实施方式中，步骤(d)的所述定量分析是通过以下方式进行：聚合酶链式反应(例如实时聚合酶链式反应、数字聚合酶链式反应)、核酸测序、基于质量的分离(例如电泳法、质谱法)或靶标捕获(例如杂交、微阵列)。在一些实施方式中，步骤(d)的所述定量分析是通过实时聚合酶链式反应进行的，任选地所述实时聚合酶链式反应是多重实时聚合酶链式反应。

在一些实施方式中，步骤(d)的所述定量分析包含使用定量引物对和DNA聚合酶对步骤(c)的预扩增产物进行扩增，其中所述预扩增产物通过扩增产生扩增产物。

在一些实施方式中，步骤(d)使用的所述定量引物对能够与步骤(c)的所述预扩增产物的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。

在一些实施方式中，步骤(d)使用的至少一个所述定量引物对和步骤(c)的所述预扩增引物池的至少一个所述甲基化特异性引物对相同。

在一些实施方式中，步骤(d)使用的所述定量引物对被设计为用于扩增步骤(c)的所述至少一个预扩增产物内的至少一部分。

在一些实施方式中，所述步骤(d)在检测试剂存在的情况下进行。在一些实施方式中，所述检测试剂选自下组：荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。优选地，用于检测Septin9的探针为SEQ ID NO:36；检测BCAT1的探针为SEQ ID NO:37；用于检测IKZF1的探针为SEQ ID NO:38；用于检测PKNOX2的探针为SEQ ID NO:39和40；用于检测CRHBP的探针为SEQ ID NO:41；用于检测SOX1的探针为SEQ IDNO:42；用于检测基因间隔区A的探针为SEQ ID NO:43。在一些实施方式中，所述探针至少包括选自下组的一条或多条核苷酸序列：SEQ ID NO:36-43。优选地，所述探针包括SEQ IDNO:36-38中的至少一条、至少两条或全部三条核苷酸序列和SEQ ID NO:39和/或40以及SEQID NO:41-43中的至少一条、至少两条或至少三条核苷酸序列。在一些实施方式中，所述探针包括SEQ ID NO:36-38和41-43所示的核苷酸序列，以及SEQ ID NO:39和/或40所示的核苷酸序列。

在一些实施方式中，所述荧光探针的5’端标记有荧光染料(例如FAM、HEX/VIC、TAMRA、Texas Red或Cy5)，3’端标记有猝灭剂(例如BHQ1、BHQ2、BHQ3、DABCYL或TAMRA)。

在一些实施方式中，步骤(e)包括比较步骤(d)的所述目标标记物的Ct值和参考Ct值，其中所述组(I)的目标标记物的Ct值高于其相应的参考Ct值、且组(II)的目标标记物的Ct值低于其相应的参考Ct值表明所述个体患有结直肠进展期腺瘤，或者所述个体有结直肠进展期腺瘤形成或形成的风险，或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加，或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。

在一些实施方式中，步骤(c)的所述预扩增包括5到30个反应循环，其中每个循环包括在40～80℃下反应5秒-5分钟，之后在85～99℃下反应5秒-5分钟。

在一些实施方式中，步骤(d)的所述定量分析包括基于所述预扩增产物中多个CpG二核苷酸、TpG二核苷酸或CpA二核苷酸的存在或水平来确定其甲基化水平。在一些实施方式中，步骤(d)的所述定量分析包括基于所述预扩增产物中一个或多个CpG二核苷酸的存在或水平来确定胞嘧啶残基的甲基化水平。在一些实施方式中，步骤(d)的所述定量分析是通过将步骤(c)所述预扩增产物分割为多个组分来进行的。

在一些实施方式中，步骤(e)中的所述参考水平是基于从患有结直肠瘤或具有患结直肠瘤风险的一组个体中获取的临床样本和从未患结直肠瘤或不具有患结直肠瘤风险的一组个体中获取的临床样本来确定的。

在另一方面，本申请提供了一种用于诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的试剂盒，其包含：

(a)处理DNA的第一试剂，其中所述第一试剂能够区分DNA中的甲基化和未甲基化的CpG位点；

(b)第一引物池，所述第一引物池包含用于预扩增以下两组目标标记物中每一组目标标记物中的至少一种目标标记物的引物对：(I)Septin9、BCAT1和IKZF1，和(II)PKNOX2、CRHBP、SOX1和基因间隔区A，其中所述引物对可与被所述第一试剂处理后的所述目标标记物的目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交，其中所述目标序列包含至少一个CpG位点；

(c)第二试剂，所述第二试剂用于定量分析被所述第一引物池预扩增的所述目标标记物中每个目标标记物的甲基化水平。

在一些实施方式中，所述第二试剂包含第二引物池，所述第二引物池包含多个定量引物对，所述定量引物对能够与被所述第一引物池预扩增的所述目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。

在一些实施方式中，所述第二引物池中的定量引物对和所述第一引物池中的引物对相同。在一些实施方式中，所述第二引物池中的定量引物对被设计为用于扩增被所述第一引物池预扩增的所述目标序列内的至少一部分。

在一些实施方式中，所述第一引物池包含至少一个甲基化特异性引物对。

在一些实施方式中，所述第一引物池和所述第二引物池被包装在单一容器内或被包装在独立容器内。

在一些实施方式中，所述试剂盒进一步包含一个或多个封闭寡核苷酸。

在一些实施方式中，所述试剂盒进一步包含检测试剂。在一些实施方式中，所述检测试剂选自下组：荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。所述探针至少包括选自下组的一条或多条核苷酸序列：SEQ ID NO:36-43。优选地，所述探针包括下组(I)的至少一条、至少两条或全部三条核苷酸序列和下组(II)的至少一条、至少两条或至少三条核苷酸序列：(I)SEQ ID NO:36-38，(II)SEQ ID NO:39或40以及41-43。在一些实施方式中，所述探针包括：SEQ ID NO:36-38和41-43所示的核苷酸序列，以及SEQ ID NO:39和/或40所示的核苷酸序列。在一些实施方式中，所述荧光探针的5’端标记有荧光染料(例如FAM、HEX/VIC、TAMRA、Texas Red或Cy5)，3’端标记有猝灭剂(例如BHQ1、BHQ2、BHQ3、DABCYL、TAMRA或lowa Black Dark Quenchers)。

在一些实施方式中，所述试剂盒进一步包含DNA聚合酶和/或一个适合存放从所述个体中获取的所述生物样品的容器。在一些实施方式中，所述试剂盒进一步包含使用说明书和/或对试剂盒检测结果的解释。

在一些实施方式中，所述第一试剂包括亚硫酸氢盐试剂或甲基化敏感限制酶(MSRE)。在一些实施方式中，所述亚硫酸氢盐试剂选自下组：亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子，及其任意组合。在一些实施方式中，所述MSRE选自下组：HpaII酶、SalI酶、

在一些实施方式中，所述第一引物池中包括用于扩增所述组(I)中的至少2个或全部3个目标标记物的引物对。

在一些实施方式中，所述第一引物池中包括用于扩增所述组(I)中的Septin9与BCAT1，BCAT1与IKZF1，或Septin9与IKZF1的引物对。

在一些实施方案中，所述第一引物池中包括用于扩增所述组(II)中的至少2个、至少3个或全部4个目标标记物的引物对。

在一些实施方案中，所述第一引物池中包括用于扩增组(II)中的PKNOX2与CRHBP，PKNOX2与SOX1，PKNOX2与基因间隔区A，CRHBP与基因间隔区A，或SOX1与基因间隔区A的引物对。

在一些实施方案中，所述第一引物池中包括用于扩增组(II)中的PKNOX2、CRHBP和SOX1，PKNOX2、CRHBP和基因间隔区A，PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A的引物对。

在一些实施方案中，所述第一引物池中包括用于扩增Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A的引物对；其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。

在一些实施方式中，所述各个目标标记物包含或是：

b)亚硫酸氢盐转化后的a)的对应区域；或

c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。

在一些实施方式中，所述第一引物池包含的引物对包含选自下组的核苷酸序列，或由选自下组的苷酸序列组成：SEQ ID NO:22/23、24/25、26/27、28/29、30/31、32/33和34/35，任选地其中所述第二引物池包含至少一个与所述第一引物池中的至少一个引物对相同的引物对。

在一些实施方式中，所述第一引物池和所述第二引物池进一步包含用于扩增对照标记物的引物对。在一些实施方式中，所述对照标记物选自下组：ACTB、GAPDH、微管蛋白、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。

在一些实施方式中，所述试剂盒进一步包含多个容器，每个容器均用于接收所述第二引物池的组分。

在另一方面，本申请提供了根据本申请所述的试剂盒在制造用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的诊断试剂盒中的用途。

在另一方面，本申请提供了用于定量分析目标标记物的甲基化水平的试剂在制造试剂盒中的用途，所述试剂盒被用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法中，其中所述方法包括如下步骤：

(a)从所述个体获取含有DNA的生物样品；

在一些实施方案中，上述方法的步骤(c)中，PKNOX2与CRHBP，PKNOX2与SOX1，PKNOX2与基因间隔区A，CRHBP与基因间隔区A，或SOX1与基因间隔区A被扩增。

在一些实施方案中，上述方法的步骤(c)中，PKNOX2、CRHBP和SOX1，PKNOX2、CRHBP和基因间隔区A，PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A被扩增。

在一些实施方式中，所述各个目标标记物包含或是：

b)亚硫酸氢盐转化后的a)的对应区域；或

c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。

附图说明

图1：肠镜未发现异常与进展期腺瘤患者血浆游离DNA中Septin9、BCAT1和IKZF1甲基化检测结果。

图2：肠镜未发现异常与进展期腺瘤患者血浆游离DNA中PKNOX2、CRHBP、SOX1、基因间隔区A的甲基化检测结果。

图3显示了目标标记物的示例性亚区域(subregion)的核苷酸序列。

具体实施方式

虽然本申请公开了本申请的各个方面和各种实施方式，但是本领域技术人员

可以在不脱离本申请的精神和范围的前提下做出各种等同改变或修改。本申请公开的各个方面和各种实施方式均是示例性的，并不旨在限制本申请的范围，本申请的实际保护范围以权利要求书为准。除非另有说明，否则本申请中使用的所有技术和科学术语均是本领域技术人员通常理解的含义。本申请引用的所有参考文献、专利和专利申请均通过引用并入本申请。

需注意的是，在本申请的说明书和权利要求书中，单数形式的“一个”、“一种”和“所述”均包括其复数形式，除非上下文另有说明。因此，例如，“一种试剂”包括多种试剂。

在本申请的说明书和权利要求书，除非另有说明，否则术语“包含”、“包括”或“含有”是指含有所列出的数值、步骤或成分，但也不排除还含有其他数值、步骤或成分。

传统上，对癌症的诊断依赖于对单个标记物(例如，基因突变)的检测，但是很可惜的是，通常很难通过检测单个标记物来检测癌症，或者很难通过检测单个标记物来区分多种类型的癌症。此外，在生物样品中单个标记物的水平通常是极为有限的，这进一步降低了对癌症的诊断特异性和/或诊断灵敏度。因此，仅识别单个标记物的分析法被证明具有有限的预测价值。

在一个方面，本申请预扩增本文所述的目标标记物来获得预扩增产物，之后基于其各自的预扩增产物来分别定量分析每个目标标记物的甲基化水平。这样的预扩增步骤可以提高目标标记物的数量/水平，并可以显著提高对结直肠进展期腺瘤的诊断特异性和/或诊断灵敏度。在另一方面，本申请同时定量分析生物样品中的多个目标标记物的甲基化水平，以提高对结直肠进展期腺瘤的诊断特异性和/或诊断灵敏度。在一些实施方式中，所述多个目标标记物在定量分析之前先预扩增。特别地，本申请的发明人出人意料地发现将预扩增步骤和定量分析步骤结合在一起可以显著提高对结直肠进展期腺瘤的诊断特异性和/或诊断灵敏度，使得对结直肠进展期腺瘤的早期检测成为可能，例如在癌变前的腺瘤期或癌症早期。本领域技术人员可以理解的是，在上下文中的诊断“灵敏度”定义的是被正确鉴定为阳性结果的比例，也就是被正确鉴定出患病的个体的百分比。而“特异性”定义的是被正确鉴定为阴性结果的比例，也就是被正确鉴定出不患病的个体的百分比。

1.方法

(a)从所述个体获取含有DNA的生物样品；

(b)用试剂处理所述生物样品中的DNA，所述试剂能够区分所述DNA中的甲基化和未甲基化的CpG位点，从而获得经处理的DNA；

(d)定量分析目标标记物(target marker)的甲基化水平；其中，所述目标标记物包括以下两组目标标记物中每一组目标标记物中的至少一种目标标记物：(I)Septin9、BCAT1和IKZF1，(II)PKNOX2、CRHBP、SOX1和基因间隔区A；

(e)分别比较所述目标标记物的甲基化水平和相应的参考水平，其中：组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平，且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤，或者所述个体有结直肠进展期腺瘤形成或形成的风险，或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加，或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险；

其中，所述方法包括任选的步骤(c)：用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下两组目标标记物中每一组目标标记物中的至少一种目标标记物：(I)Septin9、BCAT1和IKZF1，(II)PKNOX2、CRHBP、SOX1和基因间隔区A；其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。

优选地，所述方法包括：

(a)从所述个体获取含有DNA的生物样品；

本文中所使用的术语“筛查”是指对病理状态、疾病或病况进行鉴定，例如对结直肠进展期腺瘤的鉴定，或对患有结直肠进展期腺瘤但可能从特定的治疗方案中获益的个体进行鉴定。在本申请中，术语“筛查”和术语“诊断”可能互换使用。

本文中所使用的术语“瘤”或“肿瘤”应当理解为是指包含肿瘤细胞的病灶、肿瘤或其他包囊化或未包囊化的块体或其他形式的生长物。“肿瘤细胞”应当理解为是指显示出异常生长的细胞。术语“生长”应当以最广泛的意义理解并且包括增殖。于此而言，细胞异常生长的一个实例是细胞失控的增殖。另一个实例是

细胞因凋亡失败而延长其通常的寿命。肿瘤细胞可以是良性细胞或恶性细胞。在一些实施方式中，肿瘤是腺瘤或腺癌。不使本发明限于任一理论或作用模式，腺瘤通常是源自上皮的良性肿瘤，其源自上皮组织或显示出清晰界定的上皮结构。这些结构物可以具有腺状外观。它可能在腺瘤内部包含恶性细胞群体，例如，随着良性腺瘤或良性肿瘤病灶进展成恶性腺癌而发生。在一些实施方式中，瘤是恶性的，例如癌。在一些实施方式中，瘤不是恶性的，例如腺瘤。

本文中所使用的术语“结直肠瘤”是指存在于结肠、直肠和/或阑尾的瘤。在一些实施方式中，结直肠瘤是结直肠癌、结直肠腺瘤和/或无蒂锯齿状息肉。在一些实施方式中，结直肠瘤是癌前的。

本文所述术语“结直肠进展期腺瘤”是指肿瘤大于1cm、或含高级别上皮内瘤变、或含绒毛成分的腺瘤。

本文中所使用的术语“癌前”指的是展示出与癌症进展风险升高相关的一些组织学变化的瘤。就结直肠细胞增殖性病症来说，这类状况的实例包括高度发育异常的细胞增殖性疾病，例如结肠的腺瘤状息肉。

本文中在描述瘤(例如，腺瘤或腺癌)时所用的术语“形成”被理解为是指表现出发育异常的个体的一个或多个细胞。对这一点而言，腺瘤或腺癌可能已形成发展，因为已形成非正常增长的细胞团块，也可以是腺瘤或腺癌处在极早期，在诊断时只有相比数量极少的细胞出现非正常分裂。本申请也延伸至评估个体的结直肠进展期腺瘤(例如，结直肠癌)形成风险。

本文中所用的术语“评估”指的是区分来自患有结直肠进展期腺瘤的个体和未患有结直肠进展期腺瘤的个体的样本的能力，或者区分来自处于结直肠瘤进展不同阶段的个体的样本的能力。在一些实施方式中，该评估涉及确定个体的肿瘤是否进入进展阶段或是否具有较高可能性进入进展阶段。在一些实施方式中，该评估涉及对个体的肿瘤进行分类，例如I期、II期、III期、IV期等。在一些实施方式中，该评估涉及确定个体的肿瘤是否减轻或加重。在一些实施方式中，该评估可以协助评价一种治疗具有临床受益的可能性。在一些实施方式中，该评估可能涉及患者在接受治疗(例如，用特定的药物进行治疗)后是否好转和/或好转的可能性。通过为任何特定患者选择最合适的治疗方式，本申请的评估方法可以被用于在临床上做出治疗决定。在施用治疗方案(例如，给定的治疗方案，包括例如给定的治疗药剂或组合的施用，手术干预、类固醇治疗等)后，本申请的评估方法在评价该患者能否长期存活的可能性上是有价值的工具。

本领域技术人员所理解的“区分”不能达到对所分析的样品100％正确。但是，依然要求对具有统计学意义的数量的样品能够正确分类。具有统计学意义的数量可以由本领域技术人员通过使用不同的统计工具来确定，例如但不限于确定置信区间、确定p值，学生氏T检验或Fisher区分方程。有关详细信息，请参见Dowdy and Wearden,Statistics forResearch,John Wiley&Sons,New York 1983。在一些实施方式中，置信区间为至少90％、至少95％、至少96％、至少97％、至少98％或至少99％。在一些实施方式中，p值小于0.1、0.05、0.01、0.005或0.0001。

本文所用的术语“进展”是指细胞的形态和生理沿着遗传确定的途径改变，例如，从先前、较低或早期到后来的、更复杂或更高级阶段的生理成熟中的自然发展过程。

本文所用的术语“预后”是指预测疾病(例如，癌症)的疾病症状(包括例如复发、加剧、耐药性)结果的可能性。该术语还指对治疗的临床获益可能性的预测。在一些实施方式中，使用统计算法为个体提供疾病的预后。例如，预后可以是手术、癌症(例如，实体瘤，例如结直肠癌、黑素瘤和肾细胞癌)的临床亚型的进展、一种或多种临床因素的进展或从疾病中恢复。预后可以是预后不良(例如可能复发或产生耐药性)或预后良好。

在本申请中，以下关于步骤(a)、步骤(b)、步骤(c)、步骤(d)和步骤(e)的详细描述适用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法。

步骤(a)

在根据本申请的方法的步骤(a)中，从所述个体中获取包含DNA的生物学样本。

本文所用的术语“生物样品”是指获自或衍生自目标个体的生物组合物，其包含基于物理、生化、化学和/或生理特征待表征或待识别的细胞和/或其他分子实体(例如DNA)。生物样品包括但不限于通过本领域技术人员已知的任何方法获得的个体的细胞、组织、器官和/或生物体液。在一些实施方式中，所述生物样品选自下组：组织学切片、组织活检、石蜡包埋的组织、体液、结肠流出物、手术切除样本、分离的血细胞、分离自血液的细胞，及其任意组合。在一些实施方式中，所述体液选自下组：全血、血清、血浆、尿液、粘液、唾液、腹膜液、胸腔液、胸膜积液、滑液、脑脊髓液、胸腔穿刺液、腹腔积液，及其任意组合。在一些实施方式中，所述结肠流出物选自下组：粪便样品和灌肠洗涤样品。选择最适合根据本文申请的方法的检测的样品将取决于情境的性质。在一些实施方式中，所述生物样品获自个体的全血。在一些实施方式中，所述生物样品获自个体的血浆。本领域技术人员知道从全血制备血浆的各种方法。例如，在一些实施方式中，血浆通过将来自个体的全血离心一次、两次、三次、四次、五次或更多次来获得。

本文所用的术语“个体”包括人类和非人类的动物。非人类动物包括所有脊椎动物，例如哺乳动物和非哺乳动物。“个体”也可以是家畜，例如牛、猪、绵羊、家禽和马；或啮齿动物，例如大鼠、小鼠；或非人类灵长类动物，例如猿、猴、恒河猴；或家养的动物，例如狗或猫。在一些实施方式中，个体是人类或非人类灵长类动物。在一些实施方式中，个体是人类。在本申请中，“个体”和“受试者”可能互换使用。

在一些实施方式中，所述DNA是从所述生物样本中分离的。从生物样品中分离和纯化DNA可以通过使用本领域已知的各种方法来实施，包括使用可商购的试剂盒。例如，通过以下方式从细胞和组织中分离DNA：在高度变性和还原条件下裂解原材料、部分使用蛋白质降解酶、纯化通过苯酚/氯仿提取工艺获得的核酸组分，并通过渗析或乙醇沉淀从水相中回收核酸(参见例如Sambrook,J.,Fritsch,E.F.in T.Maniatis,C S H,Molecular Cloning,1989)。又例如，现在有许多试剂体系特别适用于从琼脂糖凝胶中纯化DNA片段、从细菌裂解物中分离质粒DNA，以及从血液、组织或细胞培养物中分离较长链的核酸(基因组DNA、总细胞RNA)。许多这些可商购的纯化体系中是基于相当众所周知的原理，即，在不同离液盐的溶液的存在下将核酸与矿物载体相结合。在这些体系中，细磨的玻璃粉、硅藻土或硅胶的悬浮液被用作载体材料。在例如US7888006B2和EP1626085A1中描述了从生物样品中分离和纯化DNA的一些其他方法。在方法之间进行选择将受到几个因素的影响，包括时间、费用和所需的DNA数量。

在一些实施方式中，生物样品中包含的DNA包括基因组DNA。本文所用的术语“基因组DNA”是指包含细胞或生物体的完整基因组及其片段或部分的DNA。基因组DNA是来源于个体的大段DNA(例如长于大约10、20、30、40、50、60、70、80、90、100、200或300kb)，并且可以具有天然修饰，例如DNA甲基化。

在一些实施方式中，生物样品中包含的DNA包括细胞DNA。本文所用的术语“细胞DNA”是指存在于细胞内的DNA，或从体内细胞中获取DNA并在体外分离、或以其他方式在体外操作，只要该DNA未从体内细胞中移除。

在一些实施方式中，生物样品中包含的DNA包括细胞外游离DNA。本文所用的术语“细胞外游离DNA”是指在体内的细胞外存在的DNA片段。该术语也可以被用于指代获取自体内的细胞外来源并在体外分离、或操作的DNA片段。细胞外游离DNA中的DNA片段通常具有约100到200bp的长度，推测与被包裹于核小体的DNA片段的长度有关。细胞外游离DNA包括例如细胞外游离胎儿DNA和循环肿瘤DNA。细胞外游离胎儿DNA在孕妇的体内(例如血液)中循环，代表胎儿基因组，而循环肿瘤DNA在癌症患者的体内(例如血液)中循环。在一些实施方式中，细胞外游离DNA可基本上不含个体的细胞DNA。例如，所述细胞外游离DNA可包含小于约1,000ng/mL、小于约100ng/mL、小于约10ng/mL、小于约1ng/mL的细胞DNA。

可以通过使用本领域已知的常规技术来制备细胞外游离DNA。例如，可以通过以约200-20,000g、约200-10,000g、约200-5,000g、约300-4000g等的速度离心血液样品约3-30分钟、约3-15分钟、约3-10分钟、约3-5分钟来获得血液样品的细胞外游离DNA。例如，在一些实施方式中，可以通过将个体的血浆或血清离心一、二、三、四、五次或更多次来获得血液样本的细胞外游离DNA。在一些实施方式中，为了从包含可溶性DNA的无细胞组分中分离细胞及其片段，可以通过微滤来获得所述生物样品。通常来说，微滤可以通过使用过滤器来进行，例如，0.1微米～0.45微米的膜过滤器，诸如0.22微米的膜过滤器。

在一些实施方式中，使用商购的DNA提取产品从全血、血清或血浆中提取细胞外游离DNA用于分析。这种提取方法据称对循环DNA的回收率高(>50％)，某些产品(例如Qiagen生产的QIAamp Circulating Nucleic Acid Kit)据称可提取小尺寸的DNA片段。所使用的典型样品量为1-5mL血清或血浆。

在一些实施方式中，细胞外游离DNA包括循环肿瘤DNA。循环肿瘤DNA(“ctDNA”)是与细胞无关的体液(例如血液、尿液、唾液、痰、粪便、胸膜液、脑脊液等)中肿瘤来源的片段化DNA。通常，ctDNA高度片段化，平均长度约为150个碱基对。ctDNA通常包括体液(例如血浆)中细胞外游离DNA的极小部分，例如ctDNA可能构成血浆DNA的不到约10％。通常，该百分比小于约1％，例如小于约0.5％或小于约0.01％。另外，血浆DNA的总量通常非常低，例如约10ng/mL血浆。ctDNA的数量因人而异，并且取决于肿瘤的类型、位置，对于癌性肿瘤，则取决于癌症的阶段。但是，ctDNA通常在体液中非常罕见，只能通过极其敏感和特异性的技术进行检测。检测ctDNA可能有助于检测和诊断肿瘤、指导肿瘤特异性治疗、监测治疗以及监测癌症的缓解。

步骤(b)

在根据本申请的方法的步骤(b)中，用能够区分DNA中的未甲基化和甲基化CpG位点的试剂处理步骤(a)中获取的生物样品中的DNA，从而获得经处理的DNA。

DNA甲基化是(例如，通过DNA甲基转移酶的作用)将甲基添加到DNA分子上(例如，添加至DNA分子的一个或多个胞嘧啶碱基)的生物学过程。在哺乳动物中，DNA甲基化出现于胞嘧啶-磷酸-鸟嘌呤(CpG)二核苷酸(即“CpG位点”)的5’位置，当其出现在基因的启动子或第一个外显子中的5’-CpG-3’二核苷酸中时，会导致基因的表观遗传失活。充分证明DNA甲基化在调节基因表达、肿瘤发生、以及其他遗传和表观遗传疾病中起重要作用。

如本文所用，术语“甲基化的胞嘧啶残基”是指胞嘧啶残基的衍生物，其中一个甲基连接至胞嘧啶环的碳原子上(例如C5)。术语“未甲基化的胞嘧啶残基”是指未衍生化的胞嘧啶残基，其中与“甲基化的胞嘧啶残基”相反，在胞嘧啶环的碳原子(例如C5)上没有甲基连接。其内的胞嘧啶残基被甲基化的CpG位点就是甲基化的CpG位点，而其内的胞嘧啶残基未被甲基化的CpG位点是未甲基化的CpG位点。

在一些实施方式中，步骤(b)中使用的试剂能够区分DNA中的未甲基化和甲基化的CpG位点，从而获得经处理的DNA。该试剂可以选择性地作用于未甲基化的胞嘧啶残基，但不能显著地作用于甲基化的胞嘧啶残基。或者该试剂可以选择性地作用于甲基化的胞嘧啶残基，而不显著地作用于未甲基化的胞嘧啶残基。因此，原始DNA以取决于是否被甲基化的方式转化为经处理的DNA，从而可以通过其杂交行为将经处理的DNA与原始DNA区分开。

例如，一些试剂可以选择性地将未甲基化的胞嘧啶残基转化为尿嘧啶、胸腺嘧啶或杂交上与胞嘧啶不同的另一碱基，而甲基化的胞嘧啶残基依然处于未转化状态。又例如，一些试剂可以选择性地切割甲基化的残基，或者选择性地切割未甲基化的残基。

如本文所用，“经处理的DNA”是指已经用能够区分DNA中的未甲基化和甲基化的CpG位点的试剂处理后的DNA，即DNA中的DNA甲基化状态已经改变。

在一些实施方式中，步骤(b)的所述试剂在CpG位点选择性地修饰未甲基化的胞嘧啶残基以产生修饰的残基，但并不显著性地修饰甲基化的胞嘧啶残基。

在一些实施方式中，步骤(b)的所述试剂包括亚硫酸氢盐试剂。如本文所用，术语“亚硫酸氢盐试剂”是指，例如本申请所公开的可用于区分甲基化和未甲基化的CpG二核苷酸序列的包括亚硫酸氢盐、亚硫酸氢根离子或其任意组合的试剂。在本申请中，用亚硫酸氢盐试剂处理DNA也被描述为“亚硫酸氢盐反应”或“亚硫酸氢盐处理”，指的是转化未甲基化的胞嘧啶残基的反应，特别是在亚硫酸氢根离子存在的情况下，核酸中未甲基化的胞嘧啶残基被转化为尿嘧啶碱基、胸腺嘧啶碱基或在杂交行为上与胞嘧啶不同的其他碱基，而其中甲基化的胞嘧啶残基未被显著地转化。换言之，亚硫酸氢盐处理可用于区分甲基化的CpG二核苷酸和未甲基化的CpG二核苷酸。Frommer,M.,et al.,Proc Natl Acad Sci USA 89(1992)1827-31和Grigg,G.,Clark,S.,Bioessays 16(1994)431-6中详细描述了用于检测甲基化的胞嘧啶残基的亚硫酸氢盐反应。亚硫酸氢盐反应包括脱氨基步骤和脱磺酸基步骤(参见Grigg and Clark,同上)。“甲基化的胞嘧啶残基未被显著地转化”这一陈述，不排除非常小的百分比(例如，小于0.1％、小于0.2％、小于0.3％、小于0.4％、小于0.5％、小于0.6％、小于0.7％、小于0.8％、小于0.9％、小于1％、小于2％、小于3％、小于4％、小于5％、小于6％、小于7％、小于8％、小于9％、小于10％、小于11％、小于12％、小于13％、小于14％、小于15％、小于16％、小于17％、小于18％、小于19％、小于20％)的甲基化的胞嘧啶残基被转化为尿嘧啶、胸腺嘧啶或在杂交行为上与胞嘧啶不同的其他碱基，尽管其意在仅仅转化未甲基化的胞嘧啶残基。

在例如参考Frommer M.,et al.(同上)或Grigg and Clark(同上)的情况下(它们公开了亚硫酸氢盐处理的基本参数)，本领域技术人员知道如何进行亚硫酸氢盐处理，特别是脱氨基步骤和脱磺酸基步骤。孵育时间和温度对脱氨基效率的影响、以及影响DNA降解的参数都已公开。

在一些实施方式中，所述亚硫酸氢盐试剂选自下组：亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子，及其任意组合。在一些实施方式中，所述亚硫酸氢盐试剂是亚硫酸氢钠。在一些实施方式中，亚硫酸氢盐试剂是可商购的，例如，MethylCode^TM Bisulfite Conversion Kit、EpiMark^TM BisulfiteConversion Kit、EpiJET^TM Bisulfite Conversion Kit、EZDNAMethylation-Gold^TM Kit等。在一些实施方式中，根据试剂盒的使用说明书进行亚硫酸氢盐反应。

在一些实施方式中，步骤(b)的所述试剂选择性地切割未甲基化的残基但不切割甲基化的残基，或者选择性地切割甲基化的残基但不切割未甲基化的残基。

在一些实施方式中，步骤(b)的所述试剂是甲基化敏感限制酶(MSRE)。

术语“甲基化敏感限制酶”是指根据其识别位点的甲基化状态而选择性地消化核酸的酶。对于当识别位点未被甲基化或半甲基化时才特异剪切的限制酶来说，当识别位点被甲基化时，不会发生剪切，或以显著降低的效率剪切。对于当识别位点被甲基化时才特异剪切的限制酶来说，当识别位点未被甲基化时，不会发生剪切，或以显著降低的效率剪切。在一些实施方式中，甲基化敏感限制酶的识别序列含有CG二核苷酸(例如cgcg或cccggg)。在一些实施方式中，当该CG二核苷酸中的胞嘧啶在C5碳原子处被甲基化时，甲基化敏感限制酶不进行剪切。

在一些实施方式中，所述MSRE选自下组：HpaII酶、SalI酶、

使用本领域已知的方法，使用能区分目标区域内的甲基化的CpG二核苷酸和未甲基化的CpG二核苷酸的甲基化敏感限制酶或包含甲基化敏感限制酶的一系列限制酶试剂来确定甲基化，例如但不限于，差异性甲基化杂交(“DMH”)。

在一些实施方式中，步骤(a)的DNA可以在用甲基化敏感限制酶处理之前被切割。这样的方法是本领域已知的，并且可以既包括物理方式也包括酶促方式。特别优选的是使用一种或多种对甲基化不敏感的并且其识别位点富含AT并且不包含CG二核苷酸的限制酶。使用此类酶使得DNA片段中的CpG位点和CpG富集区域得以保存。在一些实施方式中，此类限制酶选自MseI酶、BfaI酶、Csp6I15酶、Tru1I酶、Tru9I酶、MaeI酶、XspI酶及其任意组合。

步骤(c)

在根据本申请的方法的步骤(c)中，用预扩增引物池对从步骤(b)获得的经处理的DNA中的目标标记物进行预扩增，其中每个目标标记物的至少一部分被预扩增以获得至少一个预扩增产物。在本申请中，步骤(c)也可以被称为预扩增步骤。

对目标标记物进行预扩增的目的之一是增加经处理的DNA中的目标标记物的数量。如本文所用，术语“扩增”大体上是指任何能够导致分子或一组相关分子的拷贝数增加的过程。当“扩增”被用于多核苷酸分子时，是指通常从少量多核苷酸开始产生多拷贝的多核苷酸分子或多核苷酸分子的一部分的多份拷贝，其中被扩增的物质(扩增子，PCR扩增子)通常是可被检测到的。多核苷酸的扩增涵盖多个化学和酶促过程。扩增的形式包括通过聚合酶链式反应(逆转录PCR、PCR)、链置换扩增(SDA)反应、转录介导扩增(TMA)反应、基于核酸序列的扩增(NASBA)反应或连接酶链反应(LCR)，从一个或几个拷贝的模板RNA或DNA分子生成多个DNA拷贝。

如本文所用，术语“目标标记物”是指这样的目的核酸或基因区域：其甲基化水平指示着结直肠瘤(例如，结直肠进展期腺瘤)，或指示着结直肠瘤(例如，结直肠进展期腺瘤)形成或形成的风险，或指示着结直肠瘤(例如，结直肠进展期腺瘤)的进展或预后。在本申请中，术语“标记物”和“基因”可以互换使用。术语“标记物”或“基因”应被认为包括其所有转录变体及其所有启动子和调控元件。如本领域技术人员所理解的，已知某些基因在个体之间表现出等位基因变异或单核苷酸多态性(“SNP”)。SNP包括不同长度的简单的重复序列(例如二核苷酸和三核苷酸重复)的插入和缺失。因此，本申请应被理解为扩展到由任何其他突变、多态性或等位基因变异产生的标记物/基因的所有形式。另外，应当理解，术语“标记物”和“基因”应既包括标记物或基因的正义链序列，也包括标记物或基因的反义链序列。

本文所用的术语“目标标记物”被宽泛地解释为既包括1)在生物样品或基因组DNA中发现的原始标记物(处于特定的甲基化状态)，也包括2)其经过处理的序列(例如亚硫酸氢盐转化后的对应区域或MSRE处理后的对应区域)。亚硫酸氢盐转化后的对应区域与基因组序列中的目标标记物不同之处在于，一个或多个未甲基化的胞嘧啶残基被转化为尿嘧啶碱基、胸腺嘧啶碱基或在杂交行为上与胞嘧啶不同的其他碱基。经MSRE处理的对应区域与基因组序列中的目标标记物不同之处在于，该序列在一个或多个MSRE切割位点处被切割。

在本文所述的方法和试剂盒中，所述目标标记物分为以下两组：(I)Septin9、BCAT1和IKZF1，(II)PKNOX2、CRHBP、SOX1和基因间隔区A。其中，每一组中至少预扩增一种目标标记物或每组中至少一种目标标记物的至少一部分被预扩增。

在一些实施方式中，所述组(I)中的至少2个或全部3个目标标记物被扩增，和/或，所述组(II)中的至少2个、至少3个或全部4个目标标记物被扩增。

在一些实施方式中，所述组(I)中的Septin9与BCAT1，BCAT1与IKZF1，或Septin9与IKZF1被扩增。

在一些实施方案中，组(II)中的PKNOX2与CRHBP，PKNOX2与SOX1，PKNOX2与基因间隔区A，CRHBP与基因间隔区A，或SOX1与基因间隔区A被扩增。在一些实施方案中，组(II)中的PKNOX2、CRHBP和SOX1，PKNOX2、CRHBP和基因间隔区A，PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A被扩增。

在一些实施方中，用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下目标标记物：Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A；其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。

在本申请中，应该理解的是，标记物/基因既通过引用其名称又通过其染色体坐标来进行描述。所述染色体坐标与2009年2月发布的人类基因组数据库Hg19版本一致(在本文中称为“Hg19坐标”)。

在一些实施方式中，所述的各个目标标记物包括或是：

b)亚硫酸氢盐转化后的a)的对应区域；或

c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。

在公共数据库(例如UCSC Genome Browser、Ensemble和NCBI网站)中可以获得如上所述的Hg19坐标的特定核苷酸序列，以及每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb。

在一些实施方式中，所述各个目标标记物也包括其所有变体。变体包括来自相同区域的、与本文所述的标记物/基因区域具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％的序列同一性(即，具有一个或多个缺失、插入、取代、反向序列等)的核酸序列。因此，本申请内容应理解为延伸至实现相同结果的此类变体，尽管事实上个体间的实际核酸序列具有微小的遗传变异。

如本文所用，术语“序列同一性的百分比(％)”是指候选序列的氨基酸(或核酸)残基和参考序列的氨基酸(或核酸)残基进行序列比对后的相同百分比，比对时可以引入间隔(如有必要)以使得相同的氨基酸(或核酸)数目达到最多。

换句话说，氨基酸序列(或核酸序列)的序列同一性百分比(％)可以通过用与参考序列相同的氨基酸残基(或碱基)的数目除以候选序列或参考序列中氨基酸残基(或碱基)的总数(以较短者为准)来计算。氨基酸残基的保守取代可以被认为或可以不被认为是相同的残基。可以通过以下方式来确定氨基酸(或核酸)序列同一性的百分比，例如，可以使用公开的工具如BLASTN、BLASTp(可在美国国家生物技术信息中心(NCBI)的网站上获得，也可参见Altschul S.F.et al.,J.Mol.Biol.,215:403–410(1990)；Stephen F.et al.,NucleicAcids Res.,25:3389–3402(1997))、ClustalW2(可在欧洲生物信息研究所的网站上找到)，也可参见Higgins D.G.et al.,Methods in Enzymology,266:383-402(1996)；LarkinM.A.et al.,Bioinformatics(Oxford,England),23(21):2947-8(2007))和ALIGN或Megalign(DNASTAR)软件。本领域技术人员可以使用所述工具提供的默认参数，或者可以(例如，通过选择合适的算法)定制适合比对的参数。

在本文提供的步骤c)中，每个目标标记物的至少一部分被预扩增以获得至少一个预扩增产物。在一些实施方式中，目标标记物的预扩增部分在目标标记物的亚区域内。

在不使本申请限于任一理论或作用模式的情况下，据信测量目标标记物的亚区域内的甲基化水平尤其有用，所述亚区域包含在结直肠瘤(例如，结直肠进展期腺瘤)中经常被超甲基化(hypermethylated)的高密度CpG二核苷酸。这一发现使得亚区域成为分析的一个特别有用的目标，因为它既可以简化筛查过程(因为需要分析的DNA区域更短且界定更为清晰)，而且进一步地，相比于对目标标记物的整个Hg19区域进行分析所获得的结果，从这些亚区域所获得的结果会在超甲基化的存在或不存在这方面提供显著地更为明确的结果。因此，该发现既简化了诊断、筛查/监测过程，又增加了结直肠进展期腺瘤诊断的敏感度和特异性。在一些实施方式中，各个目标标记物的亚区域包含或是：

a)如下所示的通过Hg19坐标定义的各个区域：

目标标记物	Hg19坐标的亚区域
		Septin9	chr17:75369603-75369693
BCAT1	chr12:25102016-25102110
		IKZF1	chr7:50343793-50343896
PKNOX2	chr11:125036431-125036547
		CRHBP	chr5:76249633-76249729
SOX1	chr13:112758808-112758890
		基因间隔区A	chr10:130085033-130085148

以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb；或b)亚硫酸氢盐转化后的a)的对应区域；或c)MSRE处理后的a)的对应区域。

在一些实施方式中，各个目标标记物的亚区域包含或是选自下组的多核苷酸序列：SEQ ID NO：1-7、或其亚硫酸氢盐转化后的对应区域、或其MSRE处理的对应区域。在一些实施方式中，各目标标记物的亚区域的经亚硫酸氢盐转化后的对应区域包含或是选自下组的多核苷酸序列：SEQ ID NO：8-21。每个目标标记物的亚区域及经亚硫酸氢盐转化后的对应区域的SEQ ID NO列在下表1中，图3中提供了具体序列。

表1：各个目标标记物的示例性亚区域

在一些实施方式中，Septin9的亚区域包含选自下组的序列：SEQ ID NO:1、8、15；BCAT1的亚区域包含选自下组的序列：SEQ ID NO:2、9、16；IKZF1的亚区域包含选自下组的序列：SEQ ID NO:3、10、17。

在一些实施方式中，PKNOX2的亚区域包含选自下组的序列：SEQ ID NO:4、11、18；SOX1的亚区域包含选自下组的序列：SEQ ID NO:5、12、19；CRHBP的亚区域包含选自下组的序列：SEQ ID NO:6、13、20；基因间隔区A的亚区域包含选自下组的序列：SEQ ID NO:7、14、21。

在一些实施方式中，细胞外游离DNA中的目标标记物以不超过1ng、不超过0.9ng、不超过0.8ng、不超过0.7ng、不超过0.6ng、不超过0.5ng、不超过0.4ng、不超过0.3ng、不超过0.2ng、不超过0.1ng、不超过0.09ng、不超过0.08ng、不超过0.07ng、不超过0.06ng、不超过0.05ng、不超过0.04ng、不超过0.03ng、不超过0.02ng或不超过0.01ng的量存在于生物样品中。在一些实施方式中，细胞外游离DNA中的目标标记物以不超过0.1％、不超过0.2％、不超过0.3％、不超过0.4％、不超过0.5％、不超过0.6％、不超过0.7％、不超过0.8％、不超过0.9％、不超过1％的百分比存在于生物样品中。在一些实施方式中，细胞外游离DNA中的所述目标标记物在生物样品中的浓度低于用于目标标记物的检测分析的灵敏度水平。“检测分析的灵敏度”是对检测分析在分析浓度/量的微小差异之间进行区分的能力的度量。如果存在于生物样品中的细胞外游离DNA中的目标标记物低于检测分析的灵敏度水平，那么将无法使用常规方法来定量分析样品中每个目标标记物的甲基化水平。相反，本申请公开的方法在检测样品中极少量的目标标记物方面是实用并优越的。在一些实施方式中，细胞外游离DNA中的目标标记物以不超过0.08ng或不超过0.04ng的量存在于生物样品中。

在一些实施方式中，步骤(c)的所述至少一个预扩增产物在下一步骤(即步骤(d))之前用稀释剂稀释。在一些实施方式中，稀释剂选自下组：不含核酸酶的水、Tris-EDTA缓冲液和没有PCR抑制作用的任何其他缓冲液。在一些实施方式中，将步骤(c)的所述预扩增的DNA直接添加至下一步骤(即步骤(d))，而无需事先稀释。

用预扩增引物池预扩增经处理的DNA中的所述目标标记物。如本文所用，术语“引物”是指这样的单链寡核苷酸，其能够在合适的条件(例如缓冲液和温度)下，在四种不同的三磷酸核苷和用于聚合的试剂(例如DNA聚合酶)的存在下，作为模板指导的DNA合成的起始点。在任何给定的情况下，引物的长度取决于例如引物的预期用途，并且通常在15至30个核苷酸的范围内。短的引物分子通常需要较低的温度才能与模板形成足够稳定的杂交复合物。引物不必反映模板的确切序列，但必须足够互补以能与该模板杂交。引物位点是模板上与引物杂交的区域。引物对是一组引物，其包括与待扩增的序列的5’末端杂交的5’正向引物和与待扩增的序列的3’末端的互补链杂交的3’反向引物。本领域技术人员可以基于本领域的公知常识根据待扩增的标记物设计引物(参见，例如PCR Primer:A LaboratoryManual,Cold Spring Harbor Laboratories,NY,1995)。此外，一些用于设计在各种各样分析中使用的最佳探针和/或引物的软件包是公开的，例如可从美国马萨诸塞州剑桥市的基因组研究中心(the Center for Genome Research,Cambridge,Mass.,USA)获得的Primer3。显然，在设计探针或引物时其潜在用途也应考虑在内。例如，设计用于本发明目的的引物可以包括至少一个CpG位点，或者从该引物获得的扩增产物可以包括至少一个CpG位点。用于设计检测DNA甲基化状态的引物的工具也是本领域已知的，例如MethPrimer(Li LC andDahiya R.MethPrimer:designing primers for methylationPCRs.Bioinformatics.2002Nov；18(11):1427-31)。在本申请中，通过将预扩增引物作为引物池，经处理的DNA中的任何目标标记物(目标标记物的每至少一部分或目标标记物的一个亚区域)均可以被预扩增。

本文所用的术语“寡核苷酸”定义为包含两个或更多个核苷酸(例如，脱氧核糖核苷酸或核糖核苷酸)的分子，优选为至少5个核苷酸，更优选为至少约10-15个核苷酸，更优选为至少约15至30个核苷酸或更长(例如，寡核苷酸的长度通常少于200个残基(例如，在15至100个核苷酸之间)，但是，如本文所用，该术语也意在覆盖更长的多核苷酸链)。确切的大小将取决于许多因素，而这些因素又取决于寡核苷酸的最终功能或用途。寡核苷酸通常用其长度来指代。例如，具有24个残基的寡核苷酸被称为“24聚体”(24-mer)。寡核苷酸可通过自身杂交或与其他多核苷酸杂交形成二级和三级结构。这样的结构可以包括但不限于双链体、发夹、十字形、弯折和三链体。可以以任何方式产生寡核苷酸，包括化学合成、DNA复制、反转录、PCR或其任意组合。

如本文所用，术语“互补”是指核苷酸或核酸之间的杂交或碱基配对，例如，双链DNA分子的两条链之间，或待测序或扩增的单链核酸上的引物结合位点和寡核苷酸引物之间。互补核苷酸通常是A和T(或A和U)，或C和G。当一条链的核苷酸以最佳的方式对齐、并比较、并有适当的核苷酸插入或缺失后，与另一链的至少约80％(通常至少约90％至95％，更优选地为约98％至100％)的核苷酸配对，两条单链RNA或DNA分子就被称为是互补的。或者，当RNA链或DNA链在选择性杂交条件下与其互补序列杂交时，互补存在。通常，当在至少14至25个核苷酸的一段上具有至少约65％(优选至少约75％、更优选至少约90％)的互补性时，将发生选择性杂交。参见M.Kanehisa,Nucleic Acids Res.12:203(1984)，作为参考并入本文。

在一些实施方式中，预扩增引物池包含至少一个甲基化特异性引物对。在一些实施方式中，预扩增引物池包含多个甲基化特异性引物对。在一些实施方式中，预扩增步骤通过甲基化特异性PCR(“MSP”)进行，甲基化特异性PCR是使用甲基化特异性引物的PCR。Herman et al.,Methylation-specific PCR:a novelPCRassay for methylation statusofCpGislands.Proc Natl Acad Sci USA.1996September 3；93(18):9821-6和UnitedStates Patent No.6,265,171中已描述了该技术(即MSP)。

如本文所用，术语“甲基化特异性引物对”是指经特异性设计以识别CpG位点以利用甲基化的差异来扩增经处理的DNA中的特定目标标记物的引物对。引物仅作用于具有特定甲基化状态或没有特定甲基化状态的分子。例如，引物可以是寡核苷酸，在严紧条件、中等严紧条件或高度严紧条件下，其可以以甲基化特异性方式与具有甲基化的特定CpG位点特异性杂交，但不能与没有甲基化的特定CpG位点杂交。因此，引物将特异性扩增在特定CpG位点具有甲基化的目标标记物。又例如，引物可以是寡核苷酸，在严紧条件、中等严紧条件或高度严紧条件下，其可以以甲基化特异性的方式与未甲基化的特定的CpG位点特异性杂交，但是不能与甲基化的特定的CpG位点杂交。因此，引物将特异性扩增在特定CpG位点没有甲基化的目标标记物。因此，在本申请中，对在经处理的DNA内的至少一个目标标记物的预扩增中使用甲基化特异性引物，可以区分甲基化的和未甲基化的CpG位点。本申请的甲基化特异性引物对包含至少一个与亚硫酸氢盐处理的CpG二核苷酸杂交的引物。因此，所述特异性针对甲基化DNA的引物的序列包含至少一个CpG二核苷酸，并且所述特异性针对未甲基化DNA的引物的序列在CpG的C位置上包含“T”，和/或在CpG中G位置上包含“A”。

在一些实施方式中，所述至少一个甲基化特异性引物对包含一个正向引物和一个反向引物，所述引物均包含寡核苷酸序列，所述寡核苷酸序列与所述目标标记物之一(或目标标记物的亚区域)的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交，其中所述目标标记物之一(或目标标记物的亚区域)的至少9个连续核苷酸包含至少一个(例如1、2、3、4、5、6、7、8、9、10或更多个)CpG位点。

如本文所用，术语“杂交”可以指其中两条单链多核苷酸非共价形式结合以形成稳定的双链多核苷酸的过程。在一个方面，所得的双链多核苷酸可以是“杂交物”或“双链”。“杂交条件”中的盐浓度通常约小于1M，经常小于约500mM并且可以小于约200mM。“杂交缓冲液”包括缓冲盐溶液，例如5％SSPE，或本领域已知的其他此类缓冲液。杂交温度可以低至5℃，但是通常高于22℃，并且更为通常地高于约30℃，并且通常超过37℃。杂交通常在严紧条件下进行，即，在该条件下序列将与其目标序列杂交但不与其他非互补序列杂交。严紧条件是取决于序列的，并且在不同情况下有所不同。例如，更长的片段可能需要比短片段更高的杂交温度才能进行特异性杂交。由于其他因素可能会影响杂交的严紧性，包括碱基组成和互补链的长度，有机溶剂的存在以及碱基错配的程度，因此参数组合比单独使用任何一个参数的绝对测量更为重要。通常严紧条件被选定为比特定序列在特定的离子强度和pH下的解链温度(Tm)低约5℃。Tm可以是双链核酸分子群体中的一半被分离成单链的温度。用于计算核酸的Tm的几个方程式是本领域众所周知的。如标准参考文献所示，当核酸在1M NaCl水溶液中时，可以通过公式Tm＝81.5+0.41(％G+C)计算出简单估算的Tm值(参见例如Anderson and Young,Quantitative Filter Hybridization,in Nucleic AcidHybridization(1985))。其他参考文献(例如Allawi and SantaLucia,Jr.,Biochemistry,36:10581-94(1997))包括替代的计算方法，其计算Tm时将结构和环境以及序列特征等考虑在内。

通常，杂交物的稳定性是关于离子浓度和温度的函数。通常，杂交反应在较低严紧条件下进行，然后在具有不同但较高严紧性的洗涤液中洗涤。示例性的严紧条件包括pH约7.0至约8.3、温度至少25℃、钠离子(或其他盐)浓度为至少0.01M至不超过1M。例如，5xSSPE(750mM NaCl，50mM磷酸钠，5mM EDTA，pH 7.4)和约30℃的温度适合于等位基因特异性杂交，尽管合适的温度取决于杂交区域的长度和/或GC含量。在一个方面，确定错配百分比的“杂交严紧性”可以如下：1)高度严紧性：0.1x SSPE，0.1％SDS，65℃；2)中等严紧性(也称为中度严紧性)：0.2x SSPE，0.1％SDS，50℃；3)低严紧性：1.0x SSPE，0.1％SDS，50℃。应当理解，使用替代的缓冲剂、盐和温度可以达到相同的严紧性。例如，中等严紧杂交可以是指允许核酸分子(例如探针)结合互补核酸分子的条件。杂交的核酸分子通常具有至少60％的同一性，包括例如至少70％、75％、80％、85％、90％或95％的同一性。中等严紧条件可以是与下述条件达到同等效果的条件：42℃，50％甲酰胺，5x Denhardt溶液，5x SSPE，0.2％SDS杂交，然后用42℃，0.2x SSPE，0.2％SDS进行洗涤。高度严紧条件可以通过如下条件提供，例如，42℃，50％甲酰胺，5x Denhardt溶液，5x SSPE，0.2％SDS杂交，然后65℃，0.1x SSPE和0.1％SDS中洗涤。低严紧性杂交可以是与下述条件达到同等效果的条件：22℃，10％甲酰胺，5x Denhardt溶液，6x SSPE，0.2％SDS杂交，然后在1x SSPE，0.2％SDS中于37℃洗涤。Denhardt的溶液包含1％聚蔗糖，1％聚乙烯吡咯烷酮和1％牛血清白蛋白(BSA)。20x SSPE(氯化钠，磷酸钠，EDTA)包含3M氯化钠、0.2M磷酸钠和0.025M EDTA。其他合适的中等严紧性和高度严紧性杂交缓冲液和条件是本领域技术人员众所周知的，并且描述于例如Sambrooket al.,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring HarborPress,Plainview,N.Y.(1989)和Ausubel et al.,Short Protocols in MolecularBiology,4th ed.,John Wiley&Sons(1999)。

在一些实施方式中，预扩增引物池还包含用于扩增对照标记物的对照引物对。通常，对照标记物是具有已知特征(例如，序列已知，每个细胞的拷贝数已知)的核酸，用于与实验目标(例如，浓度未知的核酸)进行比较。对照可以是内源的，优选为不变的基因，可以将分析中的实验核酸或目标核酸相对其进行标准化。此类因为样品间差异而标准化的对照可能发生在例如样品处理，分析效率等，并且允许精确的样品间数据比较，定量分析扩增效率和偏差。

在一些实施方式中，所述对照标记物选自下组：ACTB、GAPDH、微管蛋白、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。在一些实施方式中，对照引物对的序列如下表2的SEQ ID NO：44和45所示。

在一些实施方式中，Septin9的甲基化特异性引物对为SEQ ID NO:22/23；BCAT1的甲基化特异性引物对为SEQ ID NO:24/25；IKZF1的甲基化特异性引物对为SEQ ID NO:26/27；PKNOX2的甲基化特异性引物对为SEQ ID NO:28/29；CRHBP的甲基化特异性引物对为SEQID NO:30/31；SOX1的甲基化特异性引物对为SEQ ID NO:32/33；基因间隔区A的甲基化特异性引物对为SEQ ID NO:34/35。在一些实施方案中，所述甲基化特异性引物对包含如下表2所示的选自下组的至少一对核苷酸序列：SEQ ID NO：22/23，24/25，26/27，28/29，30/31，32/33和34/35。优选地，所述甲基化特异性引物对包括SEQ ID NO：22/23，24/25和26/27中的至少一对引物对，以及SEQ ID NO：28/29，30/31，32/33和34/35中的至少一对引物对。优选地，所述甲基化特异性引物对包含：SEQ ID NO：22/23，24/25，26/27，28/29，30/31，32/33和34/35。本申请中使用的引物对的序列号以“SEQ ID NO：n/m”的形式表示。例如，SEQ IDNO：22/23是指分别具有如下表2所示的SEQ ID NO：22和SEQ ID NO：23所示的核酸序列的引物对。

表2

在一些实施方式中，在步骤(c)中，所述目标标记物在一个或多个封闭寡核苷酸的存在下被扩增。此类封闭寡核苷酸的用途已经被描述于Yu et al.,BioTechniques 23:714-720,1997。封闭序列与预扩增引物对同时与经处理的DNA杂交。目标标记物的预扩增终止于封闭序列的5’位置，使得目标标记物的预扩增在与封闭序列互补的序列存在的情况下被抑制。封闭序列可以被设计为以甲基化状态特异性方式与经处理的DNA杂交。例如，为了检测未甲基化核酸群体中的甲基化核酸，可以通过使用在相关位置包含“CpA”或“TpA”的封闭序列来抑制在所述位置未甲基化的核酸的扩增，与之对应，如果需要抑制甲基化核酸扩增，则使用“CpG”。

对于使用了封闭寡核苷酸的PCR方法，对聚合酶介导的扩增的有效干扰要求封闭寡核苷酸不能被聚合酶延长。优选地，这是通过使用封闭物来实现的，所述封闭物为3'-脱氧寡核苷酸或在3'位置衍生的具有“游离”羟基以外的寡核苷酸。例如，3'-O-乙酰基寡核苷酸是优选的封闭物分子类别的代表。

另外，聚合酶介导的封闭寡核苷酸的分解应当被阻止。优选地，此类阻止包括使用缺乏5'-3'核酸外切酶活性的聚合酶，或使用例如在其5'-末端具有硫醇盐桥的修饰的封闭寡核苷酸，使封闭物分子抗核酸酶。特定的应用可能不需要对封闭物进行5'修饰。例如，如果封闭物结合位点和引物结合位点重叠，因而阻止了引物的结合(例如使用过量的封闭物)，封闭寡核苷酸的降解将被基本上阻止。这是因为聚合酶不会将引物延伸至、并超过封闭物(沿5'-3'方向)，该过程通常会导致杂交的封闭寡核苷酸降解。

出于本申请的目的并且也如本文所实施，特别优选的封闭物/PCR实施方式包括使用肽核酸(PNA)寡聚物作为封闭寡核苷酸。此类PNA封闭低聚物是理想的，因为它们既不会被分解也不会被聚合酶延伸。

在一些实施方式中，所述至少一个目标标记物是用DNA聚合酶预扩增的。

如本文所用，术语“DNA聚合酶”是指催化三磷酸单脱氧核糖核苷酸(dNTP)合成多聚脱氧核糖核苷酸的酶，其完成在DNA复制、修复以及在某些情况下细胞分化中的最基本功能。

原核生物中的DNA聚合酶的实例包括DNA聚合酶I、DNA聚合酶II、DNA聚合酶III、DNA聚合酶IV和DNA聚合酶V。已知在大肠杆菌(E.coli)中有DNA聚合酶I、II和III。DNA聚合酶III在基因组复制中似乎是最重要的。DNA聚合酶I的重要性在于其可以在增长的链的末端删除掉未配对的碱基。逆转录病毒具有独特的DNA聚合酶，即，逆转录酶，它使用RNA模板合成DNA。对于真核生物，DNA聚合酶的实例是聚合酶α、β、λ、γ、σ、μ、δ、ε、η、ι、κ、ζ、θ和Rev1。动物细胞的DNA聚合酶负责DNA在细胞核和线粒体中的复制。

在预扩增步骤中使用的PCR试剂可以是任何可商购的PCR混合物(例如KAPA2GFast MultiplexPCRKit,

Universal Probe qPCR Master Mix,EpiTectMethyLightPCRKit等)，其用于扩增经处理的DNA。或者，本领域技术人员可以在实验室中制备包括Mg²⁺、dNTP、DNA聚合酶等的PCR试剂。本领域技术人员还可以根据实际需要选择合适的PCR反应体系和PCR反应条件。在一些实施方式中，步骤(c)的预扩增包括5至30个反应循环，其中每个循环包括在85～99℃下反应5秒到5分钟，然后在40～80℃下反应5秒到5分钟。在一些实施方式中，步骤(c)的预扩增包括10至20个反应循环，其中每个循环包括在90～99℃下反应15秒到2分钟，然后在45～60℃下反应30秒到3分钟。在一些实施方式中，步骤(c)的预扩增包括15个反应循环，其中每个循环包括在95℃下反应30秒，然后在56℃下反应60秒。

步骤(d)

在根据本申请的方法的步骤(d)中，每个目标标记物的甲基化水平分别基于其在步骤(c)中获得的各个预扩增产物而进行定量分析。在本申请中，步骤也可以被命名为定量分析步骤。

如本文所用，术语“甲基化状态”指的是DNA区域内的一个特定的核苷酸或多个核苷酸的甲基化的存在、不存在和/或甲基化的数量。特定DNA序列的甲基化状态(例如，本文所述的目标标记物)可以指示序列中每个碱基的甲基化状态，或者可以指示序列中的碱基对的子集的甲基化状态(例如，胞嘧啶残基的甲基化状态或一个或多个特定的限制酶识别序列的甲基化状态)，或者可以指示序列中区域甲基化密度的信息，虽然不能提供甲基化发生在序列中何处的精确信息。甲基化状态可以任选地由“甲基化水平”来表示或指示。甲基化水平可以通过例如定量分析在用甲基化敏感性限制性酶进行限制性消化后存在的完整DNA的量来确定。在该例中，如果使用定量PCR对DNA中的特定序列进行定量分析，模板DNA的量大约等于模拟处理的对照则表明该序列未高度甲基化，而模板量明显少于模拟处理的样品中的模板量则表明该序列中存在甲基化DNA。因此，如上述例子中的甲基化水平代表着甲基化状态，并且因此可以用作甲基化状态的定量指标。当需要将样品中序列的甲基化状态与阈值水平进行比较时，这尤其有用。

在DNA序列内一个或多个特定的CpG甲基化位点(每个具有两个CpG二核苷酸序列)的甲基化状态包括“未甲基化”、“完全甲基化”和“半甲基化”。术语“半甲基化”是指双链DNA其中仅其一条链被甲基化的甲基化状态。术语“超甲基化”是指，相对于正常对照DNA样品中的相应的CpG二核苷酸处5-甲基胞嘧啶的数量，在检测的DNA样品的DNA序列中一个或多个CpG二核苷酸处5-甲基胞嘧啶的数量增加所对应的平均甲基化状态。一个残基的甲基化状态可以是定性读数或定量读数，例如通过甲基化水平来表示的。在本申请中，术语“甲基化状态”和“甲基化水平”可以互换使用。根据本申请，可以同时确定一个以上的不同甲基化水平。

如本文所述，每个目标标记物的甲基化水平分别基于步骤(c)获得的其各自的预扩增产物而进行定量分析。DNA序列(例如目标标记物)内的一个或多个CpG二核苷酸序列的甲基化水平/状态可以通过本领域中已知的各种分析方法来确定。

在一些实施方式中，步骤(d)的所述定量分析是通过以下方式进行：聚合酶链式反应(例如实时聚合酶链式反应、数字聚合酶链式反应)、核酸测序、基于质量的分离(例如电泳法、质谱法)或靶标捕获(例如杂交、微阵列)。

在一些实施方式中，基于预扩增的DNA通过使用MSP(参见Herman，同上)分别定量分析每个目标标记物的甲基化水平。例如，通过使用在中等和/或高度严紧条件下与未转化序列特异性杂交的一种或多种引物，仅当模板在CpG位点包含甲基化胞嘧啶时才产生扩增产物。

在一些实施方式中，步骤(d)的定量分析通过实时PCR进行。实时PCR的非限制性实例包括Cottrell et al.,Nucl.Acids Res.32:e10,2003描述的HeavyMethyl^TMPCR；Eads etal.,Cancer Res.59:2302-2306,1999描述的MethyLight^TMPCR；Rand et al.,Nucl.AcidsRes.33:e 127,2005描述的Headloop PCR。

如本文所用，术语“HeavyMethyl^TM PCR”是指本领域公认的一种实时PCR技术，其中一个或多个不可延伸性核酸(例如，寡核苷酸)封闭物以甲基化特异性方式与亚硫酸氢盐处理的核酸结合(即，封闭物在中等至高等严紧条件下与未突变的DNA特异性结合)。使用一种或多种引物进行扩增反应，所述引物可以任选地是甲基化特异性的，但旁侧分布一个或多个封闭物。在未甲基化的核酸(即突变的DNA)存在的情况下，封闭物结合并且无PCR产物产生。使用基本上像例如Holland et al.,Proc.Natl.Acad.Sci.USA,88:7276-7280,1991所述的TaqMan^TM分析方法，样品中核酸的甲基化水平得以确定。

如本文所用，术语“MethyLight^TMPCR”是指基于本领域公认的一种基于荧光的实时PCR技术，其中采用了称为TaqMan^TM探针的双标记荧光寡核苷酸探针，并且被设计为可同位于正向和反向扩增引物之间的富含CpG的序列杂交。所述的TaqMan^TM探针包含一个荧光“报告因子部分”和“淬灭剂部分”共价结合到与TaqMan^TM寡核苷酸的核苷酸相连的接头部分(例如，亚磷酰胺)。在PCR扩增过程中，与富含CpG的序列杂交的TaqMan^TM探针被Taq聚合酶的5’核酸酶活性切割，从而在PCR反应过程中产生以实时方式检测的信号。在该方法中，可以将分子信标用作可检测的探针，并且该系统不依赖于所使用的DNA聚合酶的5’-3’核酸外切酶活性(参见Mhlanga and Malmberg,Methods 25:463-471,2001)。

如本文所用，术语“Headloop PCR”是指本领域公认的一种实时PCR，其选择性地扩增目标核酸，但是通过将3’茎环延伸形成不能进一步提供扩增模板的发卡结构来抑制非扩增目标变体的扩增。

在一些实施方式中，所述实时PCR是多重实时PCR。

如本文所用，术语“多重”可指，通过使用一个以上的标记物，每个标记物具有至少一个不同的检测特征，例如荧光特征(例如，激发波长、发射波长、发射强度、FWHM(半峰高处的全宽度)或荧光寿命)或独特的核酸或蛋白序列特征，可以同时对多个标记物(例如多个核酸序列)的存在和/或量进行测定的分析或其他分析方法。

在一些实施方式中，步骤(d)的定量分析通过核酸测序进行。核酸测序的示例性方法是本领域已知的，参见，例如Frommer et al.,Proc.Natl.Acad.Sci.USA 89:1827-1831,1992；Clark et al.,Nucl.Acids Res.22:2990-2997,1994。例如，通过将未使用亚硫酸氢盐处理的样品获得的序列或目标区域的已知核苷酸序列与使用亚硫酸氢盐处理的样品获得的序列进行比较，有助于鉴定DNA序列中甲基化胞嘧啶。与未处理的样品相比，在亚硫酸氢盐处理的样品中的任意胞嘧啶位点检测到的胸腺嘧啶残基都可以认为是由亚硫酸氢盐处理而引起的突变，即该位点存在甲基化的胞嘧啶。

用于测序DNA的方法是本领域已知的，并且包括例如双脱氧链终止法或Maxam-Gilbert法(参见Sambrook et al.,Molecular Cloning,A Laboratory Manual(2^nd Ed.,CSHP,New York 1989))、焦磷酸测序(参见Uhlmann et al.,Electrophoresis,23:4072-4079,2002)、固相焦磷酸测序(参见Landegren et al.,Genome Res.,8(8):769-776,1998)、固相微测序(参见例如，Southern et al.,Genomics,13:1008-1017,1992)、采用FRET的微测序(参见例如，Chen and Kwok,Nucleic Acids Res.25:347-353,1997)、连接法测序或超深度测序(参见Marguiles et al.,Nature 437(7057):376-80(2005))。

在一些实施方式中，步骤(d)的所述定量分析通过基于质量的分离(例如电泳、质谱法)进行。

例如，甲基化胞嘧啶残基的存在可以通过联合亚硫酸氢盐限制分析法(COBRA)进行检测，基本如Xiong and Laird,Nucl.Acids Res.,25:2532-2534,2001所述。这种方法利用了在使用可以选择性地突变未甲基化的胞嘧啶残基的化合物(例如，亚硫酸氢盐)处理之后，在甲基化和未甲基化的核酸之间的限制酶识别位点的差异。例如，限制性核酸内切酶Taq1切割序列TCGA，在对未甲基化核酸进行亚硫酸氢盐处理后该序列将是TTGA，因此将不被切割。然后使用本领域已知的检测手段例如电泳和/或质谱法，检测消化的和/或未消化的核酸。

又例如，在用选择性突变未甲基化胞嘧啶残基的化合物处理后，基于核苷酸序列和/或二级结构的差异，使用不同的技术来检测扩增产物中核酸差异，例如甲基化特异性单链构象分析(MS-SSCA)(Bianco et al.,Hum.Mutat.,14:289-293,1999)、甲基化特异性变性梯度凝胶电泳(MS-DGGE)(Abrams and Stanton,Methods Enzymol.,212:71-74,1992)和甲基化特异性变性高效液相色谱(MS-DHPLC)(Deng et al.,Chin.J.Cancer Res.,12:171-191,2000)。

在一些实施方式中，步骤(d)的定量分析是通过靶标捕获(例如杂交、微阵列)来进行的。

通过杂交的合适的检测方法是本领域已知的，例如Southern、斑点印迹、狭缝印迹或其他核酸杂交方式(Kawai et al.,Mol.Cell.Biol.14:7421-7427,1994；Gonzalgo etal.,Cancer Res.57:594-599,1997)。在一些实施方式中，用于杂交分析的探针被可检测地标记。在一些实施方式中，用于杂交分析的基于核酸的探针是未标记的。这种未标记的探针可以固定在固体载体如微阵列上，并且可以与被可检测地标记的目标核酸分子杂交。

微阵列的一个实例是甲基化特异性微阵列，其可用于区分具有转化的胞嘧啶残基的序列和具有未转化的胞嘧啶残基的序列(参见Adorjan et al.,Nucl.Acids Res.,30:e21,2002)。基于杂交的分析还可被用于用甲基化敏感的限制酶处理后的核酸。

又例如，可通过寡核苷酸探针确定DNA序列内CpG二核苷酸序列的甲基化状态，所述寡核苷酸探针与PCR扩增引物同时与亚硫酸氢盐处理的DNA杂交(其中所述引物可以是甲基化特异性引物或标准引物)。

在一些实施方式中，步骤(d)在检测试剂的存在下进行。如本文所用，术语“检测试剂”是在定量分析步骤中用于检测核酸的存在、不存在或量的试剂。

本领域已知的各种检测试剂在本申请中都可使用。在一些实施方式中，检测试剂选自下组：荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。

优选地，用于检测Septin9的探针为SEQ ID NO:36；检测BCAT1的探针为SEQ IDNO:37；用于检测IKZF1的探针为SEQ ID NO:38；用于检测PKNOX2的探针为SEQ ID NO:39和40；用于检测CRHBP的探针为SEQ ID NO:41；用于检测SOX1的探针为SEQ ID NO:42；用于检测基因间隔区A的探针为SEQ ID NO:43。

在一些实施方式中，所述探针至少包括选自下组的一条或多条核苷酸序列：SEQID NO:36-38、SEQ ID NO:41-43、以及SEQ ID NO:39和/或SEQ ID NO:40。优选地，所述探针包括SEQ ID NO:36-38中的至少一条、至少两条或全部三条核苷酸序列和SEQ ID NO:39和/或40以及SEQ ID NO:41-43中的至少一条、至少两条或至少三条核苷酸序列。在一些实施方式中，所述探针包括SEQ ID NO:36-38和41-43所示的核苷酸序列，以及SEQ ID NO:39和/或40所示的核苷酸序列。

在一些实施方式中，对照标记物为ACTB，其示例性的探针的核苷酸序列如SEQ IDNO:58所述。

在一些实施方式中，荧光探针的5’端标记有荧光染料(例如FAM、HEX/VIC、TAMRA、Texas Red或Cy5)，3’端标记有猝灭剂(例如BHQ1、BHQ2、BHQ3、DABCYL或TAMRA)。

标记可以通过直接或间接方法来完成。直接标记涉及将标记直接(共价或非共价)偶联至试剂上。间接标记涉及第二试剂与第一试剂的结合(共价或非共价)。第二试剂应与第一试剂特异性结合。所述第二试剂可以与合适的标记偶联和/或第二试剂是可与第二试剂结合的第三试剂的目标(受体)。使用二级、三级甚至更高阶的试剂通常会增加信号强度。合适的二级和高级试剂可以包括抗体、二级抗体和众所周知的链霉亲和素-生物素系统(Vector Laboratories，Inc.)。试剂或底物也可以被本领域中已知的一个或多个标签“标记”。

如本文所用，术语“定量引物对”是指在定量分析步骤中使用的一个或多个引物对。

在一些实施方式中，步骤(d)使用的所述定量引物对能够与步骤(c)的所述预扩增产物的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。在一些实施方式中，步骤(d)中所使用的定量引物对与在步骤(c)的预扩增引物池中的甲基化特异性引物对相同。

在一些实施方式中，步骤(d)中使用的定量引物对被设计为扩增步骤(c)的所述预扩增产物内的至少一部分，即步骤(c)和步骤(d)被设计为巢式PCR。

巢式PCR是PCR的一种改进，旨在提高灵敏度和特异性。巢式PCR涉及使用两个引物组和两个连续的PCR反应。进行第一轮扩增以产生第一扩增子，并使用一个引物对进行第二轮扩增，其中一个或两个引物与由初始引物对界定的区域内的位点退火，即第二个引物对被认为是“嵌套”在第一对引物中。以这种方式，不包含正确内部序列的来自第一次PCR反应的背景扩增产物在第二次PCR反应中不再被进一步扩增。

在一些实施方式中，步骤(d)的定量分析包括基于所述预扩增产物中的多个CpG二核苷酸、TpG二核苷酸或CpA二核苷酸的存在或水平，确定每个目标标记物的甲基化水平。在一些实施方式中，步骤(d)的所述定量分析包括基于所述预扩增产物中一个或多个CpG二核苷酸的存在或水平来确定胞嘧啶残基的甲基化水平。在一些实施方式中，步骤(d)的所述定量分析包括基于所述预扩增产物中一个或多个TpG二核苷酸的存在或水平来确定胞嘧啶残基的甲基化水平。在一些实施方式中，步骤(d)的所述定量分析包括基于所述预扩增产物中CpA二核苷酸的存在来确定胞嘧啶残基的甲基化水平。

在一些实施方式中，定量分析步骤是通过将步骤(c)的所述预扩增产物分为多个组分来进行的。在一些实施方式中，对多个组分进行多个不同的定量分析实验，其中在多个组分之一中定量分析所述预扩增产物(如果存在于所述组分中的话)的不同组合。在一些实施方式中，定量分析每个组分中的对照标记物。

步骤(e)

在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法的步骤(e)中，由步骤(d)的获得的目标标记物的甲基化水平分别与相应的参考水平进行比较，其中，组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平、且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤，或者所述个体有结直肠进展期腺瘤形成或形成的风险，或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加，或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。

根据本申请的方法的步骤(e)也可以被称为比较步骤。

本文所用的术语“比较”是指分别对检测的生物样本所含有的通过定量分析步骤获取的目标标记物的甲基化水平与其相应的参考水平进行对比。应当理解，本文所用的术语是指相应参数或值的比较，例如，将绝对量与绝对参考量进行比较，将浓度与参考浓度进行比较，或从检测的样本中获得的强度信号同参考样本的同类型的强度信号进行比较。可以通过手动或计算机辅助进行比较。对于计算机辅助进行的比较，可以将所确定的量的值与通过计算机程序存储在数据库中的合适参考的值进行比较。该计算机程序可以进一步评估比较的结果，并以合适的输出格式自动提供期望的评估。基于定量分析步骤中每个目标标记物的甲基化水平与相应参考水平的比较，可以识别出患有结直肠进展期腺瘤、或者有结直肠进展期腺瘤形成或形成的风险、或者有结直肠进展期腺瘤发展或发展的可能性增加、或者有结直肠进展期腺瘤预后不良或预后不良的风险的个体。

如本文所用，术语“参考水平”是指将个体纳入或排除结肠直肠进展期腺瘤或结肠直肠进展期腺瘤的形成或形成的风险的阈值水平。

本文所述的“相对于其相应的参考水平具有更高的甲基化水平”指组(I)中所检测的目标标记物的甲基化水平至少是其相应参考水平的1.1、1.2、1.3、1.4、1.5、2、3、4、5、6、7、8、9、10倍或更多倍。本文所述的“相对于其相应的参考水平具有较低的甲基化水平”指组(II)所检测的目标标记物的甲基化水平是其相应参考水平的98％、95％、93％、90％、85％、80％、75％、70％、65％、60％、55％、50％、45％、40％、35％、30％、25％、20％、15％、10％甚至更低。在本申请中，为了在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后，不需要组(I)的每个目标标记物的甲基化水平均高于其相应的参考水平以及组(II)的每个目标标记物的甲基化水平均低于其相应的参考水平。准确的说，如果在定量分析步骤中进行定量分析的每一组中至少有一种目标标记物的甲基化水平等于或高于其相应的参考水平就足够了。

目标标记物的甲基化的参考水平可以源自一个或多个参考样品，其中参考水平获自与检测目的样品的实验平行进行的实验。或者，可以在数据库中获得参考水平，该数据库包括来自一个或多个参考样品或疾病参考样品的数据、标准或水平的集合。在一些实施方式中，此类数据、标准或水平的集合被标准化，以便可用于与来自一个或多个样品的数据进行比较的目的。“标准化”是将测量原始数据转换为可以直接与其他标准化数据进行比较的数据的过程。标准化被用于克服因不同的分析方法里因素不同而导致的、分析方法特异性的误差，例如上样量的不同、结合效率的不同、检测灵敏度的不同和其他各类的误差。

在一些实施方式中，参考数据库包括来自一个或多个参考样品的目标标记物和/或其他实验室和临床数据的甲基化水平。在一些实施方式中，参考数据库包括目标标记物的甲基化水平，其各自被标准化为在与参考样品相同的条件下检测的对照标志物的甲基化水平的百分比。为了与目标标记物的如此标准化甲基化水平进行比较，测试样品的目标标记物的甲基化水平也被测量并计算为在与测试样品相同的条件下检测的对照标记物的甲基化水平的百分比。

在一些实施方式中，通过汇总获自健康个体和/或非肿瘤个体(即已知没有肿瘤的个体)的参考样品的参考水平数据来建立参考数据库。在一些实施方式中，通过汇总获自正在接受结直肠瘤治疗的个体的参考样品的参考水平数据来建立参考数据库。在一些实施方式中，通过汇总获自结直肠瘤不同阶段的个体的参考样品的数据来建立参考数据库，所述结直肠瘤不同阶段是通过例如目标标记物的不同的甲基化水平来证明的。

本领域技术人员可以根据期望的灵敏度和特异性来选择参考水平。确定合适的参考水平的手段是本领域技术人员已知的，例如参考水平可以从临床研究中收集的数据来确定。

在一些实施方式中，步骤(e)的参考水平是基于从患有结直肠进展期腺瘤或具有患结直肠进展期腺瘤风险的一组个体中获取的临床样本和从未患结直肠进展期腺瘤或不具有患结直肠进展期腺瘤风险的一组个体中获取的临床样本来确定的。

本领域技术人员可以基于各种因素，例如年龄、性别、病史、家族史、症状等，来确定个体是否患结直肠进展期腺瘤或具有患结直肠进展期腺瘤的风险。

在一些实施方式中，用循环阈值(即Ct值)来表示目标标记物的甲基化水平和参考水平。如本文所用，术语“Ct值”是指在背景信号以上可以检测到PCR产物的荧光的循环数。Ct值与样品中目标标记物的数量成反比，即Ct值越低，样品中目标标记物的数量就越大。

例如，在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法的步骤(e)中，组(I)所述目标标记物中至少一个目标标记物的Ct值相对于其相应的参考Ct值低，且组(II)所述目标标记物中至少一个目标标记物的Ct值相对于其相应的参考Ct值高，表明所述个体患有结直肠进展期腺瘤，或者所述个体有结直肠进展期腺瘤形成或形成的风险，或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加，或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。在一些实施方式中，如果组(I)所述目标标记物中至少一个目标标记物Ct值比其对应的参考Ct值低2-10个循环(例如2、3、4、5、6、7、8、9、10个循环)且组(II)所述目标标记物中至少一个目标标记物的Ct值相对于其相应的参考Ct值高2-10个循环(例如2、3、4、5、6、7、8、9、10个循环)，则确定所述个体患有结直肠进展期腺瘤，或者所述个体有结直肠进展期腺瘤形成或形成的风险，或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加，或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。

如本文所用，术语“可能性增加”，是指与从中获得参考样品的个体相比，在个体发展结直肠进展期腺瘤或有结直肠进展期腺瘤预后不良的可能性水平方面总体增加5％、10％、15％、20％、25％、30％、40％、50％、60％、70％、80％、85％、90％、95％、96％、97％、98％、99％或更高。

2.试剂盒

在另一方面，本申请还提供了一种用于诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的试剂盒，其包含：

(b)第二试剂，所述第二试剂用于定量分析目标标记物中每个目标标记物的甲基化水平；其中，所述目标标记物包括以下两组目标标记物中每一组目标标记物中的至少一种：(I)Septin9、BCAT1和IKZF1，(II)PKNOX2、CRHBP、SOX1和基因间隔区A；和任选的

(c)第一引物池，所述第一引物池包含用于预扩增以下两组目标标记物中每一组目标标记物中的至少一种目标标记物的引物对：(I)Septin9、BCAT1和IKZF1，(II)PKNOX2、CRHBP、SOX1和基因间隔区A，其中所述引物对可与被所述第一试剂处理后的所述目标标记物的目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交，其中所述目标序列包含至少一个CpG位点。

优选地，所述试剂盒包含：

(b)第一引物池，所述第一引物池包含用于预扩增以下两组目标标记物中每一组目标标记物中的至少一种目标标记物的引物对：(I)Septin9、BCAT1和IKZF1，(II)PKNOX2、CRHBP、SOX1和基因间隔区A，其中所述引物对可与被所述第一试剂处理后的所述目标标记物的目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交，其中所述目标序列包含至少一个CpG位点；

在一些实施方式中，所述第二引物池中的至少一个定量引物对和所述第一引物池中的至少一个引物对相同。在一些实施方式中，所述第二引物池中的定量引物对被设计为用于扩增被所述第一引物池预扩增的所述目标序列内的至少一部分。在一些实施方式中，所述第一引物池包含至少一个甲基化特异性引物对。

在一些实施方式中，所述第一引物池和所述第二引物池被包装在单一容器内或被包装在独立容器内。在一些实施方式中，所述试剂盒进一步包含一个或多个封闭寡核苷酸。

在一些实施方式中，所述试剂盒进一步包含检测试剂。在一些实施方式中，所述检测试剂选自下组：荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。在一些实施方式中，所述探针至少包括选自下组的一条或多条核苷酸序列：SEQ ID NO:36-38、SEQ ID NO:41-43、以及SEQ ID NO:39和/或SEQ ID NO:40。优选地，所述探针包括SEQ ID NO:36-38中的至少一条、至少两条或全部三条核苷酸序列和SEQ IDNO:39和/或40以及SEQ ID NO:41-43中的至少一条、至少两条或至少三条核苷酸序列。在一些实施方式中，所述探针包括SEQ ID NO:36-38和41-43所示的核苷酸序列，以及SEQ IDNO:39和/或40所示的核苷酸序列。在一些实施方式中，所述荧光探针的5’端标记有荧光染料(例如FAM、HEX/VIC、TAMRA、Texas Red或Cy5)，3’端标记有猝灭剂(例如BHQ1、BHQ2、BHQ3、DABCYL、TAMRA或lowa Black Dark Quenchers)。

在一些实施方式中，所述试剂盒进一步包含DNA聚合酶和/或适合存放从所述个体中获取的所述生物样品的容器。在一些实施方式中，所述试剂盒进一步含使用说明书和/或对试剂盒检测结果的解释。

在一些实施方式中，所述试剂盒可包含包装在独立的容器中的反应缓冲液，该反应缓冲液针对由聚合酶介导的引物延伸(例如PCR)进行了优化。优选的是这样的试剂盒：其进一步包括容器，所述容器适合容纳用于在个体的生物样品中确定下组(I)中的至少一个(例如2、3、4或5个)目标标记物以及下组(II)中的至少一个(例如2、3或4个)目标标记物的甲基化的装置：(I)Septin9、BCAT1和IKZF1，(II)PKNOX2、CRHBP、SOX1和基因间隔区A。

在一些实施方式中，所述第一试剂包括亚硫酸氢盐试剂或甲基化敏感限制酶(MSRE)。在一些实施方式中，所述亚硫酸氢盐试剂选自下组：亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子，及其任意组合。在一些实施方式中，亚硫酸氢盐试剂是亚硫酸氢钠。在一些实施方式中，所述MSRE选自下组：HpaII酶、SalI酶、

在一些实施方式中，所述第一引物池包含至少一个甲基化特异性引物对，用于预扩增选自下组(I)的至少一个目标标记物中的至少一个目标序列：(I)Septin9、BCAT1和IKZF1。在一些实施方式中，所述第一引物池包含至少一个甲基化特异性引物对，用于预扩增选自下组(II)的至少一个目标标记物中的至少一个目标序列：PKNOX2、SOX1、CRHBP和基因间隔区A。在一些实施方式中，所述第一引物池包含至少两个甲基化特异性引物对，其中一个用于预扩增选自下组(I)的至少一个目标标记物中的至少一个目标序列：(I)Septin9、BCAT1和IKZF1，另一个用于预扩增选自下组(II)的至少一个目标标记物中的至少一个目标序列：PKNOX2、SOX1、CRHBP和基因间隔区A。

在一些实施方式中，所述第一引物池包含用于预扩增以下两组目标标记物的引物对：所述组(I)中的至少2个或全部3个目标标记物，以及所述组(II)中的至少2个、至少3个或全部4个目标标记物。

在一些实施方式中，所述第一引物池包含用于预扩增组(I)的下述目标标记物的引物对：Septin9与BCAT1，BCAT1与IKZF1，或Septin9与IKZF1被扩增。

在一些实施方案中，所述第一引物池包含用于预扩增组(II)的下述目标标记物的引物对：PKNOX2与CRHBP，PKNOX2与SOX1，PKNOX2与基因间隔区A，CRHBP与基因间隔区A，或SOX1与基因间隔区A。在一些实施方案中，所述第一引物池包含用于预扩增组(II)的下述目标标记物的引物对：PKNOX2、CRHBP和SOX1，PKNOX2、CRHBP和基因间隔区A，PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A。

在一些实施方中，所述第一引物池包含用于预扩增下述目标标记物的引物对：Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A；其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。

在一些实施方式中，所述的各个目标标记物包括或是：

b)亚硫酸氢盐转化后的a)的对应区域；或

c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。

在一些实施方式中，所述第一引物池至少包含选自以下的引物对中的一对或多对：SEQ ID NO：22/23、24/25、26/27、28/29、30/31、32/33和34/35。优选地，所述第一引物池包含选自下组(I)的至少一对、至少两对或全部三对引物对和下组(II)的至少一对、至少两对、至少三对引物对：(I)SEQ ID NO：22/23、24/25、26/27；(II)SEQ ID NO：28/29、30/31、32/33和34/35。在一些实施方式中，所述第一引物池包含以下引物对：SEQ ID NO：22/23、24/25、26/27、28/29、30/31、32/33和34/35，任选地其中所述第二引物池包含至少一个与所述第一引物池中的至少一个引物对相同的引物对。在一些实施方式中，第二引物池中的引物对与第一引物池中的引物对完全相同。

在一些实施方式中，所述试剂盒还包含可用于进行CpG位置特异性甲基化分析的标准试剂，其中所述分析包括以下一种或多种技术：MS-SNuPE、MSP、MethyLight^TM、HeavyMethyl^TM、COBRA和核酸测序。

在一些实施方式中，所述试剂盒可包含选自下组的额外的试剂：缓冲液(例如限制酶、PCR、保存或洗涤缓冲液)、DNA回收试剂或试剂盒(例如沉淀、超滤、亲和柱)和DNA回收组件。

在一些实施方式中，本申请的试剂盒可包含：

a)亚硫酸氢盐试剂；

b)第一引物池，所述引物池包含多个甲基化特异性引物对，用于预扩增下组(I)中的至少一个目标标记物和下组(II)中的至少一个目标标记物：(I)Septin9、BCAT1和IKZF1，(II)PKNOX2、CRHBP、SOX1和基因间隔区A，其中所述甲基化特异性引物对包含以下引物对，或由以下引物对组成：SEQ ID NO:22/23、24/25、26/27、28/29、30/31、32/33和34/35；

c)第二试剂，所述第二试剂用于定量分析被所述第一引物池预扩增的目标标记物的每一个的甲基化水平，其中所述第二试剂包含第二引物池，所述第二引物池包含多个定量引物对，所述定量引物对能够与被所述第一引物池预扩增的所述目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。

本申请的试剂盒还可包含包装在独立容器中的其他组分，例如适用于封闭、洗涤或包被的缓冲液或溶液。

本申请的试剂盒可进一步包含在DNA富集领域中已知的以下组分的一种或几种：蛋白组分，所述蛋白选择性地结合甲基化的DNA；三链形成核酸组分，一个或多个接头，任选地在合适的溶液中；用于进行连接的物质或溶液，例如连接酶、缓冲液；用于进行柱层析的物质或溶液；用于进行免疫学为基础的富集(例如免疫沉淀)的物质或溶液；用于进行核酸扩增的物质或溶液，例如PCR；一种染料或几种染料，若适用于偶联剂，若适用于溶液中；用于进行杂交的物质或溶液；和/或用于进行洗涤步骤的物质或溶液。

3.用途

在另一方面，本申请提供了本申请的试剂盒在制造用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后或监测接受结直肠瘤治疗的个体对治疗的应答的诊断试剂盒中的用途。

在另一方面，本申请提供用于定量分析目标标记物的甲基化水平的试剂在制造试剂盒中的用途，所述试剂盒被用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法中。

优选地，所述方法中的各个步骤以及各步骤所用的各试剂如本文“1.方法”部分所述，因此，本发明的试剂盒可根据该方法而包括用于该方法各步骤所需的各试剂。

优选地，所述试剂盒为本文“2.试剂盒”部分所述。

优选地，所述目标标记物包括：所述组(I)中的至少2个或全部3个目标标记物，和所述组(II)中的至少2个、至少3个或全部4个目标标记物。

优选地，所述目标标记物包括Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A。

优选地，所述试剂包括扩增引物，用于扩增所述目标标记物的引物对。

优选地，所述试剂包括用于扩增：所述组(I)中的Septin9与BCAT1，BCAT1与IKZF1，或Septin9与IKZF1的引物对；或所述组(I)的Septin9、BCAT1和IKZF1的引物对。

优选地，所述试剂包括用于扩增：所述组(II)中的PKNOX2与CRHBP，PKNOX2与SOX1，PKNOX2与基因间隔区A，CRHBP与基因间隔区A，或SOX1与基因间隔区A的引物对；所述组(II)中的PKNOX2、CRHBP和SOX1，PKNOX2、CRHBP和基因间隔区A，PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A的引物对；或所述组(II)中的PKNOX2、CRHBP、SOX1和基因间隔区A的引物对。

优选地，用于扩增Septin9的引物对为SEQ ID NO:22/23；用于扩增BCAT1的引物对为SEQ ID NO:24/25；用于扩增IKZF1的引物对为SEQ ID NO:26/27；用于扩增PKNOX2的引物对为SEQ ID NO:28/29；用于扩增CRHBP的引物对为SEQ ID NO:30/31；用于扩增SOX1的引物对为SEQ ID NO:32/33；用于扩增基因间隔区A的引物对为SEQ ID NO:34/35。

优选地，所述试剂还包括定量引物对，所述定量引物对被设计为用于扩增已用所述扩增引物预扩增的所述目标序列内的至少一部分，能够与被所述第一引物池预扩增的所述目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。

优选地，所述定量引物对与所述扩增引物对相同。

优选地，所述试剂进一步包含一个或多个封闭寡核苷酸。

优选地，所述试剂进一步包含检测试剂。

优选地，所述检测试剂选自下组：荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。

优选地，所述探针至少包括选自下组的一条或多条核苷酸序列：SEQ ID NO:36-43。

优选地，所述探针包括SEQ ID NO:36-38中所示的至少一条、至少两条或全部三条核苷酸序列，和SEQ ID NO:39或40以及41-43中所示的至少一条、至少两条或至少三条核苷酸序列。

优选地，所述探针包括：SEQ ID NO:36-38和41-43所示的核苷酸序列，以及SEQ IDNO:39和/或40所示的核苷酸序列。

优选地，所述荧光探针的5’端标记有荧光染料，3’端标记有猝灭剂；优选地，所述荧光染料选自FAM、HEX/VIC、TAMRA、Texas Red或Cy5，所述淬灭剂选自BHQ1、BHQ2、BHQ3、DABCYL、TAMRA或lowa Black Dark Quenchers。

优选地，所述试剂还包括亚硫酸氢盐试剂或甲基化敏感限制酶。

优选地，所述亚硫酸氢盐试剂选自下组：亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子，及其任意组合。

优选地，所述MSRE选自下组：HpaII酶、SalI酶、

优选地，所述试剂包含用于扩增对照标记物的引物对。

优选地，所述对照标记物选自下组：ACTB、GAPDH、微管蛋白、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。

优选地，所述目标标记物包含或是：

b)亚硫酸氢盐转化后的a)的对应区域；或

c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。

优选地，所述方法包括如下步骤：

(a)从所述个体获取含有DNA的生物样品；

在一些实施方式中，所述各个目标标记物包含或是：

b)亚硫酸氢盐转化后的a)的对应区域；或

c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。

具体实施方式

所有实施例中使用的生物材料，包括各种克隆和表达质粒、培养基、酶、缓冲液、各种培养方法、蛋白质提取和纯化方法以及其他分子生物学操作方法，都是本领域技术人员所熟知的。更多细节请参照Sambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,N.Y.和Frederick M.Ausubel等人编写的“Short Protocolsin Molecular Biology”(Yan Ziying等译，科学出版社(北京)，1998)。

实施例

本实施例通过检测Septin9、BCAT1、IKZF1高甲基化及PKNOX2、CRHBP、SOX1、基因间隔区(hg19，chr10:130085033-130085148)低甲基化来筛查结直肠进展期腺瘤。

为评估甲基化标志物在结直肠进展期腺瘤检测中的临床性能，我们使用预扩增检测法，检测了117份经临床诊断为结直肠进展期腺瘤的血浆样品和100份结肠镜检查为阴性的血浆对照样品。检测位点为Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)。

预扩增方法

预扩增方法包括以下步骤：

1、使用QIAamp Circulating Nucleic Acid Kit(Qiagen)从1-4ml血浆样品中获得细胞外游离DNA(cfDNA)样品。

2、使用亚硫酸氢盐试剂(MethylCodeTM Bisulfite Conversion Kit)对20ngcfDNA进行亚硫酸氢盐转化以获得转化的cfDNA。

3、将转化的cfDNA样品进行预扩增。简而言之，在甲基化特异性引物对的存在下，通过PCR反应对从上述步骤2获得的转化的cfDNA进行预扩增，所述甲基化特异性引物对专门针对Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)而设计。在PCR反应体系中，每个引物的终浓度均为200nM。25μL PCR混合物由10μL转化的cfDNA、2.5μL含有上述引物的预混液和12.5μL PCR试剂(

UniversalProbe qPCR Master Mix(NEB))组成。

PCR反应条件如下：95℃3分钟；95℃30秒，56℃60秒，10个循环。ProFlex TM PCR系统(Thermo Fisher)。

4、将从上述步骤3获得的预扩增产物稀释10倍，然后用于多重荧光PCR检测，专门针对Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)。qPCR混合物由10μL稀释的预扩增产物、2.5μL引物/探针池、12.5μL PCR试剂(

Universal Probe qPCR Master Mix(NEB))组成。非CpG的ACTB区域用作每个反应孔的内参。不同标记物的检测探针用不同的荧光进行标记。在PCR反应体系中，每个引物的终浓度为500nM，每个检测探针的终浓度为200nM。PCR反应条件如下：95℃5分钟；95℃15秒，56℃40秒(采集荧光)，50个循环。使用ABI 7500Real-Time PCR System在相应的荧光通道检测不同的荧光。

结果

将没有扩增信号样品的Ct值设置为50。分别统计Septin9、BCAT1、IKZF1的Ct平均值及PKNOX2、CRHBP、SOX1、基因间隔区A(hg19，chr10:130085033-130085148)的Ct平均值。图1显示患有进展期腺瘤的群体和结肠镜检查为阴性的群体中目标标志物Septin9、BCAT1、IKZF1 Ct值分布，患有进展期腺瘤的群体整体Ct值比阴性群体要小，提示甲基化水平更高。如图2所示，患有进展期腺瘤的群体中目标标志物PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)的检测Ct较阴性对照要大，提示更低的甲基化水平。

表3显示了在预扩增方法中检测Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)目标标记物对进展期腺瘤的检测结果。根据Septin9、BCAT1、IKZF1的平均Ct值ROC曲线，确定平均Ct小于44为检测阳性；根据PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)的平均Ct值ROC曲线，划定平均Ct大于38为检测阳性。样本最终结果Septin9、BCAT1、IKZF1的高甲基化或PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区A(hg19)的低甲基化任一为阳性即为检测阳性。如表3所示，预扩增方法显示出对进展期腺瘤具有超高灵敏度(54.7％)和对结肠镜检查为阴性的群体的高特异性(82.7％)。对进展期腺瘤的检出率远高于目前已有的血液检测方法。

表3：预扩增方法结果和结肠镜检查结果的对比

序列表

<110> 复旦大学附属中山医院

上海鹍远生物技术有限公司

<120> 结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒

<130> 20A341

<160> 46

<170> SIPOSequenceListing 1.0

<210> 1

<211> 7398

<212> DNA

<213> Homo sapiens

<400> 1

ctggagccgg tgggctctga gcacagtcac gaaggcatgc gcactttctg gctgctctcc 60

tgccattgtc ccttgggttc ccattttggt gaggcgtgca ccctggcggc gctccccagg 120

gaactaaata tgtttgctgc actgtgcgtg gagatggaga atgtacaatt ggctgaccct 180

gtgctaatct ggtggaactc catgccagcc ctgggaaaga acaattgcat gggtgtgtcc 240

acactcacca ggtgcttttt agaaaaacac tcgagaataa tgctgtggct taggatggct 300

gttgtgccgg acccggcatc ttcccagggg ggctgtgttg ttgggctgag tttcttaggt 360

actggacccc caaatcccca aatacggcgt ggacaggtgg cccagtaggg gctggactat 420

ccgataggcc caggtgctgg agttcagaca agacataccc tggcctggcg tggaagatac 480

ggggtgctat taatggcagc aatggctgca tttctgaaac ccgggctccc aggccgacga 540

gggtgtgcac gcatctgaaa tgtctgtggt tttgcagttc ccatgtccac aaactcactt 600

ggttgaaaat agttcaaaat atccaaagca tgagggaggg agtgcctgct tttcttaaaa 660

aggaaggact tgatttcatc tacttaaaaa gccacccaaa cctagaacat tttccgcaag 720

agaccccctg ccccccgcct ctccagaatg gctggagagt ctcagcactc ctgcacattt 780

gggatatttc agagggggtg gggaggggca agtgggcagc gagcgacctc agacccagga 840

tgagctgtca ggcgctcccc ggccacacat tcaagggacc ggagtgcagt tgtagcgttg 900

cggcctgctg cttcgggggt gggggtgttg ttccatgctg tgaattctca catggcccct 960

gactctgggc agaggccgag ggtctaaggg acggggtgac agggagagca tgcaggagtg 1020

ggtttctggc tttccagggc gagtggaaga agcgcctctc tctcttgtag gtgacagacc 1080

tggggggccc ttcttgagga tgagagcctg ttgcttctca agttctgtgt ctaacccagg 1140

tccccaggtc taccccagcc cctcggccct gcctgccttg tggatgatat agtttaaggg 1200

tagagaccgc tggcctggag ggaaggctag gcctcaggtt agggcccaga agggagggag 1260

aagcccttgg ggcagctccc tttctgctca ctcactgcct agctccttcc ttcacacctt 1320

ccttcggaaa cgtctgctcc tgacaaggtc tacttcctgc tctcaggagg cccttattgt 1380

ggaggaaggg aggcgtcgcc cgtccctggc ttctctgaca gccgtgttcc atccccgccc 1440

tgtgcccctt ctcccggaca gtgccttctc cagggctcac ccaggagggt gcagcggtgg 1500

cccccggggc ggtggtcgtg gtgggggtgt tagctgcagg ggtgccctcg gtgggtggga 1560

gttggtggcc tctcgctggt gccatgggac tcgcatgttc gccctgcgcc cctcggctct 1620

tgagcccaca ggccgggatc ctgcctgcca gccgcgtgcg ctgccgttta acccttgcag 1680

gcgcagagcg cgcggcggcg gtgacagaga actttgtttg gctgcccaaa tacagcctcc 1740

tgcagaagga ccctgcgccc ggggaagggg aggaatctct tcccctctgg gcgcccgccc 1800

tcctcgccat ggcccggcct ccacatccgc ccacatctgg ccgcagcggg gcgcccgggg 1860

ggaggggctg aggccgcgtc tctcgccgtc ccctgggcgc gggccaggcg gggaggaggg 1920

gggcgctccg gtcgtgtgcc caggactgtc ccccagcggc cactcgggcc ccagcccccc 1980

aggcctggcc ttgacaggcg ggcggagcag ccagtgcgag acagggaggc cggtgcgggt 2040

gcgggaacct gatccgcccg ggaggcgggg gcggggcggg ggcgcagcgc gcggggaggg 2100

gccggcgccc gccttcctcc cccattcatt cagctgagcc agggggccta ggggctcctc 2160

cggcggctag ctctgcactg caggagcgcg ggcgcggcgc cccagccagc gcgcagggcc 2220

cgggccccgc cgggggcgct tcctcgccgc tgccctccgc gcgacccgct gcccaccagc 2280

catcatgtcg gaccccgcgg tcaacgcgca gctggatggg atcatttcgg acttcgaagg 2340

tgggtgctgg gctggctgct gcggccgcgg acgtgctgga gaggaccctg cgggtgggcc 2400

tggcgcggga cgggggtgcg ctgaggggag acgggagtgc gctgagggga gacgggaccc 2460

ctaatccagg cgccctcccg ctgagagcgc cgcgcgcccc cggccccgtg cccgcgccgc 2520

ctacgtgggg gaccctgtta ggggcacccg cgtagaccct gcgcgccctc acaggaccct 2580

gtgctcgttc tgcgcactgc cgcctgggtt tccttccttt tattgttgtt tgtgtttgcc 2640

aagcgacagc gacctcctcg agggctcgcg aggctgcctc ggaactctcc aggacgcaca 2700

gtttcactct gggaaatcca tcggtcccct ccctttggct ctccccggcg gctctcgggc 2760

cccgcttgga cccggcaacg ggatagggag gtcgttcctc acctccgact gagtggacag 2820

ccgcgtcctg ctcgggtgga cagccctccc ctcccccacg ccagtttcgg ggccgccaag 2880

ttgtgcagcc cgtgggccgg gagcaccgaa cggacacagc ccaggtcgtg gcagggtcta 2940

gagtgggatg tcccatggcc cccatccagg cctggggata tcctcatccg cctcccagaa 3000

tcgggccgtg ggggacagaa ggggcctgcg tgcgggcagg gagagtattt tggctctctc 3060

ctgtcttcgg ggtttacaaa gtgtgttggg acttgcgggg ctgctctgtc caagcctggg 3120

tctggcgtcc gcgtctctga gcctgtgagt gcgtgcgctt tcctgcgtcc tcttgactgc 3180

cggtgctggg gctctgcgtc ctgcgtccgc gggagtaaat acagcaggcg aaggggaagc 3240

tcacacaatg gtctccagcg ctctggggca gggcttctga ggggcgggcc tgcctctgcc 3300

gggacctgga gcccccgccc ctcggagagg ctcctaggct gacttgggca gagccctctg 3360

gtgggccggg agggggaaag gctgtgttga aatgagcaaa ctgtccaggt gtcaggccaa 3420

gctgggaggt gaccagcctg aggtcctccc cgctccatgg ccagaaccag ggctgacatc 3480

tgggtgtcct gagcccagct gcccacacgg cccacctggg gtcagcccta tctgagtggg 3540

ggaggcgggg cctcctgggg gaccagaact ttggctggac gccaagcaga gtgccagtgg 3600

ctgttcttca gggctgggcc tgaggagggt gtggggcggc gaagggacgg gagggggttg 3660

tgatccagtg gccactggcg ctgtgcagag tgtgagctgg aaacatcgta gttactttgt 3720

cagcttagtg gtgaaagccc tttttcaggc tctatccctt tgcatccctg cttcccagag 3780

ggaggggagg tctgggtctg cagagctggg agggcttgct gttcccgccc ccctccccca 3840

caacacctcc tcatctggac atctttgggc acatgctcat actggggtct ccctaggtcc 3900

actgtgttcc gttgagcctc ctgcagtccc cgagtgaatg tgacctccct gcccctgcct 3960

ctttgcaact cctccctgcg accgctcctc caggggcctt ccttgtccca aatgtccaag 4020

tggcacgact tagccggtct gaccactttc cagtaagccc ttatggagag aggccctgtg 4080

ttgtgcagag ctctcctcct gcctgcggga tcgaggtctc tgctctcagt tcctaacaga 4140

aagtgtcggg cccccagtgg gatttctggg gaagaactct cgtgtctcaa cgggagccct 4200

gtggcgggag gggaggccag ggtttggggt tgtgttcgtt gtacagctgt caccatttgc 4260

actatgaaag ttgttagtgc cccttccttg ggtctctggg tgtaactcca cccttgcccc 4320

catgtgcctc catctggagc tgcttctgcg gctgtctccc aagccagttt tgtgaccctg 4380

taatttagtc caagacaatg ggctcattga gaccatcctg gtgcagcagt tggcaatcct 4440

ttggctctgg gggaaggttt ctcagtctcg gggagtgggg cctcaatctg ctggttccct 4500

gtgtttatca gtctccccct tgtgtgtcct gaatggtttt gctgggaatt ctggtcttag 4560

agccatcagg tggcccgagt cgataggcgt gagagagtgt gtgtgtgcat gagtgcgcat 4620

gtgcatgggg gctgacctgg ggtatggaaa ggtggccctc cctggtgccc aaggagcctg 4680

gagtatagtt ggagggtgtg ggggtgtgta tatgggagtt ggacaacctt gggtggacag 4740

acagacgtgg ggaagggatg attgaaggag gtggaggaga gagtgtgatt cagcccagcc 4800

aggggtgatg tggacaggca gcttccgaat cagggtagag aaaagtcacc actagctagc 4860

aggggagaag tcagtatgga ggaggcggac cttgagggag agtaggaatt ggattgcaag 4920

aggaaggaga gccttctggc cagcagcagc cagcagcagt gggggaggct ggaatgagct 4980

ggctggagag ggggctgggg cataaggagg ggcctgcctg tgaagatcat atgggccagg 5040

ctgcggaggg ccaggcatgc ccgccgggag tgcagctggt ccacgggaag catctggagt 5100

ggctgggaat gggcgcagga gcagcgccgt gggagcacag gtctctttcc cggggcggct 5160

cacctggtgt cttggttcct gcaaggtagg ccgaaagggt ggggaggaaa ctgccagctc 5220

cttacagcgc tgggatggtg gccccagggt tcctgaggcc agcggatgtg ggtgcctgtc 5280

accatgtggg ttgctgaggg gcggagactc caggggccac cccaaagcag gacgagctct 5340

gagccacggc atctctgggg gcagttttcc aatcgagcag acgtctaggc ctggaatcct 5400

gtaacagagg ccacagggcc ctgatcaggg tgttctggga ggcttagaac tagtggcagt 5460

atacagggta gacggcaagt gacctggcat ggggaaagag gcaggtgccc aggccggcac 5520

agcacacccg taaggaacag gtagacggga agccgtccgt gggcctgtgt gtgtgctcgg 5580

agttaaaatt ctgccaatgt cccatgtcct gggcacatct accccctccc tggggagcac 5640

ctttctcttc accttttcct tccccgcctg tccccttcac ccagggcctt ccccatccct 5700

cccgtcttgg ggaccgaggg caccatggct ttatgttcca tcaccgatga gttgcacagg 5760

gattcagtcc ttccgctgtt caggccgggt ccttcaggct cagggttccc aggaatggag 5820

agggtatcag tgtcttccat ggactcaaac ttcccgcatc ccgcctttgc tcccccttca 5880

agataggtct ccgagcttca aggttttagg gctctgtgga ggccgccacg tagcagcaag 5940

gagaatgttt tgtatttggc tgatgagatt tttagagtct cattttctac ttttccactg 6000

tacaaacggg cctccaggcg actgcagcac ccgccactgc ccgtaatagg gtgacaagag 6060

ggatgaccct ttcctctttc tcccttctgg ttggtggagg cacggggctg gcggacggca 6120

tgtgctttcg tgaattcagg ccaaatctgt tatcgcaaac acgattacaa ctcgggtctt 6180

tgtgtaacaa aagcctttcc aagtaccagc tgttggcctg ctttgctcag cggtgtttgc 6240

tgtaaccaga tttgcacacc gagaaagaat ccaaaagtcc ttgatgtttg ttgaaacaat 6300

ctggcccagg acccacgtgc tcagatccca gagctgtgtg gcatctgagc ttctcccgag 6360

cccccactgt cgcccgagga ggacccccag atctgtgttc tggaggcaga gcaggctgtg 6420

ggacgggctt ctgggtggga aggaccatgt ggatatgcct tcttgtctga gagtcccaac 6480

acctccggga cgtgggagct ggcgcgctgg caggattcag gtgcctcttt cctctctaga 6540

gaaaaaggcc ccgttgcttg gtaataggtg cagacctgtc cctaattaat gccagtaggc 6600

ctcttgcgtg atgaaccctg cctttcagcc aagactcaag gcatcctgtg aatactgcct 6660

ctctgcagtt tgagcttttg tggtgggagg caggagccat ggggagtggg ggcaggcctc 6720

ttacacgggt cccacagcca ctggcagcac tgacttgatg ctctttgagt tcagagccca 6780

gggccagaca gacccactgt cccgactacg agttggttca tttagagggg ggcggacaca 6840

gcacccaggc agcagatgca ctgtgatcag ccttgcagcg gggctgtggg ttctctgggc 6900

tggatgtccg ggaagaggca ggtggaggta aacgccagga cacccctgca gtgactgggt 6960

gactgcaggc tggaaatgct ttctgtgggc tgtggctgtc caggaaggtt ttgaatgggg 7020

ctagtggaca gagtttgcat ccagaggggc agtgctttgg aggagtgagg ggtatggcag 7080

tgtagggatg cccaggccgc cctcactctg ccattggaaa gctgggcggc ttcggtttct 7140

tcagtttctt cgcctgtttc cctgcctgca aagtggggtt agaaacagct ctctttgagg 7200

gttgctgggg gactctgaga tgcagcccat ggcgctgagc acgggtcctg cctcctacgg 7260

gtgtggtggg tgtcgcggct ggtgtggcat ctgggcggga aaagggggca tttgcaaagg 7320

acaggtaggt ttggatgctt aaatatgcag atctggggat gggaggtctc aggcaagggc 7380

ctgtgtgatg ccactgta 7398

<210> 2

<211> 1587

<212> DNA

<213> Homo sapiens

<400> 2

ggatgggttg tagataagag cagttgagaa ccacgcttca tctccctcct tagaaactct 60

gaaacgaggc tttattccta ccagaagttc agattgcatt atggtcatct caattccaaa 120

atgttagatg gcaagaatat ctgcccatcc ttcactttcc ttggaaaaag ttgctcttcg 180

ggttttatat gcgattgcag ttttccagtg tgtgaaacta ggaaaacaaa acactcaacg 240

gtgtacatcc ctacacctaa atagtcagaa ataataggca gctaggctaa ttatccttga 300

ttagcaagat cagagccatt agggtgctca ctggtttaac aaatgaatgc ccttaggcgt 360

ctatcatttg taactcctag aagctttaat ttccacaaga aacaaaataa gaggggcctt 420

ctgcttttaa cagtgaaaag atcgttctcc ctcccctctc cacccgggtc aactcttcca 480

gccgctccct cctgcatcac gaacacacgc tgcaggaaag cgcatttaca gcccgggaca 540

tccccagacc tcctctccaa aattccccac ctcctgtgca taggagaaac tgagagaagc 600

cctcacttcc tttccaaact tcacaagcag gggagggagc tgtagcagac tttcacctcc 660

gttcccaaaa gcgaatgtga aaaagtccga gaaggcacgt cctgcgagtg gaggttaaac 720

cgaaatctga acagaatgca cggtccccgc aaactacgat tgataaagaa gatactgaga 780

cgtttgcggg ggatataagc catggttgtc tcgccttcct cccctccctg ccaactatgt 840

ttcttggaga aatcgccggt tcgattcacg cacacatttt tgtaaaacac ggacaaaacc 900

ataagtagtt accttcattg ttccgtcggc cacgagggaa gctcgagctg agcggagggc 960

agatcccaag ggtcgtagcc cctggccgtg tggaccgggt ctgcggctgc agagcgcggt 1020

cccggctgca gcaagacctg gggcagtgcc cgaggcggcg gcgagtacac gtggcgggct 1080

ggattgcaga ccggccctct cgcggcggag actcgcgacc tagcggattg catcagcagg 1140

aagacactaa ggctgctccc ccaggccgcc cccagatggt ggagtctctc ccagcccgaa 1200

gattcggagc cagcgcccag acccgagcct cactcactgc tcactcccgg ggtgcagggc 1260

agaggtgcca gtgttgcaag caaatgacac ggttaccccc gaatcagcca ctgtgggtgc 1320

gtatccgagt gtggggatgc ccgtgtaaca tttatatgga gacgtcaagg aggaggaaat 1380

aaacagatca gaggtcaaat gtgattgcca ttccgtcatc actggctcct gcccacctcc 1440

ctactgtccc caaagtaact ttgctgcatg ctgagaggac cacggcacaa tcctgcccaa 1500

aagtatacat gtatcccccg cggctacttt aaatgtactt ttgcagtagt caagaacatg 1560

tgcctggttt gccgatctct ttcccag 1587

<210> 3

<211> 3381

<212> DNA

<213> Homo sapiens

<400> 3

ggtaaatcaa tggacctttc actaccttcc ccttctctgg gctgtagcag tgagttaact 60

ggctcagact tgcccagcgg aatgcccttc aggacacact gagtactgta gtaagagctg 120

catatgcgct cagggagaat gtggatagac gctgtttgtg attcacgggt aaagggcctt 180

ctcccagagg cagcagaggc agatcctgtc tctggtgtgc cctggccccc gacttggagg 240

cctcctgggc caggccaaga ccttccccgg cagcgatggt ctccagccac actcaactgc 300

cctgaaggga catttcctgc ttattccctt gcccggctgt gtcctccacc cggaaggcct 360

gtgccttctt cgcctgcatg tcctaccctg aggaggctcc cttggtcttt catcgctctc 420

cctatgggtc ttcacgcctt cccgaaccac cgcgcccaag caggagcacg ttctcggccc 480

tcttcacagg gcgctcctcc tcacaggggt gcccgggatt tttattctgt gccttcctgg 540

tggctcctac aagtctggaa gggcaggagg cgcatctcac tcctctgggt cccctcccct 600

agcgcctggc gggagcccag gctgcatttg tggaattcat gactttttct ctcctgctca 660

agctgaacac attgctggct cctgctcggg tggagcccgg ctaattagag tgaggggctc 720

cccgtagggc gaaggggtgc gctgtcagat gtggcattcc cgttttacgg agacacacgg 780

tgtcttacac gccagggaga ggtctgagac gcaaagagcc gtcgagcggg ctgcgggatt 840

gcttcgctgt cacctccgcc tgcagccacc cttccgcacg cacttgtgtg tgcacccagg 900

ccaacatgga aggcgccatc ctaacttctg ccgtgagcag gtgggaggga agagagacga 960

gaggtattcc attggttgtc tgggaaaatg aattgcacct tcccctccct tgcggaggat 1020

caacttttcc caccccctcg ggtgggcact cgcatcctgg ggccggagcc tgaacccggg 1080

agccaagggg ccccagttcc agggacgtga agctgagcgt acagcgggcg ctcccagaca 1140

ctggggaaag tgctttacga tgtcccgagt ccctccagtc tcgccagcgg ggcgagcgtg 1200

agggtgcccc gaccgaccag cggccccggg tgcagggtgg cgggcccggc ggcgcgcgtc 1260

cccctccccc tcctggcggc ccgcacgtgt cgcccgcgcc gcgcccccac gggttacgcg 1320

cgggtcccgc agcgccgcgg ccgagccggg ctgcccggcc cgcggacaca gcgccggccg 1380

ccgcatcccg tgcggggccg cggcgcgatg ctgcgctgga atgaggaagc gcggcggcga 1440

ggggagggcc cgggcgcggt gcgcgcgggg gtggcggcgg cgcgccgagc gggcccggcg 1500

cgggcgagcg ggctgcagcc ggcggcggcg ccagcaggta cggcccgcac ccgccgccgc 1560

cccggcggcc tttgggggct gagccggagc ccggcgcgat tgcaaagttt tcgtgcgcgg 1620

cccctctggc ccggagttgc ggctgagacg cgcgccgcgc gagccggggg actcggcgac 1680

ggggcgggga cgggacgacg caccctctcc gtgtcccgct ctgcgccctt ctgcgcgccc 1740

cgctccctgt accggagcag cgatccggga ggcggccgag aggtgcgcgc ggggccgagc 1800

cggctgcggg gcaggtcgag cagggaccgc cagcgtgcgt caccccaaag tttgcggggt 1860

ggcagggcgc gcgctctggc cacccgccgc tctgggcggc agctggtggc aacgcaaggg 1920

cgcggcgggg gcggccggcg cggagggggc caggtacggg gcccgcgggc ggcgctgtgc 1980

gcgcggggca gccggtcggc cgggagcgcg aaagcctggt ctgagccggc tgggggcggg 2040

gagtgtggcg gagaaatggg gaacaatgcg agtgagcaac ttcaggaagt cattgtgaaa 2100

gaaagctggg aagagctccg cggccaagtt agcaggacac tctaacaagt gactgcgcgg 2160

cccgcgcccg gggcggtgac tgcggcaagc cccctgggtc cccgcgcggc gcatcccagc 2220

ctgggcggga cgctcggccg cggcgaggcg ggcaagcctg gcagggcaga gggagccccg 2280

gctccgaggt tgctcttcgc acccgaggat cagtcttggc cccaaagcgc gacgcacaaa 2340

tccacgtgag tgttttcaaa ttgaatttca ataggaaaac ttggggtaac tggtgaattt 2400

aaaaaaaaaa aaacacagta aagaaaagcg gtaaggttgg tagaccctgg tgtcgctcag 2460

gtccgcctct cttttctgag gacagtgaga gagttcactt ctgtcaagcg tctgttgctc 2520

tgcactgtgc cagcaggtgc aggaccaggc cgacatggga cacttctgag cagccccgct 2580

gtcaccagga gaggagttct agctcccaac catatttaaa tttatgtaga cctacatata 2640

cccacggaag tcagccttta taaagtcgtg tgtaaagagt tttccttata tttgagccgg 2700

gagctttctt tttatactat aaatatgatg agatcgagtc tgaacttaat ttctgcaaga 2760

gaggaattat cccggctttg aaaagttagt ccttttgctg accgcaggtt tgacgctcaa 2820

gtcaccaaac cttctcagga aaacccttag taatattaag gcatcaggtt acttgcggtt 2880

atatttgaaa tgtattttaa atatttgtca agcatcgctg ctgatgccta aggaacctcg 2940

tgagggcttg tttttccttc taatttggag gcatctaatg accgaaaacc gtagcgattc 3000

catagggtct gaccaggcac agctttcaaa tgcagcttcc ctctctctag ggactgcagc 3060

ccacccagac tgaatttcaa tgcggtgcgc tttgcttagg ttacccactc acaatttccc 3120

actgcgccgc aggcagtata tttcagcttt gagatacctt gttttaaaat tccagacaaa 3180

atggtgttga ggaaatgtct ccttactagt cccatcaact tctgttaaaa gaggaaaatt 3240

tatggaattt gaaaatactg cgtatgatat ttaaactttc atagacattc aaatgctttt 3300

aaggccaggt tcaatttggt tatgagtcga ggggtggggg ggacccacat agaaatgtcc 3360

tgggtcctct tgagtttatt t 3381

<210> 4

<211> 3381

<212> DNA

<213> Homo sapiens

<400> 4

ttcatcattt ctggggagtt ctcttggggt ccacagaaaa tctcacctca tctcggtccc 60

ctcagcaccg gtgatatctt ggaactcggc cccggttgtt cgctaaggag gacttggctt 120

gggggcggga gggtgctcca gagttcctgg gggtccaccg cactccccat ccgaggctcc 180

tcgcgagcgg agccgcttct ccaggccgcc cgcctccctg ccgcaggagc aggcccgcgc 240

ccgccgcccg agagcctccg gtagagggag acactccagc ggctcctccg acttggcagc 300

ggccgggccg ggagtgggtg ggggtgatgg ggggtgggga gaaaaggggg agtggggaga 360

ggggaggtgt gtgaaggggg ggtccggggg gcgggtccct gtgccgctga cgtcccgagc 420

agtgctggga agtataggct gtgttgtcac gccggtgtca gtctgatgaa gattggcatc 480

aggtaagctg tcattcattt ccatgtcaga gacgcttttg caggcggcgg cggcggcgcg 540

gcggcggctg ctgctgcggg cggctgcctc agagcgcgtg tgttttattc cagtccccaa 600

gccagagtat tattcattgc gacagggcaa ggaggagaga gggagagagg gaggcagcag 660

ggaggagaga gagggaggca gcagggagga gggaggcagg gagcagcgag ggacggcggg 720

agcgtgcaga gagaagctgg ggaagcgccg ggagagcgcg gagcggagca gcgcgagggg 780

cggcgaggcc gggcacggag gctgcgagag ccccgcgggc cgcccgctcc cctgcccggc 840

cagcgctcag ccccgccgcc gccgccgccg ccgcctcgcc gcgcttgggc ccgtggccgg 900

ccgcgcattg tcctcgggtg caaggagccg ggctgcggac tcgaatcgcc gcgggcccaa 960

ccccgtagcg ggcgggcggg gagctgtgcg ccaggagcgc caggggaccc gagaatagga 1020

acaggcacgc cggcccgagc ccgggtgcag aaggctcccg gccgggcgct ccgcggggag 1080

aggctgggaa ccgcgggcag gctccaggtt ctctttctcc cggcttcggg cgtccttggg 1140

gccggcgctt actccgcgcc accagcctgg agatgctttc cagcggctgg aggcgggagc 1200

ggtcccaggc tggggccagg tgaccggagg agtcgaggag ccgcggccgc ggcctgggga 1260

ggcagggcga atgagggttt gcagacggat cagtggagac aggggaacac cggcggggcc 1320

cgggaagcca ggatccgagg ggctacacgc acggaccctc acccagggag gagcgagaat 1380

gtgtagggtc accggctttc catgattgct ggggatcttt ggtgaggcgg gcgtaggggc 1440

ccgcgcgagg cttgggaatc gggagccctt ctggctcgag aactagggga tgagttcgta 1500

aaagagggaa ctgaaagcga tcgagagcgg agagctgagg gggatggcgc aggatcccga 1560

atctgccgct caaagtttgc atttctttcg ggttaggaga cgggctttcc tggctcccga 1620

tccccaggaa gaaacgagcg aaatgggccg tcctttcccg gggctcttca cgggggagcc 1680

gggggtttcc gcgcggtggg gagactcggg ttgggaattg aggggtaggg gcttgtggat 1740

cggcctgaat tagggctggg ttttaggacc agtctagagt tcggtttata ggatccagac 1800

tgtttacgga atcgggatcg aggggccgat aagtagttta cacgccggcc agagcagagg 1860

gctggaggtc ggagttgggg gctggaggaa cgggtggcgt ttttaggatt cagtaacagg 1920

atcacagctt tttcttgtgg tggaagctat tggaatttgg ggagggtagc acgaggggtc 1980

ctgcagctcc gcgtgtgaaa aagcgtttag gtaggcgatg aaagtagttg atctgagcca 2040

tggcaggcga gccccgaatt tttgctgctt ccccctgaaa gtgtttcttt aggaggagag 2100

gacttgggcc acacaggacc cggtcctaag agagcgattc cgggaagcgg acagatcgaa 2160

gagaccttct gggcgaagcg gcagggcagc ctcgcggggc tgggagtgga tctgaggtcc 2220

cgacccaggc ggctcggagt gctccaggag ccacctgggt ctgcgggcgc agcgcggcgg 2280

ggcgggagcg gtggcccgca ggggccgcgg cctgcgatga aggccggggg gcagcgctag 2340

cagcgaggtg ccacagtggg ccgaggagtc tgggctgtgg cccagggtag gaccggctca 2400

aactccagtg ccctgattgg agccgcttcc tgtgcttacc cgcgccggac tgagaagccc 2460

acaaacccgg cctttggtgc gcccggggga ggaggaagct tggagtgccc tactgtcatc 2520

tctcctgtcc ggagacttca ggatattagc ttttcgggtt tcaaatgctc tataaccggt 2580

ggcagccaaa agcttcgcat tttaggcagt ttagacgatc ctccccgccc caaatctgag 2640

aatgatggtg ttcaaacata acacggtgta ttacccaaag cccctgccct tgccctcctg 2700

ctctctctgc cgttctggcc ttcggaggcc ccaggacctt ggtggaagcg gggagggagg 2760

gtcccgtttc tggtctcata atctcccact cgggctgcat ccccatagct tgggcctagc 2820

tgtggggtgt ggggtgggaa ggggtcccga ccagggaggt aggttattct ctgggcatct 2880

agagaaagag tgtgtgtggg gggtgggagc gggggggagg agggcattga ggggaggaag 2940

atttgagatt tcctcctctt aatattaaac ccaccatccc agccccctgc acccctggca 3000

gggagagcca gacagccctt acaggacacg gaagacgcac gacccacgac ccacgagtgg 3060

cctcggcggc ccggggcgcg gcgactgccg ccgcggagct ccaaggctgt tgttttgtag 3120

gcttggaatt cgtgagagct ctctcccgct gagagcccga ggggggaggg agccgtgacc 3180

ccacggagac tccctggtca ccgcctcccc tttgtgagcg ggaaaggctt gaaagccaag 3240

agaaagagag gctgctcaga ataaggggca gggggttacc ggagggagat gggcccgacc 3300

accgctcaca gtaaaatgcc tcgtgcgaat tgcactgaag tatacccaac ttgagactgg 3360

ctgttttatg atcctctctg g 3381

<210> 5

<211> 1958

<212> DNA

<213> Homo sapiens

<400> 5

atgctgggcc acgctgaaaa tttgtggctg agagctggac cctcgtcatc gccacgtact 60

ctgtcaatga gacagggtaa cccatggtta ctgagctccg atcagttaag gggcagagag 120

cctccgctcc ccactgctct ataaaagaga cccagcaaag ggaccctacc agcttctagc 180

tctcagtctg cgcgagggtg taggaaggaa agcccaggac ctccggagca gagcacagca 240

gctgcagagg caaggccagc atgtcgccca acttcaaact tcagtgtcac ttcattctca 300

tcttcctgac ggctctaaga ggggaaagcc ggtacctaga ggtgagccac ccctggactg 360

acccatctca ccttccttgc gtgttagccc taggcggcag gcaggctgcc tctgctcgca 420

gccttttggg gttcgctgtt tcttccctct ctgctggatg ctgtcttgcc cctggtttcc 480

cctatcctgt tctccctcct tgcctctgag catcccagac tgcctgcctg ccttcctctg 540

gccgctgggg ataccctggc ctgatggaga gggtctaaga ccttcccgtc ttctccggac 600

acgggaaaac attacccctc tctctttatt cgctatgctg agtggcaggg agggtgcccc 660

gctcctggtc ccctttttta tccccagccc ttgaactttt ccggactgac ctatgtttct 720

tgccagctga gggaagcggc ggactacgat cctttcctgc tcttcagcgc caacctgaag 780

cgggagctgg ctggggagca gccgtaccgc cgcgctctgc gtgagtcgag gctgcccggc 840

tcgcgggcgc ccgggacgcg gggaaggtgg gactctgtgc ggggggcaga gggctcgcgg 900

acatctcggg gaaggggctg gccggaaccg ccaggggcgc ggtcccctta gctaaggatc 960

ggtccgcgga ggcgcgccag gagcgggaga gggtggcgcg cccggggcgc aggaacccag 1020

cgcagcctag gctggaagtc ggggcgctgg gcactacaga gcccgggaat ggggcgcgcg 1080

gagagcggcc gcccgaggac ggcgctgcgg cggctgcagc ccgggactta ttgccccatg 1140

ccctcctccc ccagggtgcc tggacatgct gagcctccag ggccagttca ccttcaccgc 1200

cgaccggccg cagctgcact gcgcagcctt cttcatcagc gagcccgagg agttcattac 1260

catccactac gaccaggtct ccatcgactg tcagggcggc gacttcctga aggtgaggcg 1320

cccacggcca gccaacctag ccggagggcg gcacgggagg gttggaaagg gctggggcgc 1380

tgcacccagc gtggggctgc tgagcgtagg tagccagtgg cacttcttag acacttcgct 1440

ggtgcccgag tcggagaggc gcgttcgagg acccccacac ggcgagaatc tcgcccttac 1500

ccgaagacct cgacccacac acatccagtg gggctggggc cggtgcctct ggacgctgcc 1560

atggtttaaa ttcccttctg ggcgctttcg aggccctagg aacttctaaa gacttgaact 1620

cgcagcgcgg aactctgacg caatccaggg ccgaggaaaa atgattaaaa cccaacaagc 1680

tcgagtgctg gggtccacca agcgggccgt cttggttaga aggcccgccc cacacgtctc 1740

acatctgagc ccgcctcgct cctgctggtc cacgctcggc agagccgttc cgagagcaca 1800

gaggctgtct tcagtgcgcg ggtgacccga ttttggagca gtaggggact ggctgccgag 1860

ggggcatcta gattgagata ggtgggaggg caggacaaga cccctaagct cactgcctcc 1920

tcgattccag tcgtcagact ccataagtat aacagggc 1958

<210> 6

<211> 4899

<212> DNA

<213> Homo sapiens

<400> 6

gaggcagccc tgggaggcac tggtctgaag ggctagaccc ttggtaagaa cctctggaag 60

aacgcctgtc ttccggaacc agacagggag gcgtgcaacg gggtggggtg gggggtactc 120

ccagctgcag gcacctctac tcctaactat ctgcaagagg acacacacac acacacaccc 180

tgggtgtcag agaagtcctc ccttccctgt acctcctcct tcccaagccc ctgaaatcca 240

gaagtgcctg tttccaggcg ccagccctgc tgagtggatg tggggatgga ggtcactgga 300

ggcccagggc tggtttgttg tttttgtttc ctgttaggag tactgtgaag gctttgcagg 360

gctagttttg ggaaatctta ggtttggctt catctgactc ctctactgga gcgaggcgtg 420

cagccaagcc tgcttagacc tccccaggcc acgggcccgc ggcagcccag ctcagcacct 480

gcaggcgggg ggaccgcgcg cttggctcga agaccccgcc ctgggcaggg gacagaaaat 540

atgaaatcag atggggagtt atgaataact gtcctcccct cccctctgcc gtgtttcctg 600

aatccgtacg ctatgcagga ggggggcggg ggcgggggcg cggggaggag gagggggccg 660

tttgccatta atctgggaac aagcggctaa cctcggtgac tggtattttc gcttttcttt 720

tctcactttt ctcagtgtgg ggaaagcagt caagcccgcg cggagcgatt gtgaggggct 780

ctgctggaat ttggcagcgc ggaggcttgg agagaagccc catgctggct cccattcagc 840

cggcccgttt tcctcgagct ttggaagttt cactcagccg tgcactcaat ggcttcacaa 900

agctgattac aagcttcagc gcattcctga aggagccaaa agcgacgcag gtgcaaacga 960

gccgagggag ccccttatcc cggtgacaga atgggacaag ctgggaaagg cttagaccac 1020

acaagtccaa ggctcaccag gccgcagaaa gcctgccttg ggaaccgggg gtcattatcc 1080

gccctattca gcggggcccg gggaccctgg gggccgagcg aggccagccc gggcgggagc 1140

accgccgcca gcgcgcgccg gcgacagggg ggaaccccgc tgggcgctgc ggccaggccg 1200

gggctcaggg cgctgggctg tgcgtttgca caaatctgtg ttccggcggg ccggtgtcaa 1260

ccctagtggg gacacgggag aaagagcacg ccagtaggcc acgcggcgcg tgggcagtgc 1320

gcaacttctg tcggcgtcca ggctgtacgg ccacgtttca gccggtgccc ccaggccatg 1380

gacacccagc tccagggtcg ctctgcgccc tttctcccca gcccaccttt cccattggtc 1440

ccctctcctg tccgagtggc agcgcggccc cgcagggagc gaccccggga gggacagtga 1500

ccgcacgcgt ggagtgggga cggcggggca caggacggta gtctaagagt gttcgcatgg 1560

ccgaggacgc tttcgctgcg agtttggggt cgaggggcag ttccctcccg gagtcattaa 1620

cttcgtctcc tcgtgctcag ggaccagcaa cttggtgctg cgggcgccag aaagaaaagg 1680

gtagcgcctc gcggagcgcg cgggggaaga gggactgcgg cagcgggacg cgagggcggg 1740

aggggcgcag cagcggggag ccggagcgca gcggagggga gcgctggggg gcggggagcg 1800

ctcgggcagc caccctgtcc ccgtctggag ccccgcgctg cgtctaggag ggcgcaacac 1860

gcagtccccg cgggggccag agctcggagc cccctagtgc atgccccctc tcctcgcgcc 1920

ctgccgaggc ctcggccctg cctgccgtgc cctgggcctg gttgtgcccg ggggtccccg 1980

cgggcagggc gcggggcagg cagggcgcgc gcgccgacgc tcttttgtct gataactaat 2040

ttgagttaat gcgatcttta tgtaaagcta acagcggata attgtctatt ttctcgccaa 2100

cagtctccat cacaatcact tatctggaaa cctgcggttg gattaatcgt tatattcccg 2160

agatgagcgt cgctgcaatc cgcagcgaac gcgggtaggg acctggagac gcctcccggg 2220

cgctggcggg gccggtgtgg gccagctccg ctaccgcctg agacgcggtg tgcccaggtg 2280

ttggtgcccg cgggagaggg ctgtggggcg ccttccccag gatttgcttg acttgctttt 2340

cgctcgagtg ggtggtgcgc gggtgcggga ggcggaggga ggaggagggg tgaggggagg 2400

agggcctgtg gggctgcgga cccggagcag cctgggtgga gcgcggcctc gggaggccct 2460

gggtgcatcg cggcggggcc tgggggggcc caggcgccgg aggagccgtc ggtgccggaa 2520

tgcagcgtgt ttcacttggg agaaacgttg ccctcggtcc cttgcctccc tcctgttgtc 2580

tcggtttttc tggcttcgtc cttcgtccca cccacccgtt cccacctcag gtccctcccc 2640

caggatcccc tccttaagga tccaggtctc tgaaaattat tggcaacagt tacacgcccc 2700

acgattgaaa tccacaagag aagagtccca gttctgcagg ccgctccagg gctaggggta 2760

gagatggtgg caggtggtgc gtcaactctc tagggaagag gaacttgcat tacaaagact 2820

tgtctttctg agctgaagtc aaaacggggg cgtcaagcgc gctccgtttg gcggcggtgg 2880

aggggccgcg cgcccgcgct gtcccagccg gagctgccct ggctggtgat tggaggttta 2940

acgtccggaa ttcaggcgct tctgcagctc agatttgccg gccaaggggc ctcagttgca 3000

acttttcaaa atggtgtttc tggaaaataa caaattcaga ctcaactggt gacagctttt 3060

ggctatagag aatgaaactg cttccctttg gcggtggaac tcttaaactt cgaagagtga 3120

aagaatacaa tgaaataaaa tgccataaga tcactggatt tttcagaaaa aggaagaccc 3180

caaattactc ccaaaatgag gctttgtaaa ttcttgttaa aaatctttaa atctcgaatt 3240

tccccctaca acatctgatg agtgctttaa gagcaaacga gcaaatccca cctcgagaat 3300

caacaaaccc aagctctggc caaggctctc cccgcgtttt cttctcgtga cctggggaat 3360

gtcccgcccc atcgctcacc tggctcttgt catctcgctc atcttgaagt gacccgtgga 3420

caatgctgct ccctgccgca gctccgccgg tcactcaggc agaacggggt atgcaaatgg 3480

cctggagagg ccgaggccga acactgcgcc cattgtcccg ggcgctcaaa gcgccgagca 3540

gctgcgcaga ctttctgggc tcggaccctc ggccgccacg ctaatgtcat cattgcaaaa 3600

catcagattt tgagaactat gcagtctgaa ttcattagca gccttctcgg cgaaggttct 3660

tttccccgtg acaagtttca aagtccagac cccctccaac gttggtaggg gtaggaagag 3720

gaggaggggc ccagggaggg gggtctttcg caagtggggc ctcgggggat ccctgctctc 3780

cttctggtgc attccgcaac tttaaaagcc ttccttgggg ttctgagcgc ggatgtctga 3840

cttgaatgac ctgagatttg gacatattcc cgttttctcc caagagttgc tttaatgttg 3900

cgagtttaaa ttcactgaaa gaggcccaga taccaagtcg agtgaatttc atagacatca 3960

tcttctgttt taatgatcgc ggcagtgatc gtttctgaag tcataccctt tagggtgaac 4020

tcacaacaat gcatgtcaga gaggctgcgc gccctaaagc aaaacagtta aaacatcagg 4080

ccacgctcct caaactgcag gattgcaagc agctcacaaa cttccagtcc ccaccccaag 4140

gtgaggagag tctcagtgac ttgaggacct gcttgcactc ccgctttcca cgcccggtcc 4200

cctacccgca cctgcccaag tggtctcgtt cctctagaat ctgaatggtg gggaggggtg 4260

ctcctgatgc cccgggtgca gggcgggcac cagcgagcga gacccaaggg cgctagaacc 4320

caggagcgca aaccaccgtt agggcctgag ggacgcagag gcgggtggag tagtgtttct 4380

cagattcgtg ggaggccgca ggcgccagca gaggcaattt tcctcccctg agcaatgcta 4440

gttctcctca ggcccaggat ctccactaac gtgtccttcc acctcctcac aggactccaa 4500

gctgctgtcc cctctctgcc gcatctgagg ctgggaaaac ttcctaggag aaggcaagag 4560

aaagccacca gaccagagcc gaggactaaa ctttaaggtc gaagacggca gaggggcagg 4620

ttctcccctg cacaccccaa ggcctctcct gcacccgcga ggccttcctt gagcgcccag 4680

gcccccgaaa tgcctgccct ccttctgaca aaaggagggg gtaggatgtg aaggggtagt 4740

gcaaccaaca atgtttttgt aaacacaaca acagggaaat acatggagga aatctattta 4800

ttgggtgtgt catttttggt ggggggcggg attgaaagtg gcgccatcta gacccaggaa 4860

aaagctacgg ggtgggcggg gtaagcgggg gactcttgg 4899

<210> 7

<211> 1206

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

gagagcagca ctcatttctt cttatcattt ctgaactgcg agacaaagaa ctttaatttt 60

ggggctagaa tttaatttgt ttttgagaat accgaatatt accaagcaac gccagcacgg 120

atataatagt agtgtgaggt ttgcacacac gcagctgaaa tggtaaattt aaaataggag 180

acactgtgtg cacgtatagt gtgtgcatac agtatcaaga cattctttgc tcctggagtt 240

ttctctgctt tgccaaactt cacgcccctt ttggaaaggg ggagcgaatt ttccaagttg 300

tgaggatact tttcctccat ccagccacac cctcttccgg gccagtcttt ggtgaaacct 360

gggcgatgtg gagtcactgg gggatgtgag tgagggcgtt tttgctcatc ttaacccagg 420

tctctgggag agcctttagg atcgctctgg gacttagagg aggttccgtc ctgggccggg 480

agctgaggct ctccggacaa acgctaagca gctctcactt atcggtgtcc aataggcctt 540

atataaagtg ccaaagtgcc ccagcaaggc tttaccagca cctgggccgt agttgtctcc 600

tggctcctgg ggtccgcgga gctctagatg tacctgcagc tcctcccgag tcctgcaagc 660

cacccttgtc cctcttctcc cgctcacccc ccggcccccc catctctttt gctattccgg 720

ggaaggccac gcagggtgca acccggacgc gcccccgggg gaagcccgcg acgcagcagc 780

cacaccccca gcctgcactg gcgcccaccc catgacttcg ccttcgcggt cgcgggcagg 840

gagcgcgcgt ttccatcggt tgattagaag cgggagtcgg aggagccccc gcccgccggc 900

ggccagcgca cagcccggcc aggggcgccc tccctgccgc cgccggccct ttgatcgccc 960

gcggcccgcg gcccgcagac cacagccagc gctgtgctgg gcaggtggcg gcagcggggc 1020

gcggcgcgct caggcgcacg ggtccccggg ccgcggcgcg ctccccgcca cgccgcacat 1080

caaggcccgg ccggccggcg ggcgccttca ttagcagcct gaaattataa tattatgtta 1140

aagaacaaag ctgctccccg gaaaaatatg tgctgcatat ctgacaaaga taaattggat 1200

tattca 1206

<210> 8

<211> 7398

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

ttggagtcgg tgggttttga gtatagttac gaaggtatgc gtattttttg gttgtttttt 60

tgttattgtt ttttgggttt ttattttggt gaggcgtgta ttttggcggc gttttttagg 120

gaattaaata tgtttgttgt attgtgcgtg gagatggaga atgtataatt ggttgatttt 180

gtgttaattt ggtggaattt tatgttagtt ttgggaaaga ataattgtat gggtgtgttt 240

atatttatta ggtgtttttt agaaaaatat tcgagaataa tgttgtggtt taggatggtt 300

gttgtgtcgg attcggtatt tttttagggg ggttgtgttg ttgggttgag ttttttaggt 360

attggatttt taaattttta aatacggcgt ggataggtgg tttagtaggg gttggattat 420

tcgataggtt taggtgttgg agtttagata agatatattt tggtttggcg tggaagatac 480

ggggtgttat taatggtagt aatggttgta tttttgaaat tcgggttttt aggtcgacga 540

gggtgtgtac gtatttgaaa tgtttgtggt tttgtagttt ttatgtttat aaatttattt 600

ggttgaaaat agtttaaaat atttaaagta tgagggaggg agtgtttgtt ttttttaaaa 660

aggaaggatt tgattttatt tatttaaaaa gttatttaaa tttagaatat ttttcgtaag 720

agattttttg tttttcgttt ttttagaatg gttggagagt tttagtattt ttgtatattt 780

gggatatttt agagggggtg gggaggggta agtgggtagc gagcgatttt agatttagga 840

tgagttgtta ggcgtttttc ggttatatat ttaagggatc ggagtgtagt tgtagcgttg 900

cggtttgttg tttcgggggt gggggtgttg ttttatgttg tgaattttta tatggttttt 960

gattttgggt agaggtcgag ggtttaaggg acggggtgat agggagagta tgtaggagtg 1020

ggtttttggt tttttagggc gagtggaaga agcgtttttt ttttttgtag gtgatagatt 1080

tggggggttt tttttgagga tgagagtttg ttgtttttta agttttgtgt ttaatttagg 1140

tttttaggtt tattttagtt tttcggtttt gtttgttttg tggatgatat agtttaaggg 1200

tagagatcgt tggtttggag ggaaggttag gttttaggtt agggtttaga agggagggag 1260

aagtttttgg ggtagttttt tttttgttta tttattgttt agtttttttt tttatatttt 1320

ttttcggaaa cgtttgtttt tgataaggtt tattttttgt ttttaggagg tttttattgt 1380

ggaggaaggg aggcgtcgtt cgtttttggt ttttttgata gtcgtgtttt attttcgttt 1440

tgtgtttttt ttttcggata gtgttttttt tagggtttat ttaggagggt gtagcggtgg 1500

ttttcggggc ggtggtcgtg gtgggggtgt tagttgtagg ggtgttttcg gtgggtggga 1560

gttggtggtt tttcgttggt gttatgggat tcgtatgttc gttttgcgtt tttcggtttt 1620

tgagtttata ggtcgggatt ttgtttgtta gtcgcgtgcg ttgtcgttta atttttgtag 1680

gcgtagagcg cgcggcggcg gtgatagaga attttgtttg gttgtttaaa tatagttttt 1740

tgtagaagga ttttgcgttc ggggaagggg aggaattttt ttttttttgg gcgttcgttt 1800

ttttcgttat ggttcggttt ttatattcgt ttatatttgg tcgtagcggg gcgttcgggg 1860

ggaggggttg aggtcgcgtt tttcgtcgtt ttttgggcgc gggttaggcg gggaggaggg 1920

gggcgtttcg gtcgtgtgtt taggattgtt ttttagcggt tattcgggtt ttagtttttt 1980

aggtttggtt ttgataggcg ggcggagtag ttagtgcgag atagggaggt cggtgcgggt 2040

gcgggaattt gattcgttcg ggaggcgggg gcggggcggg ggcgtagcgc gcggggaggg 2100

gtcggcgttc gttttttttt tttatttatt tagttgagtt agggggttta ggggtttttt 2160

cggcggttag ttttgtattg taggagcgcg ggcgcggcgt tttagttagc gcgtagggtt 2220

cgggtttcgt cgggggcgtt ttttcgtcgt tgtttttcgc gcgattcgtt gtttattagt 2280

tattatgtcg gatttcgcgg ttaacgcgta gttggatggg attatttcgg atttcgaagg 2340

tgggtgttgg gttggttgtt gcggtcgcgg acgtgttgga gaggattttg cgggtgggtt 2400

tggcgcggga cgggggtgcg ttgaggggag acgggagtgc gttgagggga gacgggattt 2460

ttaatttagg cgttttttcg ttgagagcgt cgcgcgtttt cggtttcgtg ttcgcgtcgt 2520

ttacgtgggg gattttgtta ggggtattcg cgtagatttt gcgcgttttt ataggatttt 2580

gtgttcgttt tgcgtattgt cgtttgggtt tttttttttt tattgttgtt tgtgtttgtt 2640

aagcgatagc gattttttcg agggttcgcg aggttgtttc ggaatttttt aggacgtata 2700

gttttatttt gggaaattta tcggtttttt ttttttggtt tttttcggcg gttttcgggt 2760

ttcgtttgga ttcggtaacg ggatagggag gtcgtttttt attttcgatt gagtggatag 2820

tcgcgttttg ttcgggtgga tagttttttt tttttttacg ttagtttcgg ggtcgttaag 2880

ttgtgtagtt cgtgggtcgg gagtatcgaa cggatatagt ttaggtcgtg gtagggttta 2940

gagtgggatg ttttatggtt tttatttagg tttggggata tttttattcg ttttttagaa 3000

tcgggtcgtg ggggatagaa ggggtttgcg tgcgggtagg gagagtattt tggttttttt 3060

ttgttttcgg ggtttataaa gtgtgttggg atttgcgggg ttgttttgtt taagtttggg 3120

tttggcgttc gcgtttttga gtttgtgagt gcgtgcgttt ttttgcgttt ttttgattgt 3180

cggtgttggg gttttgcgtt ttgcgttcgc gggagtaaat atagtaggcg aaggggaagt 3240

ttatataatg gtttttagcg ttttggggta gggtttttga ggggcgggtt tgtttttgtc 3300

gggatttgga gttttcgttt ttcggagagg tttttaggtt gatttgggta gagttttttg 3360

gtgggtcggg agggggaaag gttgtgttga aatgagtaaa ttgtttaggt gttaggttaa 3420

gttgggaggt gattagtttg aggttttttt cgttttatgg ttagaattag ggttgatatt 3480

tgggtgtttt gagtttagtt gtttatacgg tttatttggg gttagtttta tttgagtggg 3540

ggaggcgggg ttttttgggg gattagaatt ttggttggac gttaagtaga gtgttagtgg 3600

ttgtttttta gggttgggtt tgaggagggt gtggggcggc gaagggacgg gagggggttg 3660

tgatttagtg gttattggcg ttgtgtagag tgtgagttgg aaatatcgta gttattttgt 3720

tagtttagtg gtgaaagttt ttttttaggt tttatttttt tgtatttttg ttttttagag 3780

ggaggggagg tttgggtttg tagagttggg agggtttgtt gttttcgttt ttttttttta 3840

taatattttt ttatttggat atttttgggt atatgtttat attggggttt ttttaggttt 3900

attgtgtttc gttgagtttt ttgtagtttt cgagtgaatg tgattttttt gtttttgttt 3960

ttttgtaatt tttttttgcg atcgtttttt taggggtttt ttttgtttta aatgtttaag 4020

tggtacgatt tagtcggttt gattattttt tagtaagttt ttatggagag aggttttgtg 4080

ttgtgtagag tttttttttt gtttgcggga tcgaggtttt tgtttttagt ttttaataga 4140

aagtgtcggg tttttagtgg gatttttggg gaagaatttt cgtgttttaa cgggagtttt 4200

gtggcgggag gggaggttag ggtttggggt tgtgttcgtt gtatagttgt tattatttgt 4260

attatgaaag ttgttagtgt tttttttttg ggtttttggg tgtaatttta tttttgtttt 4320

tatgtgtttt tatttggagt tgtttttgcg gttgtttttt aagttagttt tgtgattttg 4380

taatttagtt taagataatg ggtttattga gattattttg gtgtagtagt tggtaatttt 4440

ttggttttgg gggaaggttt tttagtttcg gggagtgggg ttttaatttg ttggtttttt 4500

gtgtttatta gttttttttt tgtgtgtttt gaatggtttt gttgggaatt ttggttttag 4560

agttattagg tggttcgagt cgataggcgt gagagagtgt gtgtgtgtat gagtgcgtat 4620

gtgtatgggg gttgatttgg ggtatggaaa ggtggttttt tttggtgttt aaggagtttg 4680

gagtatagtt ggagggtgtg ggggtgtgta tatgggagtt ggataatttt gggtggatag 4740

atagacgtgg ggaagggatg attgaaggag gtggaggaga gagtgtgatt tagtttagtt 4800

aggggtgatg tggataggta gttttcgaat tagggtagag aaaagttatt attagttagt 4860

aggggagaag ttagtatgga ggaggcggat tttgagggag agtaggaatt ggattgtaag 4920

aggaaggaga gttttttggt tagtagtagt tagtagtagt gggggaggtt ggaatgagtt 4980

ggttggagag ggggttgggg tataaggagg ggtttgtttg tgaagattat atgggttagg 5040

ttgcggaggg ttaggtatgt tcgtcgggag tgtagttggt ttacgggaag tatttggagt 5100

ggttgggaat gggcgtagga gtagcgtcgt gggagtatag gttttttttt cggggcggtt 5160

tatttggtgt tttggttttt gtaaggtagg tcgaaagggt ggggaggaaa ttgttagttt 5220

tttatagcgt tgggatggtg gttttagggt ttttgaggtt agcggatgtg ggtgtttgtt 5280

attatgtggg ttgttgaggg gcggagattt taggggttat tttaaagtag gacgagtttt 5340

gagttacggt atttttgggg gtagtttttt aatcgagtag acgtttaggt ttggaatttt 5400

gtaatagagg ttatagggtt ttgattaggg tgttttggga ggtttagaat tagtggtagt 5460

atatagggta gacggtaagt gatttggtat ggggaaagag gtaggtgttt aggtcggtat 5520

agtatattcg taaggaatag gtagacggga agtcgttcgt gggtttgtgt gtgtgttcgg 5580

agttaaaatt ttgttaatgt tttatgtttt gggtatattt attttttttt tggggagtat 5640

tttttttttt attttttttt ttttcgtttg ttttttttat ttagggtttt ttttattttt 5700

ttcgttttgg ggatcgaggg tattatggtt ttatgtttta ttatcgatga gttgtatagg 5760

gatttagttt tttcgttgtt taggtcgggt tttttaggtt tagggttttt aggaatggag 5820

agggtattag tgttttttat ggatttaaat ttttcgtatt tcgtttttgt ttttttttta 5880

agataggttt tcgagtttta aggttttagg gttttgtgga ggtcgttacg tagtagtaag 5940

gagaatgttt tgtatttggt tgatgagatt tttagagttt tattttttat ttttttattg 6000

tataaacggg tttttaggcg attgtagtat tcgttattgt tcgtaatagg gtgataagag 6060

ggatgatttt tttttttttt ttttttttgg ttggtggagg tacggggttg gcggacggta 6120

tgtgttttcg tgaatttagg ttaaatttgt tatcgtaaat acgattataa ttcgggtttt 6180

tgtgtaataa aagttttttt aagtattagt tgttggtttg ttttgtttag cggtgtttgt 6240

tgtaattaga tttgtatatc gagaaagaat ttaaaagttt ttgatgtttg ttgaaataat 6300

ttggtttagg atttacgtgt ttagatttta gagttgtgtg gtatttgagt ttttttcgag 6360

tttttattgt cgttcgagga ggatttttag atttgtgttt tggaggtaga gtaggttgtg 6420

ggacgggttt ttgggtggga aggattatgt ggatatgttt ttttgtttga gagttttaat 6480

attttcggga cgtgggagtt ggcgcgttgg taggatttag gtgttttttt tttttttaga 6540

gaaaaaggtt tcgttgtttg gtaataggtg tagatttgtt tttaattaat gttagtaggt 6600

tttttgcgtg atgaattttg ttttttagtt aagatttaag gtattttgtg aatattgttt 6660

ttttgtagtt tgagtttttg tggtgggagg taggagttat ggggagtggg ggtaggtttt 6720

ttatacgggt tttatagtta ttggtagtat tgatttgatg ttttttgagt ttagagttta 6780

gggttagata gatttattgt ttcgattacg agttggttta tttagagggg ggcggatata 6840

gtatttaggt agtagatgta ttgtgattag ttttgtagcg gggttgtggg ttttttgggt 6900

tggatgttcg ggaagaggta ggtggaggta aacgttagga tatttttgta gtgattgggt 6960

gattgtaggt tggaaatgtt ttttgtgggt tgtggttgtt taggaaggtt ttgaatgggg 7020

ttagtggata gagtttgtat ttagaggggt agtgttttgg aggagtgagg ggtatggtag 7080

tgtagggatg tttaggtcgt ttttattttg ttattggaaa gttgggcggt ttcggttttt 7140

ttagtttttt cgtttgtttt tttgtttgta aagtggggtt agaaatagtt ttttttgagg 7200

gttgttgggg gattttgaga tgtagtttat ggcgttgagt acgggttttg ttttttacgg 7260

gtgtggtggg tgtcgcggtt ggtgtggtat ttgggcggga aaagggggta tttgtaaagg 7320

ataggtaggt ttggatgttt aaatatgtag atttggggat gggaggtttt aggtaagggt 7380

ttgtgtgatg ttattgta 7398

<210> 9

<211> 1587

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

ggatgggttg tagataagag tagttgagaa ttacgtttta tttttttttt tagaaatttt 60

gaaacgaggt tttattttta ttagaagttt agattgtatt atggttattt taattttaaa 120

atgttagatg gtaagaatat ttgtttattt tttatttttt ttggaaaaag ttgtttttcg 180

ggttttatat gcgattgtag ttttttagtg tgtgaaatta ggaaaataaa atatttaacg 240

gtgtatattt ttatatttaa atagttagaa ataataggta gttaggttaa ttatttttga 300

ttagtaagat tagagttatt agggtgttta ttggtttaat aaatgaatgt ttttaggcgt 360

ttattatttg taatttttag aagttttaat ttttataaga aataaaataa gaggggtttt 420

ttgtttttaa tagtgaaaag atcgtttttt tttttttttt tattcgggtt aattttttta 480

gtcgtttttt tttgtattac gaatatacgt tgtaggaaag cgtatttata gttcgggata 540

tttttagatt ttttttttaa aattttttat tttttgtgta taggagaaat tgagagaagt 600

ttttattttt tttttaaatt ttataagtag gggagggagt tgtagtagat ttttattttc 660

gtttttaaaa gcgaatgtga aaaagttcga gaaggtacgt tttgcgagtg gaggttaaat 720

cgaaatttga atagaatgta cggttttcgt aaattacgat tgataaagaa gatattgaga 780

cgtttgcggg ggatataagt tatggttgtt tcgttttttt tttttttttg ttaattatgt 840

tttttggaga aatcgtcggt tcgatttacg tatatatttt tgtaaaatac ggataaaatt 900

ataagtagtt atttttattg tttcgtcggt tacgagggaa gttcgagttg agcggagggt 960

agattttaag ggtcgtagtt tttggtcgtg tggatcgggt ttgcggttgt agagcgcggt 1020

ttcggttgta gtaagatttg gggtagtgtt cgaggcggcg gcgagtatac gtggcgggtt 1080

ggattgtaga tcggtttttt cgcggcggag attcgcgatt tagcggattg tattagtagg 1140

aagatattaa ggttgttttt ttaggtcgtt tttagatggt ggagtttttt ttagttcgaa 1200

gattcggagt tagcgtttag attcgagttt tatttattgt ttattttcgg ggtgtagggt 1260

agaggtgtta gtgttgtaag taaatgatac ggttattttc gaattagtta ttgtgggtgc 1320

gtattcgagt gtggggatgt tcgtgtaata tttatatgga gacgttaagg aggaggaaat 1380

aaatagatta gaggttaaat gtgattgtta tttcgttatt attggttttt gtttattttt 1440

ttattgtttt taaagtaatt ttgttgtatg ttgagaggat tacggtataa ttttgtttaa 1500

aagtatatat gtatttttcg cggttatttt aaatgtattt ttgtagtagt taagaatatg 1560

tgtttggttt gtcgattttt tttttag 1587

<210> 10

<211> 3381

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ggtaaattaa tggatttttt attatttttt ttttttttgg gttgtagtag tgagttaatt 60

ggtttagatt tgtttagcgg aatgtttttt aggatatatt gagtattgta gtaagagttg 120

tatatgcgtt tagggagaat gtggatagac gttgtttgtg atttacgggt aaagggtttt 180

tttttagagg tagtagaggt agattttgtt tttggtgtgt tttggttttc gatttggagg 240

ttttttgggt taggttaaga tttttttcgg tagcgatggt ttttagttat atttaattgt 300

tttgaaggga tattttttgt ttattttttt gttcggttgt gttttttatt cggaaggttt 360

gtgttttttt cgtttgtatg ttttattttg aggaggtttt tttggttttt tatcgttttt 420

tttatgggtt tttacgtttt ttcgaattat cgcgtttaag taggagtacg ttttcggttt 480

tttttatagg gcgttttttt ttataggggt gttcgggatt tttattttgt gtttttttgg 540

tggtttttat aagtttggaa gggtaggagg cgtattttat ttttttgggt tttttttttt 600

agcgtttggc gggagtttag gttgtatttg tggaatttat gatttttttt tttttgttta 660

agttgaatat attgttggtt tttgttcggg tggagttcgg ttaattagag tgaggggttt 720

ttcgtagggc gaaggggtgc gttgttagat gtggtatttt cgttttacgg agatatacgg 780

tgttttatac gttagggaga ggtttgagac gtaaagagtc gtcgagcggg ttgcgggatt 840

gtttcgttgt tattttcgtt tgtagttatt ttttcgtacg tatttgtgtg tgtatttagg 900

ttaatatgga aggcgttatt ttaatttttg tcgtgagtag gtgggaggga agagagacga 960

gaggtatttt attggttgtt tgggaaaatg aattgtattt tttttttttt tgcggaggat 1020

taattttttt tattttttcg ggtgggtatt cgtattttgg ggtcggagtt tgaattcggg 1080

agttaagggg ttttagtttt agggacgtga agttgagcgt atagcgggcg tttttagata 1140

ttggggaaag tgttttacga tgtttcgagt ttttttagtt tcgttagcgg ggcgagcgtg 1200

agggtgtttc gatcgattag cggtttcggg tgtagggtgg cgggttcggc ggcgcgcgtt 1260

tttttttttt ttttggcggt tcgtacgtgt cgttcgcgtc gcgtttttac gggttacgcg 1320

cgggtttcgt agcgtcgcgg tcgagtcggg ttgttcggtt cgcggatata gcgtcggtcg 1380

tcgtatttcg tgcggggtcg cggcgcgatg ttgcgttgga atgaggaagc gcggcggcga 1440

ggggagggtt cgggcgcggt gcgcgcgggg gtggcggcgg cgcgtcgagc gggttcggcg 1500

cgggcgagcg ggttgtagtc ggcggcggcg ttagtaggta cggttcgtat tcgtcgtcgt 1560

ttcggcggtt tttgggggtt gagtcggagt tcggcgcgat tgtaaagttt tcgtgcgcgg 1620

tttttttggt tcggagttgc ggttgagacg cgcgtcgcgc gagtcggggg attcggcgac 1680

ggggcgggga cgggacgacg tatttttttc gtgtttcgtt ttgcgttttt ttgcgcgttt 1740

cgttttttgt atcggagtag cgattcggga ggcggtcgag aggtgcgcgc ggggtcgagt 1800

cggttgcggg gtaggtcgag tagggatcgt tagcgtgcgt tattttaaag tttgcggggt 1860

ggtagggcgc gcgttttggt tattcgtcgt tttgggcggt agttggtggt aacgtaaggg 1920

cgcggcgggg gcggtcggcg cggagggggt taggtacggg gttcgcgggc ggcgttgtgc 1980

gcgcggggta gtcggtcggt cgggagcgcg aaagtttggt ttgagtcggt tgggggcggg 2040

gagtgtggcg gagaaatggg gaataatgcg agtgagtaat tttaggaagt tattgtgaaa 2100

gaaagttggg aagagtttcg cggttaagtt agtaggatat tttaataagt gattgcgcgg 2160

ttcgcgttcg gggcggtgat tgcggtaagt tttttgggtt ttcgcgcggc gtattttagt 2220

ttgggcggga cgttcggtcg cggcgaggcg ggtaagtttg gtagggtaga gggagtttcg 2280

gtttcgaggt tgtttttcgt attcgaggat tagttttggt tttaaagcgc gacgtataaa 2340

tttacgtgag tgtttttaaa ttgaatttta ataggaaaat ttggggtaat tggtgaattt 2400

aaaaaaaaaa aaatatagta aagaaaagcg gtaaggttgg tagattttgg tgtcgtttag 2460

gttcgttttt tttttttgag gatagtgaga gagtttattt ttgttaagcg tttgttgttt 2520

tgtattgtgt tagtaggtgt aggattaggt cgatatggga tatttttgag tagtttcgtt 2580

gttattagga gaggagtttt agtttttaat tatatttaaa tttatgtaga tttatatata 2640

tttacggaag ttagttttta taaagtcgtg tgtaaagagt tttttttata tttgagtcgg 2700

gagttttttt tttatattat aaatatgatg agatcgagtt tgaatttaat ttttgtaaga 2760

gaggaattat ttcggttttg aaaagttagt ttttttgttg atcgtaggtt tgacgtttaa 2820

gttattaaat ttttttagga aaatttttag taatattaag gtattaggtt atttgcggtt 2880

atatttgaaa tgtattttaa atatttgtta agtatcgttg ttgatgttta aggaatttcg 2940

tgagggtttg tttttttttt taatttggag gtatttaatg atcgaaaatc gtagcgattt 3000

tatagggttt gattaggtat agtttttaaa tgtagttttt ttttttttag ggattgtagt 3060

ttatttagat tgaattttaa tgcggtgcgt tttgtttagg ttatttattt ataatttttt 3120

attgcgtcgt aggtagtata ttttagtttt gagatatttt gttttaaaat tttagataaa 3180

atggtgttga ggaaatgttt ttttattagt tttattaatt tttgttaaaa gaggaaaatt 3240

tatggaattt gaaaatattg cgtatgatat ttaaattttt atagatattt aaatgttttt 3300

aaggttaggt ttaatttggt tatgagtcga ggggtggggg ggatttatat agaaatgttt 3360

tgggtttttt tgagtttatt t 3381

<210> 11

<211> 3381

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

tttattattt ttggggagtt tttttggggt ttatagaaaa ttttatttta tttcggtttt 60

tttagtatcg gtgatatttt ggaattcggt ttcggttgtt cgttaaggag gatttggttt 120

gggggcggga gggtgtttta gagtttttgg gggtttatcg tattttttat tcgaggtttt 180

tcgcgagcgg agtcgttttt ttaggtcgtt cgtttttttg tcgtaggagt aggttcgcgt 240

tcgtcgttcg agagttttcg gtagagggag atattttagc ggttttttcg atttggtagc 300

ggtcgggtcg ggagtgggtg ggggtgatgg ggggtgggga gaaaaggggg agtggggaga 360

ggggaggtgt gtgaaggggg ggttcggggg gcgggttttt gtgtcgttga cgtttcgagt 420

agtgttggga agtataggtt gtgttgttac gtcggtgtta gtttgatgaa gattggtatt 480

aggtaagttg ttatttattt ttatgttaga gacgtttttg taggcggcgg cggcggcgcg 540

gcggcggttg ttgttgcggg cggttgtttt agagcgcgtg tgttttattt tagtttttaa 600

gttagagtat tatttattgc gatagggtaa ggaggagaga gggagagagg gaggtagtag 660

ggaggagaga gagggaggta gtagggagga gggaggtagg gagtagcgag ggacggcggg 720

agcgtgtaga gagaagttgg ggaagcgtcg ggagagcgcg gagcggagta gcgcgagggg 780

cggcgaggtc gggtacggag gttgcgagag tttcgcgggt cgttcgtttt tttgttcggt 840

tagcgtttag tttcgtcgtc gtcgtcgtcg tcgtttcgtc gcgtttgggt tcgtggtcgg 900

tcgcgtattg ttttcgggtg taaggagtcg ggttgcggat tcgaatcgtc gcgggtttaa 960

tttcgtagcg ggcgggcggg gagttgtgcg ttaggagcgt taggggattc gagaatagga 1020

ataggtacgt cggttcgagt tcgggtgtag aaggttttcg gtcgggcgtt tcgcggggag 1080

aggttgggaa tcgcgggtag gttttaggtt tttttttttt cggtttcggg cgtttttggg 1140

gtcggcgttt atttcgcgtt attagtttgg agatgttttt tagcggttgg aggcgggagc 1200

ggttttaggt tggggttagg tgatcggagg agtcgaggag tcgcggtcgc ggtttgggga 1260

ggtagggcga atgagggttt gtagacggat tagtggagat aggggaatat cggcggggtt 1320

cgggaagtta ggattcgagg ggttatacgt acggattttt atttagggag gagcgagaat 1380

gtgtagggtt atcggttttt tatgattgtt ggggattttt ggtgaggcgg gcgtaggggt 1440

tcgcgcgagg tttgggaatc gggagttttt ttggttcgag aattagggga tgagttcgta 1500

aaagagggaa ttgaaagcga tcgagagcgg agagttgagg gggatggcgt aggatttcga 1560

atttgtcgtt taaagtttgt atttttttcg ggttaggaga cgggtttttt tggttttcga 1620

tttttaggaa gaaacgagcg aaatgggtcg ttttttttcg gggtttttta cgggggagtc 1680

gggggttttc gcgcggtggg gagattcggg ttgggaattg aggggtaggg gtttgtggat 1740

cggtttgaat tagggttggg ttttaggatt agtttagagt tcggtttata ggatttagat 1800

tgtttacgga atcgggatcg aggggtcgat aagtagttta tacgtcggtt agagtagagg 1860

gttggaggtc ggagttgggg gttggaggaa cgggtggcgt ttttaggatt tagtaatagg 1920

attatagttt ttttttgtgg tggaagttat tggaatttgg ggagggtagt acgaggggtt 1980

ttgtagtttc gcgtgtgaaa aagcgtttag gtaggcgatg aaagtagttg atttgagtta 2040

tggtaggcga gtttcgaatt tttgttgttt ttttttgaaa gtgttttttt aggaggagag 2100

gatttgggtt atataggatt cggttttaag agagcgattt cgggaagcgg atagatcgaa 2160

gagatttttt gggcgaagcg gtagggtagt ttcgcggggt tgggagtgga tttgaggttt 2220

cgatttaggc ggttcggagt gttttaggag ttatttgggt ttgcgggcgt agcgcggcgg 2280

ggcgggagcg gtggttcgta ggggtcgcgg tttgcgatga aggtcggggg gtagcgttag 2340

tagcgaggtg ttatagtggg tcgaggagtt tgggttgtgg tttagggtag gatcggttta 2400

aattttagtg ttttgattgg agtcgttttt tgtgtttatt cgcgtcggat tgagaagttt 2460

ataaattcgg tttttggtgc gttcggggga ggaggaagtt tggagtgttt tattgttatt 2520

ttttttgttc ggagatttta ggatattagt ttttcgggtt ttaaatgttt tataatcggt 2580

ggtagttaaa agtttcgtat tttaggtagt ttagacgatt tttttcgttt taaatttgag 2640

aatgatggtg tttaaatata atacggtgta ttatttaaag tttttgtttt tgtttttttg 2700

ttttttttgt cgttttggtt ttcggaggtt ttaggatttt ggtggaagcg gggagggagg 2760

gtttcgtttt tggttttata attttttatt cgggttgtat ttttatagtt tgggtttagt 2820

tgtggggtgt ggggtgggaa ggggtttcga ttagggaggt aggttatttt ttgggtattt 2880

agagaaagag tgtgtgtggg gggtgggagc gggggggagg agggtattga ggggaggaag 2940

atttgagatt tttttttttt aatattaaat ttattatttt agttttttgt atttttggta 3000

gggagagtta gatagttttt ataggatacg gaagacgtac gatttacgat ttacgagtgg 3060

tttcggcggt tcggggcgcg gcgattgtcg tcgcggagtt ttaaggttgt tgttttgtag 3120

gtttggaatt cgtgagagtt ttttttcgtt gagagttcga ggggggaggg agtcgtgatt 3180

ttacggagat tttttggtta tcgttttttt tttgtgagcg ggaaaggttt gaaagttaag 3240

agaaagagag gttgtttaga ataaggggta gggggttatc ggagggagat gggttcgatt 3300

atcgtttata gtaaaatgtt tcgtgcgaat tgtattgaag tatatttaat ttgagattgg 3360

ttgttttatg attttttttg g 3381

<210> 12

<211> 1958

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

atgttgggtt acgttgaaaa tttgtggttg agagttggat tttcgttatc gttacgtatt 60

ttgttaatga gatagggtaa tttatggtta ttgagtttcg attagttaag gggtagagag 120

ttttcgtttt ttattgtttt ataaaagaga tttagtaaag ggattttatt agtttttagt 180

ttttagtttg cgcgagggtg taggaaggaa agtttaggat tttcggagta gagtatagta 240

gttgtagagg taaggttagt atgtcgttta attttaaatt ttagtgttat tttattttta 300

tttttttgac ggttttaaga ggggaaagtc ggtatttaga ggtgagttat ttttggattg 360

atttatttta ttttttttgc gtgttagttt taggcggtag gtaggttgtt tttgttcgta 420

gttttttggg gttcgttgtt tttttttttt ttgttggatg ttgttttgtt tttggttttt 480

tttattttgt tttttttttt tgtttttgag tattttagat tgtttgtttg tttttttttg 540

gtcgttgggg atattttggt ttgatggaga gggtttaaga ttttttcgtt tttttcggat 600

acgggaaaat attatttttt tttttttatt cgttatgttg agtggtaggg agggtgtttc 660

gtttttggtt ttttttttta tttttagttt ttgaattttt tcggattgat ttatgttttt 720

tgttagttga gggaagcggc ggattacgat ttttttttgt tttttagcgt taatttgaag 780

cgggagttgg ttggggagta gtcgtatcgt cgcgttttgc gtgagtcgag gttgttcggt 840

tcgcgggcgt tcgggacgcg gggaaggtgg gattttgtgc ggggggtaga gggttcgcgg 900

atatttcggg gaaggggttg gtcggaatcg ttaggggcgc ggttttttta gttaaggatc 960

ggttcgcgga ggcgcgttag gagcgggaga gggtggcgcg ttcggggcgt aggaatttag 1020

cgtagtttag gttggaagtc ggggcgttgg gtattataga gttcgggaat ggggcgcgcg 1080

gagagcggtc gttcgaggac ggcgttgcgg cggttgtagt tcgggattta ttgttttatg 1140

tttttttttt ttagggtgtt tggatatgtt gagtttttag ggttagttta tttttatcgt 1200

cgatcggtcg tagttgtatt gcgtagtttt ttttattagc gagttcgagg agtttattat 1260

tatttattac gattaggttt ttatcgattg ttagggcggc gattttttga aggtgaggcg 1320

tttacggtta gttaatttag tcggagggcg gtacgggagg gttggaaagg gttggggcgt 1380

tgtatttagc gtggggttgt tgagcgtagg tagttagtgg tattttttag atatttcgtt 1440

ggtgttcgag tcggagaggc gcgttcgagg atttttatac ggcgagaatt tcgtttttat 1500

tcgaagattt cgatttatat atatttagtg gggttggggt cggtgttttt ggacgttgtt 1560

atggtttaaa tttttttttg ggcgttttcg aggttttagg aatttttaaa gatttgaatt 1620

cgtagcgcgg aattttgacg taatttaggg tcgaggaaaa atgattaaaa tttaataagt 1680

tcgagtgttg gggtttatta agcgggtcgt tttggttaga aggttcgttt tatacgtttt 1740

atatttgagt tcgtttcgtt tttgttggtt tacgttcggt agagtcgttt cgagagtata 1800

gaggttgttt ttagtgcgcg ggtgattcga ttttggagta gtaggggatt ggttgtcgag 1860

ggggtattta gattgagata ggtgggaggg taggataaga tttttaagtt tattgttttt 1920

tcgattttag tcgttagatt ttataagtat aatagggt 1958

<210> 13

<211> 4899

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

gaggtagttt tgggaggtat tggtttgaag ggttagattt ttggtaagaa tttttggaag 60

aacgtttgtt tttcggaatt agatagggag gcgtgtaacg gggtggggtg gggggtattt 120

ttagttgtag gtatttttat ttttaattat ttgtaagagg atatatatat atatatattt 180

tgggtgttag agaagttttt ttttttttgt attttttttt ttttaagttt ttgaaattta 240

gaagtgtttg tttttaggcg ttagttttgt tgagtggatg tggggatgga ggttattgga 300

ggtttagggt tggtttgttg tttttgtttt ttgttaggag tattgtgaag gttttgtagg 360

gttagttttg ggaaatttta ggtttggttt tatttgattt ttttattgga gcgaggcgtg 420

tagttaagtt tgtttagatt tttttaggtt acgggttcgc ggtagtttag tttagtattt 480

gtaggcgggg ggatcgcgcg tttggttcga agatttcgtt ttgggtaggg gatagaaaat 540

atgaaattag atggggagtt atgaataatt gttttttttt tttttttgtc gtgttttttg 600

aattcgtacg ttatgtagga ggggggcggg ggcgggggcg cggggaggag gagggggtcg 660

tttgttatta atttgggaat aagcggttaa tttcggtgat tggtattttc gttttttttt 720

ttttattttt tttagtgtgg ggaaagtagt taagttcgcg cggagcgatt gtgaggggtt 780

ttgttggaat ttggtagcgc ggaggtttgg agagaagttt tatgttggtt tttatttagt 840

cggttcgttt ttttcgagtt ttggaagttt tatttagtcg tgtatttaat ggttttataa 900

agttgattat aagttttagc gtatttttga aggagttaaa agcgacgtag gtgtaaacga 960

gtcgagggag ttttttattt cggtgataga atgggataag ttgggaaagg tttagattat 1020

ataagtttaa ggtttattag gtcgtagaaa gtttgttttg ggaatcgggg gttattattc 1080

gttttattta gcggggttcg gggattttgg gggtcgagcg aggttagttc gggcgggagt 1140

atcgtcgtta gcgcgcgtcg gcgatagggg ggaatttcgt tgggcgttgc ggttaggtcg 1200

gggtttaggg cgttgggttg tgcgtttgta taaatttgtg tttcggcggg tcggtgttaa 1260

ttttagtggg gatacgggag aaagagtacg ttagtaggtt acgcggcgcg tgggtagtgc 1320

gtaatttttg tcggcgttta ggttgtacgg ttacgtttta gtcggtgttt ttaggttatg 1380

gatatttagt tttagggtcg ttttgcgttt ttttttttta gtttattttt tttattggtt 1440

tttttttttg ttcgagtggt agcgcggttt cgtagggagc gatttcggga gggatagtga 1500

tcgtacgcgt ggagtgggga cggcggggta taggacggta gtttaagagt gttcgtatgg 1560

tcgaggacgt tttcgttgcg agtttggggt cgaggggtag ttttttttcg gagttattaa 1620

tttcgttttt tcgtgtttag ggattagtaa tttggtgttg cgggcgttag aaagaaaagg 1680

gtagcgtttc gcggagcgcg cgggggaaga gggattgcgg tagcgggacg cgagggcggg 1740

aggggcgtag tagcggggag tcggagcgta gcggagggga gcgttggggg gcggggagcg 1800

ttcgggtagt tattttgttt tcgtttggag tttcgcgttg cgtttaggag ggcgtaatac 1860

gtagttttcg cgggggttag agttcggagt tttttagtgt atgttttttt ttttcgcgtt 1920

ttgtcgaggt ttcggttttg tttgtcgtgt tttgggtttg gttgtgttcg ggggttttcg 1980

cgggtagggc gcggggtagg tagggcgcgc gcgtcgacgt ttttttgttt gataattaat 2040

ttgagttaat gcgattttta tgtaaagtta atagcggata attgtttatt ttttcgttaa 2100

tagtttttat tataattatt tatttggaaa tttgcggttg gattaatcgt tatattttcg 2160

agatgagcgt cgttgtaatt cgtagcgaac gcgggtaggg atttggagac gtttttcggg 2220

cgttggcggg gtcggtgtgg gttagtttcg ttatcgtttg agacgcggtg tgtttaggtg 2280

ttggtgttcg cgggagaggg ttgtggggcg ttttttttag gatttgtttg atttgttttt 2340

cgttcgagtg ggtggtgcgc gggtgcggga ggcggaggga ggaggagggg tgaggggagg 2400

agggtttgtg gggttgcgga ttcggagtag tttgggtgga gcgcggtttc gggaggtttt 2460

gggtgtatcg cggcggggtt tgggggggtt taggcgtcgg aggagtcgtc ggtgtcggaa 2520

tgtagcgtgt tttatttggg agaaacgttg ttttcggttt tttgtttttt ttttgttgtt 2580

tcggtttttt tggtttcgtt tttcgtttta tttattcgtt tttattttag gttttttttt 2640

taggattttt tttttaagga tttaggtttt tgaaaattat tggtaatagt tatacgtttt 2700

acgattgaaa tttataagag aagagtttta gttttgtagg tcgttttagg gttaggggta 2760

gagatggtgg taggtggtgc gttaattttt tagggaagag gaatttgtat tataaagatt 2820

tgtttttttg agttgaagtt aaaacggggg cgttaagcgc gtttcgtttg gcggcggtgg 2880

aggggtcgcg cgttcgcgtt gttttagtcg gagttgtttt ggttggtgat tggaggttta 2940

acgttcggaa tttaggcgtt tttgtagttt agatttgtcg gttaaggggt tttagttgta 3000

attttttaaa atggtgtttt tggaaaataa taaatttaga tttaattggt gatagttttt 3060

ggttatagag aatgaaattg tttttttttg gcggtggaat ttttaaattt cgaagagtga 3120

aagaatataa tgaaataaaa tgttataaga ttattggatt ttttagaaaa aggaagattt 3180

taaattattt ttaaaatgag gttttgtaaa tttttgttaa aaatttttaa atttcgaatt 3240

tttttttata atatttgatg agtgttttaa gagtaaacga gtaaatttta tttcgagaat 3300

taataaattt aagttttggt taaggttttt ttcgcgtttt tttttcgtga tttggggaat 3360

gtttcgtttt atcgtttatt tggtttttgt tatttcgttt attttgaagt gattcgtgga 3420

taatgttgtt ttttgtcgta gtttcgtcgg ttatttaggt agaacggggt atgtaaatgg 3480

tttggagagg tcgaggtcga atattgcgtt tattgtttcg ggcgtttaaa gcgtcgagta 3540

gttgcgtaga ttttttgggt tcggattttc ggtcgttacg ttaatgttat tattgtaaaa 3600

tattagattt tgagaattat gtagtttgaa tttattagta gttttttcgg cgaaggtttt 3660

ttttttcgtg ataagtttta aagtttagat tttttttaac gttggtaggg gtaggaagag 3720

gaggaggggt ttagggaggg gggtttttcg taagtggggt ttcgggggat ttttgttttt 3780

tttttggtgt atttcgtaat tttaaaagtt ttttttgggg ttttgagcgc ggatgtttga 3840

tttgaatgat ttgagatttg gatatatttt cgtttttttt taagagttgt tttaatgttg 3900

cgagtttaaa tttattgaaa gaggtttaga tattaagtcg agtgaatttt atagatatta 3960

ttttttgttt taatgatcgc ggtagtgatc gtttttgaag ttatattttt tagggtgaat 4020

ttataataat gtatgttaga gaggttgcgc gttttaaagt aaaatagtta aaatattagg 4080

ttacgttttt taaattgtag gattgtaagt agtttataaa tttttagttt ttattttaag 4140

gtgaggagag ttttagtgat ttgaggattt gtttgtattt tcgtttttta cgttcggttt 4200

tttattcgta tttgtttaag tggtttcgtt tttttagaat ttgaatggtg gggaggggtg 4260

tttttgatgt ttcgggtgta gggcgggtat tagcgagcga gatttaaggg cgttagaatt 4320

taggagcgta aattatcgtt agggtttgag ggacgtagag gcgggtggag tagtgttttt 4380

tagattcgtg ggaggtcgta ggcgttagta gaggtaattt tttttttttg agtaatgtta 4440

gtttttttta ggtttaggat ttttattaac gtgttttttt atttttttat aggattttaa 4500

gttgttgttt tttttttgtc gtatttgagg ttgggaaaat tttttaggag aaggtaagag 4560

aaagttatta gattagagtc gaggattaaa ttttaaggtc gaagacggta gaggggtagg 4620

tttttttttg tatattttaa ggtttttttt gtattcgcga ggtttttttt gagcgtttag 4680

gttttcgaaa tgtttgtttt ttttttgata aaaggagggg gtaggatgtg aaggggtagt 4740

gtaattaata atgtttttgt aaatataata atagggaaat atatggagga aatttattta 4800

ttgggtgtgt tatttttggt ggggggcggg attgaaagtg gcgttattta gatttaggaa 4860

aaagttacgg ggtgggcggg gtaagcgggg gatttttgg 4899

<210> 14

<211> 1206

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

gagagtagta tttatttttt tttattattt ttgaattgcg agataaagaa ttttaatttt 60

ggggttagaa tttaatttgt ttttgagaat atcgaatatt attaagtaac gttagtacgg 120

atataatagt agtgtgaggt ttgtatatac gtagttgaaa tggtaaattt aaaataggag 180

atattgtgtg tacgtatagt gtgtgtatat agtattaaga tattttttgt ttttggagtt 240

ttttttgttt tgttaaattt tacgtttttt ttggaaaggg ggagcgaatt ttttaagttg 300

tgaggatatt ttttttttat ttagttatat tttttttcgg gttagttttt ggtgaaattt 360

gggcgatgtg gagttattgg gggatgtgag tgagggcgtt tttgtttatt ttaatttagg 420

tttttgggag agtttttagg atcgttttgg gatttagagg aggtttcgtt ttgggtcggg 480

agttgaggtt tttcggataa acgttaagta gtttttattt atcggtgttt aataggtttt 540

atataaagtg ttaaagtgtt ttagtaaggt tttattagta tttgggtcgt agttgttttt 600

tggtttttgg ggttcgcgga gttttagatg tatttgtagt ttttttcgag ttttgtaagt 660

tatttttgtt tttttttttt cgtttatttt tcggtttttt tatttttttt gttatttcgg 720

ggaaggttac gtagggtgta attcggacgc gttttcgggg gaagttcgcg acgtagtagt 780

tatattttta gtttgtattg gcgtttattt tatgatttcg ttttcgcggt cgcgggtagg 840

gagcgcgcgt ttttatcggt tgattagaag cgggagtcgg aggagttttc gttcgtcggc 900

ggttagcgta tagttcggtt aggggcgttt tttttgtcgt cgtcggtttt ttgatcgttc 960

gcggttcgcg gttcgtagat tatagttagc gttgtgttgg gtaggtggcg gtagcggggc 1020

gcggcgcgtt taggcgtacg ggttttcggg tcgcggcgcg tttttcgtta cgtcgtatat 1080

taaggttcgg tcggtcggcg ggcgttttta ttagtagttt gaaattataa tattatgtta 1140

aagaataaag ttgtttttcg gaaaaatatg tgttgtatat ttgataaaga taaattggat 1200

tattta 1206

<210> 15

<211> 7398

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

ctaaaaccga taaactctaa acacaatcac gaaaacatac gcactttcta actactctcc 60

taccattatc ccttaaattc ccattttaat aaaacgtaca ccctaacgac gctccccaaa 120

aaactaaata tatttactac actatacgta aaaataaaaa atatacaatt aactaaccct 180

atactaatct aataaaactc cataccaacc ctaaaaaaaa acaattacat aaatatatcc 240

acactcacca aatacttttt aaaaaaacac tcgaaaataa tactataact taaaataact 300

attataccga acccgacatc ttcccaaaaa aactatatta ttaaactaaa tttcttaaat 360

actaaacccc caaatcccca aatacgacgt aaacaaataa cccaataaaa actaaactat 420

ccgataaacc caaatactaa aattcaaaca aaacataccc taacctaacg taaaaaatac 480

gaaatactat taataacaac aataactaca tttctaaaac ccgaactccc aaaccgacga 540

aaatatacac gcatctaaaa tatctataat tttacaattc ccatatccac aaactcactt 600

aattaaaaat aattcaaaat atccaaaaca taaaaaaaaa aatacctact tttcttaaaa 660

aaaaaaaact taatttcatc tacttaaaaa accacccaaa cctaaaacat tttccgcaaa 720

aaacccccta ccccccgcct ctccaaaata actaaaaaat ctcaacactc ctacacattt 780

aaaatatttc aaaaaaaata aaaaaaaaca aataaacaac gaacgacctc aaacccaaaa 840

taaactatca aacgctcccc gaccacacat tcaaaaaacc gaaatacaat tataacgtta 900

cgacctacta cttcgaaaat aaaaatatta ttccatacta taaattctca cataacccct 960

aactctaaac aaaaaccgaa aatctaaaaa acgaaataac aaaaaaaaca tacaaaaata 1020

aatttctaac tttccaaaac gaataaaaaa aacgcctctc tctcttataa ataacaaacc 1080

taaaaaaccc ttcttaaaaa taaaaaccta ttacttctca aattctatat ctaacccaaa 1140

tccccaaatc taccccaacc cctcgaccct acctacctta taaataatat aatttaaaaa 1200

taaaaaccgc taacctaaaa aaaaaactaa acctcaaatt aaaacccaaa aaaaaaaaaa 1260

aaacccttaa aacaactccc tttctactca ctcactacct aactccttcc ttcacacctt 1320

ccttcgaaaa cgtctactcc taacaaaatc tacttcctac tctcaaaaaa cccttattat 1380

aaaaaaaaaa aaacgtcgcc cgtccctaac ttctctaaca accgtattcc atccccgccc 1440

tatacccctt ctcccgaaca ataccttctc caaaactcac ccaaaaaaat acaacgataa 1500

cccccgaaac gataatcgta ataaaaatat taactacaaa aataccctcg ataaataaaa 1560

attaataacc tctcgctaat accataaaac tcgcatattc gccctacgcc cctcgactct 1620

taaacccaca aaccgaaatc ctacctacca accgcgtacg ctaccgttta acccttacaa 1680

acgcaaaacg cgcgacgacg ataacaaaaa actttattta actacccaaa tacaacctcc 1740

tacaaaaaaa ccctacgccc gaaaaaaaaa aaaaatctct tcccctctaa acgcccgccc 1800

tcctcgccat aacccgacct ccacatccgc ccacatctaa ccgcaacgaa acgcccgaaa 1860

aaaaaaacta aaaccgcgtc tctcgccgtc ccctaaacgc gaaccaaacg aaaaaaaaaa 1920

aaacgctccg atcgtatacc caaaactatc ccccaacgac cactcgaacc ccaacccccc 1980

aaacctaacc ttaacaaacg aacgaaacaa ccaatacgaa acaaaaaaac cgatacgaat 2040

acgaaaacct aatccgcccg aaaaacgaaa acgaaacgaa aacgcaacgc gcgaaaaaaa 2100

accgacgccc gccttcctcc cccattcatt caactaaacc aaaaaaccta aaaactcctc 2160

cgacgactaa ctctacacta caaaaacgcg aacgcgacgc cccaaccaac gcgcaaaacc 2220

cgaaccccgc cgaaaacgct tcctcgccgc taccctccgc gcgacccgct acccaccaac 2280

catcatatcg aaccccgcga tcaacgcgca actaaataaa atcatttcga acttcgaaaa 2340

taaatactaa actaactact acgaccgcga acgtactaaa aaaaacccta cgaataaacc 2400

taacgcgaaa cgaaaatacg ctaaaaaaaa acgaaaatac gctaaaaaaa aacgaaaccc 2460

ctaatccaaa cgccctcccg ctaaaaacgc cgcgcgcccc cgaccccgta cccgcgccgc 2520

ctacgtaaaa aaccctatta aaaacacccg cgtaaaccct acgcgccctc acaaaaccct 2580

atactcgttc tacgcactac cgcctaaatt tccttccttt tattattatt tatatttacc 2640

aaacgacaac gacctcctcg aaaactcgcg aaactacctc gaaactctcc aaaacgcaca 2700

atttcactct aaaaaatcca tcgatcccct ccctttaact ctccccgacg actctcgaac 2760

cccgcttaaa cccgacaacg aaataaaaaa atcgttcctc acctccgact aaataaacaa 2820

ccgcgtccta ctcgaataaa caaccctccc ctcccccacg ccaatttcga aaccgccaaa 2880

ttatacaacc cgtaaaccga aaacaccgaa cgaacacaac ccaaatcgta acaaaatcta 2940

aaataaaata tcccataacc cccatccaaa cctaaaaata tcctcatccg cctcccaaaa 3000

tcgaaccgta aaaaacaaaa aaaacctacg tacgaacaaa aaaaatattt taactctctc 3060

ctatcttcga aatttacaaa atatattaaa acttacgaaa ctactctatc caaacctaaa 3120

tctaacgtcc gcgtctctaa acctataaat acgtacgctt tcctacgtcc tcttaactac 3180

cgatactaaa actctacgtc ctacgtccgc gaaaataaat acaacaaacg aaaaaaaaac 3240

tcacacaata atctccaacg ctctaaaaca aaacttctaa aaaacgaacc tacctctacc 3300

gaaacctaaa acccccgccc ctcgaaaaaa ctcctaaact aacttaaaca aaaccctcta 3360

ataaaccgaa aaaaaaaaaa actatattaa aataaacaaa ctatccaaat atcaaaccaa 3420

actaaaaaat aaccaaccta aaatcctccc cgctccataa ccaaaaccaa aactaacatc 3480

taaatatcct aaacccaact acccacacga cccacctaaa atcaacccta tctaaataaa 3540

aaaaacgaaa cctcctaaaa aaccaaaact ttaactaaac gccaaacaaa ataccaataa 3600

ctattcttca aaactaaacc taaaaaaaat ataaaacgac gaaaaaacga aaaaaaatta 3660

taatccaata accactaacg ctatacaaaa tataaactaa aaacatcgta attactttat 3720

caacttaata ataaaaaccc tttttcaaac tctatccctt tacatcccta cttcccaaaa 3780

aaaaaaaaaa tctaaatcta caaaactaaa aaaacttact attcccgccc ccctccccca 3840

caacacctcc tcatctaaac atctttaaac acatactcat actaaaatct ccctaaatcc 3900

actatattcc gttaaacctc ctacaatccc cgaataaata taacctccct acccctacct 3960

ctttacaact cctccctacg accgctcctc caaaaacctt ccttatccca aatatccaaa 4020

taacacgact taaccgatct aaccactttc caataaaccc ttataaaaaa aaaccctata 4080

ttatacaaaa ctctcctcct acctacgaaa tcgaaatctc tactctcaat tcctaacaaa 4140

aaatatcgaa cccccaataa aatttctaaa aaaaaactct cgtatctcaa cgaaaaccct 4200

ataacgaaaa aaaaaaccaa aatttaaaat tatattcgtt atacaactat caccatttac 4260

actataaaaa ttattaatac cccttcctta aatctctaaa tataactcca cccttacccc 4320

catatacctc catctaaaac tacttctacg actatctccc aaaccaattt tataacccta 4380

taatttaatc caaaacaata aactcattaa aaccatccta atacaacaat taacaatcct 4440

ttaactctaa aaaaaaattt ctcaatctcg aaaaataaaa cctcaatcta ctaattccct 4500

atatttatca atctccccct tatatatcct aaataatttt actaaaaatt ctaatcttaa 4560

aaccatcaaa taacccgaat cgataaacgt aaaaaaatat atatatacat aaatacgcat 4620

atacataaaa actaacctaa aatataaaaa aataaccctc cctaataccc aaaaaaccta 4680

aaatataatt aaaaaatata aaaatatata tataaaaatt aaacaacctt aaataaacaa 4740

acaaacgtaa aaaaaaaata attaaaaaaa ataaaaaaaa aaatataatt caacccaacc 4800

aaaaataata taaacaaaca acttccgaat caaaataaaa aaaaatcacc actaactaac 4860

aaaaaaaaaa tcaatataaa aaaaacgaac cttaaaaaaa aataaaaatt aaattacaaa 4920

aaaaaaaaaa accttctaac caacaacaac caacaacaat aaaaaaaact aaaataaact 4980

aactaaaaaa aaaactaaaa cataaaaaaa aacctaccta taaaaatcat ataaaccaaa 5040

ctacgaaaaa ccaaacatac ccgccgaaaa tacaactaat ccacgaaaaa catctaaaat 5100

aactaaaaat aaacgcaaaa acaacgccgt aaaaacacaa atctctttcc cgaaacgact 5160

cacctaatat cttaattcct acaaaataaa ccgaaaaaat aaaaaaaaaa ctaccaactc 5220

cttacaacgc taaaataata accccaaaat tcctaaaacc aacgaatata aatacctatc 5280

accatataaa ttactaaaaa acgaaaactc caaaaaccac cccaaaacaa aacgaactct 5340

aaaccacgac atctctaaaa acaattttcc aatcgaacaa acgtctaaac ctaaaatcct 5400

ataacaaaaa ccacaaaacc ctaatcaaaa tattctaaaa aacttaaaac taataacaat 5460

atacaaaata aacgacaaat aacctaacat aaaaaaaaaa acaaataccc aaaccgacac 5520

aacacacccg taaaaaacaa ataaacgaaa aaccgtccgt aaacctatat atatactcga 5580

aattaaaatt ctaccaatat cccatatcct aaacacatct accccctccc taaaaaacac 5640

ctttctcttc accttttcct tccccgccta tccccttcac ccaaaacctt ccccatccct 5700

cccgtcttaa aaaccgaaaa caccataact ttatattcca tcaccgataa attacacaaa 5760

aattcaatcc ttccgctatt caaaccgaat ccttcaaact caaaattccc aaaaataaaa 5820

aaaatatcaa tatcttccat aaactcaaac ttcccgcatc ccgcctttac tcccccttca 5880

aaataaatct ccgaacttca aaattttaaa actctataaa aaccgccacg taacaacaaa 5940

aaaaatattt tatatttaac taataaaatt tttaaaatct cattttctac ttttccacta 6000

tacaaacgaa cctccaaacg actacaacac ccgccactac ccgtaataaa ataacaaaaa 6060

aaataaccct ttcctctttc tcccttctaa ttaataaaaa cacgaaacta acgaacgaca 6120

tatactttcg taaattcaaa ccaaatctat tatcgcaaac acgattacaa ctcgaatctt 6180

tatataacaa aaacctttcc aaataccaac tattaaccta ctttactcaa cgatatttac 6240

tataaccaaa tttacacacc gaaaaaaaat ccaaaaatcc ttaatattta ttaaaacaat 6300

ctaacccaaa acccacgtac tcaaatccca aaactatata acatctaaac ttctcccgaa 6360

cccccactat cgcccgaaaa aaacccccaa atctatattc taaaaacaaa acaaactata 6420

aaacgaactt ctaaataaaa aaaaccatat aaatatacct tcttatctaa aaatcccaac 6480

acctccgaaa cgtaaaaact aacgcgctaa caaaattcaa atacctcttt cctctctaaa 6540

aaaaaaaacc ccgttactta ataataaata caaacctatc cctaattaat accaataaac 6600

ctcttacgta ataaacccta cctttcaacc aaaactcaaa acatcctata aatactacct 6660

ctctacaatt taaactttta taataaaaaa caaaaaccat aaaaaataaa aacaaacctc 6720

ttacacgaat cccacaacca ctaacaacac taacttaata ctctttaaat tcaaaaccca 6780

aaaccaaaca aacccactat cccgactacg aattaattca tttaaaaaaa aacgaacaca 6840

acacccaaac aacaaataca ctataatcaa ccttacaacg aaactataaa ttctctaaac 6900

taaatatccg aaaaaaaaca aataaaaata aacgccaaaa cacccctaca ataactaaat 6960

aactacaaac taaaaatact ttctataaac tataactatc caaaaaaatt ttaaataaaa 7020

ctaataaaca aaatttacat ccaaaaaaac aatactttaa aaaaataaaa aatataacaa 7080

tataaaaata cccaaaccgc cctcactcta ccattaaaaa actaaacgac ttcgatttct 7140

tcaatttctt cgcctatttc cctacctaca aaataaaatt aaaaacaact ctctttaaaa 7200

attactaaaa aactctaaaa tacaacccat aacgctaaac acgaatccta cctcctacga 7260

atataataaa tatcgcgact aatataacat ctaaacgaaa aaaaaaaaca tttacaaaaa 7320

acaaataaat ttaaatactt aaatatacaa atctaaaaat aaaaaatctc aaacaaaaac 7380

ctatataata ccactata 7398

<210> 16

<211> 1587

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

aaataaatta taaataaaaa caattaaaaa ccacgcttca tctccctcct taaaaactct 60

aaaacgaaac tttattccta ccaaaaattc aaattacatt ataatcatct caattccaaa 120

atattaaata acaaaaatat ctacccatcc ttcactttcc ttaaaaaaaa ttactcttcg 180

aattttatat acgattacaa ttttccaata tataaaacta aaaaaacaaa acactcaacg 240

atatacatcc ctacacctaa ataatcaaaa ataataaaca actaaactaa ttatccttaa 300

ttaacaaaat caaaaccatt aaaatactca ctaatttaac aaataaatac ccttaaacgt 360

ctatcattta taactcctaa aaactttaat ttccacaaaa aacaaaataa aaaaaacctt 420

ctacttttaa caataaaaaa atcgttctcc ctcccctctc cacccgaatc aactcttcca 480

accgctccct cctacatcac gaacacacgc tacaaaaaaa cgcatttaca acccgaaaca 540

tccccaaacc tcctctccaa aattccccac ctcctataca taaaaaaaac taaaaaaaac 600

cctcacttcc tttccaaact tcacaaacaa aaaaaaaaac tataacaaac tttcacctcc 660

gttcccaaaa acgaatataa aaaaatccga aaaaacacgt cctacgaata aaaattaaac 720

cgaaatctaa acaaaataca cgatccccgc aaactacgat taataaaaaa aatactaaaa 780

cgtttacgaa aaatataaac cataattatc tcgccttcct cccctcccta ccaactatat 840

ttcttaaaaa aatcgccgat tcgattcacg cacacatttt tataaaacac gaacaaaacc 900

ataaataatt accttcatta ttccgtcgac cacgaaaaaa actcgaacta aacgaaaaac 960

aaatcccaaa aatcgtaacc cctaaccgta taaaccgaat ctacgactac aaaacgcgat 1020

cccgactaca acaaaaccta aaacaatacc cgaaacgacg acgaatacac gtaacgaact 1080

aaattacaaa ccgaccctct cgcgacgaaa actcgcgacc taacgaatta catcaacaaa 1140

aaaacactaa aactactccc ccaaaccgcc cccaaataat aaaatctctc ccaacccgaa 1200

aattcgaaac caacgcccaa acccgaacct cactcactac tcactcccga aatacaaaac 1260

aaaaatacca atattacaaa caaataacac gattaccccc gaatcaacca ctataaatac 1320

gtatccgaat ataaaaatac ccgtataaca tttatataaa aacgtcaaaa aaaaaaaaat 1380

aaacaaatca aaaatcaaat ataattacca ttccgtcatc actaactcct acccacctcc 1440

ctactatccc caaaataact ttactacata ctaaaaaaac cacgacacaa tcctacccaa 1500

aaatatacat atatcccccg cgactacttt aaatatactt ttacaataat caaaaacata 1560

tacctaattt accgatctct ttcccaa 1587

<210> 17

<211> 3381

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

aataaatcaa taaacctttc actaccttcc ccttctctaa actataacaa taaattaact 60

aactcaaact tacccaacga aatacccttc aaaacacact aaatactata ataaaaacta 120

catatacgct caaaaaaaat ataaataaac gctatttata attcacgaat aaaaaacctt 180

ctcccaaaaa caacaaaaac aaatcctatc tctaatatac cctaaccccc gacttaaaaa 240

cctcctaaac caaaccaaaa ccttccccga caacgataat ctccaaccac actcaactac 300

cctaaaaaaa catttcctac ttattccctt acccgactat atcctccacc cgaaaaacct 360

ataccttctt cgcctacata tcctacccta aaaaaactcc cttaatcttt catcgctctc 420

cctataaatc ttcacgcctt cccgaaccac cgcgcccaaa caaaaacacg ttctcgaccc 480

tcttcacaaa acgctcctcc tcacaaaaat acccgaaatt tttattctat accttcctaa 540

taactcctac aaatctaaaa aaacaaaaaa cgcatctcac tcctctaaat cccctcccct 600

aacgcctaac gaaaacccaa actacattta taaaattcat aactttttct ctcctactca 660

aactaaacac attactaact cctactcgaa taaaacccga ctaattaaaa taaaaaactc 720

cccgtaaaac gaaaaaatac gctatcaaat ataacattcc cgttttacga aaacacacga 780

tatcttacac gccaaaaaaa aatctaaaac gcaaaaaacc gtcgaacgaa ctacgaaatt 840

acttcgctat cacctccgcc tacaaccacc cttccgcacg cacttatata tacacccaaa 900

ccaacataaa aaacgccatc ctaacttcta ccgtaaacaa ataaaaaaaa aaaaaaacga 960

aaaatattcc attaattatc taaaaaaata aattacacct tcccctccct tacgaaaaat 1020

caacttttcc caccccctcg aataaacact cgcatcctaa aaccgaaacc taaacccgaa 1080

aaccaaaaaa ccccaattcc aaaaacgtaa aactaaacgt acaacgaacg ctcccaaaca 1140

ctaaaaaaaa tactttacga tatcccgaat ccctccaatc tcgccaacga aacgaacgta 1200

aaaatacccc gaccgaccaa cgaccccgaa tacaaaataa cgaacccgac gacgcgcgtc 1260

cccctccccc tcctaacgac ccgcacgtat cgcccgcgcc gcgcccccac gaattacgcg 1320

cgaatcccgc aacgccgcga ccgaaccgaa ctacccgacc cgcgaacaca acgccgaccg 1380

ccgcatcccg tacgaaaccg cgacgcgata ctacgctaaa ataaaaaaac gcgacgacga 1440

aaaaaaaacc cgaacgcgat acgcgcgaaa ataacgacga cgcgccgaac gaacccgacg 1500

cgaacgaacg aactacaacc gacgacgacg ccaacaaata cgacccgcac ccgccgccgc 1560

cccgacgacc tttaaaaact aaaccgaaac ccgacgcgat tacaaaattt tcgtacgcga 1620

cccctctaac ccgaaattac gactaaaacg cgcgccgcgc gaaccgaaaa actcgacgac 1680

gaaacgaaaa cgaaacgacg caccctctcc gtatcccgct ctacgccctt ctacgcgccc 1740

cgctccctat accgaaacaa cgatccgaaa aacgaccgaa aaatacgcgc gaaaccgaac 1800

cgactacgaa acaaatcgaa caaaaaccgc caacgtacgt caccccaaaa tttacgaaat 1860

aacaaaacgc gcgctctaac cacccgccgc tctaaacgac aactaataac aacgcaaaaa 1920

cgcgacgaaa acgaccgacg cgaaaaaaac caaatacgaa acccgcgaac gacgctatac 1980

gcgcgaaaca accgatcgac cgaaaacgcg aaaacctaat ctaaaccgac taaaaacgaa 2040

aaatataacg aaaaaataaa aaacaatacg aataaacaac ttcaaaaaat cattataaaa 2100

aaaaactaaa aaaaactccg cgaccaaatt aacaaaacac tctaacaaat aactacgcga 2160

cccgcgcccg aaacgataac tacgacaaac cccctaaatc cccgcgcgac gcatcccaac 2220

ctaaacgaaa cgctcgaccg cgacgaaacg aacaaaccta acaaaacaaa aaaaaccccg 2280

actccgaaat tactcttcgc acccgaaaat caatcttaac cccaaaacgc gacgcacaaa 2340

tccacgtaaa tattttcaaa ttaaatttca ataaaaaaac ttaaaataac taataaattt 2400

aaaaaaaaaa aaacacaata aaaaaaaacg ataaaattaa taaaccctaa tatcgctcaa 2460

atccgcctct cttttctaaa aacaataaaa aaattcactt ctatcaaacg tctattactc 2520

tacactatac caacaaatac aaaaccaaac cgacataaaa cacttctaaa caaccccgct 2580

atcaccaaaa aaaaaattct aactcccaac catatttaaa tttatataaa cctacatata 2640

cccacgaaaa tcaaccttta taaaatcgta tataaaaaat tttccttata tttaaaccga 2700

aaactttctt tttatactat aaatataata aaatcgaatc taaacttaat ttctacaaaa 2760

aaaaaattat cccgacttta aaaaattaat ccttttacta accgcaaatt taacgctcaa 2820

atcaccaaac cttctcaaaa aaacccttaa taatattaaa acatcaaatt acttacgatt 2880

atatttaaaa tatattttaa atatttatca aacatcgcta ctaataccta aaaaacctcg 2940

taaaaactta tttttccttc taatttaaaa acatctaata accgaaaacc gtaacgattc 3000

cataaaatct aaccaaacac aactttcaaa tacaacttcc ctctctctaa aaactacaac 3060

ccacccaaac taaatttcaa tacgatacgc tttacttaaa ttacccactc acaatttccc 3120

actacgccgc aaacaatata tttcaacttt aaaatacctt attttaaaat tccaaacaaa 3180

ataatattaa aaaaatatct ccttactaat cccatcaact tctattaaaa aaaaaaaatt 3240

tataaaattt aaaaatacta cgtataatat ttaaactttc ataaacattc aaatactttt 3300

aaaaccaaat tcaatttaat tataaatcga aaaataaaaa aaacccacat aaaaatatcc 3360

taaatcctct taaatttatt t 3381

<210> 18

<211> 3381

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

ttcatcattt ctaaaaaatt ctcttaaaat ccacaaaaaa tctcacctca tctcgatccc 60

ctcaacaccg ataatatctt aaaactcgac cccgattatt cgctaaaaaa aacttaactt 120

aaaaacgaaa aaatactcca aaattcctaa aaatccaccg cactccccat ccgaaactcc 180

tcgcgaacga aaccgcttct ccaaaccgcc cgcctcccta ccgcaaaaac aaacccgcgc 240

ccgccgcccg aaaacctccg ataaaaaaaa acactccaac gactcctccg acttaacaac 300

gaccgaaccg aaaataaata aaaataataa aaaataaaaa aaaaaaaaaa aataaaaaaa 360

aaaaaaatat ataaaaaaaa aatccgaaaa acgaatccct ataccgctaa cgtcccgaac 420

aatactaaaa aatataaact atattatcac gccgatatca atctaataaa aattaacatc 480

aaataaacta tcattcattt ccatatcaaa aacgctttta caaacgacga cgacgacgcg 540

acgacgacta ctactacgaa cgactacctc aaaacgcgta tattttattc caatccccaa 600

accaaaatat tattcattac gacaaaacaa aaaaaaaaaa aaaaaaaaaa aaaacaacaa 660

aaaaaaaaaa aaaaaaaaca acaaaaaaaa aaaaaacaaa aaacaacgaa aaacgacgaa 720

aacgtacaaa aaaaaactaa aaaaacgccg aaaaaacgcg aaacgaaaca acgcgaaaaa 780

cgacgaaacc gaacacgaaa actacgaaaa ccccgcgaac cgcccgctcc cctacccgac 840

caacgctcaa ccccgccgcc gccgccgccg ccgcctcgcc gcgcttaaac ccgtaaccga 900

ccgcgcatta tcctcgaata caaaaaaccg aactacgaac tcgaatcgcc gcgaacccaa 960

ccccgtaacg aacgaacgaa aaactatacg ccaaaaacgc caaaaaaccc gaaaataaaa 1020

acaaacacgc cgacccgaac ccgaatacaa aaaactcccg accgaacgct ccgcgaaaaa 1080

aaactaaaaa ccgcgaacaa actccaaatt ctctttctcc cgacttcgaa cgtccttaaa 1140

accgacgctt actccgcgcc accaacctaa aaatactttc caacgactaa aaacgaaaac 1200

gatcccaaac taaaaccaaa taaccgaaaa aatcgaaaaa ccgcgaccgc gacctaaaaa 1260

aacaaaacga ataaaaattt acaaacgaat caataaaaac aaaaaaacac cgacgaaacc 1320

cgaaaaacca aaatccgaaa aactacacgc acgaaccctc acccaaaaaa aaacgaaaat 1380

atataaaatc accgactttc cataattact aaaaatcttt aataaaacga acgtaaaaac 1440

ccgcgcgaaa cttaaaaatc gaaaaccctt ctaactcgaa aactaaaaaa taaattcgta 1500

aaaaaaaaaa ctaaaaacga tcgaaaacga aaaactaaaa aaaataacgc aaaatcccga 1560

atctaccgct caaaatttac atttctttcg aattaaaaaa cgaactttcc taactcccga 1620

tccccaaaaa aaaacgaacg aaataaaccg tcctttcccg aaactcttca cgaaaaaacc 1680

gaaaatttcc gcgcgataaa aaaactcgaa ttaaaaatta aaaaataaaa acttataaat 1740

cgacctaaat taaaactaaa ttttaaaacc aatctaaaat tcgatttata aaatccaaac 1800

tatttacgaa atcgaaatcg aaaaaccgat aaataattta cacgccgacc aaaacaaaaa 1860

actaaaaatc gaaattaaaa actaaaaaaa cgaataacgt ttttaaaatt caataacaaa 1920

atcacaactt tttcttataa taaaaactat taaaatttaa aaaaaataac acgaaaaatc 1980

ctacaactcc gcgtataaaa aaacgtttaa ataaacgata aaaataatta atctaaacca 2040

taacaaacga accccgaatt tttactactt ccccctaaaa atatttcttt aaaaaaaaaa 2100

aacttaaacc acacaaaacc cgatcctaaa aaaacgattc cgaaaaacga acaaatcgaa 2160

aaaaccttct aaacgaaacg acaaaacaac ctcgcgaaac taaaaataaa tctaaaatcc 2220

cgacccaaac gactcgaaat actccaaaaa ccacctaaat ctacgaacgc aacgcgacga 2280

aacgaaaacg ataacccgca aaaaccgcga cctacgataa aaaccgaaaa acaacgctaa 2340

caacgaaata ccacaataaa ccgaaaaatc taaactataa cccaaaataa aaccgactca 2400

aactccaata ccctaattaa aaccgcttcc tatacttacc cgcgccgaac taaaaaaccc 2460

acaaacccga cctttaatac gcccgaaaaa aaaaaaaact taaaataccc tactatcatc 2520

tctcctatcc gaaaacttca aaatattaac ttttcgaatt tcaaatactc tataaccgat 2580

aacaaccaaa aacttcgcat tttaaacaat ttaaacgatc ctccccgccc caaatctaaa 2640

aataataata ttcaaacata acacgatata ttacccaaaa cccctaccct taccctccta 2700

ctctctctac cgttctaacc ttcgaaaacc ccaaaacctt aataaaaacg aaaaaaaaaa 2760

atcccgtttc taatctcata atctcccact cgaactacat ccccataact taaacctaac 2820

tataaaatat aaaataaaaa aaaatcccga ccaaaaaaat aaattattct ctaaacatct 2880

aaaaaaaaaa tatatataaa aaataaaaac gaaaaaaaaa aaaacattaa aaaaaaaaaa 2940

atttaaaatt tcctcctctt aatattaaac ccaccatccc aaccccctac acccctaaca 3000

aaaaaaacca aacaaccctt acaaaacacg aaaaacgcac gacccacgac ccacgaataa 3060

cctcgacgac ccgaaacgcg acgactaccg ccgcgaaact ccaaaactat tattttataa 3120

acttaaaatt cgtaaaaact ctctcccgct aaaaacccga aaaaaaaaaa aaccgtaacc 3180

ccacgaaaac tccctaatca ccgcctcccc tttataaacg aaaaaaactt aaaaaccaaa 3240

aaaaaaaaaa actactcaaa ataaaaaaca aaaaattacc gaaaaaaaat aaacccgacc 3300

accgctcaca ataaaatacc tcgtacgaat tacactaaaa tatacccaac ttaaaactaa 3360

ctattttata atcctctcta a 3381

<210> 19

<211> 1958

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

atactaaacc acgctaaaaa tttataacta aaaactaaac cctcgtcatc gccacgtact 60

ctatcaataa aacaaaataa cccataatta ctaaactccg atcaattaaa aaacaaaaaa 120

cctccgctcc ccactactct ataaaaaaaa cccaacaaaa aaaccctacc aacttctaac 180

tctcaatcta cgcgaaaata taaaaaaaaa aacccaaaac ctccgaaaca aaacacaaca 240

actacaaaaa caaaaccaac atatcgccca acttcaaact tcaatatcac ttcattctca 300

tcttcctaac gactctaaaa aaaaaaaacc gatacctaaa aataaaccac ccctaaacta 360

acccatctca ccttccttac gtattaaccc taaacgacaa acaaactacc tctactcgca 420

accttttaaa attcgctatt tcttccctct ctactaaata ctatcttacc cctaatttcc 480

cctatcctat tctccctcct tacctctaaa catcccaaac tacctaccta ccttcctcta 540

accgctaaaa ataccctaac ctaataaaaa aaatctaaaa ccttcccgtc ttctccgaac 600

acgaaaaaac attacccctc tctctttatt cgctatacta aataacaaaa aaaatacccc 660

gctcctaatc ccctttttta tccccaaccc ttaaactttt ccgaactaac ctatatttct 720

taccaactaa aaaaaacgac gaactacgat cctttcctac tcttcaacgc caacctaaaa 780

cgaaaactaa ctaaaaaaca accgtaccgc cgcgctctac gtaaatcgaa actacccgac 840

tcgcgaacgc ccgaaacgcg aaaaaaataa aactctatac gaaaaacaaa aaactcgcga 900

acatctcgaa aaaaaaacta accgaaaccg ccaaaaacgc gatcccctta actaaaaatc 960

gatccgcgaa aacgcgccaa aaacgaaaaa aaataacgcg cccgaaacgc aaaaacccaa 1020

cgcaacctaa actaaaaatc gaaacgctaa acactacaaa acccgaaaat aaaacgcgcg 1080

aaaaacgacc gcccgaaaac gacgctacga cgactacaac ccgaaactta ttaccccata 1140

ccctcctccc ccaaaatacc taaacatact aaacctccaa aaccaattca ccttcaccgc 1200

cgaccgaccg caactacact acgcaacctt cttcatcaac gaacccgaaa aattcattac 1260

catccactac gaccaaatct ccatcgacta tcaaaacgac gacttcctaa aaataaaacg 1320

cccacgacca accaacctaa ccgaaaaacg acacgaaaaa attaaaaaaa actaaaacgc 1380

tacacccaac gtaaaactac taaacgtaaa taaccaataa cacttcttaa acacttcgct 1440

aatacccgaa tcgaaaaaac gcgttcgaaa acccccacac gacgaaaatc tcgcccttac 1500

ccgaaaacct cgacccacac acatccaata aaactaaaac cgatacctct aaacgctacc 1560

ataatttaaa ttcccttcta aacgctttcg aaaccctaaa aacttctaaa aacttaaact 1620

cgcaacgcga aactctaacg caatccaaaa ccgaaaaaaa ataattaaaa cccaacaaac 1680

tcgaatacta aaatccacca aacgaaccgt cttaattaaa aaacccgccc cacacgtctc 1740

acatctaaac ccgcctcgct cctactaatc cacgctcgac aaaaccgttc cgaaaacaca 1800

aaaactatct tcaatacgcg aataacccga ttttaaaaca ataaaaaact aactaccgaa 1860

aaaacatcta aattaaaata aataaaaaaa caaaacaaaa cccctaaact cactacctcc 1920

tcgattccaa tcgtcaaact ccataaatat aacaaaac 1958

<210> 20

<211> 4899

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

aaaacaaccc taaaaaacac taatctaaaa aactaaaccc ttaataaaaa cctctaaaaa 60

aacgcctatc ttccgaaacc aaacaaaaaa acgtacaacg aaataaaata aaaaatactc 120

ccaactacaa acacctctac tcctaactat ctacaaaaaa acacacacac acacacaccc 180

taaatatcaa aaaaatcctc ccttccctat acctcctcct tcccaaaccc ctaaaatcca 240

aaaataccta tttccaaacg ccaaccctac taaataaata taaaaataaa aatcactaaa 300

aacccaaaac taatttatta tttttatttc ctattaaaaa tactataaaa actttacaaa 360

actaatttta aaaaatctta aatttaactt catctaactc ctctactaaa acgaaacgta 420

caaccaaacc tacttaaacc tccccaaacc acgaacccgc gacaacccaa ctcaacacct 480

acaaacgaaa aaaccgcgcg cttaactcga aaaccccgcc ctaaacaaaa aacaaaaaat 540

ataaaatcaa ataaaaaatt ataaataact atcctcccct cccctctacc gtatttccta 600

aatccgtacg ctatacaaaa aaaaaacgaa aacgaaaacg cgaaaaaaaa aaaaaaaccg 660

tttaccatta atctaaaaac aaacgactaa cctcgataac taatattttc gcttttcttt 720

tctcactttt ctcaatataa aaaaaacaat caaacccgcg cgaaacgatt ataaaaaact 780

ctactaaaat ttaacaacgc gaaaacttaa aaaaaaaccc catactaact cccattcaac 840

cgacccgttt tcctcgaact ttaaaaattt cactcaaccg tacactcaat aacttcacaa 900

aactaattac aaacttcaac gcattcctaa aaaaaccaaa aacgacgcaa atacaaacga 960

accgaaaaaa ccccttatcc cgataacaaa ataaaacaaa ctaaaaaaaa cttaaaccac 1020

acaaatccaa aactcaccaa accgcaaaaa acctacctta aaaaccgaaa atcattatcc 1080

gccctattca acgaaacccg aaaaccctaa aaaccgaacg aaaccaaccc gaacgaaaac 1140

accgccgcca acgcgcgccg acgacaaaaa aaaaccccgc taaacgctac gaccaaaccg 1200

aaactcaaaa cgctaaacta tacgtttaca caaatctata ttccgacgaa ccgatatcaa 1260

ccctaataaa aacacgaaaa aaaaaacacg ccaataaacc acgcgacgcg taaacaatac 1320

gcaacttcta tcgacgtcca aactatacga ccacgtttca accgataccc ccaaaccata 1380

aacacccaac tccaaaatcg ctctacgccc tttctcccca acccaccttt cccattaatc 1440

ccctctccta tccgaataac aacgcgaccc cgcaaaaaac gaccccgaaa aaaacaataa 1500

ccgcacgcgt aaaataaaaa cgacgaaaca caaaacgata atctaaaaat attcgcataa 1560

ccgaaaacgc tttcgctacg aatttaaaat cgaaaaacaa ttccctcccg aaatcattaa 1620

cttcgtctcc tcgtactcaa aaaccaacaa cttaatacta cgaacgccaa aaaaaaaaaa 1680

ataacgcctc gcgaaacgcg cgaaaaaaaa aaaactacga caacgaaacg cgaaaacgaa 1740

aaaaacgcaa caacgaaaaa ccgaaacgca acgaaaaaaa acgctaaaaa acgaaaaacg 1800

ctcgaacaac caccctatcc ccgtctaaaa ccccgcgcta cgtctaaaaa aacgcaacac 1860

gcaatccccg cgaaaaccaa aactcgaaac cccctaatac ataccccctc tcctcgcgcc 1920

ctaccgaaac ctcgacccta cctaccgtac cctaaaccta attatacccg aaaatccccg 1980

cgaacaaaac gcgaaacaaa caaaacgcgc gcgccgacgc tcttttatct aataactaat 2040

ttaaattaat acgatcttta tataaaacta acaacgaata attatctatt ttctcgccaa 2100

caatctccat cacaatcact tatctaaaaa cctacgatta aattaatcgt tatattcccg 2160

aaataaacgt cgctacaatc cgcaacgaac gcgaataaaa acctaaaaac gcctcccgaa 2220

cgctaacgaa accgatataa accaactccg ctaccgccta aaacgcgata tacccaaata 2280

ttaatacccg cgaaaaaaaa ctataaaacg ccttccccaa aatttactta acttactttt 2340

cgctcgaata aataatacgc gaatacgaaa aacgaaaaaa aaaaaaaaaa taaaaaaaaa 2400

aaaacctata aaactacgaa cccgaaacaa cctaaataaa acgcgacctc gaaaaaccct 2460

aaatacatcg cgacgaaacc taaaaaaacc caaacgccga aaaaaccgtc gataccgaaa 2520

tacaacgtat ttcacttaaa aaaaacgtta ccctcgatcc cttacctccc tcctattatc 2580

tcgatttttc taacttcgtc cttcgtccca cccacccgtt cccacctcaa atccctcccc 2640

caaaatcccc tccttaaaaa tccaaatctc taaaaattat taacaacaat tacacgcccc 2700

acgattaaaa tccacaaaaa aaaaatccca attctacaaa ccgctccaaa actaaaaata 2760

aaaataataa caaataatac gtcaactctc taaaaaaaaa aaacttacat tacaaaaact 2820

tatctttcta aactaaaatc aaaacgaaaa cgtcaaacgc gctccgttta acgacgataa 2880

aaaaaccgcg cgcccgcgct atcccaaccg aaactaccct aactaataat taaaaattta 2940

acgtccgaaa ttcaaacgct tctacaactc aaatttaccg accaaaaaac ctcaattaca 3000

acttttcaaa ataatatttc taaaaaataa caaattcaaa ctcaactaat aacaactttt 3060

aactataaaa aataaaacta cttcccttta acgataaaac tcttaaactt cgaaaaataa 3120

aaaaatacaa taaaataaaa taccataaaa tcactaaatt tttcaaaaaa aaaaaaaccc 3180

caaattactc ccaaaataaa actttataaa ttcttattaa aaatctttaa atctcgaatt 3240

tccccctaca acatctaata aatactttaa aaacaaacga acaaatccca cctcgaaaat 3300

caacaaaccc aaactctaac caaaactctc cccgcgtttt cttctcgtaa cctaaaaaat 3360

atcccgcccc atcgctcacc taactcttat catctcgctc atcttaaaat aacccgtaaa 3420

caatactact ccctaccgca actccgccga tcactcaaac aaaacgaaat atacaaataa 3480

cctaaaaaaa ccgaaaccga acactacgcc cattatcccg aacgctcaaa acgccgaaca 3540

actacgcaaa ctttctaaac tcgaaccctc gaccgccacg ctaatatcat cattacaaaa 3600

catcaaattt taaaaactat acaatctaaa ttcattaaca accttctcga cgaaaattct 3660

tttccccgta acaaatttca aaatccaaac cccctccaac gttaataaaa ataaaaaaaa 3720

aaaaaaaaac ccaaaaaaaa aaatctttcg caaataaaac ctcgaaaaat ccctactctc 3780

cttctaatac attccgcaac tttaaaaacc ttccttaaaa ttctaaacgc gaatatctaa 3840

cttaaataac ctaaaattta aacatattcc cgttttctcc caaaaattac tttaatatta 3900

cgaatttaaa ttcactaaaa aaaacccaaa taccaaatcg aataaatttc ataaacatca 3960

tcttctattt taataatcgc gacaataatc gtttctaaaa tcataccctt taaaataaac 4020

tcacaacaat acatatcaaa aaaactacgc gccctaaaac aaaacaatta aaacatcaaa 4080

ccacgctcct caaactacaa aattacaaac aactcacaaa cttccaatcc ccaccccaaa 4140

ataaaaaaaa tctcaataac ttaaaaacct acttacactc ccgctttcca cgcccgatcc 4200

cctacccgca cctacccaaa taatctcgtt cctctaaaat ctaaataata aaaaaaaata 4260

ctcctaatac cccgaataca aaacgaacac caacgaacga aacccaaaaa cgctaaaacc 4320

caaaaacgca aaccaccgtt aaaacctaaa aaacgcaaaa acgaataaaa taatatttct 4380

caaattcgta aaaaaccgca aacgccaaca aaaacaattt tcctccccta aacaatacta 4440

attctcctca aacccaaaat ctccactaac gtatccttcc acctcctcac aaaactccaa 4500

actactatcc cctctctacc gcatctaaaa ctaaaaaaac ttcctaaaaa aaaacaaaaa 4560

aaaaccacca aaccaaaacc gaaaactaaa ctttaaaatc gaaaacgaca aaaaaacaaa 4620

ttctccccta cacaccccaa aacctctcct acacccgcga aaccttcctt aaacgcccaa 4680

acccccgaaa tacctaccct ccttctaaca aaaaaaaaaa ataaaatata aaaaaataat 4740

acaaccaaca atatttttat aaacacaaca acaaaaaaat acataaaaaa aatctattta 4800

ttaaatatat catttttaat aaaaaacgaa attaaaaata acgccatcta aacccaaaaa 4860

aaaactacga aataaacgaa ataaacgaaa aactcttaa 4899

<210> 21

<211> 1206

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

aaaaacaaca ctcatttctt cttatcattt ctaaactacg aaacaaaaaa ctttaatttt 60

aaaactaaaa tttaatttat ttttaaaaat accgaatatt accaaacaac gccaacacga 120

atataataat aatataaaat ttacacacac gcaactaaaa taataaattt aaaataaaaa 180

acactatata cacgtataat atatacatac aatatcaaaa cattctttac tcctaaaatt 240

ttctctactt taccaaactt cacgcccctt ttaaaaaaaa aaaacgaatt ttccaaatta 300

taaaaatact tttcctccat ccaaccacac cctcttccga accaatcttt aataaaacct 360

aaacgatata aaatcactaa aaaatataaa taaaaacgtt tttactcatc ttaacccaaa 420

tctctaaaaa aacctttaaa atcgctctaa aacttaaaaa aaattccgtc ctaaaccgaa 480

aactaaaact ctccgaacaa acgctaaaca actctcactt atcgatatcc aataaacctt 540

atataaaata ccaaaatacc ccaacaaaac tttaccaaca cctaaaccgt aattatctcc 600

taactcctaa aatccgcgaa actctaaata tacctacaac tcctcccgaa tcctacaaac 660

cacccttatc cctcttctcc cgctcacccc ccgacccccc catctctttt actattccga 720

aaaaaaccac gcaaaataca acccgaacgc gcccccgaaa aaaacccgcg acgcaacaac 780

cacaccccca acctacacta acgcccaccc cataacttcg ccttcgcgat cgcgaacaaa 840

aaacgcgcgt ttccatcgat taattaaaaa cgaaaatcga aaaaaccccc gcccgccgac 900

gaccaacgca caacccgacc aaaaacgccc tccctaccgc cgccgaccct ttaatcgccc 960

gcgacccgcg acccgcaaac cacaaccaac gctatactaa acaaataacg acaacgaaac 1020

gcgacgcgct caaacgcacg aatccccgaa ccgcgacgcg ctccccgcca cgccgcacat 1080

caaaacccga ccgaccgacg aacgccttca ttaacaacct aaaattataa tattatatta 1140

aaaaacaaaa ctactccccg aaaaaatata tactacatat ctaacaaaaa taaattaaat 1200

tattca 1206

<210> 22

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

gtagttggat gggattattt 20

<210> 23

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

cacccgcaaa atcctct 17

<210> 24

<211> 15

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

tacgtggcgg gttgg 15

<210> 25

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

aaaaaaacaa ccttaatatc ttc 23

<210> 26

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

gtttttttgg ttcggagttg 20

<210> 27

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

caaaacgaaa cacgaaaaaa ata 23

<210> 28

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

gttttaggag ttatttgggt ttgc 24

<210> 29

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

actataacac ctcgctacta acgct 25

<210> 30

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

ggggcgcggt tttttta 17

<210> 31

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

ctaaactacg ctaaattcct 20

<210> 32

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

atacgggaga aagagtacgt ta 22

<210> 33

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

aacgtaaccg tacaacctaa acg 23

<210> 34

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

ttatttcggg gaaggttacg 20

<210> 35

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

gcgaaaacga aatcataaaa taaac 25

<210> 36

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

ttgttgcggt cgcggacg 18

<210> 37

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

tcggtttttt cgcggcg 17

<210> 38

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

cgccccgtcg ccgaat 16

<210> 39

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

cggtggttcg taggggtcgc g 21

<210> 40

<211> 15

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

cgtagcgcgg cgggg 15

<210> 41

<211> 14

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

cgcgttcggg gcgt 14

<210> 42

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

ggttacgcgg cgcgtgg 17

<210> 43

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

tcggacgcgt tttcggg 17

<210> 44

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

gtgatggagg aggtttagta agtt 24

<210> 45

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

ccaataaaac ctactcctcc cttaa 25

<210> 46

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

accaccaccc aacacacaat aacaaacaca 30

Claims

1.一种用于诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的试剂盒，其包含：

2.如权利要求1所述的试剂盒，其特征在于，所述目标标记物包含或是：

b)亚硫酸氢盐转化后的a)的对应区域；或

c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。

3.如权利要求1或2所述的试剂盒，其特征在于，所述第一引物池中包括用于扩增所述组(I)中的至少2个或全部3个目标标记物的引物对；和/或所述第一引物池中包括用于扩增所述组(II)中的至少2个、至少3个或全部4个目标标记物的引物对。

4.如权利要求3所述的试剂盒，其特征在于，

所述第一引物池中包括用于扩增所述组(I)中的Septin9与BCAT1，BCAT1与IKZF1，或Septin9与IKZF1引物对；或所述第一引物池中包括用于扩增所述组(I)中的Septin9、BCAT1与IKZF1的引物对；和/或

所述第一引物池中包括用于扩增组(II)中的PKNOX2与CRHBP，PKNOX2与SOX1，PKNOX2与基因间隔区A，CRHBP与基因间隔区A，或SOX1与基因间隔区A的引物对；或所述第一引物池中包括用于扩增组(II)中的PKNOX2、CRHBP和SOX1，PKNOX2、CRHBP和基因间隔区A，PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A的引物对。

5.如权利要求3所述的试剂盒，其特征在于，所述第一引物池中包括用于扩增Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A的引物对。

6.如权利要求1所述的试剂盒，其特征在于，用于扩增Septin9的引物对为SEQ ID NO:22/23；用于扩增BCAT1的引物对为SEQ ID NO:24/25；用于扩增IKZF1的引物对为SEQ IDNO:26/27；用于扩增PKNOX2的引物对为SEQ ID NO:28/29；用于扩增CRHBP的引物对为SEQID NO:30/31；用于扩增SOX1的引物对为SEQ ID NO:32/33；用于扩增基因间隔区A的引物对为SEQ ID NO:34/35。

7.如权利要求1所述的试剂盒，其特征在于，所述第一引物池包含以下引物对，或由以下引物对组成：SEQ ID NO:22/23、24/25、26/27、28/29、30/31、32/33和34/35。

8.如权利要求1所述的试剂盒，其特征在于，所述第二试剂包含第二引物池，所述第二引物池包含多个定量引物对，所述定量引物对被设计为用于扩增被所述第一引物池预扩增的所述目标序列内的至少一部分，能够与被所述第一引物池预扩增的所述目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。

9.如权利要求8所述的试剂盒，其特征在于，所述第二引物池中的定量引物对和所述第一引物池中的引物对相同。

10.如权利要求8或9所述的试剂盒，其特征在于，所述第一引物池和所述第二引物池被包装在单一容器内或被包装在独立容器内。

11.如权利要求1所述的试剂盒，其特征在于，所述试剂盒进一步包含一个或多个封闭寡核苷酸。

12.如权利要求1所述的试剂盒，其特征在于，所述试剂盒进一步包含检测试剂。

13.如权利要求12所述的试剂盒，其特征在于，所述检测试剂选自下组：荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。

14.如权利要求13所述的试剂盒，其特征在于，所述探针至少包括选自下组的一条或多条核苷酸序列：SEQ ID NO:36-43。

15.如权利要求14所述的试剂盒，其特征在于，所述探针包括SEQ ID NO:36-38中所示的至少一条、至少两条或全部三条核苷酸序列，和SEQ ID NO:39或40以及41-43中所示的至少一条、至少两条或至少三条核苷酸序列。

16.如权利要求15所述的试剂盒，其特征在于，所述探针包括：SEQ ID NO:36-38和41-43所示的核苷酸序列，以及SEQ ID NO:39和/或40所示的核苷酸序列。

17.如权利要求13所述的试剂盒，其特征在于，所述荧光探针的5’端标记有荧光染料，3’端标记有猝灭剂；优选地，所述荧光染料选自FAM、HEX/VIC、TAMRA、Texas Red或Cy5，所述淬灭剂选自BHQ1、BHQ2、BHQ3、DABCYL、TAMRA或lowa Black Dark Quenchers。

18.如权利要求1所述的试剂盒，其特征在于，所述试剂盒进一步包含DNA聚合酶和/或一个适合存放从所述个体中获取的所述生物样品的容器。

19.如权利要求1所述的试剂盒，其特征在于，所述第一试剂包括亚硫酸氢盐试剂或甲基化敏感限制酶。

20.如权利要求19所述的试剂盒，其特征在于，

所述亚硫酸氢盐试剂选自下组：亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子，及其任意组合；

所述MSRE选自下组：HpaII酶、SalI酶、

21.如权利要求1所述的试剂盒，其特征在于，所述第一引物池和所述第二试剂包含的第二引物池进一步包含用于扩增对照标记物的引物对。

22.如权利要求21所述的试剂盒，其特征在于，所述对照标记物选自下组：ACTB、GAPDH、微管蛋白、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。

23.用于定量分析目标标记物的甲基化水平的试剂在制造试剂盒中的用途，所述试剂盒用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法中；其中，所述目标标记物包括下组(I)中的至少一种目标标记物和下组(II)中的至少一种目标标记物：(I)Septin9、BCAT1和IKZF1，(II)PKNOX2、CRHBP、SOX1和基因间隔区A。

24.如权利要求23所述的用途，其特征在于，所述目标标记物包括：所述组(I)中的至少2个或全部3个目标标记物，和所述组(II)中的至少2个、至少3个或全部4个目标标记物。

25.如权利要求23所述的用途，其特征在于，所述目标标记物为Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A。

26.如权利要求23-25中任一项所述的用途，其特征在于，所述试剂包括扩增引物对，用于扩增所述目标标记物的引物对。

27.如权利要求27所述的用途，其特征在于，所述扩增引物对包括用于扩增：

所述组(I)中的Septin9与BCAT1，BCAT1与IKZF1，或Septin9与IKZF1引物对；或

所述组(I)的Septin9、BCAT1和IKZF1的引物对。

28.如权利要求23所述的用途，其特征在于，所述扩增引物对包括用于扩增：

所述组(II)中的PKNOX2与CRHBP，PKNOX2与SOX1，PKNOX2与基因间隔区A，CRHBP与基因间隔区A，或SOX1与基因间隔区A的引物对；

所述组(II)中的PKNOX2、CRHBP和SOX1，PKNOX2、CRHBP和基因间隔区A，PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A的引物对；或

所述组(II)中的PKNOX2、CRHBP、SOX1和基因间隔区A的引物对。

29.如权利要求26-28中任一项所述的用途，其特征在于，用于扩增Septin9的引物对为SEQ ID NO:22/23；用于扩增BCAT1的引物对为SEQ ID NO:24/25；用于扩增IKZF1的引物对为SEQ ID NO:26/27；用于扩增PKNOX2的引物对为SEQ ID NO:28/29；用于扩增CRHBP的引物对为SEQ ID NO:30/31；用于扩增SOX1的引物对为SEQ ID NO:32/33；用于扩增基因间隔区A的引物对为SEQ ID NO:34/35。

30.如权利要求23所述的用途，其特征在于，所述试剂还包括定量引物对，所述定量引物对被设计为用于扩增已被预扩增的所述目标序列内的至少一部分，能够与被所述第一引物池预扩增的所述目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。

31.如权利要求30所述的用途，其特征在于，所述定量引物对与权利要求28或29所述的引物对相同。

32.如权利要求23所述的用途，其特征在于，所述试剂进一步包含一个或多个封闭寡核苷酸。

33.如权利要求23所述的用途，其特征在于，所述试剂进一步包含检测试剂。

34.如权利要求33所述的用途，其特征在于，所述检测试剂选自下组：荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。

35.如权利要求34所述的用途，其特征在于，所述探针至少包括选自下组的一条或多条核苷酸序列：SEQ ID NO:36-43。

36.如权利要求35所述的用途，其特征在于，所述探针包括SEQ ID NO:36-38中所示的至少一条、至少两条或全部三条核苷酸序列，和SEQ ID NO:39或40以及41-43中所示的至少一条、至少两条或至少三条核苷酸序列。

37.如权利要求35所述的用途，其特征在于，所述探针包括：SEQ ID NO:36-38和41-43所示的核苷酸序列，以及SEQ ID NO:39和/或40所示的核苷酸序列。

38.如权利要求34所述的用途，其特征在于，所述荧光探针的5’端标记有荧光染料，3’端标记有猝灭剂；优选地，所述荧光染料选自FAM、HEX/VIC、TAMRA、Texas Red或Cy5，所述淬灭剂选自BHQ1、BHQ2、BHQ3、DABCYL、TAMRA或lowa Black Dark Quenchers。

39.如权利要求23所述的用途，其特征在于，所述试剂还包括亚硫酸氢盐试剂或甲基化敏感限制酶。

40.如权利要求39所述的用途，其特征在于，

所述MSRE选自下组：HpaII酶、SalI酶、

41.如权利要求23所述的用途，其特征在于，所述试剂包含用于扩增对照标记物的引物对。

42.如权利要求41所述的用途，其特征在于，所述对照标记物选自下组：ACTB、GAPDH、微管蛋白、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。

43.如权利要求23所述的用途，其特征在于，所述目标标记物包含或是：

b)亚硫酸氢盐转化后的a)的对应区域；或

c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。

44.如权利要求23所述的用途，其特征在于，所述方法包括如下步骤：

(a)从所述个体获取含有DNA的生物样品；