CN114908159A - 结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒 - Google Patents

结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒 Download PDF

Info

Publication number
CN114908159A
CN114908159A CN202110178812.5A CN202110178812A CN114908159A CN 114908159 A CN114908159 A CN 114908159A CN 202110178812 A CN202110178812 A CN 202110178812A CN 114908159 A CN114908159 A CN 114908159A
Authority
CN
China
Prior art keywords
primer
enzyme
dna
seq
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110178812.5A
Other languages
English (en)
Inventor
周平红
蔡明琰
朱博群
王辉
刘蕊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Fuyuan Biotechnology Co ltd
Zhongshan Hospital Fudan University
Original Assignee
Shanghai Fuyuan Biotechnology Co ltd
Zhongshan Hospital Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Fuyuan Biotechnology Co ltd, Zhongshan Hospital Fudan University filed Critical Shanghai Fuyuan Biotechnology Co ltd
Priority to CN202110178812.5A priority Critical patent/CN114908159A/zh
Priority to PCT/CN2022/074143 priority patent/WO2022170984A1/zh
Publication of CN114908159A publication Critical patent/CN114908159A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请涉及结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒。具体而言,本申请提供一种用于诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的试剂盒,包含处理DNA的第一试剂、第一引物池和第二试剂,该第一引物池含用于预扩增以下两组目标标记物中每一组目标标记物中的至少一种目标标记物的引物对:(I)Septin9、BCAT1和IKZF1,和(II)PKNOX2、CRHBP、SOX1和基因间隔区A,所述引物对可与被第一试剂处理后的目标标记物的目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交,所述目标序列包含至少一个CpG位点。

Description

结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒
技术领域
本申请总体上涉及生物医学领域。具体来说,本申请涉及结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒。
背景技术
在癌变前的腺瘤晚期或癌症早期对结直肠瘤进行早期检测表明可以显著降低患者的死亡率。当前的结直肠瘤筛查手段包括结肠镜检查或对粪便、血液样品的分子检查,这些筛查手段都是侵入性的或只有极少的标记物,限制了患者对癌症筛查的配合度或检测灵敏度。
然而,虽然通过检测血浆游离DNA的高甲基化已被证实可用于结直肠肿瘤的筛查,但现有检测方法对进展期腺瘤的检出率较低。
因此,亟需开发一种方法和/或试剂盒,其可以从生物样品中数量极为有限的细胞外游离DNA高效地读取表观遗传学信息,而且可以在医院检验科里很容易地配置并可以可靠地应用。
发明内容
本发明通过不同检测靶点,联合血浆游离DNA高甲基化和低甲基化的方法,提高对结直肠进展期腺瘤的检测灵敏度。
在一个方面,本申请提供了一种在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法,所述方法包括如下步骤:
从所述个体获取含有DNA的生物样品;
用试剂处理所述生物样品中的DNA,所述试剂能够区分所述DNA中的甲基化和未甲基化的CpG位点,从而获得经处理的DNA;
定量分析目标标记物(target marker)的甲基化水平;其中,所述目标标记物包括以下两组目标标记物中每一组目标标记物中的至少一种目标标记物:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A;
分别比较所述目标标记物的甲基化水平和相应的参考水平,其中:组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平,且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤,或者所述个体有结直肠进展期腺瘤形成或形成的风险,或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加,或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。
在一些实施方式中,所述方法包括:
(a)从所述个体获取含有DNA的生物样品;
(b)用试剂处理步骤(a)中获取的所述生物样品中的DNA,所述试剂能够区分所述DNA中的甲基化和未甲基化的CpG位点,从而获得经处理的DNA;
(c)用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下两组目标标记物(target marker)中每一组目标标记物中的至少一种目标标记物:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物;
(d)基于步骤(c)获取的预扩增产物来分别定量分析所述被扩增的目标标记物的甲基化水平;
(e)分别比较步骤(d)中的所述被扩增的目标标记物的甲基化水平和相应的参考水平,其中:组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平,且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤,或者所述个体有结直肠进展期腺瘤形成或形成的风险,或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加,或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。
在一些实施方式中,上述方法的步骤(c)中,所述组(I)中的至少2个或全部3个目标标记物被扩增。
在一些实施方式中,上述方法的步骤(c)中,所述组(I)中的Septin9与BCAT1,BCAT1与IKZF1,或Septin9与IKZF1被扩增。
在一些实施方案中,上述方法的步骤(c)中,所述组(II)中的至少2个、至少3个或全部4个目标标记物被扩增。
在一些实施方案中,上述方法的步骤(c)中,所述组(II)中,PKNOX2与CRHBP,PKNOX2与SOX1,PKNOX2与基因间隔区A,CRHBP与基因间隔区A,或SOX1与基因间隔区A被扩增。
在一些实施方案中,上述方法的步骤(c)中,所述组(II)中,PKNOX2、CRHBP和SOX1,PKNOX2、CRHBP和基因间隔区A,PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A被扩增。
在一些实施方案中,上述方法的步骤(c)中,用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下目标标记物:Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。
在一些实施方式中,所述各个目标标记物包含或是:
a)如下所示的通过Hg19坐标定义的各个区域:Septin9,chr17:75276651-75496678;BCAT1,chr12:24964295-25102393;IKZF1,chr7:50343720-50472799;PKNOX2,chr11:125034583-125303285;CRHBP,chr5:76248538-76276983;SOX1,chr13:112721913-112726020;基因间隔区A,chr10:130082033-130087148;以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb;或
b)亚硫酸氢盐转化后的a)的对应区域;或
c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。
在一些实施方式中,从步骤(a)中获取的所述生物样本中的所述DNA包括基因组DNA或细胞外游离DNA。在一些实施方式中,所述细胞外游离DNA包括循环肿瘤DNA。在一些实施方式中,所述细胞外游离DNA中的所述目标标记物在所述生物样品中的数量不超过1ng、0.8ng、0.6ng、0.4ng、0.2ng、0.1ng、0.08ng或不超过0.04ng。在一些实施方式中,所述细胞外游离DNA中的所述目标标记物在所述生物样品中的浓度低于用于所述目标标记物的检测分析的灵敏度水平。
在一些实施方式中,步骤(c)中所述预扩增产物在步骤(d)之前使用稀释剂稀释。
在一些实施方式中,所述生物样品选自下组:组织学切片、组织活检、石蜡包埋的组织、体液、结肠流出物、手术切除样本、分离的血细胞、分离自血液的细胞,及其任意组合。在一些实施方式中,所述体液选自下组:全血、血清、血浆、尿液、粘液、唾液、腹膜液、胸腔液、胸膜积液、滑液、脑脊髓液、胸腔穿刺液、腹腔积液,及其任意组合。在一些实施方式中,从所述个体的血浆中获得所述生物样品。在一些实施方式中,所述结肠流出物选自下组:粪便样品和灌肠洗涤样品。
在一些实施方式中,步骤(b)的所述试剂在CpG位点选择性地修饰未甲基化的胞嘧啶残基以产生修饰的残基,但并不显著性地修饰甲基化的胞嘧啶残基。在一些实施方式中,步骤(b)的所述试剂包括亚硫酸氢盐试剂。在一些实施方式中,所述亚硫酸氢盐试剂选自下组:亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子,及其任意组合。
在一些实施方式中,步骤(b)的所述试剂选择性地切割未甲基化的残基但不切割甲基化的残基,或者选择性地切割甲基化的残基但不切割未甲基化的残基。在一些实施方式中,步骤(b)的所述试剂是甲基化敏感限制酶(MSRE)。在一些实施方式中,所述MSRE选自下组:HpaII酶、SalI酶、
Figure BDA0002940865460000041
酶、ScrFI酶、BbeI酶、NotI酶、SmaI酶、XmaI酶、MboI酶、BstBI酶、ClaI酶、MluI酶、NaeI酶、NarI酶、PvuI酶、SacII酶、HhaI酶及其任意组合。
在一些实施方式中,所述预扩增引物池包含甲基化特异性引物对。在一些实施方式中,其中所述甲基化特异性引物对包含一个正向引物和一个反向引物,所述引物均包含寡核苷酸序列,所述寡核苷酸序列与相应的目标标记物的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交,其中所述至少9个连续核苷酸包含至少一个CpG位点。
在一些实施方式中,所述预扩增引物池进一步包含用于扩增对照标记物的对照引物对。在一些实施方式中,所述对照标记物选自下组:ACTB、GAPDH、微管蛋白(tubulin)、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。
在一些实施方案中,用于扩增Septin9的引物对为SEQ ID NO:22/23;用于扩增BCAT1的引物对为SEQ ID NO:24/25;用于扩增IKZF1的引物对为SEQ ID NO:26/27;用于扩增PKNOX2的引物对为SEQ ID NO:28/29;用于扩增CRHBP的引物对为SEQ ID NO:30/31;用于扩增SOX1的引物对为SEQ ID NO:32/33;用于扩增基因间隔区A的引物对为SEQ ID NO:34/35。
在一些实施方式中,所述甲基化特异性引物对至少包含选自以下的引物对中的一对或多对:SEQ ID NO:22/23、24/25、26/27、28/29、30/31、32/33和34/35。优选地,所述甲基化特异性引物对包含选自下组(I)的至少一对、至少两对或全部三对引物对和下组(II)的至少一对、至少两对、至少三对引物对:(I)SEQ ID NO:22/23、24/25和26/27;(II)SEQ IDNO:28/29、30/31、32/33和34/35。优选地,所述甲基化特异性引物对包含SEQ ID NO:22/23、24/25、26/27、28/29、30/31、32/33和34/35。
在一些实施方式中,在步骤(c)中,所述目标标记物在一个或多个封闭寡核苷酸存在的情况下被扩增。
在一些实施方式中,步骤(d)的所述定量分析是通过以下方式进行:聚合酶链式反应(例如实时聚合酶链式反应、数字聚合酶链式反应)、核酸测序、基于质量的分离(例如电泳法、质谱法)或靶标捕获(例如杂交、微阵列)。在一些实施方式中,步骤(d)的所述定量分析是通过实时聚合酶链式反应进行的,任选地所述实时聚合酶链式反应是多重实时聚合酶链式反应。
在一些实施方式中,步骤(d)的所述定量分析包含使用定量引物对和DNA聚合酶对步骤(c)的预扩增产物进行扩增,其中所述预扩增产物通过扩增产生扩增产物。
在一些实施方式中,步骤(d)使用的所述定量引物对能够与步骤(c)的所述预扩增产物的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。
在一些实施方式中,步骤(d)使用的至少一个所述定量引物对和步骤(c)的所述预扩增引物池的至少一个所述甲基化特异性引物对相同。
在一些实施方式中,步骤(d)使用的所述定量引物对被设计为用于扩增步骤(c)的所述至少一个预扩增产物内的至少一部分。
在一些实施方式中,所述步骤(d)在检测试剂存在的情况下进行。在一些实施方式中,所述检测试剂选自下组:荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。优选地,用于检测Septin9的探针为SEQ ID NO:36;检测BCAT1的探针为SEQ ID NO:37;用于检测IKZF1的探针为SEQ ID NO:38;用于检测PKNOX2的探针为SEQ ID NO:39和40;用于检测CRHBP的探针为SEQ ID NO:41;用于检测SOX1的探针为SEQ IDNO:42;用于检测基因间隔区A的探针为SEQ ID NO:43。在一些实施方式中,所述探针至少包括选自下组的一条或多条核苷酸序列:SEQ ID NO:36-43。优选地,所述探针包括SEQ IDNO:36-38中的至少一条、至少两条或全部三条核苷酸序列和SEQ ID NO:39和/或40以及SEQID NO:41-43中的至少一条、至少两条或至少三条核苷酸序列。在一些实施方式中,所述探针包括SEQ ID NO:36-38和41-43所示的核苷酸序列,以及SEQ ID NO:39和/或40所示的核苷酸序列。
在一些实施方式中,所述荧光探针的5’端标记有荧光染料(例如FAM、HEX/VIC、TAMRA、Texas Red或Cy5),3’端标记有猝灭剂(例如BHQ1、BHQ2、BHQ3、DABCYL或TAMRA)。
在一些实施方式中,步骤(e)包括比较步骤(d)的所述目标标记物的Ct值和参考Ct值,其中所述组(I)的目标标记物的Ct值高于其相应的参考Ct值、且组(II)的目标标记物的Ct值低于其相应的参考Ct值表明所述个体患有结直肠进展期腺瘤,或者所述个体有结直肠进展期腺瘤形成或形成的风险,或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加,或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。
在一些实施方式中,步骤(c)的所述预扩增包括5到30个反应循环,其中每个循环包括在40~80℃下反应5秒-5分钟,之后在85~99℃下反应5秒-5分钟。
在一些实施方式中,步骤(d)的所述定量分析包括基于所述预扩增产物中多个CpG二核苷酸、TpG二核苷酸或CpA二核苷酸的存在或水平来确定其甲基化水平。在一些实施方式中,步骤(d)的所述定量分析包括基于所述预扩增产物中一个或多个CpG二核苷酸的存在或水平来确定胞嘧啶残基的甲基化水平。在一些实施方式中,步骤(d)的所述定量分析是通过将步骤(c)所述预扩增产物分割为多个组分来进行的。
在一些实施方式中,步骤(e)中的所述参考水平是基于从患有结直肠瘤或具有患结直肠瘤风险的一组个体中获取的临床样本和从未患结直肠瘤或不具有患结直肠瘤风险的一组个体中获取的临床样本来确定的。
在另一方面,本申请提供了一种用于诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的试剂盒,其包含:
(a)处理DNA的第一试剂,其中所述第一试剂能够区分DNA中的甲基化和未甲基化的CpG位点;
(b)第一引物池,所述第一引物池包含用于预扩增以下两组目标标记物中每一组目标标记物中的至少一种目标标记物的引物对:(I)Septin9、BCAT1和IKZF1,和(II)PKNOX2、CRHBP、SOX1和基因间隔区A,其中所述引物对可与被所述第一试剂处理后的所述目标标记物的目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交,其中所述目标序列包含至少一个CpG位点;
(c)第二试剂,所述第二试剂用于定量分析被所述第一引物池预扩增的所述目标标记物中每个目标标记物的甲基化水平。
在一些实施方式中,所述第二试剂包含第二引物池,所述第二引物池包含多个定量引物对,所述定量引物对能够与被所述第一引物池预扩增的所述目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。
在一些实施方式中,所述第二引物池中的定量引物对和所述第一引物池中的引物对相同。在一些实施方式中,所述第二引物池中的定量引物对被设计为用于扩增被所述第一引物池预扩增的所述目标序列内的至少一部分。
在一些实施方式中,所述第一引物池包含至少一个甲基化特异性引物对。
在一些实施方式中,所述第一引物池和所述第二引物池被包装在单一容器内或被包装在独立容器内。
在一些实施方式中,所述试剂盒进一步包含一个或多个封闭寡核苷酸。
在一些实施方式中,所述试剂盒进一步包含检测试剂。在一些实施方式中,所述检测试剂选自下组:荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。所述探针至少包括选自下组的一条或多条核苷酸序列:SEQ ID NO:36-43。优选地,所述探针包括下组(I)的至少一条、至少两条或全部三条核苷酸序列和下组(II)的至少一条、至少两条或至少三条核苷酸序列:(I)SEQ ID NO:36-38,(II)SEQ ID NO:39或40以及41-43。在一些实施方式中,所述探针包括:SEQ ID NO:36-38和41-43所示的核苷酸序列,以及SEQ ID NO:39和/或40所示的核苷酸序列。在一些实施方式中,所述荧光探针的5’端标记有荧光染料(例如FAM、HEX/VIC、TAMRA、Texas Red或Cy5),3’端标记有猝灭剂(例如BHQ1、BHQ2、BHQ3、DABCYL、TAMRA或lowa Black Dark Quenchers)。
在一些实施方式中,所述试剂盒进一步包含DNA聚合酶和/或一个适合存放从所述个体中获取的所述生物样品的容器。在一些实施方式中,所述试剂盒进一步包含使用说明书和/或对试剂盒检测结果的解释。
在一些实施方式中,所述第一试剂包括亚硫酸氢盐试剂或甲基化敏感限制酶(MSRE)。在一些实施方式中,所述亚硫酸氢盐试剂选自下组:亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子,及其任意组合。在一些实施方式中,所述MSRE选自下组:HpaII酶、SalI酶、
Figure BDA0002940865460000071
酶、ScrFI酶、BbeI酶、NotI酶、SmaI酶、XmaI酶、MboI酶、BstBI酶、ClaI酶、MluI酶、NaeI酶、NarI酶、PvuI酶、SacII酶、HhaI酶及其任意组合。
在一些实施方式中,所述第一引物池中包括用于扩增所述组(I)中的至少2个或全部3个目标标记物的引物对。
在一些实施方式中,所述第一引物池中包括用于扩增所述组(I)中的Septin9与BCAT1,BCAT1与IKZF1,或Septin9与IKZF1的引物对。
在一些实施方案中,所述第一引物池中包括用于扩增所述组(II)中的至少2个、至少3个或全部4个目标标记物的引物对。
在一些实施方案中,所述第一引物池中包括用于扩增组(II)中的PKNOX2与CRHBP,PKNOX2与SOX1,PKNOX2与基因间隔区A,CRHBP与基因间隔区A,或SOX1与基因间隔区A的引物对。
在一些实施方案中,所述第一引物池中包括用于扩增组(II)中的PKNOX2、CRHBP和SOX1,PKNOX2、CRHBP和基因间隔区A,PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A的引物对。
在一些实施方案中,所述第一引物池中包括用于扩增Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A的引物对;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。
在一些实施方案中,用于扩增Septin9的引物对为SEQ ID NO:22/23;用于扩增BCAT1的引物对为SEQ ID NO:24/25;用于扩增IKZF1的引物对为SEQ ID NO:26/27;用于扩增PKNOX2的引物对为SEQ ID NO:28/29;用于扩增CRHBP的引物对为SEQ ID NO:30/31;用于扩增SOX1的引物对为SEQ ID NO:32/33;用于扩增基因间隔区A的引物对为SEQ ID NO:34/35。
在一些实施方式中,所述各个目标标记物包含或是:
a)如下所示的通过Hg19坐标定义的各个区域:Septin9,chr17:75276651-75496678;BCAT1,chr12:24964295-25102393;IKZF1,chr7:50343720-50472799;PKNOX2,chr11:125034583-125303285;CRHBP,chr5:76248538-76276983;SOX1,chr13:112721913-112726020;基因间隔区A,chr10:130082033-130087148;以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb;或
b)亚硫酸氢盐转化后的a)的对应区域;或
c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。
在一些实施方式中,所述第一引物池包含的引物对包含选自下组的核苷酸序列,或由选自下组的苷酸序列组成:SEQ ID NO:22/23、24/25、26/27、28/29、30/31、32/33和34/35,任选地其中所述第二引物池包含至少一个与所述第一引物池中的至少一个引物对相同的引物对。
在一些实施方式中,所述第一引物池和所述第二引物池进一步包含用于扩增对照标记物的引物对。在一些实施方式中,所述对照标记物选自下组:ACTB、GAPDH、微管蛋白、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。
在一些实施方式中,所述试剂盒进一步包含多个容器,每个容器均用于接收所述第二引物池的组分。
在另一方面,本申请提供了根据本申请所述的试剂盒在制造用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的诊断试剂盒中的用途。
在另一方面,本申请提供了用于定量分析目标标记物的甲基化水平的试剂在制造试剂盒中的用途,所述试剂盒被用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法中,其中所述方法包括如下步骤:
(a)从所述个体获取含有DNA的生物样品;
(b)用试剂处理步骤(a)中获取的所述生物样品中的DNA,所述试剂能够区分所述DNA中的甲基化和未甲基化的CpG位点,从而获得经处理的DNA;
(c)用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下两组目标标记物(target marker)中每一组目标标记物中的至少一种目标标记物:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物;
(d)基于步骤(c)获取的预扩增产物来分别定量分析所述被扩增的目标标记物的甲基化水平;
(e)分别比较步骤(d)中的所述被扩增的目标标记物的甲基化水平和相应的参考水平,其中:组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平,且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤,或者所述个体有结直肠进展期腺瘤形成或形成的风险,或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加,或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。
在一些实施方式中,上述方法的步骤(c)中,所述组(I)中的至少2个或全部3个目标标记物被扩增。
在一些实施方式中,上述方法的步骤(c)中,所述组(I)中的Septin9与BCAT1,BCAT1与IKZF1,或Septin9与IKZF1被扩增。
在一些实施方案中,上述方法的步骤(c)中,所述组(II)中的至少2个、至少3个或全部4个目标标记物被扩增。
在一些实施方案中,上述方法的步骤(c)中,PKNOX2与CRHBP,PKNOX2与SOX1,PKNOX2与基因间隔区A,CRHBP与基因间隔区A,或SOX1与基因间隔区A被扩增。
在一些实施方案中,上述方法的步骤(c)中,PKNOX2、CRHBP和SOX1,PKNOX2、CRHBP和基因间隔区A,PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A被扩增。
在一些实施方案中,上述方法的步骤(c)中,用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下目标标记物:Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。
在一些实施方式中,所述各个目标标记物包含或是:
a)如下所示的通过Hg19坐标定义的各个区域:Septin9,chr17:75276651-75496678;BCAT1,chr12:24964295-25102393;IKZF1,chr7:50343720-50472799;PKNOX2,chr11:125034583-125303285;CRHBP,chr5:76248538-76276983;SOX1,chr13:112721913-112726020;基因间隔区A,chr10:130082033-130087148;以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb;或
b)亚硫酸氢盐转化后的a)的对应区域;或
c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。
附图说明
图1:肠镜未发现异常与进展期腺瘤患者血浆游离DNA中Septin9、BCAT1和IKZF1甲基化检测结果。
图2:肠镜未发现异常与进展期腺瘤患者血浆游离DNA中PKNOX2、CRHBP、SOX1、基因间隔区A的甲基化检测结果。
图3显示了目标标记物的示例性亚区域(subregion)的核苷酸序列。
具体实施方式
虽然本申请公开了本申请的各个方面和各种实施方式,但是本领域技术人员
可以在不脱离本申请的精神和范围的前提下做出各种等同改变或修改。本申请公开的各个方面和各种实施方式均是示例性的,并不旨在限制本申请的范围,本申请的实际保护范围以权利要求书为准。除非另有说明,否则本申请中使用的所有技术和科学术语均是本领域技术人员通常理解的含义。本申请引用的所有参考文献、专利和专利申请均通过引用并入本申请。
需注意的是,在本申请的说明书和权利要求书中,单数形式的“一个”、“一种”和“所述”均包括其复数形式,除非上下文另有说明。因此,例如,“一种试剂”包括多种试剂。
在本申请的说明书和权利要求书,除非另有说明,否则术语“包含”、“包括”或“含有”是指含有所列出的数值、步骤或成分,但也不排除还含有其他数值、步骤或成分。
传统上,对癌症的诊断依赖于对单个标记物(例如,基因突变)的检测,但是很可惜的是,通常很难通过检测单个标记物来检测癌症,或者很难通过检测单个标记物来区分多种类型的癌症。此外,在生物样品中单个标记物的水平通常是极为有限的,这进一步降低了对癌症的诊断特异性和/或诊断灵敏度。因此,仅识别单个标记物的分析法被证明具有有限的预测价值。
在一个方面,本申请预扩增本文所述的目标标记物来获得预扩增产物,之后基于其各自的预扩增产物来分别定量分析每个目标标记物的甲基化水平。这样的预扩增步骤可以提高目标标记物的数量/水平,并可以显著提高对结直肠进展期腺瘤的诊断特异性和/或诊断灵敏度。在另一方面,本申请同时定量分析生物样品中的多个目标标记物的甲基化水平,以提高对结直肠进展期腺瘤的诊断特异性和/或诊断灵敏度。在一些实施方式中,所述多个目标标记物在定量分析之前先预扩增。特别地,本申请的发明人出人意料地发现将预扩增步骤和定量分析步骤结合在一起可以显著提高对结直肠进展期腺瘤的诊断特异性和/或诊断灵敏度,使得对结直肠进展期腺瘤的早期检测成为可能,例如在癌变前的腺瘤期或癌症早期。本领域技术人员可以理解的是,在上下文中的诊断“灵敏度”定义的是被正确鉴定为阳性结果的比例,也就是被正确鉴定出患病的个体的百分比。而“特异性”定义的是被正确鉴定为阴性结果的比例,也就是被正确鉴定出不患病的个体的百分比。
1.方法
在一个方面,本申请提供了一种在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法,所述方法包括如下步骤:
(a)从所述个体获取含有DNA的生物样品;
(b)用试剂处理所述生物样品中的DNA,所述试剂能够区分所述DNA中的甲基化和未甲基化的CpG位点,从而获得经处理的DNA;
(d)定量分析目标标记物(target marker)的甲基化水平;其中,所述目标标记物包括以下两组目标标记物中每一组目标标记物中的至少一种目标标记物:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A;
(e)分别比较所述目标标记物的甲基化水平和相应的参考水平,其中:组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平,且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤,或者所述个体有结直肠进展期腺瘤形成或形成的风险,或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加,或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险;
其中,所述方法包括任选的步骤(c):用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下两组目标标记物中每一组目标标记物中的至少一种目标标记物:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。
优选地,所述方法包括:
(a)从所述个体获取含有DNA的生物样品;
(b)用试剂处理步骤(a)中获取的所述生物样品中的DNA,所述试剂能够区分所述DNA中的甲基化和未甲基化的CpG位点,从而获得经处理的DNA;
(c)用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下两组目标标记物(target marker)中每一组目标标记物中的至少一种目标标记物:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物;
(d)基于步骤(c)获取的预扩增产物来分别定量分析所述被扩增的目标标记物的甲基化水平;
(e)分别比较步骤(d)中的所述被扩增的目标标记物的甲基化水平和相应的参考水平,其中:组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平,且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤,或者所述个体有结直肠进展期腺瘤形成或形成的风险,或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加,或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。
本文中所使用的术语“筛查”是指对病理状态、疾病或病况进行鉴定,例如对结直肠进展期腺瘤的鉴定,或对患有结直肠进展期腺瘤但可能从特定的治疗方案中获益的个体进行鉴定。在本申请中,术语“筛查”和术语“诊断”可能互换使用。
本文中所使用的术语“瘤”或“肿瘤”应当理解为是指包含肿瘤细胞的病灶、肿瘤或其他包囊化或未包囊化的块体或其他形式的生长物。“肿瘤细胞”应当理解为是指显示出异常生长的细胞。术语“生长”应当以最广泛的意义理解并且包括增殖。于此而言,细胞异常生长的一个实例是细胞失控的增殖。另一个实例是
细胞因凋亡失败而延长其通常的寿命。肿瘤细胞可以是良性细胞或恶性细胞。在一些实施方式中,肿瘤是腺瘤或腺癌。不使本发明限于任一理论或作用模式,腺瘤通常是源自上皮的良性肿瘤,其源自上皮组织或显示出清晰界定的上皮结构。这些结构物可以具有腺状外观。它可能在腺瘤内部包含恶性细胞群体,例如,随着良性腺瘤或良性肿瘤病灶进展成恶性腺癌而发生。在一些实施方式中,瘤是恶性的,例如癌。在一些实施方式中,瘤不是恶性的,例如腺瘤。
本文中所使用的术语“结直肠瘤”是指存在于结肠、直肠和/或阑尾的瘤。在一些实施方式中,结直肠瘤是结直肠癌、结直肠腺瘤和/或无蒂锯齿状息肉。在一些实施方式中,结直肠瘤是癌前的。
本文所述术语“结直肠进展期腺瘤”是指肿瘤大于1cm、或含高级别上皮内瘤变、或含绒毛成分的腺瘤。
本文中所使用的术语“癌前”指的是展示出与癌症进展风险升高相关的一些组织学变化的瘤。就结直肠细胞增殖性病症来说,这类状况的实例包括高度发育异常的细胞增殖性疾病,例如结肠的腺瘤状息肉。
本文中在描述瘤(例如,腺瘤或腺癌)时所用的术语“形成”被理解为是指表现出发育异常的个体的一个或多个细胞。对这一点而言,腺瘤或腺癌可能已形成发展,因为已形成非正常增长的细胞团块,也可以是腺瘤或腺癌处在极早期,在诊断时只有相比数量极少的细胞出现非正常分裂。本申请也延伸至评估个体的结直肠进展期腺瘤(例如,结直肠癌)形成风险。
本文中所用的术语“评估”指的是区分来自患有结直肠进展期腺瘤的个体和未患有结直肠进展期腺瘤的个体的样本的能力,或者区分来自处于结直肠瘤进展不同阶段的个体的样本的能力。在一些实施方式中,该评估涉及确定个体的肿瘤是否进入进展阶段或是否具有较高可能性进入进展阶段。在一些实施方式中,该评估涉及对个体的肿瘤进行分类,例如I期、II期、III期、IV期等。在一些实施方式中,该评估涉及确定个体的肿瘤是否减轻或加重。在一些实施方式中,该评估可以协助评价一种治疗具有临床受益的可能性。在一些实施方式中,该评估可能涉及患者在接受治疗(例如,用特定的药物进行治疗)后是否好转和/或好转的可能性。通过为任何特定患者选择最合适的治疗方式,本申请的评估方法可以被用于在临床上做出治疗决定。在施用治疗方案(例如,给定的治疗方案,包括例如给定的治疗药剂或组合的施用,手术干预、类固醇治疗等)后,本申请的评估方法在评价该患者能否长期存活的可能性上是有价值的工具。
本领域技术人员所理解的“区分”不能达到对所分析的样品100%正确。但是,依然要求对具有统计学意义的数量的样品能够正确分类。具有统计学意义的数量可以由本领域技术人员通过使用不同的统计工具来确定,例如但不限于确定置信区间、确定p值,学生氏T检验或Fisher区分方程。有关详细信息,请参见Dowdy and Wearden,Statistics forResearch,John Wiley&Sons,New York 1983。在一些实施方式中,置信区间为至少90%、至少95%、至少96%、至少97%、至少98%或至少99%。在一些实施方式中,p值小于0.1、0.05、0.01、0.005或0.0001。
本文所用的术语“进展”是指细胞的形态和生理沿着遗传确定的途径改变,例如,从先前、较低或早期到后来的、更复杂或更高级阶段的生理成熟中的自然发展过程。
本文所用的术语“预后”是指预测疾病(例如,癌症)的疾病症状(包括例如复发、加剧、耐药性)结果的可能性。该术语还指对治疗的临床获益可能性的预测。在一些实施方式中,使用统计算法为个体提供疾病的预后。例如,预后可以是手术、癌症(例如,实体瘤,例如结直肠癌、黑素瘤和肾细胞癌)的临床亚型的进展、一种或多种临床因素的进展或从疾病中恢复。预后可以是预后不良(例如可能复发或产生耐药性)或预后良好。
在本申请中,以下关于步骤(a)、步骤(b)、步骤(c)、步骤(d)和步骤(e)的详细描述适用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法。
步骤(a)
在根据本申请的方法的步骤(a)中,从所述个体中获取包含DNA的生物学样本。
本文所用的术语“生物样品”是指获自或衍生自目标个体的生物组合物,其包含基于物理、生化、化学和/或生理特征待表征或待识别的细胞和/或其他分子实体(例如DNA)。生物样品包括但不限于通过本领域技术人员已知的任何方法获得的个体的细胞、组织、器官和/或生物体液。在一些实施方式中,所述生物样品选自下组:组织学切片、组织活检、石蜡包埋的组织、体液、结肠流出物、手术切除样本、分离的血细胞、分离自血液的细胞,及其任意组合。在一些实施方式中,所述体液选自下组:全血、血清、血浆、尿液、粘液、唾液、腹膜液、胸腔液、胸膜积液、滑液、脑脊髓液、胸腔穿刺液、腹腔积液,及其任意组合。在一些实施方式中,所述结肠流出物选自下组:粪便样品和灌肠洗涤样品。选择最适合根据本文申请的方法的检测的样品将取决于情境的性质。在一些实施方式中,所述生物样品获自个体的全血。在一些实施方式中,所述生物样品获自个体的血浆。本领域技术人员知道从全血制备血浆的各种方法。例如,在一些实施方式中,血浆通过将来自个体的全血离心一次、两次、三次、四次、五次或更多次来获得。
本文所用的术语“个体”包括人类和非人类的动物。非人类动物包括所有脊椎动物,例如哺乳动物和非哺乳动物。“个体”也可以是家畜,例如牛、猪、绵羊、家禽和马;或啮齿动物,例如大鼠、小鼠;或非人类灵长类动物,例如猿、猴、恒河猴;或家养的动物,例如狗或猫。在一些实施方式中,个体是人类或非人类灵长类动物。在一些实施方式中,个体是人类。在本申请中,“个体”和“受试者”可能互换使用。
在一些实施方式中,所述DNA是从所述生物样本中分离的。从生物样品中分离和纯化DNA可以通过使用本领域已知的各种方法来实施,包括使用可商购的试剂盒。例如,通过以下方式从细胞和组织中分离DNA:在高度变性和还原条件下裂解原材料、部分使用蛋白质降解酶、纯化通过苯酚/氯仿提取工艺获得的核酸组分,并通过渗析或乙醇沉淀从水相中回收核酸(参见例如Sambrook,J.,Fritsch,E.F.in T.Maniatis,C S H,Molecular Cloning,1989)。又例如,现在有许多试剂体系特别适用于从琼脂糖凝胶中纯化DNA片段、从细菌裂解物中分离质粒DNA,以及从血液、组织或细胞培养物中分离较长链的核酸(基因组DNA、总细胞RNA)。许多这些可商购的纯化体系中是基于相当众所周知的原理,即,在不同离液盐的溶液的存在下将核酸与矿物载体相结合。在这些体系中,细磨的玻璃粉、硅藻土或硅胶的悬浮液被用作载体材料。在例如US7888006B2和EP1626085A1中描述了从生物样品中分离和纯化DNA的一些其他方法。在方法之间进行选择将受到几个因素的影响,包括时间、费用和所需的DNA数量。
在一些实施方式中,生物样品中包含的DNA包括基因组DNA。本文所用的术语“基因组DNA”是指包含细胞或生物体的完整基因组及其片段或部分的DNA。基因组DNA是来源于个体的大段DNA(例如长于大约10、20、30、40、50、60、70、80、90、100、200或300kb),并且可以具有天然修饰,例如DNA甲基化。
在一些实施方式中,生物样品中包含的DNA包括细胞DNA。本文所用的术语“细胞DNA”是指存在于细胞内的DNA,或从体内细胞中获取DNA并在体外分离、或以其他方式在体外操作,只要该DNA未从体内细胞中移除。
在一些实施方式中,生物样品中包含的DNA包括细胞外游离DNA。本文所用的术语“细胞外游离DNA”是指在体内的细胞外存在的DNA片段。该术语也可以被用于指代获取自体内的细胞外来源并在体外分离、或操作的DNA片段。细胞外游离DNA中的DNA片段通常具有约100到200bp的长度,推测与被包裹于核小体的DNA片段的长度有关。细胞外游离DNA包括例如细胞外游离胎儿DNA和循环肿瘤DNA。细胞外游离胎儿DNA在孕妇的体内(例如血液)中循环,代表胎儿基因组,而循环肿瘤DNA在癌症患者的体内(例如血液)中循环。在一些实施方式中,细胞外游离DNA可基本上不含个体的细胞DNA。例如,所述细胞外游离DNA可包含小于约1,000ng/mL、小于约100ng/mL、小于约10ng/mL、小于约1ng/mL的细胞DNA。
可以通过使用本领域已知的常规技术来制备细胞外游离DNA。例如,可以通过以约200-20,000g、约200-10,000g、约200-5,000g、约300-4000g等的速度离心血液样品约3-30分钟、约3-15分钟、约3-10分钟、约3-5分钟来获得血液样品的细胞外游离DNA。例如,在一些实施方式中,可以通过将个体的血浆或血清离心一、二、三、四、五次或更多次来获得血液样本的细胞外游离DNA。在一些实施方式中,为了从包含可溶性DNA的无细胞组分中分离细胞及其片段,可以通过微滤来获得所述生物样品。通常来说,微滤可以通过使用过滤器来进行,例如,0.1微米~0.45微米的膜过滤器,诸如0.22微米的膜过滤器。
在一些实施方式中,使用商购的DNA提取产品从全血、血清或血浆中提取细胞外游离DNA用于分析。这种提取方法据称对循环DNA的回收率高(>50%),某些产品(例如Qiagen生产的QIAamp Circulating Nucleic Acid Kit)据称可提取小尺寸的DNA片段。所使用的典型样品量为1-5mL血清或血浆。
在一些实施方式中,细胞外游离DNA包括循环肿瘤DNA。循环肿瘤DNA(“ctDNA”)是与细胞无关的体液(例如血液、尿液、唾液、痰、粪便、胸膜液、脑脊液等)中肿瘤来源的片段化DNA。通常,ctDNA高度片段化,平均长度约为150个碱基对。ctDNA通常包括体液(例如血浆)中细胞外游离DNA的极小部分,例如ctDNA可能构成血浆DNA的不到约10%。通常,该百分比小于约1%,例如小于约0.5%或小于约0.01%。另外,血浆DNA的总量通常非常低,例如约10ng/mL血浆。ctDNA的数量因人而异,并且取决于肿瘤的类型、位置,对于癌性肿瘤,则取决于癌症的阶段。但是,ctDNA通常在体液中非常罕见,只能通过极其敏感和特异性的技术进行检测。检测ctDNA可能有助于检测和诊断肿瘤、指导肿瘤特异性治疗、监测治疗以及监测癌症的缓解。
步骤(b)
在根据本申请的方法的步骤(b)中,用能够区分DNA中的未甲基化和甲基化CpG位点的试剂处理步骤(a)中获取的生物样品中的DNA,从而获得经处理的DNA。
DNA甲基化是(例如,通过DNA甲基转移酶的作用)将甲基添加到DNA分子上(例如,添加至DNA分子的一个或多个胞嘧啶碱基)的生物学过程。在哺乳动物中,DNA甲基化出现于胞嘧啶-磷酸-鸟嘌呤(CpG)二核苷酸(即“CpG位点”)的5’位置,当其出现在基因的启动子或第一个外显子中的5’-CpG-3’二核苷酸中时,会导致基因的表观遗传失活。充分证明DNA甲基化在调节基因表达、肿瘤发生、以及其他遗传和表观遗传疾病中起重要作用。
如本文所用,术语“甲基化的胞嘧啶残基”是指胞嘧啶残基的衍生物,其中一个甲基连接至胞嘧啶环的碳原子上(例如C5)。术语“未甲基化的胞嘧啶残基”是指未衍生化的胞嘧啶残基,其中与“甲基化的胞嘧啶残基”相反,在胞嘧啶环的碳原子(例如C5)上没有甲基连接。其内的胞嘧啶残基被甲基化的CpG位点就是甲基化的CpG位点,而其内的胞嘧啶残基未被甲基化的CpG位点是未甲基化的CpG位点。
在一些实施方式中,步骤(b)中使用的试剂能够区分DNA中的未甲基化和甲基化的CpG位点,从而获得经处理的DNA。该试剂可以选择性地作用于未甲基化的胞嘧啶残基,但不能显著地作用于甲基化的胞嘧啶残基。或者该试剂可以选择性地作用于甲基化的胞嘧啶残基,而不显著地作用于未甲基化的胞嘧啶残基。因此,原始DNA以取决于是否被甲基化的方式转化为经处理的DNA,从而可以通过其杂交行为将经处理的DNA与原始DNA区分开。
例如,一些试剂可以选择性地将未甲基化的胞嘧啶残基转化为尿嘧啶、胸腺嘧啶或杂交上与胞嘧啶不同的另一碱基,而甲基化的胞嘧啶残基依然处于未转化状态。又例如,一些试剂可以选择性地切割甲基化的残基,或者选择性地切割未甲基化的残基。
如本文所用,“经处理的DNA”是指已经用能够区分DNA中的未甲基化和甲基化的CpG位点的试剂处理后的DNA,即DNA中的DNA甲基化状态已经改变。
在一些实施方式中,步骤(b)的所述试剂在CpG位点选择性地修饰未甲基化的胞嘧啶残基以产生修饰的残基,但并不显著性地修饰甲基化的胞嘧啶残基。
在一些实施方式中,步骤(b)的所述试剂包括亚硫酸氢盐试剂。如本文所用,术语“亚硫酸氢盐试剂”是指,例如本申请所公开的可用于区分甲基化和未甲基化的CpG二核苷酸序列的包括亚硫酸氢盐、亚硫酸氢根离子或其任意组合的试剂。在本申请中,用亚硫酸氢盐试剂处理DNA也被描述为“亚硫酸氢盐反应”或“亚硫酸氢盐处理”,指的是转化未甲基化的胞嘧啶残基的反应,特别是在亚硫酸氢根离子存在的情况下,核酸中未甲基化的胞嘧啶残基被转化为尿嘧啶碱基、胸腺嘧啶碱基或在杂交行为上与胞嘧啶不同的其他碱基,而其中甲基化的胞嘧啶残基未被显著地转化。换言之,亚硫酸氢盐处理可用于区分甲基化的CpG二核苷酸和未甲基化的CpG二核苷酸。Frommer,M.,et al.,Proc Natl Acad Sci USA 89(1992)1827-31和Grigg,G.,Clark,S.,Bioessays 16(1994)431-6中详细描述了用于检测甲基化的胞嘧啶残基的亚硫酸氢盐反应。亚硫酸氢盐反应包括脱氨基步骤和脱磺酸基步骤(参见Grigg and Clark,同上)。“甲基化的胞嘧啶残基未被显著地转化”这一陈述,不排除非常小的百分比(例如,小于0.1%、小于0.2%、小于0.3%、小于0.4%、小于0.5%、小于0.6%、小于0.7%、小于0.8%、小于0.9%、小于1%、小于2%、小于3%、小于4%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于11%、小于12%、小于13%、小于14%、小于15%、小于16%、小于17%、小于18%、小于19%、小于20%)的甲基化的胞嘧啶残基被转化为尿嘧啶、胸腺嘧啶或在杂交行为上与胞嘧啶不同的其他碱基,尽管其意在仅仅转化未甲基化的胞嘧啶残基。
在例如参考Frommer M.,et al.(同上)或Grigg and Clark(同上)的情况下(它们公开了亚硫酸氢盐处理的基本参数),本领域技术人员知道如何进行亚硫酸氢盐处理,特别是脱氨基步骤和脱磺酸基步骤。孵育时间和温度对脱氨基效率的影响、以及影响DNA降解的参数都已公开。
在一些实施方式中,所述亚硫酸氢盐试剂选自下组:亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子,及其任意组合。在一些实施方式中,所述亚硫酸氢盐试剂是亚硫酸氢钠。在一些实施方式中,亚硫酸氢盐试剂是可商购的,例如,MethylCodeTM Bisulfite Conversion Kit、EpiMarkTM BisulfiteConversion Kit、EpiJETTM Bisulfite Conversion Kit、EZDNAMethylation-GoldTM Kit等。在一些实施方式中,根据试剂盒的使用说明书进行亚硫酸氢盐反应。
在一些实施方式中,步骤(b)的所述试剂选择性地切割未甲基化的残基但不切割甲基化的残基,或者选择性地切割甲基化的残基但不切割未甲基化的残基。
在一些实施方式中,步骤(b)的所述试剂是甲基化敏感限制酶(MSRE)。
术语“甲基化敏感限制酶”是指根据其识别位点的甲基化状态而选择性地消化核酸的酶。对于当识别位点未被甲基化或半甲基化时才特异剪切的限制酶来说,当识别位点被甲基化时,不会发生剪切,或以显著降低的效率剪切。对于当识别位点被甲基化时才特异剪切的限制酶来说,当识别位点未被甲基化时,不会发生剪切,或以显著降低的效率剪切。在一些实施方式中,甲基化敏感限制酶的识别序列含有CG二核苷酸(例如cgcg或cccggg)。在一些实施方式中,当该CG二核苷酸中的胞嘧啶在C5碳原子处被甲基化时,甲基化敏感限制酶不进行剪切。
在一些实施方式中,所述MSRE选自下组:HpaII酶、SalI酶、
Figure BDA0002940865460000181
酶、ScrFI酶、BbeI酶、NotI酶、SmaI酶、XmaI酶、MboI酶、BstBI酶、ClaI酶、MluI酶、NaeI酶、NarI酶、PvuI酶、SacII酶、HhaI酶及其任意组合。
使用本领域已知的方法,使用能区分目标区域内的甲基化的CpG二核苷酸和未甲基化的CpG二核苷酸的甲基化敏感限制酶或包含甲基化敏感限制酶的一系列限制酶试剂来确定甲基化,例如但不限于,差异性甲基化杂交(“DMH”)。
在一些实施方式中,步骤(a)的DNA可以在用甲基化敏感限制酶处理之前被切割。这样的方法是本领域已知的,并且可以既包括物理方式也包括酶促方式。特别优选的是使用一种或多种对甲基化不敏感的并且其识别位点富含AT并且不包含CG二核苷酸的限制酶。使用此类酶使得DNA片段中的CpG位点和CpG富集区域得以保存。在一些实施方式中,此类限制酶选自MseI酶、BfaI酶、Csp6I15酶、Tru1I酶、Tru9I酶、MaeI酶、XspI酶及其任意组合。
步骤(c)
在根据本申请的方法的步骤(c)中,用预扩增引物池对从步骤(b)获得的经处理的DNA中的目标标记物进行预扩增,其中每个目标标记物的至少一部分被预扩增以获得至少一个预扩增产物。在本申请中,步骤(c)也可以被称为预扩增步骤。
对目标标记物进行预扩增的目的之一是增加经处理的DNA中的目标标记物的数量。如本文所用,术语“扩增”大体上是指任何能够导致分子或一组相关分子的拷贝数增加的过程。当“扩增”被用于多核苷酸分子时,是指通常从少量多核苷酸开始产生多拷贝的多核苷酸分子或多核苷酸分子的一部分的多份拷贝,其中被扩增的物质(扩增子,PCR扩增子)通常是可被检测到的。多核苷酸的扩增涵盖多个化学和酶促过程。扩增的形式包括通过聚合酶链式反应(逆转录PCR、PCR)、链置换扩增(SDA)反应、转录介导扩增(TMA)反应、基于核酸序列的扩增(NASBA)反应或连接酶链反应(LCR),从一个或几个拷贝的模板RNA或DNA分子生成多个DNA拷贝。
如本文所用,术语“目标标记物”是指这样的目的核酸或基因区域:其甲基化水平指示着结直肠瘤(例如,结直肠进展期腺瘤),或指示着结直肠瘤(例如,结直肠进展期腺瘤)形成或形成的风险,或指示着结直肠瘤(例如,结直肠进展期腺瘤)的进展或预后。在本申请中,术语“标记物”和“基因”可以互换使用。术语“标记物”或“基因”应被认为包括其所有转录变体及其所有启动子和调控元件。如本领域技术人员所理解的,已知某些基因在个体之间表现出等位基因变异或单核苷酸多态性(“SNP”)。SNP包括不同长度的简单的重复序列(例如二核苷酸和三核苷酸重复)的插入和缺失。因此,本申请应被理解为扩展到由任何其他突变、多态性或等位基因变异产生的标记物/基因的所有形式。另外,应当理解,术语“标记物”和“基因”应既包括标记物或基因的正义链序列,也包括标记物或基因的反义链序列。
本文所用的术语“目标标记物”被宽泛地解释为既包括1)在生物样品或基因组DNA中发现的原始标记物(处于特定的甲基化状态),也包括2)其经过处理的序列(例如亚硫酸氢盐转化后的对应区域或MSRE处理后的对应区域)。亚硫酸氢盐转化后的对应区域与基因组序列中的目标标记物不同之处在于,一个或多个未甲基化的胞嘧啶残基被转化为尿嘧啶碱基、胸腺嘧啶碱基或在杂交行为上与胞嘧啶不同的其他碱基。经MSRE处理的对应区域与基因组序列中的目标标记物不同之处在于,该序列在一个或多个MSRE切割位点处被切割。
在本文所述的方法和试剂盒中,所述目标标记物分为以下两组:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A。其中,每一组中至少预扩增一种目标标记物或每组中至少一种目标标记物的至少一部分被预扩增。
在一些实施方式中,所述组(I)中的至少2个或全部3个目标标记物被扩增,和/或,所述组(II)中的至少2个、至少3个或全部4个目标标记物被扩增。
在一些实施方式中,所述组(I)中的Septin9与BCAT1,BCAT1与IKZF1,或Septin9与IKZF1被扩增。
在一些实施方案中,组(II)中的PKNOX2与CRHBP,PKNOX2与SOX1,PKNOX2与基因间隔区A,CRHBP与基因间隔区A,或SOX1与基因间隔区A被扩增。在一些实施方案中,组(II)中的PKNOX2、CRHBP和SOX1,PKNOX2、CRHBP和基因间隔区A,PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A被扩增。
在一些实施方中,用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下目标标记物:Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。
在本申请中,应该理解的是,标记物/基因既通过引用其名称又通过其染色体坐标来进行描述。所述染色体坐标与2009年2月发布的人类基因组数据库Hg19版本一致(在本文中称为“Hg19坐标”)。
在一些实施方式中,所述的各个目标标记物包括或是:
a)如下所示的通过Hg19坐标定义的各个区域:Septin9,chr17:75276651-75496678;BCAT1,chr12:24964295-25102393;IKZF1,chr7:50343720-50472799;PKNOX2,chr11:125034583-125303285;CRHBP,chr5:76248538-76276983;SOX1,chr13:112721913-112726020;基因间隔区A,chr10:130082033-130087148;以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb;或
b)亚硫酸氢盐转化后的a)的对应区域;或
c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。
在公共数据库(例如UCSC Genome Browser、Ensemble和NCBI网站)中可以获得如上所述的Hg19坐标的特定核苷酸序列,以及每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb。
在一些实施方式中,所述各个目标标记物也包括其所有变体。变体包括来自相同区域的、与本文所述的标记物/基因区域具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列同一性(即,具有一个或多个缺失、插入、取代、反向序列等)的核酸序列。因此,本申请内容应理解为延伸至实现相同结果的此类变体,尽管事实上个体间的实际核酸序列具有微小的遗传变异。
如本文所用,术语“序列同一性的百分比(%)”是指候选序列的氨基酸(或核酸)残基和参考序列的氨基酸(或核酸)残基进行序列比对后的相同百分比,比对时可以引入间隔(如有必要)以使得相同的氨基酸(或核酸)数目达到最多。
换句话说,氨基酸序列(或核酸序列)的序列同一性百分比(%)可以通过用与参考序列相同的氨基酸残基(或碱基)的数目除以候选序列或参考序列中氨基酸残基(或碱基)的总数(以较短者为准)来计算。氨基酸残基的保守取代可以被认为或可以不被认为是相同的残基。可以通过以下方式来确定氨基酸(或核酸)序列同一性的百分比,例如,可以使用公开的工具如BLASTN、BLASTp(可在美国国家生物技术信息中心(NCBI)的网站上获得,也可参见Altschul S.F.et al.,J.Mol.Biol.,215:403–410(1990);Stephen F.et al.,NucleicAcids Res.,25:3389–3402(1997))、ClustalW2(可在欧洲生物信息研究所的网站上找到),也可参见Higgins D.G.et al.,Methods in Enzymology,266:383-402(1996);LarkinM.A.et al.,Bioinformatics(Oxford,England),23(21):2947-8(2007))和ALIGN或Megalign(DNASTAR)软件。本领域技术人员可以使用所述工具提供的默认参数,或者可以(例如,通过选择合适的算法)定制适合比对的参数。
在本文提供的步骤c)中,每个目标标记物的至少一部分被预扩增以获得至少一个预扩增产物。在一些实施方式中,目标标记物的预扩增部分在目标标记物的亚区域内。
在不使本申请限于任一理论或作用模式的情况下,据信测量目标标记物的亚区域内的甲基化水平尤其有用,所述亚区域包含在结直肠瘤(例如,结直肠进展期腺瘤)中经常被超甲基化(hypermethylated)的高密度CpG二核苷酸。这一发现使得亚区域成为分析的一个特别有用的目标,因为它既可以简化筛查过程(因为需要分析的DNA区域更短且界定更为清晰),而且进一步地,相比于对目标标记物的整个Hg19区域进行分析所获得的结果,从这些亚区域所获得的结果会在超甲基化的存在或不存在这方面提供显著地更为明确的结果。因此,该发现既简化了诊断、筛查/监测过程,又增加了结直肠进展期腺瘤诊断的敏感度和特异性。在一些实施方式中,各个目标标记物的亚区域包含或是:
a)如下所示的通过Hg19坐标定义的各个区域:
目标标记物 Hg19坐标的亚区域
Septin9 chr17:75369603-75369693
BCAT1 chr12:25102016-25102110
IKZF1 chr7:50343793-50343896
PKNOX2 chr11:125036431-125036547
CRHBP chr5:76249633-76249729
SOX1 chr13:112758808-112758890
基因间隔区A chr10:130085033-130085148
以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb;或b)亚硫酸氢盐转化后的a)的对应区域;或c)MSRE处理后的a)的对应区域。
在一些实施方式中,各个目标标记物的亚区域包含或是选自下组的多核苷酸序列:SEQ ID NO:1-7、或其亚硫酸氢盐转化后的对应区域、或其MSRE处理的对应区域。在一些实施方式中,各目标标记物的亚区域的经亚硫酸氢盐转化后的对应区域包含或是选自下组的多核苷酸序列:SEQ ID NO:8-21。每个目标标记物的亚区域及经亚硫酸氢盐转化后的对应区域的SEQ ID NO列在下表1中,图3中提供了具体序列。
表1:各个目标标记物的示例性亚区域
Figure BDA0002940865460000221
在一些实施方式中,Septin9的亚区域包含选自下组的序列:SEQ ID NO:1、8、15;BCAT1的亚区域包含选自下组的序列:SEQ ID NO:2、9、16;IKZF1的亚区域包含选自下组的序列:SEQ ID NO:3、10、17。
在一些实施方式中,PKNOX2的亚区域包含选自下组的序列:SEQ ID NO:4、11、18;SOX1的亚区域包含选自下组的序列:SEQ ID NO:5、12、19;CRHBP的亚区域包含选自下组的序列:SEQ ID NO:6、13、20;基因间隔区A的亚区域包含选自下组的序列:SEQ ID NO:7、14、21。
在一些实施方式中,细胞外游离DNA中的目标标记物以不超过1ng、不超过0.9ng、不超过0.8ng、不超过0.7ng、不超过0.6ng、不超过0.5ng、不超过0.4ng、不超过0.3ng、不超过0.2ng、不超过0.1ng、不超过0.09ng、不超过0.08ng、不超过0.07ng、不超过0.06ng、不超过0.05ng、不超过0.04ng、不超过0.03ng、不超过0.02ng或不超过0.01ng的量存在于生物样品中。在一些实施方式中,细胞外游离DNA中的目标标记物以不超过0.1%、不超过0.2%、不超过0.3%、不超过0.4%、不超过0.5%、不超过0.6%、不超过0.7%、不超过0.8%、不超过0.9%、不超过1%的百分比存在于生物样品中。在一些实施方式中,细胞外游离DNA中的所述目标标记物在生物样品中的浓度低于用于目标标记物的检测分析的灵敏度水平。“检测分析的灵敏度”是对检测分析在分析浓度/量的微小差异之间进行区分的能力的度量。如果存在于生物样品中的细胞外游离DNA中的目标标记物低于检测分析的灵敏度水平,那么将无法使用常规方法来定量分析样品中每个目标标记物的甲基化水平。相反,本申请公开的方法在检测样品中极少量的目标标记物方面是实用并优越的。在一些实施方式中,细胞外游离DNA中的目标标记物以不超过0.08ng或不超过0.04ng的量存在于生物样品中。
在一些实施方式中,步骤(c)的所述至少一个预扩增产物在下一步骤(即步骤(d))之前用稀释剂稀释。在一些实施方式中,稀释剂选自下组:不含核酸酶的水、Tris-EDTA缓冲液和没有PCR抑制作用的任何其他缓冲液。在一些实施方式中,将步骤(c)的所述预扩增的DNA直接添加至下一步骤(即步骤(d)),而无需事先稀释。
用预扩增引物池预扩增经处理的DNA中的所述目标标记物。如本文所用,术语“引物”是指这样的单链寡核苷酸,其能够在合适的条件(例如缓冲液和温度)下,在四种不同的三磷酸核苷和用于聚合的试剂(例如DNA聚合酶)的存在下,作为模板指导的DNA合成的起始点。在任何给定的情况下,引物的长度取决于例如引物的预期用途,并且通常在15至30个核苷酸的范围内。短的引物分子通常需要较低的温度才能与模板形成足够稳定的杂交复合物。引物不必反映模板的确切序列,但必须足够互补以能与该模板杂交。引物位点是模板上与引物杂交的区域。引物对是一组引物,其包括与待扩增的序列的5’末端杂交的5’正向引物和与待扩增的序列的3’末端的互补链杂交的3’反向引物。本领域技术人员可以基于本领域的公知常识根据待扩增的标记物设计引物(参见,例如PCR Primer:A LaboratoryManual,Cold Spring Harbor Laboratories,NY,1995)。此外,一些用于设计在各种各样分析中使用的最佳探针和/或引物的软件包是公开的,例如可从美国马萨诸塞州剑桥市的基因组研究中心(the Center for Genome Research,Cambridge,Mass.,USA)获得的Primer3。显然,在设计探针或引物时其潜在用途也应考虑在内。例如,设计用于本发明目的的引物可以包括至少一个CpG位点,或者从该引物获得的扩增产物可以包括至少一个CpG位点。用于设计检测DNA甲基化状态的引物的工具也是本领域已知的,例如MethPrimer(Li LC andDahiya R.MethPrimer:designing primers for methylationPCRs.Bioinformatics.2002Nov;18(11):1427-31)。在本申请中,通过将预扩增引物作为引物池,经处理的DNA中的任何目标标记物(目标标记物的每至少一部分或目标标记物的一个亚区域)均可以被预扩增。
本文所用的术语“寡核苷酸”定义为包含两个或更多个核苷酸(例如,脱氧核糖核苷酸或核糖核苷酸)的分子,优选为至少5个核苷酸,更优选为至少约10-15个核苷酸,更优选为至少约15至30个核苷酸或更长(例如,寡核苷酸的长度通常少于200个残基(例如,在15至100个核苷酸之间),但是,如本文所用,该术语也意在覆盖更长的多核苷酸链)。确切的大小将取决于许多因素,而这些因素又取决于寡核苷酸的最终功能或用途。寡核苷酸通常用其长度来指代。例如,具有24个残基的寡核苷酸被称为“24聚体”(24-mer)。寡核苷酸可通过自身杂交或与其他多核苷酸杂交形成二级和三级结构。这样的结构可以包括但不限于双链体、发夹、十字形、弯折和三链体。可以以任何方式产生寡核苷酸,包括化学合成、DNA复制、反转录、PCR或其任意组合。
如本文所用,术语“互补”是指核苷酸或核酸之间的杂交或碱基配对,例如,双链DNA分子的两条链之间,或待测序或扩增的单链核酸上的引物结合位点和寡核苷酸引物之间。互补核苷酸通常是A和T(或A和U),或C和G。当一条链的核苷酸以最佳的方式对齐、并比较、并有适当的核苷酸插入或缺失后,与另一链的至少约80%(通常至少约90%至95%,更优选地为约98%至100%)的核苷酸配对,两条单链RNA或DNA分子就被称为是互补的。或者,当RNA链或DNA链在选择性杂交条件下与其互补序列杂交时,互补存在。通常,当在至少14至25个核苷酸的一段上具有至少约65%(优选至少约75%、更优选至少约90%)的互补性时,将发生选择性杂交。参见M.Kanehisa,Nucleic Acids Res.12:203(1984),作为参考并入本文。
在一些实施方式中,预扩增引物池包含至少一个甲基化特异性引物对。在一些实施方式中,预扩增引物池包含多个甲基化特异性引物对。在一些实施方式中,预扩增步骤通过甲基化特异性PCR(“MSP”)进行,甲基化特异性PCR是使用甲基化特异性引物的PCR。Herman et al.,Methylation-specific PCR:a novelPCRassay for methylation statusofCpGislands.Proc Natl Acad Sci USA.1996September 3;93(18):9821-6和UnitedStates Patent No.6,265,171中已描述了该技术(即MSP)。
如本文所用,术语“甲基化特异性引物对”是指经特异性设计以识别CpG位点以利用甲基化的差异来扩增经处理的DNA中的特定目标标记物的引物对。引物仅作用于具有特定甲基化状态或没有特定甲基化状态的分子。例如,引物可以是寡核苷酸,在严紧条件、中等严紧条件或高度严紧条件下,其可以以甲基化特异性方式与具有甲基化的特定CpG位点特异性杂交,但不能与没有甲基化的特定CpG位点杂交。因此,引物将特异性扩增在特定CpG位点具有甲基化的目标标记物。又例如,引物可以是寡核苷酸,在严紧条件、中等严紧条件或高度严紧条件下,其可以以甲基化特异性的方式与未甲基化的特定的CpG位点特异性杂交,但是不能与甲基化的特定的CpG位点杂交。因此,引物将特异性扩增在特定CpG位点没有甲基化的目标标记物。因此,在本申请中,对在经处理的DNA内的至少一个目标标记物的预扩增中使用甲基化特异性引物,可以区分甲基化的和未甲基化的CpG位点。本申请的甲基化特异性引物对包含至少一个与亚硫酸氢盐处理的CpG二核苷酸杂交的引物。因此,所述特异性针对甲基化DNA的引物的序列包含至少一个CpG二核苷酸,并且所述特异性针对未甲基化DNA的引物的序列在CpG的C位置上包含“T”,和/或在CpG中G位置上包含“A”。
在一些实施方式中,所述至少一个甲基化特异性引物对包含一个正向引物和一个反向引物,所述引物均包含寡核苷酸序列,所述寡核苷酸序列与所述目标标记物之一(或目标标记物的亚区域)的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交,其中所述目标标记物之一(或目标标记物的亚区域)的至少9个连续核苷酸包含至少一个(例如1、2、3、4、5、6、7、8、9、10或更多个)CpG位点。
如本文所用,术语“杂交”可以指其中两条单链多核苷酸非共价形式结合以形成稳定的双链多核苷酸的过程。在一个方面,所得的双链多核苷酸可以是“杂交物”或“双链”。“杂交条件”中的盐浓度通常约小于1M,经常小于约500mM并且可以小于约200mM。“杂交缓冲液”包括缓冲盐溶液,例如5%SSPE,或本领域已知的其他此类缓冲液。杂交温度可以低至5℃,但是通常高于22℃,并且更为通常地高于约30℃,并且通常超过37℃。杂交通常在严紧条件下进行,即,在该条件下序列将与其目标序列杂交但不与其他非互补序列杂交。严紧条件是取决于序列的,并且在不同情况下有所不同。例如,更长的片段可能需要比短片段更高的杂交温度才能进行特异性杂交。由于其他因素可能会影响杂交的严紧性,包括碱基组成和互补链的长度,有机溶剂的存在以及碱基错配的程度,因此参数组合比单独使用任何一个参数的绝对测量更为重要。通常严紧条件被选定为比特定序列在特定的离子强度和pH下的解链温度(Tm)低约5℃。Tm可以是双链核酸分子群体中的一半被分离成单链的温度。用于计算核酸的Tm的几个方程式是本领域众所周知的。如标准参考文献所示,当核酸在1M NaCl水溶液中时,可以通过公式Tm=81.5+0.41(%G+C)计算出简单估算的Tm值(参见例如Anderson and Young,Quantitative Filter Hybridization,in Nucleic AcidHybridization(1985))。其他参考文献(例如Allawi and SantaLucia,Jr.,Biochemistry,36:10581-94(1997))包括替代的计算方法,其计算Tm时将结构和环境以及序列特征等考虑在内。
通常,杂交物的稳定性是关于离子浓度和温度的函数。通常,杂交反应在较低严紧条件下进行,然后在具有不同但较高严紧性的洗涤液中洗涤。示例性的严紧条件包括pH约7.0至约8.3、温度至少25℃、钠离子(或其他盐)浓度为至少0.01M至不超过1M。例如,5xSSPE(750mM NaCl,50mM磷酸钠,5mM EDTA,pH 7.4)和约30℃的温度适合于等位基因特异性杂交,尽管合适的温度取决于杂交区域的长度和/或GC含量。在一个方面,确定错配百分比的“杂交严紧性”可以如下:1)高度严紧性:0.1x SSPE,0.1%SDS,65℃;2)中等严紧性(也称为中度严紧性):0.2x SSPE,0.1%SDS,50℃;3)低严紧性:1.0x SSPE,0.1%SDS,50℃。应当理解,使用替代的缓冲剂、盐和温度可以达到相同的严紧性。例如,中等严紧杂交可以是指允许核酸分子(例如探针)结合互补核酸分子的条件。杂交的核酸分子通常具有至少60%的同一性,包括例如至少70%、75%、80%、85%、90%或95%的同一性。中等严紧条件可以是与下述条件达到同等效果的条件:42℃,50%甲酰胺,5x Denhardt溶液,5x SSPE,0.2%SDS杂交,然后用42℃,0.2x SSPE,0.2%SDS进行洗涤。高度严紧条件可以通过如下条件提供,例如,42℃,50%甲酰胺,5x Denhardt溶液,5x SSPE,0.2%SDS杂交,然后65℃,0.1x SSPE和0.1%SDS中洗涤。低严紧性杂交可以是与下述条件达到同等效果的条件:22℃,10%甲酰胺,5x Denhardt溶液,6x SSPE,0.2%SDS杂交,然后在1x SSPE,0.2%SDS中于37℃洗涤。Denhardt的溶液包含1%聚蔗糖,1%聚乙烯吡咯烷酮和1%牛血清白蛋白(BSA)。20x SSPE(氯化钠,磷酸钠,EDTA)包含3M氯化钠、0.2M磷酸钠和0.025M EDTA。其他合适的中等严紧性和高度严紧性杂交缓冲液和条件是本领域技术人员众所周知的,并且描述于例如Sambrooket al.,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring HarborPress,Plainview,N.Y.(1989)和Ausubel et al.,Short Protocols in MolecularBiology,4th ed.,John Wiley&Sons(1999)。
在一些实施方式中,预扩增引物池还包含用于扩增对照标记物的对照引物对。通常,对照标记物是具有已知特征(例如,序列已知,每个细胞的拷贝数已知)的核酸,用于与实验目标(例如,浓度未知的核酸)进行比较。对照可以是内源的,优选为不变的基因,可以将分析中的实验核酸或目标核酸相对其进行标准化。此类因为样品间差异而标准化的对照可能发生在例如样品处理,分析效率等,并且允许精确的样品间数据比较,定量分析扩增效率和偏差。
在一些实施方式中,所述对照标记物选自下组:ACTB、GAPDH、微管蛋白、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。在一些实施方式中,对照引物对的序列如下表2的SEQ ID NO:44和45所示。
在一些实施方式中,Septin9的甲基化特异性引物对为SEQ ID NO:22/23;BCAT1的甲基化特异性引物对为SEQ ID NO:24/25;IKZF1的甲基化特异性引物对为SEQ ID NO:26/27;PKNOX2的甲基化特异性引物对为SEQ ID NO:28/29;CRHBP的甲基化特异性引物对为SEQID NO:30/31;SOX1的甲基化特异性引物对为SEQ ID NO:32/33;基因间隔区A的甲基化特异性引物对为SEQ ID NO:34/35。在一些实施方案中,所述甲基化特异性引物对包含如下表2所示的选自下组的至少一对核苷酸序列:SEQ ID NO:22/23,24/25,26/27,28/29,30/31,32/33和34/35。优选地,所述甲基化特异性引物对包括SEQ ID NO:22/23,24/25和26/27中的至少一对引物对,以及SEQ ID NO:28/29,30/31,32/33和34/35中的至少一对引物对。优选地,所述甲基化特异性引物对包含:SEQ ID NO:22/23,24/25,26/27,28/29,30/31,32/33和34/35。本申请中使用的引物对的序列号以“SEQ ID NO:n/m”的形式表示。例如,SEQ IDNO:22/23是指分别具有如下表2所示的SEQ ID NO:22和SEQ ID NO:23所示的核酸序列的引物对。
表2
Figure BDA0002940865460000271
Figure BDA0002940865460000281
在一些实施方式中,在步骤(c)中,所述目标标记物在一个或多个封闭寡核苷酸的存在下被扩增。此类封闭寡核苷酸的用途已经被描述于Yu et al.,BioTechniques 23:714-720,1997。封闭序列与预扩增引物对同时与经处理的DNA杂交。目标标记物的预扩增终止于封闭序列的5’位置,使得目标标记物的预扩增在与封闭序列互补的序列存在的情况下被抑制。封闭序列可以被设计为以甲基化状态特异性方式与经处理的DNA杂交。例如,为了检测未甲基化核酸群体中的甲基化核酸,可以通过使用在相关位置包含“CpA”或“TpA”的封闭序列来抑制在所述位置未甲基化的核酸的扩增,与之对应,如果需要抑制甲基化核酸扩增,则使用“CpG”。
对于使用了封闭寡核苷酸的PCR方法,对聚合酶介导的扩增的有效干扰要求封闭寡核苷酸不能被聚合酶延长。优选地,这是通过使用封闭物来实现的,所述封闭物为3'-脱氧寡核苷酸或在3'位置衍生的具有“游离”羟基以外的寡核苷酸。例如,3'-O-乙酰基寡核苷酸是优选的封闭物分子类别的代表。
另外,聚合酶介导的封闭寡核苷酸的分解应当被阻止。优选地,此类阻止包括使用缺乏5'-3'核酸外切酶活性的聚合酶,或使用例如在其5'-末端具有硫醇盐桥的修饰的封闭寡核苷酸,使封闭物分子抗核酸酶。特定的应用可能不需要对封闭物进行5'修饰。例如,如果封闭物结合位点和引物结合位点重叠,因而阻止了引物的结合(例如使用过量的封闭物),封闭寡核苷酸的降解将被基本上阻止。这是因为聚合酶不会将引物延伸至、并超过封闭物(沿5'-3'方向),该过程通常会导致杂交的封闭寡核苷酸降解。
出于本申请的目的并且也如本文所实施,特别优选的封闭物/PCR实施方式包括使用肽核酸(PNA)寡聚物作为封闭寡核苷酸。此类PNA封闭低聚物是理想的,因为它们既不会被分解也不会被聚合酶延伸。
在一些实施方式中,所述至少一个目标标记物是用DNA聚合酶预扩增的。
如本文所用,术语“DNA聚合酶”是指催化三磷酸单脱氧核糖核苷酸(dNTP)合成多聚脱氧核糖核苷酸的酶,其完成在DNA复制、修复以及在某些情况下细胞分化中的最基本功能。
原核生物中的DNA聚合酶的实例包括DNA聚合酶I、DNA聚合酶II、DNA聚合酶III、DNA聚合酶IV和DNA聚合酶V。已知在大肠杆菌(E.coli)中有DNA聚合酶I、II和III。DNA聚合酶III在基因组复制中似乎是最重要的。DNA聚合酶I的重要性在于其可以在增长的链的末端删除掉未配对的碱基。逆转录病毒具有独特的DNA聚合酶,即,逆转录酶,它使用RNA模板合成DNA。对于真核生物,DNA聚合酶的实例是聚合酶α、β、λ、γ、σ、μ、δ、ε、η、ι、κ、ζ、θ和Rev1。动物细胞的DNA聚合酶负责DNA在细胞核和线粒体中的复制。
在预扩增步骤中使用的PCR试剂可以是任何可商购的PCR混合物(例如KAPA2GFast MultiplexPCRKit,
Figure BDA0002940865460000291
Universal Probe qPCR Master Mix,EpiTectMethyLightPCRKit等),其用于扩增经处理的DNA。或者,本领域技术人员可以在实验室中制备包括Mg2+、dNTP、DNA聚合酶等的PCR试剂。本领域技术人员还可以根据实际需要选择合适的PCR反应体系和PCR反应条件。在一些实施方式中,步骤(c)的预扩增包括5至30个反应循环,其中每个循环包括在85~99℃下反应5秒到5分钟,然后在40~80℃下反应5秒到5分钟。在一些实施方式中,步骤(c)的预扩增包括10至20个反应循环,其中每个循环包括在90~99℃下反应15秒到2分钟,然后在45~60℃下反应30秒到3分钟。在一些实施方式中,步骤(c)的预扩增包括15个反应循环,其中每个循环包括在95℃下反应30秒,然后在56℃下反应60秒。
步骤(d)
在根据本申请的方法的步骤(d)中,每个目标标记物的甲基化水平分别基于其在步骤(c)中获得的各个预扩增产物而进行定量分析。在本申请中,步骤也可以被命名为定量分析步骤。
如本文所用,术语“甲基化状态”指的是DNA区域内的一个特定的核苷酸或多个核苷酸的甲基化的存在、不存在和/或甲基化的数量。特定DNA序列的甲基化状态(例如,本文所述的目标标记物)可以指示序列中每个碱基的甲基化状态,或者可以指示序列中的碱基对的子集的甲基化状态(例如,胞嘧啶残基的甲基化状态或一个或多个特定的限制酶识别序列的甲基化状态),或者可以指示序列中区域甲基化密度的信息,虽然不能提供甲基化发生在序列中何处的精确信息。甲基化状态可以任选地由“甲基化水平”来表示或指示。甲基化水平可以通过例如定量分析在用甲基化敏感性限制性酶进行限制性消化后存在的完整DNA的量来确定。在该例中,如果使用定量PCR对DNA中的特定序列进行定量分析,模板DNA的量大约等于模拟处理的对照则表明该序列未高度甲基化,而模板量明显少于模拟处理的样品中的模板量则表明该序列中存在甲基化DNA。因此,如上述例子中的甲基化水平代表着甲基化状态,并且因此可以用作甲基化状态的定量指标。当需要将样品中序列的甲基化状态与阈值水平进行比较时,这尤其有用。
在DNA序列内一个或多个特定的CpG甲基化位点(每个具有两个CpG二核苷酸序列)的甲基化状态包括“未甲基化”、“完全甲基化”和“半甲基化”。术语“半甲基化”是指双链DNA其中仅其一条链被甲基化的甲基化状态。术语“超甲基化”是指,相对于正常对照DNA样品中的相应的CpG二核苷酸处5-甲基胞嘧啶的数量,在检测的DNA样品的DNA序列中一个或多个CpG二核苷酸处5-甲基胞嘧啶的数量增加所对应的平均甲基化状态。一个残基的甲基化状态可以是定性读数或定量读数,例如通过甲基化水平来表示的。在本申请中,术语“甲基化状态”和“甲基化水平”可以互换使用。根据本申请,可以同时确定一个以上的不同甲基化水平。
如本文所述,每个目标标记物的甲基化水平分别基于步骤(c)获得的其各自的预扩增产物而进行定量分析。DNA序列(例如目标标记物)内的一个或多个CpG二核苷酸序列的甲基化水平/状态可以通过本领域中已知的各种分析方法来确定。
在一些实施方式中,步骤(d)的所述定量分析是通过以下方式进行:聚合酶链式反应(例如实时聚合酶链式反应、数字聚合酶链式反应)、核酸测序、基于质量的分离(例如电泳法、质谱法)或靶标捕获(例如杂交、微阵列)。
在一些实施方式中,基于预扩增的DNA通过使用MSP(参见Herman,同上)分别定量分析每个目标标记物的甲基化水平。例如,通过使用在中等和/或高度严紧条件下与未转化序列特异性杂交的一种或多种引物,仅当模板在CpG位点包含甲基化胞嘧啶时才产生扩增产物。
在一些实施方式中,步骤(d)的定量分析通过实时PCR进行。实时PCR的非限制性实例包括Cottrell et al.,Nucl.Acids Res.32:e10,2003描述的HeavyMethylTMPCR;Eads etal.,Cancer Res.59:2302-2306,1999描述的MethyLightTMPCR;Rand et al.,Nucl.AcidsRes.33:e 127,2005描述的Headloop PCR。
如本文所用,术语“HeavyMethylTM PCR”是指本领域公认的一种实时PCR技术,其中一个或多个不可延伸性核酸(例如,寡核苷酸)封闭物以甲基化特异性方式与亚硫酸氢盐处理的核酸结合(即,封闭物在中等至高等严紧条件下与未突变的DNA特异性结合)。使用一种或多种引物进行扩增反应,所述引物可以任选地是甲基化特异性的,但旁侧分布一个或多个封闭物。在未甲基化的核酸(即突变的DNA)存在的情况下,封闭物结合并且无PCR产物产生。使用基本上像例如Holland et al.,Proc.Natl.Acad.Sci.USA,88:7276-7280,1991所述的TaqManTM分析方法,样品中核酸的甲基化水平得以确定。
如本文所用,术语“MethyLightTMPCR”是指基于本领域公认的一种基于荧光的实时PCR技术,其中采用了称为TaqManTM探针的双标记荧光寡核苷酸探针,并且被设计为可同位于正向和反向扩增引物之间的富含CpG的序列杂交。所述的TaqManTM探针包含一个荧光“报告因子部分”和“淬灭剂部分”共价结合到与TaqManTM寡核苷酸的核苷酸相连的接头部分(例如,亚磷酰胺)。在PCR扩增过程中,与富含CpG的序列杂交的TaqManTM探针被Taq聚合酶的5’核酸酶活性切割,从而在PCR反应过程中产生以实时方式检测的信号。在该方法中,可以将分子信标用作可检测的探针,并且该系统不依赖于所使用的DNA聚合酶的5’-3’核酸外切酶活性(参见Mhlanga and Malmberg,Methods 25:463-471,2001)。
如本文所用,术语“Headloop PCR”是指本领域公认的一种实时PCR,其选择性地扩增目标核酸,但是通过将3’茎环延伸形成不能进一步提供扩增模板的发卡结构来抑制非扩增目标变体的扩增。
在一些实施方式中,所述实时PCR是多重实时PCR。
如本文所用,术语“多重”可指,通过使用一个以上的标记物,每个标记物具有至少一个不同的检测特征,例如荧光特征(例如,激发波长、发射波长、发射强度、FWHM(半峰高处的全宽度)或荧光寿命)或独特的核酸或蛋白序列特征,可以同时对多个标记物(例如多个核酸序列)的存在和/或量进行测定的分析或其他分析方法。
在一些实施方式中,步骤(d)的定量分析通过核酸测序进行。核酸测序的示例性方法是本领域已知的,参见,例如Frommer et al.,Proc.Natl.Acad.Sci.USA 89:1827-1831,1992;Clark et al.,Nucl.Acids Res.22:2990-2997,1994。例如,通过将未使用亚硫酸氢盐处理的样品获得的序列或目标区域的已知核苷酸序列与使用亚硫酸氢盐处理的样品获得的序列进行比较,有助于鉴定DNA序列中甲基化胞嘧啶。与未处理的样品相比,在亚硫酸氢盐处理的样品中的任意胞嘧啶位点检测到的胸腺嘧啶残基都可以认为是由亚硫酸氢盐处理而引起的突变,即该位点存在甲基化的胞嘧啶。
用于测序DNA的方法是本领域已知的,并且包括例如双脱氧链终止法或Maxam-Gilbert法(参见Sambrook et al.,Molecular Cloning,A Laboratory Manual(2nd Ed.,CSHP,New York 1989))、焦磷酸测序(参见Uhlmann et al.,Electrophoresis,23:4072-4079,2002)、固相焦磷酸测序(参见Landegren et al.,Genome Res.,8(8):769-776,1998)、固相微测序(参见例如,Southern et al.,Genomics,13:1008-1017,1992)、采用FRET的微测序(参见例如,Chen and Kwok,Nucleic Acids Res.25:347-353,1997)、连接法测序或超深度测序(参见Marguiles et al.,Nature 437(7057):376-80(2005))。
在一些实施方式中,步骤(d)的所述定量分析通过基于质量的分离(例如电泳、质谱法)进行。
例如,甲基化胞嘧啶残基的存在可以通过联合亚硫酸氢盐限制分析法(COBRA)进行检测,基本如Xiong and Laird,Nucl.Acids Res.,25:2532-2534,2001所述。这种方法利用了在使用可以选择性地突变未甲基化的胞嘧啶残基的化合物(例如,亚硫酸氢盐)处理之后,在甲基化和未甲基化的核酸之间的限制酶识别位点的差异。例如,限制性核酸内切酶Taq1切割序列TCGA,在对未甲基化核酸进行亚硫酸氢盐处理后该序列将是TTGA,因此将不被切割。然后使用本领域已知的检测手段例如电泳和/或质谱法,检测消化的和/或未消化的核酸。
又例如,在用选择性突变未甲基化胞嘧啶残基的化合物处理后,基于核苷酸序列和/或二级结构的差异,使用不同的技术来检测扩增产物中核酸差异,例如甲基化特异性单链构象分析(MS-SSCA)(Bianco et al.,Hum.Mutat.,14:289-293,1999)、甲基化特异性变性梯度凝胶电泳(MS-DGGE)(Abrams and Stanton,Methods Enzymol.,212:71-74,1992)和甲基化特异性变性高效液相色谱(MS-DHPLC)(Deng et al.,Chin.J.Cancer Res.,12:171-191,2000)。
在一些实施方式中,步骤(d)的定量分析是通过靶标捕获(例如杂交、微阵列)来进行的。
通过杂交的合适的检测方法是本领域已知的,例如Southern、斑点印迹、狭缝印迹或其他核酸杂交方式(Kawai et al.,Mol.Cell.Biol.14:7421-7427,1994;Gonzalgo etal.,Cancer Res.57:594-599,1997)。在一些实施方式中,用于杂交分析的探针被可检测地标记。在一些实施方式中,用于杂交分析的基于核酸的探针是未标记的。这种未标记的探针可以固定在固体载体如微阵列上,并且可以与被可检测地标记的目标核酸分子杂交。
微阵列的一个实例是甲基化特异性微阵列,其可用于区分具有转化的胞嘧啶残基的序列和具有未转化的胞嘧啶残基的序列(参见Adorjan et al.,Nucl.Acids Res.,30:e21,2002)。基于杂交的分析还可被用于用甲基化敏感的限制酶处理后的核酸。
又例如,可通过寡核苷酸探针确定DNA序列内CpG二核苷酸序列的甲基化状态,所述寡核苷酸探针与PCR扩增引物同时与亚硫酸氢盐处理的DNA杂交(其中所述引物可以是甲基化特异性引物或标准引物)。
在一些实施方式中,步骤(d)在检测试剂的存在下进行。如本文所用,术语“检测试剂”是在定量分析步骤中用于检测核酸的存在、不存在或量的试剂。
本领域已知的各种检测试剂在本申请中都可使用。在一些实施方式中,检测试剂选自下组:荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。
优选地,用于检测Septin9的探针为SEQ ID NO:36;检测BCAT1的探针为SEQ IDNO:37;用于检测IKZF1的探针为SEQ ID NO:38;用于检测PKNOX2的探针为SEQ ID NO:39和40;用于检测CRHBP的探针为SEQ ID NO:41;用于检测SOX1的探针为SEQ ID NO:42;用于检测基因间隔区A的探针为SEQ ID NO:43。
在一些实施方式中,所述探针至少包括选自下组的一条或多条核苷酸序列:SEQID NO:36-38、SEQ ID NO:41-43、以及SEQ ID NO:39和/或SEQ ID NO:40。优选地,所述探针包括SEQ ID NO:36-38中的至少一条、至少两条或全部三条核苷酸序列和SEQ ID NO:39和/或40以及SEQ ID NO:41-43中的至少一条、至少两条或至少三条核苷酸序列。在一些实施方式中,所述探针包括SEQ ID NO:36-38和41-43所示的核苷酸序列,以及SEQ ID NO:39和/或40所示的核苷酸序列。
在一些实施方式中,对照标记物为ACTB,其示例性的探针的核苷酸序列如SEQ IDNO:58所述。
在一些实施方式中,荧光探针的5’端标记有荧光染料(例如FAM、HEX/VIC、TAMRA、Texas Red或Cy5),3’端标记有猝灭剂(例如BHQ1、BHQ2、BHQ3、DABCYL或TAMRA)。
标记可以通过直接或间接方法来完成。直接标记涉及将标记直接(共价或非共价)偶联至试剂上。间接标记涉及第二试剂与第一试剂的结合(共价或非共价)。第二试剂应与第一试剂特异性结合。所述第二试剂可以与合适的标记偶联和/或第二试剂是可与第二试剂结合的第三试剂的目标(受体)。使用二级、三级甚至更高阶的试剂通常会增加信号强度。合适的二级和高级试剂可以包括抗体、二级抗体和众所周知的链霉亲和素-生物素系统(Vector Laboratories,Inc.)。试剂或底物也可以被本领域中已知的一个或多个标签“标记”。
在一些实施方式中,步骤(d)的所述定量分析包含使用定量引物对和DNA聚合酶对步骤(c)的预扩增产物进行扩增,其中所述预扩增产物通过扩增产生扩增产物。
如本文所用,术语“定量引物对”是指在定量分析步骤中使用的一个或多个引物对。
在一些实施方式中,步骤(d)使用的所述定量引物对能够与步骤(c)的所述预扩增产物的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。在一些实施方式中,步骤(d)中所使用的定量引物对与在步骤(c)的预扩增引物池中的甲基化特异性引物对相同。
在一些实施方式中,步骤(d)中使用的定量引物对被设计为扩增步骤(c)的所述预扩增产物内的至少一部分,即步骤(c)和步骤(d)被设计为巢式PCR。
巢式PCR是PCR的一种改进,旨在提高灵敏度和特异性。巢式PCR涉及使用两个引物组和两个连续的PCR反应。进行第一轮扩增以产生第一扩增子,并使用一个引物对进行第二轮扩增,其中一个或两个引物与由初始引物对界定的区域内的位点退火,即第二个引物对被认为是“嵌套”在第一对引物中。以这种方式,不包含正确内部序列的来自第一次PCR反应的背景扩增产物在第二次PCR反应中不再被进一步扩增。
在一些实施方式中,步骤(d)的定量分析包括基于所述预扩增产物中的多个CpG二核苷酸、TpG二核苷酸或CpA二核苷酸的存在或水平,确定每个目标标记物的甲基化水平。在一些实施方式中,步骤(d)的所述定量分析包括基于所述预扩增产物中一个或多个CpG二核苷酸的存在或水平来确定胞嘧啶残基的甲基化水平。在一些实施方式中,步骤(d)的所述定量分析包括基于所述预扩增产物中一个或多个TpG二核苷酸的存在或水平来确定胞嘧啶残基的甲基化水平。在一些实施方式中,步骤(d)的所述定量分析包括基于所述预扩增产物中CpA二核苷酸的存在来确定胞嘧啶残基的甲基化水平。
在一些实施方式中,定量分析步骤是通过将步骤(c)的所述预扩增产物分为多个组分来进行的。在一些实施方式中,对多个组分进行多个不同的定量分析实验,其中在多个组分之一中定量分析所述预扩增产物(如果存在于所述组分中的话)的不同组合。在一些实施方式中,定量分析每个组分中的对照标记物。
步骤(e)
在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法的步骤(e)中,由步骤(d)的获得的目标标记物的甲基化水平分别与相应的参考水平进行比较,其中,组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平、且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤,或者所述个体有结直肠进展期腺瘤形成或形成的风险,或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加,或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。
根据本申请的方法的步骤(e)也可以被称为比较步骤。
本文所用的术语“比较”是指分别对检测的生物样本所含有的通过定量分析步骤获取的目标标记物的甲基化水平与其相应的参考水平进行对比。应当理解,本文所用的术语是指相应参数或值的比较,例如,将绝对量与绝对参考量进行比较,将浓度与参考浓度进行比较,或从检测的样本中获得的强度信号同参考样本的同类型的强度信号进行比较。可以通过手动或计算机辅助进行比较。对于计算机辅助进行的比较,可以将所确定的量的值与通过计算机程序存储在数据库中的合适参考的值进行比较。该计算机程序可以进一步评估比较的结果,并以合适的输出格式自动提供期望的评估。基于定量分析步骤中每个目标标记物的甲基化水平与相应参考水平的比较,可以识别出患有结直肠进展期腺瘤、或者有结直肠进展期腺瘤形成或形成的风险、或者有结直肠进展期腺瘤发展或发展的可能性增加、或者有结直肠进展期腺瘤预后不良或预后不良的风险的个体。
如本文所用,术语“参考水平”是指将个体纳入或排除结肠直肠进展期腺瘤或结肠直肠进展期腺瘤的形成或形成的风险的阈值水平。
本文所述的“相对于其相应的参考水平具有更高的甲基化水平”指组(I)中所检测的目标标记物的甲基化水平至少是其相应参考水平的1.1、1.2、1.3、1.4、1.5、2、3、4、5、6、7、8、9、10倍或更多倍。本文所述的“相对于其相应的参考水平具有较低的甲基化水平”指组(II)所检测的目标标记物的甲基化水平是其相应参考水平的98%、95%、93%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%甚至更低。在本申请中,为了在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后,不需要组(I)的每个目标标记物的甲基化水平均高于其相应的参考水平以及组(II)的每个目标标记物的甲基化水平均低于其相应的参考水平。准确的说,如果在定量分析步骤中进行定量分析的每一组中至少有一种目标标记物的甲基化水平等于或高于其相应的参考水平就足够了。
目标标记物的甲基化的参考水平可以源自一个或多个参考样品,其中参考水平获自与检测目的样品的实验平行进行的实验。或者,可以在数据库中获得参考水平,该数据库包括来自一个或多个参考样品或疾病参考样品的数据、标准或水平的集合。在一些实施方式中,此类数据、标准或水平的集合被标准化,以便可用于与来自一个或多个样品的数据进行比较的目的。“标准化”是将测量原始数据转换为可以直接与其他标准化数据进行比较的数据的过程。标准化被用于克服因不同的分析方法里因素不同而导致的、分析方法特异性的误差,例如上样量的不同、结合效率的不同、检测灵敏度的不同和其他各类的误差。
在一些实施方式中,参考数据库包括来自一个或多个参考样品的目标标记物和/或其他实验室和临床数据的甲基化水平。在一些实施方式中,参考数据库包括目标标记物的甲基化水平,其各自被标准化为在与参考样品相同的条件下检测的对照标志物的甲基化水平的百分比。为了与目标标记物的如此标准化甲基化水平进行比较,测试样品的目标标记物的甲基化水平也被测量并计算为在与测试样品相同的条件下检测的对照标记物的甲基化水平的百分比。
在一些实施方式中,通过汇总获自健康个体和/或非肿瘤个体(即已知没有肿瘤的个体)的参考样品的参考水平数据来建立参考数据库。在一些实施方式中,通过汇总获自正在接受结直肠瘤治疗的个体的参考样品的参考水平数据来建立参考数据库。在一些实施方式中,通过汇总获自结直肠瘤不同阶段的个体的参考样品的数据来建立参考数据库,所述结直肠瘤不同阶段是通过例如目标标记物的不同的甲基化水平来证明的。
本领域技术人员可以根据期望的灵敏度和特异性来选择参考水平。确定合适的参考水平的手段是本领域技术人员已知的,例如参考水平可以从临床研究中收集的数据来确定。
在一些实施方式中,步骤(e)的参考水平是基于从患有结直肠进展期腺瘤或具有患结直肠进展期腺瘤风险的一组个体中获取的临床样本和从未患结直肠进展期腺瘤或不具有患结直肠进展期腺瘤风险的一组个体中获取的临床样本来确定的。
本领域技术人员可以基于各种因素,例如年龄、性别、病史、家族史、症状等,来确定个体是否患结直肠进展期腺瘤或具有患结直肠进展期腺瘤的风险。
在一些实施方式中,用循环阈值(即Ct值)来表示目标标记物的甲基化水平和参考水平。如本文所用,术语“Ct值”是指在背景信号以上可以检测到PCR产物的荧光的循环数。Ct值与样品中目标标记物的数量成反比,即Ct值越低,样品中目标标记物的数量就越大。
例如,在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法的步骤(e)中,组(I)所述目标标记物中至少一个目标标记物的Ct值相对于其相应的参考Ct值低,且组(II)所述目标标记物中至少一个目标标记物的Ct值相对于其相应的参考Ct值高,表明所述个体患有结直肠进展期腺瘤,或者所述个体有结直肠进展期腺瘤形成或形成的风险,或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加,或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。在一些实施方式中,如果组(I)所述目标标记物中至少一个目标标记物Ct值比其对应的参考Ct值低2-10个循环(例如2、3、4、5、6、7、8、9、10个循环)且组(II)所述目标标记物中至少一个目标标记物的Ct值相对于其相应的参考Ct值高2-10个循环(例如2、3、4、5、6、7、8、9、10个循环),则确定所述个体患有结直肠进展期腺瘤,或者所述个体有结直肠进展期腺瘤形成或形成的风险,或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加,或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。
如本文所用,术语“可能性增加”,是指与从中获得参考样品的个体相比,在个体发展结直肠进展期腺瘤或有结直肠进展期腺瘤预后不良的可能性水平方面总体增加5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或更高。
2.试剂盒
在另一方面,本申请还提供了一种用于诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的试剂盒,其包含:
(a)处理DNA的第一试剂,其中所述第一试剂能够区分DNA中的甲基化和未甲基化的CpG位点;
(b)第二试剂,所述第二试剂用于定量分析目标标记物中每个目标标记物的甲基化水平;其中,所述目标标记物包括以下两组目标标记物中每一组目标标记物中的至少一种:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A;和任选的
(c)第一引物池,所述第一引物池包含用于预扩增以下两组目标标记物中每一组目标标记物中的至少一种目标标记物的引物对:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A,其中所述引物对可与被所述第一试剂处理后的所述目标标记物的目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交,其中所述目标序列包含至少一个CpG位点。
优选地,所述试剂盒包含:
(a)处理DNA的第一试剂,其中所述第一试剂能够区分DNA中的甲基化和未甲基化的CpG位点;
(b)第一引物池,所述第一引物池包含用于预扩增以下两组目标标记物中每一组目标标记物中的至少一种目标标记物的引物对:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A,其中所述引物对可与被所述第一试剂处理后的所述目标标记物的目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交,其中所述目标序列包含至少一个CpG位点;
(c)第二试剂,所述第二试剂用于定量分析被所述第一引物池预扩增的所述目标标记物中每个目标标记物的甲基化水平。
在一些实施方式中,所述第二试剂包含第二引物池,所述第二引物池包含多个定量引物对,所述定量引物对能够与被所述第一引物池预扩增的所述目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。
在一些实施方式中,所述第二引物池中的至少一个定量引物对和所述第一引物池中的至少一个引物对相同。在一些实施方式中,所述第二引物池中的定量引物对被设计为用于扩增被所述第一引物池预扩增的所述目标序列内的至少一部分。在一些实施方式中,所述第一引物池包含至少一个甲基化特异性引物对。
在一些实施方式中,所述第一引物池和所述第二引物池被包装在单一容器内或被包装在独立容器内。在一些实施方式中,所述试剂盒进一步包含一个或多个封闭寡核苷酸。
在一些实施方式中,所述试剂盒进一步包含检测试剂。在一些实施方式中,所述检测试剂选自下组:荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。在一些实施方式中,所述探针至少包括选自下组的一条或多条核苷酸序列:SEQ ID NO:36-38、SEQ ID NO:41-43、以及SEQ ID NO:39和/或SEQ ID NO:40。优选地,所述探针包括SEQ ID NO:36-38中的至少一条、至少两条或全部三条核苷酸序列和SEQ IDNO:39和/或40以及SEQ ID NO:41-43中的至少一条、至少两条或至少三条核苷酸序列。在一些实施方式中,所述探针包括SEQ ID NO:36-38和41-43所示的核苷酸序列,以及SEQ IDNO:39和/或40所示的核苷酸序列。在一些实施方式中,所述荧光探针的5’端标记有荧光染料(例如FAM、HEX/VIC、TAMRA、Texas Red或Cy5),3’端标记有猝灭剂(例如BHQ1、BHQ2、BHQ3、DABCYL、TAMRA或lowa Black Dark Quenchers)。
在一些实施方式中,所述试剂盒进一步包含DNA聚合酶和/或适合存放从所述个体中获取的所述生物样品的容器。在一些实施方式中,所述试剂盒进一步含使用说明书和/或对试剂盒检测结果的解释。
在一些实施方式中,所述试剂盒可包含包装在独立的容器中的反应缓冲液,该反应缓冲液针对由聚合酶介导的引物延伸(例如PCR)进行了优化。优选的是这样的试剂盒:其进一步包括容器,所述容器适合容纳用于在个体的生物样品中确定下组(I)中的至少一个(例如2、3、4或5个)目标标记物以及下组(II)中的至少一个(例如2、3或4个)目标标记物的甲基化的装置:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A。
在一些实施方式中,所述第一试剂包括亚硫酸氢盐试剂或甲基化敏感限制酶(MSRE)。在一些实施方式中,所述亚硫酸氢盐试剂选自下组:亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子,及其任意组合。在一些实施方式中,亚硫酸氢盐试剂是亚硫酸氢钠。在一些实施方式中,所述MSRE选自下组:HpaII酶、SalI酶、
Figure BDA0002940865460000391
酶、ScrFI酶、BbeI酶、NotI酶、SmaI酶、XmaI酶、MboI酶、BstBI酶、ClaI酶、MluI酶、NaeI酶、NarI酶、PvuI酶、SacII酶、HhaI酶及其任意组合。
在一些实施方式中,所述第一引物池包含至少一个甲基化特异性引物对,用于预扩增选自下组(I)的至少一个目标标记物中的至少一个目标序列:(I)Septin9、BCAT1和IKZF1。在一些实施方式中,所述第一引物池包含至少一个甲基化特异性引物对,用于预扩增选自下组(II)的至少一个目标标记物中的至少一个目标序列:PKNOX2、SOX1、CRHBP和基因间隔区A。在一些实施方式中,所述第一引物池包含至少两个甲基化特异性引物对,其中一个用于预扩增选自下组(I)的至少一个目标标记物中的至少一个目标序列:(I)Septin9、BCAT1和IKZF1,另一个用于预扩增选自下组(II)的至少一个目标标记物中的至少一个目标序列:PKNOX2、SOX1、CRHBP和基因间隔区A。
在一些实施方式中,所述第一引物池包含用于预扩增以下两组目标标记物的引物对:所述组(I)中的至少2个或全部3个目标标记物,以及所述组(II)中的至少2个、至少3个或全部4个目标标记物。
在一些实施方式中,所述第一引物池包含用于预扩增组(I)的下述目标标记物的引物对:Septin9与BCAT1,BCAT1与IKZF1,或Septin9与IKZF1被扩增。
在一些实施方案中,所述第一引物池包含用于预扩增组(II)的下述目标标记物的引物对:PKNOX2与CRHBP,PKNOX2与SOX1,PKNOX2与基因间隔区A,CRHBP与基因间隔区A,或SOX1与基因间隔区A。在一些实施方案中,所述第一引物池包含用于预扩增组(II)的下述目标标记物的引物对:PKNOX2、CRHBP和SOX1,PKNOX2、CRHBP和基因间隔区A,PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A。
在一些实施方中,所述第一引物池包含用于预扩增下述目标标记物的引物对:Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。
在一些实施方式中,所述的各个目标标记物包括或是:
a)如下所示的通过Hg19坐标定义的各个区域:Septin9,chr17:75276651-75496678;BCAT1,chr12:24964295-25102393;IKZF1,chr7:50343720-50472799;PKNOX2,chr11:125034583-125303285;CRHBP,chr5:76248538-76276983;SOX1,chr13:112721913-112726020;基因间隔区A,chr10:130082033-130087148;以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb;或
b)亚硫酸氢盐转化后的a)的对应区域;或
c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。
在一些实施方式中,所述第一引物池至少包含选自以下的引物对中的一对或多对:SEQ ID NO:22/23、24/25、26/27、28/29、30/31、32/33和34/35。优选地,所述第一引物池包含选自下组(I)的至少一对、至少两对或全部三对引物对和下组(II)的至少一对、至少两对、至少三对引物对:(I)SEQ ID NO:22/23、24/25、26/27;(II)SEQ ID NO:28/29、30/31、32/33和34/35。在一些实施方式中,所述第一引物池包含以下引物对:SEQ ID NO:22/23、24/25、26/27、28/29、30/31、32/33和34/35,任选地其中所述第二引物池包含至少一个与所述第一引物池中的至少一个引物对相同的引物对。在一些实施方式中,第二引物池中的引物对与第一引物池中的引物对完全相同。
在一些实施方式中,所述第一引物池和所述第二引物池进一步包含用于扩增对照标记物的引物对。在一些实施方式中,所述对照标记物选自下组:ACTB、GAPDH、微管蛋白、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。
在一些实施方式中,所述试剂盒进一步包含多个容器,每个容器均用于接收所述第二引物池的组分。
在一些实施方式中,所述试剂盒还包含可用于进行CpG位置特异性甲基化分析的标准试剂,其中所述分析包括以下一种或多种技术:MS-SNuPE、MSP、MethyLightTM、HeavyMethylTM、COBRA和核酸测序。
在一些实施方式中,所述试剂盒可包含选自下组的额外的试剂:缓冲液(例如限制酶、PCR、保存或洗涤缓冲液)、DNA回收试剂或试剂盒(例如沉淀、超滤、亲和柱)和DNA回收组件。
在一些实施方式中,本申请的试剂盒可包含:
a)亚硫酸氢盐试剂;
b)第一引物池,所述引物池包含多个甲基化特异性引物对,用于预扩增下组(I)中的至少一个目标标记物和下组(II)中的至少一个目标标记物:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A,其中所述甲基化特异性引物对包含以下引物对,或由以下引物对组成:SEQ ID NO:22/23、24/25、26/27、28/29、30/31、32/33和34/35;
c)第二试剂,所述第二试剂用于定量分析被所述第一引物池预扩增的目标标记物的每一个的甲基化水平,其中所述第二试剂包含第二引物池,所述第二引物池包含多个定量引物对,所述定量引物对能够与被所述第一引物池预扩增的所述目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。
本申请的试剂盒还可包含包装在独立容器中的其他组分,例如适用于封闭、洗涤或包被的缓冲液或溶液。
本申请的试剂盒可进一步包含在DNA富集领域中已知的以下组分的一种或几种:蛋白组分,所述蛋白选择性地结合甲基化的DNA;三链形成核酸组分,一个或多个接头,任选地在合适的溶液中;用于进行连接的物质或溶液,例如连接酶、缓冲液;用于进行柱层析的物质或溶液;用于进行免疫学为基础的富集(例如免疫沉淀)的物质或溶液;用于进行核酸扩增的物质或溶液,例如PCR;一种染料或几种染料,若适用于偶联剂,若适用于溶液中;用于进行杂交的物质或溶液;和/或用于进行洗涤步骤的物质或溶液。
3.用途
在另一方面,本申请提供了本申请的试剂盒在制造用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后或监测接受结直肠瘤治疗的个体对治疗的应答的诊断试剂盒中的用途。
在另一方面,本申请提供用于定量分析目标标记物的甲基化水平的试剂在制造试剂盒中的用途,所述试剂盒被用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法中。
优选地,所述方法中的各个步骤以及各步骤所用的各试剂如本文“1.方法”部分所述,因此,本发明的试剂盒可根据该方法而包括用于该方法各步骤所需的各试剂。
优选地,所述试剂盒为本文“2.试剂盒”部分所述。
优选地,所述目标标记物包括:所述组(I)中的至少2个或全部3个目标标记物,和所述组(II)中的至少2个、至少3个或全部4个目标标记物。
优选地,所述目标标记物包括Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A。
优选地,所述试剂包括扩增引物,用于扩增所述目标标记物的引物对。
优选地,所述试剂包括用于扩增:所述组(I)中的Septin9与BCAT1,BCAT1与IKZF1,或Septin9与IKZF1的引物对;或所述组(I)的Septin9、BCAT1和IKZF1的引物对。
优选地,所述试剂包括用于扩增:所述组(II)中的PKNOX2与CRHBP,PKNOX2与SOX1,PKNOX2与基因间隔区A,CRHBP与基因间隔区A,或SOX1与基因间隔区A的引物对;所述组(II)中的PKNOX2、CRHBP和SOX1,PKNOX2、CRHBP和基因间隔区A,PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A的引物对;或所述组(II)中的PKNOX2、CRHBP、SOX1和基因间隔区A的引物对。
优选地,用于扩增Septin9的引物对为SEQ ID NO:22/23;用于扩增BCAT1的引物对为SEQ ID NO:24/25;用于扩增IKZF1的引物对为SEQ ID NO:26/27;用于扩增PKNOX2的引物对为SEQ ID NO:28/29;用于扩增CRHBP的引物对为SEQ ID NO:30/31;用于扩增SOX1的引物对为SEQ ID NO:32/33;用于扩增基因间隔区A的引物对为SEQ ID NO:34/35。
优选地,所述试剂还包括定量引物对,所述定量引物对被设计为用于扩增已用所述扩增引物预扩增的所述目标序列内的至少一部分,能够与被所述第一引物池预扩增的所述目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。
优选地,所述定量引物对与所述扩增引物对相同。
优选地,所述试剂进一步包含一个或多个封闭寡核苷酸。
优选地,所述试剂进一步包含检测试剂。
优选地,所述检测试剂选自下组:荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。
优选地,所述探针至少包括选自下组的一条或多条核苷酸序列:SEQ ID NO:36-43。
优选地,所述探针包括SEQ ID NO:36-38中所示的至少一条、至少两条或全部三条核苷酸序列,和SEQ ID NO:39或40以及41-43中所示的至少一条、至少两条或至少三条核苷酸序列。
优选地,所述探针包括:SEQ ID NO:36-38和41-43所示的核苷酸序列,以及SEQ IDNO:39和/或40所示的核苷酸序列。
优选地,所述荧光探针的5’端标记有荧光染料,3’端标记有猝灭剂;优选地,所述荧光染料选自FAM、HEX/VIC、TAMRA、Texas Red或Cy5,所述淬灭剂选自BHQ1、BHQ2、BHQ3、DABCYL、TAMRA或lowa Black Dark Quenchers。
优选地,所述试剂还包括亚硫酸氢盐试剂或甲基化敏感限制酶。
优选地,所述亚硫酸氢盐试剂选自下组:亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子,及其任意组合。
优选地,所述MSRE选自下组:HpaII酶、SalI酶、
Figure BDA0002940865460000431
酶、ScrFI酶、BbeI酶、NotI酶、SmaI酶、XmaI酶、MboI酶、BstBI酶、ClaI酶、MluI酶、NaeI酶、NarI酶、PvuI酶、SacII酶、HhaI酶及其任意组合。
优选地,所述试剂包含用于扩增对照标记物的引物对。
优选地,所述对照标记物选自下组:ACTB、GAPDH、微管蛋白、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。
优选地,所述目标标记物包含或是:
a)如下所示的通过Hg19坐标定义的各个区域:Septin9,chr17:75276651-75496678;BCAT1,chr12:24964295-25102393;IKZF1,chr7:50343720-50472799;PKNOX2,chr11:125034583-125303285;CRHBP,chr5:76248538-76276983;SOX1,chr13:112721913-112726020;基因间隔区A,chr10:130082033-130087148;以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb;或
b)亚硫酸氢盐转化后的a)的对应区域;或
c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。
优选地,所述方法包括如下步骤:
(a)从所述个体获取含有DNA的生物样品;
(b)用试剂处理步骤(a)中获取的所述生物样品中的DNA,所述试剂能够区分所述DNA中的甲基化和未甲基化的CpG位点,从而获得经处理的DNA;
(c)用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下两组目标标记物(target marker)中每一组目标标记物中的至少一种目标标记物:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物;
(d)基于步骤(c)获取的预扩增产物来分别定量分析所述被扩增的目标标记物的甲基化水平;
(e)分别比较步骤(d)中的所述被扩增的目标标记物的甲基化水平和相应的参考水平,其中:组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平,且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤,或者所述个体有结直肠进展期腺瘤形成或形成的风险,或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加,或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。
在一些实施方式中,上述方法的步骤(c)中,所述组(I)中的至少2个或全部3个目标标记物被扩增。
在一些实施方式中,上述方法的步骤(c)中,所述组(I)中的Septin9与BCAT1,BCAT1与IKZF1,或Septin9与IKZF1被扩增。
在一些实施方案中,上述方法的步骤(c)中,所述组(II)中的至少2个、至少3个或全部4个目标标记物被扩增。
在一些实施方案中,上述方法的步骤(c)中,PKNOX2与CRHBP,PKNOX2与SOX1,PKNOX2与基因间隔区A,CRHBP与基因间隔区A,或SOX1与基因间隔区A被扩增。
在一些实施方案中,上述方法的步骤(c)中,PKNOX2、CRHBP和SOX1,PKNOX2、CRHBP和基因间隔区A,PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A被扩增。
在一些实施方案中,上述方法的步骤(c)中,用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下目标标记物:Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物。
在一些实施方式中,所述各个目标标记物包含或是:
a)如下所示的通过Hg19坐标定义的各个区域:Septin9,chr17:75276651-75496678;BCAT1,chr12:24964295-25102393;IKZF1,chr7:50343720-50472799;PKNOX2,chr11:125034583-125303285;CRHBP,chr5:76248538-76276983;SOX1,chr13:112721913-112726020;基因间隔区A,chr10:130082033-130087148;以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb;或
b)亚硫酸氢盐转化后的a)的对应区域;或
c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。
具体实施方式
所有实施例中使用的生物材料,包括各种克隆和表达质粒、培养基、酶、缓冲液、各种培养方法、蛋白质提取和纯化方法以及其他分子生物学操作方法,都是本领域技术人员所熟知的。更多细节请参照Sambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,N.Y.和Frederick M.Ausubel等人编写的“Short Protocolsin Molecular Biology”(Yan Ziying等译,科学出版社(北京),1998)。
实施例
本实施例通过检测Septin9、BCAT1、IKZF1高甲基化及PKNOX2、CRHBP、SOX1、基因间隔区(hg19,chr10:130085033-130085148)低甲基化来筛查结直肠进展期腺瘤。
为评估甲基化标志物在结直肠进展期腺瘤检测中的临床性能,我们使用预扩增检测法,检测了117份经临床诊断为结直肠进展期腺瘤的血浆样品和100份结肠镜检查为阴性的血浆对照样品。检测位点为Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)。
预扩增方法
预扩增方法包括以下步骤:
1、使用QIAamp Circulating Nucleic Acid Kit(Qiagen)从1-4ml血浆样品中获得细胞外游离DNA(cfDNA)样品。
2、使用亚硫酸氢盐试剂(MethylCodeTM Bisulfite Conversion Kit)对20ngcfDNA进行亚硫酸氢盐转化以获得转化的cfDNA。
3、将转化的cfDNA样品进行预扩增。简而言之,在甲基化特异性引物对的存在下,通过PCR反应对从上述步骤2获得的转化的cfDNA进行预扩增,所述甲基化特异性引物对专门针对Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)而设计。在PCR反应体系中,每个引物的终浓度均为200nM。25μL PCR混合物由10μL转化的cfDNA、2.5μL含有上述引物的预混液和12.5μL PCR试剂(
Figure BDA0002940865460000451
UniversalProbe qPCR Master Mix(NEB))组成。
PCR反应条件如下:95℃3分钟;95℃30秒,56℃60秒,10个循环。ProFlex TM PCR系统(Thermo Fisher)。
4、将从上述步骤3获得的预扩增产物稀释10倍,然后用于多重荧光PCR检测,专门针对Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)。qPCR混合物由10μL稀释的预扩增产物、2.5μL引物/探针池、12.5μL PCR试剂(
Figure BDA0002940865460000461
Universal Probe qPCR Master Mix(NEB))组成。非CpG的ACTB区域用作每个反应孔的内参。不同标记物的检测探针用不同的荧光进行标记。在PCR反应体系中,每个引物的终浓度为500nM,每个检测探针的终浓度为200nM。PCR反应条件如下:95℃5分钟;95℃15秒,56℃40秒(采集荧光),50个循环。使用ABI 7500Real-Time PCR System在相应的荧光通道检测不同的荧光。
结果
将没有扩增信号样品的Ct值设置为50。分别统计Septin9、BCAT1、IKZF1的Ct平均值及PKNOX2、CRHBP、SOX1、基因间隔区A(hg19,chr10:130085033-130085148)的Ct平均值。图1显示患有进展期腺瘤的群体和结肠镜检查为阴性的群体中目标标志物Septin9、BCAT1、IKZF1 Ct值分布,患有进展期腺瘤的群体整体Ct值比阴性群体要小,提示甲基化水平更高。如图2所示,患有进展期腺瘤的群体中目标标志物PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)的检测Ct较阴性对照要大,提示更低的甲基化水平。
表3显示了在预扩增方法中检测Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)目标标记物对进展期腺瘤的检测结果。根据Septin9、BCAT1、IKZF1的平均Ct值ROC曲线,确定平均Ct小于44为检测阳性;根据PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区(hg19)的平均Ct值ROC曲线,划定平均Ct大于38为检测阳性。样本最终结果Septin9、BCAT1、IKZF1的高甲基化或PKNOX2、CRHBP、SOX1和位于chr10:130085033-130085148的基因间隔区A(hg19)的低甲基化任一为阳性即为检测阳性。如表3所示,预扩增方法显示出对进展期腺瘤具有超高灵敏度(54.7%)和对结肠镜检查为阴性的群体的高特异性(82.7%)。对进展期腺瘤的检出率远高于目前已有的血液检测方法。
表3:预扩增方法结果和结肠镜检查结果的对比
Figure BDA0002940865460000462
Figure BDA0002940865460000471
序列表
<110> 复旦大学附属中山医院
上海鹍远生物技术有限公司
<120> 结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒
<130> 20A341
<160> 46
<170> SIPOSequenceListing 1.0
<210> 1
<211> 7398
<212> DNA
<213> Homo sapiens
<400> 1
ctggagccgg tgggctctga gcacagtcac gaaggcatgc gcactttctg gctgctctcc 60
tgccattgtc ccttgggttc ccattttggt gaggcgtgca ccctggcggc gctccccagg 120
gaactaaata tgtttgctgc actgtgcgtg gagatggaga atgtacaatt ggctgaccct 180
gtgctaatct ggtggaactc catgccagcc ctgggaaaga acaattgcat gggtgtgtcc 240
acactcacca ggtgcttttt agaaaaacac tcgagaataa tgctgtggct taggatggct 300
gttgtgccgg acccggcatc ttcccagggg ggctgtgttg ttgggctgag tttcttaggt 360
actggacccc caaatcccca aatacggcgt ggacaggtgg cccagtaggg gctggactat 420
ccgataggcc caggtgctgg agttcagaca agacataccc tggcctggcg tggaagatac 480
ggggtgctat taatggcagc aatggctgca tttctgaaac ccgggctccc aggccgacga 540
gggtgtgcac gcatctgaaa tgtctgtggt tttgcagttc ccatgtccac aaactcactt 600
ggttgaaaat agttcaaaat atccaaagca tgagggaggg agtgcctgct tttcttaaaa 660
aggaaggact tgatttcatc tacttaaaaa gccacccaaa cctagaacat tttccgcaag 720
agaccccctg ccccccgcct ctccagaatg gctggagagt ctcagcactc ctgcacattt 780
gggatatttc agagggggtg gggaggggca agtgggcagc gagcgacctc agacccagga 840
tgagctgtca ggcgctcccc ggccacacat tcaagggacc ggagtgcagt tgtagcgttg 900
cggcctgctg cttcgggggt gggggtgttg ttccatgctg tgaattctca catggcccct 960
gactctgggc agaggccgag ggtctaaggg acggggtgac agggagagca tgcaggagtg 1020
ggtttctggc tttccagggc gagtggaaga agcgcctctc tctcttgtag gtgacagacc 1080
tggggggccc ttcttgagga tgagagcctg ttgcttctca agttctgtgt ctaacccagg 1140
tccccaggtc taccccagcc cctcggccct gcctgccttg tggatgatat agtttaaggg 1200
tagagaccgc tggcctggag ggaaggctag gcctcaggtt agggcccaga agggagggag 1260
aagcccttgg ggcagctccc tttctgctca ctcactgcct agctccttcc ttcacacctt 1320
ccttcggaaa cgtctgctcc tgacaaggtc tacttcctgc tctcaggagg cccttattgt 1380
ggaggaaggg aggcgtcgcc cgtccctggc ttctctgaca gccgtgttcc atccccgccc 1440
tgtgcccctt ctcccggaca gtgccttctc cagggctcac ccaggagggt gcagcggtgg 1500
cccccggggc ggtggtcgtg gtgggggtgt tagctgcagg ggtgccctcg gtgggtggga 1560
gttggtggcc tctcgctggt gccatgggac tcgcatgttc gccctgcgcc cctcggctct 1620
tgagcccaca ggccgggatc ctgcctgcca gccgcgtgcg ctgccgttta acccttgcag 1680
gcgcagagcg cgcggcggcg gtgacagaga actttgtttg gctgcccaaa tacagcctcc 1740
tgcagaagga ccctgcgccc ggggaagggg aggaatctct tcccctctgg gcgcccgccc 1800
tcctcgccat ggcccggcct ccacatccgc ccacatctgg ccgcagcggg gcgcccgggg 1860
ggaggggctg aggccgcgtc tctcgccgtc ccctgggcgc gggccaggcg gggaggaggg 1920
gggcgctccg gtcgtgtgcc caggactgtc ccccagcggc cactcgggcc ccagcccccc 1980
aggcctggcc ttgacaggcg ggcggagcag ccagtgcgag acagggaggc cggtgcgggt 2040
gcgggaacct gatccgcccg ggaggcgggg gcggggcggg ggcgcagcgc gcggggaggg 2100
gccggcgccc gccttcctcc cccattcatt cagctgagcc agggggccta ggggctcctc 2160
cggcggctag ctctgcactg caggagcgcg ggcgcggcgc cccagccagc gcgcagggcc 2220
cgggccccgc cgggggcgct tcctcgccgc tgccctccgc gcgacccgct gcccaccagc 2280
catcatgtcg gaccccgcgg tcaacgcgca gctggatggg atcatttcgg acttcgaagg 2340
tgggtgctgg gctggctgct gcggccgcgg acgtgctgga gaggaccctg cgggtgggcc 2400
tggcgcggga cgggggtgcg ctgaggggag acgggagtgc gctgagggga gacgggaccc 2460
ctaatccagg cgccctcccg ctgagagcgc cgcgcgcccc cggccccgtg cccgcgccgc 2520
ctacgtgggg gaccctgtta ggggcacccg cgtagaccct gcgcgccctc acaggaccct 2580
gtgctcgttc tgcgcactgc cgcctgggtt tccttccttt tattgttgtt tgtgtttgcc 2640
aagcgacagc gacctcctcg agggctcgcg aggctgcctc ggaactctcc aggacgcaca 2700
gtttcactct gggaaatcca tcggtcccct ccctttggct ctccccggcg gctctcgggc 2760
cccgcttgga cccggcaacg ggatagggag gtcgttcctc acctccgact gagtggacag 2820
ccgcgtcctg ctcgggtgga cagccctccc ctcccccacg ccagtttcgg ggccgccaag 2880
ttgtgcagcc cgtgggccgg gagcaccgaa cggacacagc ccaggtcgtg gcagggtcta 2940
gagtgggatg tcccatggcc cccatccagg cctggggata tcctcatccg cctcccagaa 3000
tcgggccgtg ggggacagaa ggggcctgcg tgcgggcagg gagagtattt tggctctctc 3060
ctgtcttcgg ggtttacaaa gtgtgttggg acttgcgggg ctgctctgtc caagcctggg 3120
tctggcgtcc gcgtctctga gcctgtgagt gcgtgcgctt tcctgcgtcc tcttgactgc 3180
cggtgctggg gctctgcgtc ctgcgtccgc gggagtaaat acagcaggcg aaggggaagc 3240
tcacacaatg gtctccagcg ctctggggca gggcttctga ggggcgggcc tgcctctgcc 3300
gggacctgga gcccccgccc ctcggagagg ctcctaggct gacttgggca gagccctctg 3360
gtgggccggg agggggaaag gctgtgttga aatgagcaaa ctgtccaggt gtcaggccaa 3420
gctgggaggt gaccagcctg aggtcctccc cgctccatgg ccagaaccag ggctgacatc 3480
tgggtgtcct gagcccagct gcccacacgg cccacctggg gtcagcccta tctgagtggg 3540
ggaggcgggg cctcctgggg gaccagaact ttggctggac gccaagcaga gtgccagtgg 3600
ctgttcttca gggctgggcc tgaggagggt gtggggcggc gaagggacgg gagggggttg 3660
tgatccagtg gccactggcg ctgtgcagag tgtgagctgg aaacatcgta gttactttgt 3720
cagcttagtg gtgaaagccc tttttcaggc tctatccctt tgcatccctg cttcccagag 3780
ggaggggagg tctgggtctg cagagctggg agggcttgct gttcccgccc ccctccccca 3840
caacacctcc tcatctggac atctttgggc acatgctcat actggggtct ccctaggtcc 3900
actgtgttcc gttgagcctc ctgcagtccc cgagtgaatg tgacctccct gcccctgcct 3960
ctttgcaact cctccctgcg accgctcctc caggggcctt ccttgtccca aatgtccaag 4020
tggcacgact tagccggtct gaccactttc cagtaagccc ttatggagag aggccctgtg 4080
ttgtgcagag ctctcctcct gcctgcggga tcgaggtctc tgctctcagt tcctaacaga 4140
aagtgtcggg cccccagtgg gatttctggg gaagaactct cgtgtctcaa cgggagccct 4200
gtggcgggag gggaggccag ggtttggggt tgtgttcgtt gtacagctgt caccatttgc 4260
actatgaaag ttgttagtgc cccttccttg ggtctctggg tgtaactcca cccttgcccc 4320
catgtgcctc catctggagc tgcttctgcg gctgtctccc aagccagttt tgtgaccctg 4380
taatttagtc caagacaatg ggctcattga gaccatcctg gtgcagcagt tggcaatcct 4440
ttggctctgg gggaaggttt ctcagtctcg gggagtgggg cctcaatctg ctggttccct 4500
gtgtttatca gtctccccct tgtgtgtcct gaatggtttt gctgggaatt ctggtcttag 4560
agccatcagg tggcccgagt cgataggcgt gagagagtgt gtgtgtgcat gagtgcgcat 4620
gtgcatgggg gctgacctgg ggtatggaaa ggtggccctc cctggtgccc aaggagcctg 4680
gagtatagtt ggagggtgtg ggggtgtgta tatgggagtt ggacaacctt gggtggacag 4740
acagacgtgg ggaagggatg attgaaggag gtggaggaga gagtgtgatt cagcccagcc 4800
aggggtgatg tggacaggca gcttccgaat cagggtagag aaaagtcacc actagctagc 4860
aggggagaag tcagtatgga ggaggcggac cttgagggag agtaggaatt ggattgcaag 4920
aggaaggaga gccttctggc cagcagcagc cagcagcagt gggggaggct ggaatgagct 4980
ggctggagag ggggctgggg cataaggagg ggcctgcctg tgaagatcat atgggccagg 5040
ctgcggaggg ccaggcatgc ccgccgggag tgcagctggt ccacgggaag catctggagt 5100
ggctgggaat gggcgcagga gcagcgccgt gggagcacag gtctctttcc cggggcggct 5160
cacctggtgt cttggttcct gcaaggtagg ccgaaagggt ggggaggaaa ctgccagctc 5220
cttacagcgc tgggatggtg gccccagggt tcctgaggcc agcggatgtg ggtgcctgtc 5280
accatgtggg ttgctgaggg gcggagactc caggggccac cccaaagcag gacgagctct 5340
gagccacggc atctctgggg gcagttttcc aatcgagcag acgtctaggc ctggaatcct 5400
gtaacagagg ccacagggcc ctgatcaggg tgttctggga ggcttagaac tagtggcagt 5460
atacagggta gacggcaagt gacctggcat ggggaaagag gcaggtgccc aggccggcac 5520
agcacacccg taaggaacag gtagacggga agccgtccgt gggcctgtgt gtgtgctcgg 5580
agttaaaatt ctgccaatgt cccatgtcct gggcacatct accccctccc tggggagcac 5640
ctttctcttc accttttcct tccccgcctg tccccttcac ccagggcctt ccccatccct 5700
cccgtcttgg ggaccgaggg caccatggct ttatgttcca tcaccgatga gttgcacagg 5760
gattcagtcc ttccgctgtt caggccgggt ccttcaggct cagggttccc aggaatggag 5820
agggtatcag tgtcttccat ggactcaaac ttcccgcatc ccgcctttgc tcccccttca 5880
agataggtct ccgagcttca aggttttagg gctctgtgga ggccgccacg tagcagcaag 5940
gagaatgttt tgtatttggc tgatgagatt tttagagtct cattttctac ttttccactg 6000
tacaaacggg cctccaggcg actgcagcac ccgccactgc ccgtaatagg gtgacaagag 6060
ggatgaccct ttcctctttc tcccttctgg ttggtggagg cacggggctg gcggacggca 6120
tgtgctttcg tgaattcagg ccaaatctgt tatcgcaaac acgattacaa ctcgggtctt 6180
tgtgtaacaa aagcctttcc aagtaccagc tgttggcctg ctttgctcag cggtgtttgc 6240
tgtaaccaga tttgcacacc gagaaagaat ccaaaagtcc ttgatgtttg ttgaaacaat 6300
ctggcccagg acccacgtgc tcagatccca gagctgtgtg gcatctgagc ttctcccgag 6360
cccccactgt cgcccgagga ggacccccag atctgtgttc tggaggcaga gcaggctgtg 6420
ggacgggctt ctgggtggga aggaccatgt ggatatgcct tcttgtctga gagtcccaac 6480
acctccggga cgtgggagct ggcgcgctgg caggattcag gtgcctcttt cctctctaga 6540
gaaaaaggcc ccgttgcttg gtaataggtg cagacctgtc cctaattaat gccagtaggc 6600
ctcttgcgtg atgaaccctg cctttcagcc aagactcaag gcatcctgtg aatactgcct 6660
ctctgcagtt tgagcttttg tggtgggagg caggagccat ggggagtggg ggcaggcctc 6720
ttacacgggt cccacagcca ctggcagcac tgacttgatg ctctttgagt tcagagccca 6780
gggccagaca gacccactgt cccgactacg agttggttca tttagagggg ggcggacaca 6840
gcacccaggc agcagatgca ctgtgatcag ccttgcagcg gggctgtggg ttctctgggc 6900
tggatgtccg ggaagaggca ggtggaggta aacgccagga cacccctgca gtgactgggt 6960
gactgcaggc tggaaatgct ttctgtgggc tgtggctgtc caggaaggtt ttgaatgggg 7020
ctagtggaca gagtttgcat ccagaggggc agtgctttgg aggagtgagg ggtatggcag 7080
tgtagggatg cccaggccgc cctcactctg ccattggaaa gctgggcggc ttcggtttct 7140
tcagtttctt cgcctgtttc cctgcctgca aagtggggtt agaaacagct ctctttgagg 7200
gttgctgggg gactctgaga tgcagcccat ggcgctgagc acgggtcctg cctcctacgg 7260
gtgtggtggg tgtcgcggct ggtgtggcat ctgggcggga aaagggggca tttgcaaagg 7320
acaggtaggt ttggatgctt aaatatgcag atctggggat gggaggtctc aggcaagggc 7380
ctgtgtgatg ccactgta 7398
<210> 2
<211> 1587
<212> DNA
<213> Homo sapiens
<400> 2
ggatgggttg tagataagag cagttgagaa ccacgcttca tctccctcct tagaaactct 60
gaaacgaggc tttattccta ccagaagttc agattgcatt atggtcatct caattccaaa 120
atgttagatg gcaagaatat ctgcccatcc ttcactttcc ttggaaaaag ttgctcttcg 180
ggttttatat gcgattgcag ttttccagtg tgtgaaacta ggaaaacaaa acactcaacg 240
gtgtacatcc ctacacctaa atagtcagaa ataataggca gctaggctaa ttatccttga 300
ttagcaagat cagagccatt agggtgctca ctggtttaac aaatgaatgc ccttaggcgt 360
ctatcatttg taactcctag aagctttaat ttccacaaga aacaaaataa gaggggcctt 420
ctgcttttaa cagtgaaaag atcgttctcc ctcccctctc cacccgggtc aactcttcca 480
gccgctccct cctgcatcac gaacacacgc tgcaggaaag cgcatttaca gcccgggaca 540
tccccagacc tcctctccaa aattccccac ctcctgtgca taggagaaac tgagagaagc 600
cctcacttcc tttccaaact tcacaagcag gggagggagc tgtagcagac tttcacctcc 660
gttcccaaaa gcgaatgtga aaaagtccga gaaggcacgt cctgcgagtg gaggttaaac 720
cgaaatctga acagaatgca cggtccccgc aaactacgat tgataaagaa gatactgaga 780
cgtttgcggg ggatataagc catggttgtc tcgccttcct cccctccctg ccaactatgt 840
ttcttggaga aatcgccggt tcgattcacg cacacatttt tgtaaaacac ggacaaaacc 900
ataagtagtt accttcattg ttccgtcggc cacgagggaa gctcgagctg agcggagggc 960
agatcccaag ggtcgtagcc cctggccgtg tggaccgggt ctgcggctgc agagcgcggt 1020
cccggctgca gcaagacctg gggcagtgcc cgaggcggcg gcgagtacac gtggcgggct 1080
ggattgcaga ccggccctct cgcggcggag actcgcgacc tagcggattg catcagcagg 1140
aagacactaa ggctgctccc ccaggccgcc cccagatggt ggagtctctc ccagcccgaa 1200
gattcggagc cagcgcccag acccgagcct cactcactgc tcactcccgg ggtgcagggc 1260
agaggtgcca gtgttgcaag caaatgacac ggttaccccc gaatcagcca ctgtgggtgc 1320
gtatccgagt gtggggatgc ccgtgtaaca tttatatgga gacgtcaagg aggaggaaat 1380
aaacagatca gaggtcaaat gtgattgcca ttccgtcatc actggctcct gcccacctcc 1440
ctactgtccc caaagtaact ttgctgcatg ctgagaggac cacggcacaa tcctgcccaa 1500
aagtatacat gtatcccccg cggctacttt aaatgtactt ttgcagtagt caagaacatg 1560
tgcctggttt gccgatctct ttcccag 1587
<210> 3
<211> 3381
<212> DNA
<213> Homo sapiens
<400> 3
ggtaaatcaa tggacctttc actaccttcc ccttctctgg gctgtagcag tgagttaact 60
ggctcagact tgcccagcgg aatgcccttc aggacacact gagtactgta gtaagagctg 120
catatgcgct cagggagaat gtggatagac gctgtttgtg attcacgggt aaagggcctt 180
ctcccagagg cagcagaggc agatcctgtc tctggtgtgc cctggccccc gacttggagg 240
cctcctgggc caggccaaga ccttccccgg cagcgatggt ctccagccac actcaactgc 300
cctgaaggga catttcctgc ttattccctt gcccggctgt gtcctccacc cggaaggcct 360
gtgccttctt cgcctgcatg tcctaccctg aggaggctcc cttggtcttt catcgctctc 420
cctatgggtc ttcacgcctt cccgaaccac cgcgcccaag caggagcacg ttctcggccc 480
tcttcacagg gcgctcctcc tcacaggggt gcccgggatt tttattctgt gccttcctgg 540
tggctcctac aagtctggaa gggcaggagg cgcatctcac tcctctgggt cccctcccct 600
agcgcctggc gggagcccag gctgcatttg tggaattcat gactttttct ctcctgctca 660
agctgaacac attgctggct cctgctcggg tggagcccgg ctaattagag tgaggggctc 720
cccgtagggc gaaggggtgc gctgtcagat gtggcattcc cgttttacgg agacacacgg 780
tgtcttacac gccagggaga ggtctgagac gcaaagagcc gtcgagcggg ctgcgggatt 840
gcttcgctgt cacctccgcc tgcagccacc cttccgcacg cacttgtgtg tgcacccagg 900
ccaacatgga aggcgccatc ctaacttctg ccgtgagcag gtgggaggga agagagacga 960
gaggtattcc attggttgtc tgggaaaatg aattgcacct tcccctccct tgcggaggat 1020
caacttttcc caccccctcg ggtgggcact cgcatcctgg ggccggagcc tgaacccggg 1080
agccaagggg ccccagttcc agggacgtga agctgagcgt acagcgggcg ctcccagaca 1140
ctggggaaag tgctttacga tgtcccgagt ccctccagtc tcgccagcgg ggcgagcgtg 1200
agggtgcccc gaccgaccag cggccccggg tgcagggtgg cgggcccggc ggcgcgcgtc 1260
cccctccccc tcctggcggc ccgcacgtgt cgcccgcgcc gcgcccccac gggttacgcg 1320
cgggtcccgc agcgccgcgg ccgagccggg ctgcccggcc cgcggacaca gcgccggccg 1380
ccgcatcccg tgcggggccg cggcgcgatg ctgcgctgga atgaggaagc gcggcggcga 1440
ggggagggcc cgggcgcggt gcgcgcgggg gtggcggcgg cgcgccgagc gggcccggcg 1500
cgggcgagcg ggctgcagcc ggcggcggcg ccagcaggta cggcccgcac ccgccgccgc 1560
cccggcggcc tttgggggct gagccggagc ccggcgcgat tgcaaagttt tcgtgcgcgg 1620
cccctctggc ccggagttgc ggctgagacg cgcgccgcgc gagccggggg actcggcgac 1680
ggggcgggga cgggacgacg caccctctcc gtgtcccgct ctgcgccctt ctgcgcgccc 1740
cgctccctgt accggagcag cgatccggga ggcggccgag aggtgcgcgc ggggccgagc 1800
cggctgcggg gcaggtcgag cagggaccgc cagcgtgcgt caccccaaag tttgcggggt 1860
ggcagggcgc gcgctctggc cacccgccgc tctgggcggc agctggtggc aacgcaaggg 1920
cgcggcgggg gcggccggcg cggagggggc caggtacggg gcccgcgggc ggcgctgtgc 1980
gcgcggggca gccggtcggc cgggagcgcg aaagcctggt ctgagccggc tgggggcggg 2040
gagtgtggcg gagaaatggg gaacaatgcg agtgagcaac ttcaggaagt cattgtgaaa 2100
gaaagctggg aagagctccg cggccaagtt agcaggacac tctaacaagt gactgcgcgg 2160
cccgcgcccg gggcggtgac tgcggcaagc cccctgggtc cccgcgcggc gcatcccagc 2220
ctgggcggga cgctcggccg cggcgaggcg ggcaagcctg gcagggcaga gggagccccg 2280
gctccgaggt tgctcttcgc acccgaggat cagtcttggc cccaaagcgc gacgcacaaa 2340
tccacgtgag tgttttcaaa ttgaatttca ataggaaaac ttggggtaac tggtgaattt 2400
aaaaaaaaaa aaacacagta aagaaaagcg gtaaggttgg tagaccctgg tgtcgctcag 2460
gtccgcctct cttttctgag gacagtgaga gagttcactt ctgtcaagcg tctgttgctc 2520
tgcactgtgc cagcaggtgc aggaccaggc cgacatggga cacttctgag cagccccgct 2580
gtcaccagga gaggagttct agctcccaac catatttaaa tttatgtaga cctacatata 2640
cccacggaag tcagccttta taaagtcgtg tgtaaagagt tttccttata tttgagccgg 2700
gagctttctt tttatactat aaatatgatg agatcgagtc tgaacttaat ttctgcaaga 2760
gaggaattat cccggctttg aaaagttagt ccttttgctg accgcaggtt tgacgctcaa 2820
gtcaccaaac cttctcagga aaacccttag taatattaag gcatcaggtt acttgcggtt 2880
atatttgaaa tgtattttaa atatttgtca agcatcgctg ctgatgccta aggaacctcg 2940
tgagggcttg tttttccttc taatttggag gcatctaatg accgaaaacc gtagcgattc 3000
catagggtct gaccaggcac agctttcaaa tgcagcttcc ctctctctag ggactgcagc 3060
ccacccagac tgaatttcaa tgcggtgcgc tttgcttagg ttacccactc acaatttccc 3120
actgcgccgc aggcagtata tttcagcttt gagatacctt gttttaaaat tccagacaaa 3180
atggtgttga ggaaatgtct ccttactagt cccatcaact tctgttaaaa gaggaaaatt 3240
tatggaattt gaaaatactg cgtatgatat ttaaactttc atagacattc aaatgctttt 3300
aaggccaggt tcaatttggt tatgagtcga ggggtggggg ggacccacat agaaatgtcc 3360
tgggtcctct tgagtttatt t 3381
<210> 4
<211> 3381
<212> DNA
<213> Homo sapiens
<400> 4
ttcatcattt ctggggagtt ctcttggggt ccacagaaaa tctcacctca tctcggtccc 60
ctcagcaccg gtgatatctt ggaactcggc cccggttgtt cgctaaggag gacttggctt 120
gggggcggga gggtgctcca gagttcctgg gggtccaccg cactccccat ccgaggctcc 180
tcgcgagcgg agccgcttct ccaggccgcc cgcctccctg ccgcaggagc aggcccgcgc 240
ccgccgcccg agagcctccg gtagagggag acactccagc ggctcctccg acttggcagc 300
ggccgggccg ggagtgggtg ggggtgatgg ggggtgggga gaaaaggggg agtggggaga 360
ggggaggtgt gtgaaggggg ggtccggggg gcgggtccct gtgccgctga cgtcccgagc 420
agtgctggga agtataggct gtgttgtcac gccggtgtca gtctgatgaa gattggcatc 480
aggtaagctg tcattcattt ccatgtcaga gacgcttttg caggcggcgg cggcggcgcg 540
gcggcggctg ctgctgcggg cggctgcctc agagcgcgtg tgttttattc cagtccccaa 600
gccagagtat tattcattgc gacagggcaa ggaggagaga gggagagagg gaggcagcag 660
ggaggagaga gagggaggca gcagggagga gggaggcagg gagcagcgag ggacggcggg 720
agcgtgcaga gagaagctgg ggaagcgccg ggagagcgcg gagcggagca gcgcgagggg 780
cggcgaggcc gggcacggag gctgcgagag ccccgcgggc cgcccgctcc cctgcccggc 840
cagcgctcag ccccgccgcc gccgccgccg ccgcctcgcc gcgcttgggc ccgtggccgg 900
ccgcgcattg tcctcgggtg caaggagccg ggctgcggac tcgaatcgcc gcgggcccaa 960
ccccgtagcg ggcgggcggg gagctgtgcg ccaggagcgc caggggaccc gagaatagga 1020
acaggcacgc cggcccgagc ccgggtgcag aaggctcccg gccgggcgct ccgcggggag 1080
aggctgggaa ccgcgggcag gctccaggtt ctctttctcc cggcttcggg cgtccttggg 1140
gccggcgctt actccgcgcc accagcctgg agatgctttc cagcggctgg aggcgggagc 1200
ggtcccaggc tggggccagg tgaccggagg agtcgaggag ccgcggccgc ggcctgggga 1260
ggcagggcga atgagggttt gcagacggat cagtggagac aggggaacac cggcggggcc 1320
cgggaagcca ggatccgagg ggctacacgc acggaccctc acccagggag gagcgagaat 1380
gtgtagggtc accggctttc catgattgct ggggatcttt ggtgaggcgg gcgtaggggc 1440
ccgcgcgagg cttgggaatc gggagccctt ctggctcgag aactagggga tgagttcgta 1500
aaagagggaa ctgaaagcga tcgagagcgg agagctgagg gggatggcgc aggatcccga 1560
atctgccgct caaagtttgc atttctttcg ggttaggaga cgggctttcc tggctcccga 1620
tccccaggaa gaaacgagcg aaatgggccg tcctttcccg gggctcttca cgggggagcc 1680
gggggtttcc gcgcggtggg gagactcggg ttgggaattg aggggtaggg gcttgtggat 1740
cggcctgaat tagggctggg ttttaggacc agtctagagt tcggtttata ggatccagac 1800
tgtttacgga atcgggatcg aggggccgat aagtagttta cacgccggcc agagcagagg 1860
gctggaggtc ggagttgggg gctggaggaa cgggtggcgt ttttaggatt cagtaacagg 1920
atcacagctt tttcttgtgg tggaagctat tggaatttgg ggagggtagc acgaggggtc 1980
ctgcagctcc gcgtgtgaaa aagcgtttag gtaggcgatg aaagtagttg atctgagcca 2040
tggcaggcga gccccgaatt tttgctgctt ccccctgaaa gtgtttcttt aggaggagag 2100
gacttgggcc acacaggacc cggtcctaag agagcgattc cgggaagcgg acagatcgaa 2160
gagaccttct gggcgaagcg gcagggcagc ctcgcggggc tgggagtgga tctgaggtcc 2220
cgacccaggc ggctcggagt gctccaggag ccacctgggt ctgcgggcgc agcgcggcgg 2280
ggcgggagcg gtggcccgca ggggccgcgg cctgcgatga aggccggggg gcagcgctag 2340
cagcgaggtg ccacagtggg ccgaggagtc tgggctgtgg cccagggtag gaccggctca 2400
aactccagtg ccctgattgg agccgcttcc tgtgcttacc cgcgccggac tgagaagccc 2460
acaaacccgg cctttggtgc gcccggggga ggaggaagct tggagtgccc tactgtcatc 2520
tctcctgtcc ggagacttca ggatattagc ttttcgggtt tcaaatgctc tataaccggt 2580
ggcagccaaa agcttcgcat tttaggcagt ttagacgatc ctccccgccc caaatctgag 2640
aatgatggtg ttcaaacata acacggtgta ttacccaaag cccctgccct tgccctcctg 2700
ctctctctgc cgttctggcc ttcggaggcc ccaggacctt ggtggaagcg gggagggagg 2760
gtcccgtttc tggtctcata atctcccact cgggctgcat ccccatagct tgggcctagc 2820
tgtggggtgt ggggtgggaa ggggtcccga ccagggaggt aggttattct ctgggcatct 2880
agagaaagag tgtgtgtggg gggtgggagc gggggggagg agggcattga ggggaggaag 2940
atttgagatt tcctcctctt aatattaaac ccaccatccc agccccctgc acccctggca 3000
gggagagcca gacagccctt acaggacacg gaagacgcac gacccacgac ccacgagtgg 3060
cctcggcggc ccggggcgcg gcgactgccg ccgcggagct ccaaggctgt tgttttgtag 3120
gcttggaatt cgtgagagct ctctcccgct gagagcccga ggggggaggg agccgtgacc 3180
ccacggagac tccctggtca ccgcctcccc tttgtgagcg ggaaaggctt gaaagccaag 3240
agaaagagag gctgctcaga ataaggggca gggggttacc ggagggagat gggcccgacc 3300
accgctcaca gtaaaatgcc tcgtgcgaat tgcactgaag tatacccaac ttgagactgg 3360
ctgttttatg atcctctctg g 3381
<210> 5
<211> 1958
<212> DNA
<213> Homo sapiens
<400> 5
atgctgggcc acgctgaaaa tttgtggctg agagctggac cctcgtcatc gccacgtact 60
ctgtcaatga gacagggtaa cccatggtta ctgagctccg atcagttaag gggcagagag 120
cctccgctcc ccactgctct ataaaagaga cccagcaaag ggaccctacc agcttctagc 180
tctcagtctg cgcgagggtg taggaaggaa agcccaggac ctccggagca gagcacagca 240
gctgcagagg caaggccagc atgtcgccca acttcaaact tcagtgtcac ttcattctca 300
tcttcctgac ggctctaaga ggggaaagcc ggtacctaga ggtgagccac ccctggactg 360
acccatctca ccttccttgc gtgttagccc taggcggcag gcaggctgcc tctgctcgca 420
gccttttggg gttcgctgtt tcttccctct ctgctggatg ctgtcttgcc cctggtttcc 480
cctatcctgt tctccctcct tgcctctgag catcccagac tgcctgcctg ccttcctctg 540
gccgctgggg ataccctggc ctgatggaga gggtctaaga ccttcccgtc ttctccggac 600
acgggaaaac attacccctc tctctttatt cgctatgctg agtggcaggg agggtgcccc 660
gctcctggtc ccctttttta tccccagccc ttgaactttt ccggactgac ctatgtttct 720
tgccagctga gggaagcggc ggactacgat cctttcctgc tcttcagcgc caacctgaag 780
cgggagctgg ctggggagca gccgtaccgc cgcgctctgc gtgagtcgag gctgcccggc 840
tcgcgggcgc ccgggacgcg gggaaggtgg gactctgtgc ggggggcaga gggctcgcgg 900
acatctcggg gaaggggctg gccggaaccg ccaggggcgc ggtcccctta gctaaggatc 960
ggtccgcgga ggcgcgccag gagcgggaga gggtggcgcg cccggggcgc aggaacccag 1020
cgcagcctag gctggaagtc ggggcgctgg gcactacaga gcccgggaat ggggcgcgcg 1080
gagagcggcc gcccgaggac ggcgctgcgg cggctgcagc ccgggactta ttgccccatg 1140
ccctcctccc ccagggtgcc tggacatgct gagcctccag ggccagttca ccttcaccgc 1200
cgaccggccg cagctgcact gcgcagcctt cttcatcagc gagcccgagg agttcattac 1260
catccactac gaccaggtct ccatcgactg tcagggcggc gacttcctga aggtgaggcg 1320
cccacggcca gccaacctag ccggagggcg gcacgggagg gttggaaagg gctggggcgc 1380
tgcacccagc gtggggctgc tgagcgtagg tagccagtgg cacttcttag acacttcgct 1440
ggtgcccgag tcggagaggc gcgttcgagg acccccacac ggcgagaatc tcgcccttac 1500
ccgaagacct cgacccacac acatccagtg gggctggggc cggtgcctct ggacgctgcc 1560
atggtttaaa ttcccttctg ggcgctttcg aggccctagg aacttctaaa gacttgaact 1620
cgcagcgcgg aactctgacg caatccaggg ccgaggaaaa atgattaaaa cccaacaagc 1680
tcgagtgctg gggtccacca agcgggccgt cttggttaga aggcccgccc cacacgtctc 1740
acatctgagc ccgcctcgct cctgctggtc cacgctcggc agagccgttc cgagagcaca 1800
gaggctgtct tcagtgcgcg ggtgacccga ttttggagca gtaggggact ggctgccgag 1860
ggggcatcta gattgagata ggtgggaggg caggacaaga cccctaagct cactgcctcc 1920
tcgattccag tcgtcagact ccataagtat aacagggc 1958
<210> 6
<211> 4899
<212> DNA
<213> Homo sapiens
<400> 6
gaggcagccc tgggaggcac tggtctgaag ggctagaccc ttggtaagaa cctctggaag 60
aacgcctgtc ttccggaacc agacagggag gcgtgcaacg gggtggggtg gggggtactc 120
ccagctgcag gcacctctac tcctaactat ctgcaagagg acacacacac acacacaccc 180
tgggtgtcag agaagtcctc ccttccctgt acctcctcct tcccaagccc ctgaaatcca 240
gaagtgcctg tttccaggcg ccagccctgc tgagtggatg tggggatgga ggtcactgga 300
ggcccagggc tggtttgttg tttttgtttc ctgttaggag tactgtgaag gctttgcagg 360
gctagttttg ggaaatctta ggtttggctt catctgactc ctctactgga gcgaggcgtg 420
cagccaagcc tgcttagacc tccccaggcc acgggcccgc ggcagcccag ctcagcacct 480
gcaggcgggg ggaccgcgcg cttggctcga agaccccgcc ctgggcaggg gacagaaaat 540
atgaaatcag atggggagtt atgaataact gtcctcccct cccctctgcc gtgtttcctg 600
aatccgtacg ctatgcagga ggggggcggg ggcgggggcg cggggaggag gagggggccg 660
tttgccatta atctgggaac aagcggctaa cctcggtgac tggtattttc gcttttcttt 720
tctcactttt ctcagtgtgg ggaaagcagt caagcccgcg cggagcgatt gtgaggggct 780
ctgctggaat ttggcagcgc ggaggcttgg agagaagccc catgctggct cccattcagc 840
cggcccgttt tcctcgagct ttggaagttt cactcagccg tgcactcaat ggcttcacaa 900
agctgattac aagcttcagc gcattcctga aggagccaaa agcgacgcag gtgcaaacga 960
gccgagggag ccccttatcc cggtgacaga atgggacaag ctgggaaagg cttagaccac 1020
acaagtccaa ggctcaccag gccgcagaaa gcctgccttg ggaaccgggg gtcattatcc 1080
gccctattca gcggggcccg gggaccctgg gggccgagcg aggccagccc gggcgggagc 1140
accgccgcca gcgcgcgccg gcgacagggg ggaaccccgc tgggcgctgc ggccaggccg 1200
gggctcaggg cgctgggctg tgcgtttgca caaatctgtg ttccggcggg ccggtgtcaa 1260
ccctagtggg gacacgggag aaagagcacg ccagtaggcc acgcggcgcg tgggcagtgc 1320
gcaacttctg tcggcgtcca ggctgtacgg ccacgtttca gccggtgccc ccaggccatg 1380
gacacccagc tccagggtcg ctctgcgccc tttctcccca gcccaccttt cccattggtc 1440
ccctctcctg tccgagtggc agcgcggccc cgcagggagc gaccccggga gggacagtga 1500
ccgcacgcgt ggagtgggga cggcggggca caggacggta gtctaagagt gttcgcatgg 1560
ccgaggacgc tttcgctgcg agtttggggt cgaggggcag ttccctcccg gagtcattaa 1620
cttcgtctcc tcgtgctcag ggaccagcaa cttggtgctg cgggcgccag aaagaaaagg 1680
gtagcgcctc gcggagcgcg cgggggaaga gggactgcgg cagcgggacg cgagggcggg 1740
aggggcgcag cagcggggag ccggagcgca gcggagggga gcgctggggg gcggggagcg 1800
ctcgggcagc caccctgtcc ccgtctggag ccccgcgctg cgtctaggag ggcgcaacac 1860
gcagtccccg cgggggccag agctcggagc cccctagtgc atgccccctc tcctcgcgcc 1920
ctgccgaggc ctcggccctg cctgccgtgc cctgggcctg gttgtgcccg ggggtccccg 1980
cgggcagggc gcggggcagg cagggcgcgc gcgccgacgc tcttttgtct gataactaat 2040
ttgagttaat gcgatcttta tgtaaagcta acagcggata attgtctatt ttctcgccaa 2100
cagtctccat cacaatcact tatctggaaa cctgcggttg gattaatcgt tatattcccg 2160
agatgagcgt cgctgcaatc cgcagcgaac gcgggtaggg acctggagac gcctcccggg 2220
cgctggcggg gccggtgtgg gccagctccg ctaccgcctg agacgcggtg tgcccaggtg 2280
ttggtgcccg cgggagaggg ctgtggggcg ccttccccag gatttgcttg acttgctttt 2340
cgctcgagtg ggtggtgcgc gggtgcggga ggcggaggga ggaggagggg tgaggggagg 2400
agggcctgtg gggctgcgga cccggagcag cctgggtgga gcgcggcctc gggaggccct 2460
gggtgcatcg cggcggggcc tgggggggcc caggcgccgg aggagccgtc ggtgccggaa 2520
tgcagcgtgt ttcacttggg agaaacgttg ccctcggtcc cttgcctccc tcctgttgtc 2580
tcggtttttc tggcttcgtc cttcgtccca cccacccgtt cccacctcag gtccctcccc 2640
caggatcccc tccttaagga tccaggtctc tgaaaattat tggcaacagt tacacgcccc 2700
acgattgaaa tccacaagag aagagtccca gttctgcagg ccgctccagg gctaggggta 2760
gagatggtgg caggtggtgc gtcaactctc tagggaagag gaacttgcat tacaaagact 2820
tgtctttctg agctgaagtc aaaacggggg cgtcaagcgc gctccgtttg gcggcggtgg 2880
aggggccgcg cgcccgcgct gtcccagccg gagctgccct ggctggtgat tggaggttta 2940
acgtccggaa ttcaggcgct tctgcagctc agatttgccg gccaaggggc ctcagttgca 3000
acttttcaaa atggtgtttc tggaaaataa caaattcaga ctcaactggt gacagctttt 3060
ggctatagag aatgaaactg cttccctttg gcggtggaac tcttaaactt cgaagagtga 3120
aagaatacaa tgaaataaaa tgccataaga tcactggatt tttcagaaaa aggaagaccc 3180
caaattactc ccaaaatgag gctttgtaaa ttcttgttaa aaatctttaa atctcgaatt 3240
tccccctaca acatctgatg agtgctttaa gagcaaacga gcaaatccca cctcgagaat 3300
caacaaaccc aagctctggc caaggctctc cccgcgtttt cttctcgtga cctggggaat 3360
gtcccgcccc atcgctcacc tggctcttgt catctcgctc atcttgaagt gacccgtgga 3420
caatgctgct ccctgccgca gctccgccgg tcactcaggc agaacggggt atgcaaatgg 3480
cctggagagg ccgaggccga acactgcgcc cattgtcccg ggcgctcaaa gcgccgagca 3540
gctgcgcaga ctttctgggc tcggaccctc ggccgccacg ctaatgtcat cattgcaaaa 3600
catcagattt tgagaactat gcagtctgaa ttcattagca gccttctcgg cgaaggttct 3660
tttccccgtg acaagtttca aagtccagac cccctccaac gttggtaggg gtaggaagag 3720
gaggaggggc ccagggaggg gggtctttcg caagtggggc ctcgggggat ccctgctctc 3780
cttctggtgc attccgcaac tttaaaagcc ttccttgggg ttctgagcgc ggatgtctga 3840
cttgaatgac ctgagatttg gacatattcc cgttttctcc caagagttgc tttaatgttg 3900
cgagtttaaa ttcactgaaa gaggcccaga taccaagtcg agtgaatttc atagacatca 3960
tcttctgttt taatgatcgc ggcagtgatc gtttctgaag tcataccctt tagggtgaac 4020
tcacaacaat gcatgtcaga gaggctgcgc gccctaaagc aaaacagtta aaacatcagg 4080
ccacgctcct caaactgcag gattgcaagc agctcacaaa cttccagtcc ccaccccaag 4140
gtgaggagag tctcagtgac ttgaggacct gcttgcactc ccgctttcca cgcccggtcc 4200
cctacccgca cctgcccaag tggtctcgtt cctctagaat ctgaatggtg gggaggggtg 4260
ctcctgatgc cccgggtgca gggcgggcac cagcgagcga gacccaaggg cgctagaacc 4320
caggagcgca aaccaccgtt agggcctgag ggacgcagag gcgggtggag tagtgtttct 4380
cagattcgtg ggaggccgca ggcgccagca gaggcaattt tcctcccctg agcaatgcta 4440
gttctcctca ggcccaggat ctccactaac gtgtccttcc acctcctcac aggactccaa 4500
gctgctgtcc cctctctgcc gcatctgagg ctgggaaaac ttcctaggag aaggcaagag 4560
aaagccacca gaccagagcc gaggactaaa ctttaaggtc gaagacggca gaggggcagg 4620
ttctcccctg cacaccccaa ggcctctcct gcacccgcga ggccttcctt gagcgcccag 4680
gcccccgaaa tgcctgccct ccttctgaca aaaggagggg gtaggatgtg aaggggtagt 4740
gcaaccaaca atgtttttgt aaacacaaca acagggaaat acatggagga aatctattta 4800
ttgggtgtgt catttttggt ggggggcggg attgaaagtg gcgccatcta gacccaggaa 4860
aaagctacgg ggtgggcggg gtaagcgggg gactcttgg 4899
<210> 7
<211> 1206
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gagagcagca ctcatttctt cttatcattt ctgaactgcg agacaaagaa ctttaatttt 60
ggggctagaa tttaatttgt ttttgagaat accgaatatt accaagcaac gccagcacgg 120
atataatagt agtgtgaggt ttgcacacac gcagctgaaa tggtaaattt aaaataggag 180
acactgtgtg cacgtatagt gtgtgcatac agtatcaaga cattctttgc tcctggagtt 240
ttctctgctt tgccaaactt cacgcccctt ttggaaaggg ggagcgaatt ttccaagttg 300
tgaggatact tttcctccat ccagccacac cctcttccgg gccagtcttt ggtgaaacct 360
gggcgatgtg gagtcactgg gggatgtgag tgagggcgtt tttgctcatc ttaacccagg 420
tctctgggag agcctttagg atcgctctgg gacttagagg aggttccgtc ctgggccggg 480
agctgaggct ctccggacaa acgctaagca gctctcactt atcggtgtcc aataggcctt 540
atataaagtg ccaaagtgcc ccagcaaggc tttaccagca cctgggccgt agttgtctcc 600
tggctcctgg ggtccgcgga gctctagatg tacctgcagc tcctcccgag tcctgcaagc 660
cacccttgtc cctcttctcc cgctcacccc ccggcccccc catctctttt gctattccgg 720
ggaaggccac gcagggtgca acccggacgc gcccccgggg gaagcccgcg acgcagcagc 780
cacaccccca gcctgcactg gcgcccaccc catgacttcg ccttcgcggt cgcgggcagg 840
gagcgcgcgt ttccatcggt tgattagaag cgggagtcgg aggagccccc gcccgccggc 900
ggccagcgca cagcccggcc aggggcgccc tccctgccgc cgccggccct ttgatcgccc 960
gcggcccgcg gcccgcagac cacagccagc gctgtgctgg gcaggtggcg gcagcggggc 1020
gcggcgcgct caggcgcacg ggtccccggg ccgcggcgcg ctccccgcca cgccgcacat 1080
caaggcccgg ccggccggcg ggcgccttca ttagcagcct gaaattataa tattatgtta 1140
aagaacaaag ctgctccccg gaaaaatatg tgctgcatat ctgacaaaga taaattggat 1200
tattca 1206
<210> 8
<211> 7398
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ttggagtcgg tgggttttga gtatagttac gaaggtatgc gtattttttg gttgtttttt 60
tgttattgtt ttttgggttt ttattttggt gaggcgtgta ttttggcggc gttttttagg 120
gaattaaata tgtttgttgt attgtgcgtg gagatggaga atgtataatt ggttgatttt 180
gtgttaattt ggtggaattt tatgttagtt ttgggaaaga ataattgtat gggtgtgttt 240
atatttatta ggtgtttttt agaaaaatat tcgagaataa tgttgtggtt taggatggtt 300
gttgtgtcgg attcggtatt tttttagggg ggttgtgttg ttgggttgag ttttttaggt 360
attggatttt taaattttta aatacggcgt ggataggtgg tttagtaggg gttggattat 420
tcgataggtt taggtgttgg agtttagata agatatattt tggtttggcg tggaagatac 480
ggggtgttat taatggtagt aatggttgta tttttgaaat tcgggttttt aggtcgacga 540
gggtgtgtac gtatttgaaa tgtttgtggt tttgtagttt ttatgtttat aaatttattt 600
ggttgaaaat agtttaaaat atttaaagta tgagggaggg agtgtttgtt ttttttaaaa 660
aggaaggatt tgattttatt tatttaaaaa gttatttaaa tttagaatat ttttcgtaag 720
agattttttg tttttcgttt ttttagaatg gttggagagt tttagtattt ttgtatattt 780
gggatatttt agagggggtg gggaggggta agtgggtagc gagcgatttt agatttagga 840
tgagttgtta ggcgtttttc ggttatatat ttaagggatc ggagtgtagt tgtagcgttg 900
cggtttgttg tttcgggggt gggggtgttg ttttatgttg tgaattttta tatggttttt 960
gattttgggt agaggtcgag ggtttaaggg acggggtgat agggagagta tgtaggagtg 1020
ggtttttggt tttttagggc gagtggaaga agcgtttttt ttttttgtag gtgatagatt 1080
tggggggttt tttttgagga tgagagtttg ttgtttttta agttttgtgt ttaatttagg 1140
tttttaggtt tattttagtt tttcggtttt gtttgttttg tggatgatat agtttaaggg 1200
tagagatcgt tggtttggag ggaaggttag gttttaggtt agggtttaga agggagggag 1260
aagtttttgg ggtagttttt tttttgttta tttattgttt agtttttttt tttatatttt 1320
ttttcggaaa cgtttgtttt tgataaggtt tattttttgt ttttaggagg tttttattgt 1380
ggaggaaggg aggcgtcgtt cgtttttggt ttttttgata gtcgtgtttt attttcgttt 1440
tgtgtttttt ttttcggata gtgttttttt tagggtttat ttaggagggt gtagcggtgg 1500
ttttcggggc ggtggtcgtg gtgggggtgt tagttgtagg ggtgttttcg gtgggtggga 1560
gttggtggtt tttcgttggt gttatgggat tcgtatgttc gttttgcgtt tttcggtttt 1620
tgagtttata ggtcgggatt ttgtttgtta gtcgcgtgcg ttgtcgttta atttttgtag 1680
gcgtagagcg cgcggcggcg gtgatagaga attttgtttg gttgtttaaa tatagttttt 1740
tgtagaagga ttttgcgttc ggggaagggg aggaattttt ttttttttgg gcgttcgttt 1800
ttttcgttat ggttcggttt ttatattcgt ttatatttgg tcgtagcggg gcgttcgggg 1860
ggaggggttg aggtcgcgtt tttcgtcgtt ttttgggcgc gggttaggcg gggaggaggg 1920
gggcgtttcg gtcgtgtgtt taggattgtt ttttagcggt tattcgggtt ttagtttttt 1980
aggtttggtt ttgataggcg ggcggagtag ttagtgcgag atagggaggt cggtgcgggt 2040
gcgggaattt gattcgttcg ggaggcgggg gcggggcggg ggcgtagcgc gcggggaggg 2100
gtcggcgttc gttttttttt tttatttatt tagttgagtt agggggttta ggggtttttt 2160
cggcggttag ttttgtattg taggagcgcg ggcgcggcgt tttagttagc gcgtagggtt 2220
cgggtttcgt cgggggcgtt ttttcgtcgt tgtttttcgc gcgattcgtt gtttattagt 2280
tattatgtcg gatttcgcgg ttaacgcgta gttggatggg attatttcgg atttcgaagg 2340
tgggtgttgg gttggttgtt gcggtcgcgg acgtgttgga gaggattttg cgggtgggtt 2400
tggcgcggga cgggggtgcg ttgaggggag acgggagtgc gttgagggga gacgggattt 2460
ttaatttagg cgttttttcg ttgagagcgt cgcgcgtttt cggtttcgtg ttcgcgtcgt 2520
ttacgtgggg gattttgtta ggggtattcg cgtagatttt gcgcgttttt ataggatttt 2580
gtgttcgttt tgcgtattgt cgtttgggtt tttttttttt tattgttgtt tgtgtttgtt 2640
aagcgatagc gattttttcg agggttcgcg aggttgtttc ggaatttttt aggacgtata 2700
gttttatttt gggaaattta tcggtttttt ttttttggtt tttttcggcg gttttcgggt 2760
ttcgtttgga ttcggtaacg ggatagggag gtcgtttttt attttcgatt gagtggatag 2820
tcgcgttttg ttcgggtgga tagttttttt tttttttacg ttagtttcgg ggtcgttaag 2880
ttgtgtagtt cgtgggtcgg gagtatcgaa cggatatagt ttaggtcgtg gtagggttta 2940
gagtgggatg ttttatggtt tttatttagg tttggggata tttttattcg ttttttagaa 3000
tcgggtcgtg ggggatagaa ggggtttgcg tgcgggtagg gagagtattt tggttttttt 3060
ttgttttcgg ggtttataaa gtgtgttggg atttgcgggg ttgttttgtt taagtttggg 3120
tttggcgttc gcgtttttga gtttgtgagt gcgtgcgttt ttttgcgttt ttttgattgt 3180
cggtgttggg gttttgcgtt ttgcgttcgc gggagtaaat atagtaggcg aaggggaagt 3240
ttatataatg gtttttagcg ttttggggta gggtttttga ggggcgggtt tgtttttgtc 3300
gggatttgga gttttcgttt ttcggagagg tttttaggtt gatttgggta gagttttttg 3360
gtgggtcggg agggggaaag gttgtgttga aatgagtaaa ttgtttaggt gttaggttaa 3420
gttgggaggt gattagtttg aggttttttt cgttttatgg ttagaattag ggttgatatt 3480
tgggtgtttt gagtttagtt gtttatacgg tttatttggg gttagtttta tttgagtggg 3540
ggaggcgggg ttttttgggg gattagaatt ttggttggac gttaagtaga gtgttagtgg 3600
ttgtttttta gggttgggtt tgaggagggt gtggggcggc gaagggacgg gagggggttg 3660
tgatttagtg gttattggcg ttgtgtagag tgtgagttgg aaatatcgta gttattttgt 3720
tagtttagtg gtgaaagttt ttttttaggt tttatttttt tgtatttttg ttttttagag 3780
ggaggggagg tttgggtttg tagagttggg agggtttgtt gttttcgttt ttttttttta 3840
taatattttt ttatttggat atttttgggt atatgtttat attggggttt ttttaggttt 3900
attgtgtttc gttgagtttt ttgtagtttt cgagtgaatg tgattttttt gtttttgttt 3960
ttttgtaatt tttttttgcg atcgtttttt taggggtttt ttttgtttta aatgtttaag 4020
tggtacgatt tagtcggttt gattattttt tagtaagttt ttatggagag aggttttgtg 4080
ttgtgtagag tttttttttt gtttgcggga tcgaggtttt tgtttttagt ttttaataga 4140
aagtgtcggg tttttagtgg gatttttggg gaagaatttt cgtgttttaa cgggagtttt 4200
gtggcgggag gggaggttag ggtttggggt tgtgttcgtt gtatagttgt tattatttgt 4260
attatgaaag ttgttagtgt tttttttttg ggtttttggg tgtaatttta tttttgtttt 4320
tatgtgtttt tatttggagt tgtttttgcg gttgtttttt aagttagttt tgtgattttg 4380
taatttagtt taagataatg ggtttattga gattattttg gtgtagtagt tggtaatttt 4440
ttggttttgg gggaaggttt tttagtttcg gggagtgggg ttttaatttg ttggtttttt 4500
gtgtttatta gttttttttt tgtgtgtttt gaatggtttt gttgggaatt ttggttttag 4560
agttattagg tggttcgagt cgataggcgt gagagagtgt gtgtgtgtat gagtgcgtat 4620
gtgtatgggg gttgatttgg ggtatggaaa ggtggttttt tttggtgttt aaggagtttg 4680
gagtatagtt ggagggtgtg ggggtgtgta tatgggagtt ggataatttt gggtggatag 4740
atagacgtgg ggaagggatg attgaaggag gtggaggaga gagtgtgatt tagtttagtt 4800
aggggtgatg tggataggta gttttcgaat tagggtagag aaaagttatt attagttagt 4860
aggggagaag ttagtatgga ggaggcggat tttgagggag agtaggaatt ggattgtaag 4920
aggaaggaga gttttttggt tagtagtagt tagtagtagt gggggaggtt ggaatgagtt 4980
ggttggagag ggggttgggg tataaggagg ggtttgtttg tgaagattat atgggttagg 5040
ttgcggaggg ttaggtatgt tcgtcgggag tgtagttggt ttacgggaag tatttggagt 5100
ggttgggaat gggcgtagga gtagcgtcgt gggagtatag gttttttttt cggggcggtt 5160
tatttggtgt tttggttttt gtaaggtagg tcgaaagggt ggggaggaaa ttgttagttt 5220
tttatagcgt tgggatggtg gttttagggt ttttgaggtt agcggatgtg ggtgtttgtt 5280
attatgtggg ttgttgaggg gcggagattt taggggttat tttaaagtag gacgagtttt 5340
gagttacggt atttttgggg gtagtttttt aatcgagtag acgtttaggt ttggaatttt 5400
gtaatagagg ttatagggtt ttgattaggg tgttttggga ggtttagaat tagtggtagt 5460
atatagggta gacggtaagt gatttggtat ggggaaagag gtaggtgttt aggtcggtat 5520
agtatattcg taaggaatag gtagacggga agtcgttcgt gggtttgtgt gtgtgttcgg 5580
agttaaaatt ttgttaatgt tttatgtttt gggtatattt attttttttt tggggagtat 5640
tttttttttt attttttttt ttttcgtttg ttttttttat ttagggtttt ttttattttt 5700
ttcgttttgg ggatcgaggg tattatggtt ttatgtttta ttatcgatga gttgtatagg 5760
gatttagttt tttcgttgtt taggtcgggt tttttaggtt tagggttttt aggaatggag 5820
agggtattag tgttttttat ggatttaaat ttttcgtatt tcgtttttgt ttttttttta 5880
agataggttt tcgagtttta aggttttagg gttttgtgga ggtcgttacg tagtagtaag 5940
gagaatgttt tgtatttggt tgatgagatt tttagagttt tattttttat ttttttattg 6000
tataaacggg tttttaggcg attgtagtat tcgttattgt tcgtaatagg gtgataagag 6060
ggatgatttt tttttttttt ttttttttgg ttggtggagg tacggggttg gcggacggta 6120
tgtgttttcg tgaatttagg ttaaatttgt tatcgtaaat acgattataa ttcgggtttt 6180
tgtgtaataa aagttttttt aagtattagt tgttggtttg ttttgtttag cggtgtttgt 6240
tgtaattaga tttgtatatc gagaaagaat ttaaaagttt ttgatgtttg ttgaaataat 6300
ttggtttagg atttacgtgt ttagatttta gagttgtgtg gtatttgagt ttttttcgag 6360
tttttattgt cgttcgagga ggatttttag atttgtgttt tggaggtaga gtaggttgtg 6420
ggacgggttt ttgggtggga aggattatgt ggatatgttt ttttgtttga gagttttaat 6480
attttcggga cgtgggagtt ggcgcgttgg taggatttag gtgttttttt tttttttaga 6540
gaaaaaggtt tcgttgtttg gtaataggtg tagatttgtt tttaattaat gttagtaggt 6600
tttttgcgtg atgaattttg ttttttagtt aagatttaag gtattttgtg aatattgttt 6660
ttttgtagtt tgagtttttg tggtgggagg taggagttat ggggagtggg ggtaggtttt 6720
ttatacgggt tttatagtta ttggtagtat tgatttgatg ttttttgagt ttagagttta 6780
gggttagata gatttattgt ttcgattacg agttggttta tttagagggg ggcggatata 6840
gtatttaggt agtagatgta ttgtgattag ttttgtagcg gggttgtggg ttttttgggt 6900
tggatgttcg ggaagaggta ggtggaggta aacgttagga tatttttgta gtgattgggt 6960
gattgtaggt tggaaatgtt ttttgtgggt tgtggttgtt taggaaggtt ttgaatgggg 7020
ttagtggata gagtttgtat ttagaggggt agtgttttgg aggagtgagg ggtatggtag 7080
tgtagggatg tttaggtcgt ttttattttg ttattggaaa gttgggcggt ttcggttttt 7140
ttagtttttt cgtttgtttt tttgtttgta aagtggggtt agaaatagtt ttttttgagg 7200
gttgttgggg gattttgaga tgtagtttat ggcgttgagt acgggttttg ttttttacgg 7260
gtgtggtggg tgtcgcggtt ggtgtggtat ttgggcggga aaagggggta tttgtaaagg 7320
ataggtaggt ttggatgttt aaatatgtag atttggggat gggaggtttt aggtaagggt 7380
ttgtgtgatg ttattgta 7398
<210> 9
<211> 1587
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ggatgggttg tagataagag tagttgagaa ttacgtttta tttttttttt tagaaatttt 60
gaaacgaggt tttattttta ttagaagttt agattgtatt atggttattt taattttaaa 120
atgttagatg gtaagaatat ttgtttattt tttatttttt ttggaaaaag ttgtttttcg 180
ggttttatat gcgattgtag ttttttagtg tgtgaaatta ggaaaataaa atatttaacg 240
gtgtatattt ttatatttaa atagttagaa ataataggta gttaggttaa ttatttttga 300
ttagtaagat tagagttatt agggtgttta ttggtttaat aaatgaatgt ttttaggcgt 360
ttattatttg taatttttag aagttttaat ttttataaga aataaaataa gaggggtttt 420
ttgtttttaa tagtgaaaag atcgtttttt tttttttttt tattcgggtt aattttttta 480
gtcgtttttt tttgtattac gaatatacgt tgtaggaaag cgtatttata gttcgggata 540
tttttagatt ttttttttaa aattttttat tttttgtgta taggagaaat tgagagaagt 600
ttttattttt tttttaaatt ttataagtag gggagggagt tgtagtagat ttttattttc 660
gtttttaaaa gcgaatgtga aaaagttcga gaaggtacgt tttgcgagtg gaggttaaat 720
cgaaatttga atagaatgta cggttttcgt aaattacgat tgataaagaa gatattgaga 780
cgtttgcggg ggatataagt tatggttgtt tcgttttttt tttttttttg ttaattatgt 840
tttttggaga aatcgtcggt tcgatttacg tatatatttt tgtaaaatac ggataaaatt 900
ataagtagtt atttttattg tttcgtcggt tacgagggaa gttcgagttg agcggagggt 960
agattttaag ggtcgtagtt tttggtcgtg tggatcgggt ttgcggttgt agagcgcggt 1020
ttcggttgta gtaagatttg gggtagtgtt cgaggcggcg gcgagtatac gtggcgggtt 1080
ggattgtaga tcggtttttt cgcggcggag attcgcgatt tagcggattg tattagtagg 1140
aagatattaa ggttgttttt ttaggtcgtt tttagatggt ggagtttttt ttagttcgaa 1200
gattcggagt tagcgtttag attcgagttt tatttattgt ttattttcgg ggtgtagggt 1260
agaggtgtta gtgttgtaag taaatgatac ggttattttc gaattagtta ttgtgggtgc 1320
gtattcgagt gtggggatgt tcgtgtaata tttatatgga gacgttaagg aggaggaaat 1380
aaatagatta gaggttaaat gtgattgtta tttcgttatt attggttttt gtttattttt 1440
ttattgtttt taaagtaatt ttgttgtatg ttgagaggat tacggtataa ttttgtttaa 1500
aagtatatat gtatttttcg cggttatttt aaatgtattt ttgtagtagt taagaatatg 1560
tgtttggttt gtcgattttt tttttag 1587
<210> 10
<211> 3381
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ggtaaattaa tggatttttt attatttttt ttttttttgg gttgtagtag tgagttaatt 60
ggtttagatt tgtttagcgg aatgtttttt aggatatatt gagtattgta gtaagagttg 120
tatatgcgtt tagggagaat gtggatagac gttgtttgtg atttacgggt aaagggtttt 180
tttttagagg tagtagaggt agattttgtt tttggtgtgt tttggttttc gatttggagg 240
ttttttgggt taggttaaga tttttttcgg tagcgatggt ttttagttat atttaattgt 300
tttgaaggga tattttttgt ttattttttt gttcggttgt gttttttatt cggaaggttt 360
gtgttttttt cgtttgtatg ttttattttg aggaggtttt tttggttttt tatcgttttt 420
tttatgggtt tttacgtttt ttcgaattat cgcgtttaag taggagtacg ttttcggttt 480
tttttatagg gcgttttttt ttataggggt gttcgggatt tttattttgt gtttttttgg 540
tggtttttat aagtttggaa gggtaggagg cgtattttat ttttttgggt tttttttttt 600
agcgtttggc gggagtttag gttgtatttg tggaatttat gatttttttt tttttgttta 660
agttgaatat attgttggtt tttgttcggg tggagttcgg ttaattagag tgaggggttt 720
ttcgtagggc gaaggggtgc gttgttagat gtggtatttt cgttttacgg agatatacgg 780
tgttttatac gttagggaga ggtttgagac gtaaagagtc gtcgagcggg ttgcgggatt 840
gtttcgttgt tattttcgtt tgtagttatt ttttcgtacg tatttgtgtg tgtatttagg 900
ttaatatgga aggcgttatt ttaatttttg tcgtgagtag gtgggaggga agagagacga 960
gaggtatttt attggttgtt tgggaaaatg aattgtattt tttttttttt tgcggaggat 1020
taattttttt tattttttcg ggtgggtatt cgtattttgg ggtcggagtt tgaattcggg 1080
agttaagggg ttttagtttt agggacgtga agttgagcgt atagcgggcg tttttagata 1140
ttggggaaag tgttttacga tgtttcgagt ttttttagtt tcgttagcgg ggcgagcgtg 1200
agggtgtttc gatcgattag cggtttcggg tgtagggtgg cgggttcggc ggcgcgcgtt 1260
tttttttttt ttttggcggt tcgtacgtgt cgttcgcgtc gcgtttttac gggttacgcg 1320
cgggtttcgt agcgtcgcgg tcgagtcggg ttgttcggtt cgcggatata gcgtcggtcg 1380
tcgtatttcg tgcggggtcg cggcgcgatg ttgcgttgga atgaggaagc gcggcggcga 1440
ggggagggtt cgggcgcggt gcgcgcgggg gtggcggcgg cgcgtcgagc gggttcggcg 1500
cgggcgagcg ggttgtagtc ggcggcggcg ttagtaggta cggttcgtat tcgtcgtcgt 1560
ttcggcggtt tttgggggtt gagtcggagt tcggcgcgat tgtaaagttt tcgtgcgcgg 1620
tttttttggt tcggagttgc ggttgagacg cgcgtcgcgc gagtcggggg attcggcgac 1680
ggggcgggga cgggacgacg tatttttttc gtgtttcgtt ttgcgttttt ttgcgcgttt 1740
cgttttttgt atcggagtag cgattcggga ggcggtcgag aggtgcgcgc ggggtcgagt 1800
cggttgcggg gtaggtcgag tagggatcgt tagcgtgcgt tattttaaag tttgcggggt 1860
ggtagggcgc gcgttttggt tattcgtcgt tttgggcggt agttggtggt aacgtaaggg 1920
cgcggcgggg gcggtcggcg cggagggggt taggtacggg gttcgcgggc ggcgttgtgc 1980
gcgcggggta gtcggtcggt cgggagcgcg aaagtttggt ttgagtcggt tgggggcggg 2040
gagtgtggcg gagaaatggg gaataatgcg agtgagtaat tttaggaagt tattgtgaaa 2100
gaaagttggg aagagtttcg cggttaagtt agtaggatat tttaataagt gattgcgcgg 2160
ttcgcgttcg gggcggtgat tgcggtaagt tttttgggtt ttcgcgcggc gtattttagt 2220
ttgggcggga cgttcggtcg cggcgaggcg ggtaagtttg gtagggtaga gggagtttcg 2280
gtttcgaggt tgtttttcgt attcgaggat tagttttggt tttaaagcgc gacgtataaa 2340
tttacgtgag tgtttttaaa ttgaatttta ataggaaaat ttggggtaat tggtgaattt 2400
aaaaaaaaaa aaatatagta aagaaaagcg gtaaggttgg tagattttgg tgtcgtttag 2460
gttcgttttt tttttttgag gatagtgaga gagtttattt ttgttaagcg tttgttgttt 2520
tgtattgtgt tagtaggtgt aggattaggt cgatatggga tatttttgag tagtttcgtt 2580
gttattagga gaggagtttt agtttttaat tatatttaaa tttatgtaga tttatatata 2640
tttacggaag ttagttttta taaagtcgtg tgtaaagagt tttttttata tttgagtcgg 2700
gagttttttt tttatattat aaatatgatg agatcgagtt tgaatttaat ttttgtaaga 2760
gaggaattat ttcggttttg aaaagttagt ttttttgttg atcgtaggtt tgacgtttaa 2820
gttattaaat ttttttagga aaatttttag taatattaag gtattaggtt atttgcggtt 2880
atatttgaaa tgtattttaa atatttgtta agtatcgttg ttgatgttta aggaatttcg 2940
tgagggtttg tttttttttt taatttggag gtatttaatg atcgaaaatc gtagcgattt 3000
tatagggttt gattaggtat agtttttaaa tgtagttttt ttttttttag ggattgtagt 3060
ttatttagat tgaattttaa tgcggtgcgt tttgtttagg ttatttattt ataatttttt 3120
attgcgtcgt aggtagtata ttttagtttt gagatatttt gttttaaaat tttagataaa 3180
atggtgttga ggaaatgttt ttttattagt tttattaatt tttgttaaaa gaggaaaatt 3240
tatggaattt gaaaatattg cgtatgatat ttaaattttt atagatattt aaatgttttt 3300
aaggttaggt ttaatttggt tatgagtcga ggggtggggg ggatttatat agaaatgttt 3360
tgggtttttt tgagtttatt t 3381
<210> 11
<211> 3381
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tttattattt ttggggagtt tttttggggt ttatagaaaa ttttatttta tttcggtttt 60
tttagtatcg gtgatatttt ggaattcggt ttcggttgtt cgttaaggag gatttggttt 120
gggggcggga gggtgtttta gagtttttgg gggtttatcg tattttttat tcgaggtttt 180
tcgcgagcgg agtcgttttt ttaggtcgtt cgtttttttg tcgtaggagt aggttcgcgt 240
tcgtcgttcg agagttttcg gtagagggag atattttagc ggttttttcg atttggtagc 300
ggtcgggtcg ggagtgggtg ggggtgatgg ggggtgggga gaaaaggggg agtggggaga 360
ggggaggtgt gtgaaggggg ggttcggggg gcgggttttt gtgtcgttga cgtttcgagt 420
agtgttggga agtataggtt gtgttgttac gtcggtgtta gtttgatgaa gattggtatt 480
aggtaagttg ttatttattt ttatgttaga gacgtttttg taggcggcgg cggcggcgcg 540
gcggcggttg ttgttgcggg cggttgtttt agagcgcgtg tgttttattt tagtttttaa 600
gttagagtat tatttattgc gatagggtaa ggaggagaga gggagagagg gaggtagtag 660
ggaggagaga gagggaggta gtagggagga gggaggtagg gagtagcgag ggacggcggg 720
agcgtgtaga gagaagttgg ggaagcgtcg ggagagcgcg gagcggagta gcgcgagggg 780
cggcgaggtc gggtacggag gttgcgagag tttcgcgggt cgttcgtttt tttgttcggt 840
tagcgtttag tttcgtcgtc gtcgtcgtcg tcgtttcgtc gcgtttgggt tcgtggtcgg 900
tcgcgtattg ttttcgggtg taaggagtcg ggttgcggat tcgaatcgtc gcgggtttaa 960
tttcgtagcg ggcgggcggg gagttgtgcg ttaggagcgt taggggattc gagaatagga 1020
ataggtacgt cggttcgagt tcgggtgtag aaggttttcg gtcgggcgtt tcgcggggag 1080
aggttgggaa tcgcgggtag gttttaggtt tttttttttt cggtttcggg cgtttttggg 1140
gtcggcgttt atttcgcgtt attagtttgg agatgttttt tagcggttgg aggcgggagc 1200
ggttttaggt tggggttagg tgatcggagg agtcgaggag tcgcggtcgc ggtttgggga 1260
ggtagggcga atgagggttt gtagacggat tagtggagat aggggaatat cggcggggtt 1320
cgggaagtta ggattcgagg ggttatacgt acggattttt atttagggag gagcgagaat 1380
gtgtagggtt atcggttttt tatgattgtt ggggattttt ggtgaggcgg gcgtaggggt 1440
tcgcgcgagg tttgggaatc gggagttttt ttggttcgag aattagggga tgagttcgta 1500
aaagagggaa ttgaaagcga tcgagagcgg agagttgagg gggatggcgt aggatttcga 1560
atttgtcgtt taaagtttgt atttttttcg ggttaggaga cgggtttttt tggttttcga 1620
tttttaggaa gaaacgagcg aaatgggtcg ttttttttcg gggtttttta cgggggagtc 1680
gggggttttc gcgcggtggg gagattcggg ttgggaattg aggggtaggg gtttgtggat 1740
cggtttgaat tagggttggg ttttaggatt agtttagagt tcggtttata ggatttagat 1800
tgtttacgga atcgggatcg aggggtcgat aagtagttta tacgtcggtt agagtagagg 1860
gttggaggtc ggagttgggg gttggaggaa cgggtggcgt ttttaggatt tagtaatagg 1920
attatagttt ttttttgtgg tggaagttat tggaatttgg ggagggtagt acgaggggtt 1980
ttgtagtttc gcgtgtgaaa aagcgtttag gtaggcgatg aaagtagttg atttgagtta 2040
tggtaggcga gtttcgaatt tttgttgttt ttttttgaaa gtgttttttt aggaggagag 2100
gatttgggtt atataggatt cggttttaag agagcgattt cgggaagcgg atagatcgaa 2160
gagatttttt gggcgaagcg gtagggtagt ttcgcggggt tgggagtgga tttgaggttt 2220
cgatttaggc ggttcggagt gttttaggag ttatttgggt ttgcgggcgt agcgcggcgg 2280
ggcgggagcg gtggttcgta ggggtcgcgg tttgcgatga aggtcggggg gtagcgttag 2340
tagcgaggtg ttatagtggg tcgaggagtt tgggttgtgg tttagggtag gatcggttta 2400
aattttagtg ttttgattgg agtcgttttt tgtgtttatt cgcgtcggat tgagaagttt 2460
ataaattcgg tttttggtgc gttcggggga ggaggaagtt tggagtgttt tattgttatt 2520
ttttttgttc ggagatttta ggatattagt ttttcgggtt ttaaatgttt tataatcggt 2580
ggtagttaaa agtttcgtat tttaggtagt ttagacgatt tttttcgttt taaatttgag 2640
aatgatggtg tttaaatata atacggtgta ttatttaaag tttttgtttt tgtttttttg 2700
ttttttttgt cgttttggtt ttcggaggtt ttaggatttt ggtggaagcg gggagggagg 2760
gtttcgtttt tggttttata attttttatt cgggttgtat ttttatagtt tgggtttagt 2820
tgtggggtgt ggggtgggaa ggggtttcga ttagggaggt aggttatttt ttgggtattt 2880
agagaaagag tgtgtgtggg gggtgggagc gggggggagg agggtattga ggggaggaag 2940
atttgagatt tttttttttt aatattaaat ttattatttt agttttttgt atttttggta 3000
gggagagtta gatagttttt ataggatacg gaagacgtac gatttacgat ttacgagtgg 3060
tttcggcggt tcggggcgcg gcgattgtcg tcgcggagtt ttaaggttgt tgttttgtag 3120
gtttggaatt cgtgagagtt ttttttcgtt gagagttcga ggggggaggg agtcgtgatt 3180
ttacggagat tttttggtta tcgttttttt tttgtgagcg ggaaaggttt gaaagttaag 3240
agaaagagag gttgtttaga ataaggggta gggggttatc ggagggagat gggttcgatt 3300
atcgtttata gtaaaatgtt tcgtgcgaat tgtattgaag tatatttaat ttgagattgg 3360
ttgttttatg attttttttg g 3381
<210> 12
<211> 1958
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
atgttgggtt acgttgaaaa tttgtggttg agagttggat tttcgttatc gttacgtatt 60
ttgttaatga gatagggtaa tttatggtta ttgagtttcg attagttaag gggtagagag 120
ttttcgtttt ttattgtttt ataaaagaga tttagtaaag ggattttatt agtttttagt 180
ttttagtttg cgcgagggtg taggaaggaa agtttaggat tttcggagta gagtatagta 240
gttgtagagg taaggttagt atgtcgttta attttaaatt ttagtgttat tttattttta 300
tttttttgac ggttttaaga ggggaaagtc ggtatttaga ggtgagttat ttttggattg 360
atttatttta ttttttttgc gtgttagttt taggcggtag gtaggttgtt tttgttcgta 420
gttttttggg gttcgttgtt tttttttttt ttgttggatg ttgttttgtt tttggttttt 480
tttattttgt tttttttttt tgtttttgag tattttagat tgtttgtttg tttttttttg 540
gtcgttgggg atattttggt ttgatggaga gggtttaaga ttttttcgtt tttttcggat 600
acgggaaaat attatttttt tttttttatt cgttatgttg agtggtaggg agggtgtttc 660
gtttttggtt ttttttttta tttttagttt ttgaattttt tcggattgat ttatgttttt 720
tgttagttga gggaagcggc ggattacgat ttttttttgt tttttagcgt taatttgaag 780
cgggagttgg ttggggagta gtcgtatcgt cgcgttttgc gtgagtcgag gttgttcggt 840
tcgcgggcgt tcgggacgcg gggaaggtgg gattttgtgc ggggggtaga gggttcgcgg 900
atatttcggg gaaggggttg gtcggaatcg ttaggggcgc ggttttttta gttaaggatc 960
ggttcgcgga ggcgcgttag gagcgggaga gggtggcgcg ttcggggcgt aggaatttag 1020
cgtagtttag gttggaagtc ggggcgttgg gtattataga gttcgggaat ggggcgcgcg 1080
gagagcggtc gttcgaggac ggcgttgcgg cggttgtagt tcgggattta ttgttttatg 1140
tttttttttt ttagggtgtt tggatatgtt gagtttttag ggttagttta tttttatcgt 1200
cgatcggtcg tagttgtatt gcgtagtttt ttttattagc gagttcgagg agtttattat 1260
tatttattac gattaggttt ttatcgattg ttagggcggc gattttttga aggtgaggcg 1320
tttacggtta gttaatttag tcggagggcg gtacgggagg gttggaaagg gttggggcgt 1380
tgtatttagc gtggggttgt tgagcgtagg tagttagtgg tattttttag atatttcgtt 1440
ggtgttcgag tcggagaggc gcgttcgagg atttttatac ggcgagaatt tcgtttttat 1500
tcgaagattt cgatttatat atatttagtg gggttggggt cggtgttttt ggacgttgtt 1560
atggtttaaa tttttttttg ggcgttttcg aggttttagg aatttttaaa gatttgaatt 1620
cgtagcgcgg aattttgacg taatttaggg tcgaggaaaa atgattaaaa tttaataagt 1680
tcgagtgttg gggtttatta agcgggtcgt tttggttaga aggttcgttt tatacgtttt 1740
atatttgagt tcgtttcgtt tttgttggtt tacgttcggt agagtcgttt cgagagtata 1800
gaggttgttt ttagtgcgcg ggtgattcga ttttggagta gtaggggatt ggttgtcgag 1860
ggggtattta gattgagata ggtgggaggg taggataaga tttttaagtt tattgttttt 1920
tcgattttag tcgttagatt ttataagtat aatagggt 1958
<210> 13
<211> 4899
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gaggtagttt tgggaggtat tggtttgaag ggttagattt ttggtaagaa tttttggaag 60
aacgtttgtt tttcggaatt agatagggag gcgtgtaacg gggtggggtg gggggtattt 120
ttagttgtag gtatttttat ttttaattat ttgtaagagg atatatatat atatatattt 180
tgggtgttag agaagttttt ttttttttgt attttttttt ttttaagttt ttgaaattta 240
gaagtgtttg tttttaggcg ttagttttgt tgagtggatg tggggatgga ggttattgga 300
ggtttagggt tggtttgttg tttttgtttt ttgttaggag tattgtgaag gttttgtagg 360
gttagttttg ggaaatttta ggtttggttt tatttgattt ttttattgga gcgaggcgtg 420
tagttaagtt tgtttagatt tttttaggtt acgggttcgc ggtagtttag tttagtattt 480
gtaggcgggg ggatcgcgcg tttggttcga agatttcgtt ttgggtaggg gatagaaaat 540
atgaaattag atggggagtt atgaataatt gttttttttt tttttttgtc gtgttttttg 600
aattcgtacg ttatgtagga ggggggcggg ggcgggggcg cggggaggag gagggggtcg 660
tttgttatta atttgggaat aagcggttaa tttcggtgat tggtattttc gttttttttt 720
ttttattttt tttagtgtgg ggaaagtagt taagttcgcg cggagcgatt gtgaggggtt 780
ttgttggaat ttggtagcgc ggaggtttgg agagaagttt tatgttggtt tttatttagt 840
cggttcgttt ttttcgagtt ttggaagttt tatttagtcg tgtatttaat ggttttataa 900
agttgattat aagttttagc gtatttttga aggagttaaa agcgacgtag gtgtaaacga 960
gtcgagggag ttttttattt cggtgataga atgggataag ttgggaaagg tttagattat 1020
ataagtttaa ggtttattag gtcgtagaaa gtttgttttg ggaatcgggg gttattattc 1080
gttttattta gcggggttcg gggattttgg gggtcgagcg aggttagttc gggcgggagt 1140
atcgtcgtta gcgcgcgtcg gcgatagggg ggaatttcgt tgggcgttgc ggttaggtcg 1200
gggtttaggg cgttgggttg tgcgtttgta taaatttgtg tttcggcggg tcggtgttaa 1260
ttttagtggg gatacgggag aaagagtacg ttagtaggtt acgcggcgcg tgggtagtgc 1320
gtaatttttg tcggcgttta ggttgtacgg ttacgtttta gtcggtgttt ttaggttatg 1380
gatatttagt tttagggtcg ttttgcgttt ttttttttta gtttattttt tttattggtt 1440
tttttttttg ttcgagtggt agcgcggttt cgtagggagc gatttcggga gggatagtga 1500
tcgtacgcgt ggagtgggga cggcggggta taggacggta gtttaagagt gttcgtatgg 1560
tcgaggacgt tttcgttgcg agtttggggt cgaggggtag ttttttttcg gagttattaa 1620
tttcgttttt tcgtgtttag ggattagtaa tttggtgttg cgggcgttag aaagaaaagg 1680
gtagcgtttc gcggagcgcg cgggggaaga gggattgcgg tagcgggacg cgagggcggg 1740
aggggcgtag tagcggggag tcggagcgta gcggagggga gcgttggggg gcggggagcg 1800
ttcgggtagt tattttgttt tcgtttggag tttcgcgttg cgtttaggag ggcgtaatac 1860
gtagttttcg cgggggttag agttcggagt tttttagtgt atgttttttt ttttcgcgtt 1920
ttgtcgaggt ttcggttttg tttgtcgtgt tttgggtttg gttgtgttcg ggggttttcg 1980
cgggtagggc gcggggtagg tagggcgcgc gcgtcgacgt ttttttgttt gataattaat 2040
ttgagttaat gcgattttta tgtaaagtta atagcggata attgtttatt ttttcgttaa 2100
tagtttttat tataattatt tatttggaaa tttgcggttg gattaatcgt tatattttcg 2160
agatgagcgt cgttgtaatt cgtagcgaac gcgggtaggg atttggagac gtttttcggg 2220
cgttggcggg gtcggtgtgg gttagtttcg ttatcgtttg agacgcggtg tgtttaggtg 2280
ttggtgttcg cgggagaggg ttgtggggcg ttttttttag gatttgtttg atttgttttt 2340
cgttcgagtg ggtggtgcgc gggtgcggga ggcggaggga ggaggagggg tgaggggagg 2400
agggtttgtg gggttgcgga ttcggagtag tttgggtgga gcgcggtttc gggaggtttt 2460
gggtgtatcg cggcggggtt tgggggggtt taggcgtcgg aggagtcgtc ggtgtcggaa 2520
tgtagcgtgt tttatttggg agaaacgttg ttttcggttt tttgtttttt ttttgttgtt 2580
tcggtttttt tggtttcgtt tttcgtttta tttattcgtt tttattttag gttttttttt 2640
taggattttt tttttaagga tttaggtttt tgaaaattat tggtaatagt tatacgtttt 2700
acgattgaaa tttataagag aagagtttta gttttgtagg tcgttttagg gttaggggta 2760
gagatggtgg taggtggtgc gttaattttt tagggaagag gaatttgtat tataaagatt 2820
tgtttttttg agttgaagtt aaaacggggg cgttaagcgc gtttcgtttg gcggcggtgg 2880
aggggtcgcg cgttcgcgtt gttttagtcg gagttgtttt ggttggtgat tggaggttta 2940
acgttcggaa tttaggcgtt tttgtagttt agatttgtcg gttaaggggt tttagttgta 3000
attttttaaa atggtgtttt tggaaaataa taaatttaga tttaattggt gatagttttt 3060
ggttatagag aatgaaattg tttttttttg gcggtggaat ttttaaattt cgaagagtga 3120
aagaatataa tgaaataaaa tgttataaga ttattggatt ttttagaaaa aggaagattt 3180
taaattattt ttaaaatgag gttttgtaaa tttttgttaa aaatttttaa atttcgaatt 3240
tttttttata atatttgatg agtgttttaa gagtaaacga gtaaatttta tttcgagaat 3300
taataaattt aagttttggt taaggttttt ttcgcgtttt tttttcgtga tttggggaat 3360
gtttcgtttt atcgtttatt tggtttttgt tatttcgttt attttgaagt gattcgtgga 3420
taatgttgtt ttttgtcgta gtttcgtcgg ttatttaggt agaacggggt atgtaaatgg 3480
tttggagagg tcgaggtcga atattgcgtt tattgtttcg ggcgtttaaa gcgtcgagta 3540
gttgcgtaga ttttttgggt tcggattttc ggtcgttacg ttaatgttat tattgtaaaa 3600
tattagattt tgagaattat gtagtttgaa tttattagta gttttttcgg cgaaggtttt 3660
ttttttcgtg ataagtttta aagtttagat tttttttaac gttggtaggg gtaggaagag 3720
gaggaggggt ttagggaggg gggtttttcg taagtggggt ttcgggggat ttttgttttt 3780
tttttggtgt atttcgtaat tttaaaagtt ttttttgggg ttttgagcgc ggatgtttga 3840
tttgaatgat ttgagatttg gatatatttt cgtttttttt taagagttgt tttaatgttg 3900
cgagtttaaa tttattgaaa gaggtttaga tattaagtcg agtgaatttt atagatatta 3960
ttttttgttt taatgatcgc ggtagtgatc gtttttgaag ttatattttt tagggtgaat 4020
ttataataat gtatgttaga gaggttgcgc gttttaaagt aaaatagtta aaatattagg 4080
ttacgttttt taaattgtag gattgtaagt agtttataaa tttttagttt ttattttaag 4140
gtgaggagag ttttagtgat ttgaggattt gtttgtattt tcgtttttta cgttcggttt 4200
tttattcgta tttgtttaag tggtttcgtt tttttagaat ttgaatggtg gggaggggtg 4260
tttttgatgt ttcgggtgta gggcgggtat tagcgagcga gatttaaggg cgttagaatt 4320
taggagcgta aattatcgtt agggtttgag ggacgtagag gcgggtggag tagtgttttt 4380
tagattcgtg ggaggtcgta ggcgttagta gaggtaattt tttttttttg agtaatgtta 4440
gtttttttta ggtttaggat ttttattaac gtgttttttt atttttttat aggattttaa 4500
gttgttgttt tttttttgtc gtatttgagg ttgggaaaat tttttaggag aaggtaagag 4560
aaagttatta gattagagtc gaggattaaa ttttaaggtc gaagacggta gaggggtagg 4620
tttttttttg tatattttaa ggtttttttt gtattcgcga ggtttttttt gagcgtttag 4680
gttttcgaaa tgtttgtttt ttttttgata aaaggagggg gtaggatgtg aaggggtagt 4740
gtaattaata atgtttttgt aaatataata atagggaaat atatggagga aatttattta 4800
ttgggtgtgt tatttttggt ggggggcggg attgaaagtg gcgttattta gatttaggaa 4860
aaagttacgg ggtgggcggg gtaagcgggg gatttttgg 4899
<210> 14
<211> 1206
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gagagtagta tttatttttt tttattattt ttgaattgcg agataaagaa ttttaatttt 60
ggggttagaa tttaatttgt ttttgagaat atcgaatatt attaagtaac gttagtacgg 120
atataatagt agtgtgaggt ttgtatatac gtagttgaaa tggtaaattt aaaataggag 180
atattgtgtg tacgtatagt gtgtgtatat agtattaaga tattttttgt ttttggagtt 240
ttttttgttt tgttaaattt tacgtttttt ttggaaaggg ggagcgaatt ttttaagttg 300
tgaggatatt ttttttttat ttagttatat tttttttcgg gttagttttt ggtgaaattt 360
gggcgatgtg gagttattgg gggatgtgag tgagggcgtt tttgtttatt ttaatttagg 420
tttttgggag agtttttagg atcgttttgg gatttagagg aggtttcgtt ttgggtcggg 480
agttgaggtt tttcggataa acgttaagta gtttttattt atcggtgttt aataggtttt 540
atataaagtg ttaaagtgtt ttagtaaggt tttattagta tttgggtcgt agttgttttt 600
tggtttttgg ggttcgcgga gttttagatg tatttgtagt ttttttcgag ttttgtaagt 660
tatttttgtt tttttttttt cgtttatttt tcggtttttt tatttttttt gttatttcgg 720
ggaaggttac gtagggtgta attcggacgc gttttcgggg gaagttcgcg acgtagtagt 780
tatattttta gtttgtattg gcgtttattt tatgatttcg ttttcgcggt cgcgggtagg 840
gagcgcgcgt ttttatcggt tgattagaag cgggagtcgg aggagttttc gttcgtcggc 900
ggttagcgta tagttcggtt aggggcgttt tttttgtcgt cgtcggtttt ttgatcgttc 960
gcggttcgcg gttcgtagat tatagttagc gttgtgttgg gtaggtggcg gtagcggggc 1020
gcggcgcgtt taggcgtacg ggttttcggg tcgcggcgcg tttttcgtta cgtcgtatat 1080
taaggttcgg tcggtcggcg ggcgttttta ttagtagttt gaaattataa tattatgtta 1140
aagaataaag ttgtttttcg gaaaaatatg tgttgtatat ttgataaaga taaattggat 1200
tattta 1206
<210> 15
<211> 7398
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ctaaaaccga taaactctaa acacaatcac gaaaacatac gcactttcta actactctcc 60
taccattatc ccttaaattc ccattttaat aaaacgtaca ccctaacgac gctccccaaa 120
aaactaaata tatttactac actatacgta aaaataaaaa atatacaatt aactaaccct 180
atactaatct aataaaactc cataccaacc ctaaaaaaaa acaattacat aaatatatcc 240
acactcacca aatacttttt aaaaaaacac tcgaaaataa tactataact taaaataact 300
attataccga acccgacatc ttcccaaaaa aactatatta ttaaactaaa tttcttaaat 360
actaaacccc caaatcccca aatacgacgt aaacaaataa cccaataaaa actaaactat 420
ccgataaacc caaatactaa aattcaaaca aaacataccc taacctaacg taaaaaatac 480
gaaatactat taataacaac aataactaca tttctaaaac ccgaactccc aaaccgacga 540
aaatatacac gcatctaaaa tatctataat tttacaattc ccatatccac aaactcactt 600
aattaaaaat aattcaaaat atccaaaaca taaaaaaaaa aatacctact tttcttaaaa 660
aaaaaaaact taatttcatc tacttaaaaa accacccaaa cctaaaacat tttccgcaaa 720
aaacccccta ccccccgcct ctccaaaata actaaaaaat ctcaacactc ctacacattt 780
aaaatatttc aaaaaaaata aaaaaaaaca aataaacaac gaacgacctc aaacccaaaa 840
taaactatca aacgctcccc gaccacacat tcaaaaaacc gaaatacaat tataacgtta 900
cgacctacta cttcgaaaat aaaaatatta ttccatacta taaattctca cataacccct 960
aactctaaac aaaaaccgaa aatctaaaaa acgaaataac aaaaaaaaca tacaaaaata 1020
aatttctaac tttccaaaac gaataaaaaa aacgcctctc tctcttataa ataacaaacc 1080
taaaaaaccc ttcttaaaaa taaaaaccta ttacttctca aattctatat ctaacccaaa 1140
tccccaaatc taccccaacc cctcgaccct acctacctta taaataatat aatttaaaaa 1200
taaaaaccgc taacctaaaa aaaaaactaa acctcaaatt aaaacccaaa aaaaaaaaaa 1260
aaacccttaa aacaactccc tttctactca ctcactacct aactccttcc ttcacacctt 1320
ccttcgaaaa cgtctactcc taacaaaatc tacttcctac tctcaaaaaa cccttattat 1380
aaaaaaaaaa aaacgtcgcc cgtccctaac ttctctaaca accgtattcc atccccgccc 1440
tatacccctt ctcccgaaca ataccttctc caaaactcac ccaaaaaaat acaacgataa 1500
cccccgaaac gataatcgta ataaaaatat taactacaaa aataccctcg ataaataaaa 1560
attaataacc tctcgctaat accataaaac tcgcatattc gccctacgcc cctcgactct 1620
taaacccaca aaccgaaatc ctacctacca accgcgtacg ctaccgttta acccttacaa 1680
acgcaaaacg cgcgacgacg ataacaaaaa actttattta actacccaaa tacaacctcc 1740
tacaaaaaaa ccctacgccc gaaaaaaaaa aaaaatctct tcccctctaa acgcccgccc 1800
tcctcgccat aacccgacct ccacatccgc ccacatctaa ccgcaacgaa acgcccgaaa 1860
aaaaaaacta aaaccgcgtc tctcgccgtc ccctaaacgc gaaccaaacg aaaaaaaaaa 1920
aaacgctccg atcgtatacc caaaactatc ccccaacgac cactcgaacc ccaacccccc 1980
aaacctaacc ttaacaaacg aacgaaacaa ccaatacgaa acaaaaaaac cgatacgaat 2040
acgaaaacct aatccgcccg aaaaacgaaa acgaaacgaa aacgcaacgc gcgaaaaaaa 2100
accgacgccc gccttcctcc cccattcatt caactaaacc aaaaaaccta aaaactcctc 2160
cgacgactaa ctctacacta caaaaacgcg aacgcgacgc cccaaccaac gcgcaaaacc 2220
cgaaccccgc cgaaaacgct tcctcgccgc taccctccgc gcgacccgct acccaccaac 2280
catcatatcg aaccccgcga tcaacgcgca actaaataaa atcatttcga acttcgaaaa 2340
taaatactaa actaactact acgaccgcga acgtactaaa aaaaacccta cgaataaacc 2400
taacgcgaaa cgaaaatacg ctaaaaaaaa acgaaaatac gctaaaaaaa aacgaaaccc 2460
ctaatccaaa cgccctcccg ctaaaaacgc cgcgcgcccc cgaccccgta cccgcgccgc 2520
ctacgtaaaa aaccctatta aaaacacccg cgtaaaccct acgcgccctc acaaaaccct 2580
atactcgttc tacgcactac cgcctaaatt tccttccttt tattattatt tatatttacc 2640
aaacgacaac gacctcctcg aaaactcgcg aaactacctc gaaactctcc aaaacgcaca 2700
atttcactct aaaaaatcca tcgatcccct ccctttaact ctccccgacg actctcgaac 2760
cccgcttaaa cccgacaacg aaataaaaaa atcgttcctc acctccgact aaataaacaa 2820
ccgcgtccta ctcgaataaa caaccctccc ctcccccacg ccaatttcga aaccgccaaa 2880
ttatacaacc cgtaaaccga aaacaccgaa cgaacacaac ccaaatcgta acaaaatcta 2940
aaataaaata tcccataacc cccatccaaa cctaaaaata tcctcatccg cctcccaaaa 3000
tcgaaccgta aaaaacaaaa aaaacctacg tacgaacaaa aaaaatattt taactctctc 3060
ctatcttcga aatttacaaa atatattaaa acttacgaaa ctactctatc caaacctaaa 3120
tctaacgtcc gcgtctctaa acctataaat acgtacgctt tcctacgtcc tcttaactac 3180
cgatactaaa actctacgtc ctacgtccgc gaaaataaat acaacaaacg aaaaaaaaac 3240
tcacacaata atctccaacg ctctaaaaca aaacttctaa aaaacgaacc tacctctacc 3300
gaaacctaaa acccccgccc ctcgaaaaaa ctcctaaact aacttaaaca aaaccctcta 3360
ataaaccgaa aaaaaaaaaa actatattaa aataaacaaa ctatccaaat atcaaaccaa 3420
actaaaaaat aaccaaccta aaatcctccc cgctccataa ccaaaaccaa aactaacatc 3480
taaatatcct aaacccaact acccacacga cccacctaaa atcaacccta tctaaataaa 3540
aaaaacgaaa cctcctaaaa aaccaaaact ttaactaaac gccaaacaaa ataccaataa 3600
ctattcttca aaactaaacc taaaaaaaat ataaaacgac gaaaaaacga aaaaaaatta 3660
taatccaata accactaacg ctatacaaaa tataaactaa aaacatcgta attactttat 3720
caacttaata ataaaaaccc tttttcaaac tctatccctt tacatcccta cttcccaaaa 3780
aaaaaaaaaa tctaaatcta caaaactaaa aaaacttact attcccgccc ccctccccca 3840
caacacctcc tcatctaaac atctttaaac acatactcat actaaaatct ccctaaatcc 3900
actatattcc gttaaacctc ctacaatccc cgaataaata taacctccct acccctacct 3960
ctttacaact cctccctacg accgctcctc caaaaacctt ccttatccca aatatccaaa 4020
taacacgact taaccgatct aaccactttc caataaaccc ttataaaaaa aaaccctata 4080
ttatacaaaa ctctcctcct acctacgaaa tcgaaatctc tactctcaat tcctaacaaa 4140
aaatatcgaa cccccaataa aatttctaaa aaaaaactct cgtatctcaa cgaaaaccct 4200
ataacgaaaa aaaaaaccaa aatttaaaat tatattcgtt atacaactat caccatttac 4260
actataaaaa ttattaatac cccttcctta aatctctaaa tataactcca cccttacccc 4320
catatacctc catctaaaac tacttctacg actatctccc aaaccaattt tataacccta 4380
taatttaatc caaaacaata aactcattaa aaccatccta atacaacaat taacaatcct 4440
ttaactctaa aaaaaaattt ctcaatctcg aaaaataaaa cctcaatcta ctaattccct 4500
atatttatca atctccccct tatatatcct aaataatttt actaaaaatt ctaatcttaa 4560
aaccatcaaa taacccgaat cgataaacgt aaaaaaatat atatatacat aaatacgcat 4620
atacataaaa actaacctaa aatataaaaa aataaccctc cctaataccc aaaaaaccta 4680
aaatataatt aaaaaatata aaaatatata tataaaaatt aaacaacctt aaataaacaa 4740
acaaacgtaa aaaaaaaata attaaaaaaa ataaaaaaaa aaatataatt caacccaacc 4800
aaaaataata taaacaaaca acttccgaat caaaataaaa aaaaatcacc actaactaac 4860
aaaaaaaaaa tcaatataaa aaaaacgaac cttaaaaaaa aataaaaatt aaattacaaa 4920
aaaaaaaaaa accttctaac caacaacaac caacaacaat aaaaaaaact aaaataaact 4980
aactaaaaaa aaaactaaaa cataaaaaaa aacctaccta taaaaatcat ataaaccaaa 5040
ctacgaaaaa ccaaacatac ccgccgaaaa tacaactaat ccacgaaaaa catctaaaat 5100
aactaaaaat aaacgcaaaa acaacgccgt aaaaacacaa atctctttcc cgaaacgact 5160
cacctaatat cttaattcct acaaaataaa ccgaaaaaat aaaaaaaaaa ctaccaactc 5220
cttacaacgc taaaataata accccaaaat tcctaaaacc aacgaatata aatacctatc 5280
accatataaa ttactaaaaa acgaaaactc caaaaaccac cccaaaacaa aacgaactct 5340
aaaccacgac atctctaaaa acaattttcc aatcgaacaa acgtctaaac ctaaaatcct 5400
ataacaaaaa ccacaaaacc ctaatcaaaa tattctaaaa aacttaaaac taataacaat 5460
atacaaaata aacgacaaat aacctaacat aaaaaaaaaa acaaataccc aaaccgacac 5520
aacacacccg taaaaaacaa ataaacgaaa aaccgtccgt aaacctatat atatactcga 5580
aattaaaatt ctaccaatat cccatatcct aaacacatct accccctccc taaaaaacac 5640
ctttctcttc accttttcct tccccgccta tccccttcac ccaaaacctt ccccatccct 5700
cccgtcttaa aaaccgaaaa caccataact ttatattcca tcaccgataa attacacaaa 5760
aattcaatcc ttccgctatt caaaccgaat ccttcaaact caaaattccc aaaaataaaa 5820
aaaatatcaa tatcttccat aaactcaaac ttcccgcatc ccgcctttac tcccccttca 5880
aaataaatct ccgaacttca aaattttaaa actctataaa aaccgccacg taacaacaaa 5940
aaaaatattt tatatttaac taataaaatt tttaaaatct cattttctac ttttccacta 6000
tacaaacgaa cctccaaacg actacaacac ccgccactac ccgtaataaa ataacaaaaa 6060
aaataaccct ttcctctttc tcccttctaa ttaataaaaa cacgaaacta acgaacgaca 6120
tatactttcg taaattcaaa ccaaatctat tatcgcaaac acgattacaa ctcgaatctt 6180
tatataacaa aaacctttcc aaataccaac tattaaccta ctttactcaa cgatatttac 6240
tataaccaaa tttacacacc gaaaaaaaat ccaaaaatcc ttaatattta ttaaaacaat 6300
ctaacccaaa acccacgtac tcaaatccca aaactatata acatctaaac ttctcccgaa 6360
cccccactat cgcccgaaaa aaacccccaa atctatattc taaaaacaaa acaaactata 6420
aaacgaactt ctaaataaaa aaaaccatat aaatatacct tcttatctaa aaatcccaac 6480
acctccgaaa cgtaaaaact aacgcgctaa caaaattcaa atacctcttt cctctctaaa 6540
aaaaaaaacc ccgttactta ataataaata caaacctatc cctaattaat accaataaac 6600
ctcttacgta ataaacccta cctttcaacc aaaactcaaa acatcctata aatactacct 6660
ctctacaatt taaactttta taataaaaaa caaaaaccat aaaaaataaa aacaaacctc 6720
ttacacgaat cccacaacca ctaacaacac taacttaata ctctttaaat tcaaaaccca 6780
aaaccaaaca aacccactat cccgactacg aattaattca tttaaaaaaa aacgaacaca 6840
acacccaaac aacaaataca ctataatcaa ccttacaacg aaactataaa ttctctaaac 6900
taaatatccg aaaaaaaaca aataaaaata aacgccaaaa cacccctaca ataactaaat 6960
aactacaaac taaaaatact ttctataaac tataactatc caaaaaaatt ttaaataaaa 7020
ctaataaaca aaatttacat ccaaaaaaac aatactttaa aaaaataaaa aatataacaa 7080
tataaaaata cccaaaccgc cctcactcta ccattaaaaa actaaacgac ttcgatttct 7140
tcaatttctt cgcctatttc cctacctaca aaataaaatt aaaaacaact ctctttaaaa 7200
attactaaaa aactctaaaa tacaacccat aacgctaaac acgaatccta cctcctacga 7260
atataataaa tatcgcgact aatataacat ctaaacgaaa aaaaaaaaca tttacaaaaa 7320
acaaataaat ttaaatactt aaatatacaa atctaaaaat aaaaaatctc aaacaaaaac 7380
ctatataata ccactata 7398
<210> 16
<211> 1587
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aaataaatta taaataaaaa caattaaaaa ccacgcttca tctccctcct taaaaactct 60
aaaacgaaac tttattccta ccaaaaattc aaattacatt ataatcatct caattccaaa 120
atattaaata acaaaaatat ctacccatcc ttcactttcc ttaaaaaaaa ttactcttcg 180
aattttatat acgattacaa ttttccaata tataaaacta aaaaaacaaa acactcaacg 240
atatacatcc ctacacctaa ataatcaaaa ataataaaca actaaactaa ttatccttaa 300
ttaacaaaat caaaaccatt aaaatactca ctaatttaac aaataaatac ccttaaacgt 360
ctatcattta taactcctaa aaactttaat ttccacaaaa aacaaaataa aaaaaacctt 420
ctacttttaa caataaaaaa atcgttctcc ctcccctctc cacccgaatc aactcttcca 480
accgctccct cctacatcac gaacacacgc tacaaaaaaa cgcatttaca acccgaaaca 540
tccccaaacc tcctctccaa aattccccac ctcctataca taaaaaaaac taaaaaaaac 600
cctcacttcc tttccaaact tcacaaacaa aaaaaaaaac tataacaaac tttcacctcc 660
gttcccaaaa acgaatataa aaaaatccga aaaaacacgt cctacgaata aaaattaaac 720
cgaaatctaa acaaaataca cgatccccgc aaactacgat taataaaaaa aatactaaaa 780
cgtttacgaa aaatataaac cataattatc tcgccttcct cccctcccta ccaactatat 840
ttcttaaaaa aatcgccgat tcgattcacg cacacatttt tataaaacac gaacaaaacc 900
ataaataatt accttcatta ttccgtcgac cacgaaaaaa actcgaacta aacgaaaaac 960
aaatcccaaa aatcgtaacc cctaaccgta taaaccgaat ctacgactac aaaacgcgat 1020
cccgactaca acaaaaccta aaacaatacc cgaaacgacg acgaatacac gtaacgaact 1080
aaattacaaa ccgaccctct cgcgacgaaa actcgcgacc taacgaatta catcaacaaa 1140
aaaacactaa aactactccc ccaaaccgcc cccaaataat aaaatctctc ccaacccgaa 1200
aattcgaaac caacgcccaa acccgaacct cactcactac tcactcccga aatacaaaac 1260
aaaaatacca atattacaaa caaataacac gattaccccc gaatcaacca ctataaatac 1320
gtatccgaat ataaaaatac ccgtataaca tttatataaa aacgtcaaaa aaaaaaaaat 1380
aaacaaatca aaaatcaaat ataattacca ttccgtcatc actaactcct acccacctcc 1440
ctactatccc caaaataact ttactacata ctaaaaaaac cacgacacaa tcctacccaa 1500
aaatatacat atatcccccg cgactacttt aaatatactt ttacaataat caaaaacata 1560
tacctaattt accgatctct ttcccaa 1587
<210> 17
<211> 3381
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
aataaatcaa taaacctttc actaccttcc ccttctctaa actataacaa taaattaact 60
aactcaaact tacccaacga aatacccttc aaaacacact aaatactata ataaaaacta 120
catatacgct caaaaaaaat ataaataaac gctatttata attcacgaat aaaaaacctt 180
ctcccaaaaa caacaaaaac aaatcctatc tctaatatac cctaaccccc gacttaaaaa 240
cctcctaaac caaaccaaaa ccttccccga caacgataat ctccaaccac actcaactac 300
cctaaaaaaa catttcctac ttattccctt acccgactat atcctccacc cgaaaaacct 360
ataccttctt cgcctacata tcctacccta aaaaaactcc cttaatcttt catcgctctc 420
cctataaatc ttcacgcctt cccgaaccac cgcgcccaaa caaaaacacg ttctcgaccc 480
tcttcacaaa acgctcctcc tcacaaaaat acccgaaatt tttattctat accttcctaa 540
taactcctac aaatctaaaa aaacaaaaaa cgcatctcac tcctctaaat cccctcccct 600
aacgcctaac gaaaacccaa actacattta taaaattcat aactttttct ctcctactca 660
aactaaacac attactaact cctactcgaa taaaacccga ctaattaaaa taaaaaactc 720
cccgtaaaac gaaaaaatac gctatcaaat ataacattcc cgttttacga aaacacacga 780
tatcttacac gccaaaaaaa aatctaaaac gcaaaaaacc gtcgaacgaa ctacgaaatt 840
acttcgctat cacctccgcc tacaaccacc cttccgcacg cacttatata tacacccaaa 900
ccaacataaa aaacgccatc ctaacttcta ccgtaaacaa ataaaaaaaa aaaaaaacga 960
aaaatattcc attaattatc taaaaaaata aattacacct tcccctccct tacgaaaaat 1020
caacttttcc caccccctcg aataaacact cgcatcctaa aaccgaaacc taaacccgaa 1080
aaccaaaaaa ccccaattcc aaaaacgtaa aactaaacgt acaacgaacg ctcccaaaca 1140
ctaaaaaaaa tactttacga tatcccgaat ccctccaatc tcgccaacga aacgaacgta 1200
aaaatacccc gaccgaccaa cgaccccgaa tacaaaataa cgaacccgac gacgcgcgtc 1260
cccctccccc tcctaacgac ccgcacgtat cgcccgcgcc gcgcccccac gaattacgcg 1320
cgaatcccgc aacgccgcga ccgaaccgaa ctacccgacc cgcgaacaca acgccgaccg 1380
ccgcatcccg tacgaaaccg cgacgcgata ctacgctaaa ataaaaaaac gcgacgacga 1440
aaaaaaaacc cgaacgcgat acgcgcgaaa ataacgacga cgcgccgaac gaacccgacg 1500
cgaacgaacg aactacaacc gacgacgacg ccaacaaata cgacccgcac ccgccgccgc 1560
cccgacgacc tttaaaaact aaaccgaaac ccgacgcgat tacaaaattt tcgtacgcga 1620
cccctctaac ccgaaattac gactaaaacg cgcgccgcgc gaaccgaaaa actcgacgac 1680
gaaacgaaaa cgaaacgacg caccctctcc gtatcccgct ctacgccctt ctacgcgccc 1740
cgctccctat accgaaacaa cgatccgaaa aacgaccgaa aaatacgcgc gaaaccgaac 1800
cgactacgaa acaaatcgaa caaaaaccgc caacgtacgt caccccaaaa tttacgaaat 1860
aacaaaacgc gcgctctaac cacccgccgc tctaaacgac aactaataac aacgcaaaaa 1920
cgcgacgaaa acgaccgacg cgaaaaaaac caaatacgaa acccgcgaac gacgctatac 1980
gcgcgaaaca accgatcgac cgaaaacgcg aaaacctaat ctaaaccgac taaaaacgaa 2040
aaatataacg aaaaaataaa aaacaatacg aataaacaac ttcaaaaaat cattataaaa 2100
aaaaactaaa aaaaactccg cgaccaaatt aacaaaacac tctaacaaat aactacgcga 2160
cccgcgcccg aaacgataac tacgacaaac cccctaaatc cccgcgcgac gcatcccaac 2220
ctaaacgaaa cgctcgaccg cgacgaaacg aacaaaccta acaaaacaaa aaaaaccccg 2280
actccgaaat tactcttcgc acccgaaaat caatcttaac cccaaaacgc gacgcacaaa 2340
tccacgtaaa tattttcaaa ttaaatttca ataaaaaaac ttaaaataac taataaattt 2400
aaaaaaaaaa aaacacaata aaaaaaaacg ataaaattaa taaaccctaa tatcgctcaa 2460
atccgcctct cttttctaaa aacaataaaa aaattcactt ctatcaaacg tctattactc 2520
tacactatac caacaaatac aaaaccaaac cgacataaaa cacttctaaa caaccccgct 2580
atcaccaaaa aaaaaattct aactcccaac catatttaaa tttatataaa cctacatata 2640
cccacgaaaa tcaaccttta taaaatcgta tataaaaaat tttccttata tttaaaccga 2700
aaactttctt tttatactat aaatataata aaatcgaatc taaacttaat ttctacaaaa 2760
aaaaaattat cccgacttta aaaaattaat ccttttacta accgcaaatt taacgctcaa 2820
atcaccaaac cttctcaaaa aaacccttaa taatattaaa acatcaaatt acttacgatt 2880
atatttaaaa tatattttaa atatttatca aacatcgcta ctaataccta aaaaacctcg 2940
taaaaactta tttttccttc taatttaaaa acatctaata accgaaaacc gtaacgattc 3000
cataaaatct aaccaaacac aactttcaaa tacaacttcc ctctctctaa aaactacaac 3060
ccacccaaac taaatttcaa tacgatacgc tttacttaaa ttacccactc acaatttccc 3120
actacgccgc aaacaatata tttcaacttt aaaatacctt attttaaaat tccaaacaaa 3180
ataatattaa aaaaatatct ccttactaat cccatcaact tctattaaaa aaaaaaaatt 3240
tataaaattt aaaaatacta cgtataatat ttaaactttc ataaacattc aaatactttt 3300
aaaaccaaat tcaatttaat tataaatcga aaaataaaaa aaacccacat aaaaatatcc 3360
taaatcctct taaatttatt t 3381
<210> 18
<211> 3381
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ttcatcattt ctaaaaaatt ctcttaaaat ccacaaaaaa tctcacctca tctcgatccc 60
ctcaacaccg ataatatctt aaaactcgac cccgattatt cgctaaaaaa aacttaactt 120
aaaaacgaaa aaatactcca aaattcctaa aaatccaccg cactccccat ccgaaactcc 180
tcgcgaacga aaccgcttct ccaaaccgcc cgcctcccta ccgcaaaaac aaacccgcgc 240
ccgccgcccg aaaacctccg ataaaaaaaa acactccaac gactcctccg acttaacaac 300
gaccgaaccg aaaataaata aaaataataa aaaataaaaa aaaaaaaaaa aataaaaaaa 360
aaaaaaatat ataaaaaaaa aatccgaaaa acgaatccct ataccgctaa cgtcccgaac 420
aatactaaaa aatataaact atattatcac gccgatatca atctaataaa aattaacatc 480
aaataaacta tcattcattt ccatatcaaa aacgctttta caaacgacga cgacgacgcg 540
acgacgacta ctactacgaa cgactacctc aaaacgcgta tattttattc caatccccaa 600
accaaaatat tattcattac gacaaaacaa aaaaaaaaaa aaaaaaaaaa aaaacaacaa 660
aaaaaaaaaa aaaaaaaaca acaaaaaaaa aaaaaacaaa aaacaacgaa aaacgacgaa 720
aacgtacaaa aaaaaactaa aaaaacgccg aaaaaacgcg aaacgaaaca acgcgaaaaa 780
cgacgaaacc gaacacgaaa actacgaaaa ccccgcgaac cgcccgctcc cctacccgac 840
caacgctcaa ccccgccgcc gccgccgccg ccgcctcgcc gcgcttaaac ccgtaaccga 900
ccgcgcatta tcctcgaata caaaaaaccg aactacgaac tcgaatcgcc gcgaacccaa 960
ccccgtaacg aacgaacgaa aaactatacg ccaaaaacgc caaaaaaccc gaaaataaaa 1020
acaaacacgc cgacccgaac ccgaatacaa aaaactcccg accgaacgct ccgcgaaaaa 1080
aaactaaaaa ccgcgaacaa actccaaatt ctctttctcc cgacttcgaa cgtccttaaa 1140
accgacgctt actccgcgcc accaacctaa aaatactttc caacgactaa aaacgaaaac 1200
gatcccaaac taaaaccaaa taaccgaaaa aatcgaaaaa ccgcgaccgc gacctaaaaa 1260
aacaaaacga ataaaaattt acaaacgaat caataaaaac aaaaaaacac cgacgaaacc 1320
cgaaaaacca aaatccgaaa aactacacgc acgaaccctc acccaaaaaa aaacgaaaat 1380
atataaaatc accgactttc cataattact aaaaatcttt aataaaacga acgtaaaaac 1440
ccgcgcgaaa cttaaaaatc gaaaaccctt ctaactcgaa aactaaaaaa taaattcgta 1500
aaaaaaaaaa ctaaaaacga tcgaaaacga aaaactaaaa aaaataacgc aaaatcccga 1560
atctaccgct caaaatttac atttctttcg aattaaaaaa cgaactttcc taactcccga 1620
tccccaaaaa aaaacgaacg aaataaaccg tcctttcccg aaactcttca cgaaaaaacc 1680
gaaaatttcc gcgcgataaa aaaactcgaa ttaaaaatta aaaaataaaa acttataaat 1740
cgacctaaat taaaactaaa ttttaaaacc aatctaaaat tcgatttata aaatccaaac 1800
tatttacgaa atcgaaatcg aaaaaccgat aaataattta cacgccgacc aaaacaaaaa 1860
actaaaaatc gaaattaaaa actaaaaaaa cgaataacgt ttttaaaatt caataacaaa 1920
atcacaactt tttcttataa taaaaactat taaaatttaa aaaaaataac acgaaaaatc 1980
ctacaactcc gcgtataaaa aaacgtttaa ataaacgata aaaataatta atctaaacca 2040
taacaaacga accccgaatt tttactactt ccccctaaaa atatttcttt aaaaaaaaaa 2100
aacttaaacc acacaaaacc cgatcctaaa aaaacgattc cgaaaaacga acaaatcgaa 2160
aaaaccttct aaacgaaacg acaaaacaac ctcgcgaaac taaaaataaa tctaaaatcc 2220
cgacccaaac gactcgaaat actccaaaaa ccacctaaat ctacgaacgc aacgcgacga 2280
aacgaaaacg ataacccgca aaaaccgcga cctacgataa aaaccgaaaa acaacgctaa 2340
caacgaaata ccacaataaa ccgaaaaatc taaactataa cccaaaataa aaccgactca 2400
aactccaata ccctaattaa aaccgcttcc tatacttacc cgcgccgaac taaaaaaccc 2460
acaaacccga cctttaatac gcccgaaaaa aaaaaaaact taaaataccc tactatcatc 2520
tctcctatcc gaaaacttca aaatattaac ttttcgaatt tcaaatactc tataaccgat 2580
aacaaccaaa aacttcgcat tttaaacaat ttaaacgatc ctccccgccc caaatctaaa 2640
aataataata ttcaaacata acacgatata ttacccaaaa cccctaccct taccctccta 2700
ctctctctac cgttctaacc ttcgaaaacc ccaaaacctt aataaaaacg aaaaaaaaaa 2760
atcccgtttc taatctcata atctcccact cgaactacat ccccataact taaacctaac 2820
tataaaatat aaaataaaaa aaaatcccga ccaaaaaaat aaattattct ctaaacatct 2880
aaaaaaaaaa tatatataaa aaataaaaac gaaaaaaaaa aaaacattaa aaaaaaaaaa 2940
atttaaaatt tcctcctctt aatattaaac ccaccatccc aaccccctac acccctaaca 3000
aaaaaaacca aacaaccctt acaaaacacg aaaaacgcac gacccacgac ccacgaataa 3060
cctcgacgac ccgaaacgcg acgactaccg ccgcgaaact ccaaaactat tattttataa 3120
acttaaaatt cgtaaaaact ctctcccgct aaaaacccga aaaaaaaaaa aaccgtaacc 3180
ccacgaaaac tccctaatca ccgcctcccc tttataaacg aaaaaaactt aaaaaccaaa 3240
aaaaaaaaaa actactcaaa ataaaaaaca aaaaattacc gaaaaaaaat aaacccgacc 3300
accgctcaca ataaaatacc tcgtacgaat tacactaaaa tatacccaac ttaaaactaa 3360
ctattttata atcctctcta a 3381
<210> 19
<211> 1958
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
atactaaacc acgctaaaaa tttataacta aaaactaaac cctcgtcatc gccacgtact 60
ctatcaataa aacaaaataa cccataatta ctaaactccg atcaattaaa aaacaaaaaa 120
cctccgctcc ccactactct ataaaaaaaa cccaacaaaa aaaccctacc aacttctaac 180
tctcaatcta cgcgaaaata taaaaaaaaa aacccaaaac ctccgaaaca aaacacaaca 240
actacaaaaa caaaaccaac atatcgccca acttcaaact tcaatatcac ttcattctca 300
tcttcctaac gactctaaaa aaaaaaaacc gatacctaaa aataaaccac ccctaaacta 360
acccatctca ccttccttac gtattaaccc taaacgacaa acaaactacc tctactcgca 420
accttttaaa attcgctatt tcttccctct ctactaaata ctatcttacc cctaatttcc 480
cctatcctat tctccctcct tacctctaaa catcccaaac tacctaccta ccttcctcta 540
accgctaaaa ataccctaac ctaataaaaa aaatctaaaa ccttcccgtc ttctccgaac 600
acgaaaaaac attacccctc tctctttatt cgctatacta aataacaaaa aaaatacccc 660
gctcctaatc ccctttttta tccccaaccc ttaaactttt ccgaactaac ctatatttct 720
taccaactaa aaaaaacgac gaactacgat cctttcctac tcttcaacgc caacctaaaa 780
cgaaaactaa ctaaaaaaca accgtaccgc cgcgctctac gtaaatcgaa actacccgac 840
tcgcgaacgc ccgaaacgcg aaaaaaataa aactctatac gaaaaacaaa aaactcgcga 900
acatctcgaa aaaaaaacta accgaaaccg ccaaaaacgc gatcccctta actaaaaatc 960
gatccgcgaa aacgcgccaa aaacgaaaaa aaataacgcg cccgaaacgc aaaaacccaa 1020
cgcaacctaa actaaaaatc gaaacgctaa acactacaaa acccgaaaat aaaacgcgcg 1080
aaaaacgacc gcccgaaaac gacgctacga cgactacaac ccgaaactta ttaccccata 1140
ccctcctccc ccaaaatacc taaacatact aaacctccaa aaccaattca ccttcaccgc 1200
cgaccgaccg caactacact acgcaacctt cttcatcaac gaacccgaaa aattcattac 1260
catccactac gaccaaatct ccatcgacta tcaaaacgac gacttcctaa aaataaaacg 1320
cccacgacca accaacctaa ccgaaaaacg acacgaaaaa attaaaaaaa actaaaacgc 1380
tacacccaac gtaaaactac taaacgtaaa taaccaataa cacttcttaa acacttcgct 1440
aatacccgaa tcgaaaaaac gcgttcgaaa acccccacac gacgaaaatc tcgcccttac 1500
ccgaaaacct cgacccacac acatccaata aaactaaaac cgatacctct aaacgctacc 1560
ataatttaaa ttcccttcta aacgctttcg aaaccctaaa aacttctaaa aacttaaact 1620
cgcaacgcga aactctaacg caatccaaaa ccgaaaaaaa ataattaaaa cccaacaaac 1680
tcgaatacta aaatccacca aacgaaccgt cttaattaaa aaacccgccc cacacgtctc 1740
acatctaaac ccgcctcgct cctactaatc cacgctcgac aaaaccgttc cgaaaacaca 1800
aaaactatct tcaatacgcg aataacccga ttttaaaaca ataaaaaact aactaccgaa 1860
aaaacatcta aattaaaata aataaaaaaa caaaacaaaa cccctaaact cactacctcc 1920
tcgattccaa tcgtcaaact ccataaatat aacaaaac 1958
<210> 20
<211> 4899
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aaaacaaccc taaaaaacac taatctaaaa aactaaaccc ttaataaaaa cctctaaaaa 60
aacgcctatc ttccgaaacc aaacaaaaaa acgtacaacg aaataaaata aaaaatactc 120
ccaactacaa acacctctac tcctaactat ctacaaaaaa acacacacac acacacaccc 180
taaatatcaa aaaaatcctc ccttccctat acctcctcct tcccaaaccc ctaaaatcca 240
aaaataccta tttccaaacg ccaaccctac taaataaata taaaaataaa aatcactaaa 300
aacccaaaac taatttatta tttttatttc ctattaaaaa tactataaaa actttacaaa 360
actaatttta aaaaatctta aatttaactt catctaactc ctctactaaa acgaaacgta 420
caaccaaacc tacttaaacc tccccaaacc acgaacccgc gacaacccaa ctcaacacct 480
acaaacgaaa aaaccgcgcg cttaactcga aaaccccgcc ctaaacaaaa aacaaaaaat 540
ataaaatcaa ataaaaaatt ataaataact atcctcccct cccctctacc gtatttccta 600
aatccgtacg ctatacaaaa aaaaaacgaa aacgaaaacg cgaaaaaaaa aaaaaaaccg 660
tttaccatta atctaaaaac aaacgactaa cctcgataac taatattttc gcttttcttt 720
tctcactttt ctcaatataa aaaaaacaat caaacccgcg cgaaacgatt ataaaaaact 780
ctactaaaat ttaacaacgc gaaaacttaa aaaaaaaccc catactaact cccattcaac 840
cgacccgttt tcctcgaact ttaaaaattt cactcaaccg tacactcaat aacttcacaa 900
aactaattac aaacttcaac gcattcctaa aaaaaccaaa aacgacgcaa atacaaacga 960
accgaaaaaa ccccttatcc cgataacaaa ataaaacaaa ctaaaaaaaa cttaaaccac 1020
acaaatccaa aactcaccaa accgcaaaaa acctacctta aaaaccgaaa atcattatcc 1080
gccctattca acgaaacccg aaaaccctaa aaaccgaacg aaaccaaccc gaacgaaaac 1140
accgccgcca acgcgcgccg acgacaaaaa aaaaccccgc taaacgctac gaccaaaccg 1200
aaactcaaaa cgctaaacta tacgtttaca caaatctata ttccgacgaa ccgatatcaa 1260
ccctaataaa aacacgaaaa aaaaaacacg ccaataaacc acgcgacgcg taaacaatac 1320
gcaacttcta tcgacgtcca aactatacga ccacgtttca accgataccc ccaaaccata 1380
aacacccaac tccaaaatcg ctctacgccc tttctcccca acccaccttt cccattaatc 1440
ccctctccta tccgaataac aacgcgaccc cgcaaaaaac gaccccgaaa aaaacaataa 1500
ccgcacgcgt aaaataaaaa cgacgaaaca caaaacgata atctaaaaat attcgcataa 1560
ccgaaaacgc tttcgctacg aatttaaaat cgaaaaacaa ttccctcccg aaatcattaa 1620
cttcgtctcc tcgtactcaa aaaccaacaa cttaatacta cgaacgccaa aaaaaaaaaa 1680
ataacgcctc gcgaaacgcg cgaaaaaaaa aaaactacga caacgaaacg cgaaaacgaa 1740
aaaaacgcaa caacgaaaaa ccgaaacgca acgaaaaaaa acgctaaaaa acgaaaaacg 1800
ctcgaacaac caccctatcc ccgtctaaaa ccccgcgcta cgtctaaaaa aacgcaacac 1860
gcaatccccg cgaaaaccaa aactcgaaac cccctaatac ataccccctc tcctcgcgcc 1920
ctaccgaaac ctcgacccta cctaccgtac cctaaaccta attatacccg aaaatccccg 1980
cgaacaaaac gcgaaacaaa caaaacgcgc gcgccgacgc tcttttatct aataactaat 2040
ttaaattaat acgatcttta tataaaacta acaacgaata attatctatt ttctcgccaa 2100
caatctccat cacaatcact tatctaaaaa cctacgatta aattaatcgt tatattcccg 2160
aaataaacgt cgctacaatc cgcaacgaac gcgaataaaa acctaaaaac gcctcccgaa 2220
cgctaacgaa accgatataa accaactccg ctaccgccta aaacgcgata tacccaaata 2280
ttaatacccg cgaaaaaaaa ctataaaacg ccttccccaa aatttactta acttactttt 2340
cgctcgaata aataatacgc gaatacgaaa aacgaaaaaa aaaaaaaaaa taaaaaaaaa 2400
aaaacctata aaactacgaa cccgaaacaa cctaaataaa acgcgacctc gaaaaaccct 2460
aaatacatcg cgacgaaacc taaaaaaacc caaacgccga aaaaaccgtc gataccgaaa 2520
tacaacgtat ttcacttaaa aaaaacgtta ccctcgatcc cttacctccc tcctattatc 2580
tcgatttttc taacttcgtc cttcgtccca cccacccgtt cccacctcaa atccctcccc 2640
caaaatcccc tccttaaaaa tccaaatctc taaaaattat taacaacaat tacacgcccc 2700
acgattaaaa tccacaaaaa aaaaatccca attctacaaa ccgctccaaa actaaaaata 2760
aaaataataa caaataatac gtcaactctc taaaaaaaaa aaacttacat tacaaaaact 2820
tatctttcta aactaaaatc aaaacgaaaa cgtcaaacgc gctccgttta acgacgataa 2880
aaaaaccgcg cgcccgcgct atcccaaccg aaactaccct aactaataat taaaaattta 2940
acgtccgaaa ttcaaacgct tctacaactc aaatttaccg accaaaaaac ctcaattaca 3000
acttttcaaa ataatatttc taaaaaataa caaattcaaa ctcaactaat aacaactttt 3060
aactataaaa aataaaacta cttcccttta acgataaaac tcttaaactt cgaaaaataa 3120
aaaaatacaa taaaataaaa taccataaaa tcactaaatt tttcaaaaaa aaaaaaaccc 3180
caaattactc ccaaaataaa actttataaa ttcttattaa aaatctttaa atctcgaatt 3240
tccccctaca acatctaata aatactttaa aaacaaacga acaaatccca cctcgaaaat 3300
caacaaaccc aaactctaac caaaactctc cccgcgtttt cttctcgtaa cctaaaaaat 3360
atcccgcccc atcgctcacc taactcttat catctcgctc atcttaaaat aacccgtaaa 3420
caatactact ccctaccgca actccgccga tcactcaaac aaaacgaaat atacaaataa 3480
cctaaaaaaa ccgaaaccga acactacgcc cattatcccg aacgctcaaa acgccgaaca 3540
actacgcaaa ctttctaaac tcgaaccctc gaccgccacg ctaatatcat cattacaaaa 3600
catcaaattt taaaaactat acaatctaaa ttcattaaca accttctcga cgaaaattct 3660
tttccccgta acaaatttca aaatccaaac cccctccaac gttaataaaa ataaaaaaaa 3720
aaaaaaaaac ccaaaaaaaa aaatctttcg caaataaaac ctcgaaaaat ccctactctc 3780
cttctaatac attccgcaac tttaaaaacc ttccttaaaa ttctaaacgc gaatatctaa 3840
cttaaataac ctaaaattta aacatattcc cgttttctcc caaaaattac tttaatatta 3900
cgaatttaaa ttcactaaaa aaaacccaaa taccaaatcg aataaatttc ataaacatca 3960
tcttctattt taataatcgc gacaataatc gtttctaaaa tcataccctt taaaataaac 4020
tcacaacaat acatatcaaa aaaactacgc gccctaaaac aaaacaatta aaacatcaaa 4080
ccacgctcct caaactacaa aattacaaac aactcacaaa cttccaatcc ccaccccaaa 4140
ataaaaaaaa tctcaataac ttaaaaacct acttacactc ccgctttcca cgcccgatcc 4200
cctacccgca cctacccaaa taatctcgtt cctctaaaat ctaaataata aaaaaaaata 4260
ctcctaatac cccgaataca aaacgaacac caacgaacga aacccaaaaa cgctaaaacc 4320
caaaaacgca aaccaccgtt aaaacctaaa aaacgcaaaa acgaataaaa taatatttct 4380
caaattcgta aaaaaccgca aacgccaaca aaaacaattt tcctccccta aacaatacta 4440
attctcctca aacccaaaat ctccactaac gtatccttcc acctcctcac aaaactccaa 4500
actactatcc cctctctacc gcatctaaaa ctaaaaaaac ttcctaaaaa aaaacaaaaa 4560
aaaaccacca aaccaaaacc gaaaactaaa ctttaaaatc gaaaacgaca aaaaaacaaa 4620
ttctccccta cacaccccaa aacctctcct acacccgcga aaccttcctt aaacgcccaa 4680
acccccgaaa tacctaccct ccttctaaca aaaaaaaaaa ataaaatata aaaaaataat 4740
acaaccaaca atatttttat aaacacaaca acaaaaaaat acataaaaaa aatctattta 4800
ttaaatatat catttttaat aaaaaacgaa attaaaaata acgccatcta aacccaaaaa 4860
aaaactacga aataaacgaa ataaacgaaa aactcttaa 4899
<210> 21
<211> 1206
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
aaaaacaaca ctcatttctt cttatcattt ctaaactacg aaacaaaaaa ctttaatttt 60
aaaactaaaa tttaatttat ttttaaaaat accgaatatt accaaacaac gccaacacga 120
atataataat aatataaaat ttacacacac gcaactaaaa taataaattt aaaataaaaa 180
acactatata cacgtataat atatacatac aatatcaaaa cattctttac tcctaaaatt 240
ttctctactt taccaaactt cacgcccctt ttaaaaaaaa aaaacgaatt ttccaaatta 300
taaaaatact tttcctccat ccaaccacac cctcttccga accaatcttt aataaaacct 360
aaacgatata aaatcactaa aaaatataaa taaaaacgtt tttactcatc ttaacccaaa 420
tctctaaaaa aacctttaaa atcgctctaa aacttaaaaa aaattccgtc ctaaaccgaa 480
aactaaaact ctccgaacaa acgctaaaca actctcactt atcgatatcc aataaacctt 540
atataaaata ccaaaatacc ccaacaaaac tttaccaaca cctaaaccgt aattatctcc 600
taactcctaa aatccgcgaa actctaaata tacctacaac tcctcccgaa tcctacaaac 660
cacccttatc cctcttctcc cgctcacccc ccgacccccc catctctttt actattccga 720
aaaaaaccac gcaaaataca acccgaacgc gcccccgaaa aaaacccgcg acgcaacaac 780
cacaccccca acctacacta acgcccaccc cataacttcg ccttcgcgat cgcgaacaaa 840
aaacgcgcgt ttccatcgat taattaaaaa cgaaaatcga aaaaaccccc gcccgccgac 900
gaccaacgca caacccgacc aaaaacgccc tccctaccgc cgccgaccct ttaatcgccc 960
gcgacccgcg acccgcaaac cacaaccaac gctatactaa acaaataacg acaacgaaac 1020
gcgacgcgct caaacgcacg aatccccgaa ccgcgacgcg ctccccgcca cgccgcacat 1080
caaaacccga ccgaccgacg aacgccttca ttaacaacct aaaattataa tattatatta 1140
aaaaacaaaa ctactccccg aaaaaatata tactacatat ctaacaaaaa taaattaaat 1200
tattca 1206
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gtagttggat gggattattt 20
<210> 23
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
cacccgcaaa atcctct 17
<210> 24
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
tacgtggcgg gttgg 15
<210> 25
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
aaaaaaacaa ccttaatatc ttc 23
<210> 26
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
gtttttttgg ttcggagttg 20
<210> 27
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
caaaacgaaa cacgaaaaaa ata 23
<210> 28
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gttttaggag ttatttgggt ttgc 24
<210> 29
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
actataacac ctcgctacta acgct 25
<210> 30
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
ggggcgcggt tttttta 17
<210> 31
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
ctaaactacg ctaaattcct 20
<210> 32
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
atacgggaga aagagtacgt ta 22
<210> 33
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
aacgtaaccg tacaacctaa acg 23
<210> 34
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
ttatttcggg gaaggttacg 20
<210> 35
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
gcgaaaacga aatcataaaa taaac 25
<210> 36
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ttgttgcggt cgcggacg 18
<210> 37
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
tcggtttttt cgcggcg 17
<210> 38
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
cgccccgtcg ccgaat 16
<210> 39
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
cggtggttcg taggggtcgc g 21
<210> 40
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
cgtagcgcgg cgggg 15
<210> 41
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
cgcgttcggg gcgt 14
<210> 42
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
ggttacgcgg cgcgtgg 17
<210> 43
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
tcggacgcgt tttcggg 17
<210> 44
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
gtgatggagg aggtttagta agtt 24
<210> 45
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
ccaataaaac ctactcctcc cttaa 25
<210> 46
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
accaccaccc aacacacaat aacaaacaca 30

Claims (44)

1.一种用于诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的试剂盒,其包含:
(a)处理DNA的第一试剂,其中所述第一试剂能够区分DNA中的甲基化和未甲基化的CpG位点;
(b)第一引物池,所述第一引物池包含用于预扩增以下两组目标标记物中每一组目标标记物中的至少一种目标标记物的引物对:(I)Septin9、BCAT1和IKZF1,和(II)PKNOX2、CRHBP、SOX1和基因间隔区A,其中所述引物对可与被所述第一试剂处理后的所述目标标记物的目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交,其中所述目标序列包含至少一个CpG位点;
(c)第二试剂,所述第二试剂用于定量分析被所述第一引物池预扩增的所述目标标记物中每个目标标记物的甲基化水平。
2.如权利要求1所述的试剂盒,其特征在于,所述目标标记物包含或是:
a)如下所示的通过Hg19坐标定义的各个区域:Septin9,chr17:75276651-75496678;BCAT1,chr12:24964295-25102393;IKZF1,chr7:50343720-50472799;PKNOX2,chr11:125034583-125303285;CRHBP,chr5:76248538-76276983;SOX1,chr13:112721913-112726020;基因间隔区A,chr10:130082033-130087148;以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb;或
b)亚硫酸氢盐转化后的a)的对应区域;或
c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。
3.如权利要求1或2所述的试剂盒,其特征在于,所述第一引物池中包括用于扩增所述组(I)中的至少2个或全部3个目标标记物的引物对;和/或所述第一引物池中包括用于扩增所述组(II)中的至少2个、至少3个或全部4个目标标记物的引物对。
4.如权利要求3所述的试剂盒,其特征在于,
所述第一引物池中包括用于扩增所述组(I)中的Septin9与BCAT1,BCAT1与IKZF1,或Septin9与IKZF1引物对;或所述第一引物池中包括用于扩增所述组(I)中的Septin9、BCAT1与IKZF1的引物对;和/或
所述第一引物池中包括用于扩增组(II)中的PKNOX2与CRHBP,PKNOX2与SOX1,PKNOX2与基因间隔区A,CRHBP与基因间隔区A,或SOX1与基因间隔区A的引物对;或所述第一引物池中包括用于扩增组(II)中的PKNOX2、CRHBP和SOX1,PKNOX2、CRHBP和基因间隔区A,PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A的引物对。
5.如权利要求3所述的试剂盒,其特征在于,所述第一引物池中包括用于扩增Septin9、BCAT1和IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A的引物对。
6.如权利要求1所述的试剂盒,其特征在于,用于扩增Septin9的引物对为SEQ ID NO:22/23;用于扩增BCAT1的引物对为SEQ ID NO:24/25;用于扩增IKZF1的引物对为SEQ IDNO:26/27;用于扩增PKNOX2的引物对为SEQ ID NO:28/29;用于扩增CRHBP的引物对为SEQID NO:30/31;用于扩增SOX1的引物对为SEQ ID NO:32/33;用于扩增基因间隔区A的引物对为SEQ ID NO:34/35。
7.如权利要求1所述的试剂盒,其特征在于,所述第一引物池包含以下引物对,或由以下引物对组成:SEQ ID NO:22/23、24/25、26/27、28/29、30/31、32/33和34/35。
8.如权利要求1所述的试剂盒,其特征在于,所述第二试剂包含第二引物池,所述第二引物池包含多个定量引物对,所述定量引物对被设计为用于扩增被所述第一引物池预扩增的所述目标序列内的至少一部分,能够与被所述第一引物池预扩增的所述目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。
9.如权利要求8所述的试剂盒,其特征在于,所述第二引物池中的定量引物对和所述第一引物池中的引物对相同。
10.如权利要求8或9所述的试剂盒,其特征在于,所述第一引物池和所述第二引物池被包装在单一容器内或被包装在独立容器内。
11.如权利要求1所述的试剂盒,其特征在于,所述试剂盒进一步包含一个或多个封闭寡核苷酸。
12.如权利要求1所述的试剂盒,其特征在于,所述试剂盒进一步包含检测试剂。
13.如权利要求12所述的试剂盒,其特征在于,所述检测试剂选自下组:荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。
14.如权利要求13所述的试剂盒,其特征在于,所述探针至少包括选自下组的一条或多条核苷酸序列:SEQ ID NO:36-43。
15.如权利要求14所述的试剂盒,其特征在于,所述探针包括SEQ ID NO:36-38中所示的至少一条、至少两条或全部三条核苷酸序列,和SEQ ID NO:39或40以及41-43中所示的至少一条、至少两条或至少三条核苷酸序列。
16.如权利要求15所述的试剂盒,其特征在于,所述探针包括:SEQ ID NO:36-38和41-43所示的核苷酸序列,以及SEQ ID NO:39和/或40所示的核苷酸序列。
17.如权利要求13所述的试剂盒,其特征在于,所述荧光探针的5’端标记有荧光染料,3’端标记有猝灭剂;优选地,所述荧光染料选自FAM、HEX/VIC、TAMRA、Texas Red或Cy5,所述淬灭剂选自BHQ1、BHQ2、BHQ3、DABCYL、TAMRA或lowa Black Dark Quenchers。
18.如权利要求1所述的试剂盒,其特征在于,所述试剂盒进一步包含DNA聚合酶和/或一个适合存放从所述个体中获取的所述生物样品的容器。
19.如权利要求1所述的试剂盒,其特征在于,所述第一试剂包括亚硫酸氢盐试剂或甲基化敏感限制酶。
20.如权利要求19所述的试剂盒,其特征在于,
所述亚硫酸氢盐试剂选自下组:亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子,及其任意组合;
所述MSRE选自下组:HpaII酶、SalI酶、
Figure FDA0002940865450000031
酶、ScrFI酶、BbeI酶、NotI酶、SmaI酶、XmaI酶、MboI酶、BstBI酶、ClaI酶、MluI酶、NaeI酶、NarI酶、PvuI酶、SacII酶、HhaI酶及其任意组合。
21.如权利要求1所述的试剂盒,其特征在于,所述第一引物池和所述第二试剂包含的第二引物池进一步包含用于扩增对照标记物的引物对。
22.如权利要求21所述的试剂盒,其特征在于,所述对照标记物选自下组:ACTB、GAPDH、微管蛋白、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。
23.用于定量分析目标标记物的甲基化水平的试剂在制造试剂盒中的用途,所述试剂盒用于在个体中诊断结直肠进展期腺瘤、筛查结直肠进展期腺瘤形成或形成的风险或评估结直肠进展期腺瘤的进展或预后的方法中;其中,所述目标标记物包括下组(I)中的至少一种目标标记物和下组(II)中的至少一种目标标记物:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A。
24.如权利要求23所述的用途,其特征在于,所述目标标记物包括:所述组(I)中的至少2个或全部3个目标标记物,和所述组(II)中的至少2个、至少3个或全部4个目标标记物。
25.如权利要求23所述的用途,其特征在于,所述目标标记物为Septin9、BCAT1、IKZF1、PKNOX2、CRHBP、SOX1和基因间隔区A。
26.如权利要求23-25中任一项所述的用途,其特征在于,所述试剂包括扩增引物对,用于扩增所述目标标记物的引物对。
27.如权利要求27所述的用途,其特征在于,所述扩增引物对包括用于扩增:
所述组(I)中的Septin9与BCAT1,BCAT1与IKZF1,或Septin9与IKZF1引物对;或
所述组(I)的Septin9、BCAT1和IKZF1的引物对。
28.如权利要求23所述的用途,其特征在于,所述扩增引物对包括用于扩增:
所述组(II)中的PKNOX2与CRHBP,PKNOX2与SOX1,PKNOX2与基因间隔区A,CRHBP与基因间隔区A,或SOX1与基因间隔区A的引物对;
所述组(II)中的PKNOX2、CRHBP和SOX1,PKNOX2、CRHBP和基因间隔区A,PKNOX2、SOX1和基因间隔区A或CRHBP、SOX1和基因间隔区A的引物对;或
所述组(II)中的PKNOX2、CRHBP、SOX1和基因间隔区A的引物对。
29.如权利要求26-28中任一项所述的用途,其特征在于,用于扩增Septin9的引物对为SEQ ID NO:22/23;用于扩增BCAT1的引物对为SEQ ID NO:24/25;用于扩增IKZF1的引物对为SEQ ID NO:26/27;用于扩增PKNOX2的引物对为SEQ ID NO:28/29;用于扩增CRHBP的引物对为SEQ ID NO:30/31;用于扩增SOX1的引物对为SEQ ID NO:32/33;用于扩增基因间隔区A的引物对为SEQ ID NO:34/35。
30.如权利要求23所述的用途,其特征在于,所述试剂还包括定量引物对,所述定量引物对被设计为用于扩增已被预扩增的所述目标序列内的至少一部分,能够与被所述第一引物池预扩增的所述目标序列的至少9个连续核苷酸在严紧条件下、中等严紧条件下或高度严紧条件下杂交。
31.如权利要求30所述的用途,其特征在于,所述定量引物对与权利要求28或29所述的引物对相同。
32.如权利要求23所述的用途,其特征在于,所述试剂进一步包含一个或多个封闭寡核苷酸。
33.如权利要求23所述的用途,其特征在于,所述试剂进一步包含检测试剂。
34.如权利要求33所述的用途,其特征在于,所述检测试剂选自下组:荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。
35.如权利要求34所述的用途,其特征在于,所述探针至少包括选自下组的一条或多条核苷酸序列:SEQ ID NO:36-43。
36.如权利要求35所述的用途,其特征在于,所述探针包括SEQ ID NO:36-38中所示的至少一条、至少两条或全部三条核苷酸序列,和SEQ ID NO:39或40以及41-43中所示的至少一条、至少两条或至少三条核苷酸序列。
37.如权利要求35所述的用途,其特征在于,所述探针包括:SEQ ID NO:36-38和41-43所示的核苷酸序列,以及SEQ ID NO:39和/或40所示的核苷酸序列。
38.如权利要求34所述的用途,其特征在于,所述荧光探针的5’端标记有荧光染料,3’端标记有猝灭剂;优选地,所述荧光染料选自FAM、HEX/VIC、TAMRA、Texas Red或Cy5,所述淬灭剂选自BHQ1、BHQ2、BHQ3、DABCYL、TAMRA或lowa Black Dark Quenchers。
39.如权利要求23所述的用途,其特征在于,所述试剂还包括亚硫酸氢盐试剂或甲基化敏感限制酶。
40.如权利要求39所述的用途,其特征在于,
所述亚硫酸氢盐试剂选自下组:亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子,及其任意组合;
所述MSRE选自下组:HpaII酶、SalI酶、
Figure FDA0002940865450000051
酶、ScrFI酶、BbeI酶、NotI酶、SmaI酶、XmaI酶、MboI酶、BstBI酶、ClaI酶、MluI酶、NaeI酶、NarI酶、PvuI酶、SacII酶、HhaI酶及其任意组合。
41.如权利要求23所述的用途,其特征在于,所述试剂包含用于扩增对照标记物的引物对。
42.如权利要求41所述的用途,其特征在于,所述对照标记物选自下组:ACTB、GAPDH、微管蛋白、ALDOA、PGK1、LDHA、RPS27A、RPL19、RPL11、ARHGDIA、RPL32、C1orf43、CHMP2A、EMC7、GPI、PSMB2、PSMB4、RAB7A、REEP5、SNRPD3、VCP和VPS29。
43.如权利要求23所述的用途,其特征在于,所述目标标记物包含或是:
a)如下所示的通过Hg19坐标定义的各个区域:Septin9,chr17:75276651-75496678;BCAT1,chr12:24964295-25102393;IKZF1,chr7:50343720-50472799;PKNOX2,chr11:125034583-125303285;CRHBP,chr5:76248538-76276983;SOX1,chr13:112721913-112726020;基因间隔区A,chr10:130082033-130087148;以及上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb;或
b)亚硫酸氢盐转化后的a)的对应区域;或
c)甲基化敏感限制酶(MSRE)处理后的a)的对应区域。
44.如权利要求23所述的用途,其特征在于,所述方法包括如下步骤:
(a)从所述个体获取含有DNA的生物样品;
(b)用试剂处理步骤(a)中获取的所述生物样品中的DNA,所述试剂能够区分所述DNA中的甲基化和未甲基化的CpG位点,从而获得经处理的DNA;
(c)用预扩增引物池预扩增从步骤(b)获取的所述经处理的DNA中的以下两组目标标记物(target marker)中每一组目标标记物中的至少一种目标标记物:(I)Septin9、BCAT1和IKZF1,(II)PKNOX2、CRHBP、SOX1和基因间隔区A;其中所述目标标记物的至少一部分被预扩增以获得预扩增产物;
(d)基于步骤(c)获取的预扩增产物来分别定量分析所述被扩增的目标标记物的甲基化水平;
(e)分别比较步骤(d)中的所述被扩增的目标标记物的甲基化水平和相应的参考水平,其中:组(I)所述的目标标记物相对于其相应的参考水平具有更高的甲基化水平,且组(II)所述的目标标记物相对于其相应的参考水平具有较低的甲基化水平表明所述个体患有结直肠进展期腺瘤,或者所述个体有结直肠进展期腺瘤形成或形成的风险,或者所述个体有结直肠进展期腺瘤发展或发展的可能性增加,或者所述个体有结直肠进展期腺瘤预后不良或预后不良的风险。
CN202110178812.5A 2021-02-09 2021-02-09 结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒 Pending CN114908159A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110178812.5A CN114908159A (zh) 2021-02-09 2021-02-09 结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒
PCT/CN2022/074143 WO2022170984A1 (zh) 2021-02-09 2022-01-27 结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110178812.5A CN114908159A (zh) 2021-02-09 2021-02-09 结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒

Publications (1)

Publication Number Publication Date
CN114908159A true CN114908159A (zh) 2022-08-16

Family

ID=82761872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110178812.5A Pending CN114908159A (zh) 2021-02-09 2021-02-09 结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒

Country Status (2)

Country Link
CN (1) CN114908159A (zh)
WO (1) WO2022170984A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024056008A1 (zh) * 2022-09-16 2024-03-21 江苏鹍远生物科技股份有限公司 鉴别癌症的甲基化标志物及应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013022872A1 (en) * 2011-08-10 2013-02-14 Celgene Corporation Gene methylation biomarkers and methods of use thereof
US20140274767A1 (en) * 2013-01-23 2014-09-18 The Johns Hopkins University Dna methylation markers for metastatic prostate cancer
KR20200105661A (ko) * 2017-11-30 2020-09-08 메이오 파운데이션 포 메디칼 에쥬케이션 앤드 리써치 유방암 검출방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024056008A1 (zh) * 2022-09-16 2024-03-21 江苏鹍远生物科技股份有限公司 鉴别癌症的甲基化标志物及应用

Also Published As

Publication number Publication date
WO2022170984A1 (zh) 2022-08-18

Similar Documents

Publication Publication Date Title
KR101569498B1 (ko) 위용종 및 위암 특이적 메틸화 마커 유전자를 이용한 위용종 및 위암의 검출방법
KR101530498B1 (ko) 검사 마커로서 표적 유전자의 메틸화율을 검출하는 방법
CN101688239A (zh) 结肠癌的早期检测和预后
CN110438223B (zh) 检测Kras基因点突变的引物、探针及其试剂盒与检测方法
KR20150031231A (ko) 신장 세포암의 예후 예측방법
CN110129436A (zh) Dna甲基化的数字序列分析
CN110541033B (zh) Egfr基因突变检测用组合物及检测方法
KR101857227B1 (ko) 다중 증폭 이중 시그널 증폭에 의한 암 유전자 분석 방법 및 이를 위한 암 유전자 분석용 키트
CN101864480B (zh) 一种癌症筛检的方法
CN113186278B (zh) 甲状腺结节良恶性相关标志物及其应用
KR20220156899A (ko) 결장직장 신생물의 스크리닝을 위한 방법 및 키트
CN114908159A (zh) 结直肠进展期腺瘤的筛查、风险评估及预后方法和试剂盒
KR20100105770A (ko) 전립선암에서 gstp1 과메틸화의 검출
CN111197087B (zh) 甲状腺癌鉴别标志物
CN113493835A (zh) 通过检测bcan基因区域的甲基化状态筛查大肠瘤的方法和试剂盒
CN111100866B (zh) 鉴别甲状腺良恶性结节的基因片段及其应用
KR101990953B1 (ko) 암 유발 유전자 이상을 분석하는 방법
KR20230005927A (ko) 종양 검출 시약 및 키트
CN113166813A (zh) 子宫体癌的预后的判定方法
CN109136367B (zh) 提高braf基因v600e突变的诊断效率的方法
TW201038739A (en) Cancer screening method
WO2018211404A1 (en) Composite epigenetic biomarkers for accurate screening, diagnosis and prognosis of colorectal cancer
EP1892304B1 (en) Method and kit for detection of microsatellite instability-positive cell
KR100892587B1 (ko) 대장암 특이적 발현감소 유전자의 메틸화된 프로모터를함유하는 암 진단용 조성물 및 그 용도
WO2024056008A1 (zh) 鉴别癌症的甲基化标志物及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 200032 No. 136, Xuhui District Medical College, Shanghai

Applicant after: ZHONGSHAN HOSPITAL, FUDAN University

Applicant after: Jiangsu Huayuan Biotechnology Co.,Ltd.

Address before: 200032 No. 136, Xuhui District Medical College, Shanghai

Applicant before: ZHONGSHAN HOSPITAL, FUDAN University

Applicant before: Shanghai Fuyuan Biotechnology Co.,Ltd.