CN117004720A - 用于检测甲状腺癌的组合物及其用途 - Google Patents

用于检测甲状腺癌的组合物及其用途 Download PDF

Info

Publication number
CN117004720A
CN117004720A CN202310787062.0A CN202310787062A CN117004720A CN 117004720 A CN117004720 A CN 117004720A CN 202310787062 A CN202310787062 A CN 202310787062A CN 117004720 A CN117004720 A CN 117004720A
Authority
CN
China
Prior art keywords
seq
gene
sequence
target
methylation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310787062.0A
Other languages
English (en)
Inventor
陈树超
关晋霞
吴宁宁
杨亚东
郭媛媛
李永君
陈丽娟
王晶
王元昊
吴振
周光朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biochain Beijing Science and Technology Inc
Original Assignee
Biochain Beijing Science and Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biochain Beijing Science and Technology Inc filed Critical Biochain Beijing Science and Technology Inc
Priority to CN202310787062.0A priority Critical patent/CN117004720A/zh
Publication of CN117004720A publication Critical patent/CN117004720A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Toxicology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Oncology (AREA)

Abstract

本申请提供了一种用于检测甲状腺癌的组合物及其用途,所述组合物包括:用于检测目标基因甲基化状态的核酸,其中,所述目标基因为MIR578基因、SNHG15基因和IFFO1基因中的一种、两种或三种。本申请还提供了包括所述组合物的试剂盒,以及所述组合物在制备用于体外检测甲状腺癌的试剂盒中的用途。

Description

用于检测甲状腺癌的组合物及其用途
技术领域
本申请属于分子生物学领域,涉及基因检测,具体的是涉及一种用于检测甲状腺癌的组合物及其用途。
背景技术
基于国家癌症中心数据,2016年甲状腺癌(thyroid carcinoma)新发病例为20.3万,死亡病例为0.8万。甲状腺癌预后较好,死亡率较低,但发病速度持续增长。
甲状腺癌包括乳头状癌、滤泡状癌、未分化癌和髓样癌四种病理类型。以恶性度较低、预后较好的乳头状癌最常见,除髓样癌外,绝大部分甲状腺癌起源于滤泡上皮细胞。发病率与地区、种族、性别有一定关系。女性发病较多,男女发病比例为1:(2~4)。任何年龄均可发病,但以青壮年多见。绝大多数甲状腺癌发生于一侧甲状腺腺叶,常为单个肿瘤。
目前甲状腺癌的早期诊断主要还是依赖于影像学手段发现结节,结节的进一步穿刺检查等传统方式,检查效率低且检出灵敏度不高。比如颈部超声检查虽然灵敏性较好,但对甲状腺结节的鉴别能力与超声医师的临床经验相关。CT对最大直径≤5mm结节及弥漫性病变合并结节的患者观察欠佳。MRI对钙化不敏感,检查时间长,易受呼吸和吞咽动作影响。因此,早期甲状腺癌尺寸小,传统方法不易发现,且目前的检查效率低下,不适用大规模普及筛查。
近年的研究显示表观遗传学在癌症的发生、发展中起着重要作用。作为表观遗传学的一种重要机制,多种癌症的DNA甲基化调控得到了深入研究。研究数据显示:基因甲基化的调控与染色质结构和基因表达调控等生物学机制相关;细胞基因甲基化的变化发生在肿瘤形成的早期,并贯穿癌症的发生和发展过程;抑癌基因的甲基化是癌前病变组织转化为恶性肿瘤细胞的重要分子机制。但是目前缺乏针对甲状腺癌甲基化基因检测的检测技术、方法和产品。因此,当前对用于甲状腺癌检测的敏感性高和特异性高的甲基化基因标记物存在需求。
发明内容
基于现有甲状腺癌检测中存在的问题,本申请的目的在于提供一种用于检测甲状腺癌的组合物及其用途。
本申请具体技术方案如下:
1.一种用于体外检测甲状腺癌的组合物,所述组合物包括:
用于检测目标基因甲基化状态的核酸,
其中,所述目标基因甲基化状态由所述目标基因的靶序列的甲基化来表征,
其中,所述目标基因为MIR578基因、SNHG15基因和IFFO1基因中的一种、两种或三种。
2.根据项1所述的组合物,其中,所述MIR578基因的靶序列如SEQ ID NO:1-4中任一个所示,或包括SEQ ID NO:1-4中任一个所示的序列。
3.根据项1所述的组合物,其中,所述SNHG15基因的靶序列如SEQ ID NO:5-8中任一个所示,或包括SEQ ID NO:5-8中任一个所示的序列。
4.根据项1所述的组合物,其中,所述IFFO1基因的靶序列如SEQ ID NO:9-12中任一个所示,或包括SEQ ID NO:9-12中任一个所示的序列。
5.根据项1~4中任一项所述的组合物,其中,所述用于检测目标基因甲基化状态的核酸包括:
引物,所述引物为所述目标基因的靶序列中的至少9个核苷酸的片段,所述片段包含至少一个CpG二核苷酸序列。
6.根据项1~5中任一项所述的组合物,其中,所述用于检测目标基因甲基化状态的核酸包括:
探针,所述探针为在中等严紧或严紧条件下杂交于所述目标基因的靶序列中的至少15个核苷酸的片段,
所述片段包含至少一个CpG二核苷酸序列。
7.根据项1~6中任一项所述的组合物,其还包括:
将目标基因的靶序列的5位未甲基化胞嘧啶碱基转化为尿嘧啶的试剂。
8.根据项1~7中任一项所述的组合物,其中所述用于检测目标基因甲基化状态的核酸还包括:
优先与处于非甲基化状态的靶序列结合的阻断剂。
9.根据项8所述的组合物,其中,
所述至少9个核苷酸的片段,其为SEQ ID NO:13和SEQ ID NO:14的序列,或者其为SEQ ID NO:16和SEQ ID NO:17的序列,或者其为SEQ ID NO:19和SEQ ID NO:20的序列;
所述至少15个核苷酸的片段,其为SEQ ID NO:15的序列,或SEQ ID NO:18的序列,或SEQ ID NO:21的序列。
10.一种用于体外检测甲状腺癌的寡核苷酸,其包括:
所述SEQ ID NO:1或SEQ ID NO:2或SEQ ID NO:3或SEQ ID NO:4或其互补序列中的至少9个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或
所述SEQ ID NO:5或SEQ ID NO:6或SEQ ID NO:7或SEQ ID NO:8或其互补序列中的至少9个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或
所述SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或其互补序列中的至少9个核苷酸且包含至少一个CpG二核苷酸序列的片段。
11.根据项10所述的寡核苷酸,其还包括:
在中等严紧或严紧条件下杂交于所述SEQ ID NO:1或SEQ ID NO:2或SEQ ID NO:3或SEQ ID NO:4或其互补序列中的至少15个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或
在中等严紧或严紧条件下杂交于所述SEQ ID NO:5或SEQ ID NO:6或SEQ ID NO:7或SEQ ID NO:8或其互补序列中的至少15个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或
在中等严紧或严紧条件下杂交于所述SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或其互补序列中的至少15个核苷酸且包含至少一个CpG二核苷酸序列的片段。
12.根据项11所述的寡核苷酸,其还包括:
优先与处于非甲基化状态的靶序列结合的阻断剂。
13.一种用于体外检测甲状腺癌的寡核苷酸,其包括:
SEQ ID NO:13和SEQ ID NO:14的序列。
14.根据项13所述的寡核苷酸,其还包括:
SEQ ID NO:15的序列。
15.一种用于体外检测甲状腺癌的寡核苷酸,其包括:
SEQ ID NO:16和SEQ ID NO:17的序列。
16.根据项15所述的寡核苷酸,其还包括:
SEQ ID NO:18的序列。
17.一种用于体外检测甲状腺癌的寡核苷酸,其包括:
SEQ ID NO:19和SEQ ID NO:20的序列。
18.根据项17所述的寡核苷酸,其还包括:
SEQ ID NO:21的序列。
19.一种试剂盒,其包括项1~9中任一项所述的组合物或包括项10~18中任一项所述的寡核苷酸。
20.根据项19所述的试剂盒,其还包含选自下述的至少一种其它组分:
三磷酸核苷、DNA聚合酶和所述DNA聚合酶功能所需的缓冲液。
21.根据项19或20所述的试剂盒,其中,所述试剂盒用于检测的样本包括:细胞系、组织学切片、组织活检/石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,或其组合。
22.根据项19~21中任一项所述的试剂盒,其还包含:说明书。
23.根据项1~9中任一项所述的组合物或项10~18中任一项所述的寡核苷酸在制备用于体外检测甲状腺癌的试剂盒中的用途。
本申请具有以下有益效果:
通过检测MIR578基因、SNHG15基因和/或IFFO1基因这三个甲状腺癌甲基化基因的靶序列,能够灵敏和特异地检测这3个基因的甲基化状态,从而可以用于对外周血游离DNA的检测。通过对甲状腺癌患者和正常对照个体的外周血样本的检测显示:本申请的系统和方法能够灵敏和特异地检测甲状腺癌,从而保证了检测结果的正确性和可靠性。因此,本申请提供了一种检测甲状腺癌的系统和方法,具有重要的临床应用价值。
本申请的其他特点和优势将由下面的具体说明和权利要求书作详细的描述。
发明的效果
本申请利用表观基因组和生物信息学技术,通过分析甲状腺癌的基因组甲基化数据,寻找到了多个与甲状腺癌相关的甲基化基因,并确定了甲状腺癌甲基化基因发生甲基化异常的靶序列,并且通过这个甲基化基因的靶序列,能够灵敏和特异地检测该基因的甲基化的状态,从而可以用于对外周血游离DNA的检测。
本申请所述的组合物以非侵入性的方式用于无症状人群的筛查,降低了侵入性检测造成的危害,所述的组合物具有更高的灵敏度和准确度,能够实现实时监测。
具体实施方式
下面对本申请做以详细说明。虽然显示了本申请的具体实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
除非另有说明,本申请的实施将采用常规的分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和基因学技术,其均在本领域常规技术手段的范围内。在文献中对此类技术进行了详细说明如Molecular Cloning:ALaboratory Manual,第二版(Sambrook等,1989);Oligonucleotide Synthesis(M.J.Gait,1984版);Animal CellCulture(R.I.Freshney,1987版);Methods in Enzymology丛书(美国学术出版社有限公司);Current Protocols in Molecular Biology(F.M.Ausubel等,1987版,和定期更新);PCR:The Polymerase Chain Reaction(Mullis等,1994版)。本申请中使用的引物、探针、阻断剂和试剂盒可以采用本领域公知的标准技术制备。
除非另有定义,本申请所使用的技术和科学术语与本申请所属领域的普通技术人员的通常理解具有相同的含义。
定义
本申请的“癌症前期”表示处于转化为癌细胞的早期阶段或倾向于转化为癌细胞的细胞。这样的细胞可以表现出一种或多种具有癌细胞特征的表型性状。
本申请中的“严紧杂交条件”和“高度严紧”指的是探针与其靶子序列杂交的条件,典型的在核酸复杂的混合物中。严紧的条件是依赖于序列的,并且在不同的环境下是不同的。较长的序列在较高的温度中特异性的杂交。关于核酸杂交的详细的指导可以参考Tijssen,生物化学和分子生物学技术-核酸探针杂交,“杂交原理和核酸试验策略的回顾”。通常,严紧条件是在限定的离子强度pH下低于特定核酸的熔点(Tm)大约5-10℃。在Tm的温度(在所限定的离子强度,pH和核酸浓度)下,50%的和靶点互补的探针均衡地和靶点序列杂交。还可以通过增加去稳定剂来实现严紧条件。对于选择性或者特定的杂交,正信号为背景杂交的两倍,优选10倍。示例性的严紧杂交条件如下:在50%甲酰胺,5x SSC和1%的SDS的溶液中在42℃杂交,或者在5x SSC和1%的SDS的溶液中在65℃杂交,然后在0.2xSSC和0.1%SDS的溶液中在65℃洗涤。
并且,如果核酸所编码的多肽是实质性相似的话,即使不能在严紧条件下杂交的核酸仍然是实质性相似的。这种情况下,典型地,核酸在中等严紧杂交条件下进行杂交。作为示例的,“中等严紧杂交条件”包括在40%甲酰胺,1M的氯化钠和1%的SDS的溶液中在37℃杂交,并且在1xSSC的溶液中在45℃洗涤。本领域的普通技术人员可以很显然地在现有技术中获得对于取得获得相同的严紧度的条件的指导。对于PCR而言,36℃左右的温度典型地适用于低度严紧扩增,而基于引物的长度,退火温度的范围则在32℃至48℃之间。对于高度严紧的PCR扩增,一般是在62℃,而基于引物的长度和特异性,高度严紧杂交的退火温度的范围则在50℃至65℃之间。对于高度严紧和低度严紧扩增的循环条件,典型的,包括:在90-95℃下持续变性阶段30秒至2分钟,持续退火阶段30秒至2分钟,在约72℃下持续扩展阶段1至2分钟。关于低度和高度严紧扩增反应的工具和指导可以在现有技术中获得。
本申请中的“寡核苷酸”指由两个或者两个以上的核苷酸构成的分子,优选为由三个以上的核苷酸构成的分子,其精确大小可以依靠许多因素,这些因素反过来又是由寡核苷酸的最终功能和用途决定的。在某些具体实施方式中,寡核苷酸可以包括10个核苷酸至100个核苷酸的长度。在某些具体实施方式中,寡核苷酸可以包括10个核苷酸至30个核苷酸的长度,或者可以具有20和25个核苷酸的长度。在一些特定的具体实施方式中,短于这些长度的寡核苷酸也是合适的。
本申请的“引物”表示当置于能诱发与核酸链互补的引物延伸产物的合成的条件下,即在核苷酸和诸如DNA或RNA聚合酶的诱发剂的存在下并且在合适的温度和pH下,能够作为合成起始点的寡核苷酸,无论它是纯化的限制性消化物中天然存在的或合成产生的。引物可以是单链或双链的,并且必须足够长而使其在诱发剂的存在下能引发所需延伸产物的合成。引物的确切长度取决于多种因素,包括温度、引物来源和所用的方法。例如,为了诊断和预后应用,根据靶序列的复杂性,寡核苷酸引物通常含有至少或多于约9、10、或15、或20、或25或更多个核苷酸,但是其可以含有更少核苷酸或更多核苷酸。参与确定引物合适长度的因素是本领域技术人员熟知的。
本申请的“引物对”表示与靶DNA分子相反链杂交或与侧翼连接待扩增的核苷酸序列的靶DNA区域杂交的引物对。
本申请的“引物位点”表示引物杂交的靶DNA或其它核酸的区域。
本申请的“探针”,当涉及核酸序列时,以其通常含义使用,表示在规定条件下能与靶序列杂交并且可以用于检测该靶序列的存在的选择的核酸序列。本领域技术人员应当理解,在某些情况下,探针也可以用作引物,并且引物可以用作探针。
本申请的“DNA甲基化”是指甲基添加到胞嘧啶(C)的5位,这通常(但不必须)是在CpG(胞嘧啶之后为鸟嘌呤)二核苷酸的情况下。本文所用的“增加的甲基化程度”或“显著的甲基化程度”是指DNA序列中至少存在一个甲基化的胞嘧啶核苷酸,其中正常对照样品(例如从非癌细胞或组织样品提取的DNA样品或对DNA残基的甲基化进行处理的DNA样品)中对应的C是非甲基化的,在某些实施方案中,至少2、3、4、5、6、7、8、9、10或更多个C可以是甲基化的,其中对照DNA样品中的这些位置的C是非甲基化的。
在实施方案中,多种不同的方法可用于检测DNA甲基化改变。检测DNA甲基化的方法包括,例如,利用southern或聚合酶链反应(PCR)分析的甲基化敏感的限制性内切核酸酶(MSRE)测定、甲基化特异性或甲基化敏感的PCR(MS-PCR)、甲基化敏感的单核苷酸引物延伸(Ms-SnuPE)、高分辨率熔解(HRM)分析、重亚硫酸氢盐测序、焦磷酸测序、甲基化特异性单链构象分析(MS-SSCA)、组合重亚硫酸氢盐限制分析(COBRA)、甲基化特异性变性梯度凝胶电泳(MS-DGGE)、甲基化特异性熔解曲线分析(MS-MCA)、甲基化特异性变性高效液相色谱(MS-DHPLC)、甲基化特异性微阵列(MSO)。这些测定可以是PCR分析、利用荧光标记的定量分析或southern印记分析。
本申请的“甲基化测定”指确定DNA序列内一个或多个CpG二核苷酸序列的甲基化状态的任何测定。
本申请的“检测”表示观察样本中的标志物或标志物改变(例如标志物甲基化状态的改变或核酸或蛋白序列的表达水平)的任何过程,无论实际上是否检测到标志物或标志物改变。换言之,探测样品的标志物或标志物改变的行为是“检测”,即使标志物被测定为不存在或低于灵敏度水平。检测可以是定量、半定量或非定量观察,并且可以基于与一个或多个对照样品的比较。应当理解,检测本文公开的甲状腺癌包括检测癌症前期细胞,所述癌症前期细胞开始发展为甲状腺癌细胞或将要发展为甲状腺癌细胞,或具有增加的发展为甲状腺癌细胞的倾向。检测甲状腺癌还可以包括检测可能的死亡概率或疾病条件的可能的预后。
本申请的“同源性”、“同一性”和“相似性”表示2个核酸分子之间的序列相似性。可以比较每个序列中的位置来测定“同源性”、“同一性”或“相似性”,为了比较的目的可以将所述序列进行比对。当比较的序列中的等同位置被相同碱基占据时,所述分子在该位置是相同的;当等同位点被相同或相似氨基酸(例如,在空间性质或带电性质上相似)残基占据时,所述分子可以称为在该位置是同源的(相似的)。同源性/相似性或同一性百分比的表达是指比较的序列所共享的位置上相同或相似氨基酸的数量的函数。“无关的”或“非同源的”序列与本申请的序列共享小于40%同一性,优选小于25%同一性。在比较2个序列时,残基(氨基酸或核酸)的缺失或多余残基的存在也降低同一性和同源性/相似性。在具体实施方案中,对于两个或更多个序列或子序列,按照使用具有下文所述的默认参数的BLAST或BLAST 2.0序列比较算法进行测定或通过例如国家生物技术信息中心(National Centerfor Biotechnology Information(NCBI))在线提供的手动比对和肉眼检查进行测定,当在比较窗或指定区域上为最大对应性进行比较和比对时,如果它们的序列在规定的区域上同一性为约60%,或约65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高,可以认为是基本或显著同源的、相似的或同一的。该定义也涉及或可以用于测试序列的互补物。因此,在本文背景允许的程度下,例如,如果核苷酸序列可以被预测为天然存在于DNA双链体中,或可以以互补链中的一条或两条的形式天然存在,则与规定靶序列或其变体互补的核苷酸序列自身被视为与靶序列是“相似的”,并且当涉及“相似的”核酸序列时,包括单链序列、其互补序列、双链的链复合物、能够编码相同或相似多肽产物的序列、以及上述任意一项的任何容许的变体。相似性必须限制为单一核酸链序列的分析的情况可以包括例如细胞中特定RNA序列或编码序列的表达的检测和定量。该定义还包括具有缺失和/或添加的序列,以及具有取代的序列。在实施方案中,同一性或相似性可以是在长度为至少约9、10、11、12、13、14、15、16、17、18、19、10、21、22、23、24、25或更多核苷酸的区域上,或在长度为多于约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或多于约100个核苷酸的区域上。
本申请的“扩增”表示由核酸的一个具体基因座得到多个拷贝的过程,所述核酸例如基因组DNA或cDNA。可以使用多种已知手段中的任何一种实现扩增,所述手段包括但不限于聚合酶链反应(PCR)、基于转录的扩增和链置换扩增(SDA)。
本申请的“基于荧光的实时PCR”或“实时荧光定量PCR”表示这样的方法:在PCR反应体系中加入荧光基团,利用荧光信号积累实时监测整个PCR进程,最后通过标准曲线对未知模板进行定量分析的方法。在该PCR技术中,有一个很重要的概念,循环阈值,也称为Ct值。C代表Cycle,t代表threshold(阈值),Ct值的含义是:每个反应管内的荧光信号到达设定阈值时所经历的循环数。例如,荧光阈值(threshold)的设定方法如下:PCR反应的前15个循环的荧光信号作为荧光本底信号,荧光阈值的缺省(默认)设置是3-15个循环的荧光信号的标准偏差的10倍。
本申请的“实时PCR的cut off值”表示针对某一个生物标记物的判断样本阴阳性的一个临界Ct值。根据本申请的某些具体实时方式,“临界Ct值(Cut Off值)是根据一定数量的样本数据,基于统计学处理而得到的”,该临界Ct值可以根据所需要的灵敏度或特异性的要求不同而不同。
本申请的“灵敏度”表示从一定癌症样本中检测出癌症的比例,其计算公式为:灵敏度=(检测到的癌症/所有的癌症),而“特异性”表示一定正常人样本中检测出正常的比例,其计算公式为特异性=(检测到的阴性/总的阴性)。
本申请的“标记”或“可检测的部分”是可通过分光镜、光化学、生物化学、免疫化学、化学或其它物理手段检测的组分。例如,有用的标记包括32P、荧光染料、电子致密试剂、酶(例如,ELISA中常用的酶)、生物素、地高辛或半抗原和可以被制备为可检测的蛋白,例如,通过将放射性标记并入肽或用于检测与肽特异性反应的抗体。
可以使用多种不同方法检测核酸分子。核酸检测方法包括,例如,PCR和核酸杂交(例如,Southern印迹、Northern印迹或原位杂交)。具体而言,能够扩增靶核酸的寡核苷酸(例如,寡核苷酸引物)可以用于PCR反应。PCR方法通常包括以下步骤:获得样品、从所述样品分离核酸(例如,DNA、RNA或两者)和使所述核酸与一种或多种寡核苷酸引物接触,所述引物在能使模板核酸扩增发生的条件下特异性地与模板核酸杂交。在模板核酸的存在下,产生扩增产物。核酸扩增和扩增产物检测的条件是本领域技术人员已知的。已开发出多种对于基础PCR技术的改进,包括但不限于,锚定PCR、RACE PCR、RT-PCR和连接酶链式反应(LCR)。扩增反应中的引物对必须与模板核酸的相对链退火,并且应该彼此保持合适的距离,使得聚合酶能有效地跨过区域进行聚合并使得可以例如使用电泳来容易地检测扩增产物。例如,可以使用诸如OLIGO(Molecular Biology Insights Inc.,Cascade,Colo.)的计算机程序来设计寡核苷酸引物,以助于设计具有相似熔解温度的引物。通常,寡核苷酸引物长度为9-30或40或50个核苷酸(例如,长度为9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸),但是寡核苷酸引物可以更长或更短,只要使用合适的扩增条件。
通常使用可检测的标记实现扩增产物或杂交复合物的检测。术语“标记”,当涉及核酸时,意图包括通过将可检测的物质偶联(即,物理连接)至核酸的核酸直接标记,以及通过与直接标记了可检测的物质的另一试剂进行反应的核酸间接标记。可检测的物质包括各种酶、辅基、荧光材料、冷光材料、生物冷光材料和放射性材料。合适的酶的实例包括辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶;合适的辅基复合物的实例包括抗生物素蛋白链菌素/生物素和抗生物素蛋白/生物素;合适的荧光材料的实例包括伞形酮、荧光素、异硫氰酸荧光素、罗丹明、二氯代三嗪基胺荧光素、丹磺酰氯或藻红蛋白;冷光材料的实例包括鲁米诺;生物冷光材料的实例包括荧光素酶、虫荧光素和水母蛋白。间接标记的实例包括用生物素将核酸进行末端标记,使得可以用荧光标记的抗生物素蛋白链菌素检测该核酸。
一方面,本申请提供了一种用于体外检测甲状腺癌的组合物,所述组合物包括用于检测目标基因的靶序列内甲基化状态的核酸,其中,所述目标基因甲基化状态由所述目标基因的靶序列的甲基化来表征,其中,所述目标基因为MIR578基因、SNHG15基因和IFFO1基因中的一种、两种或三种。
本申请提供了一组在甲状腺癌中发出异常甲基化的目标基因的靶序列,包括MIR578基因、SNHG15基因和IFFO1的靶序列。其中,MIR578基因的靶序列如SEQ ID NO:1-4中任一个所示,或包括如SEQ ID NO:1-4中任一个所示的序列。SNHG15基因的靶序列如SEQ IDNO:5-8中任一个所示,或包括如SEQ ID NO:5-8中任一个所示的序列。IFFO1基因的靶序列如SEQ ID NO:9-12中任一个所示,或包括如SEQ ID NO:9-12中任一个所示的序列。
本领域技术人员也可以理解,所述MIR578基因、SNHG15基因和IFFO1的靶序列并不局限于上述列出的具体的序列。MIR578基因的靶序列应该涵盖与SEQ ID NO:1-4中任一个所示的序列相比,包含一个或两个或三个以上的核苷酸突变,但实质上仍然与其实质功能相同的序列,也包含与SEQ ID NO:1-4中任一个所示的序列相比,具有95%、96%、97%、98%或99%序列同一性的序列。SNHG15基因的靶序列应该涵盖与SEQ ID NO:5-8中任一个所示的序列相比,包含一个或两个或三个以上的核苷酸突变,但实质上仍然与其实质功能相同的序列,也包含与SEQ ID NO:5-8中任一个所示的序列相比,具有95%、96%、97%、98%或99%序列同一性的序列。IFFO1的靶序列应该涵盖与SEQ ID NO:9-12中任一个所示的序列相比,包含一个或两个或三个以上的核苷酸突变,但实质上仍然与其实质功能相同的序列,也包含与SEQ ID NO:9-12中任一个所示的序列相比,具有95%、96%、97%、98%或99%序列同一性的序列。
MIR578基因的靶序列(5’-3’)如下:
SEQ ID NO:1
MIR578基因的靶序列在亚硫酸氢盐处理后的序列(5’-3’)如下:
SEQ ID NO:2
MIR578基因的靶序列的互补序列(5’-3’)如下:
SEQ ID NO:3
MIR578基因的靶序列的互补序列在亚硫酸氢盐处理后的序列(5’-3’)如下:
SEQ ID NO:4
SNHG15基因的靶序列(5’-3’)如下:
SEQ ID NO:5
SNHG15基因的靶序列在亚硫酸氢盐处理后的序列(5’-3’)如下:
SEQ ID NO:6
SNHG15基因的靶序列的互补序列(5’-3’)如下:
SEQ ID NO:7
SNHG15基因的靶序列的互补序列在亚硫酸氢盐处理后的序列(5’-3’)如下:
SEQ ID NO:8
IFFO1基因的靶序列(5’-3’)如下:
SEQ ID NO:9
IFFO1基因的靶序列在亚硫酸氢盐处理后的序列(5’-3’)如下:
SEQ ID NO:10
IFFO1基因的靶序列的互补序列(5’-3’)如下:
SEQ ID NO:11
IFFO1基因的靶序列的互补序列在亚硫酸氢盐处理后的序列(5’-3’)如下:
SEQ ID NO:12
/>
MIR578基因、SNHG15基因和IFFO1基因的靶序列及相关序列如表1所示:
表1:MIR578基因、SNHG15基因和IFFO1基因的靶序列及相关序列
优选地,用于检测目标基因甲基化状态的核酸包括目标基因的靶序列中的至少9个核苷酸的片段,其中所述片段包含至少一个CpG二核苷酸序列。在某些优选实施方式中,如使用亚硫酸氢盐对待测样本DNA进行转化,用于检测目标基因甲基化状态的核酸包括目标基因的靶序列进行亚硫酸氢盐转化后的序列中的至少9个核苷酸的片段,优选至少10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个或更多个核苷酸的片段,其中所述核苷酸的片段包含至少一个CpG二核苷酸序列。
更优选地,用于检测目标基因甲基化状态的核酸包括在中等严紧或严紧条件下杂交于所述目标基因的靶序列中的至少15个核苷酸的片段,其中所述核苷酸的片段包含至少一个CpG二核苷酸序列。在某些优选实施方式中,如使用亚硫酸氢盐对待测样本DNA进行转化,用于检测目标基因甲基化状态的核酸包括在中等严紧或严紧条件下,杂交于目标基因的靶序列进行亚硫酸氢盐转化后序列中的至少15个核苷酸的片段,优选至少16个、17个、18个、19个、20个、21个、22个或更多个核苷酸的片段,其中所述核苷酸的片段包含至少一个CpG二核苷酸序列。
优选地,所述组合物还包括将目标基因的靶序列的5位未甲基化胞嘧啶碱基转化为尿嘧啶的试剂。更优选地,所述试剂为亚硫酸氢盐。
用于检测目标基因甲基化状态的核酸还可以包括优先与处于非甲基化状态的DNA结合的阻断剂。
优选地,所述组合物包括如表2中所示的引物、探针中的一种或多种:
表2本申请使用的引物和探针序列
/>
表2中的“F”表示正向引物;“R”表示反向引物;“P”表示探针。
优选地,本申请使用的探针序列的荧光标记方式如表3所示。
表3本申请使用的探针序列的一种荧光标记方式
序列编号 序列名称 5’标记 3’标记
SEQ ID NO:15 MIR578_1P FAM BHQ1
SEQ ID NO:18 SNHG15_1P Cy5 BHQ3
SEQ ID NO:21 IFFO1_1P VIC BHQ1
在某些实施方式中,所述组合物还包括将基因的5位未甲基化的胞嘧啶碱基转化为尿嘧啶的试剂。优选地,该试剂是亚硫酸氢盐。DNA的亚硫酸氢盐修饰为已知的用于评估CpG甲基化状态的工具。在真核细胞的DNA中,5-甲基胞嘧啶是最常见的共价碱基修饰。5-甲基胞嘧啶不能通过测序来鉴定,因为5-甲基胞嘧啶与胞嘧啶有相同的碱基配对行为。此外,在PCR扩增过程中,5-甲基胞嘧啶携带的表观遗传信息则完全丢失。最常用于分析DNA中5-甲基胞嘧啶存在的方法是基于亚硫酸氢盐与胞嘧啶的特异反应;在随后的碱性水解后,没有甲基化的胞嘧啶被转变为在配对行为上对应胸腺嘧啶的尿嘧啶;但在这些条件下5-甲基胞嘧啶保持不被修饰。由此原始的DNA以此方式被转变,使得原来在其杂交行为上不能与胞嘧啶区分开的5-甲基胞嘧啶现在可作为仅剩的胞嘧啶被常规的已知分子生物学技术检测到,例如通过扩增和杂交。所有这些技术都基于不同的碱基配对特性,现在可被充分利用了。因此,典型地,本申请提供了亚硫酸氢盐技术与一种或多种甲基化测定的联合使用,用于确定目标基因的靶序列内的CpG二核苷酸序列的甲基化状态。此外,本申请的方法适于分析异质的样本,例如血液或粪便中的低浓度肿瘤细胞。因此,当分析这种样品中CpG二核苷酸序列的甲基化状态时,本领域技术人员可以使用定量测定法来确定特定CpG二核苷酸序列的甲基化水平(例如百分比、份数、比率、比例或程度),而不是甲基化状态。相应地,术语甲基化状况或甲基化状态还应被认为是指反映CpG二核苷酸序列甲基化状态的值。
另一方面,本申请提供用于体外检测甲状腺癌的寡核苷酸,其包括:SEQ ID NO:1或SEQ ID NO:2或SEQ ID NO:3或SEQ ID NO:4或其互补序列中的至少9个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或SEQ ID NO:5或SEQ ID NO:6或SEQ ID NO:7或SEQID NO:8或其互补序列中的至少9个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或其互补序列中的至少9个核苷酸且包含至少一个CpG二核苷酸序列的片段。
优选地该用于体外检测甲状腺癌的寡核苷酸包括:对SEQ ID NO:1或SEQ ID NO:2或SEQ ID NO:3或SEQ ID NO:4或其互补序列进行亚硫酸氢盐转化后的序列中的至少9个核苷酸的片段;和/或对SEQ ID NO:5或SEQ ID NO:6或SEQ ID NO:7或SEQ ID NO:8或其互补序列进行亚硫酸氢盐转化后的序列中的至少9个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或对SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或其互补序列进行亚硫酸氢盐转化后的序列中的至少9个核苷酸且包含至少一个CpG二核苷酸序列的片段。
本申请的用于体外检测甲状腺癌的寡核苷酸,其还包括:在中等严紧或严紧条件下杂交于所述SEQ ID NO:1或SEQ ID NO:2或SEQ ID NO:3或SEQ ID NO:4或其互补序列中的至少15个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或在中等严紧或严紧条件下杂交于所述SEQ ID NO:5或SEQ ID NO:6或SEQ ID NO:7或SEQ ID NO:8或其互补序列中的至少15个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或在中等严紧或严紧条件下杂交于所述SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或其互补序列中的至少15个核苷酸且包含至少一个CpG二核苷酸序列的片段。
优选地该用于体外检测甲状腺癌的寡核苷酸包括:在中等严紧或严紧条件下杂交于对SEQ ID NO:1或SEQ ID NO:2或SEQ ID NO:3或SEQ ID NO:4或其互补序列进行亚硫酸氢盐转化后的序列中的至少15个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或在中等严紧或严紧条件下杂交于对SEQ ID NO:5或SEQ ID NO:6或SEQ ID NO:7或SEQ ID NO:8或其互补序列进行亚硫酸氢盐转化后的序列中的至少15个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或在中等严紧或严紧条件下杂交于对SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或其互补序列进行亚硫酸氢盐转化后的序列中的至少15个核苷酸且包含至少一个CpG二核苷酸序列的片段。
本申请的用于体外检测甲状腺癌的寡核苷酸,还可以包括:优先与处于非甲基化状态的DNA结合的阻断剂。
在一个具体的实施方式中,用于体外检测甲状腺癌的寡核苷酸,其包括:SEQ IDNO:13和SEQ ID NO:14的序列。其还包括:SEQ ID NO:15的序列。
在另一个具体的实施方式中,用于体外检测甲状腺癌的寡核苷酸,其包括:SEQ IDNO:16和SEQ ID NO:17的序列。其还包括:SEQ ID NO:18的序列。
在另一个具体的实施方式中,用于体外检测甲状腺癌的寡核苷酸,其包括:SEQ IDNO:19和SEQ ID NO:20的序列,其还包括:SEQ ID NO:21的序列。
另一方面,本申请提供了包括所述组合物的试剂盒。该试剂盒还包含选自下述的至少一种其它组分:三磷酸核苷、DNA聚合酶和所述DNA聚合酶功能所需的缓冲液。
典型地,所述试剂盒还包括用于容纳患者样本的容器。并且,所述试剂盒也包括使用和解释检测结果的说明。
本申请还涉及上述组合物和寡核苷酸在制备用于体外检测甲状腺癌的试剂盒中的用途。
再一方面,本申请提供了一种体外检测甲状腺癌的方法,所述方法包括以下步骤:
1)分离待测样本中的目标基因的靶序列或其片段;
2)确定所述目标基因的靶序列的甲基化状态;
3)通过所述目标基因的靶序列的甲基化状态的检测结果判断样本的状态,从而实现对甲状腺癌的体外检测。
根据某些优选实施方式,所述方法还包括以下步骤:
1)提取待测样本的基因组DNA;
2)使用试剂处理步骤1)得到的DNA样品,使5位未甲基化的胞嘧啶碱基转化为尿嘧啶或其它碱基,即目标基因的靶序列的5位未甲基化的胞嘧啶碱基转化为尿嘧啶或其它碱基,转化后的碱基在杂交性能方面不同于5位未甲基化的胞嘧啶碱基,并且是可检测的;
3)将经步骤2)处理过的DNA样品与DNA聚合酶和所述目标基因的靶序列的引物接触,使得所述经处理的目标基因的靶序列被扩增以产生扩增产物或不被扩增;所述经处理的目标基因的靶序列如果发生DNA聚合反应,会产生扩增产物;所述经处理的目标基因的靶序列如果不发生DNA聚合反应,则不被扩增;
4)用探针检测扩增产物;以及
5)基于所述扩增产物是否存在,确定所述目标基因的靶序列的至少一个CpG二核苷酸的甲基化状态。
优选地,典型的引物包括所述目标基因的靶序列的片段,所述目标基因的靶序列的片段包含分别等同于、互补于或在中等严紧或严紧条件下杂交于选自SEQ ID NO:1-4中任一个、SEQ ID NO:5-8中任一个和SEQ ID NO:9-12中任一个的至少9个核苷酸的片段。
优选地,典型的探针包括所述目标基因的靶序列的片段,所述目标基因的靶序列的片段包含分别等同于、互补于或在中等严紧或严紧条件下杂交于选自SEQ ID NO:1-4中任一个、SEQ ID NO:5-8中任一个和SEQ ID NO:9-12中任一个的至少15个核苷酸的片段。
优选地,所述引物、探针中的一种或多种如前述表2所示。
并且,所述接触或扩增包括使用至少一种如下的方法:使用耐热DNA聚合酶作为所述扩增酶、使用缺乏5’-3’外切酶活性的聚合酶、使用聚合酶链式反应(PCR)、产生带有可检测标记的扩增产物核酸分子。
优选地,用PCR方式来测定甲基化状态,诸如“基于荧光的实时PCR技术”、甲基化敏感的单核苷酸引物延伸反应(Ms-SNuPE)、甲基化特异性PCR(MSP)、和甲基化CpG岛扩增(MCA)等测定方法被用于测定目标基因的靶序列的至少一个CpG二核苷酸的甲基化状态。其中,“基于荧光的实时PCR”测定为高通量定量甲基化测定,其使用基于荧光的实时PCR(TaqMan)技术,在PCR步骤后不需要进一步的操作。简言之,“基于荧光的实时PCR”方法以基因组DNA的混合样品开始,该混合样品根据标准操作在亚硫酸氢钠反应中被转变为甲基化依赖的序列差异的混合池。随后在“偏移的(biased)”反应(采用重叠已知CpG二核苷酸的PCR引物)中进行基于荧光的PCR。可在扩增水平以及在荧光检测扩增水平上产生序列差别。“基于荧光的实时PCR”测定可以用作基因组DNA样品中甲基化状态的定量测试,其中序列区分发生在探针杂交水平上。在该定量方式中,在重叠特定的CpG二核苷酸的荧光探针存在下,PCR反应提供了甲基化特异的扩增。用于起始DNA量的无偏移对照由以下反应提供:其中引物和探针都不覆盖任何CpG二核苷酸。“基于荧光的实时PCR”方法可与任何适合的探针一起使用,如“TaqMan”、“Lightcycler”等。TaqMan探针为荧光报道物(RCHFRrter)和淬灭分子(Quencher)双标记的,并被设计为特异于相对高GC含量区,以至于其在PCR循环中以比正向或反向引物高约10℃的温度熔解。这使得TaqMan探针在PCR退火/延伸步骤中保持充分杂交。当Taq聚合酶在PCR中酶合成新链时,其最终会遇到退火的TaqMan探针。Taq聚合酶5’至3’内切酶活性随后将通过消化TaqMan探针而顶替它,从而释放荧光报道物分子用于采用实时荧光检测系统定量检测其现在未被淬灭的信号。用于“基于荧光的实时PCR”分析的典型试剂可以包括,但不限于:用于目标基因的靶序列PCR引物;非特异扩增阻断剂;TaqMan或Lightcycler探针;优化的PCR缓冲液以及脱氧核苷酸;以及Taq聚合酶等。
在某些优选实施方式中,所述目标基因的靶序列中至少一个CpG二核苷酸的甲基化状态是由实时PCR反应的临界Ct值确定的。通过利用实时PCR反应分析生物样本中DNA的方法,能方便地实现针对目标基因的靶序列甲基化状态的检测,并且能根据PCR反应的临界Ct值来快速、便捷地判断受检样本是否呈阳性,因而提供了一种无创、快速的甲状腺癌体外检测方法。
所述的样本选自细胞系、组织学切片、组织活检/石蜡包埋的组织、体液、粪便、结肠流出物、尿、血浆、血清、全血、分离的血细胞、从血液中分离的细胞,或其组合。优选的样本为血浆和组织。
本申请还提供一种检测甲状腺癌的系统,其中所述系统包括:
数据采集模块,其用于获取受试者样本的甲基化标志物水平的数据;以及
患甲状腺癌概率的计算模块,其用于对数据采集模块中的获取的数据进行计算,从而计算出受试者患甲状腺癌的概率,
其中所述甲基化标志物为MIR578基因、SNHG15基因和IFFO1基因中的一种、两种或三种。
进一步地,MIR578基因、SNHG15基因和IFFO1基因的靶序列,所使用的引物和探针如上所述。
在一个具体的实施方式中,所述数据采集模块包括以下子模块:
提取模块,其用于提取样本的基因组DNA;
试剂处理模块,其用于使用亚硫酸氢盐试剂处理提取的基因组DNA,使5位未甲基化的胞嘧啶碱基转化为尿嘧啶或其它碱基;
检测模块,其用于对亚硫酸氢盐试剂处理的基因组DNA进行检测,以获得样本的甲基化标志物水平。
在一个具体的实施方式中,在检测模块中,使用实时荧光定量PCR对亚硫酸氢盐试剂处理的基因组DNA进行检测。
在一个具体的实施方式中,在所述患甲状腺癌概率的计算模块中,预先存储有预先构建的基于甲基化标志物水平的数据拟合的用于计算受试者患甲状腺癌概率的公式。
在一个具体的实施方式中,所述公式是基于现有数据库中IFF01的甲基化水平的数据拟合得到的。
在一个具体的实施方式中,所述公式是基于现有数据库中SNHG15的甲基化水平、IFFO1的甲基化水平的数据拟合得到的。
在一个具体的实施方式中,所述公式是基于现有数据库中MIR578的甲基化水平、IFFO1的甲基化水平、SNHG15的甲基化水平的数据拟合得到的。
在一个具体的实施方式中,所述公式是将现有数据库中MIR578的甲基化水平、IFFO1的甲基化水平、SNHG15的甲基化水平的数据利用广义线性回归拟合得到的。广义线性模型是线性模型的扩展,通过连接函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。主要特点是不强行改变数据的自然度量,是常用的二分类分类策略。
在一个具体的实施方式中,所述公式为:
p=e(a*M1+b*M2+c*M3+78)/e(a*M1+b*M2+c*M3+78)+1,
其中P表示受试者患甲状腺癌概率,M1表示MIR578通过实时荧光定量PCR测定的Ct值,M2表示IFFO1通过实时荧光定量PCR测定的Ct值,M3表示SNHG15通过实时荧光定量PCR测定的Ct值,
a选自-0.50~-0.60中的任意数值,优选为-0.55;
b选自-0.75~-0.85中的任意数值,优选为-0.8;
c选自-0.60~-0.70中的任意数值,优选为-0.65。
在一个具体的实施方式中,当受试者患甲状腺癌的概率即P大于等于0.5时,判定受试者患有甲状腺癌。
本申请还提供一种检测甲状腺癌的方法,其中所述方法包括:
数据采集步骤,其获取受试者样本的甲基化标志物水平的数据;以及
患甲状腺癌概率的计算步骤,其对数据采集步骤中的获取的数据进行计算,从而计算出受试者患甲状腺癌的概率,
其中所述甲基化标志物为MIR578基因、SNHG15基因和IFFO1基因中的一种、两种或三种。
进一步地,MIR578基因、SNHG15基因和IFFO1基因的靶序列,所使用的引物和探针如上所述。
在一个具体的实施方式中,所述数据采集步骤包括以下子步骤:
提取步骤,其提取样本的基因组DNA;
试剂处理步骤,其使用亚硫酸氢盐试剂处理提取的基因组DNA,使5位未甲基化的胞嘧啶碱基转化为尿嘧啶或其它碱基;
检测步骤,其对亚硫酸氢盐试剂处理的基因组DNA进行检测,以获得样本的甲基化标志物水平。
在一个具体的实施方式中,在检测步骤中,使用实时荧光定量PCR对亚硫酸氢盐试剂处理的基因组DNA进行检测。
在一个具体的实施方式中,在所述患甲状腺癌概率的计算步骤中,预先存储有预先构建的基于甲基化标志物水平的数据拟合的用于计算受试者患甲状腺癌概率的公式。
在一个具体的实施方式中,所述公式是基于现有数据库中MIR578的甲基化水平的数据拟合得到的。
在一个具体的实施方式中,所述公式是基于现有数据库中MIR578的甲基化水平、IFFO1的甲基化水平的数据拟合得到的。
在一个具体的实施方式中,所述公式是基于现有数据库中MIR578的甲基化水平、IFFO1的甲基化水平、SNHG15的甲基化水平的数据拟合得到的。
在一个具体的实施方式中,所述公式是将现有数据库中MIR578的甲基化水平、IFFO1的甲基化水平、SNHG15的甲基化水平的数据利用广义线性回归拟合得到的。广义线性模型是线性模型的扩展,通过连接函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。主要特点是不强行改变数据的自然度量,是常用的二分类分类策略。
在一个具体的实施方式中,所述公式为:
P=e(a*M1+b*M2+c*M3+78)/e(a*M1+b*M2+c*M3+78)+1,
其中P表示受试者患甲状腺癌概率,M1表示MIR578通过实时荧光定量PCR测定的Ct值,M2表示IFFO1通过实时荧光定量PCR测定的Ct值,M3表示SNHG15通过实时荧光定量PCR测定的Ct值,
a选自-0.50~-0.60中的任意数值,优选为-0.55;
b选自-0.75~-0.85中的任意数值,优选为-0.8;
c选自-0.60~-0.70中的任意数值,优选为-0.65。
在一个具体的实施方式中,当受试者患甲状腺癌的概率即P大于等于0.5时,判定受试者患有甲状腺癌。
本申请发明人发现,在甲状腺癌组织中MIR578基因、SNHG15基因和IFFO1基因的靶序列的甲基化状态和正常甲状腺组织的所述基因的靶序列的甲基化状态存在显著性差异:在甲状腺癌组织中,MIR578基因、SNHG15基因和IFFO1基因的靶序列发生甲基化,而在正常甲状腺组织中,MIR578基因、SNHG15基因和IFFO1基因的靶序列不发生甲基化。因此本申请提供了一种通过检测样本中的MIR578基因、SNHG15基因和IFFO1基因的靶序列甲基化状态对甲状腺癌进行检测的系统和方法,本申请提供的方法能够无创、快速地检测甲状腺癌。
实施例
本申请对试验中所用到的材料以及试验方法进行一般性和/或具体的描述,在下面的实施例中,如果无其他特别的说明,%表示wt%,即重量百分数。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规试剂产品。
实施例1引物和探针测试
首先,在340例健康人WBC样本和102例健康人血浆cfDNA样本的二代测序信息中筛选低甲基化水平的位点。其次,对筛选出的低甲基化水平位点进行血浆和甲状腺癌组织分析,筛选出在103例甲状腺癌血浆和102例正常人血浆中存在差异,且在56甲状腺癌组织和56例癌旁组织中同时存在差异的位点作为候选标志物。然后,再对候选标志物进行血浆溯源。最后,再通过甲状腺癌组织和正常人血浆灵敏度和特异性验证,确定了MIR578基因、SNHG15基因、IFFO1基因、OSTM1基因、SLC38A1基因共五个特异性标志物。
根据上述五个基因的靶序列设计引物和探针。其中,设计的MIR578基因、SNHG15基因、IFFO1基因、引物探针序列如上述的表2所示。OSTM1基因的靶序列(5’-3’)如下:
SLC38A1基因的靶序列(5’-3’)如下:
OSTM1基因的引物和探针序列(5’-3’)如下:
OSTM1_1F:GGTTTAGTTTGTTTGCGA(SEQ ID NO:24)
OSTM1_1R:CGCAAACTCAAATCCTTAC(SEQ ID NO:25)
OSTM1_1P:CAAAACCGCGATCGATCCGT(SEQ ID NO:26)
SLC38A1基因的引物和探针序列(5’-3’)如下:
SLC38A1_1F:GTATATGGTAGTAAAAGGAATTTC(SEQ ID NO:27)
SLC38A1_1R:CAAAACAACCTATAAAAAACACT(SEQ ID NO:28)
SLC38A1_1P:CGGTATTCGCGTTACGTCGTT(SEQ ID NO:29)
正常人白细胞的细胞系DNA通常处于低/非甲基化状态,可作为阴性对照,本实施方案中所用的DNA量为15.75ng/反应;全甲基化DNA处于高/全甲基化状态,可作为阳性对照,本实施方案中所用的DNA量为200pg/反应。将DNA样本首先进行亚硫酸氢盐转化,以转化后的BisDNA为模板,利用上述引物探针进行实时PCR扩增。以β肌动蛋白(ACTB)基因为内参,通过使用与β肌动蛋白基因序列互补的引物来创建β肌动蛋白基因扩增子,并且用特定的探针检测β肌动蛋白基因扩增子。每个样品进行至少一次的实时PCR,在某些具体实施方式中,进行两次或三次实时PCR检测。引物探针测试的PCR体系如下表4所示。
表4引物探针测试的PCR体系
体积(μL) 终浓度
Taq DNA Polymerase(Biochain) 1.2 /
4.2×buffer(Biochain) 11.9
正向引物F(10μM) 1.0 200nM
反向引物R(10μM) 1.0 200nM
探针P(10μM) 1.0 200nM
ACTB_F(10μM) 0.5 100nM
ACTB_R(10μM) 0.5 100nM
ACTB_P(10μM) 0.375 75nM
BisDNA 4.0 /
H2O 19.05 /
Total 50.0 /
注:“F”表示正向引物;“R”表示反向引物;“P”表示探针。
所用的PCR扩增程序为:94℃,20min;(93℃,30s;57℃,35s-读取荧光信号)45个循环;40℃,5s。
结果如表5所示,当以全甲基化DNA的BisDNA为模板时,MIR578基因、SNHG15基因、IFFO1基因、OSTM1基因、SLC38A1基因均能够有效扩增;而当以WBC的BisDNA为模板时,除内参基因ACTB外,其余目的基因均无扩增。
表5各基因引物探针测试结果
其中“No Ct”表示未检测到Ct值。
实施例2
选择16例甲状腺癌组织样本(10ng/反应)和16例正常人血浆样本(3.5mL),提取基因组DNA,经亚硫酸氢盐转化为BisDNA后,按照表6中的PCR反应体系和实施例1中的反应程序对效果较好的MIR578、SNHG15和IFFO1基因的甲基化进行检测。最后测得16例甲状腺癌组织和16例正常人血浆对于目的基因的靶序列的实时PCR的Ct值。
表6不同引物和探针组合的PCR体系
注:“F”表示正向引物;“R”表示反向引物;“P”表示探针。
测试结果如表7和表8所示,利用SNHG15、IFFO1和MIR578基因单独检测甲状腺癌的灵敏度分别为87.5%、81.25%和87.5%;三个基因联合判读的灵敏度达到100%。目的基因靶序列的甲基化具有良好的特异性,SNHG15和MIR578的特异性均达到93.75%,IFFO1的特异性为100%,因此联合判读的特异性也为93.75%。
表7:SNHG15、IFFO1和MIR578基因在甲状腺癌组织和正常人血浆的检测阳性
表8:SNHG15、IFFO1和MIR578基因在甲状腺癌组织和正常人血浆的检测阴性
实施例3
选择32例甲状腺癌血浆样本(3.5mL)、和32例正常人血浆样本(3.5mL),提取基因组DNA,经亚硫酸氢盐转化为BisDNA后,按照实施例2中的PCR反应体系,以及联合SNHG15、IFFO1和MIR578基因进行甲基化检测。最后测得32例甲状腺癌血浆样本和32例正常人血浆对于目的基因靶序列的实时PCR的Ct值。根据PCR结果,三个基因各自Ct值的临界值均选择Ct=38,结果如表9所示,利用SNHG15、IFFO1和MIR578基因单独检测甲状腺癌的灵敏度分别为68.75%、75%和78.13%;三个基因联合判读的灵敏度达到87.5%,特异性93.75%。
表9:联合SNHG15、IFFO1和MIR578基因在癌症血浆和正常人血浆的检测结果
/>
实施例4
以实施例3的64例样本(32例甲状腺癌血浆样本,32例正常人血浆样本)的Ct值数据,作为模型的训练数据集进行拟合。将所有样本按照75:25的比例拆分训练集和测试集,在训练集中进行5折交叉验证,对不同标志物类型(包含差异甲基化区域、甲基化单体型等)联合不同的标志物筛选策略(包含筛选指标包括AUC、互信息等)和建模方法(如随机森林、支持向量机、广义线性模型、XGboost等)进行标志物筛选和建模,以AUC为标准对上述方法组合进行评价,最终采用广义线性回归的方式拟合公式,得到如下的公式:
即p=e(-0.55*M1-0.8*M2-0.65*M3+78)/(e(-0.55*M1-0.8*M2-0.65*M3+78)+1),
其中P表示受试者患甲状腺癌概率,M1表示MIR578通过实时荧光定量PCR测定的Ct值,M2表示IFFO1通过实时荧光定量PCR测定的Ct值,M3表示SNHG15通过实时荧光定量PCR测定的Ct值。
分别将MIR578、IFFO1和SNHG15检测样本后的Ct值带入上述判读公式,该判读公式的指定阈值(Cut-off值)为0.5,即当P<0.5时,该患者为阴性,当P≥0.5时,该患者为阳性。
选择32例甲状腺癌血浆样本(3.5mL)、和32例正常人血浆样本(3.5mL),提取基因组DNA,经亚硫酸氢盐转化为BisDNA后,按照实施例2中的PCR反应体系,以及联合SNHG15、IFFO1和MIR578基因进行甲基化检测。最后测得32例甲状腺癌血浆样本和32例正常人血浆对于目的基因靶序列的实时PCR的Ct值,输入三个基因的检测Ct值使用公式判读。结果如表10所示,利用SNHG15、IFFO1和MIR578基因单独检测甲状腺癌的灵敏度分别为68.75%、75%和78.13%;三个基因使用公式判读的灵敏度达到90.63%,特异性93.75%。
表10:联合SNHG15、IFFO1和MIR578基因在癌症血浆和正常人血浆的检测结果
/>
与不使用公式的三基因联合判读相比,使用公式在检测甲状腺癌血浆的特异性没有变化,但是灵敏度上有明显提升,从87.5%提升到90.63%。
以上所述,仅是本申请的较佳实施例而已,并非是对本申请作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本申请技术方案内容,依据本申请的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本申请技术方案的保护范围。

Claims (10)

1.一种用于体外检测甲状腺癌的组合物,所述组合物包括:
用于检测目标基因甲基化状态的核酸,
其中,所述目标基因甲基化状态由所述目标基因的靶序列的甲基化来表征,
其中,所述目标基因为MIR578基因、SNHG15基因和IFFO1基因中的一种、两种或三种。
2.根据权利要求1所述的组合物,其中,所述MIR578基因的靶序列如SEQ ID NO:1-4中任一个所示,或包括SEQ ID NO:1-4中任一个所示的序列。
3.根据权利要求1所述的组合物,其中,所述SNHG15基因的靶序列如SEQ ID NO:5-8中任一个所示,或包括SEQ ID NO:5-8中任一个所示的序列。
4.根据权利要求1所述的组合物,其中,所述IFFO1基因的靶序列如SEQ ID NO:9-12中任一个所示,或包括SEQ ID NO:9-12中任一个所示的序列。
5.根据权利要求1~4中任一项所述的组合物,其中,所述用于检测目标基因甲基化状态的核酸包括:
引物,所述引物为所述目标基因的靶序列中的至少9个核苷酸的片段,
所述片段包含至少一个CpG二核苷酸序列。
6.根据权利要求1~5中任一项所述的组合物,其中,所述用于检测目标基因甲基化状态的核酸包括:
探针,所述探针为在中等严紧或严紧条件下杂交于所述目标基因的靶序列中的至少15个核苷酸的片段,
所述片段包含至少一个CpG二核苷酸序列。
7.根据权利要求1~6中任一项所述的组合物,其还包括:
将目标基因的靶序列的5位未甲基化胞嘧啶碱基转化为尿嘧啶的试剂。
8.根据权利要求1~7中任一项所述的组合物,其中所述用于检测目标基因甲基化状态的核酸还包括:
优先与处于非甲基化状态的靶序列结合的阻断剂。
9.根据权利要求8所述的组合物,其中,
所述至少9个核苷酸的片段,其为SEQ ID NO:13和SEQ ID NO:14的序列,或者其为SEQID NO:16和SEQ ID NO:17的序列,或者其为SEQ ID NO:19和SEQ ID NO:20的序列;
所述至少15个核苷酸的片段,其为SEQ ID NO:15的序列,或SEQ ID NO:18的序列,或SEQ ID NO:21的序列。
10.一种用于体外检测甲状腺癌的寡核苷酸,其包括:
所述SEQ ID NO:1或SEQ ID NO:2或SEQ ID NO:3或SEQ ID NO:4或其互补序列中的至少9个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或
所述SEQ ID NO:5或SEQ ID NO:6或SEQ ID NO:7或SEQ ID NO:8或其互补序列中的至少9个核苷酸且包含至少一个CpG二核苷酸序列的片段;和/或
所述SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或其互补序列中的至少9个核苷酸且包含至少一个CpG二核苷酸序列的片段。
CN202310787062.0A 2023-06-29 2023-06-29 用于检测甲状腺癌的组合物及其用途 Pending CN117004720A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310787062.0A CN117004720A (zh) 2023-06-29 2023-06-29 用于检测甲状腺癌的组合物及其用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310787062.0A CN117004720A (zh) 2023-06-29 2023-06-29 用于检测甲状腺癌的组合物及其用途

Publications (1)

Publication Number Publication Date
CN117004720A true CN117004720A (zh) 2023-11-07

Family

ID=88571885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310787062.0A Pending CN117004720A (zh) 2023-06-29 2023-06-29 用于检测甲状腺癌的组合物及其用途

Country Status (1)

Country Link
CN (1) CN117004720A (zh)

Similar Documents

Publication Publication Date Title
JP7035156B2 (ja) 結腸直腸がんのエピジェネティックマーカー及び該マーカーを使用する診断法
US20060183128A1 (en) Methods and compositions for differentiating tissues for cell types using epigenetic markers
CN104745681B (zh) 多元基因组合物及其用途
US10968486B2 (en) Gene composition for detecting cell proliferative abnormality or grading disease degree and use thereof
JP2024020392A (ja) 特定の遺伝子のcpgメチル化変化を利用した肝癌診断用組成物およびその使用
US11535897B2 (en) Composite epigenetic biomarkers for accurate screening, diagnosis and prognosis of colorectal cancer
WO2021143709A1 (zh) 检测dna甲基化的试剂及用途
US11542559B2 (en) Methylation-based biomarkers in breast cancer screening, diagnosis, or prognosis
CN117004720A (zh) 用于检测甲状腺癌的组合物及其用途
CN116798606A (zh) 用于检测甲状腺癌的系统
CN117721203A (zh) 用于检测甲状腺癌的组合物及其用途
CN116732180A (zh) 用于检测甲状腺癌的组合物及其用途
CN116640852A (zh) 用于检测甲状腺癌的组合物及其用途
CN117004722A (zh) 用于检测肺癌的组合物及其用途
CN117683888A (zh) 用于检测肺癌的组合物及其用途
CN118109595A (zh) 用于检测肺癌相关基因tacc2甲基化的核酸组合物及其用途
CN117004726A (zh) 用于检测膀胱癌相关基因甲基化的核酸组合物及其相应的试剂盒和用途
CN118166104A (zh) 用于检测肠癌的组合物及其用途
CN118291616A (zh) 用于检测肺癌的组合物及其用途
CN117327796A (zh) 用于检测尿路上皮癌的组合物及其用途
CN117305450A (zh) 用于检测膀胱癌相关基因甲基化的核酸组合物及其相应的试剂盒和用途
CN117265118A (zh) 用于检测膀胱癌相关基因甲基化的核酸组合物及其相应的试剂盒和用途
CN118291617A (zh) 用于检测肺癌的组合物及其用途
CN117126941A (zh) 用于检测膀胱癌的组合物及其用途
CN117004724A (zh) 用于检测膀胱癌的组合物及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination