CN114369663A - 用于肝癌筛查的标志物、探针组合物及其应用 - Google Patents
用于肝癌筛查的标志物、探针组合物及其应用 Download PDFInfo
- Publication number
- CN114369663A CN114369663A CN202210055193.5A CN202210055193A CN114369663A CN 114369663 A CN114369663 A CN 114369663A CN 202210055193 A CN202210055193 A CN 202210055193A CN 114369663 A CN114369663 A CN 114369663A
- Authority
- CN
- China
- Prior art keywords
- marker
- seq
- probe
- sequence
- composition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Pathology (AREA)
- Genetics & Genomics (AREA)
- Oncology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Hospice & Palliative Care (AREA)
- General Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种用于肝癌筛查的标志物、探针组合物及其应用,所述标志物选自9个标志物的任一种。本发明使用所述的标志物,能够灵敏和特异地检测该基因的甲基化的状态,从而可以用于对外周血游离DNA的检测,并且,本发明所述的组合物以非侵入性的方式用于无症状人群的筛查,降低了侵入性检测造成的危害,所述的组合物具有更高的灵敏度和准确度,能够实现实时监测。
Description
技术领域
本发明涉及生物技术领域,尤其涉及一种用于肝癌筛查的标志物、探针组合物及其应用。
背景技术
我国是肝癌大国,全世界一半左右的肝癌发生在中国,肝癌的五年总生存率目前仅为14.1%。肝癌长期生存率低的主要原因,首先在于肝癌高危人群筛查没有普及,早期诊断率低,导致70%~80%的患者在诊断时已经是中晚期,如果能够早期发现和早期诊断,可以施行肝切除术和肝移植等根治性手段,可明显改善肝癌患者预后;其次,肝癌切除术后5年复发转移率达40%~70%。现有的诊疗策略和措施对降低肝癌的5年总病死率非常有限,因此探索新的肝癌筛查、诊疗策略极其迫切。目前,DNA甲基化已被证明具有组织特异性,可用于早期癌症检测,并可根据循环肿瘤DNA(ctDNA)甲基化特征追踪到肿瘤原发部位。。
发明内容
本发明的目的在于提供了一种检测肝癌的标志物以及探针组合物,可以用于肝癌的筛查,所述的标志物以非侵入性的方式用于无症状人群的筛查,以及癌症患者的预后检测,降低了侵入性检测造成的危害,并且具有更高的灵敏度和准确性。
本发明具体技术方案如下:
1.一种用于检测肝癌的标志物,所述标志物选自下述中的一种:ITPKB、ENDOD1、LDHB、ALDH1A2、RNF135、ADGRE5和PTPN18。
2.根据项1所述的标志物,其中,所述标志物的核苷酸序列选自如SEQ ID NO:1-SEQ ID NO:9所示的一种,优选所述标志物为甲基化后的标志物。
3.一种探针组合物,所述探针组合物包含靶向项1或2所述标志物甲基化的探针。
4.根据项3所述的探针组合物,其中,所述探针组合物包含高甲基化的第一探针组合物和低甲基化的第二探针组合物,所述第一探针组合物用于与经重亚硫酸盐转化的CG高甲基化的区域杂交,所述第二探针组合物用于与经重亚硫酸盐转化的CG低甲基化的区域杂交。
5.根据项4所述的探针组合物,其中,所述第一探针组合物包括n个探针,所述n个探针与经重亚硫酸盐转化的CG高甲基化的区域的正义链或反义链的每个核苷酸杂交;
优选的,所述第二探针组合物包括m个探针,所述m个探针与经重亚硫酸盐转化的CG低甲基化的区域的正义链或反义链的每个核苷酸杂交。
6.根据项5所述的探针组合物,其中,n和m均是1-10中的任意整数。
7.根据项5或6所述的探针组合物,其中,第n-1个探针和第n个探针之间有x1个核苷酸重叠,优选的,x1为0-100中的任意整数;
优选的,第m-1个探针和第m个探针之间有x2个核苷酸重叠,优选的,x2为0-100中的任意整数。
8.根据项5-7中任一项所述的探针组合物,其中,所述第一探针组合物包括如SEQID NO:29-84中的一种或两种,所述第二探针组合物包括如SEQ ID NO:85-140中的一种或两种。
9.标志物在制备用于检测肝癌的试剂盒中的用途,所述标志物选自下述中的一种:ITPKB、ENDOD1、LDHB、ALDH1A2、RNF135、ADGRE5和PTPN18。
10.根据项9所述的用途,其中,所述标志物的核苷酸序列选自如SEQ ID NO:1-28所示的一种,优选所述标志物为甲基化后的标志物。
11.探针组合物在制备用于检测肝癌的试剂盒中的用途,所述探针组合物用于靶向肝癌的甲基化后的标志物。
12.根据项11所述的用途,其中,所述探针组合物为项3-8中任一项所述的探针组合物。
13.一种用于肝癌检测的组合物,所述组合物包括用于检测选自下述标志物中任一种甲基化的核酸:ITPKB、ENDOD1、LDHB、ALDH1A2、RNF135、ADGRE5和PTPN18。
14.根据项13所述的组合物,其中,所述标志物的核苷酸序列选自如SEQ ID NO:1-SEQ ID NO:28所示的一种。
15.根据项13或14所述的组合物,其中,所述核酸包括项3-8中任一项所述的探针组合物。
16.根据项13或14所述的组合物,其中,所述核酸包括:
引物,所述引物为所述标志物的靶序列中的至少9个核苷酸的片段,所述片段包含至少一个CpG二核苷酸序列。
17.根据项13-14以及16中任一项所述的组合物,其中,所述核酸还包括:
探针,所述探针为在中等严紧或严紧条件下与所述标志物的靶序列中的至少15个核苷酸片段杂交,所述片段包含至少一个CpG二核苷酸序列。
18.根据项13-14以及16-17中任一项所述的组合物,其中,所述组合物还包括将标志物的靶序列的5位未甲基化胞嘧啶碱基转化为尿嘧啶的试剂,优选的,所述用于检测标志物的靶序列甲基化的核酸还包括:
优先与处于非甲基化状态的靶序列结合的阻断剂。
19.一种试剂盒,其包含项1或2所述的标志物或者项3-8中任一项所述的探针组合物或者项13-18中任一项所述的组合物。
20.一种芯片,其包含项1或2所述的标志物或者项3-8中任一项所述的探针组合物或者项13或14所述的组合物。
发明的效果
本发明的发明人利用表观基因组和生物信息学技术,通过分析肝癌的基因组甲基化数据,寻找到了多个与肝癌相关的甲基化基因,并确定了肝癌甲基化基因发生甲基化异常的靶序列,并且通过这个甲基化基因的靶序列,能够灵敏和特异地检测该基因的甲基化的状态,从而可以用于对外周血游离DNA的检测。
本发明所述的组合物以非侵入性的方式用于无症状人群的筛查,降低了侵入性检测造成的危害,所述的组合物具有更高的灵敏度和准确度,能够实现实时监测。
具体实施方式
下面对本发明做以详细说明。虽然显示了本发明的具体实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异作为区分组件的方式,而是以组件在功能上的差异作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式,然而所述描述乃以说明书的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。
本发明提供了一种检测肝癌的标志物,所述标志物选自下述中的一种:ITPKB、ENDOD1、LDHB、ALDH1A2、RNF135、ADGRE5和PTPN18。
在一个实施方案中,所述标志物的核苷酸序列选自如SEQ ID NO:1-SEQ ID NO:9所示的一种,优选的,所述标志物为甲基化后的标志物。
其中,ITPKB的核苷酸序列分别如SEQ ID NO:1和SEQ ID NO:2所示;ENDOD1的核苷酸序列如SEQ ID NO:3所示;LDHB的核苷酸序列如SEQ ID NO:4所示;ALDH1A2的核苷酸序列如SEQ ID NO:5所示;RNF135的核苷酸序列分别如SEQ ID NO:6和SEQ ID NO:7所示;ADGRE5的核苷酸序列如SEQ ID NO:8所示;PTPN18的核苷酸序列如SEQ ID NO:9所示。
其中,上述所述标志物的序列均是未经重亚硫酸盐转化的序列。
本发明提供了一种探针组合物,所述探针组合物包括靶向所述标志物甲基化的探针。
所述甲基化指的是发生在CpG二核苷酸中胞嘧啶上第5位碳原子的甲基化过程,作为一种对稳定的修饰状态,在DNA甲基转移酶的作用下,可随DNA的复制过程遗传给新生的子代DNA,是一种重要的表观遗传机制,DNA甲基化时,基因启动子区的甲基化可导致抑癌基因转录沉寂,因此它与肿瘤的发生关系密切。异常甲基化包括抑癌基因和DNA修复基因的高甲基化、重复序列DNA的低甲基化、某些基因的印记丢失,其与多种肿瘤的发生有关。
本发明所述的甲基化可以为甲基化水平、甲基化程度或甲基化状态,当分析这样的靶序列的甲基化时,本领域技术人员可以使用定量测定方法来确定甲基化。
所述探针为长度在几十到几百甚至上千碱基对的单链或双链DNA,其可利用分子的变性、复性以及碱基互补配对的高度精确性,能与待测样本中互补的非标记单链DNA或RNA以氢键结合(杂交),形成双链复合物(杂交体)。将未配对结合的探针洗去后,可用放射自显影或酶联反应等检测系统检测杂交反应结果。在本申请中,与探针互补结合或杂交的区域为特异性靶区域,多个探针组合成探针组合物。
在一个实施方案中,所述探针组合物包含高甲基化的第一探针组合物和低甲基化的第二探针组合物,所述第一探针组合物用于与经重亚硫酸盐转化的CG高甲基化的区域杂交,所述第二探针组合物用于与经重亚硫酸盐转化的CG低甲基化的区域杂交。
所述高甲基化指的是标志物经重亚硫酸盐转化后,碱基C变成碱基T,但是如果是碱基CG,则碱基C保持不变;
所述低甲基化指的是标志物经重亚硫酸盐转化后,所有的碱基CG都没有发生甲基化,碱基C均变成碱基T。
由于每个人的甲基化状态不同,标志物经重亚硫酸盐转化得到的序列也不同,在此示出了每个标志物的一种极端情况,即该区段所有的CG都处于高甲基化状态,并示出了其互补链的高甲基化状态序列:
SEQ ID NO:1的一种极端情况的序列如SEQ ID NO:46所示;
SEQ ID NO:1互补链的极端情况的序列如SEQ ID NO:47所示;
SEQ ID NO:2的一种极端情况的序列如SEQ ID NO:48所示;
SEQ ID NO:2互补链的极端情况的序列如SEQ ID NO:49所示;
SEQ ID NO:3的一种极端情况的序列如SEQ ID NO:50示;
SEQ ID NO:3互补链的极端情况的序列如SEQ ID NO:51所示;
SEQ ID NO:4的一种极端情况的序列如SEQ ID NO:52所示;
SEQ ID NO:4互补链的极端情况的序列如SEQ ID NO:53所示;
SEQ ID NO:5的一种极端情况的序列如SEQ ID NO:54所示;
SEQ ID NO:5互补链的极端情况的序列如SEQ ID NO:55所示;
SEQ ID NO:6的一种极端情况的序列如SEQ ID NO:56所示;
SEQ ID NO:6互补链的极端情况的序列如SEQ ID NO:57所示;
SEQ ID NO:7的一种极端情况的序列如SEQ ID NO:58所示;
SEQ ID NO:7互补链的极端情况的序列如SEQ ID NO:59所示;
SEQ ID NO:8的一种极端情况的序列如SEQ ID NO:60所示;
SEQ ID NO:8互补链的极端情况的序列如SEQ ID NO:61所示;
SEQ ID NO:9的一种极端情况的序列如SEQ ID NO:62所示;
SEQ ID NO:9互补链的极端情况的序列如SEQ ID NO:63所示;
同理,由于每个人的甲基化状态不同,在此示出了一种极端的情况,即所有的CG都处于低甲基化状态,也示出了其互补链的低甲基化状态序列:
SEQ ID NO:1的一种极端情况的序列如SEQ ID NO:64所示;
SEQ ID NO:1互补链的极端情况的序列如SEQ ID NO:65所示;
SEQ ID NO:2的一种极端情况的序列如SEQ ID NO:66所示;
SEQ ID NO:2互补链的极端情况的序列如SEQ ID NO:67所示;
SEQ ID NO:3的一种极端情况的序列如SEQ ID NO:68所示;
SEQ ID NO:3互补链的极端情况的序列如SEQ ID NO:69所示;
SEQ ID NO:4的一种极端情况的序列如SEQ ID NO:70所示;
SEQ ID NO:4互补链的极端情况的序列如SEQ ID NO:71所示;
SEQ ID NO:5的一种极端情况的序列如SEQ ID NO:72所示;
SEQ ID NO:5互补链的极端情况的序列如SEQ ID NO:73所示;
SEQ ID NO:6的一种极端情况的序列如SEQ ID NO:74所示;
SEQ ID NO:6互补链的极端情况的序列如SEQ ID NO:75所示;
SEQ ID NO:7的一种极端情况的序列如SEQ ID NO:76所示;
SEQ ID NO:7互补链的极端情况的序列如SEQ ID NO:77所示;
SEQ ID NO:8的一种极端情况的序列如SEQ ID NO:78所示;
SEQ ID NO:8互补链的极端情况的序列如SEQ ID NO:79所示;
SEQ ID NO:9的一种极端情况的序列如SEQ ID NO:80所示;
SEQ ID NO:9互补链的极端情况的序列如SEQ ID NO:81所示;
在一个实施方案中,所述第一探针组合物包括n个探针,所述n个探针与经重亚硫酸盐转化的CG高甲基化的区域的正义链或反义链的每个核苷酸杂交。
所述第二探针组合物包括m个探针,所述m个探针与经重亚硫酸盐转化的CG低甲基化的区域的正义链或反义链的每个核苷酸杂交。
对于第一探针组合物和第二探针组合物中探针的个数,本发明不作任何限制,本领域技术人员可以根据需要进行选择,例如,m和n可以为1-10中的任意整数,m和n既可以是相同的,也可以是不同的。
例如,m和n可以为1、2、3、4、5、6、7、8、9、10的任意整数,优选的,m=n=2。
在一个实施方案中,第n-1个探针和第n个探针之间有x1个核苷酸重叠,优选的,x1为0-100中的任意整数;
优选的,第m-1个探针和第m个探针之间有x2个核苷酸重叠,优选的,x2为0-100中的任意整数。
其中,x1和x2可以是相同的,也可以是不同的,当x1为0时,表明第n-1探针的尾部与第n个探针的首部相连接,同理,当x2为0时,表明第m-1探针的尾部与第m个探针的首部相连接。
本发明通过将探针组合物与经过重亚硫酸盐转化的标志物进行杂交,其中,高甲基化的第一探针组合物与CG高甲基化的区域杂交,低甲基化的第二探针组合物与CG低甲基化的区域杂交,从而能够高效准确地检测靶序列的甲基化水平,进而能够用于肝癌筛查。
在一个实施方案中,所述高甲基化的第一探针组合物包括如SEQ ID NO:10-17中的一种或两种。
所述低甲基化的第二探针组合物包括如SEQ ID NO:10-27中的一种或两种。
其中,用于与ITPKB甲基化序列杂交的第一探针组合物包括如SEQ ID NO:10-11所示的核苷酸序列(用于与SEQ ID NO:1甲基化序列杂交)以及SEQ ID NO:12-13所示的核苷酸序列(用于与SEQ ID NO:2甲基化序列杂交);
用于与ENDOD1甲基化序列杂交的第一探针组合物包括如SEQ ID NO:14-15所示的核苷酸序列;
用于与LDHB甲基化序列杂交的第一探针组合物包括如SEQ ID NO:16-17所示的核苷酸序列;
用于与ALDH1A2甲基化序列杂交的第一探针组合物包括如SEQ ID NO:18-19所示的核苷酸序列;
用于与RNF135甲基化序列杂交的第一探针组合物分别包括如SEQ ID NO:20-21所示的核苷酸序列(用于与SEQ ID NO:6甲基化序列杂交)以及SEQ ID NO:22-23所示的核苷酸序列(用于与SEQ ID NO:7甲基化序列杂交);
用于与ADGRE5甲基化序列杂交的第一探针组合物包括如SEQ ID NO:24-25所示的核苷酸序列;
用于与PTPN18甲基化序列杂交的第一探针组合物包括如SEQ ID NO:26-27所示的核苷酸序列;
用于与ITPKB甲基化序列杂交的第二探针组合物包括如SEQ ID NO:28-29所示的核苷酸序列(用于与SEQ ID NO:1甲基化序列杂交)以及SEQ ID NO:30-31所示的核苷酸序列(用于与SEQ ID NO:2甲基化序列杂交);
用于与ENDOD1甲基化序列杂交的第二探针组合物包括如SEQ ID NO:32-33所示的核苷酸序列;
用于与LDHB甲基化序列杂交的第二探针组合物包括如SEQ ID NO:34-35所示的核苷酸序列;
用于与ALDH1A2甲基化序列杂交的第二探针组合物包括如SEQ ID NO:36-37所示的核苷酸序列;
用于与RNF135甲基化序列杂交的第二探针组合物分别包括如SEQ ID NO:38-39所示的核苷酸序列(用于与SEQ ID NO:6甲基化序列杂交)以及SEQ ID NO:40-41所示的核苷酸序列(用于与SEQ ID NO:7甲基化序列杂交);
用于与ADGRE5甲基化序列杂交的第二探针组合物包括如SEQ ID NO:42-43所示的核苷酸序列;
用于与PTPN18甲基化序列杂交的第二探针组合物包括如SEQ ID NO:44-45所示的核苷酸序列;
本发明提供了标志物在制备用于检测肝癌的试剂盒中的用途,所述标志物选自下述中的一种:ITPKB、ENDOD1、LDHB、ALDH1A2、RNF135、ADGRE5和PTPN18。
在一个实施方案中,所述标志物的核苷酸序列选自如SEQ ID NO:1-9所示的一种,优选所述标志物为甲基化后的标志物。
本发明提供了探针组合物在制备用于检测肝癌的试剂盒中的用途,所述探针组合物用于靶向肝癌甲基化后的标志物。
在一个实施方案中,所述探针组合物为上述所述的探针组合物。
本发明提供了一种用于肝癌检测的组合物,所述组合物包括用于检测选自下述标志物中任一种甲基化的核酸:ITPKB、ENDOD1、LDHB、ALDH1A2、RNF135、ADGRE5和PTPN18,优选的,所述标志物的核苷酸序列选自如SEQ ID NO:1-SEQ ID NO:9所示的一种。
在一个实施方案中,所述核酸包括上述所述的探针组合物。
在一个实施方案中,所述核酸包括:
引物,所述引物为所述标志物的靶序列中的至少9个核苷酸的片段,所述片段包含至少一个CpG二核苷酸序列。
其中,如果使用重亚硫酸盐对待测样本NDA进行转化,则用于检测标志物的靶序列甲基化的核酸包括对标志物的靶序列进行重亚硫酸盐转化后的序列中的至少9个核苷酸的片段,所述片段包含至少一个CpG二核苷酸序列。
在一个实施方案中,所述核酸还包括:
探针,所述探针为在中等严紧或严紧条件下与所述标志物的靶序列中的至少15个核苷酸片段杂交,所述片段包含至少一个CpG二核苷酸序列。
在一个实施方案中,所述所述组合物还包括将标志物的靶序列的5位未甲基化胞嘧啶碱基转化为尿嘧啶的试剂,例如试剂可以为重亚硫酸盐等;优选的,所述用于检测标志物的靶序列甲基化的核酸还包括:
优先与处于非甲基化状态的靶序列结合的阻断剂。
所述阻断剂是为了提高PCR扩增引物的扩增特异性,阻断剂核苷酸序列的5’端与正向或反向引物的3’端核苷酸序列有大于或等于5个核苷酸的重叠区域,阻断剂与正向或反向引物互补与目标基因靶序列DNA的同一条链,阻断剂的解链温度高于正向或者反向引物超过(包括)5℃,阻断剂的核苷酸序列包含至少一个CpG二核苷酸序列,并与重亚硫酸盐转化后的未发生甲基化的目标基因靶序列DNA的序列互补。因此,当所要检测的生物样本的基因组DNA是处于甲基化和非甲基化状态的混合物时,尤其是处于甲基化状态的DNA远远少于处于非甲基化状态的DNA的情况下,处于非甲基化状态的DNA经重亚硫酸盐转化后,会优先与阻断剂相结合,从而以及DNA模板与PCR义务结合,因而不发生PCR扩增,而处于甲基化状态的DNA不与阻断剂相结合,因而与引物集合,发生PCR扩增,之后直接或间接地检测通过扩增获得的片段。
本发明提供了一种试剂盒,其包括上述所述的标志物或者上述所述的探针组合物或者上述所述的组合物。
在一个实施方案中,所述试剂盒还包含用于容纳受试者生物样品的容器。
在一个实施方案中,所述试剂盒还包括使用和解释检测结果的说明。
所述生物样品例如可以为外周血全血、血浆或血清。
本发明对于使用上述所述的试剂盒检测靶序列甲基化水平的方法,本发明不作任何限制,本领域技术人员可以根据需要进行选择,例如本发明提供了一种使用上述所述的试剂盒检测标志物靶序列甲基化水平的方法,其包括下述步骤:
采集受试者样品;
提取纯化所述样品中的DNA;
针对纯化的DNA样品构建用于测序的DNA文库;
用重亚硫酸盐转化所述构建的DNA文库;
预PCR扩增所述经重亚硫酸盐转化的DNA文库;
利用探针组合物对经预PCR扩增的样品进行杂交捕获;
利用PCR扩增经杂交捕获后的产物;
对PCR扩增后的经杂交捕获后的产物进行高通量二代测序;
对测序数据进行分析,确定样本的甲基化水平;
基于已有样本的甲基化情况计算每个标志物的阈值,基于所述样本的某个标志物甲基化水平判读所述患者的患病情况,如果样本的某个标志物的甲基化水平超过阈值为癌症样本,如果低于阈值为健康人样本。
还例如,本发明提供了一种使用上述所述的试剂盒检测标志物的靶序列甲基化水平的方法,其包括下述步骤:
(1)抽取受试者外周血,分离血浆或血清;
(2)抽取血浆或血清中的游离DNA;
(3)使用试剂处理步骤(2)所得到的游离DNA,使5位未甲基化的胞嘧啶碱基转为为尿嘧啶或其他碱基,即标志物的靶序列的5位未甲基化的胞嘧啶碱基转化为尿嘧啶或其他碱基,转化后的碱基在杂交性能方面不同于5位未甲基化的胞嘧啶碱基,并且是可检测的;
(4)将经步骤(3)处理过的游离DNA与DNA聚合酶和所述标志物的靶序列的引物接触,使得所述经处理的标志物的靶序列被扩增以产生扩增产物或不被扩增;所述经处理的标志物的靶序列如果发生DNA聚合反应,会产生扩增产物;所述经处理的标志物的靶序列如果不发生DNA聚合反应,则不被扩增;
(5)用探针检测扩增产物;
(6)基于所述扩增产物是否存在,确定所述标志物的靶序列的至少一个CpG二核苷酸的甲基化状态,从而确定标志物的靶序列的甲基化水平。
本发明提供了一种芯片,其包含上述所述的标志物或者上述所述的探针组合物或者上述所述的组合物。
所述芯片又称为基因芯片,其测序原理是杂交测序方法,即通过与一组已知序列的核酸探针杂交进行核酸序列测定的方法,在一块基片表面固定了序列已知的靶核苷酸的探针。当溶液中带有荧光标记的核酸序列与基因芯片上对应位置的核酸探针产生互补匹配时,通过确定荧光强度最强的探针位置,获得一组序列完全互补的探针序列。
所述芯片的制备主要是以玻璃片或硅片为载体,采用原位合成和微矩阵的方法将寡核苷酸片段或cDNA作为探针按顺序排列在载体上。
本发明所述芯片是基于重亚硫酸盐处理后的DNA序列杂交的信号探测,重亚硫酸盐处理是将非甲基化的胞嘧啶变成尿嘧啶,而甲基化的胞嘧啶则保持不变,然后再将尿嘧啶转化为胸腺嘧啶,最后进行芯片杂交;最后根据荧光颜色判断加入碱基的类型,进而确定该位点是否被甲基化。
本发明提供了一种肝癌筛查的方法,其包括:
检测标志物的甲基化水平,以及
基于所述甲基化水平来判断受试者罹患肝癌的风险,所述标志物选自下述中的一种:ITPKB、ENDOD1、LDHB、ALDH1A2、RNF135、ADGRE5和PTPN18。
实施例
本发明对试验中所用到的材料以及试验方法进行一般性和/或具体的描述,在下面的实施例中,如果无其他特别的说明,%表示wt%,即重量百分数。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规试剂产品。
实施例1筛选标志物
1)样本搜集:下载TCGA中450k甲基化芯片癌组织数据,共涉及26种肿瘤7769个癌组织样本,其中包括肾上腺皮质癌(80)、膀胱尿路上皮癌(409)、急性髓细胞样白血病(140)、脑低级别胶质瘤(654)、乳腺癌(740)、宫颈癌(286)、肝癌(348)、食管癌(183)、葡萄膜黑色素瘤(80)、头颈鳞状细胞癌(527)、肾癌(660)、肝癌(377)、肺腺癌(425)、肺鳞癌(372)、弥漫性大B细胞淋巴瘤(29)、卵巢浆液性囊腺癌(10)、胰腺癌(184)、间皮瘤(116)、前列腺癌(488)、皮肤黑色素瘤(104)、肉瘤(117)、胃癌(397)、睾丸癌(134)、胸腺癌(94)、甲状腺癌(506)、子宫内膜癌(309)。针对健康人群,博尔诚搜集38例健康人的血浆,进而进行全基因组甲基化测序(Whole Genome Bisulfite Sequencing,WGBS)。
2)候选标志物筛选:针对健康血浆样本,计算对应450K对应区域的每个探针β值第三四分位数(Q3),又称"较大四分位数",筛选Q3<0.02的位点,结果为List1。针对450K芯片组织数据,计算对应450K对应区域的每个探针β值第一四分位数(Q1),Q1又称"较小四分位数",筛选Q1>0.1的位点,结果为List2。取List1和List2交集得到65739个差异甲基化区域
3)标志物选择:在上述标志物中选择肝癌特有的标志物,得到17个标志物。同时要求,TCGA中450k芯片肝癌组织(377)与癌旁组织(53)的甲基化水平的差值大于0.2,最终得到15个差异甲基化区域.
4)标志物验证:针对上述的15个差异甲基化区域设计探针捕获,利用博尔诚血浆样本数据(肝癌样本个数=15,健康人样本个数=15)进行验证,最终得到9个能区分开肝癌与健康人的标志物。其序列分别为SEQ ID NO:1-SEQ ID NO:9所示。
根据所得到的靶序列区域,定制探针组合物(panel),其包括高甲基化的第一探针组合物和低甲基化的第二探针组合物,其中,针对每个marker,第一探针组合物包括两个探针,对于SEQ ID NO:1,其第一探针组合物包括如SEQ ID NO:10-11所示的核苷酸序列;对于SEQ ID NO:2,其第一探针组合物包括如SEQ ID NO:12-13所示的核苷酸序列;对于SEQ IDNO:3,其第一探针组合物包括如SEQ ID NO:14-15所示的核苷酸序列;对于SEQ ID NO:4,其第一探针组合物包括如SEQ ID NO:16-17所示的核苷酸序列;对于SEQ ID NO:5,其第一探针组合物包括如SEQ ID NO:18-19所示的核苷酸序列;对于SEQ ID NO:6,其第一探针组合物包括如SEQ ID NO:20-21所示的核苷酸序列;对于SEQ ID NO:7,其第一探针组合物包括如SEQ ID NO:22-23所示的核苷酸序列;对于SEQ ID NO:8,其第一探针组合物包括如SEQID NO:24-25所示的核苷酸序列;对于SEQ ID NO:9,其第一探针组合物包括如SEQ ID NO:26-27所示的核苷酸序列;
第二探针组合物包括两个探针,其中,对于SEQ ID NO:1,其第二探针组合物包括如SEQ ID NO:28-29所示的核苷酸序列;对于SEQ ID NO:2,其第二探针组合物包括如SEQID NO:30-31所示的核苷酸序列;对于SEQ ID NO:3,其第二探针组合物包括如SEQ ID NO:32-33所示的核苷酸序列;对于SEQ ID NO:4,其第二探针组合物包括如SEQ ID NO:34-35所示的核苷酸序列;对于SEQ ID NO:5,其第二探针组合物包括如SEQ ID NO:36-37所示的核苷酸序列;对于SEQ ID NO:6,其第二探针组合物包括如SEQ ID NO:38-39所示的核苷酸序列;对于SEQ ID NO:7,其第二探针组合物包括如SEQ ID NO:40-41所示的核苷酸序列;对于SEQ ID NO:8,其第二探针组合物包括如SEQ ID NO:42-43所示的核苷酸序列;对于SEQ IDNO:9,其第二探针组合物包括如SEQ ID NO:44-45所示的核苷酸序列;
然后在血浆样本中验证,其实验检测方法如下:
1.1.cfDNA提取纯化
1.1.1.血浆样本制备:
4℃、2000g离心血液样本10min,将血浆转移到一个新的离心管中。4℃、16000g离心血浆样本10min,根据使用的收集管类型,执行下一步,本实验中使用的收集管类型为其他。
表1
1.1.2.裂解和结合
1.1.2.1.按照下表2准备结合溶液/珠子混合物,然后彻底混匀。
表2
加入适量体积的血浆样品。
1.1.2.2.彻底混匀血浆样品和结合溶液/珠子混合物。
1.1.2.3.在旋转混匀仪上充分的结合10min,使cfDNA结合到磁珠上。
1.1.2.4.将结合管放在磁力架上5min,直到溶液变得澄清,磁珠完全吸附在磁力架上。
1.1.2.5.用移液管小心的弃去上清,继续保持管子在磁力架上几分钟,用移液管移去残留上清。
1.1.3.洗涤
1.1.3.1.将珠子重悬在1ml洗涤溶液中。
1.1.3.2.将重悬液转移到新的无吸附1.5ml离心管中。保留结合管。
1.1.3.3.将含有珠子重悬液的离心管置于磁力架上,20s。
1.1.3.4.将分离得到的上清,吸出洗涤结合管,将清洗后的残留珠子再次收集到重悬液中,弃掉裂解/结合管。
1.1.3.5.管子置于磁力架上2min,直到溶液变得澄清,珠子聚集在磁力架,用1ml移液器移除上清。
1.1.3.6.管子留在磁力架上,用200μL移液器尽可能移除残留的液体。
1.1.3.7.将管子从磁力架取下来,加入1ml洗涤溶液,涡旋30s。
1.1.3.8.置于磁力架2min,直到溶液澄清,珠子聚集在磁力架上,用1ml移液管移除上清。
1.1.3.9.管子留在磁力架上,用200μL移液器彻底移除残留液体。
1.1.3.10.将管子从磁力架取下,加入1ml 80%乙醇,涡旋30s。
1.1.3.11.置于磁力架上2min,溶液变得澄清,用1ml移液器移去上清。
1.1.3.12.管子留在磁力架上,用200μL移液器移去残留液体。
1.1.3.13.用80%乙醇重复上述1.1.3.10.-1.1.3.12.步骤一次,尽可能除去上清。
1.1.3.14.管子留在磁力架上,空气中干燥珠子3~5分钟。
1.1.4.洗脱cfDNA
1.1.4.1.按照下表3加入洗脱液。
表3
1.1.4.2.涡旋5min,置于磁力架上2min,溶液变得澄清,吸取上清液中的cfDNA。
1.1.4.3.纯化的cfDNA立即使用,或者将上清转移至新的离心管中,-20℃保存。
1.2.gDNA打断与纯化:
1.2.1.按照Qubit浓度,取2μg gDNA,加水补至125μl,加入到covaris 130μl打断管中,设置程序:50W,20%,200个循环,250s。
1.2.2.打断结束后取1μl样品使用Agilent2100进行片段检测,正常打断后样品检测主峰约在150bp-200bp。
对于cfDNA样品,Agilent2100进行片段检测,直接Qubit用于后续的实验。
1.3.末端修复、3‘端加“A”:
1.3.1.取20ng打断后的gDNA或cfDNA至PCR管中,用无核酸酶水补至50μl,加入以下表4中试剂,涡旋混匀:
表4
组分 | 体积 |
gDNA/cfDNA | 50μl |
终止修复和A加尾缓冲液 | 7μl |
终止修复和A加尾酶混合物 | 3μl |
总体积 | 60μl |
1.3.2.设置以下如表5的程序在PCR仪上进行反应:热盖温度85℃。
表5
1.4.接头连接及纯化:
1.4.1.参照下表6将接头提前稀释成合适的浓度:
表6
每50ul ER和AT反应的片段化的DNA | 接头浓度 |
1μg | 10uM |
500ng | 10uM |
250ng | 10uM |
100ng | 10uM |
50ng | 10uM |
25ng | 10uM |
10ng | 3uM |
5ng | 5uM |
2.5ng | 2.5uM |
1ng | 625nM |
1.4.2.按下表7配制以下试剂,轻轻吸打混匀,短暂离心:
表7
组分 | 体积 |
末端修复、加“A”反应产物 | 60μl |
接头 | 5μl |
无核酸酶水 | 5μl |
连接缓冲液 | 30μl |
DNA连接酶 | 10μl |
总体积 | 110μl |
1.4.3.设置以下表8中程序在PCR仪上进行反应:无热盖。
表8
温度 | 时间 |
20℃ | 30min |
4℃ | ∞ |
1.4.4.按照以下表9中体系,加入纯化磁珠进行实验(Agencourt AMPure XP磁珠提前拿至室温震荡混合均匀备用):
表9
组分 | 体积 |
接头连接产物 | 110μl |
Agencourt AMPure XP珠子 | 110μl |
总体积 | 220μl |
1.4.4.1.轻轻吸打混匀6次。
1.4.4.2.室温静置孵育5-15min,将PCR管置于磁力架上3min使溶液澄清。
1.4.4.3.移除上清,PCR管继续放置在磁力架上,向PCR管内加入200μl80%乙醇溶液,静置30s。
1.4.4.4.移除上清,再向PCR管内加入200μl 80%乙醇溶液,静置30s后彻底移除上清(建议使用10μl移液器移除底部残留乙醇溶液)。
1.4.4.5.室温静置3-5min,使残留乙醇彻底挥发。
1.4.4.6.加入22μl的无核酸酶水,把PCR管从磁力架取下,轻轻吸打重悬磁珠,避免产生气泡,室温静置2min。
1.4.4.7.将PCR管置于磁力架上2min使溶液澄清。
1.4.4.8.用移液器吸取20μl上清液,转移到新的PCR管。
1.5重亚硫酸盐处理及纯化:
1.5.1.预先拿出所需要的试剂,并溶解。根据下表10加入各试剂:
表10
组分 | 高浓度样品(1ng-2μg)体积 | 低浓度样品(1-500ng)体积 |
接头连接纯化产物 | 20μl | 40μl |
重亚硫酸盐溶液 | 85μl | 85μl |
DNA保护缓冲液 | 35μl | 15μl |
总体积 | 140μl | 140μl |
1.5.2.DNA保护缓冲液加入液体变成蓝色。轻轻吸打混匀,然后分成两管至于PCR仪上。
1.5.3.设置以下表11中程序,并运行:热盖105℃。
表11
温度 | 时间 |
95℃ | 5min |
60℃ | 10min |
95℃ | 5min |
60℃ | 10min |
4℃ | ∞ |
1.5.4.简短离心将两管相同样本合并至同一个干净的1.5ml离心管中。
1.5.5.每个样本中加入310μl缓冲液BL(样本量少于100ng加入1μl的载体RNA(1μg/μl)),涡旋混匀,简短离心。
1.5.6.加入250μl无水乙醇到每个样本中,涡旋混匀15s,简短离心,将混合液加入到准备好的对应的离心柱中。
1.5.7.静置1min,离心1min,将收集管中的液体重新转移到离心柱中,离心1min,弃去离心管的液体。
1.5.8.加入500μl缓冲液BW(注意是否加入无水乙醇),离心1min,弃去废液。
1.5.9.加入500μl缓冲液BD(注意是否加入无水乙醇),盖好管盖,室温放置15min。离心1min,弃去离心下的液体。
1.5.10.加入500μl缓冲液BW(注意是否加入无水乙醇),离心1min,弃去离下来的液体,在重复一次,共2次。
1.5.11.加入250μl无水乙醇,离心1min,将离心柱放置到新的2ml收集管中,弃掉全部剩余液体。
1.5.12.将离心柱放置到干净的1.5ml离心管中,加入20μl无核酸酶水到离心柱膜中心,轻轻盖上管盖,室温放置1min,离心1min。
1.5.13.将收集管中的液体重新转移至离心柱中,室温放置1min,离心1min。
1.6.杂交前预扩增及纯化:
1.6.1.按下列表12配制反应体系,吹打混匀,短暂离心:
表12
1.6.2.设置以下表13程序并启动PCR程序:热盖105℃
表13
1.6.3.PCR循环数根据投入DNA的量不同进行调整,参考数据如下表14所示:
表14
1.6.4.向反应结束后的PCR管中加入50μl Agencourt AMPure XP磁珠,用移液器吹打混匀,避免产生气泡(Agencourt AMPure XP提前室温混匀并平衡)。
1.6.5.室温孵育5-15min,把PCR管置于磁力架上3min使溶液澄清。
1.6.6.移除上清,PCR管继续放置在磁力架上,向PCR管内加入200μl 80%乙醇溶液,静置30s。
1.6.7.移除上清,再向PCR管内加入200μl 80%乙醇溶液,静置30s后彻底移除上清(建议使用10μl移液器移除底部残留乙醇溶液)。
1.6.8.室温静置5min,使残留乙醇彻底挥发。
1.6.9.加入30μl的无核酸酶水,将离心管从磁力架取下,使用移液器,轻轻吸打重悬磁珠。
1.6.10.室温静置2min,将200μl PCR管置于磁力架上2min使溶液澄清。
1.6.11.用移液器将上清液转移到新的200μl PCR管中(置于冰盒上),在反应管上标记好样本号,准备下一步反应。
1.6.12.取1μl样品使用Qubit进行文库浓度测定,记录文库浓度。
1.6.13.取1μl样品使用安捷伦2100进行文库片段长度测定,文库长度约在270bp-320bp间。
1.7.样品与探针杂交:
1.7.1.按照以下表15中体系将样品文库与各种Hyb阻断物混匀,标记为B:
表15
组分 | 体积 |
预扩增产物 | 750ng对应体积 |
Hyb人阻断物 | 5μl |
接头阻断物 | 6μl |
增强剂 | 5μl |
1.7.2.将准备好的样品和Hyb阻断物混合物放入真空浓缩离心机,打开PCR管盖,启动离心机,打开真空泵开关,开始浓缩。
1.7.3.将抽干的样品重新溶在约9μl无核酸酶水中,总体积10μl,轻轻吸打混匀,短暂离心后置于冰上待用,标记为B。
1.7.4.将Hyb缓冲液置于室温融化,融解之后会有沉淀出现,混匀后置于65℃水浴锅内预热,完全溶解后(无沉淀及浑浊物)取20μl Hyb缓冲液置于新的200μl PCR管内,盖好管盖,标记为A,继续置于65℃水浴锅内孵育待用。
1.7.5.通过艾吉泰康生物科技(北京)有限公司合成之前所述的甲基化探针序列:
1.7.6.取5μl RNA酶阻断物与2μl探针组合物置于200μl PCR管内,轻轻吸打混匀,短暂离心后置于冰上待用,标记为C。
1.7.7.设置PCR仪参数,热盖100℃,95℃,5min;65℃,保持。
1.7.8.将PCR管B置于PCR仪上,运行以上程序。
1.7.9.PCR仪温度降至65℃时,将PCR管A置于PCR仪上孵育,盖上PCR仪热盖。
1.7.10. 5min后,将C置于PCR上孵育,盖上PCR仪热盖。
1.7.11.将PCR管C放置入PCR仪2min后,把移液器调至13μl,从PCR管A中吸取13μlHyb缓冲液移至PCR管C中,吸取全部PCR管B中样品移至PCR管C中,轻轻吸打10次,充分混匀,避免产生大量气泡,密封管盖,盖上PCR仪热盖,65℃孵育过夜(16-24h)。
1.8.捕获目标区域DNA文库:
1.8.1.捕获磁珠的准备
1.8.1.1.将磁珠(Dynabeads MyOne Streptavidin T1磁珠)从4℃取出,涡旋震荡重悬。
1.8.1.2.取50μl磁珠置于新的PCR管内,置于磁力架上1min使溶液澄清,移除上清。
1.8.1.3.从磁力架上取下PCR管,加入200μL结合缓冲液轻轻吸打数次混匀,重悬磁珠。
1.8.1.4.置磁力架上1min,移除上清。
1.8.1.5.重复步骤3-4两次,共清洗磁珠3次。
1.8.1.6.从磁力架上取下PCR管,加入200μL结合缓冲液轻轻吸打6次重悬磁珠待用。
1.8.2.捕获目标DNA文库
1.8.2.1.保持杂交产物PCR管C在PCR仪上,将准备好的200μL捕获磁珠加入到杂交后的产物PCR管C中,用移液器吸打6次混匀,置于旋转混匀仪上室温结合30min(转速最好不要超过10转/min)。
1.8.2.2.将PCR管置于磁力架上2min使溶液澄清,移除上清液。
1.8.2.3.向PCR管C内加入200μL的洗涤缓冲液1,轻轻吸打6次混匀,置于旋转混匀仪上清洗15min(转速最好不要超过10转/min),然后短暂离心,将PCR管放于磁力架上2min使溶液澄清,移除上清。
1.8.2.4.加入200μl的65℃预热后的洗涤缓冲液2,轻轻吸打6次混匀,置于混匀仪上65℃孵育10min,转速800转/min进行清洗。
1.8.2.5.短暂离心,将PCR管放于磁力架上2min,移除上清。使用洗涤缓冲液2再重复2次清洗,共计3次。最后一次彻底移除洗涤缓冲液2。
1.8.2.6.PCR管继续置于磁力架上,向PCR管内加入200μl 80%乙醇,静置30s后彻底移除乙醇溶液,室温晾干2min。
1.8.2.7.向PCR管加入30μL无核酸酶水,从磁力架上取下PCR管,轻轻吸打6次重悬磁珠待用。
1.9.捕获后扩增及纯化
1.9.1.根据下表16配制反应体系进行捕获文库的富集,轻轻吹打混匀后,短暂离心:
表16
1.9.2.设置以下表17中程序,将样品置于PCR仪中,运行程序:热盖105℃。
表17
1.9.3.PCR结束后向样品加入55μl Agencourt AMPure XP磁珠,用移液器轻轻吸打混匀。
1.9.4.室温孵育5min,把PCR管置于磁力架上3min使溶液澄清。
1.9.5.移除上清,PCR管继续置于磁力架上,加入200μl 80%无水乙醇,静置30s。
1.9.6.移除上清,再向PCR管内加入200μl 80%无水乙醇,静置30后彻底移除上清。
1.9.7.室温放置5min,使得残留乙醇彻底挥发。
1.9.8.加入25μl无核酸酶水,将PCR管从磁力架拿下,轻轻吹打混匀重悬磁珠,室温放置2min。
1.9.9.将PCR管置于磁力架上2min使溶液澄清。
1.9.10.用移液器吸23μl上清液转移到1.5ml离心管,标记样品信息。
1.9.11.取1μl文库使用Qubit进行定量,记录文库浓度。
1.9.12.取1μl样品使用Agilent2100进行文库片段长度测定。
1.9.13.使用Illumina高通量测序平台进行测序。
1.10.甲基化生信分析流程。大致如下:使用fastp质控软件查看测序质量,去除低质量的读段,然后采用Bismark比对软件将质控后的干净的数据比对到参考基因组上,采用Bismar_methylation_extractor软件提取相应的甲基化位点。最后,计算出靶区域的甲基化水平,该值结果如果超过阈值判读为癌症,如果低于阈值判读为正常。
实施例2
基于从北京地区收集15例经临床诊断为肝癌的样本和从北京地区收集的15例健康人样本,利用实施例1所述甲基化建库方法,计算筛选到的9个甲基化生物标志物的甲基化水平,根据该9个甲基化生物标志物在肝癌样本和正常人样本数据集中的甲基化水平计算其阈值(以下简称位点或者marker)及独立区分的AUC值见表18;
其中甲基化水平阈值计算方法为:根据数据集(包含每个样本的类型和甲基化水平)绘制ROC曲线,ROC曲线上的最佳阈值点所对应的混淆矩阵将是我们计算敏感度(sensitivity)、特异度(specificity)以及准确度等指标的依据。通常情况下我们会通过约登指数(Youden index)进行选择。约登指数也称正确指数,是指敏感度和特异度之和减去1:Youden index=Sensitivity+Specificity–1。约登指数指数范围取值介于0-1之间,代表分类模型发现真正病人与非病人的总能力。约登指数越大,表示分类模型性能越好:
表18 14个甲基化标志物的具体表现数据
SEQ ID | 阈值 | Specificity | Sensitivity | AUC |
SEQ ID NO.1 | 0.13 | 0.87 | 0.87 | 0.82 |
SEQ ID NO.2 | 0.25 | 0.96 | 0.75 | 0.83 |
SEQ ID NO.3 | 0.13 | 0.91 | 0.81 | 0.94 |
SEQ ID NO.4 | 0.33 | 0.93 | 0.89 | 0.92 |
SEQ ID NO.5 | 0.27 | 0.76 | 0.93 | 0.92 |
SEQ ID NO.6 | 0.25 | 0.88 | 0.89 | 0.90 |
SEQ ID NO.7 | 0.12 | 0.79 | 0.94 | 0.86 |
SEQ ID NO.8 | 0.37 | 0.81 | 0.84 | 0.88 |
SEQ ID NO.9 | 0.11 | 0.91 | 0.86 | 0.88 |
实施例3
6例人样本(S1-3为健康人样本,S4-6为肝癌患者样本),采用本申请的甲基化标志物检测方法,按实施例1的方法采集外周血;建库,并通过Illumina平台测序;测序数据经上述生物信息的分析流程,得到每个标志物的甲基化水平,根据每个标志物的阈值,预测所述患者的患病情况,如果超过阈值为癌症样本,如果低于阈值为健康人样本,具体结果如下表19:
其中判读结果,0代表分类为正常,即健康;1代表分类为异常,即肿瘤。
表19
综上所述,本发明的发明人获得了与肝癌相关的甲基化基因,并确定了肝癌甲基化基因发生甲基化异常的靶序列,并且,通过这个甲基化基因的靶序列,能够灵敏和特异地检测该基因的甲基化的状态,从而可以用于对外周血游离DNA的检测,并且本发明所述的组合物能够实现实时监测,具有更高的灵敏度和准确度。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。
序列表如表20:
表20
序列表
<110> 博尔诚(北京)科技有限公司
<120> 用于肝癌筛查的标志物、探针组合物及其应用
<130> PE02008
<160> 81
<170> PatentIn version 3.5
<210> 1
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 1
ttacctgcag tttctcagat tctcaggtcc tgtgtagact acatgcccag aggcgcaaac 60
<210> 2
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 2
tgacgcgact gcgggcctca gccaatgggc gtgccactgc ccgtccgctc ttcagcagcc 60
<210> 3
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 3
cattcctgaa tggtgaagag cttgatacag agaccctgga gaccgttcag atccgcagaa 60
<210> 4
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 4
ccgcacgtcc catcaggctt gcctgtgggc caggattcag ggtcctgagc cgaaacctac 60
<210> 5
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 5
gctgccgtgt ggtaagagtg acatctggtg gctgccatgc tcaggctcag tgctcttcca 60
<210> 6
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 6
tggcccgcca cgctgccctg cggccacagc ttctgccgcc actgcctgga ggccctgtgg 60
<210> 7
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 7
cgccgcgccg cacgcgagat acaggcgggc tccgaccctg cccactgccc ctgcccgggc 60
<210> 8
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 8
tggtgtctgt ggggcctgcg atagaggaag ccacatggtc aagcaggcac tcacgggcac 60
<210> 9
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 9
cctcccggcc ctccctgcct gcaggagcat ctctgtgccc gggtccccgg gccacgccat 60
<210> 10
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 10
ttacttttaa aaccatctcg tccctacgaa atttacgcct ctaaacatat aatctacaca 60
aaacctaaaa atctaaaaaa ctacaaataa atttaacgac cttttaa 107
<210> 11
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 11
aaaacgaaaa ccattaaaaa accgccaaac ttacctacaa tttctcaaat tctcaaatcc 60
tatataaact acatacccaa aaacgcaaac ctcgtaaaaa cgaaataact ttaaaaataa 120
<210> 12
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 12
tcttcactcg cttttccacc gcccgcgacc gactactaaa aaacgaacga acaataacac 60
gcccattaac taaaacccgc aatcgcgtca accgaccccg accgcacctc gcgacgtaac 120
<210> 13
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 13
atcacgtcgc gaaatacgat cgaaaccgac taacgcgact acgaacctca accaataaac 60
gtaccactac ccgtccgctc ttcaacaacc gatcgcgaac gataaaaaaa cgaataaaaa 120
<210> 14
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 14
acgaaaacct ataaacgccc aacctaaact ttctacgaat ctaaacgatc tccaaaatct 60
ctatatcaaa ctcttcacca ttcaaaaata aaacactacg aatatctact caaaaataca 120
<210> 15
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 15
tacatttcta aacaaacatc cgcaatattt cattcctaaa taataaaaaa cttaatacaa 60
aaaccctaaa aaccgttcaa atccgcaaaa aacctaaact aaacgctcac aaaccttcgt 120
<210> 16
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 16
acaaaaatct ccaaaacctt ctctctccta ataaatttcg actcaaaacc ctaaatccta 60
acccacaaac aaacctaata aaacgtacga aataatactt atataaaaaa acgcgaaaaa 120
<210> 17
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 17
cttcccgcgt ctccccatac aaatactacc ccgcacgtcc catcaaactt acctataaac 60
caaaattcaa aatcctaaac cgaaacctac caaaaaaaaa aaaactctaa aaacctctat 120
<210> 18
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 18
cgaaatcctc cattaccctt acaaaattaa taaaaaaaca ctaaacctaa acataacaac 60
caccaaatat cactcttacc acacgacaac gaaaatacta tactcgaccg ccctcacaat 120
<210> 19
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 19
actataaaaa cgaccgaata caacatcctc gctaccgtat aataaaaata acatctaata 60
actaccatac tcaaactcaa tactcttcca tcaaccctac aaaaacaata aaaaacttcg 120
<210> 20
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 20
acaaacccaa cgacgaacgt cgcgaacgcc ccacaaaacc tccaaacaat aacgacaaaa 60
actataaccg caaaacaacg taacgaacca atccaacaac ccctaacaaa taatacaacc 120
<210> 21
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 21
aactacatca tctaccaaaa actactaaac taacccgcca cgctacccta cgaccacaac 60
ttctaccgcc actacctaaa aaccctataa aacgcccgcg acgcccgccg ctaaacctac 120
<210> 22
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 22
cctcgcgacc gcgctaaaaa aaaaactaaa acccgaacaa aaacaataaa caaaatcgaa 60
acccgcctat atctcgcgta cgacgcgacg atacttatcg accaaatcct acaataacgt 120
<210> 23
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 23
acgctactac aaaacctaac cgacaaatac cgccgcgccg cacgcgaaat acaaacgaac 60
tccgacccta cccactaccc ctacccgaac tccaattccc tctccaacgc gaccgcgaaa 120
<210> 24
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 24
tacccaaaca ccaccaaccc ctctcgccgt atacccgtaa atacctactt aaccatataa 60
cttcctctat cgcaaacccc acaaacacca acgacgcctc ccgtttctca aacgcaacca 120
<210> 25
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 25
taactacgtc taaaaaacga aaaacgccgc taatatctat aaaacctacg ataaaaaaaa 60
ccacataatc aaacaaacac tcacgaacac acgacgaaaa aaactaataa tacttaaaca 120
<210> 26
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 26
cgcttctaca ccaccgcgta aatatcaacc ataacgtaac ccgaaaaccc gaacacaaaa 60
atactcctac aaacaaaaaa aaccgaaaaa aaataaaacg acgacgctaa acaaaacgaa 120
<210> 27
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 27
cccgccctac ccaacgccgc cgtttcactt cctcccgacc ctccctacct acaaaaacat 60
ctctataccc gaatccccga accacgccat aactaacacc tacgcgataa tacaaaaacg 120
<210> 28
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 28
ttacttttaa aaccatctca tccctacaaa atttacacct ctaaacatat aatctacaca 60
aaacctaaaa atctaaaaaa ctacaaataa atttaacaac cttttaataa ctctcacctc 120
<210> 29
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 29
aaaacaaaaa ccattaaaaa accaccaaac ttacctacaa tttctcaaat tctcaaatcc 60
tatataaact acatacccaa aaacacaaac ctcataaaaa caaaataact ttaaaaataa 120
<210> 30
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 30
tcttcactca cttttccacc acccacaacc aactactaaa aaacaaacaa acaataacac 60
acccattaac taaaacccac aatcacatca accaacccca accacacctc acaacataac 120
<210> 31
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 31
atcacatcac aaaatacaat caaaaccaac taacacaact acaaacctca accaataaac 60
ataccactac ccatccactc ttcaacaacc aatcacaaac aataaaaaaa caaataaaaa 120
<210> 32
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 32
acaaaaacct ataaacaccc aacctaaact ttctacaaat ctaaacaatc tccaaaatct 60
ctatatcaaa ctcttcacca ttcaaaaata aaacactaca aatatctact caaaaataca 120
<210> 33
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 33
tacatttcta aacaaacatc cacaatattt cattcctaaa taataaaaaa cttaatacaa 60
aaaccctaaa aaccattcaa atccacaaaa aacctaaact aaacactcac aaaccttcat 120
<210> 34
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 34
acaaaaatct ccaaaacctt ctctctccta ataaatttca actcaaaacc ctaaatccta 60
acccacaaac aaacctaata aaacatacaa aataatactt atataaaaaa acacaaaaaa 120
<210> 35
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 35
cttcccacat ctccccatac aaatactacc ccacacatcc catcaaactt acctataaac 60
caaaattcaa aatcctaaac caaaacctac caaaaaaaaa aaaactctaa aaacctctat 120
<210> 36
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 36
caaaatcctc cattaccctt acaaaattaa taaaaaaaca ctaaacctaa acataacaac 60
caccaaatat cactcttacc acacaacaac aaaaatacta tactcaacca ccctcacaat 120
<210> 37
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 37
actataaaaa caaccaaata caacatcctc actaccatat aataaaaata acatctaata 60
actaccatac tcaaactcaa tactcttcca tcaaccctac aaaaacaata aaaaacttca 120
<210> 38
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 38
acaaacccaa caacaaacat cacaaacacc ccacaaaacc tccaaacaat aacaacaaaa 60
actataacca caaaacaaca taacaaacca atccaacaac ccctaacaaa taatacaacc 120
<210> 39
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 39
aactacatca tctaccaaaa actactaaac taacccacca cactacccta caaccacaac 60
ttctaccacc actacctaaa aaccctataa aacacccaca acacccacca ctaaacctac 120
<210> 40
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 40
cctcacaacc acactaaaaa aaaaactaaa acccaaacaa aaacaataaa caaaatcaaa 60
acccacctat atctcacata caacacaaca atacttatca accaaatcct acaataacat 120
<210> 41
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 41
acactactac aaaacctaac caacaaatac caccacacca cacacaaaat acaaacaaac 60
tccaacccta cccactaccc ctacccaaac tccaattccc tctccaacac aaccacaaaa 120
<210> 42
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 42
tacccaaaca ccaccaaccc ctctcaccat atacccataa atacctactt aaccatataa 60
cttcctctat cacaaacccc acaaacacca acaacacctc ccatttctca aacacaacca 120
<210> 43
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 43
taactacatc taaaaaacaa aaaacaccac taatatctat aaaacctaca ataaaaaaaa 60
ccacataatc aaacaaacac tcacaaacac acaacaaaaa aaactaataa tacttaaaca 120
<210> 44
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 44
cacttctaca ccaccacata aatatcaacc ataacataac ccaaaaaccc aaacacaaaa 60
atactcctac aaacaaaaaa aaccaaaaaa aaataaaaca acaacactaa acaaaacaaa 120
<210> 45
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 45
cccaccctac ccaacaccac catttcactt cctcccaacc ctccctacct acaaaaacat 60
ctctataccc aaatccccaa accacaccat aactaacacc tacacaataa tacaaaaaca 120
<210> 46
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 46
ttatttgtag ttttttagat ttttaggttt tgtgtagatt atatgtttag aggcgtaaat 60
<210> 47
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 47
gtttgcgttt ttgggtatgt agtttatata ggatttgaga atttgagaaa ttgtaggtaa 60
<210> 48
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 48
tgacgcgatt gcgggtttta gttaatgggc gtgttattgt tcgttcgttt tttagtagtt 60
<210> 49
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 49
ggttgttgaa gagcggacgg gtagtggtac gtttattggt tgaggttcgt agtcgcgtta 60
<210> 50
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 50
tatttttgaa tggtgaagag tttgatatag agattttgga gatcgtttag attcgtagaa 60
<210> 51
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 51
ttttgcggat ttgaacggtt tttagggttt ttgtattaag ttttttatta tttaggaatg 60
<210> 52
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 52
tcgtacgttt tattaggttt gtttgtgggt taggatttag ggttttgagt cgaaatttat 60
<210> 53
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 53
gtaggtttcg gtttaggatt ttgaattttg gtttataggt aagtttgatg ggacgtgcgg 60
<210> 54
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 54
gttgtcgtgt ggtaagagtg atatttggtg gttgttatgt ttaggtttag tgttttttta 60
<210> 55
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 55
tggaagagta ttgagtttga gtatggtagt tattagatgt tatttttatt atacggtagt 60
<210> 56
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 56
tggttcgtta cgttgttttg cggttatagt ttttgtcgtt attgtttgga ggttttgtgg 60
<210> 57
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 57
ttatagggtt tttaggtagt ggcggtagaa gttgtggtcg tagggtagcg tggcgggtta 60
<210> 58
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 58
cgtcgcgtcg tacgcgagat ataggcgggt ttcgattttg tttattgttt ttgttcgggt 60
<210> 59
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 59
gttcgggtag gggtagtggg tagggtcgga gttcgtttgt atttcgcgtg cggcgcggcg 60
<210> 60
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 60
tggtgtttgt ggggtttgcg atagaggaag ttatatggtt aagtaggtat ttacgggtat 60
<210> 61
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 61
gtgttcgtga gtgtttgttt gattatgtgg ttttttttat cgtaggtttt atagatatta 60
<210> 62
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 62
tttttcggtt ttttttgttt gtaggagtat ttttgtgttc gggttttcgg gttacgttat 60
<210> 63
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 63
atggcgtggt tcggggattc gggtatagag atgtttttgt aggtagggag ggtcgggagg 60
<210> 64
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 64
ttatttgtag ttttttagat ttttaggttt tgtgtagatt atatgtttag aggtgtaaat 60
<210> 65
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 65
gtttgtgttt ttgggtatgt agtttatata ggatttgaga atttgagaaa ttgtaggtaa 60
<210> 66
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 66
tgatgtgatt gtgggtttta gttaatgggt gtgttattgt ttgtttgttt tttagtagtt 60
<210> 67
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 67
ggttgttgaa gagtggatgg gtagtggtat gtttattggt tgaggtttgt agttgtgtta 60
<210> 68
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 68
tatttttgaa tggtgaagag tttgatatag agattttgga gattgtttag atttgtagaa 60
<210> 69
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 69
ttttgtggat ttgaatggtt tttagggttt ttgtattaag ttttttatta tttaggaatg 60
<210> 70
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 70
ttgtatgttt tattaggttt gtttgtgggt taggatttag ggttttgagt tgaaatttat 60
<210> 71
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 71
gtaggttttg gtttaggatt ttgaattttg gtttataggt aagtttgatg ggatgtgtgg 60
<210> 72
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 72
gttgttgtgt ggtaagagtg atatttggtg gttgttatgt ttaggtttag tgttttttta 60
<210> 73
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 73
tggaagagta ttgagtttga gtatggtagt tattagatgt tatttttatt atatggtagt 60
<210> 74
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 74
tggtttgtta tgttgttttg tggttatagt ttttgttgtt attgtttgga ggttttgtgg 60
<210> 75
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 75
ttatagggtt tttaggtagt ggtggtagaa gttgtggttg tagggtagtg tggtgggtta 60
<210> 76
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 76
tgttgtgttg tatgtgagat ataggtgggt tttgattttg tttattgttt ttgtttgggt 60
<210> 77
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 77
gtttgggtag gggtagtggg tagggttgga gtttgtttgt attttgtgtg tggtgtggtg 60
<210> 78
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 78
tggtgtttgt ggggtttgtg atagaggaag ttatatggtt aagtaggtat ttatgggtat 60
<210> 79
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 79
gtgtttgtga gtgtttgttt gattatgtgg ttttttttat tgtaggtttt atagatatta 60
<210> 80
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 80
ttttttggtt ttttttgttt gtaggagtat ttttgtgttt gggtttttgg gttatgttat 60
<210> 81
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:人工合成序列
<400> 81
atggtgtggt ttggggattt gggtatagag atgtttttgt aggtagggag ggttgggagg 60
Claims (11)
1.一种用于检测肝癌的标志物,所述标志物对应的基因选自下述中的一种:ITPKB、ENDOD1、LDHB、ALDH1A2、RNF135、ADGRE5和PTPN18。
2.根据权利要求1所述的标志物,其中,所述标志物的核苷酸序列选自如SEQ ID NO:1-SEQ ID NO:9所示的一种,优选所述标志物为甲基化后的标志物。
3.一种探针组合物,所述探针组合物包含靶向权利要求1或2所述标志物甲基化的探针。
4.根据权利要求3所述的探针组合物,其中,所述探针组合物包含高甲基化的第一探针组合物和低甲基化的第二探针组合物,所述第一探针组合物用于与经重亚硫酸盐转化的CG高甲基化的区域杂交,所述第二探针组合物用于与经重亚硫酸盐转化的CG低甲基化的区域杂交;
优选的,所述第一探针组合物包括n个探针,所述n个探针与经重亚硫酸盐转化的CG高甲基化的区域的正义链和反义链的每个核苷酸杂交;
优选的,所述第二探针组合物包括m个探针,所述m个探针与经重亚硫酸盐转化的CG低甲基化的区域的正义链和反义链的每个核苷酸杂交;
优选的,n和m均是1-10中的任意整数;
优选的,第n-1个探针和第n个探针之间有x1个核苷酸重叠,优选的,x1为0-100中的任意整数;
优选的,第m-1个探针和第m个探针之间有x2个核苷酸重叠,优选的,x2为0-100中的任意整数;
进一步优选的,所述第一探针组合物包括如SEQ ID NO:10-27中的一种或两种,所述第二探针组合物包括如SEQ ID NO:28-45中的一种或两种。
5.标志物在制备用于检测肝癌的试剂盒中的用途,所述标志物选自下述中的一种:ITPKB、ENDOD1、LDHB、ALDH1A2、RNF135、ADGRE5和PTPN18。
6.根据权利要求5所述的用途,其中,所述标志物的核苷酸序列选自如SEQ ID NO:1-9所示的一种,优选所述标志物为甲基化后的标志物;
优选的,所述探针组合物用于靶向肝癌的甲基化后的标志物;
优选的,所述探针组合物为权利要求3或4所述的探针组合物。
7.一种用于肝癌检测的组合物,所述组合物包括用于检测选自下述标志物中任一种甲基化的核酸:ITPKB、ENDOD1、LDHB、ALDH1A2、RNF135、ADGRE5和PTPN18。
8.根据权利要求7所述的组合物,其中,所述标志物的核苷酸序列选自如SEQ ID NO:1-SEQ ID NO:9所示的一种。
9.根据权利要求7或8所述的组合物,其中,所述核酸包括权利要求3或4所述的探针组合物;
优选的,所述核酸包括:
引物,所述引物为所述标志物的靶序列中的至少9个核苷酸的片段,所述片段包含至少一个CpG二核苷酸序列;
优选的,所述核酸还包括:
探针,所述探针为在中等严紧或严紧条件下与所述标志物的靶序列中的至少15个核苷酸片段杂交,所述片段包含至少一个CpG二核苷酸序列;
优选的,所述组合物还包括将标志物的靶序列的5位未甲基化胞嘧啶碱基转化为尿嘧啶的试剂;
优选的,所述用于检测标志物的靶序列甲基化的核酸还包括:
优先与处于非甲基化状态的靶序列结合的阻断剂。
10.一种试剂盒,其包含权利要求1或2所述的标志物或者权利要求3或4所述的探针组合物或者权利要求7-9中任一项所述的组合物。
11.一种芯片,其包含权利要求1或2所述的标志物或者权利要求3或4所述的探针组合物或者权利要求7或8所述的组合物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210055193.5A CN114369663A (zh) | 2022-01-18 | 2022-01-18 | 用于肝癌筛查的标志物、探针组合物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210055193.5A CN114369663A (zh) | 2022-01-18 | 2022-01-18 | 用于肝癌筛查的标志物、探针组合物及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114369663A true CN114369663A (zh) | 2022-04-19 |
Family
ID=81144526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210055193.5A Pending CN114369663A (zh) | 2022-01-18 | 2022-01-18 | 用于肝癌筛查的标志物、探针组合物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114369663A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140358448A1 (en) * | 2013-05-29 | 2014-12-04 | The University Of Tokyo | Computer readable medium for enabling a computer to carry out provision of information on hepatocellular carcinoma and marker and kit for obtaining information on hepatocellular carcinoma |
CN106222267A (zh) * | 2016-08-01 | 2016-12-14 | 博尔诚(北京)科技有限公司 | 检测肝癌的组合物及其用途 |
CN109609629A (zh) * | 2017-09-30 | 2019-04-12 | 博尔诚(北京)科技有限公司 | 用于检测肝癌的组合物及其用途 |
CN111386352A (zh) * | 2017-11-22 | 2020-07-07 | 乐彼代株式会社 | 利用基因的cpg甲基化变化评估肝癌的预后或者风险的方法 |
CN111676292A (zh) * | 2020-08-11 | 2020-09-18 | 圣湘生物科技股份有限公司 | 一种用于检测肝癌的组合物,试剂盒及其用途 |
WO2021075797A2 (ko) * | 2019-10-14 | 2021-04-22 | 주식회사 젠큐릭스 | 특정 유전자의 cpg 메틸화 변화를 이용한 간암 진단용 조성물 및 이의 용도 |
CN112899238A (zh) * | 2021-04-01 | 2021-06-04 | 中国药科大学 | 基于RNA-m6A修饰水平的化合物筛选细胞模型及其构建与应用 |
CN113249471A (zh) * | 2021-04-16 | 2021-08-13 | 杭州翱锐基因科技有限公司 | 一种用于检测肝癌的生物标志物组合 |
-
2022
- 2022-01-18 CN CN202210055193.5A patent/CN114369663A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140358448A1 (en) * | 2013-05-29 | 2014-12-04 | The University Of Tokyo | Computer readable medium for enabling a computer to carry out provision of information on hepatocellular carcinoma and marker and kit for obtaining information on hepatocellular carcinoma |
CN106222267A (zh) * | 2016-08-01 | 2016-12-14 | 博尔诚(北京)科技有限公司 | 检测肝癌的组合物及其用途 |
CN109609629A (zh) * | 2017-09-30 | 2019-04-12 | 博尔诚(北京)科技有限公司 | 用于检测肝癌的组合物及其用途 |
CN111386352A (zh) * | 2017-11-22 | 2020-07-07 | 乐彼代株式会社 | 利用基因的cpg甲基化变化评估肝癌的预后或者风险的方法 |
WO2021075797A2 (ko) * | 2019-10-14 | 2021-04-22 | 주식회사 젠큐릭스 | 특정 유전자의 cpg 메틸화 변화를 이용한 간암 진단용 조성물 및 이의 용도 |
CN111676292A (zh) * | 2020-08-11 | 2020-09-18 | 圣湘生物科技股份有限公司 | 一种用于检测肝癌的组合物,试剂盒及其用途 |
CN112899238A (zh) * | 2021-04-01 | 2021-06-04 | 中国药科大学 | 基于RNA-m6A修饰水平的化合物筛选细胞模型及其构建与应用 |
CN113249471A (zh) * | 2021-04-16 | 2021-08-13 | 杭州翱锐基因科技有限公司 | 一种用于检测肝癌的生物标志物组合 |
Non-Patent Citations (3)
Title |
---|
HSIAO CC等: "Accession NO: NG_029253.1 Homo sapiens adhesion G protein-coupled receptor E5 (ADGRE5), RefSeqGene on chromosome 19" * |
ILLUMINA INC.: "Illumina HumanMethylation450 BeadChip (HumanMethylation450_15017482)" * |
LU WEN等: "Genome-scale detection of hypermethylated CpG islands in circulating cell-free DNA of hepatocellular carcinoma patients", 《CELL RESEARCH》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110964826B (zh) | 一种结直肠癌抑癌基因甲基化高通量检测试剂盒及其应用 | |
CN118272525A (zh) | 用于胃癌筛查的标志物、探针组合物及其应用 | |
CN112662762A (zh) | 一种检测消化道5种肿瘤的探针组合物 | |
CN115176034A (zh) | 一种癌症基因甲基化检测系统和在该系统在中执行的癌症体外检测方法 | |
CN112662765A (zh) | 一种检测6种中国高发癌症的探针组合物 | |
CN112662763A (zh) | 一种检测常见两性癌症的探针组合物 | |
CN112662761A (zh) | 一种检测3种实质性器官肿瘤的探针组合物 | |
CN112662759A (zh) | 一种检测3种管腔性器官肿瘤的探针组合物 | |
CN117448450A (zh) | 用于结直肠癌筛查的标志物、探针组合物及其应用 | |
CN114231635B (zh) | 用于肺癌筛查的标志物、探针组合物及其应用 | |
CN114369663A (zh) | 用于肝癌筛查的标志物、探针组合物及其应用 | |
CN114507734B (zh) | 用于甲状腺癌筛查的标志物、探针组合物及其应用 | |
CN115279924A (zh) | 一种检测11种癌症的探针组合物 | |
CN114540497B (zh) | 用于膀胱癌筛查的标志物、探针组合物及其应用 | |
CN114369664B (zh) | 用于胰腺癌筛查的标志物、探针组合物及其应用 | |
CN114703281B (zh) | 用于睾丸癌筛查的标志物、探针组合物及其应用 | |
CN114317734B (zh) | 用于肺癌筛查的组合物及其应用 | |
CN114410792B (zh) | 用于肾癌筛查的标志物、探针组合物及其应用 | |
CN114395628B (zh) | 用于结直肠癌筛查的标志物、探针组合物及其应用 | |
CN114395626B (zh) | 用于宫颈癌筛查的标志物、探针组合物及其应用 | |
CN114369661B (zh) | 用于乳腺癌筛查的标志物、探针组合物及其应用 | |
CN118048451A (zh) | 用于肝癌筛查的标志物、探针组合物及其应用 | |
CN116024342A (zh) | 用于检测宫颈癌或癌前病变的核酸产品、试剂盒及应用 | |
CN118685508A (zh) | 用于检测食管癌的标志物、探针组合物及其应用 | |
CN117625782A (zh) | 用于肺癌早期筛查的标志物、探针组合物及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |