CN105263944B - 基因突变体及其应用 - Google Patents
基因突变体及其应用 Download PDFInfo
- Publication number
- CN105263944B CN105263944B CN201380074760.0A CN201380074760A CN105263944B CN 105263944 B CN105263944 B CN 105263944B CN 201380074760 A CN201380074760 A CN 201380074760A CN 105263944 B CN105263944 B CN 105263944B
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- mutation
- hnf1a
- sample
- adult
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010064571 Gene mutation Diseases 0.000 title description 23
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 85
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 82
- 230000035772 mutation Effects 0.000 claims abstract description 74
- 206010012601 Diabetes mellitus Diseases 0.000 claims abstract description 71
- 239000012472 biological sample Substances 0.000 claims abstract description 64
- 238000000926 separation method Methods 0.000 claims abstract description 24
- 229920001184 polypeptide Polymers 0.000 claims abstract description 19
- 102200054501 PRKAG3 G113V Human genes 0.000 claims abstract 3
- 229920003013 deoxyribonucleic acid Polymers 0.000 claims description 23
- 230000000869 mutational Effects 0.000 claims description 11
- 102200107958 TP53 K120E Human genes 0.000 claims description 8
- 102220441479 HAGH W113L Human genes 0.000 claims description 6
- 102000009824 Hepatocyte Nuclear Factor 1-alpha Human genes 0.000 claims description 6
- 108010020382 Hepatocyte Nuclear Factor 1-alpha Proteins 0.000 claims description 6
- 239000003153 chemical reaction reagent Substances 0.000 claims description 6
- 102220058698 rs199641124 Human genes 0.000 abstract 1
- 102220081827 rs863223968 Human genes 0.000 abstract 1
- 102100016995 HNF1A Human genes 0.000 description 84
- 101700018864 HNF1A Proteins 0.000 description 84
- 239000000523 sample Substances 0.000 description 74
- 229920001850 Nucleic acid sequence Polymers 0.000 description 46
- 238000006243 chemical reaction Methods 0.000 description 17
- 230000001058 adult Effects 0.000 description 16
- 102100016992 HNF4A Human genes 0.000 description 11
- 101700059151 HNF4A Proteins 0.000 description 11
- 208000001072 Type 2 Diabetes Mellitus Diseases 0.000 description 11
- 238000001514 detection method Methods 0.000 description 11
- 201000010099 disease Diseases 0.000 description 11
- 238000000605 extraction Methods 0.000 description 11
- 201000006950 maturity-onset diabetes of the young Diseases 0.000 description 11
- 229920000160 (ribonucleotides)n+m Polymers 0.000 description 10
- 229920002676 Complementary DNA Polymers 0.000 description 9
- 230000003321 amplification Effects 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 9
- 238000003199 nucleic acid amplification method Methods 0.000 description 9
- 230000001717 pathogenic Effects 0.000 description 9
- 239000000560 biocompatible material Substances 0.000 description 7
- 239000002253 acid Substances 0.000 description 6
- 102200072912 DPYD R235W Human genes 0.000 description 5
- 206010018473 Glycosuria Diseases 0.000 description 5
- 150000001413 amino acids Chemical group 0.000 description 5
- 230000000875 corresponding Effects 0.000 description 5
- 229920000665 Exon Polymers 0.000 description 4
- 230000000295 complement Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000004907 flux Effects 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 238000010839 reverse transcription Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 3
- 230000003907 kidney function Effects 0.000 description 3
- 238000007854 ligation-mediated PCR Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 210000004369 Blood Anatomy 0.000 description 2
- 241001269238 Data Species 0.000 description 2
- 102000006754 Hepatocyte Nuclear Factor 1 Human genes 0.000 description 2
- 108010086512 Hepatocyte Nuclear Factor 1 Proteins 0.000 description 2
- 102000012046 Hepatocyte Nuclear Factor 1-beta Human genes 0.000 description 2
- 108010061414 Hepatocyte Nuclear Factor 1-beta Proteins 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 108020004999 Messenger RNA Proteins 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 229920002106 messenger RNA Polymers 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000000376 reactant Substances 0.000 description 2
- 238000005185 salting out Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 1
- 210000000349 Chromosomes Anatomy 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 101700021943 GCK Proteins 0.000 description 1
- 208000002705 Glucose Intolerance Diseases 0.000 description 1
- 240000004282 Grewia occidentalis Species 0.000 description 1
- 210000003734 Kidney Anatomy 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- 210000000265 Leukocytes Anatomy 0.000 description 1
- 102100009741 MAP4K2 Human genes 0.000 description 1
- 101710038957 MAP4K2 Proteins 0.000 description 1
- 208000005276 Mason-Type Diabetes Diseases 0.000 description 1
- 102000003505 Myosin family Human genes 0.000 description 1
- 108060008487 Myosin family Proteins 0.000 description 1
- 208000009928 Nephrosis Diseases 0.000 description 1
- 206010029164 Nephrotic syndrome Diseases 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 229920000272 Oligonucleotide Polymers 0.000 description 1
- 240000004678 Panax pseudoginseng Species 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 206010068033 Renal fusion anomaly Diseases 0.000 description 1
- 229920001914 Ribonucleotide Polymers 0.000 description 1
- 210000002966 Serum Anatomy 0.000 description 1
- 210000003491 Skin Anatomy 0.000 description 1
- 210000002700 Urine Anatomy 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 102000004965 antibodies Human genes 0.000 description 1
- 108090001123 antibodies Proteins 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 210000004027 cells Anatomy 0.000 description 1
- 238000005039 chemical industry Methods 0.000 description 1
- 230000001447 compensatory Effects 0.000 description 1
- 230000001186 cumulative Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002068 genetic Effects 0.000 description 1
- 235000005035 ginseng Nutrition 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000002641 glycemic Effects 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000003345 hyperglycaemic Effects 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 238000009114 investigational therapy Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006011 modification reaction Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 231100001027 nephrosis Toxicity 0.000 description 1
- 230000000926 neurological Effects 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 238000010827 pathological analysis Methods 0.000 description 1
- 230000002093 peripheral Effects 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000000268 renotropic Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001225 therapeutic Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 102000003995 transcription factors Human genes 0.000 description 1
- 108090000464 transcription factors Proteins 0.000 description 1
- 230000002103 transcriptional Effects 0.000 description 1
Abstract
提供了分离的核酸、分离的多肽、筛选易感青年人中的成年发病型糖尿病的生物样品的方法、筛选易感青年人中的成年发病型糖尿病的生物样品的系统以及用于筛选易感青年人中的成年发病型糖尿病的生物样品的试剂盒。其中,该分离的核酸,与SEQ ID NO:1相比具有c.703C>T突变,或者与SEQ ID NO:3相比具有选自下列的至少一种突变:c.338G>T和c.358A>G。
Description
优先权信息
无
技术领域
本发明涉及基因突变体及其应用。具体地,本发明涉及分离的核酸、分离的多肽、筛选易感青年人中的成年发病型糖尿病的生物样品的方法、筛选易感青年人中的成年发病型糖尿病的生物样品的系统以及用于筛选易感青年人中的成年发病型糖尿病的生物样品的试剂盒。
背景技术
青年人中的成年发病型糖尿病(maturity onset diabetes of the young,MODY),是一组具有高度遗传及临床表型异质性的单基因疾病。1975年由Fajans和Tattersall依据1950年以来系列报道分析并命名,并总结其以下临床特征:(1)累及3代或以上家族成员,呈常染色体显性遗传,而与人类白细胞抗原(HLA)无关;(2)家族中一般有2个以上患者在25岁以前发病;(3)外显率高,可超过90%;(4)病程进展缓慢,在青年期可以无症状或仅表现为糖耐量减低;(5)一般无酮症酸中毒,至少在发病2年内不依赖胰岛素治疗。
现阶段,寻找致病基因对疾病诊断或治疗意义重大。虽然目前已发现一些青年人中的成年发病型糖尿病的致病基因,例如GCK、HNF1A、HNF4A、HNF1B基因,但仍存在着相当一部分未知致病基因位点。
因而,目前对青年人中的成年发病型糖尿病的研究仍有待深入。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出一种能够有效筛选易感青年人中的成年发病型糖尿病的生物样品的方法。
本发明是基于发明人的下列工作而完成的:发明人通过高通量外显子组测序联合候选基因突变验证的方法确定了青年人中的成年发病型糖尿病的致病基因上的新突变。
根据本发明的第一方面,本发明提出了一种分离的核酸。根据本发明的实施例,与SEQ ID NO:1相比,该核酸具有c.703C>T突变;或者与SEQ ID NO:3相比,该核酸具有选自下列的至少一种突变:c.338G>T和c.358A>G。根据本发明的实施例,发明人确定了HNF1B和HNF1A基因突变体,这些新突变体与青年人中的成年发病型糖尿病的发病密切相关,从而通过检测这些新突变体在生物样品中是否存在,可以有效地检测生物样品是否易感青年人中的成年发病型糖尿病。
根据本发明的第二方面,本发明提出了一种分离的多肽。根据本发明的实施例,与SEQ ID NO:2相比,该分离的多肽具有p.Arg235Trp突变;或者与SEQ ID NO:4相比,该分离的多肽具有选自下列的至少一种突变:p.Trp113Leu和p.Lys120Glu。通过检测生物样品中是否表达该多肽,可以有效地检测生物样品是否易感青年人中的成年发病型糖尿病。
根据本发明的第三方面,本发明提出了一种筛选易感青年人中的成年发病型糖尿病的生物样品的方法。根据本发明的实施例,该方法包括以下步骤:从生物样品提取核酸样本;确定所述核酸样本的核酸序列;所述核酸样本的核酸序列或其互补序列,与SEQ ID NO:1相比具有选自c.703C>T突变,或者与SEQ ID NO:3相比具有选自c.338G>T和c.358A>G的至少一种突变,是所述生物样品易感青年人中的成年发病型糖尿病的指示。通过根据本发明实施例的筛选易感青年人中的成年发病型糖尿病的生物样品的方法,可以有效地筛选易感青年人中的成年发病型糖尿病的生物样品。
根据本发明的第四方面,本发明提出了一种筛选易感青年人中的成年发病型糖尿病的生物样品的系统。根据本发明的实施例,该系统包括:核酸提取装置,所述核酸提取装置用于从所述生物样品提取核酸样本;核酸序列确定装置,所述核酸序列确定装置与所述核酸提取装置相连,用于对所述核酸样本进行分析,以便确定所述核酸样本的核酸序列;判断装置,所述判断装置与所述核酸序列确定装置相连,以便基于所述核酸样本的核酸序列或其互补序列,与SEQ ID NO:1相比具有c.703C>T突变,或者与SEQ ID NO:3相比具有选自c.338G>T和c.358A>G的至少一种突变,判断所述生物样品是否易感青年人中的成年发病型糖尿病。利用该系统,能够有效地实施前述筛选易感青年人中的成年发病型糖尿病的生物样品的方法,从而可以有效地筛选易感青年人中的成年发病型糖尿病的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易感青年人中的成年发病型糖尿病的生物样品的试剂盒。根据本发明的实施例,该试剂盒含有:适于检测HNF1B和HNF1A基因突变体的至少一种的试剂,其中与SEQ ID NO:1相比,所述HNF1B基因突变体具有c.703C>T突变;与SEQ ID NO:3相比,所述HNF1A基因突变体具有选自下列的至少一种突变:c.338G>T和c.358A>G。利用根据本发明的实施例的试剂盒,能够有效地筛选易感青年人中的成年发病型糖尿病的生物样品。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1:显示了根据本发明一个实施例的筛选易感青年人中的成年发病型糖尿病的生物样品的系统及其组成部分的示意图,其中,
A为根据本发明实施例的筛选易感青年人中的成年发病型糖尿病的生物样品的系统的示意图,
B为根据本发明实施例的核酸提取装置的示意图,
C为根据本发明实施例的核酸序列确定装置的示意图;
图2:显示了根据本发明一个实施例的MODY患者家系CZ01和CZ02的家系图谱,其中,
A为根据本发明实施例的CZ01家系的家系图谱,
B为根据本发明实施例的CZ02家系的家系图谱;
图3:显示了根据本发明一个实施例,MODY患者家系CZ01家系内的患者及正常人的HNF1B基因突变位点的Sanger测序验证峰图;
图4:显示了根据本发明一个实施例,MODY患者家系CZ02家系内的患者及正常人的HNF1A基因突变位点的Sanger测序验证峰图;
图5:显示了根据本发明一个实施例,MODY散发患者及家系外正常人的HNF1A基因突变位点的Sanger测序验证峰图。
发明详细描述
下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
HNF1B及HNF1A基因突变体
根据本发明的第一方面,本发明提出了一种分离的核酸。根据本发明的实施例,与SEQ ID NO:1相比,该核酸具有c.703C>T突变;或者与SEQ ID NO:3相比,该核酸具有选自下列的至少一种突变:c.338G>T和c.358A>G。需要说明的是,本发明的分离的核酸编码HNF1B或者HNF1A突变体,也可以称为“编码HNF1B或者HNF1A突变体的核酸”,即该核酸可以理解为与编码HNF1B或者HNF1A突变体的基因相对应的核酸物质,即核酸的类型不受特别限制,可以是任何包含与HNF1B和HNF1A的编码基因相对应的脱氧核糖核苷酸和/或核糖核苷酸的聚合物,包括但不限于DNA、RNA或cDNA。根据本发明的一个具体示例,前面所述的编码HNF1B和HNF1A突变体的核酸为DNA。根据本发明的实施例,发明人确定了HNF1B和HNF1A基因的新突变体,该突变体与青年人中的成年发病型糖尿病的发病密切相关,从而通过检测该突变体在生物样品中是否存在,可以有效地检测生物样品是否易感青年人中的成年发病型糖尿病,也可以通过检测该突变体在生物体中是否存在,可以有效地预测生物体是否易感青年人中的成年发病型糖尿病。
这些编码HNF1B和HNF1A突变体的核酸,是本申请的发明人通过高通量外显子组测序联合候选基因突变验证的方法,确定的青年人中的成年发病型糖尿病的致病基因上的新突变,并且在现有技术中并未见到HNF1B基因上的c.703C>T突变,以及HNF1A基因上的c.338G>T、c.358A>G突变与青年人中的成年发病型糖尿病相关的报道。
野生型HNF1B基因的cDNA的核苷酸序列如下所示(1674nt):
ATGGTGTCCAAGCTCACGTCGCTCCAGCAAGAACTCCTGAGCGCCCTGCTGAGCTCCGGGGTCACCAAGGAGGTGCTGGTTCAGGCCTTGGAGGAGTTGCTGCCATCCCCGAACTTCGGGGTGAAGCTGGAGACGCTGCCCCTGTCCCCTGGCAGCGGGGCCGAGCCCGACACCAAGCCGGTCTTCCATACTCTCACCAACGGCCACGCCAAGGGCCGCTTGTCCGGCGACGAGGGCTCCGAGGACGGCGACGACTATGACACACCTCCCATCCTCAAGGAGCTGCAGGCGCTCAACACCGAGGAGGCGGCGGAGCAGCGGGCGGAGGTGGACCGGATGCTCAGTGAGGACCCTTGGAGGGCTGCTAAAATGATCAAGGGTTACATGCAGCAACACAACATCCCCCAGAGGGAGGTGGTCGATGTCACCGGCCTGAACCAGTCGCACCTCTCCCAGCATCTCAACAAGGGCACCCCTATGAAGACCCAGAAGCGTGCCGCTCTGTACACCTGGTACGTCAGAAAGCAACGAGAGATCCTCCGACAATTCAACCAGACAGTCCAGAGTTCTGGAAATATGACAGACAAAAGCAGTCAGGATCAGCTGCTGTTTCTCTTTCCAGAGTTCAGTCAACAGAGCCATGGGCCTGGGCAGTCCGATGATGCCTGCTCTGAGCCCACCAACAAGAAGATGCGCCGCAACCGGTTCAAATGGGGGCCCGCGTCCCAGCAAATCTTGTACCAGGCCTACGATCGGCAAAAGAACCCCAGCAAGGAAGAGAGAGAGGCCTTAGTGGAGGAATGCAACAGGGCAGAATGTTTGCAGCGAGGGGTGTCCCCCTCCAAAGCCCACGGCCTGGGCTCCAACTTGGTCACTGAGGTCCGTGTCTACAACTGGTTTGCAAACCGCAGGAAGGAGGAGGCATTCCGGCAAAAGCTGGCCATGGACGCCTATAGCTCCAACCAGACTCACAGCCTGAACCCTCTGCTCTCCCACGGCTCCCCCCACCACCAGCCCAGCTCCTCTCCTCCAAACAAGCTGTCAGGAGTGCGCTACAGCCAGCAGGGAAACAATGAGATCACTTCCTCCTCAACAATCAGTCACCATGGCAACAGCGCCATGGTGACCAGCCAGTCGGTTTTACAGCAAGTCTCCCCAGCCAGCCTGGACCCAGGCCACAATCTCCTCTCACCTGATGGTAAAATGATCTCAGTCTCAGGAGGAGGTTTGCCCCCAGTCAGCACCTTGACGAATATCCACAGCCTCTCCCACCATAATCCCCAGCAATCTCAAAACCTCATCATGACACCCCTCTCTGGAGTCATGGCAATTGCACAAAGCCTCAACACCTCCCAAGCACAGAGTGTCCCTGTCATCAACAGTGTGGCCGGCAGCCTGGCAGCCCTGCAGCCCGTCCAGTTCTCCCAGCAGCTGCACAGCCCTCACCAGCAGCCCCTCATGCAGCAGAGCCCAGGCAGCCACATGGCCCAGCAGCCCTTCATGGCAGCTGTGACTCAGCTGCAGAACTCACACATGTACGCACACAAGCAGGAACCCCCCCAGTATTCCCACACCTCCCGGTTTCCATCTGCAATGGTGGTCACAGATACCAGCAGCATCAGTACACTCACCAACATGTCTTCAAGTAAACAGTGTCCTCTACAAGCCTGGTGA(SEQ ID NO:1),
其编码的的氨基酸序列如下所示(557aa):
MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKPVFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWRAAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREILRQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGPASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWFANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEITSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIHSLSHHNPQQSQNLIMTPLSGVMAIAQSLNTSQAQSVPVINSVAGSLAALQPVQFSQQLHSPHQQPLMQQSPGSHMAQQPFMAAVTQLQNSHMYAHKQEPPQYSHTSRFPSAMVVTDTSSISTLTNMSSSKQCPLQAW(SEQ ID NO:2)。
野生型HNF1A基因的cDNA的核苷酸序列如下所示(1896nt):
ATGGTTTCTAAACTGAGCCAGCTGCAGACGGAGCTCCTGGCGGCCCTGCTCGAGTCAGGGCTGAGCAAAGAGGCACTGATCCAGGCACTGGGTGAGCCGGGGCCCTACCTCCTGGCTGGAGAAGGCCCCCTGGACAAGGGGGAGTCCTGCGGCGGCGGTCGAGGGGAGCTGGCTGAGCTGCCCAATGGGCTGGGGGAGACTCGGGGCTCCGAGGACGAGACGGACGACGATGGGGAAGACTTCACGCCACCCATCCTCAAAGAGCTGGAGAACCTCAGCCCTGAGGAGGCGGCCCACCAGAAAGCCGTGGTGGAGACCCTTCTGCAGGAGGACCCGTGGCGTGTGGCGAAGATGGTCAAGTCCTACCTGCAGCAGCACAACATCCCACAGCGGGAGGTGGTCGATACCACTGGCCTCAACCAGTCCCACCTGTCCCAACACCTCAACAAGGGCACTCCCATGAAGACGCAGAAGCGGGCCGCCCTGTACACCTGGTACGTCCGCAAGCAGCGAGAGGTGGCGCAGCAGTTCACCCATGCAGGGCAGGGAGGGCTGATTGAAGAGCCCACAGGTGATGAGCTACCAACCAAGAAGGGGCGGAGGAACCGTTTCAAGTGGGGCCCAGCATCCCAGCAGATCCTGTTCCAGGCCTATGAGAGGCAGAAGAACCCTAGCAAGGAGGAGCGAGAGACGCTAGTGGAGGAGTGCAATAGGGCGGAATGCATCCAGAGAGGGGTGTCCCCATCACAGGCACAGGGGCTGGGCTCCAACCTCGTCACGGAGGTGCGTGTCTACAACTGGTTTGCCAACCGGCGCAAAGAAGAAGCCTTCCGGCACAAGCTGGCCATGGACACGTACAGCGGGCCCCCCCCAGGGCCAGGCCCGGGACCTGCGCTGCCCGCTCACAGCTCCCCTGGCCTGCCTCCACCTGCCCTCTCCCCCAGTAAGGTCCACGGTGTGCGCTATGGACAGCCTGCGACCAGTGAGACTGCAGAAGTACCCTCAAGCAGCGGCGGTCCCTTAGTGACAGTGTCTACACCCCTCCACCAAGTGTCCCCCACGGGCCTGGAGCCCAGCCACAGCCTGCTGAGTACAGAAGCCAAGCTGGTCTCAGCAGCTGGGGGCCCCCTCCCCCCTGTCAGCACCCTGACAGCACTGCACAGCTTGGAGCAGACATCCCCAGGCCTCAACCAGCAGCCCCAGAACCTCATCATGGCCTCACTTCCTGGGGTCATGACCATCGGGCCTGGTGAGCCTGCCTCCCTGGGTCCTACGTTCACCAACACAGGTGCCTCCACCCTGGTCATCGGCCTGGCCTCCACGCAGGCACAGAGTGTGCCGGTCATCAACAGCATGGGCAGCAGCCTGACCACCCTGCAGCCCGTCCAGTTCTCCCAGCCGCTGCACCCCTCCTACCAGCAGCCGCTCATGCCACCTGTGCAGAGCCATGTGACCCAGAGCCCCTTCATGGCCACCATGGCTCAGCTGCAGAGCCCCCACGCCCTCTACAGCCACAAGCCCGAGGTGGCCCAGTACACCCACACGGGCCTGCTCCCGCAGACTATGCTCATCACCGACACCACCAACCTGAGCGCCCTGGCCAGCCTCACGCCCACCAAGCAGGTCTTCACCTCAGACACTGAGGCCTCCAGTGAGTCCGGGCTTCACACGCCGGCATCTCAGGCCACCACCCTCCACGTCCCCAGCCAGGACCCTGCCAGCATCCAGCACCTGCAGCCGGCCCACCGGCTCAGCGCCAGCCCCACAGTGTCCTCCAGCAGCCTGGTGCTGTACCAGAGCTCAGACTCCAGCAATGGCCAGAGCCACCTGCTGCCATCCAACCACAGCGTCATCGAGACCTTCATCTCCACCCAGATGGCCTCTTCCTCCCAGTAA(SEQ ID NO:3),
其编码的的氨基酸序列如下所示(631aa):
MVSKLSQLQTELLAALLESGLSKEALIQALGEPGPYLLAGEGPLDKGESCGGGRGELAELPNGLGETRGSEDETDDDGEDFTPPILKELENLSPEEAAHQKAVVETLLQEDPWRVAKMVKSYLQQHNIPQREVVDTTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREVAQQFTHAGQGGLIEEPTGDELPTKKGRRNRFKWGPASQQILFQAYERQKNPSKEERETLVEECNRAECIQRGVSPSQAQGLGSNLVTEVRVYNWFANRRKEEAFRHKLAMDTYSGPPPGPGPGPALPAHSSPGLPPPALSPSKVHGVRYGQPATSETAEVPSSSGGPLVTVSTPLHQVSPTGLEPSHSLLSTEAKLVSAAGGPLPPVSTLTALHSLEQTSPGLNQQPQNLIMASLPGVMTIGPGEPASLGPTFTNTGASTLVIGLASTQAQSVPVINSMGSSLTTLQPVQFSQPLHPSYQQPLMPPVQSHVTQSPFMATMAQLQSPHALYSHKPEVAQYTHTGLLPQTMLITDTTNLSALASLTPTKQVFTSDTEASSESGLHTPASQATTLHVPSQDPASIQHLQPAHRLSASPTVSSSSLVLYQSSDSSNGQSHLLPSNHSVIETFISTQMASSSQ(SEQ ID NO:4),
发明人发现的HNF1B基因突变体与SEQ ID NO:1相比,具有c.703C>T(exon 3)突变,即相对于野生型HNF1B基因,本发明的HNF1B基因突变体的cDNA中第703位的C突变为T(位于exon 3),由此,其所编码的产物与肝细胞核因子1β(hepatocyte nuclear factor1β,HNF1B)(SEQ ID NO:2)相比,具有p.Arg235Trp(R235W)突变,即其235位氨基酸从Arg突变为Trp。
此外,发明人发现的HNF1A基因突变体与SEQ ID NO:3相比,具有c.338G>T(exon2)和c.358A>G(exon 2)的至少一种突变,即相对于野生型HNF1A基因,本发明的HNF1A基因突变体的cDNA中第338位的G突变为T(位于exon 2)、第358位的A突变为G(位于exon 2),由此,其所编码的产物与肝细胞核因子1α(hepatocyte nuclear factor1α,HNF1A)(SEQ IDNO:4)相比,具有p.Trp113Leu(W113L)或者p.Lys120Glu(K120E)突变,即其113位氨基酸从Trp突变为Leu或者其120位氨基酸从Lys突变为Glu。
本发明的发明人首次提出HNF1B基因c.703C>T突变可能导致无肾脏功能缺陷的个体出现临床表现高血糖症状,以及HNF1A基因的c.338G>T及c.358A>G突变导致患者出现青年人中的成年发病型糖尿病症状。
根据本发明的第二方面,本发明提出了一种分离的多肽。根据本发明的实施例,与SEQ ID NO:2相比,该分离的多肽具有p.Arg235Trp突变;或者与SEQ ID NO:4相比,该分离的多肽具有选自下列的至少一种突变:p.Trp113Leu和p.Lys120Glu。根据本发明的一些具体示例,具有p.Arg235Trp突变的多肽是由前述分离的编码HNF1B突变体的核酸编码的,具有p.Trp113Leu和p.Lys120Glu突变的多肽是由前述分离的编码HNF1A突变体的核酸编码的。通过检测生物样品中是否表达该多肽,可以有效地检测生物样品是否易感青年人中的成年发病型糖尿病,也可以通过检测这些多肽在生物体中是否存在,可以有效地预测生物体是否易感青年人中的成年发病型糖尿病。
筛选易感青年人中的成年发病型糖尿病的生物样品的方法
根据本发明的第三方面,本发明提出了一种筛选易感青年人中的成年发病型糖尿病的生物样品的方法。根据本发明的实施例,该筛选易感青年人中的成年发病型糖尿病的生物样品的方法可以包括以下步骤:
首先,从生物样品提取核酸样本。根据本发明的实施例,生物样品的类型并不受特别限制,只要从该生物样品中能够提取到反映生物样品HNF1B和HNF1A是否存在突变的核酸样本即可。根据本发明的实施例,生物样品可以为选自人体血液、皮肤、皮下组织的至少一种。由此,可以方便地进行取样和检测,从而能够进一步提高筛选易感青年人中的成年发病型糖尿病的生物样品的效率。根据本发明的实施例,这里所使用的术语“核酸样本”应做广义理解,其可以是任何能够反映生物样品中HNF1B和HNF1A是否存在突变的样本,例如可以是从生物样品中直接提取的全基因组DNA,也可以是该全基因组中包含HNF1B和HNF1A编码序列的一部分,可以是从生物样品中提取的总RNA,也可以是从生物样品中提取的mRNA。根据本发明的一个实施例,所述核酸样本为全基因组DNA。由此,可以扩大生物样品的来源范围,并且可以同时对生物样品的多种信息进行确定,从而能够提高筛选易感青年人中的成年发病型糖尿病的生物样品的效率。另外,根据本发明的实施例,针对采用RNA作为核酸样本,从生物样品提取核酸样本可以进一步包括:从生物样品提取RNA样本,优选RNA样本为mRNA;以及基于所得到的RNA样本,通过反转录反应,获得cDNA样本,所得到的cDNA样本构成核酸样本。由此,可以进一步提高利用RNA作为核酸样本筛选易感青年人中的成年发病型糖尿病的生物样品的效率。
接下来,在得到核酸样本之后,可以对核酸样本进行分析,从而能够确定所得到核酸样本的核酸序列。根据本发明的实施例,确定所得到核酸样本的核酸序列的方法和设备并不受特别限制。根据本发明的具体实施例,可以通过测序方法,确定核酸样本的核酸序列。根据本发明的实施例,可以用于进行测序的方法和设备并不受特别限制。根据本发明的实施例,可以采用第二代测序技术,也可以采用第三代以及第四代或者更先进的测序技术。根据本发明的具体示例,可以利用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种对核酸序列进行测序。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,能够提高后续对测序数据进行分析时的精确性和准确度。由此,根据本发明的实施例,确定核酸样本的核酸序列可以进一步包括:首先,针对所得到的核酸样本,构建核酸测序文库;以及对所得到的核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。根据本发明的一些实施例,可以采用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种对所得到的核酸测序文库进行测序。另外,根据本发明的实施例,可以对核酸样本进行筛选,富集HNF1B和HNF1A外显子,该筛选富集可以在构建测序文库之前,构建测序文库过程中,或者构建测序文库之后进行。根据本发明的一个实施例,针对核酸样本,构建核酸测序文库进一步包括:利用选自HNF1B和HNF1A基因外显子特异性引物的至少一种,对核酸样本进行PCR扩增;以及针对所得到的扩增产物,构建核酸测序文库。由此,可以通过PCR扩增,富集HNF1B和HNF1A外显子,从而能够进一步提高筛选易感青年人中的成年发病型糖尿病的生物样品的效率。根据本发明的实施例,HNF1B和HNF1A基因外显子特异性引物的序列不受特别限制,根据本发明的优选实施例,HNF1B基因外显子特异性引物可以具有如SEQ ID NO:5-6所示的核苷酸序列,HNF1A基因外显子特异性引物可以具有如SEQ ID NO:7-8所示的核苷酸序列。发明人惊奇地发现,通过采用SEQ ID NO:5-6所示的引物,可以在PCR反应体系中显著有效地完成对HNF1B尤其是c.703C>T所在的3号外显子序列的扩增;采用SEQ ID NO:7-8所示的引物,可以显著有效地完成对HNF1A尤其是c.338G>T及c.358A>G所在的2号外显子序列的扩增。需要说明的是,这些SEQ ID NO:5-8所示的核苷酸序列是本发明的发明人在付出了艰苦的劳动后,意外获得的。
引物名称 | 序列(5’→3’SEQ ID NO:) |
HNF1Bex3F | GACGAGGGGAATAAAGGTGTC(SEQ ID NO:5) |
HNF1Bex3R | AGTGTCTCAATATCCCAGGA(SEQ ID NO:6) |
HNF1Aex2F | CCCTTGCTGAGCAGATCC(SEQ ID NO:7) |
HNF1Aex2R | CCACTGACTTCCTTTCCATCTA(SEQ ID NO:8) |
关于针对核酸样本,构建测序文库的方法和流程,本领域技术人员可以根据不同的测序技术进行适当选择,关于流程的细节,可以参见测序仪器的厂商例如Illumina公司所提供的规程,例如参见Illumina公司Multiplexing Sample Preparation Guide(Part#1005361;Feb 2010)或Paired-End SamplePrep Guide(Part#1005063;Feb 2010),通过参照将其并入本文。根据本发明的实施例,从生物样品提取核酸样本的方法和设备,也不受特别限制,可以采用商品化的核酸提取试剂盒进行。
需要说明的是,在这里所使用的术语“核酸序列”应作广义理解,其可以是在对核酸样本进行测序得到的测序数据进行组装后,得到的完整的核酸序列信息,也可以是直接采用通过对核酸样本进行测序所得到的测序数据(reads)作为核酸序列,只要这些核酸序列中含有对应HNF1B和HNF1A的编码序列即可。
最后,在确定核酸样本的核酸序列之后,将所得到的核酸样本的核酸序列相应的参考序列进行比对,当所得到的核酸序列中具有前述的三种突变的至少之一时,即指示生物样品易感青年人中的成年发病型糖尿病。具体地,当获得的核酸样本是采用HNF1B基因外显子特异性引物扩增获得时,将该核酸样本的核酸序列与SEQ ID NO:1的序列相比对,如果在所得到的核酸序列中具有c.703C>T突变,则指示生物样品易感青年人中的成年发病型糖尿病。当获得的核酸样本是采用HNF1A基因外显子特异性引物扩增获得时,将该核酸样本的核酸序列与SEQ ID NO:3的序列相比对,如果在所得到的核酸序列中具有c.338G>T和c.358A>G至少一种突变,则指示生物样品易感青年人中的成年发病型糖尿病。当获得的核酸样本是采用HNF1A及HNF1B基因外显子特异性引物扩增获得时,将该核酸样本的核酸序列分别与SEQ ID NO:1和SEQ ID NO:3的序列相比对,如果在所得到的核酸序列中具有c.703C>T、c.338G>T和c.358A>G至少一种突变,则指示生物样品易感青年人中的成年发病型糖尿病。由此,通过根据本发明实施例的筛选易感青年人中的成年发病型糖尿病的生物样品的方法,可以有效地筛选易感青年人中的成年发病型糖尿病的生物样品。根据本发明的实施例,对核酸序列与SEQ ID NO:1及SEQ ID NO:3进行比对的方法和设备并不受特别限制,可以采用任意常规的软件进行操作,根据本发明的具体实例,可以采用SOAPALIGNER/SOAP2进行比对。
需要说明的是,根据本发明实施例的“筛选易感青年人中的成年发病型糖尿病的生物样品的方法”的用途不受特别限制,例如可以用作非诊断目的的筛选方法。
筛选易感青年人中的成年发病型糖尿病的生物样品的系统和试剂盒
根据本发明的第四方面,本发明提出了一种能够有效实施上述筛选易感青年人中的成年发病型糖尿病的生物样品的方法的系统。
参考图1,根据本发明的实施例,该筛选易感青年人中的成年发病型糖尿病的生物样品的系统1000包括:核酸提取装置100、核酸序列确定装置200以及判断装置300。
根据本发明的实施例,核酸提取装置100用于从生物样品提取核酸样本。如前所述,根据本发明的实施例,核酸样本的类型并不受特别限制,对于采用RNA作为核酸样本,则核酸提取装置进一步包括RNA提取单元101和反转录单元102,其中,提取单元101用于从生物样品提取RNA样本,反转录单元102与RNA提取单元101相连,用于对RNA样本进行反转录反应,以便获得cDNA样本,所得到的cDNA样本构成核酸样本。
根据本发明的实施例,核酸序列确定装置200与核酸提取装置100相连,用于对核酸样本进行分析,以便确定核酸样本的核酸序列。如前所示,可以采用测序的方法确定核酸样本的核酸序列。由此,根据本发明的一个实施例,所述核酸序列确定装置200可以进一步包括:文库构建单元201以及测序单元202。文库构建单元201用于针对核酸样本,构建核酸测序文库;测序单元202与文库构建单元201相连,用于对核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。如前所述,可以通过PCR扩增,富集HNF1B和HNF1A外显子,进一步提高筛选易感青年人中的成年发病型糖尿病的生物样品的效率。由此,文库构建单元201可以进一步包括PCR扩增模块(图中未示出),在该PCR扩增模块中设置有选自HNF1B和HNF1A基因外显子特异性引物的至少一种,以便利用HNF1B和HNF1A基因外显子特异性引物的至少一种,对所述核酸样本进行PCR扩增,根据本发明的具体实施例,HNF1B基因外显子特异性引物具有如SEQ ID NO:5-6所示的核苷酸序列,HNF1A基因外显子特异性引物具有如SEQ ID NO:7-8所示的核苷酸序列。根据本发明的实施例,测序单元202可以包括选自HISEQ2000、SOLiD、454和单分子测序装置的至少一种。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,提高后续对测序数据进行分析时的精确性和准确度。
根据本发明的实施例,判断装置300与核酸序列确定装置200相连,适于将核酸样本的核酸序列进行比对,以便基于核酸样本的核酸序列与SEQ ID NO:1及SEQ ID NO:3的区别判断生物样品是否易感青年人中的成年发病型糖尿病。具体地,基于所述核酸样本的核酸序列或其互补序列,与SEQ ID NO:1相比具有c.703C>T突变,或者与SEQ ID NO:3相比具有选自c.338G>T和c.358A>G的至少一种突变,判断生物样品是否易感青年人中的成年发病型糖尿病。如前所述,根据本发明的一个实施例,核酸样本的核酸序列或其互补序列,与SEQ ID NO:1相比具有选自c.703C>T突变,或者与SEQ ID NO:3相比具有选自c.338G>T和c.358A>G的至少一种突变,是生物样品易感青年人中的成年发病型糖尿病的指示。如前所述,根据本发明的实施例,对核酸序列与SEQ ID NO:1以及SEQ ID NO:3进行比对的设备并不受特别限制,可以采用任意常规的软件进行操作,例如根据本发明的具体实例,可以采用SOAPALIGNER/SOAP2进行比对。
由此,利用该系统,能够有效地实施前述筛选易感青年人中的成年发病型糖尿病的生物样品的方法,从而可以有效地筛选易感青年人中的成年发病型糖尿病的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易感青年人中的成年发病型糖尿病的生物样品的试剂盒。根据本发明的实施例,该用于筛选易感青年人中的成年发病型糖尿病的生物样品的试剂盒包括:适于检测HNF1B和HNF1A基因突变体的至少一种的试剂,其中与SEQ ID NO:1相比,该HNF1B基因突变体具有c.703C>T突变;与SEQ ID NO:3相比,该HNF1A基因突变体具有选自下列的至少一种突变:c.338G>T和c.358A>G。利用根据本发明的实施例的试剂盒,能够有效地筛选易感青年人中的成年发病型糖尿病的生物样品。在本文中,所使用的术语“适于检测HNF1B和HNF1A基因突变体的至少一种的试剂”应做广义理解,即可以是检测HNF1B和HNF1A编码基因的至少一种的试剂,也可以是检测HNF1B和HNF1A突变体的至少一种的试剂,例如可以采用识别特异性位点的抗体。根据本发明的一个实施例,该试剂为核酸探针。由此,可以高效地筛选易感青年人中的成年发病型糖尿病的生物样品。
需要说明的是,在本文前面筛选易感青年人中的成年发病型糖尿病的生物样品的方法部分中所描述的特征和优点,同样适用于筛选易感青年人中的成年发病型糖尿病的生物样品的系统或者试剂盒,在此不再赘述。
此外,还需要说明的是,根据本发明实施例的筛选易感青年人中的成年发病型糖尿病的生物样品的方法、系统以及试剂盒,是本申请的发明人经过艰苦的创造性劳动和优化工作才完成的。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著,黄培堂等译的《分子克隆实验指南》,第三版,科学出版社)或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品,例如可以采购自Illumina公司。
实施例1 全外显子组测序确定致病基因及突变位点
1、样本收集:
发明人收集到2个捷克MODY患者家系CZ01及CZ02。其中,图2分别显示了CZ01及CZ02家系的家系图谱。其中,图2A为CZ01家系的家系图谱,图2B为CZ02家系的家系图谱。如图2所示,表示正常女性;表示无法确定是否患病的女性;表示正常男性;表示无法确定是否患病的男性;■表示男性患者;●表示女性患者;表示已故男性患者;表示已故女性患者;表示已故正常男性;表示已故正常女性;箭头所指为先证者。其中CZ01家系现有3代存活,共8个成员,其中患者5人;CZ02家系现有3代存活,共6个成员,其中患者2人。
此外,发明人对CZ01现有所有患者进行了全面仔细的体检,结果显示所有患者均具有典型的糖尿病临床特征,其中先证者肾脏超声波检测中未检测到任何肾脏功能异常,其母亲及外祖父经过反复肾病检测发现患有马蹄肾。由于在临床表型中报道的肾脏功能异常是显性特征,故对先证者进行外显子测序前未做HNF1B基因的检测。
如图2所示,CZ01家系,先证者,女,26岁,体质量指数21.2。患者首次检测到糖尿症状在17岁,后期胰岛素治疗及口服降糖药治疗。家系内出现有3个以上患者在25岁以前发病,累及3代或以上家族成员,呈常染色体显性遗传;外显率高,可超过90%。
CZ02家系,先证者,女,21岁,体质量指数28.6。患者首次检测到糖尿症状在17岁,后期口服降糖药治疗。家系内累及3代或以上家族成员,呈常染色体显性遗传;外显率高,可超过90%。
两个先证者的病理诊断均为:青年人中的成年发病型糖尿病。
发明人收集获得上述CZ01家系中存活的3个患者以及3个正常人的DNA样本,CZ02家系中存活的2个患者以及4个正常人的DNA样本。
2、全外显子组测序确定致病基因及突变位点
发明人利用Agilent Sureselect 44M Kit结合Solexa高通量测序技术对上述CZ01患者家系中的先证者及其患病母亲和正常父亲和CZ02患者家系中的先证者及其患病母亲和正常父亲进行了外显子测序,具体步骤如下:
2.1样品制备
分别取CZ01和CZ02患者家系中的先证者及其患病母亲和正常父亲的外周血,利用常规盐析法抽提基因组DNA,并利用分光光度计测量DNA的浓度及纯度,所得的每个标本基因组DNA的OD260/OD280均位于1.7-2.0之间,浓度不少于200ng/μl,总量不少于30μg,备用。
2.2文库构建及测序
利用超声波仪(CovarisS2,Massachusetts,USA)将各基因组DNA样本随机打断成200-300bp左右的片段,随后按照制造商提供的操作说明书,在片段两端分别连接上接头制备文库(可参见:http://www.illumina.com/提供的Illumina/Solexa标准建库说明书,通过参照将其全文并入本文)。文库经纯化后经过Ligation-mediated PCR(LM-PCR)的线性扩增与SureSelect Biotiny lated RNA Library(BAITS)进行杂交富集,再经过LM-PCR的线性扩增,文库检测合格后即可上机测序,以便获得原始测序数据。其中,参照Illumina标准的成簇和测序的protocol进行测序,测序平台为Illumina Hiseq 2000,读取长度为90bp,样本的平均测序深度为170×。
2.3变异检测、注释及数据库比较
利用Illumina basecalling Software 1.7对上述获得的原始测序数据进行处理,经过过滤去污染后,使用SOAPaligner/SOAP2(可参见:Li R,Li Y,Kristiansen K,etal,SOAP:short oligonucleotide alignment program.Bioinformatics 2008,24(5):713-714;Li R,Yu C,Li Y,ea al,SOAP2:an improved ultrafast tool for short readalignment.Bioinformatics 2009,25(15):1966-1967,通过参照将其全文并入本文)比对到参考基因组UCSC NCBI37/hg19,以便获得比对到基因组上的唯一比对序列。然后利用SOAPsnp(可参见:Li R,Li Y,Fang X,Yang H,et al,SNP detection for massivelyparallel whole-genome resequencing.Genome Res2009,19(6):1124-1132,通过参照将其全文并入本文)确定靶区域的基因型。
在得到测序结果之后,对非同义突变、剪接受体/供体位点突变、编码区插入和缺失突变这三类最有可能与病理相关的突变进行研究。结果,发明人通过测序分析发现,在家系CZ01中的3个测序样本中平均发现67745个单核苷酸多态性(SNPs)和4784处的插入/缺失,在家系CZ02中的的3个测序样本中平均发现69246个单核苷酸多态性(SNPs)和4840处的插入/缺失。随后通过dbSNP132数据库(http://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi)、Exome Variant Server数据库(http://evs.gs.washington.edu/EVS/)、千人基因组数据库(www.1000genomes.org)、HapMap数据库(http://hapmap.ncbi.nlm.nih.gov)等公共数据库以及糖尿病基因变异LuCamp数据库(http://www.lucamp.org)的过滤,去掉所有已知的且在数据库中等位基因频率大于0.005的变异。剩下的非同义/剪接位点突变和微小插入缺失根据以下特征进行优先选择:(a)选择两个患者中共有的同基因同位点同突变型的突变,过滤掉正常人中存在的突变,CZ01家系还剩下343个SNP突变位点,39个Indel突变;CZ02家系还剩下336个SNP突变位点,45个Indel突变;(b)这些突变位点中,优先查找MODY已知基因的突变,在CZ01家系中发现HNF1B基因的c.703C>T突变;在CZ02家系中发现HNF1A基因的c.338G>T突变。
由于外显子组测序存在一定程度的假阳性,接下来,发明人又利用Sanger测序方法,对上述确定的2个SNP突变在家系CZ01和CZ021的先证者分别进行了验证,结果显示HNF1B基因的c.703C>T突变及HNF1A基因的c.338G>T突变均为真实的突变。由此,表明HNF1B和HNF1A基因为青年人中的成年发病型糖尿病的致病相关基因,c.703C>T(HNF1B),c.338G>T(HNF1A)突变是青年人中的成年发病型糖尿病的致病突变。
实施例2 Sanger法测序验证青年人中的成年发病型糖尿病的致病基因
分别对MODY患者家系CZ01中的6人(3个女性患者及3个家系内正常人)CZ02中的6人(2个女性患者及4个家系内正常人)(见图2)、1个散发患者及95个家系外正常人的HNF1B和HNF1A基因进行检测,针对HNF1B基因的3号外显子和HNF1A基因2号外显子序列设计引物,然后通过PCR扩增、产物纯化和测序的方法获得HNF1B基因的3号外显子和HNF1A基因2号外显子有关序列,根据确定序列测定结果属于突变型还是野生型,验证HNF1B和HNF1A与青年人中的成年发病型糖尿病之间的相关性。具体方法步骤如下:
1、DNA提取
分别采集上述家系CZ01中的3名患者和3名家系内正常人、CZ02中的2名患者和4名家系内正常人、1个散发患者以及95个家系外正常人的外周静脉血,然后利用常规盐析法抽提外周血白细胞中的基因组DNA,并利用分光光度计测量所提取DNA的浓度及纯度,所得的每个标本基因组DNA的OD260/OD280均位于1.7-2.0之间,浓度不少于200ng/微升,总量不少于6μg,由此,获得108份DNA样品,备用。
2、引物设计及PCR反应
首先,参考人类基因组序列数据库GRCh37.1/hg19,设计得到具有SEQ ID NO:5-6所示的核苷酸序列的HNF1B基因3号外显子,以及具有SEQ ID NO:7-8所示的核苷酸序列的HNF1A基因2号外显子序列特异性引物,具体见下表。
HNF1B和HNF1A基因外显子特异性引物
引物名称 | 序列(5’→3’SEQ ID NO:) |
HNF1Bex3F | GACGAGGGGAATAAAGGTGTC(SEQ ID NO:5) |
HNF1Bex3R | AGTGTCTCAATATCCCAGGA(SEQ ID NO:6) |
HNF1Aex2F | CCCTTGCTGAGCAGATCC(SEQ ID NO:7) |
HNF1Aex2R | CCACTGACTTCCTTTCCATCTA(SEQ ID NO:8) |
接着,分别按照以下配比配制各基因组DNA样本的PCR反应体系以及进行PCR反应。
针对HNF1B基因3号外显子和HNF1A基因2号外显子序列,按以下配比分别配制各基因组DNA样本的各PCR反应体系(不同的突变位点采用相同的反应体系):
反应体系:10μl
然后,将配制获得的HNF1B基因3号外显子和HNF1A基因2号外显子序列的各PCR反应体系按照以下反应条件分别进行PCR反应(不同的突变位点采用相同的反应条件):
反应条件:
由此,获得上述家系CZ01中的3名患者和3名家系内正常人,CZ02中的2名患者和4名家系内正常人,1个散发患者以及95个家系外正常人的PCR扩增产物。
3、测序
将步骤2中获得的获自家系CZ01中的3名患者和3名家系内正常人,CZ02中的2名患者和4名家系内正常人,散发患者以及95个家系外正常人的PCR扩增产物,按以下配比分别配制各基因组DNA样本的各PCR反应体系进行DNA测序(不同的突变位点采用相同的反应体系,Terminator v3.1 Cycle Sequncing kit,Applied Biosystems):
体系组成 | 体积(μl) |
H2O | 3.38 |
5x测序缓冲液 | 1.88 |
BigDye Terminator 3.1 | 0.25 |
测序引物(2.5uM) | 2.5 |
PCR产物 | 2 |
总体积 | 10 |
然后,将配制获得的HNF1B基因3号外显子和HNF1A基因2号外显子的各PCR反应体系按照以下反应条件分别进行PCR反应然后利用DNA sequencer ABI Prism 3130xl(Applied Biosystems,Warrington,UK)进行测序(不同的突变位点采用相同的反应条件):
反应条件:
结果显示,HNF1B基因的c.703C>T突变在CZ01家系内出现共分离,HNF1A基因的c.338G>T突变在CZ02家系中出现共分离。
接着,基于测序结果,对上述各样本进行HNF1B和HNF1A基因编码序列比对。发明人发现,家系CZ01和CZ02内患者及其家系内正常人分别在c.703C>T(HNF1B)和c.338G>T(HNF1A)出现共分离现象,家系CZ01和CZ02内患者分别携带c.703C>T和c.338G>T突变,并在一个散发患者中发现了c.358A>G突变(HNF1A);95个家系外正常人的HNF1B基因均未发现具有c.703C>T突变;95个家系外正常人的HNF1A基因均未发现具有c.338G>T和c.358A>G突变。由此,证明HNF1B基因的c.703C>T突变、HNF1A基因的c.338G>T和c.358A>G突变是青年人中的成年发病型糖尿病的致病突变。
其中,图3显示了MODY患者家系CZ01家系内的患者及正常人的HNF1B基因突变位点的Sanger测序验证峰图,图4显示了CZ02家系内的患者及正常人的HNF1A基因突变位点的Sanger测序验证峰图,图5显示了MODY散发患者及家系外正常人的HNF1A基因突变位点的Sanger测序验证峰图。由图3-5可知,CZ01家系中患者的HNF1B基因具有c.703C>T突变,而该家系中的正常人不具有该突变;CZ02家系中患者的HNF1A基因具有c.338G>T突变,而该家系中的正常人不具有该突变;散发患者的HNF1A基因具有c.358A>G突变,而家系外正常人在相应位点上均不存在该突变。
由此,发明人在患者家族成员中对HNF1B基因3号外显子和HNF1A基因2号外显子的序列进行突变排查发现家系CZ01的3个患者具有c.703C>T(HNF1B)突变,家系CZ02的2个患者具有c.338G>T(HNF1A)突变;散发患者中发现了一例c.358A>G(HNF1A)突变;而在与患者来自同一区域的95个家系外正常人中均未发现上述突变。由此,进一步证明HNF1B基因的c.703C>T突变、HNF1A基因的c.338G>T和c.358A>G突变是青年人中的成年发病型糖尿病的致病突变。
需要说明的是,已知,肝细胞核因子1α(hepatocyte nuclear factor1α,HNF1A)属于POU-同源结构域家族,由N末端的类肌球蛋白二聚体区、C末端的转录激活区和DNA结合区构成。其基因定位于染色体12q24.2,全长3241bp,其中蛋白编码区长1 896bp。HNF1A DNA结合区含POU-同源结构域序列,二聚体区可形成同源二聚体和HNF1B形成异源二聚体共同调节靶基因表达。肝细胞核因子1β(hepatocyte nuclear factor1β,HNF1B)是对胰腺细胞形成和维持血糖稳态具有重要作用的转录因子。HNF1B是HNF1A类似物,在脊椎动物中表达,与HNF1A高度同源,其生物学活性明显低于HNF1A。HNF1A表达下调时,HNF1B可代偿性增加。本研究可适用却不局限于在糖尿病患者无肾脏结构/功能异常症状的特殊患者中进行HNF1B基因突变筛查和临床表型分析;另一方面,将评价HNF1B基因变异与捷克人青年人中的成年发病型糖尿病易感性的关系。
综上,发明人进一步证明了HNF1B和HNF1A基因为青年人中的成年发病型糖尿病的致病相关基因,HNF1B基因的c.703C>T突变、HNF1A基因的c.338G>T和c.358A>G突变是青年人中的成年发病型糖尿病的致病突变。
实施例3 Sanger法测序验证青年人中的成年发病型糖尿病的致病突变
分别对上述得到的HNF1B和HNF1A基因上c.703C>T(HNF1B)、c.338G>T(HNF1A)和c.358A>G(HNF1A)的致病突变进行验证,即利用HNF1B基因的3号外显子和HNF1A基因的2号外显子序列引物,分别按照实施例2中的相应方法,对实施例2中获得的95个家系外正常人的基因组DNA样本进行HNF1B基因的3号外显子和HNF1A基因的2号外显子突变位点检测。结果,发明人发现,95个家系外正常人中均未发现上述突变。
由此,发明人进一步证明了HNF1B基因的c.703C>T突变、HNF1A基因的c.338G>T和c.358A>G突变是青年人中的成年发病型糖尿病的致病突变。
工业实用性
本发明的分离的核酸、分离的多肽、筛选易感青年人中的成年发病型糖尿病的生物样品的方法、系统以及试剂盒,能够有效地应用于检测生物样品是否易感青年人中的成年发病型糖尿病,并且获得的结果准确可靠。
尽管本发明的具体实施方式已经得到详细的描述,本领域技术人员将会理解。根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
Claims (5)
1.一种分离的核酸,其特征在于,
所述核酸编码肝细胞核因子1α,与SEQ ID NO:3相比,所述核酸具有选自下列的至少一种突变:c.338G>T和c.358A>G。
2.根据权利要求1所述的核酸,其特征在于,所述核酸为DNA。
3.一种分离的多肽,其特征在于,
所述分离的多肽表达肝细胞核因子1α,与SEQ ID NO:4相比,所述分离的多肽具有选自下列的至少一种突变:p.Trp113Leu和p.Lys120Glu。
4.根据权利要求3所述的分离的多肽,其特征在于,所述分离的多肽是由权利要求1所述的核酸编码的。
5.一种检测突变位点的试剂在制备筛选易感青年人中的成年发病型糖尿病的生物样品的装置中的用途,所述突变位点为选自下列的至少一种突变:与SEQ ID NO:3相比,c.338G>T和c.358A>G。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2013/073365 WO2014153753A1 (zh) | 2013-03-28 | 2013-03-28 | 基因突变体及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105263944A CN105263944A (zh) | 2016-01-20 |
CN105263944B true CN105263944B (zh) | 2018-02-09 |
Family
ID=
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998011254A1 (en) * | 1996-09-10 | 1998-03-19 | Arch Development Corporation | MUTATIONS IN THE DIABETES SUSCEPTIBILITY GENES HEPATOCYTE NUCLEAR FACTOR (HNF) 1 ALPHA (α), HNF-1β AND HNF-4$g(a) |
CN1495191A (zh) * | 2002-09-16 | 2004-05-12 | 三星电子株式会社 | 具有新的单核苷酸多态性的HNF-1α基因变体和其编码的蛋白质变体 |
CN1496412A (zh) * | 2001-03-14 | 2004-05-12 | ���Ĵ���ѧ | 用于评估中国血统的人种发展2型糖尿病危险性的方法和组合物 |
CN1254549C (zh) * | 2001-12-18 | 2006-05-03 | 三星电子株式会社 | 用于人HNF-1α基因扩增的多重PCR引物组 |
CN103290031A (zh) * | 2012-03-05 | 2013-09-11 | 深圳华大基因科技有限公司 | Card9基因突变体及其应用 |
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998011254A1 (en) * | 1996-09-10 | 1998-03-19 | Arch Development Corporation | MUTATIONS IN THE DIABETES SUSCEPTIBILITY GENES HEPATOCYTE NUCLEAR FACTOR (HNF) 1 ALPHA (α), HNF-1β AND HNF-4$g(a) |
CN1496412A (zh) * | 2001-03-14 | 2004-05-12 | ���Ĵ���ѧ | 用于评估中国血统的人种发展2型糖尿病危险性的方法和组合物 |
CN1254549C (zh) * | 2001-12-18 | 2006-05-03 | 三星电子株式会社 | 用于人HNF-1α基因扩增的多重PCR引物组 |
CN1495191A (zh) * | 2002-09-16 | 2004-05-12 | 三星电子株式会社 | 具有新的单核苷酸多态性的HNF-1α基因变体和其编码的蛋白质变体 |
CN103290031A (zh) * | 2012-03-05 | 2013-09-11 | 深圳华大基因科技有限公司 | Card9基因突变体及其应用 |
Non-Patent Citations (1)
Title |
---|
rs193922491;NCBI SNP;《NCBI SNP》;20111122;第2页gene,HGVS * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104120132B (zh) | Fbn1基因突变体及其应用 | |
CN103571847B (zh) | Foxc1基因突变体及其应用 | |
CN106282195A (zh) | 基因突变体及其应用 | |
US11584966B2 (en) | Piezo type mechanosensitive ion channel component 1 (PIEZO1) variants and uses thereof | |
CN103834673B (zh) | Ext1基因突变体及其应用 | |
WO2017107545A1 (zh) | Scap基因突变体及其应用 | |
CN104178487B (zh) | Atm基因突变体及其应用 | |
CN105838720B (zh) | Ptprq基因突变体及其应用 | |
CN105567862B (zh) | Cdk18在制备诊断冠心病产品中的用途 | |
CN104073499B (zh) | Tmc1基因突变体及其应用 | |
CN104099338B (zh) | Myo15a基因突变体及其应用 | |
CN111647670A (zh) | 一种与肾病综合征相关的肠道菌属Faecalitalea及其应用 | |
CN105263944B (zh) | 基因突变体及其应用 | |
CN104164424A (zh) | Cc2d2a基因突变体及其应用 | |
CN104232650A (zh) | 特发性基底节钙化新的致病基因及其编码蛋白质和应用 | |
CN103509801B (zh) | 骨骼肌氯离子通道基因突变体及其应用 | |
CN104561015B (zh) | Myl4基因突变体及其应用 | |
CN103849623A (zh) | Abcb6基因突变体及其应用 | |
CN107385076B (zh) | 一种甲状腺功能减退致病基因突变及基于此基因突变的诊断试剂 | |
CN104178489B (zh) | Aagab基因突变体及其应用 | |
CN105779463B (zh) | Vps13b基因突变体及其应用 | |
CN105263944A (zh) | 基因突变体及其应用 | |
CN103571846B (zh) | Atp6v1b2基因突变体及其应用 | |
CN104250649B (zh) | 皮肤角化‑少毛‑白甲综合征新的致病基因及其编码蛋白质和应用 | |
CN104178486B (zh) | Sacs基因突变体及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220119 Address after: 570311 room 201-2, floor 2, building a, leading science and Technology Innovation Park, Haikou national high tech Zone, No. 6, Yaogu 1st Road, Xiuying District, Haikou City, Hainan Province Patentee after: Hainan Huada Gene Technology Co.,Ltd. Address before: 518083 Huada Complex Park, 21 Hongan Third Street, Yantian District, Shenzhen City, Guangdong Province, 7 buildings, 7 floors-14 floors Patentee before: BGI SHENZHEN Co.,Ltd. |