MYO15A基因突变体及其应用
技术领域
本发明涉及生物技术领域。具体而言,本发明涉及MYO15A基因突变体及其应用。
背景技术
研究表明,60%耳聋患者由于遗传因素导致,另外40%耳聋患者与环境因素有关。以往由于人们缺乏对耳聋遗传病因学的深入认识以及诊断技术,无法明确耳聋分子病因,更无法预防其发生。近30年来,伴随耳聋遗传病因学及分子生物学技术的快速发展,至今已有84个耳聋基因被克隆。一些常见基因得到了深入的认识,耳聋分子病因学诊断成为可能。
因而,目前对感音神经性耳聋疾病的研究仍有待深入。
发明内容
本发明旨在至少在一定程度上解决上述技术问题之一。为此,本发明的一个目的在于提出一种能够有效筛选易患感音神经性耳聋疾病的生物样品的方法。
本发明是基于发明人的下列工作完成的:发明人通过高通量外显子组测序联合候选基因突变验证的方法确定了感音神经性耳聋疾病新的致病基因突变位点(MYO15A基因的c.IVS25+3G>A、c.8375T>C突变)。
根据本发明的第一方面,本发明提出了一种分离的编码MYO15A基因突变体的核酸。根据本发明的实施例,所述核酸与SEQ ID NO:1相比,具有选自下列的至少一种突变:c.IVS25+3G>A、c.8375T>C。即相对于野生型MYO15A基因,本发明的MYO15A基因具有一个错义突变c.8375T>C或者剪接位点突变c.IVS25+3G>A的至少一种。根据本发明的实施例,发明人确定了MYO15A基因的新突变体,该突变体与感音神经性耳聋疾病的发病密切相关,从而通过检测该新突变体在生物样品中是否存在,可以有效地检测生物样品是否易患感音神经性耳聋疾病。
根据本发明的第二个方面,本发明提出了一种分离的多肽,该多肽与SEQ ID NO:2相比具有p.V2792A突变,通过检测生物样品中是否表达该多肽,可以有效地检测生物样品是否易患感音神经性耳聋疾病。根据本发明的实施例,该多肽是由上述核酸编码的,根据本发明的具体实施例,上述c.8375T>C突变编码的蛋白为p.V2792A,而c.IVS25+3G>A为剪接位点突变,由于剪接位点突变导致蛋白变化无法验证,因此无法提供该突变蛋白。
根据本发明的地三个方面,本发明提出了一种筛选易患感音神经性耳聋疾病的生物样 品的方法,该方法包括以下步骤:从所述生物样品提取核酸样本;确定所述核酸样本的核酸序列;所述核酸样本的核酸序列与SEQ ID NO:1相比,具有选自c.IVS25+3G>A、c.8375T>C的至少一种突变是所述生物样品易患感音神经性耳聋疾病的指示,任选地,所述生物样品为选自人体血液、皮肤、皮下组织的至少一种,任选地,所述核酸样本为全基因组DNA,任选地,所述感音神经性耳聋疾病是常染色体隐性遗传疾病。通过根据本发明实施例的筛选易患感音神经性耳聋疾病的生物样品的方法,可以有效地筛选易患感音神经性耳聋疾病的生物样品。
根据本发明的第四方面,本发明提出了一种筛选易患感音神经性耳聋疾病的生物样品的系统,该系统包括:核酸提取装置,所述核酸提取装置用于从所述生物样品提取核酸样本;核酸序列确定装置,所述核酸序列确定装置与所述核酸提取装置相连,用于对所述核酸样本进行分析,以便确定所述核酸样本的核酸序列;判断装置,所述判断装置与所述核酸序列确定装置相连,以便基于所述核酸样本的核酸序列与SEQ ID NO:1相比,是否具有c.IVS25+3G>A、c.8375T>C的至少一种突变,判断所述生物样品是否易患感音神经性耳聋疾病;任选地,所述感音神经性耳聋疾病是常染色体隐性遗传疾病。利用该系统,能够有效地实施前述筛选易患感音神经性耳聋疾病的生物样品的方法,从而可以有效地筛选易患感音神经性耳聋疾病的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易患感音神经性耳聋疾病的生物样品的试剂盒,该试剂盒含有:适于检测MYO15A基因突变体的试剂,其中与SEQ ID NO:1相比,所述MYO15A基因突变体具有选自下列的至少一种突变:c.IVS25+3G>A、c.8375T>C,任选地,所述试剂为核酸探针或引物,任选地,所述核酸探针或引物具有如SEQ ID NO:3-6所示的核苷酸序列,任选地,所述是常染色体隐性遗传疾病。
对于本发明说明书和权利要求书中,提及基因序列,本领域技术人员应当理解,实际包括互补双链的任意一条,或者两条。为了方便,在本说明书和权利要求书中,虽然多数情况下只给出了一条链,但实际上也公开了与之互补的另一条链。例如提及MYO15A基因的cDNA序列,实际上可以包括/或不包括该序列以及其互补序列。例如,提及SEQ ID NO:1,实际可以包括其互补序列。本领域技术人员还可以理解,利用一条链可以检测另一条链,反之亦然。
本申请中的基因序列包括DNA形式或RNA形式,公开其中一种,意味着另一种也被公开。例如提及MYO15A基因的cDNA序列,实际也包括相应的RNA序列。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显 和容易理解,其中:
图1:显示了根据本发明一个实施例的筛选易患感音神经性耳聋疾病的生物样品的系统及其组成部分的示意图,其中,
A为根据本发明实施例的筛选易患感音神经性耳聋疾病患者的生物样品的系统的示意图,
B为根据本发明实施例的核酸提取装置的示意图,
C为根据本发明实施例的核酸序列确定装置的示意图。
图2:显示了根据本发明一个实施例的感音神经性耳聋疾病患者的家系图谱。
图3:显示了根据本发明一个实施例的MYO15A基因突变体的Sanger法测序结果。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
MYO15A基因突变体
根据本发明的第一方面,本发明提出了一种分离的编码MYO15A基因突变体的核酸。根据本发明的实施例,所述核酸与SEQ ID NO:1相比,具有选自下列的至少一种突变:c.IVS25+3G>A、c.8375T>C。即相对于野生型MYO15A基因,本发明的MYO15A基因具有一个错义突变c.8375T>C和一个剪接位点突变c.IVS25+3G>A的至少一种。根据本发明的具体实施例,上述错义突变c.8375T>C为相对于野生型MYO15A基因的cDNA的第8375位由T突变成C。根据本发明的实施例,发明人确定了MYO15A基因的新突变体,该突变体与感音神经性耳聋疾病的发病密切相关,从而通过检测该新突变体在生物样品中是否存在,可以有效地检测生物样品是否易患感音神经性耳聋疾病。
在本文中所使用的表达方式“编码MYO15A突变体的核酸”,是指与编码MYO15A突变体的基因相对应的核酸物质,即核酸的类型不受特别限制,可以是任何包含与MYO15A突变体的编码基因相对应的脱氧核糖核苷酸和/或核糖核苷酸的聚合物,包括但不限于DNA、RNA或cDNA。根据本发明的一个具体示例,前面所述的编码MYO15A突变体的核酸为DNA。根据本发明的实施例,发明人确定了MYO15A基因的新突变体,这些新突变体与感音神经性耳聋疾病的发病密切相关,从而通过检测该新突变体在生物样品中是否存在,可以有效地检测生物样品是否易患感音神经性耳聋疾病,也可以通过检测这些突变体在生物体中是否存在,可以有效地预测生物体是否易患感音神经性耳聋疾病。
该编码MYO15A突变体的核酸,是本申请的发明人通过高通量外显子组测序联合候选基因突变验证的方法确定的感音神经性耳聋疾病的致病基因上的新突变。该突变位点在现有技术中并未被提到。
其中,野生型MYO15A基因的cDNA具有如下所示的核苷酸序列:
ATGGCGAAGGAGGAAGATGAGGAGAAGAAAGCCAAGAAAGGGAAGAAGGGGA AGAAGGCACCGGAGCCGGAGAAGCCCAAACGGAGCCTGAAGGGGACGTCGCGGCT GTTCATGGGCTTCCGCGACCGTACACCCAAGATCTCCAAGAAGGGCCAGTTCCGCAG CGCCTCGGCCTTCTTCTGGGGCCTCCACACCGGCCCCCAGAAGACCAAGCGCAAGAG GAAGGCCCGCACCGTGCTCAAGTCCACGTCAAAGCTCATGACGCAGATGCGCATGGG CAAGAAGAAGCGGGCGATGAAGGGCAAGAAGCCGTCCTTCATGGTGATCCGCTTCCC AGGCCGCCGTGGCTACGGCCGCCTGCGGCCGCGCGCCCGGTCACTCAGCAAAGCGTC CACGGCCATCAACTGGCTCACAAAAAAGTTCCTCCTCAAGAAGGCCGAGGAGTCGG GCAGCGAACAGGCCACAGTGGACGCCTGGCTGCAGCGCTCGAGCTCCCGCATGGGCT CCCGCAAACTCCCCTTCCCGTCGGGTGCCGAGATCCTGCGGCCTGGGGGCCGGCTCC GGAGGTTCCCCCGCAGCCGCAGCATCTACGCGTCAGGCGAGCCCCTGGGCTTCCTGC CCTTCGAGGACGAGGCCCCATTCCATCACTCGGGCTCCCGCAAGTCGCTGTACGGGCT TGAGGGCTTCCAGGACCTGGGCGAGTATTATGACTATCACCGCGACGGCGACGACTAC TACGACCGGCAGTCACTCCACCGCTACGAGGAGCAGGAACCCTACCTGGCGGGCCTC GGCCCCTACAGCCCGGCCTGGCCACCCTACGGCGACCACTACTACGGGTACCCGCCC GAGGATCCCTACGACTACTACCACCCCGACTATTACGGTGGCCCCTTTGATCCGGGGT ACACCTACGGCTACGGCTACGACGATTACGAACCCCCATATGCGCCCCCGTCGGGGTA CTCGTCTCCTTACAGCTACCACGATGGGTACGAGGGCGAGGCGCACCCTTATGGCTAC TACCTGGATCCCTATGCGCCGTACGACGCGCCATACCCACCCTATGACCTCCCATACCA CACTCCCTACGATGTACCCTACTTTGATCCCTACGGAGTCCACTACACCGTCCCCTATG CCGAAGGCGTCTATGGCGGTGGGGACGAGGCCATCTACCCCCCCGAGGTGCCCTATTT TTACCCGGAGGAGTCGGCTTCGGCCTTTGTGTACCCCTGGGTACCACCGCCCATCCCG TCGCCCCACAACCCGTATGCCCACGCCATGGATGACATCGCCGAGCTGGAGGAACCA GAGGACGCGGGCGTAGAGCGTCAGGGGACCTCCTTCCGCCTGCCCAGCGCCGCCTTC TTCGAGCAGCAAGGCATGGATAAGCCCGCCAGGTCCAAGCTGTCCCTCATCCGCAAG TTCCGCCTCTTCCCGCGACCCCAGGTGAAGCTGTTTGGGAAGGAGAAGCTGGAGGTG CCCCTGCCACCCTCTCTGGACATTCCTCTCCCCTTGGGGGATGCGGACGAAGAAGAG GACGAGGAGGAGCTGCCCCCGGTTTCCGCTGTGCCCTACGGCCACCCTTTCTGGGGC TTCCTCACGCCGCGCCAGCGCAACCTCCAGCGCGCGCTGTCGGCCTTCGGCGCCCAC CGGGGCCTGGGCTTCGGCCCTGAGTTTGGCCGCCCCGTGCCTCGCCCTGCCACCTCG CTTGCGCGGTTCCTCAAGAAGACGCTGTCGGAGAAGAAGCCCATCGCGCGGCTCAGG GGCAGCCAGAAGGCCCGGGCGGGCGGCCCTGCTGTCAGGGAGGCGGCCTACAAACG CTTCGGCTACAAGCTGGCTGGCATGGACCCCGAGAAGCCCGGCACGCCCATCGTGCT GAGGAGGGCCCAGCCACGCGCTCGCAGCAGCAACGACGCGCGCCGCCCGCCCGCGC CACAGCCCGCGCCCAGGACCCTCTCCCACTGGAGCGCGCTCCTGTCTCCGCCCGTGC CCCCGCGGCCCCCAAGCTCCGGGCCCCCGCCCGCGCCGCCGCTCTCCCCGGCGCTCT CGGGCCTGCCCCGGCCGGCCTCGCCCTACGGCTCCCTCCGCCGCCACCCGCCGCCCT GGGCCGCCCCAGCGCACGTGCCACCGGCGCCGCAGGCCAGCTGGTGGGCCTTCGTG GAGCCCCCTGCCGTGAGCCCGGAGGTGCCCCCCGACCTACTAGCCTTCCCAGGGCCC CGACCCTCGTTCAGGGGCTCCCGCCGGAGAGGGGCGGCTTTCGGCTTCCCCGGGGCC TCTCCACGGGCGTCGCGGAGGCGAGCTTGGTCACCGCTGGCCTCGCCCCAGCCCTCG CTGAGGAGCTCGCCGGGCCTCGGCTACTGCTCACCCTTGGCGCCCCCGTCGCCTCAG CTGTCCTTGCGCACGGGCCCCTTCCAGCCGCCCTTCCTGCCCCCGGCCCGCCGGCC CCGCTCGCTGCAGGAGTCCCCAGCCCCACGCCGAGCCGCTGGGCGCCTGGGCCCACC CGGCTCGCCGCTGCCGGGCTCACCCAGGCCGCCCTCGCCGCCCCTGGGGCTCTGCCA CAGCCCGCGGCGCAGCTCCCTGAATCTGCCCTCGCGCCTCCCGCACACGTGGCGGCG CCTCAGCGAGCCACCCACTCGGGCTGTGAAGCCGCAAGTGCGCCTGCCCTTCCACCG ACCGCCCAGGGCCGGGGCCTGGCGGGCGCCCCTGGAACACCGGGAGAGCCCGCGAG AACCCGAGGACTCAGAGACGCCCTGGACTGTGCCCCCACTGGCCCCCAGCTGGGAC GTGGACATGCCTCCCACCCAACGCCCACCCTCCCCCTGGCCAGGAGGTGCAGGCAGC CGCCGAGGCTTTTCCAGGCCACCCCCTGTGCCGGAAAACCCCTTTCTCCAGCTCCTGG GCCCTGTGCCATCCCCCACCCTCCAGCCTGAGGATCCAGCTGCTGATATGACCAGGGT CTTCCTGGGCAGACACCATGAGCCGGGGCCTGGACAGCTCACCAAATCAGCTGGCCC AACCCCTGAGAAGCCTGAAGAAGAGGCCACCCTGGGGGACCCCCAGCTGCCAGCAG AGACCAAGCCTCCAACCCCAGCACCTCCCAAGGATGTCACTCCCCCCAAGGATATCA CTCCCCCCAAGGATGTCCTCCCAGAGCAAAAGACATTAAGGCCCAGCCTCTCATACCC ACTGGCTGCGTGTGACCAGACCAGGGCCACATGGCCACCATGGCACCGCTGGGGAAC ACTGCCCCAAGCCGCAGCCCCCTTGGCGCCCATCAGGGCCCCAGAGCCCCTGCCCAA GGGGGGTGAACGGCGCCAGGCAGCCCCTGGGCGTTTTGCTGTGGTCATGCCTCGTGT GCAGAAGCTGAGCTCTTTCCAGCGAGTTGGGCCTGCAACCCTGAAGCCTCAAGTCCA GCCCATTCAGGACCCCAAGCCAAGAGCCTGTAGTCTTCGCTGGTCCTGCCTCTGGCTT CGGGCAGATGCCTATGGACCCTGGCCACGAGTACACACCCATCCCCAGTCCTGCCACC TGGGCCCTGGAGCTGCCTGCCTGTCCCTTAGGGGCTCCTGGGAGGAGGTCGGCCCGC CAAGCTGGCGGAACAAGATGCACTCCATCCGCAACCTGCCATCCATGCGGTTCCGTG AGCAGCACGGGGAGGATGGTGTGGAGGACATGACACAGCTGGAAGACCTCCAGGAA ACCACTGTGCTGTCCAACCTCAAGATTAGATTTGAACGGAACCTCATCTACACATACAT TGGGAGCATCCTGGTGTCGGTGAACCCATACCAAATGTTTGGAATCTATGGGCCGGAG CAGGTGCAGCAGTACAACGGACGGGCCCTGGGAGAGAATCCCCCGCACCTCTTTGCT GTTGCAAATCTCGCCTTCGCCAAAATGCTCGATGCCAAACAGAACCAGTGCATAATCA TTAGTGGAGAGAGCGGCTCTGGCAAAACTGAGGCCACCAAGCTGATTCTGCGCTACC TGGCCGCCATGAACCAGAAACGGGAGGTCATGCAGCAGATAAAGATCCTGGAGGCAA CACCCCTCTTGGAGTCCTTCGGTAATGCCAAAACCGTCAGGAACGACAACTCCAGCC GCTTTGGGAAGTTTGTGGAAATCTTTCTGGAAGGGGGCGTGATCTCTGGTGCCATAAC CTCCCAGTACCTGCTTGAGAAATCCAGGATCGTGTTTCAGGCCAAAAACGAGAGGAA TTACCACATCTTCTACGAGTTGCTGGCCGGGTTGCCTGCCCAGCTCAGGCAGGCCTTT AGCCTGCAAGAGGCTGAGACCTACTACTATCTGAACCAGGGTGGGAACTGTGAGATA GCAGGAAAGAGCGATGCAGATGACTTTCGCCGGCTCCTGGCTGCCATGGAGGTGTTG GGCTTCAGCAGTGAGGACCAGGACAGCATCTTCCGCATCCTGGCCTCCATCCTGCACC TGGGCAACGTCTACTTTGAGAAGTATGAGACGGATGCACAGGAGGTGGCCTCAGTGG TGAGTGCCCGAGAGATCCAGGCCGTGGCAGAGCTGCTGCAGATCTCCCCTGAGGGCC TGCAGAAGGCCATCACCTTCAAAGTGACCGAGACAATGCGAGAGAAGATCTTCACGC CCCTAACTGTGGAGAGCGCTGTGGATGCCAGGGACGCCATCGCCAAGGTCTTGTATGC ACTGCTGTTCAGCTGGCTCATCACCAGGGTCAACGCGCTGGTGTCCCCAAGGCAGGA CACACTGTCCATCGCCATCCTGGACATCTATGGTTTCGAGGACCTGAGCTTCAACAGC TTTGAGCAGCTGTGTATTAACTACGCAAACGAGAACCTTCAGTACCTTTTCAACAAGA TCGTCTTCCAGGAGGAGCAGGAGGAGTACATCCGTGAGCAGATAGACTGGCAGGAGA TCACCTTTGCTGACAACCAGCCCTGCATCAACCTCATCTCACTGAAGCCTTATGGCAT CCTGCGGATCCTTGACGACCAGTGTTGCTTTCCCCAGGCTACAGACCACACCTTCCTA CAGAAGTGCCACTACCATCATGGCGCCAACCCGCTCTATTCCAAACCCAAGATGCCGC TGCCTGAGTTCACCATCAAGCACTATGCAGGCAAGGTCACCTACCAGGTGCACAAGT TCCTGGACAAGAACCACGACCAAGTGCGCCAGGATGTGCTGGACCTGTTCGTACGGA GCCGGACACGGGTGGTGGCACACCTCTTCTCCAGCCATGCCCCACAGGCTGCCCCTC AGCGCCTGGGCAAGAGCAGCTCCGTCACTCGGCTCTACAAGGCGCACACTGTGGCCG CCAAGTTCCAGCAGTCACTCCTGGATCTGGTGGAAAAGATGGAGAGGTGCAACCCCT TGTTCATGCGTTGCCTGAAGCCCAACCACAAGAAGGAGCCAGGTCTCTTTGAGCCAG ATGTGGTAATGGCACAATTACGCTATTCAGGGGTGCTGGAGACCGTGAGGATCCGCAA GGAGGGATTTCCAGTGCGCCTGCCTTTCCAGGGGTTCATCGACAGGTACTGCTGTCTA GTGGCCCTCAAGCATGACCTGCCGGCTAATGGGGACATGTGTGTGTCAGTGCTGAG TCGCCTGTGCAAAGTCATGCCAAACATGTACCGTGTTGGGGTCAGCAAGCTGTTCCTT AAGGAACACCTATACCAGCTGCTGGAGAGTATGCGAGAGCATGTCCTGAATCTGGCA GCCCTCACTCTGCAGCGCTGCCTCCGTGGCTTCTTCATTAAGCGGCGATTCCGCTCTCT GCGCCACAAGATCATCCTGCTGCAAAGCCGGGCCCGTGGCTACCTTGCCAGGCAACG CTATCAGCAGATGAGGAGGAGTCTGGTGAAGTTCCGGTCCCTGGTACACGCATACGTG AGCCGCCGACGCTATCTCAAGCTGAGGGCAGAGTGGAGGTGCCAGGTGGAGGGGGC GCTGCTGTGGGAGCAGGAGGAGCTGAGCAAGCGGGAGGTAGTCGCTGTGGGGCACC TGGAGGTACCGGCTGAGCTGGCTGGGCTCTTGCAAGCAGTGGCAGGCCTCGGGCTGG CCCAGGTGCCTCAGGTGGCCCCTGTGAGGACTCCTCGACTCCAGGCTGAGCCCCGTG TCACACTGCCCCTGGACATCAACAACTATCCTATGGCCAAGTTTGTCCAGTGCCACTT CAAGGAACCTGCCTTTGGGATGCTGACAGTGCCCCTGAGGACACCCCTCACGCAGCT GCCAGCCGAGCACCATGCAGAAGCCGTGAGCATCTTCAAGCTGATCCTGCGCTTCATG GGCGACCCCCACCTGCATGGTGCCCGGGAGAACATCTTCGGGAACTACATCGTGCAG AAGGGGCTGGCGGTGCCTGAGCTGCGGGATGAGATCCTGGCACAGCTGGCCAATCAG GTGTGGCACAATCACAATGCCCACAATGCTGAGCGGGGCTGGCTGCTGCTGGCCGCC TGCCTCAGTGGCTTTGCACCTTCCCCGTGCTTCAACAAGTACCTTCTCAAGTTTGTGT CTGATTATGGGCGGAATGGCTTCCAGGCTGTGTGTCAGCACCGCCTCATGCAGGCCAT GGGCCGGGCCCAACAGCAGGGCTCGGGGGCTGCCCGCACCTTACCCCCGACCCAGCT CGAGTGGACAGCGACCTATGAGAAGGCCAGCATGGCGCTGGACGTGGGCTGCTTCAA TGGTGACCAGTTCTCCTGCCCGGTGCACTCCTGGAGTACGGGGGAAGAGGTGGCTGG AGACATTCTGAGGCACAGGGGGCTGGCAGATGGCTGGCGCGGCTGGACCGTGGCCAT GAAGAATGGTGTCCAGTGGGCAGAGCTGGCTGGCCACGACTACGTGTTAGACCTGGT GTCGGACCTGGAGCTGCTCAGGGACTTCCCTCGACAGAAGTCCTACTTCATTGTGGGC ACAGAGGGGCCTGCAGCCAGCAGGGGAGGCCCCAAAGTGGTGTTTGGGAACAGCTG GGACTCGGATGAGGACATGTCCACTAGACCCCAGCCCCAGGAGCACATGCCCAAAGT ACTTGACTCTGATGGGTACAGCAGCCACAATCAGGACGGTACAAATGGGGAGACTGA GGCCCAAAGAGGGACAGCAACCCACCAAGAGTCAGACAGTCTTGGAGAGCCTGCTG TGCCCCACAAGGGGCTGGACTGCTACCTGGATAGCCTCTTTGACCCTGTGCTGTCCTA CGGGGATGCGGACCTGGAGAAGCCAACAGCCATTGCCTACCGCATGAAAGGGGGAG GCCAGCCCGGTGGAGGCAGCAGTAGTGGTACTGAAGACACCCCCAGGAGACCCCCA GAGCCAAAGCCAATCCCAGGCCTGGATGCCTCCACATTGGCTCTGCAGCAAGCCTTCA TCCACAAACAGGCCGTGCTGCTGGCCCGGGAGATGACCCTGCAGGCCACGGCACTCC AGCAGCAGCCCCTGAGTGCTGCCCTGAGATCCTTGCCCGCAGAGAAACCCCCAGCAC CAGAGGCACAGCCGACGTCTGTAGGCACCGGTCCCCCTGCCAAACCCGTGCTCCTGC GTGCCACTCCAAAGCCCTTGGCCCCAGCCCCTCTGGCCAAGGCTCCAAGGCTCCCCA TCAAGCCTGTGGCTGCCCCTGTTCTAGCTCAGGATCAGGCTTCTCCAGAAACCACTTC ACCCTCCCCAGAGCTGGTCCGGTACTCTACGCTCAACTCTGAGCACTTCCCACAGCCC ACACAGCAGATCAAGAATATTGTCAGGCAGTACCAGCAGCCGTTCCGGGGAGGCCGG CCTGAGGCCCTCAGGAAGGATGGCGGGAAAGTGTTCATGAAGCGGCCAGACCCTCAT GAGGAGGCCCTGATGATCCTGAAAGGGCAGATGACCCACCTGGCAGCTGCACCTGGC ACCCAGGTGTCCAGAGAGGCCGTGGCCCTGGTGAAGCCGGTGACCAGTGCACCAAG GCCATCCATGGCACCCACTTCAGCTCTGCCCTCGCGATCGCTGGAGCCCCCTGAGGAA CTCACGCAGACGCGGCTGCACCGCCTCATCAATCCCAACTTCTACGGCTATCAGGACG CCCCCTGGAAGATCTTCCTGCGCAAAGAGGTGTTTTACCCCAAGGACAGCTACAGCC ATCCTGTGCAGCTTGACCTCCTGTTCCGGCAGATCCTGCACGACACGCTCTCCGAGGC CTGCCTTCGCATCTCTGAGGATGAGAGGCTCAGGATGAAGGCCTTGTTTGCCCAGAAC CAGCTGGACACACAGAAGCCTCTGGTAACGGAAAGCGTGAAGCGGGCCGTGGTCAG CACTGCACGAGACACCTGGGAGGTCTACTTCTCCCGCATCTTCCCCGCCACGGGCAG CGTGGGCACTGGTGTGCAGCTCCTAGCTGTGTCCCACGTGGGCATCAAACTCCTGAG GATGGTCAAGGGTGGCCAGGAGGCCGGCGGGCAGCTGCGGGTCCTGCGTGCATACAG CTTTGCAGATATCCTGTTTGTGACCATGCCCTCCCAGAACATGCTGGAGTTCAACCTG GCCAGTGAGAAGGTCATCCTCTTCTCAGCCCGAGCGCACCAGGTCAAGACCCTGGTA GATGACTTCATCTTGGAGCTGAAGAAGGACTCTGACTACGTGGTCGCTGTGAGGAAC TTCCTGCCTGAGGACCCTGCGCTGCTGGCTTTCCACAAGGGTGACATCATACACCTGC AGCCCCTAGAGCCACCTCGAGTGGGCTACAGTGCTGGCTGCGTGGTTCGCAGGAAGG TGGTGTACCTGGAGGAGCTGCGACGTAGAGGCCCCGACTTTGGCTGGAGGTTCGGGA CCATCCACGGGCGCGTGGGCCGCTTCCCTTCGGAGCTGGTGCAGCCCGCTGCTGCCC CCGACTTCCTGCAGCTGCCAACGGAGCCAGGCCGCGGCCGAGCAGCCGCCGTGGCC GCTGCTGTGGCCTCTGCAGCCGCTGCACAGGAGGTGGGCCGCAGGAGAGAGGGTCC CCCAGTCAGGGCCCGCTCTGCTGACCATGGGGAGGACGCCCTGGCGCTCCCACCCTA CACAATGCTCGAGTTTGCCCAGAAGTATTTCCGAGACCCTCAGAGGAGACCCCAGGA TGGCCTCAGGCTGAAATCCAAGGAGCCTCGGGAGTCCAGAACCTTGGAGGACATGCT TTGCTTCACCAAGACTCCCCTCCAGGAATCCCTCATCGAACTCAGCGACAGCAGCCTC AGCAAGATGGCCACCGACATGTTCCTAGCTGTAATGAGGTTCATGGGGGATGCCCCAC TGAAGGGCCAGAGTGACCTGGACGTGCTTTGTAACCTCCTGAAGCTGTGCGGGGACC ATGAGGTCATGCGGGATGAATGTTACTGCCAAGTTGTGAAGCAGATCACAGACAATAC CAGCTCCAAGCAGGACAGCTGCCAGCGAGGCTGGAGGCTGCTGTATATCGTGACCGC CTACCACAGCTGCTCTGAGGTCCTCCACCCACACCTCACTCGCTTCCTCCAAGACGTG AGCCGGACCCCAGGCCTGCCCTTTCAGGGGATCGCCAAGGCCTGCGAGCAGAACCTG CAGAAAACCTTGCGCTTCGGAGGTCGTCTGGAGCTCCCCAGCAGCATAGAGCTTCGG GCCATGTTGGCAGGCCGCAGTTCCAAGAGGCAACTCTTTCTTCTTCCTGGAGGCCTTG AACGCCATCTCAAAATCAAAACATGCACTGTGGCCCTGGACGTGGTGGAAGAGATAT GTGCTGAGATGGCTCTGACACGCCCTGAGGCCTTCAATGAATATGTTATCTTCGTTGTC ACCAACCGTGGCCAGCATGTGTGCCCACTCAGTCGCCGTGCTTACATCCTGGATGTGG CCTCAGAGATGGAGCAGGTGGACGGCGGCTACATGCTCTGGTTCCGGCGTGTGCTCT GGGATCAGCCACTCAAGTTCGAGAATGAGCTATATGTGACCATGCACTACAACCAGGT CCTGCCTGACTACCTGAAGGGACTCTTCAGCAGTGTGCCGGCCAGCCGGCCCAGCGA GCAGCTGCTGCAGCAGGTGTCCAAGCTGGCTTCACTGCAGCATCGCGCCAAGGACCA CTTCTACCTGCCGAGCGTGCGGGAAGTCCAGGAGTACATCCCAGCCCAGCTCTACCGT ACAACGGCAGGCTCGACCTGGCTCAACCTGGTCAGCCAGCACCGGCAGCAGACACA GGCGCTCAGCCCCCACCAGGCCCGTGCCCAGTTTCTGGGCCTCCTCAGCGCCTTACCT ATGTTCGGCTCCTCCTTCTTCTTCATCCAGAGCTGCAGCAACATTGCTGTGCCAGCCCC TTGCATCCTTGCCATCAACCACAATGGCCTCAACTTTCTCAGCACAGAGACTCATGAA TTGATGGTGAAGTTCCCCCTGAAGGAGATCCAGTCGACGCGGACCCAGCGGCCCACG GCCAACTCCAGCTACCCCTATGTGGAGATTGCGCTGGGGGACGTGGCGGCCCAGCGC ACCTTGCAGCTGCAGCTGGAGCAGGGACTGGAACTGTGTCGTGTGGTGGCCGTGCAC GTGGAGAACCTGCTCAGTGCCCATGAGAAGCGGCTCACATTGCCCC CCAGCGAGATCACCCTGCTCTGA(SEQ ID NO:1),
其编码的蛋白质具有如下所示的氨基酸序列:
MAKEEDEEKKAKKGKKGKKAPEPEKPKRSLKGTSRLFMGFRDRTPKISKKGQFRSA SAFFWGLHTGPQKTKRKRKARTVLKSTSKLMTQMRMGKKKRAMKGKKPSFMVIRFPG RRGYGRLRPRARSLSKASTAINWLTKKFLLKKAEESGSEQATVDAWLQRSSSRMGSRKL PFPSGAEILRPGGRLRRFPRSRSIYASGEPLGFLPFEDEAPFHHSGSRKSLYGLEGFQDLGE YYDYHRDGDDYYDRQSLHRYEEQEPYLAGLGPYSPAWPPYGDHYYGYPPEDPYDYYHP DYYGGPFDPGYTYGYGYDDYEPPYAPPSGYSSPYSYHDGYEGEAHPYGYYLDPYAPYD APYPPYDLPYHTPYDVPYFDPYGVHYTVPYAEGVYGGGDEAIYPPEVPYFYPEESASAFV YPWVPPPIPSPHNPYAHAMDDIAELEEPEDAGVERQGTSFRLPSAAFFEQQGMDKPARSK LSLIRKFRLFPRPQVKLFGKEKLEVPLPPSLDIPLPLGDADEEEDEEELPPVSAVPYGHPFW GFLTPRQRNLQRALSAFGAHRGLGFGPEFGRPVPRPATSLARFLKKTLSEKKPIARLRGSQ KARAGGPAVREAAYKRFGYKLAGMDPEKPGTPIVLRRAQPRARSSNDARRPPAPQPAPRT LSHWSALLSPPVPPRPPSSGPPPAPPLSPALSGLPRPASPYGSLRRHPPPWAAPAHVPPAPQ ASWWAFVEPPAVSPEVPPDLLAFPGPRPSFRGSRRRGAAFGFPGASPRASRRRAWSPLASP QPSLRSSPGLGYCSPLAPPSPQLSLRTGPFQPPFLPPARRPRSLQESPAPRRAAGRLGPPGSP LPGSPRPPSPPLGLCHSPRRSSLNLPSRLPHTWRRLSEPPTRAVKPQVRLPFHRPPRAGAW RAPLEHRESPREPEDSETPWTVPPLAPSWDVDMPPTQRPPSPWPGGAGSRRGFSRPPPVP ENPFLQLLGPVPSPTLQPEDPAADMTRVFLGRHHEPGPGQLTKSAGPTPEKPEEEATLGDP QLPAETKPPTPAPPKDVTPPKDITPPKDVLPEQKTLRPSLSYPLAACDQTRATWPPWHRW GTLPQAAAPLAPIRAPEPLPKGGERRQAAPGRFAVVMPRVQKLSSFQRVGPATLKPQVQPI QDPKPRACSLRWSCLWLRADAYGPWPRVHTHPQSCHLGPGAACLSLRGSWEEVGPPSW RNKMHSIRNLPSMRFREQHGEDGVEDMTQLEDLQETTVLSNLKIRFERNLIYTYIGSILV SVNPYQMFGIYGPEQVQQYNGRALGENPPHLFAVANLAFAKMLDAKQNQCIIISGESGSG KTEATKLILRYLAAMNQKREVMQQIKILEATPLLESFGNAKTVRNDNSSRFGKFVEIFLEG GVISGAITSQYLLEKSRIVFQAKNERNYHIFYELLAGLPAQLRQAFSLQEAETYYYLNQG GNCEIAGKSDADDFRRLLAAMEVLGFSSEDQDSIFRILASILHLGNVYFEKYETDAQEVAS VVSAREIQAVAELLQISPEGLQKAITFKVTETMREKIFTPLTVESAVDARDAIAKVLYALLF SWLITRVNALVSPRQDTLSIAILDIYGFEDLSFNSFEQLCINYANENLQYLFNKIVFQEEQEE YIREQIDWQEITFADNQPCINLISLKPYGILRILDDQCCFPQATDHTFLQKCHYHHGANPLY SKPKMPLPEFTIKHYAGKVTYQVHKFLDKNHDQVRQDVLDLFVRSRTRVVAHLFSSHAP QAAPQRLGKSSSVTRLYKAHTVAAKFQQSLLDLVEKMERCNPLFMRCLKPNHKKEPGLF EPDVVMAQLRYSGVLETVRIRKEGFPVRLPFQGFIDRYCCLVALKHDLPANGDMCVSVLS RLCKVMPNMYRVGVSKLFLKEHLYQLLESMREHVLNLAALTLQRCLRGFFIKRRFRSLR HKIILLQSRARGYLARQRYQQMRRSLVKFRSLVHAYVSRRRYLKLRAEWRCQVEGALLW EQEELSKREVVAVGHLEVPAELAGLLQAVAGLGLAQVPQVAPVRTPRLQAEPRVTLPLDI NNYPMAKFVQCHFKEPAFGMLTVPLRTPLTQLPAEHHAEAVSIFKLILRFMGDPHLHGAR ENIFGNYIVQKGLAVPELRDEILAQLANQVWHNHNAHNAERGWLLLAACLSGFAPSPCF NKYLLKFVSDYGRNGFQAVCQHRLMQAMGRAQQQGSGAARTLPPTQLEWTATYEKAS MALDVGCFNGDQFSCPVHSWSTGEEVAGDILRHRGLADGWRGWTVAMKNGVQWAEL AGHDYVLDLVSDLELLRDFPRQKSYFIVGTEGPAASRGGPKVVFGNSWDSDEDMSTRPQ PQEHMPKVLDSDGYSSHNQDGTNGETEAQRGTATHQESDSLGEPAVPHKGLDCYLDSLF DPVLSYGDADLEKPTAIAYRMKGGGQPGGGSSSGTEDTPRRPPEPKPIPGLDASTLALQQ AFIHKQAVLLAREMTLQATALQQQPLSAALRSLPAEKPPAPEAQPTSVGTGPPAKPVLLRA TPKPLAPAPLAKAPRLPIKPVAAPVLAQDQASPETTSPSPELVRYSTLNSEHFPQPTQQIKNI VRQYQQPFRGGRPEALRKDGGKVFMKRPDPHEEALMILKGQMTHLAAAPGTQVSREAV ALVKPVTSAPRPSMAPTSALPSRSLEPPEELTQTRLHRLINPNFYGYQDAPWKIFLRKEVF YPKDSYSHPVQLDLLFRQILHDTLSEACLRISEDERLRMKALFAQNQLDTQKPLVTESVK RAVVSTARDTWEVYFSRIFPATGSVGTGVQLLAVSHVGIKLLRMVKGGQEAGGQLRVLR AYSFADILFVTMPSQNMLEFNLASEKVILFSARAHQVKTLVDDFILELKKDSDYVVAVRN FLPEDPALLAFHKGDIIHLQPLEPPRVGYSAGCVVRRKVVYLEELRRRGPDFGWRFGTIH GRVGRFPSELVQPAAAPDFLQLPTEPGRGRAAAVAAAVASAAAAQEVGRRREGPPVRARS ADHGEDALALPPYTMLEFAQKYFRDPQRRPQDGLRLKSKEPRESRTLEDMLCFTKTPLQ ESLIELSDSSLSKMATDMFLAVMRFMGDAPLKGQSDLDVLCNLLKLCGDHEVMRDECY CQVVKQITDNTSSKQDSCQRGWRLLYIVTAYHSCSEVLHPHLTRFLQDVSRTPGLPFQGIA KACEQNLQKTLRFGGRLELPSSIELRAMLAGRSSKRQLFLLPGGLERHLKIKTCTVALDV VEEICAEMALTRPEAFNEYVIFVVTNRGQHVCPLSRRAYILDVASEMEQVDGGYMLWFR RVLWDQPLKFENELYVTMHYNQVLPDYLKGLFSSVPASRPSEQLLQQVSKLASLQHRAK DHFYLPSVREVQEYIPAQLYRTTAGSTWLNLVSQHRQQTQALSPHQARAQFLGLLSALPM FGSSFFFIQSCSNIAVPAPCILAINHNGLNFLSTETHELMVKFPLKEIQSTRTQRPTANSSYP YVEIALGDVAAQRTLQLQLEQGLELCRVVAVHVENLLSAHEKRLTLPPSEITLL(SEQ ID NO:2)。
发明人发现的MYO15A基因突变体与SEQ ID NO:1相比,本发明的MYO15A基因具有一个突变c.8375T>C和一个剪接位点突变c.IVS25+3G>A的至少一种,即相对于野生型MYO15A基因,本发明的MYO15A基因突变体的cDNA的第8375位由T突变成C。c.IVS25+3G>A表示在MYO15A基因中的第25个内含子的第三位由G突变成A,此处预测为剪接位点。根据本发明的具体实施例,上述MYO15A基因的突变c.IVS25+3G>A的基因序列来源为:
http://genome.ucsc.edu/cgi-bin/hgc?hgsid=330772469&g=htcCdnaAli&i=NM_016239&c=chr17&l=80838125&r=81073968&o=18012019&aliTable=refSeqAli&table=refGene,该序列区域在染色体上的物理坐标为:chr17:18012020-18083116。
发明人进一步的研究发现,当在MYO15A基因突变体中同时出现c.8375T>C和c.IVS25+3G>A突变时,检测生物样品都患有的常染色体隐性遗传型感音神经性耳聋;携带其中任何一种突变不致病,但后代换感音神经性耳聋的几率大大增加。通过检测具有2个突变位点的MYO15A基因突变体在生物样品中是否存在,可以准确有效地预测生物体是否患常染色体隐性遗传型感音神经性耳聋。
根据本发明的第二个方面,本发明提出了一种分离的多肽。根据本发明的实施例,与SEQ ID NO:2相比,该多肽具有p.V2792A突变。根据本发明的具体实施例,该多肽是由前述分离的编码MYO15A基因突变体的核酸编码的。通过检测生物样品中是否表达该多肽,可以有效地检测生物样品是否易患感音神经性耳聋疾病,也可以通过检测这些多肽在生物体中是否存在,可以有效地预测生物体是否易患感音神经性耳聋疾病。
筛选易患感音神经性耳聋疾病的生物样品的方法
根据本发明的第三个方面,本发明提出了一种筛选易患感音神经性耳聋疾病的生物样品的方法。根据本发明的实施例,该筛选易患感音神经性耳聋疾病的生物样品的方法可以包括以下步骤:
首先,从所述生物样品提取核酸样本。根据本发明的实施例,生物样品的类型并不受特别限制,只要从该生物样品中能够提取到反映生物样品MYO15A是否存在突变的核酸样本即可。根据本发明的实施例,生物样品可以为选自人体血液、皮肤、皮下组织的至少一种。由此,可以方便地进行取样和检测,从而能够进一步提高筛选易患感音神经性耳聋疾病的生物样品的效率。根据本发明的实施例,这里所使用的术语“核酸样本”应做广义理解,其可以是任何能够反映生物样品中MYO15A是否存在突变的样本,例如可以是从生物样品中直接提取的全基因组DNA,也可以是该全基因组中包含MYO15A编码序列的一部分,可以是从生物样品中提取的总RNA,也可以是从生物样品中提取的mRNA。根据本发明的一个实施例,所述核酸样本为全基因组DNA。由此,可以扩大生物样品的来源范围,并且可以同时对生物样品的多种信息进行确定,从而能够提高筛选易患感音神经性耳聋疾病的生物样品的效率。另外,根据本发明的实施例,针对采用RNA作为核酸样本,从生物样品提取核酸样本可以进一步包括:从生物样品提取RNA样本,优选RNA样本为mRNA;以及基于所得到的RNA样本,通过反转录反应,获得cDNA样本,所得到的cDNA样本构成核酸样本。由此,可以进一步提高利用RNA作为核酸样本筛选易患感音神经性耳聋疾病的生物样品的效率。
接下来,在得到核酸样本之后,可以对核酸样本进行分析,从而能够确定所得到核酸样本的核酸序列。根据本发明的实施例,确定所得到核酸样本的核酸序列的方法和设备并不受特别限制。根据本发明的具体实施例,可以通过测序方法,确定核酸样本的核酸序列。 根据本发明的实施例,可以用于进行测序的方法和设备并不受特别限制。根据本发明的实施例,可以采用第二代测序技术,也可以采用第三代以及第四代或者更先进的测序技术。根据本发明的具体示例,可以利用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种对核酸序列进行测序。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,能够提高后续对测序数据进行分析时的精确性和准确度。由此,根据本发明的实施例,确定核酸样本的核酸序列可以进一步包括:首先,针对所得到的核酸样本,构建核酸测序文库;以及对所得到的核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。根据本发明的一些实施例,可以采用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种对所得到的核酸测序文库进行测序。另外,根据本发明的实施例,可以对核酸样本进行筛选,富集MYO15A外显子,该筛选富集可以在构建测序文库之前,构建测序文库过程中,或者构建测序文库之后进行。根据本发明的一个实施例,针对核酸样本,构建核酸测序文库进一步包括:利用MYO15A基因外显子特异性引物,对核酸样本进行PCR扩增;以及针对所得到的扩增产物,构建核酸测序文库。由此,可以通过PCR扩增,富集MYO15A基因外显子,从而能够进一步提高筛选易患感音神经性耳聋疾病的生物样品的效率。根据本发明的实施例,MYO15A基因外显子特异性引物的序列不受特别限制,根据本发明的优选实施例,这些MYO15A基因外显子特异性引物具有如下表所示的核苷酸序列,即SEQ ID NO:3-6所示的核苷酸序列。发明人惊奇地发现,通过采用这些引物,可以在PCR反应体系中显著有效地完成对MYO15A外显子尤其是c.IVS25+3G>A、c.8375T>C突变所在的外显子序列的扩增。需要说明的是,这些SEQ ID NO:3-6所示的核苷酸序列是本发明的发明人在付出了艰苦的劳动后,意外获得的。
根据本发明的具体实施例,上述的感音神经性耳聋疾病是常染色体隐性遗传疾病。
关于针对核酸样本,构建测序文库的方法和流程,本领域技术人员可以根据不同的测序技术进行适当选择,关于流程的细节,可以参见测序仪器的厂商例如Illumina公司所提供的规程,例如参见Illumina公司Multiplexing Sample Preparation Guide(Part#1005361;Feb2010)或Paired-End SamplePrep Guide(Part#1005063;Feb2010),通过参照将其并入本文。 根据本发明的实施例,从生物样品提取核酸样本的方法和设备,也不受特别限制,可以采用商品化的核酸提取试剂盒进行。
需要说明的是,在这里所使用的术语“核酸序列”应作广义理解,其可以是在对核酸样本进行测序得到的测序数据进行组装后,得到的完整的核酸序列信息,也可以是直接采用通过对核酸样本进行测序所得到的测序数据(reads)作为核酸序列,只要这些核酸序列中含有对应MYO15A基因的编码序列即可。
最后,在确定核酸样本的核酸序列之后,将所得到的核酸样本的核酸序列与SEQ ID NO:1的序列相比对。如果在所得到的核酸序列中具有c.IVS25+3G>A、c.8375T>C突变,则指示生物样品易患感音神经性耳聋疾病。由此,通过根据本发明实施例的筛选易患感音神经性耳聋疾病的生物样品的方法,可以有效地筛选易患感音神经性耳聋疾病的生物样品。根据本发明的实施例,对核酸序列与SEQ ID NO:1进行比对的方法和设备并不受特别限制,可以采用任意常规的软件进行操作,根据本发明的具体实例,可以采用SOAP软件进行比对。
需要说明的是,根据本发明实施例的“筛选易患感音神经性耳聋疾病的生物样品的方法”的用途不受特别限制,例如可以用作非诊断目的的筛选方法。
筛选易患感音神经性耳聋疾病的生物样品的系统和试剂盒
根据本发明的第四个方面,本发明提出了一种筛选易患感音神经性耳聋疾病的生物样品的系统。
参考图1,根据本发明的实施例,该筛选易患感音神经性耳聋疾病的生物样品的系统1000包括核酸提取装置100、核酸序列确定装置200以及判断装置300。
根据本发明的实施例,核酸提取装置100用于从生物样品提取核酸样本。如前所述,根据本发明的实施例,核酸样本的类型并不受特别限制,对于采用RNA作为核酸样本,则核酸提取装置进一步包括RNA提取单元101和反转录单元102,其中,提取单元101用于从生物样品提取RNA样本,反转录单元102与RNA提取单元101相连,用于对RNA样本进行反转录反应,以便获得cDNA样本,所得到的cDNA样本构成核酸样本。
根据本发明的实施例,核酸序列确定装置200与核酸提取装置100相连,用于对核酸样本进行分析,以便确定核酸样本的核酸序列。如前所示,可以采用测序的方法确定核酸样本的核酸序列。由此,根据本发明的一个实施例,所述核酸序列确定装置200可以进一步包括:文库构建单元201以及测序单元202。文库构建单元201用于针对核酸样本,构建核酸测序文库;测序单元202与文库构建单元201相连,用于对核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。如前所述,可以通过PCR扩增,富集MYO15A外显子,进一步提高筛选易患感音神经性耳聋疾病的生物样品的效率。由此,文库构建单 元201可以进一步包括PCR扩增模块(图中未示出),在该PCR扩增模块中设置有MYO15A外显子特异性引物,以便利用MYO15A外显子特异性引物,对所述核酸样本进行PCR扩增,根据本发明的具体实施例,MYO15A基因外显子特异性引物具有如SEQ ID NO:3-6所示的核苷酸序列。根据本发明的实施例,测序单元202可以包括选自HISEQ2000、SOLiD、454和单分子测序装置的至少一种。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,提高后续对测序数据进行分析时的精确性和准确度。
根据本发明的实施例,判断装置300与核酸序列确定装置200相连,适于将核酸样本的核酸序列进行比对,以便基于核酸样本的核酸序列与SEQ ID NO:1的区别判断生物样品是否易患感音神经性耳聋疾病。具体地,基于核酸样本的核酸序列与SEQ ID NO:1相比,是否具有c.IVS25+3G>A、c.8375T>C的至少一种突变,判断生物样品是否易患感音神经性耳聋疾病。如前所述,根据本发明的一个实施例,核酸样本的核酸序列与SEQ ID NO:1相比,具有c.IVS25+3G>A、c.8375T>C的至少一种突变,是生物样品易患感音神经性耳聋疾病的指示。如前所述,根据本发明的实施例,对核酸序列与SEQ ID NO:1进行比对的设备并不受特别限制,可以采用任意常规的软件进行操作,根据本发明的具体实例,可以采用SOAP软件进行比对。
由此,利用该系统,能够有效地实施前述筛选易患感音神经性耳聋疾病的生物样品的方法,从而可以有效地筛选易患感音神经性耳聋疾病的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易患感音神经性耳聋疾病的生物样品的试剂盒。根据本发明的实施例,该用于筛选易患感音神经性耳聋疾病的生物样品的试剂盒包括:适于检测MYO15A基因突变体的试剂,其中与SEQ ID NO:1相比,该MYO15A基因突变体具有c.IVS25+3G>A、c.8375T>C的至少一种突变。利用根据本发明的实施例的试剂盒,能够有效地筛选易患感音神经性耳聋疾病的生物样品。在本文中,所使用的术语“适于检测MYO15A基因突变体的试剂”应做广义理解,即可以是检测MYO15A编码基因的试剂,也可以是检测MYO15A突变体多肽的试剂,例如可以采用识别特异性位点的抗体。根据本发明的一个实施例,所述试剂为核酸探针,由此,可以高效地筛选易患感音神经性耳聋疾病的生物样品。根据本发明的具体实施例,上述感音神经性耳聋疾病为常染色体隐性遗传疾病。
需要说明的是,在本文前面筛选易患感音神经性耳聋疾病的生物样品的方法部分中所描述的特征和优点,同样适用于筛选易患感音神经性耳聋疾病的生物样品的系统或者试剂盒,在此不再赘述。
下面参考具体实施例,对本发明进行说明,需要说明的是,这些实施例仅仅是说明性的,而不能理解为对本发明的限制。
若未特别指明,实施例中所采用的技术手段为本领域技术人员所熟知的常规手段,可以参照《分子克隆实验指南》第三版或者相关产品进行,所采用的试剂和产品也均为可商业获得的。未详细描述的各种过程和方法是本领域中公知的常规方法,所用试剂的来源、商品名以及有必要列出其组成成分者,均在首次出现时标明,其后所用相同试剂如无特殊说明,均与首次标明的内容相同。
实施例1确定感音神经性耳聋疾病的致病基因
样本收集:
发明人收集到一个2代的中国感音神经性耳聋患者家系,以及该家系外的208名正常人的基因。图1显示了感音神经性耳聋患者家系1的家系图谱。如图2所示,其中,□表示正常男性,○表示正常女性,■表示男性患者。由图2可知,该家系共有4名成员,其中第二代两个儿子为感音神经性耳聋患者,第一代的父母为正常成员。
发明人使用NimbleGen SeqCap EZ Human Exome Library v3.0全外显子捕获平台,结合Illumina Hiseq2000的高通量测序技术,对两位患者及其表型正常的父母进行了全外显子组捕获测序,详细步骤如下:
1、将基因组DNA随机打断成250-300bp左右的片段,随后在片段两端分别连接上接头制备杂交文库(详见http://www.illumina.com/提供的Illumina/Solexa标准建库说明书)。
2、纯化后的文库经过ligation-mediated PCR(LM-PCR)的线性扩增与捕获试剂进行杂交富集,进行LM-PCR的线性扩增后进行上机测序。测序平台为Illumina Hiseq2000,读取长度为90bp,每个样本的平均测序深度最少为50×。
3、测序后获得的原始数据由Illumina basecalling Software1.7进行处理,使用SOAPaligner2.20将过滤后的reads比对到参考基因组,得到比对到基因组上的Unique mapped reads。利用软件SOAPsnp确定靶区域的基因型。
信息分析后,病例1发现150277个单核苷酸多态性(SNPs)和11889个插入/缺失(Indels),病例2发现146217个SNP和11716个Indel,父亲发现154042个SNP和11879个Indel,母亲发现150686个SNP和11884个Indel。将结果与dbSNP数据库(http://hgdownload.cse.ucsc.edu/goldenPath/hg19/database/snp135.txt.gz),HapMap数据库(ftp://ftp.ncbi.nlm.nih.gov/hapmap),千人基因组数据库(ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp),炎黄数据库(http://yh.genomics.org.cn/)等公共数据库进行比较,过滤掉所有已知变异。
感音神经性耳聋属于有常隐和常显两种遗传模式,本研究结合家系实际情况,使用隐性遗传策略分析。将分析后的家系结果与目前已经报道的与耳聋相关的基因列表取交集, 得到16个已知基因的突变,其中两个患者共有的突变有6个。综合测序质量和信息分析筛选参考,发明人结合隐性策略分析,即父母杂合突变、孩子纯合突变或者父母同一基因各带有一突变、孩子同时拥有两个突变(复合杂合),发现MYO15A基因上的突变符合条件。根据分析,MYO15A中有3个突变为患者共有:一个错义突变c.8375T>C(V2792A)、一个剪接位点突变(c.IVS25+3G>A)和一个同义突变(c.9792G>A或c.463+2527G>A,rs149189607)。错义突变存在于父亲,其余两个突变存在于母亲,根据信息学分析,剪接突变或UTR区突变和错义突变形成复合杂合突变。为确定分析结果,发明人对结果进行Sanger测序验证(见表1),结果发现患者都携带MYO15A上的c.8375T>C(V2792A)错义突变和剪接位点突变IVS25+3G>A,父亲携带错义突变,母亲携带剪接突变(具体结果见图2),正常人中无此两种突变。由此,可初步推断错义突变和剪接位点突变为该家系致病突变。
MYO15A为已知耳聋致病基因,该基因包含66个外显子,编码蛋白大小为395.36KDa。MYO15A为非常规肌球蛋白,在耳蜗毛细胞静纤毛的形成中发挥了重要作用。研究表明,该基因的突变可引起常染色体隐性遗传性耳聋。
MYO15A基因为正义链编码。野生型cDNA序列如SEQ ID NO:1所示。剪接位点突变导致的蛋白变化无法验证。
实施例2Sanger法测序验证感音神经性耳聋疾病的致病基因
采集家系图2中四名成员的外周血,利用QIAmp Blood kit(Qiagen,Hilden,Germany)抽提外周血白细胞中的基因组DNA,利用Qubit Fluorometer和琼脂糖凝胶电泳测量DNA的浓度及纯度,所得的每个标本基因组DNAOD260/OD280均位于1.7-2.0之间,浓度不少于50ng/ul,总量不少于3μg。
分别对2名患者(图2中Ⅱ:1、Ⅱ:2)、2名家系内正常人(图2中Ⅰ:1、Ⅰ:2)以及100位家系外正常人基因进行检测,针对该MYO15A基因复合杂合突变位点所在序列设计引物,通过PCR扩增,产物纯化,测序的方法获得有关序列,根据序列测定结果属于突变型还是野生型,以及突变是否与表型在家系内呈共分离来验证相关性。具体方法步骤如下:
1)DNA提取:
分别采取2名家系内患者、2名家系内正常人及家系外100名正常人外周静脉血按照实施例1的方法提取基因组DNA、测定DNA含量和纯度。
2)引物设计及PCR反应
引物设计参考人类基因组序列数据库GRCh37/hg19,具体见下。
a)引物序列:
b)PCR反应体系:
双蒸水 |
15.3μl |
10X缓冲液 |
2μl |
模板 |
1μl |
上游引物 |
0.5μl |
下游引物 |
0.5μl |
三磷酸脱氧核苷 |
0.5μl |
TransStart Taq聚合酶 |
0.2μl |
总体积 |
20μl |
c)PCR反应条件:
95℃ |
5分钟 |
|
95℃ |
45秒 |
9个循环;-0.2/个循环 |
58℃ |
45秒 |
|
72℃ |
30秒 |
|
95℃ |
45秒 |
34个循环;-0.1/个循环 |
55℃ |
45秒 |
|
72℃ |
30秒 |
|
72℃ |
5分钟 |
|
10℃ |
∞ |
|
3)将步骤2中获得的获自2例患者、2名家系内正常人的PCR扩增产物直接进行DNA测序。
在患者家族成员中对MYO15A基因突变位点所在编码序列及侧翼序列进行突变排查,患者Ⅱ:1、Ⅱ:2均有c.8375T>C和IVS25+3G>A复合杂合突变,Ⅰ:1、Ⅰ:2均为携带者,即Ⅰ:1仅有c.8375T>C突变;Ⅰ:2仅有c.IVS25+3G>A(见表1及图3)。
表1
本发明的MYO15A基因中的新的复合杂合突变c.8375T>C(V2792A)错义突变和剪接位点突变IVS25+3G>A,可判断此家族中未发病的成员患病的可能性,同时可用于该家族后代患病几率的评估与诊断。
研究证实MYO15A基因突变可以引起常染色体隐性耳聋。我们的研究表明:MYO15Ac.8375T>C和c.IVS25+3G>A是引起常染色体隐性遗传性耳聋的突变。
本发明公开了两种已知耳聋基因(MYO15A)的新突变,首次证实了其为常染色体隐性遗传性耳聋的分子病因,在100例中国正常听力人群中进行该位点的筛查,均为阴性。本研究丰富了耳聋基因突变谱,为开展遗传性耳聋分子诊断提供了基因学依据。
实施例3检测试剂盒
制备检测试剂盒,其中含有检测突变的c.8375T>C和c.IVS25+3G>A的引物对见下表:
按照实施例1所述的方法提取待测者DNA,以所提取的DNA为模板与上述引物进行PCR反应,按照本领域常规方法对PCR产物纯化,将纯化的产物测序。观察测序所得到的序列是否有c.8375T>C和c.IVS25+3G>A突变。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。