骨骼肌氯离子通道基因突变体及其应用
技术领域
本发明涉及骨骼肌氯离子通道基因突变体及其应用。具体地,本发明涉及分离的编码骨骼肌氯离子通道突变体的核酸、分离的多肽、筛选易感先天性肌强直疾病的生物样品的方法、筛选易感先天性肌强直疾病的生物样品的系统以及用于筛选易感先天性肌强直疾病的生物样品的试剂盒。
背景技术
先天性肌强直(myotonia congenital,MC)是以骨骼肌强直和肥大为主要临床表现的一种遗传性肌病,多数在出生时或儿童早期即发病,少数至青春期发病。发病率为0.3~0.6/10万,即全中国大约有3000-6000名MC患者。依遗传方式不同,MC可分为Thomsen病(常染色体显性遗传)和Becker病(常染色体隐性遗传),均由骨骼肌氯离子通道(CLC-1)异常引起。而CLC-1是由骨骼肌氯离子通道基因(CLCN1)编码的,位于人类7号染色体长臂3区5带(7q35),有23个外显子,编码988个氨基酸。迄今为止,已有近130种突变位点被发现,散布于整个CLCN1上,无高发热点区,但也有近1/3先天性肌强直患者未发现突变。
因而,目前对先天性肌强直疾病的研究仍有待深入。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出先天性肌强直疾病的致病基因CLCN1上的新突变。
本发明是基于发明人的下列工作而完成的:发明人通过目标区域捕获测序的方法确定了先天性肌强直疾病的致病基因上的新突变。
根据本发明的第一方面,本发明提出了一种分离的编码骨骼肌氯离子通道突变体的核酸。根据本发明的实施例,与SEQ ID NO:1相比,该核酸具有选自下列的至少一种突变:c.2655_2656insC、c.1616C>T、c.2057_2058delAC以及c.313C>T。根据本发明的实施例,发明人确定了多个骨骼肌氯离子通道基因的新突变体,这些新突变体与先天性肌强直疾病的发病密切相关,从而通过检测这些新突变体在生物样品中是否存在,可以有效地检测生物样品是否易感先天性肌强直疾病。
根据本发明的第二方面,本发明提出了一种分离的多肽。根据本发明的实施例,与SEQ ID NO:2相比,该分离的多肽具有选自下列的至少一种突变:p.Ser886Glnfs*26、p.Thr539Ile、p.Tyr686Xfs*1以及p.Arg105Cys。根据本发明的一些具体示例,该多肽是由前述分离的编码骨骼肌氯离子通道突变体的核酸编码的。通过检测生物样品中是否表达该多肽,可以有效地检测生物样品是否易感先天性肌强直疾病。
根据本发明的第三方面,本发明提出了一种筛选易感先天性肌强直疾病的生物样品的方法。根据本发明的实施例,该筛选易感先天性肌强直疾病的生物样品的方法包括以下步骤:从生物样品提取核酸样本;确定核酸样本的核酸序列;该核酸样本的核酸序列或其互补序列与SEQ ID NO:1相比,具有选自c.2655_2656insC、c.1616C>T、c.2057_2058delAC以及c.313C>T的至少一种突变是生物样品易感先天性肌强直疾病的指示。通过根据本发明实施例的筛选易感先天性肌强直疾病的生物样品的方法,可以有效地筛选易感先天性肌强直疾病的生物样品。
根据本发明的第四方面,本发明提出了一种筛选易感先天性肌强直疾病的生物样品的系统。根据本发明的实施例,该筛选易感先天性肌强直疾病的生物样品的系统包括:核酸提取装置,该核酸提取装置用于从生物样品提取核酸样本;核酸序列确定装置,该核酸序列确定装置与核酸提取装置相连,用于对核酸样本进行分析,以便确定核酸样本的核酸序列;判断装置,该判断装置与核酸序列确定装置相连,以便基于核酸样本的核酸序列或其互补序列与SEQ ID NO:1相比,是否具有选自c.2655_2656insC、c.1616C>T、c.2057_2058delAC以及c.313C>T的至少一种突变,判断生物样品是否易感先天性肌强直疾病。利用该系统,能够有效地实施前述筛选易感先天性肌强直疾病的生物样品的方法,从而可以有效地筛选易感先天性肌强直疾病的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易感先天性肌强直疾病的生物样品的试剂盒。根据本发明的实施例,该用于筛选易感先天性肌强直疾病的生物样品的试剂盒包括:适于检测骨骼肌氯离子通道基因突变体的试剂,其中与SEQ ID NO:1相比,骨骼肌氯离子通道基因突变体具有选自c.2655_2656insC、c.1616C>T、c.2057_2058delAC以及c.313C>T的至少一种突变。利用根据本发明的实施例的试剂盒,能够有效地筛选易感先天性肌强直疾病的生物样品。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1:显示了根据本发明实施例的筛选易感先天性肌强直疾病的生物样品的系统及其组成部分的示意图,其中,A为根据本发明实施例的筛选易感先天性肌强直疾病的生物样品的系统的示意图,B为根据本发明实施例的核酸提取装置的示意图,C为根据本发明实施例的核酸序列确定装置的示意图;
图2:显示了根据本发明实施例的对患者1的骨骼肌氯离子通道基因突变位点的Sanger测序验证峰图;以及
图3:显示了根据本发明实施例的对患者2及其父母的骨骼肌氯离子通道基因突变位点的Sanger测序验证峰图,其中,A为患者2与其母亲的突变位点Sanger测序验证峰图,B为患者2与其父亲的突变位点Sanger测序验证峰图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
骨骼肌氯离子通道基因突变体
根据本发明的第一方面,本发明提出了一种分离的编码骨骼肌氯离子通道突变体的核酸。根据本发明的实施例,与SEQ ID NO:1相比,该核酸具有选自下列的至少一种突变:c.2655_2656insC、c.1616C>T、c.2057_2058delAC以及c.313C>T,优选地,该核酸具有c.2655_2656insC和c.1616C>T,或c.2057_2058delAC和c.313C>T的组合突变。在本文中所使用的表达方式“编码骨骼肌氯离子通道突变体的核酸”,是指与编码骨骼肌氯离子通道突变体的基因相对应的核酸物质,即核酸的类型不受特别限制,可以是任何包含与骨骼肌氯离子通道突变体的编码基因相对应的脱氧核糖核苷酸和/或核糖核苷酸的聚合物,包括但不限于DNA、RNA或cDNA。根据本发明的一个具体示例,前面所述的编码骨骼肌氯离子通道突变体的核酸为DNA。根据本发明的实施例,发明人确了多个骨骼肌氯离子通道基因的新突变体,这些新突变体与先天性肌强直疾病的发病密切相关,从而通过检测这些新突变体在生物样品中是否存在,可以有效地检测生物样品是否易感先天性肌强直疾病,也可以通过检测这些突变体在生物体中是否存在,可以有效地预测生物体是否易感先天性肌强直疾病。
这些编码骨骼肌氯离子通道突变体的核酸,是本申请的发明人通过目标区域捕获测序的方法,针对多个患者样本进行测序,确定的先天性肌强直疾病的致病基因上的新突变。
需要说明的是,骨骼肌氯离子通道基因即CLCN1,定位于人类7号染色体长臂3区5带(7q35),有23个外显子,cDNA序列(来自NCBI的Genbank,登录号为NM_000083.2)如下所示:
ATGGAGCAATCCCGGTCACAGCAGCGTGGGGGTGAACAAAGCTGGTGGGGTAGTGACCCCCAGTACCAGTATATGCCCTTTGAACACTGCACCAGCTACGGACTGCCCTCTGAGAATGGGGGCCTCCAGCACAGGCTCCGGAAGGATGCAGGCCCCCGCCACAACGTCCACCCCACACAGATTTATGGCCATCACAAAGAACAATTCTCAGACAGGGAGCAGGACATAGGGATGCCCAAGAAGACAGGCTCCAGTTCTACCGTGGACAGCAAGGATGAGGATCACTATTCTAAATGTCAAGATTGTATCCACCGCCTGGGACAGGTGGTGAGAAGAAAATTAGGGGAAGACGGGATCTTTCTGGTGCTTCTGGGACTGCTGATGGCTCTGGTCAGCTGGAGCATGGACTACGTCAGTGCCAAAAGCCTTCAGGCCTACAAGTGGTCCTACGCGCAGATGCAGCCCAGCCTTCCTCTGCAGTTCCTGGTCTGGGTCACCTTCCCACTAGTCCTCATCCTCTTCAGCGCCCTCTTCTGCCACCTCATCTCTCCCCAGGCTGTTGGCTCTGGAATCCCCGAAATGAAGACAATACTTCGTGGGGTTGTCCTGAAGGAATACCTCACAATGAAAGCCTTTGTGGCCAAGGTTGTCGCCCTGACTGCGGGCCTGGGCAGTGGCATCCCCGTGGGGAAAGAGGGCCCCTTCGTCCACATTGCCAGCATCTGTGCTGCTGTCCTCAGCAAATTCATGTCTGTGTTCTGCGGGGTATATGAGCAGCCATACTACTACTCTGATATCCTGACGGTGGGCTGTGCTGTGGGAGTCGGCTGTTGTTTTGGGACACCACTTGGAGGAGTGCTATTTAGCATCGAGGTCACCTCCACCTACTTTGCTGTTCGGAACTACTGGAGAGGATTCTTTGCAGCCACGTTCAGCGCCTTTGTGTTTCGAGTGCTGGCAGTGTGGAACAAGGATGCTGTCACCATCACTGCTCTGTTCAGAACCAATTTCCGAATGGATTTCCCCTTTGACCTGAAGGAACTACCAGCTTTTGCTGCCATCGGGATTTGCTGTGGGCTCCTGGGAGCTGTATTTGTGTATCTGCATCGCCAAGTCATGCTCGGTGTCCGAAAGCACAAGGCCCTCAGCCAGTTTCTTGCTAAGCACCGCCTGCTGTATCCTGGAATTGTTACCTTTGTCATTGCCTCATTCACCTTCCCACCAGGAATGGGTCAATTCATGGCTGGAGAGTTGATGCCCCGCGAAGCCATCAGTACTTTGTTTGACAACAATACATGGGTGAAACACGCGGGTGATCCTGAGAGCCTGGGCCAGTCAGCTGTGTGGATTCACCCCCGGGTCAACGTTGTCATCATCATCTTTCTCTTCTTCGTCATGAAGTTCTGGATGTCCATCGTGGCCACCACTATGCCCATACCCTGCGGAGGCTTCATGCCTGTGTTTGTGCTAGGAGCTGCATTTGGAAGGCTGGTAGGAGAAATCATGGCCATGCTCTTTCCTGATGGTATTTTGTTTGATGACATCATCTACAAGATCCTACCTGGGGGCTATGCAGTAATTGGAGCAGCAGCGCTGACTGGTGCCGTTTCCCACACAGTCTCCACAGCTGTGATTTGCTTCGAATTAACGGGTCAGATTGCTCACATCCTGCCCATGATGGTGGCTGTTATCTTGGCCAACATGGTGGCCCAGAGCCTGCAGCCCTCTCTCTATGACAGCATCATCCAGGTCAAGAAGCTACCCTACTTGCCTGACCTTGGCTGGAACCAGCTCAGCAAATATACCATCTTTGTTGAGGACATCATGGTACGTGATGTGAAGTTTGTTTCAGCTTCTTACACATATGGGGAGTTGCGAACCCTGCTCCAGACCACCACAGTCAAGACTTTACCACTGGTTGACTCAAAAGATTCAATGATCCTGCTGGGCTCGGTGGAGCGGTCGGAACTGCAGGCCCTCCTGCAGCGCCACCTGTGTCCTGAGCGCAGGCTGCGCGCAGCCCAAGAGATGGCGCGGAAGTTGTCGGAGCTGCCTTACGACGGGAAGGCGCGGCTGGCTGGGGAGGGGCTCCCCGGCGCGCCTCCAGGCCGGCCCGAGTCCTTCGCCTTTGTGGATGAGGATGAGGACGAAGACCTCTCTGGCAAGAGCGAGCTTCCTCCTTCCCTTGCTCTCCACCCCTCTACTACTGCCCCTCTGTCCCCAGAAGAGCCCAATGGGCCTCTGCCTGGCCACAAACAGCAGCCGGAAGCACCAGAGCCTGCAGGTCAAAGACCCTCCATCTTCCAGTCCCTGCTTCACTGCTTGCTGGGCAGAGCTCGCCCCACAAAGAAGAAAACAACCCAGGATTCCACAGATTTAGTGGATAACATGTCACCTGAAGAGATTGAGGCCTGGGAGCAGGAGCAGCTGAGCCAGCCTGTCTGTTTTGATTCCTGCTGTATTGACCAGTCTCCCTTCCAGCTGGTGGAGCAGACAACCCTGCACAAGACTCATACCCTGTTTTCACTCCTTGGCCTCCACCTCGCTTACGTGACCAGCATGGGGAAGCTCAGGGGCGTCCTGGCCCTGGAGGAGCTACAGAAGGCCATTGAGGGGCACACCAAGTCTGGGGTGCAGCTCCGCCCTCCCCT TGCCAGCTTCCGGAACACGACTTCAACTCGAAAGAGTACCGGGGCACCTCCATCTTCTGCAGAGAACTGGAACCTGCCTGAGGACAGGCCTGGGGCCACTGGAACAGGGGATGTGATTGCTGCCTCCCCAGAGACCCCTGTGCCATCTCCTTCCCCAGAGCCCCCTCTCTCCCTGGCCCCAGGCAAGGTAGAGGGCGAGTTGGAGGAGCTGGAGCTGGTGGAGAGTCCAGGGCTGGAAGAGGAGCTGGCCGACATCTTGCAGGGCCCCAGCCTGCGATCCACAGACGAGGAGGATGAGGATGAACTGATCCTTTGA(SEQ ID NO:1),
其编码的988个氨基酸序列如下所示:
MEQSRSQQRGGEQSWWGSDPQYQYMPFEHCTSYGLPSENGGLQHRLRKDAGPRHNVHPTQIYGHHKEQFSDREQDIGMPKKTGSSSTVDSKDEDHYSKCQDCIHRLGQVVRRKLGEDGIFLVLLGLLMALVSWSMDYVSAKSLQAYKWSYAQMQPSLPLQFLVWVTFPLVLILFSALFCHLISPQAVGSGIPEMKTILRGVVLKEYLTMKAFVAKVVALTAGLGSGIPVGKEGPFVHIASICAAVLSKFMSVFCGVYEQPYYYSDILTVGCAVGVGCCFGTPLGGVLFSIEVTSTYFAVRNYWRGFFAATFSAFVFRVLAVWNKDAVTITALFRTNFRMDFPFDLKELPAFAAIGICCGLLGAVFVYLHRQVMLGVRKHKALSQFLAKHRLLYPGIVTFVIASFTFPPGMGQFMAGELMPREAISTLFDNNTWVKHAGDPESLGQSAVWIHPRVNVVIIIFLFFVMKFWMSIVATTMPIPCGGFMPVFVLGAAFGRLVGEIMAMLFPDGILFDDIIYKILPGGYAVIGAAALTGAVSHTVSTAVICFELTGQIAHILPMMVAVILANMVAQSLQPSLYDSIIQVKKLPYLPDLGWNQLSKYTIFVEDIMVRDVKFVSASYTYGELRTLLQTTTVKTLPLVDSKDSMILLGSVERSELQALLQRHLCPERRLRAAQEMARKLSELPYDGKARLAGEGLPGAPPGRPESFAFVDEDEDEDLSGKSELPPSLALHPSTTAPLSPEEPNGPLPGHKQQPEAPEPAGQRPSIFQSLLHCLLGRARPTKKKTTQDSTDLVDNMSPEEIEAWEQEQLSQPVCFDSCCIDQSPFQLVEQTTLHKTHTLFSLLGLHLAYVTSMGKLRGVLALEELQKAIEGHTKSGVQLRPPLASFRNTTSTRKSTGAPPSSAENWNLPEDRPGATGTGDVIAASPETPVPSPSPEPPLSLAPGKVEGELEELELVESPGLEEELADILQGPSLRSTDEEDEDELIL(SEQ IDNO:2)。
骨骼肌氯离子通道基因,是先天性肌强直疾病的致病基因。为此,发明人针对多个先天性肌强直疾病患者进行目标区域捕获测序,从而确定了多个骨骼肌氯离子通道基因突变体,即c.2655_2656insC、c.1616C>T、c.2057_2058delAC以及c.313C>T,这些突变体与先天性肌强直疾病的发病高度相关。
进一步,发明人发现,当在骨骼肌氯离子通道基因突变体中同时出现c.2655_2656insC和c.1616C>T突变,或c.2057_2058delAC和c.313C>T突变时,则先天性肌强直疾病的易感性更高。通过检测这些具有多个突变位点的骨骼肌氯离子通道基因突变体在生物样品中是否存在,可以进一步有效地检测生物样品是否易感先天性肌强直疾病,也可以通过检测这些突变体在生物体中是否存在,可以有效地预测生物体是否易感先天性肌强直疾病。
根据本发明的第二方面,本发明提出了一种分离的多肽。根据本发明的实施例,与SEQID NO:2相比,该分离的多肽具有选自下列的至少一种突变::p.Ser886Glnfs*26、p.Thr539Ile、p.Tyr686Xfs*1以及p.Arg105Cys,优选地,该多肽具有p.Ser886Glnfs*26和p.Thr539Ile,或p.Tyr686Xfs*1和p.Arg105Cys的组合突变。根据本发明的一些具体示例,该多肽是由前述分离的编码骨骼肌氯离子通道突变体的核酸编码的。其中,需要说明的是,“p.Tyr686Xfs*1”表示,第686位密码子突变为终止密码子,而蛋白质变成685个氨基酸;“p.Ser886Glnfs*26”表示,第886位密码子突变为Gln密码子,并造成从第886位开始计算的26个密码子的移码突变,而蛋白质变成911个氨基酸。此外,在本文中所使用的术语“组合突变”是指同时具有两种突变,例如前面所述的“该核酸具有c.2655_2656insC和c.1616C>T,或c.2057_2058delAC和c.313C>T的组合突变”,是指该核酸同时具有c.2655_2656insC和c.1616C>T突变,或者同时具有c.2057_2058delAC和c.313C>T突变;“该多肽具有p.Ser886Glnfs*26和p.Thr539Ile,或p.Tyr686Xfs*1和p.Arg105Cys的组合突变”是指,该多肽同时具有p.Ser886Glnfs*26和p.Thr539Ile突变,或者同时具有p.Tyr686Xfs*1和p.Arg105Cys突变。
通过检测生物样品中是否表达该多肽,可以有效地检测生物样品是否易感先天性肌强直疾病,也可以通过检测这些多肽在生物体中是否存在,可以有效地预测生物体是否易感先天性肌强直疾病。
筛选易感先天性肌强直疾病的生物样品的方法
根据本发明的第三方面,本发明提出了一种筛选易感先天性肌强直疾病的生物样品的方法。根据本发明的实施例,该筛选易感先天性肌强直疾病的生物样品的方法可以包括以下步骤:
首先,从生物样品提取核酸样本。根据本发明的实施例,生物样品的类型并不受特别限制,只要从该生物样品中能够提取到反映生物样品骨骼肌氯离子通道基因是否存在突变的核酸样本即可。根据本发明的实施例,生物样品可以为人体的任何组织。根据本发明的一些具体示例,优选地,生物样品为选自人体血液、皮肤、毛发和肌肉的至少一种。由此,可以方便地进行取样和检测,从而能够进一步提高筛选易感先天性肌强直疾病的生物样品的效率。根据本发明的实施例,这里所使用的术语“核酸样本”应做广义理解,其可以是任何能够反映生物样品中骨骼肌氯离子通道基因是否存在突变的样本,例如可以是从生物样品中直接提取的全基因组DNA,也可以是该全基因组中包含骨骼肌氯离子通道基因编码序列的一部分,可以是从生物样品中提取的总RNA,也可以是从生物样品中提取的mRNA。根据本发明的一个实施例,所述核酸样本为全基因组DNA。由此,可以扩大生物样品的来源范围,并且可以同时对生物样品的多种信息进行确定,从而能够提高筛选易感先天性肌强直疾病的生物样品的效率。另外,根据本发明的实施例,针对采用RNA作为核酸样本,从生物样品提取核酸样本可以进一步包括:从生物样品提取RNA样本,优选RNA样本为mRNA;以及基于所得到的RNA样本,通过反转录反应,获得cDNA样本,所得到的cDNA样本构成核酸样本。由此,可以进一步提高利用RNA作为核酸样本筛选易感先天性肌强直疾病的生物样品的效率。
接下来,在得到核酸样本之后,可以对核酸样本进行分析,从而能够确定所得到核酸样本的核酸序列。根据本发明的实施例,确定所得到核酸样本的核酸序列的方法和设备并不受特别限制。根据本发明的具体实施例,可以通过测序方法,确定核酸样本的核酸序列。根据本发明的实施例,可以用于进行测序的方法和设备并不受特别限制。根据本发明的实施例,可以采用第二代测序技术,也可以采用第三代以及第四代或者更先进的测序技术。根据本发明的具体示例,可以利用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种对核酸序列进行测序。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,能够提高后续对测序数据进行分析时的精确性和准确度。由此,根据本发明的实施例,确定核酸样本的核酸序列可以进一步包括:首先,针对所得到的核酸样本,构建核酸测序文库;以及对所得到的核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。根据本发明的一些实施例,可以采用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种对所得到的核酸测序文库进行测序。另外,根据本发明的实施例,可以对核酸样本进行筛选,富集骨骼肌氯离子通道基因外显子,该筛选富集可以在构建测序文库之前,构建测序文库过程中,或者构建测序文库之后进行。根据本发明的一个实施例,针对核酸样本,构建核酸测序文库进一步包括:利用骨骼肌氯离子通道基因外显子特异性引物,对核酸样本进行PCR扩增;以及针对所得到的扩增产物,构建核酸测序文库。由此,可以通过PCR扩增,富集骨骼肌氯离子通道基因外显子,从而能够进一步提高筛选易感先天性肌强直疾病的生物样品的效率。根据本发明的实施例,骨骼肌氯离子通道外显子特异性引物的序列不受特别限制,根据本发明的优选实施例,这些骨骼肌氯离子通道基因外显子特异性引物的序列具有如下表1所示的核酸序列,即SEQ IDNO:3-32所示的核苷酸序列。发明人惊奇地发现,通过采用这些引物,可以在一个PCR反应体系中通过多重PCR完成对骨骼肌氯离子通道基因外显子的扩增,并且扩增的均一性好。需要说明的是,这些SEQ ID NO:3-32所示的核苷酸序列是本发明的发明人在付出了艰苦的劳动后,意外获得的。
表1骨骼肌氯离子通道基因外显子特异性引物
引物名称 |
引物序列(SEQ ID NO:) |
CLCN1-P1-F |
AGAGGCTTAAGGAGCTACACTGG(3) |
CLCN1-P1-R |
CCCAATTCCTCATTTTCACCA(4) |
CLCN1-P2-F |
TAGTCTTCCACAAGGCAGACACTG(5) |
CLCN1-P2-R |
ATGCCCAAGTTATTCTCCTAATCC(6) |
CLCN1-sub-P3-F |
CGTTTCTTCCTAGATTGTATCCACC(7) |
CLCN1-sub-P3-R |
GGAGGGGCGTGAGAAGTGG(8) |
CLCN1-P4-F |
GAGAACATGCCGGGTACACG(9) |
CLCN1-P4-R |
CAGAGCTCCCTCTAGAGTTGGTG(10) |
CLCN1-P5-F |
GTGCTGCAGAGCCTCCATCT(11) |
CLCN1-P5-R |
GACACACAGCCGGACTCCTT(12) |
CLCN1-P6n-F |
TTGTTCTGTCCTCTGCCTGCC(13) |
CLCN1-P6n-R |
TGTTAATACCAGCACTTGTGGATACT(14) |
CLCN1-P7-F |
CACCCAGATTCATGTTTCAGC(15) |
CLCN1-P7-R |
CTTTCTAGCTTGGGTCCCTTC(16) |
CLCN1-P8-F |
GCAGTAGTTATGTCCAAGAGATGAG(17) |
CLCN1-P8-R |
GGAGGAACTCTTGGAGAAACC(18) |
CLCN1-P9-F |
TGTGAGTTGGCTGAATTGTGG(19) |
CLCN1-P9-R |
GTTCTACCCCTTCCTACCCTATG(20) |
CLCN1-P10-F |
CAGGATTTCTGCAGAAAGGAGG(21) |
CLCN1-P10-R |
TAGAATGAAGATCCAATGGGAGAGT(22) |
CLCN1-P11-F |
ACCAGGGTCATGTCTCTCATTCC(23) |
CLCN1-P11-R |
GGGGCCTCCTCTACCTCTATGT(24) |
CLCN1-P12-F |
GGCGCCTCTCCTGTTCCTT(25) |
CLCN1-P12-R |
GGAATTGCATGCAGGTCAAGG(26) |
CLCN1-P13-F |
CAGCTCTTTGGAGGCAAATGT(27) |
CLCN1-P13-R |
ACACTTCCCATCCAGACCACAT(28) |
CLCN1-P14-F |
GGCCGTTTGGGGTCAAAAT(29) |
CLCN1-P14-R |
TCTGAGGGGACTTCTGAGATGCT(30) |
CLCN1-P15-F |
CTGTTCTTTTCTGTGTCTCTCACTG(31) |
CLCN1-P15-R |
CCTCTCCACGGTCTTTATGAGG(32) |
关于针对核酸样本,构建测序文库的方法和流程,本领域技术人员可以根据不同的测序技术进行适当选择,关于流程的细节,可以参见测序仪器的厂商例如Illumina公司所提供的规程,例如参见Illumina公司Multiplexing Sample Preparation Guide(Part#1005361;Feb 2010)或Paired-End SamplePrep Guide(Part#1005063;Feb 2010),通过参照将其并入本文。根据本发明的实施例,从生物样品提取核酸样本的方法和设备,也不受特别限制,可以采用商品化的核酸提取试剂盒进行。
需要说明的是,在这里所使用的术语“核酸序列”应作广义理解,其可以是在对核酸样本进行测序得到的测序数据进行组装后,得到的完整的核酸序列信息,也可以是直接采用通过对核酸样本进行测序所得到的测序数据(Reads)作为核酸序列,只要这些核酸序列中含有对应骨骼肌氯离子通道的编码序列即可。
最后,在确定核酸样本的核酸序列之后,将所得到的核酸样本的核酸序列与SEQID NO:1的序列相比对。如果在所得到的核酸序列中具有选自c.2655_2656insC、c.1616C>T、c.2057_2058delAC以及c.313C>T的至少一种突变,则指示生物样品易感先天性肌强直疾病。由此,通过根据本发明实施例的筛选易感先天性肌强直疾病的生物样品的方法,可以有效地筛选易感先天性肌强直疾病的生物样品。根据本发明的实施例,对核酸序列与SEQ IDNO:1进行比对的方法和设备并不受特别限制,可以采用任意常规的软件进行操作,根据本发明的具体实例,可以采用SOAP软件进行比对。
需要说明的是,根据本发明实施例的“筛选易感先天性肌强直疾病的生物样品的方法”的用途不受特别限制,例如可以用作非诊断目的的筛选方法。
筛选易感先天性肌强直疾病的生物样品的系统和试剂盒
根据本发明的第四方面,本发明提出了一种能够有效实施上述筛选易感先天性肌强直疾病的生物样品的方法的系统。
参考图1,根据本发明的实施例,该筛选易感先天性肌强直疾病的生物样品的系统1000包括核酸提取装置100、核酸序列确定装置200以及判断装置300。
根据本发明的实施例,核酸提取装置100用于从生物样品提取核酸样本。如前所述,根据本发明的实施例,核酸样本的类型并不受特别限制,对于采用RNA作为核酸样本,则核酸提取装置进一步包括RNA提取单元101和反转录单元102,其中,提取单元101用于从生物样品提取RNA样本,反转录单元102与RNA提取单元101相连,用于对RNA样本进行反转录反应,以便获得cDNA样本,所得到的cDNA样本构成核酸样本。
根据本发明的实施例,核酸序列确定装置200与核酸提取装置100相连,用于对核酸样本进行分析,以便确定核酸样本的核酸序列。如前所示,可以采用测序的方法确定核酸样本的核酸序列。由此,根据本发明的一个实施例,所述核酸序列确定装置200可以进一步包括:文库构建单元201以及测序单元202。文库构建单元201用于针对核酸样本,构建核酸测序文库;测序单元202与文库构建单元201相连,用于对核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。如前所述,可以通过PCR扩增,富集骨骼肌氯离子通道基因外显子,进一步提高筛选易感先天性肌强直疾病的生物样品的效率。由此,文库构建单元201可以进一步包括PCR扩增模块(图中未示出),在该PCR扩增模块中设置有骨骼肌氯离子通道基因外显子特异性引物,以便利用骨骼肌氯离子通道外显子基因特异性引物,对所述核酸样本进行PCR扩增,根据本发明的具体实施例,骨骼肌氯离子通道基因外显子特异性引物具有如SEQ ID NO:3-32所示的核苷酸序列。根据本发明的实施例,测序单元202可以包括选自HISEQ2000、SOLiD、454和单分子测序装置的至少一种。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,提高后续对测序数据进行分析时的精确性和准确度。
根据本发明的实施例,判断装置300与核酸序列确定装置200相连,适于将核酸样本的核酸序列进行比对,以便基于核酸样本的核酸序列或其互补序列与SEQ ID NO:1的区别判断生物样品是否易感先天性肌强直疾病。具体地,基于核酸样本的核酸序列或其互补序列与SEQ ID NO:1相比,是否具有选自c.2655_2656insC、c.1616C>T、c.2057_2058delAC以及c.313C>T的至少一种突变,判断生物样品是否易感先天性肌强直疾病。如前所述,根据本发明的一个实施例,核酸样本的核酸序列或其互补序列与SEQ ID NO:1相比,具有选自c.2655_2656insC、c.1616C>T、c.2057_2058delAC以及c.313C>T的至少一种突变,是生物样品易感先天性肌强直疾病的指示。如前所述,根据本发明的实施例,对核酸序列与SEQIDNO:1进行比对的设备并不受特别限制,可以采用任意常规的软件进行操作,根据本发明的具体实例,可以采用SOAP软件进行比对。
由此,利用该系统,能够有效地实施前述筛选易感先天性肌强直疾病的生物样品的方法,从而可以有效地筛选易感先天性肌强直疾病的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易感先天性肌强直疾病的生物样品的试剂盒。根据本发明的实施例,该用于筛选易感先天性肌强直疾病的生物样品的试剂盒包括:适于检测骨骼肌氯离子通道基因突变体的试剂,其中与SEQ ID NO:1相比,该骨骼肌氯离子通道基因突变体具有选自c.2655_2656insC、c.1616C>T、c.2057_2058delAC以及c.313C>T的至少一种突变。利用根据本发明的实施例的试剂盒,能够有效地筛选易感先天性肌强直疾病的生物样品。在本文中,所使用的术语“适于检测骨骼肌氯离子通道基因突变体的试剂”应做广义理解,即可以是检测骨骼肌氯离子通道突变体编码基因的试剂,也可以是检测骨骼肌氯离子通道突变体多肽的试剂,例如可以采用识别特异性位点的抗体。根据本发明的一个实施例,所述试剂为核酸探针,由此,可以高效地筛选易感先天性肌强直疾病的生物样品。
需要说明的是,在本文前面筛选易感先天性肌强直疾病的生物样品的方法部分中所描述的特征和优点,同样适用于筛选易感先天性肌强直疾病的生物样品的系统或者试剂盒,在此不再赘述。
下面参考具体实施例,对本发明进行说明,需要说明的是,这些实施例仅仅是说明性的,而不能理解为对本发明的限制。
若未特别指明,实施例中所采用的技术手段为本领域技术人员所熟知的常规手段,可以参照《分子克隆实验指南》第三版或者相关产品进行,所采用的试剂和产品也均为可商业获得的。未详细描述的各种过程和方法是本领域中公职的常规方法,所用试剂的来源、商品名以及有必要列出其组成成分者,均在首次出现时标明,其后所用相同试剂如无特殊说明,均以首次标明的内容相同。
实施例1目标区域捕获测序确定突变位点
样本采集:采集患者1、患者2及其父母的外周血(患者1的父母的外周血无法采集),并利用QIAamp DNA BloodMiNi Kit(Qiagen,Hilden,Germany)分别提取基因组DNA作为样本。其中,患者1,被医院诊断为先天性肌强直,具有典型肌强直表现,其父母均正常;患者2,为广东人,其在8个月大时被诊断为结节性硬化症,进行检测时为2岁8个月大(其父母已签署知情同意书),其临床表现有:无听力,无语言能力,无法行走,脊椎无力,无法持久挺立。此外,本实施例还采集了135个正常人的外周血并采用上述方法提取了其基因组DNA样本,作为对照。
将上述采集的患者及其父母,以及正常人的基因组DNA样本进行目标区域捕获测序及数据分析,具体做法如下:
首先,发明人用NimbleGen 2.1M Human Exome Array结合Solexa高通量测序技术对各基因组DNA样本的目标区域进行了测序,具体如下:
1)芯片
本实施例所采用的芯片为NimbleGen 2.1M Human Exome Array。
2)文库构建和高通量测序
将各基因组DNA样本随机打断成150-200bp左右的片段,随后按照制造商提供的操作说明书,在片段两端分别连接上接头制备文库。文库经纯化后经过Ligation-mediatedPCR(LM-PCR)的线性扩增与Custom Capture Array进行杂交富集,再经过LM-PCR的线性扩增,文库检测合格后即可上机测序,以便获得原始测序数据。
具体地,按照以下步骤对各基因组DNA样本进行文库构建和测序处理:
利用超声波仪(CovarisS2,Massachusetts,USA)分别将各基因组DNA随机打断成150-200bp的片段。分别各取1μg(用Nanodrop定量)纯化的DNA片段用T4DNA聚合酶、T4磷酸核苷酸激酶和Escherichiacoli DNA聚合酶的Klenow片段进行处理,补平5’突出末端和去除3’突出末端。在3’末端添加A碱基后再连接上接头序列。添加接头后,利用包含8bp标签序列(Barcode Sequence)的PCR引物进行4个循环的LM-PCR的线性扩增,以便得到各基因组DNA样本的文库。将各文库进行混合后与捕获芯片进行杂交72h,然后,利用300ml洗脱缓冲液(Qiagen,Valencia,CA,USA)对结合到芯片上的DNA片段进行洗脱。具体地,在洗脱设备上于95℃下进行洗脱20min,然后添加200ml洗脱缓冲液进行一次重复洗脱,以便获得杂交产物。将获得的杂交产物进行LM-PCR的线性扩增,并经文库检测合格后,参照Illumina标准的成簇和测序的操作方案,利用Illumina Hiseq2000对其进行测序,读取长度为90bp。
3)变异检测、注释及数据库比较
利用Illumina Basecalling Software 1.7对上述获得的原始测序数据进行处理,过滤低质量reads和包含接头污染reads,以便获得测序结果。其中,低质量reads包含:超过10%的N碱基的reads、质量值小于5的碱基占reads长度50%以上的reads,以及平均质量值小于10的reads。在得到测序结果之后,对非同义突变、剪接受体/供体位点突变、编码区插入和缺失突变这三类最有可能与病理相关的突变进行研究。具体地,使用BWA(可参见:Liet al.Bioinformatics 2010.26(5):589-595,通过参照将其全文并入本文)将高质量reads比对到参考基因组,由此,获得比对到基因组上的唯一比对reads。然后利用SOAPsnp(可参见:Li R,Li Y,Fang X,Yang H,et al,SNP detection for massively parallelwhole-genome resequencing.Genome Res 2009,19(6):1124-1132.,通过参照将其全文并入本文)和GATK(可参见:McKenna et al.Genome Res.2010.20(9):1297-1303,通过参照将其全文并入本文)分别进行SNP和Indel的检测。
接着,对于检出的SNP和Indel变异,发明人对其进行注释,即确定变异所处基因组环境,以及变异的类型。然后,将检出的变异与dbSNP数据库、千人基因组数据库、HapMap数据库、HGMD和LSMD等公共数据库进行比较,从而选出了HGMD和LSMD数据库中包含的变异以及位于编码区和剪接位点区的先前未报道过的变异,并对疾病已知致病基因上候选致病突变进行Sanger验证,结果,在患者1和患者2的先天性肌强直已知致病基因CLCN1上均发现复合杂合突变,具体地:患者1的CLCN1基因上具有c.2655_2656insC和c.1616C>T的复合杂合突变(在这里所使用的表达方式“复合杂合突变”,是指一对等位基因分别携带不同的突变);患者2的CLCN1基因上具有c.2057_2058delAC和c.313C>T的复合杂合突变,其母亲携带c.313C>T,其父亲携带c.2057_2058delAC,并且对于患者2,发明人并未发现其在结节性硬化症的致病基因TSC1和TSC2上具有可能的致病突变。而在135个正常人的CLCN1基因中,并没有发现有上述突变的存在。
然后,结合Lossin C等(Adv Genet.2008,63(1):25-55)的报道,发明人证明了CLCN1基因的功能缺失突变是导致先天性肌强直的原因。
实施例2 Sanger法测序验证患者1和患者2的突变位点
利用实施例1采集的患者1和135个正常人的基因组DNA样本,按照以下步骤对上述获得的患者1的CLCN1基因突变位点进行Sanger法测序验证:
2.1引物设计及PCR反应
首先,参考人类基因组序列数据库hg19/build36.3,设计得到具有SEQ ID NO:3-32所示的核苷酸序列的骨骼肌氯离子通道基因(即CLCN1基因)外显子特异性引物(见前述表1)。其中,该外显子特异性引物对CLCN1的23个外显子及其相邻内含子序列是特异的。
接着,按以下配比分别配置各基因组DNA样本的PCR反应体系:
然后,将各PCR反应体系按照以下反应条件分别进行PCR反应:
由此,获得患者1和135个正常人的PCR扩增产物。然后,将获得的各PCR扩增产物用DNA Gel/PCR Purification Miniprep kit(Biomiga,US,San Diego)切胶回收试剂盒分别进行纯化,备用。
2.2Sanger法测序及验证结果
将所获得的各经过纯化的PCR扩增产物分别进行DNA测序,以便获得测序结果。其中DNA测序的具体步骤如下:首先,配制10μL的测序预反应体系,其中该10μL测序反应体系的配比如下:1μL经过纯化的PCR扩增产物,4μL 2.5×BDT,1μL引物(3.2pmol/μL),4μL超纯水。接着,将配制好的测序反应体系于PCR仪上,按照以下反应条件进行测序预反应:96℃1min;96℃10s,50℃5s,60℃4min,25个循环;最后4℃保存,由此,获得测序预反应产物。接下来,按照以下步骤将测序预反应产物进行纯化:a)每管加入1μL 125mM EDTA,1μL 3MNaAc,加到管底;b)加入25μL 100%酒精,封严,震荡4次,室温放置15min;c)于3000x g,4℃下进行离心30min,并立即倒置384孔板,离心至185x g时关闭离心机电源;d)加入35μL 70%酒精,3000x g,4℃下进行离心15min,并立即倒置384孔板,离心至185x g时关闭离心机电源;e)重复70%酒精洗涤1次;f)将残余的酒精于室温下挥发干,接着加入10μL Hi-Di甲酰胺,于95℃下进行变性4min后,迅速冰冷4min。然后,将经过纯化的测序预反应产物迅速上ABI3730xl测序仪进行测序,以便获得测序结果。
接着,基于测序结果,对患者1和135个正常人进行骨骼肌氯离子通道基因编码序列比对。其中患者1的骨骼肌氯离子通道基因具有突变,其比对结果见图2。图2显示了对患者1的骨骼肌氯离子通道基因突变位点的Sanger验证峰图。结合图2,发明人发现,患者1的一个等位基因上具有c.2655_2656insC的杂合突变,该突变导致蛋白翻译提前终止,产生的多肽只有911个氨基酸,相比野生型骨骼肌氯离子通道多肽,截短了77个氨基酸。其另一个等位基因上具有p.Thr539Ile的杂合突变(即c.1616C>T突变)。而135个正常人的骨骼肌氯离子通道基因中,并未发现c.2655_2656insC和p.Thr539Ile突变的存在。由此,发明人验证、确认了c.2655_2656insC和p.Thr539Ile突变是与先天性肌强直疾病发病相关的新突变位点。
实施例3 Sanger法测序验证患者1和患者2的突变位点
利用实施例1采集的患者2及其父母,以及135个正常人的基因组DNA样本,根据实施例2所述的进行Sanger法测序验证的步骤,对前面所述的患者2的CLCN1基因突变位点进行Sanger法测序验证。其中,PCR反应采用的引物不同,本实施例所采用的PCR引物为为:
(a)c.2057_2058delAC突变位点引物序列
上游引物:GGCGCCTCTCCTGTTCCTT(SEQ ID NO:33);
下游引物:GGAATTGCATGCAGGTCAAGG(SEQ ID NO:34)。
(b)p.Arg105Cys(即c.313C>T)突变位点引物序列
上游引物:CGTTTCTTCCTAGATTGTATCCACC(SEQ ID NO:35);
下游引物:GGAGGGGCGTGAGAAGTGG(SEQ ID NO:36)。
由此,获得患者2及其父母,以及135个正常人的骨骼肌氯离子通道基因编码序列的比对结果。其中,患者2及其父母的骨骼肌氯离子通道基因具有突变,其比对结果见图3。图3显示了对患者2及其父母的骨骼肌氯离子通道基因突变位点的Sanger验证峰图,其中,A为患者2与其母亲的突变位点Sanger测序验证峰图,B为患者2与其父亲的突变位点Sanger测序验证峰图。如图3所示,其中,A显示了对互补链进行测序验证获得的峰图,图中箭头处出现G和A的两个杂合峰;在B图中,箭头右边开始出现杂合峰,其中第一个峰看不出来杂峰,是因为G和A的峰重合了。结合图3,发明人发现,患者2的一个等位基因上具有c.2057_2058delAC的缺失突变,该突变导致蛋白翻译提前终止,突变蛋白的多肽长685个氨基酸,相比野生型蛋白的多肽,截短了303个氨基酸,且该突变之前在MC患者中没有报道过。其另一个等位基因上具有p.Arg105Cys(即c.313C>T)的错义突变。并且,患者2的父亲携带c.2057_2058delAC杂合突变,其母亲携带p.Arg105Cys杂合突变。而135个正常人的骨骼肌氯离子通道基因中,并未发现有c.2057_2058delAC和c.313C>T突变的存在。由此,发明人验证、确认了c.2057_2058delAC和c.313C>T突变是与先天性肌强直疾病发病相关的新突变位点。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。