EXT1基因突变体及其应用
技术领域
本发明涉及EXT1基因突变体及其应用。具体地,本发明涉及分离编码EXT1突变体的核酸,分离的多肽,筛选易患遗传性多发性软骨瘤疾病的生物样品的方法,筛选遗憾遗传性多发性软骨瘤疾病的生物样品的系统,用于筛选易患遗传性多发性软骨瘤疾病的生物样品的试剂盒以及筛选治疗或预防遗传性多发性软骨瘤疾病的药物的方法。
背景技术
遗传性多发性软骨瘤(Hereditary multiple exostoses,HME)是一种骨骼系统的良性肿瘤,易发于儿童,常见于长骨干骺端,亦可累及骨盆和肋骨,较少见于椎骨和腕骨等。遗传性多发性软骨瘤患者主要表现为疼痛、长骨干骺端多发性外生性骨疣形成。此外,瘤体生长可阻止骨的生长,并压迫邻近神经和血管组织,导致骨骼畸形、身材矮小和关节活动受限。遗传性多发性软骨瘤人群发病率约为1/5000,其中近5%的遗传性多发性软骨瘤会恶变成骨肉瘤和软骨肉瘤。虽然目前已发现一些遗传性多发性软骨瘤的致病基因,但仍存在着相当一部分未知致病基因位点。
因而,目前对遗传性多发性软骨瘤疾病的研究仍有待深入。
发明内容
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出一种能够有效筛选易患遗传性多发性软骨瘤疾病的生物样品的方法。
本发明是基于发明人的下列工作完成的:发明人通过高通量外显子组测序联合候选基因突变验证的方法确定了遗传性多发性软骨瘤疾病新的致病基因突变位点(EXT1基因的8号外显子c.1457-1458insG)。
根据本发明的第一方面,本发明提出了一种分离的编码EXT1突变体的核酸。根据本发明的实施例,所述核酸与SEQ ID NO:1相比,具有c.1457-1458insG突变,即相对于野生型EXT1基因,本发明的EXT1基因突变体在第1457位和第1458位碱基之间插入碱基G,也可以是在第1458位和第1459位或者在第1459位和第1460位插入碱基G。根据本发明的实施例,发明人确定了遗传性多发性软骨瘤的新突变体,该突变体与遗传性多发性软骨瘤疾病的发病密切相关,从而通过检测该新突变体在生物样品中是否存在,可以有效地检测生物样品是否易患遗传性多发性软骨瘤疾病。
根据本发明的第二方面,本发明提出了一种分离的多肽。根据本发明的实施例,与SEQID NO:2相比,所述分离的多肽具有p.V487G突变,即该突变是由于c.1457-1458insG的移码突变而引起的,具体地,该突变表示:从第487位开始的33个氨基酸改变为GDPPGLSVPASVEASRGCSQVPVLCPDHSSMEL,且翻译提前终止于第519位氨基酸。通过检测生物样品中是否表达该多肽,可以有效地检测生物样品是否易患遗传性多发性软骨瘤疾病。
根据本发明的第三方面,本发明提出了一种筛选易患遗传性多发性软骨瘤疾病的生物样品的方法。根据本发明的实施例,该方法包括以下步骤:从所述生物样品提取核酸样本;确定所述核酸样本的核酸序列;所述核酸样本的核酸序列与SEQ ID NO:1相比,具有c.1457-1458insG突变是所述生物样品易患遗传性多发性软骨瘤疾病的指示。通过根据本发明实施例的筛选易患遗传性多发性软骨瘤疾病的生物样品的方法,可以有效地筛选易患遗传性多发性软骨瘤疾病的生物样品。
根据本发明的第四方面,本发明提出了一种筛选易患遗传性多发性软骨瘤疾病的生物样品的系统。根据本发明的实施例,该系统包括:核酸提取装置,所述核酸提取装置用于从所述生物样品提取核酸样本;核酸序列确定装置,所述核酸序列确定装置与所述核酸提取装置相连,用于对所述核酸样本进行分析,以便确定所述核酸样本的核酸序列;判断装置,所述判断装置与所述核酸序列确定装置相连,以便基于所述核酸样本的核酸序列与SEQID NO:1相比,是否具有c.1457-1458insG突变,判断所述生物样品是否易患遗传性多发性软骨瘤疾病。利用该系统,能够有效地实施前述筛选易患遗传性多发性软骨瘤疾病的生物样品的方法,从而可以有效地筛选易患遗传性多发性软骨瘤疾病的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易患遗传性多发性软骨瘤疾病的生物样品的试剂盒。根据本发明的实施例,该试剂盒含有:适于检测EXT1基因突变体的试剂,其中与SEQ ID NO:1相比,该EXT1基因突变体具有c.1457-1458insG突变。利用根据本发明的实施例的试剂盒,能够有效地筛选易患遗传性多发性软骨瘤疾病的生物样品。
根据本发明的第六方面,本发明提出了一种筛选治疗或预防遗传性多发性软骨瘤疾病的药物的方法。根据本发明的实施例,该方法包括:将能够表达EXT1基因突变体的生物样品在存在候选试剂的情况下进行培养,其中该EXT1基因突变体与SEQ ID NO:1相比,具有c.1457-1458insG突变;将该能够表达EXT1基因突变体的生物样品在不存在该候选试剂的情况下进行培养;确定该能够表达EXT1基因突变体的生物样品在存在该候选试剂和不存在该候选试剂的情况下,细胞凋亡率或细胞生长率的变化,其中存在该候选试剂时,细胞凋亡率高于不存在该候选试剂时的细胞凋亡率,或者细胞生长率低于不存在该候选试剂时的细胞生长率,是该候选试剂作为治疗或预防遗传性多发性软骨瘤疾病的药物的指示。
利用该筛选治疗或预防遗传性多发性软骨瘤疾病的药物的方法,能够有效地筛选治疗或预防EXT1基因突变的药物。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1显示了根据本发明实施例的筛选易患遗传性多发性软骨瘤疾病的生物样品的系统及其组成部分的示意图,其中,
图1A为根据本发明实施例的筛选易患遗传性多发性软骨瘤疾病的生物样品的系统的示意图,
图1B为根据本发明实施例的核酸提取装置的示意图,
图1C为根据本发明实施例的核酸序列确定装置的示意图;
图2显示了根据本发明一个实施例的遗传性多发性软骨瘤患者家系的家系图;
图3显示了根据本发明一个实施例的遗传性多发性软骨瘤患者家系中患者的膝关节X射线图;
图4显示了根据本发明一个实施例的遗传性多发性软骨瘤患者家系中患者的手术切除瘤体组织切片hematoxylin-eosin染色图;
图5显示了根据本发明一个实施例的遗传性多发性软骨瘤患者家系患者的手术切除瘤体组织切片Safranin O染色图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
EXT1基因突变体
根据本发明的第一方面,本发明提出了一种分离的编码EXT1突变体的核酸。根据本发明的实施例,所述核酸与SEQ ID NO:1相比,具有c.1457-1458insG突变。在本文中所使用的表达方式“编码EXT1突变体的核酸”,是指与编码EXT1突变体的基因相对应的核酸物质,即核酸的类型不受特别限制,可以是任何包含与EXT1突变体的编码基因相对应的脱氧核糖核苷酸和/或核糖核苷酸的聚合物,包括但不限于DNA、RNA或cDNA。根据本发明的一个具体示例,前面所述的编码EXT1突变体的核酸为DNA。根据本发明的实施例,发明人确定了EXT1基因的新突变体,这些新突变体与遗传性多发性软骨瘤疾病的发病密切相关,从而通过检测该新突变体在生物样品中是否存在,可以有效地检测生物样品是否易患遗传性多发性软骨瘤疾病,也可以通过检测这些突变体在生物体中是否存在,可以有效地预测生物体是否易患遗传性多发性软骨瘤疾病。
该编码EXT1突变体的核酸,是本申请的发明人通过高通量外显子组测序联合候选基因突变验证的方法确定的遗传性多发性软骨瘤疾病的致病基因上的新突变。该突变位点在现有技术中并未被提到。
其中,野生型EXT1基因的cDNA具有如下所示的核苷酸序列:
ATGCAGGCCAAAAAACGCTATTTCATCCTGCTCTCAGCTGGCTCTTGTCTCGCCCTTTTGTTTTATTTCGGAGGCTTGCAGTTTAGGGCATCGAGGAGCCACAGCCGGAGAGAAGAACACAGCGGTAGGAATGGCTTGCACCACCCCAGTCCGGATCATTTCTGGCCCCGCTTCCCGGACGCTCTGCGCCCCTTCGTTCCTTGGGATCAATTGGAAAACGAGGATTCCAGCGTGCACATTTCCCCCCGGCAGAAGCGAGATGCCAACTCCAGCATCTACAAAGGCAAGAAGTGCCGCATGGAGTCCTGCTTCGATTTCACCCTTTGCAAGAAAAACGGCTTCAAAGTCTACGTATACCCACAGCAAAAAGGGGAGAAAATCGCCGAAAGTTACCAAAACATTCTAGCGGCCATCGAGGGCTCCAGGTTCTACACCTCGGACCCCAGCCAGGCGTGCCTCTTTGTCCTGAGTCTGGATACTTTAGACAGAGACCAGTTGTCACCTCAGTATGTGCACAATTTGAGATCCAAAGTGCAGAGTCTCCACTTGTGGAACAATGGTAGGAATCATTTAATTTTTAATTTATATTCCGGCACTTGGCCTGACTACACCGAGGACGTGGGGTTTGACATCGGCCAGGCGATGCTGGCCAAAGCCAGCATCAGTACTGAAAACTTCCGACCCAACTTTGATGTTTCTATTCCCCTCTTTTCTAAGGATCATCCCAGGACAGGAGGGGAGAGGGGGTTTTTGAAGTTCAACACCATCCCTCCTCTCAGGAAGTACATGCTGGTATTCAAGGGGAAGAGGTACCTGACAGGGATAGGATCAGACACCAGGAATGCCTTATATCACGTCCATAACGGGGAGGACGTTGTGCTCCTCACCACCTGCAAGCATGGCAAAGACTGGCAAAAGCACAAGGATTCTCGCTGTGACAGAGACAACACCGAGTATGAGAAGTATGATTATCGGGAAATGCTGCACAATGCCACTTTCTGTCTGGTTCCTCGTGGTCGCAGGCTTGGGTCCTTCAGATTCCTGGAGGCTTTGCAGGCTGCCTGCGTCCCTGTGATGCTCAGCAATGGATGGGAGTTGCCATTCTCTGAAGTGATTAATTGGAACCAAGCTGCCGTCATAGGCGATGAGAGATTGTTATTACAGATTCCTTCTACAATCAGGTCTATTCATCAGGATAAAATCCTAGCACTTAGACAGCAGACACAATTCTTGTGGGAGGCTTATTTTTCTTCAGTTGAGAAGATTGTATTAACTACACTAGAGATTATTCAGGACAGAATATTCAAGCACATATCACGTAACAGTTTAATATGGAACAAACATCCTGGAGGATTGTTCGTACTACCACAGTATTCATCTTATCTGGGAGATTTTCCTTACTACTATGCTAATTTAGGTTTAAAGCCCCCCTCCAAATTCACTGCAGTCATCCATGCGGTGACCCCCCTGGTCTCTCAGTCCCAGCCAGTGTTGAAGCTTCTCGTGGCTGCAGCCAAGTCCCAGTACTGTGCCCAGATCATAGTTCTATGGAATTGTGACAAGCCCCTACCAGCCAAACACCGCTGGCCTGCCACTGCTGTGCCTGTCGTCGTCATTGAAGGAGAGAGCAAGGTTATGAGCAGCCGTTTTCTGCCCTACGACAACATCATCACAGACGCCGTGCTCAGCCTTGACGAGGACACGGTGCTTTCAACAACAGAGGTGGATTTCGCCTTCACAGTGTGGCAGAGCTTCCCTGAGAGGATTGTGGGGTACCCCGCGCGCAGCCACTTCTGGGATAACTCTAAGGAGCGGTGGGGATACACATCAAAGTGGACGAACGACTACTCCATGGTGTTGACAGGAGCTGCTATTTACCACAAATATTATCACTACCTATACTCCCATTACCTGCCAGCCAGCCTGAAGAACATGGTGGACCAATTGGCCAATTGTGAGGACATTCTCATGAACTTCCTGGTGTCTGCTGTGACAAAATTGCCTCCAATCAAAGTGACCCAGAAGAAGCAGTATAAGGAGACAATGATGGGACAGACTTCTCGGGCTTCCCGTTGGGCTGACCCTGACCACTTTGCCCAGCGACAGAGCTGCATGAATACGTTTGCCAGCTGGTTTGGCTACATGCCGCTGATCCACTCTCAGATGAGGCTCGACCCCGTCCTCTTTAAAGACCAGGTCTCTATTTTGAGGAAGAAATACCGAGACATTGAGCGACTTTGA(SEQ ID NO:1),
其编码的蛋白质具有如下所示的氨基酸序列:
MQAKKRYFILLSAGSCLALLFYFGGLQFRASRSHSRREEHSGRNGLHHPSPDHFWPRFPDALRPFVPWDQLENEDSSVHISPRQKRDANSSIYKGKKCRMESCFDFTLCKKNGFKVYVYPQQKGEKIAESYQNILAAIEGSRFYTSDPSQACLFVLSLDTLDRDQLSPQYVHNLRSKVQSLHLWNNGRNHLIFNLYSGTWPDYTEDVGFDIGQAMLAKASISTENFRPNFDVSIPLFSKDHPRTGGERGFLKFNTIPPLRKYMLVFKGKRYLTGIGSDTRNALYHVHNGEDVVLLTTCKHGKDWQKHKDSRCDRDNTEYEKYDYREMLHNATFCLVPRGRRLGSFRFLEALQAACVPVMLSNGWELPFSEVINWNQAAVIGDERLLLQIPSTIRSIHQDKILALRQQTQFLWEAYFSSVEKIVLTTLEIIQDRIFKHISRNSLIWNKHPGGLFVLPQYSSYLGDFPYYYANLGLKPPSKFTAVIHAVTPLVSQSQPVLKLLVAAAKSQYCAQIIVLWNCDKPLPAKHRWPATAVPVVVIEGESKVMSSRFLPYDNIITDAVLSLDEDTVLSTTEVDFAFTVWQSFPERIVGYPARSHFWDNSKERWGYTSKWTNDYSMVLTGAAIYHKYYHYLYSHYLPASLKNMVDQLANCEDILMNFLVSAVTKLPPIKVTQKKQYKETMMGQTSRASRWADPDHFAQRQSCMNTFASWFGYMPLIHSQMRLDPVLFKDQVSILRKKYRDIERL(SEQ ID NO:2),
突变型EXT1cDNA序列:
ATGCAGGCCAAAAAACGCTATTTCATCCTGCTCTCAGCTGGCTCTTGTCTCGCCCTTTTGTTTTATTTCGGAGGCTTGCAGTTTAGGGCATCGAGGAGCCACAGCCGGAGAGAAGAACACAGCGGTAGGAATGGCTTGCACCACCCCAGTCCGGATCATTTCTGGCCCCGCTTCCCGGACGCTCTGCGCCCCTTCGTTCCTTGGGATCAATTGGAAAACGAGGATTCCAGCGTGCACATTTCCCCCCGGCAGAAGCGAGATGCCAACTCCAGCATCTACAAAGGCAAGAAGTGCCGCATGGAGTCCTGCTTCGATTTCACCCTTTGCAAGAAAAACGGCTTCAAAGTCTACGTATACCCACAGCAAAAAGGGGAGAAAATCGCCGAAAGTTACCAAAACATTCTAGCGGCCATCGAGGGCTCCAGGTTCTACACCTCGGACCCCAGCCAGGCGTGCCTCTTTGTCCTGAGTCTGGATACTTTAGACAGAGACCAGTTGTCACCTCAGTATGTGCACAATTTGAGATCCAAAGTGCAGAGTCTCCACTTGTGGAACAATGGTAGGAATCATTTAATTTTTAATTTATATTCCGGCACTTGGCCTGACTACACCGAGGACGTGGGGTTTGACATCGGCCAGGCGATGCTGGCCAAAGCCAGCATCAGTACTGAAAACTTCCGACCCAACTTTGATGTTTCTATTCCCCTCTTTTCTAAGGATCATCCCAGGACAGGAGGGGAGAGGGGGTTTTTGAAGTTCAACACCATCCCTCCTCTCAGGAAGTACATGCTGGTATTCAAGGGGAAGAGGTACCTGACAGGGATAGGATCAGACACCAGGAATGCCTTATATCACGTCCATAACGGGGAGGACGTTGTGCTCCTCACCACCTGCAAGCATGGCAAAGACTGGCAAAAGCACAAGGATTCTCGCTGTGACAGAGACAACACCGAGTATGAGAAGTATGATTATCGGGAAATGCTGCACAATGCCACTTTCTGTCTGGTTCCTCGTGGTCGCAGGCTTGGGTCCTTCAGATTCCTGGAGGCTTTGCAGGCTGCCTGCGTCCCTGTGATGCTCAGCAATGGATGGGAGTTGCCATTCTCTGAAGTGATTAATTGGAACCAAGCTGCCGTCATAGGCGATGAGAGATTGTTATTACAGATTCCTTCTACAATCAGGTCTATTCATCAGGATAAAATCCTAGCACTTAGACAGCAGACACAATTCTTGTGGGAGGCTTATTTTTCTTCAGTTGAGAAGATTGTATTAACTACACTAGAGATTATTCAGGACAGAATATTCAAGCACATATCACGTAACAGTTTAATATGGAACAAACATCCTGGAGGATTGTTCGTACTACCACAGTATTCATCTTATCTGGGAGATTTTCCTTACTACTATGCTAATTTAGGTTTAAAGCCCCCCTCCAAATTCACTGCAGTCATCCATGCGGGTGACCCCCCTGGTCTCTCAGTCCCAGCCAGTGTTGAAGCTTCTCGTGGCTGCAGCCAAGTCCCAGTACTGTGCCCAGATCATAGTTCTATGGAATTGTGA(SEQID NO:5),
突变型EXT1基因所编码蛋白质的氨基酸序列:
MQAKKRYFILLSAGSCLALLFYFGGLQFRASRSHSRREEHSGRNGLHHPSPDHFWPRFPDALRPFVPWDQLENEDSSVHISPRQKRDANSSIYKGKKCRMESCFDFTLCKKNGFKVYVYPQQKGEKIAESYQNILAAIEGSRFYTSDPSQACLFVLSLDTLDRDQLSPQYVHNLRSKVQSLHLWNNGRNHLIFNLYSGTWPDYTEDVGFDIGQAMLAKASISTENFRPNFDVSIPLFSKDHPRTGGERGFLKFNTIPPLRKYMLVFKGKRYLTGIGSDTRNALYHVHNGEDVVLLTTCKHGKDWQKHKDSRCDRDNTEYEKYDYREMLHNATFCLVPRGRRLGSFRFLEALQAACVPVMLSNGWELPFSEVINWNQAAVIGDERLLLQIPSTIRSIHQDKILALRQQTQFLWEAYFSSVEKIVLTTLEIIQDRFKHISRNSLIWNKHPGGLFVLPQYSSYLGDFPYYYANLGLKPPSKFTAVIHAGDPPGLSVPASVEASRGCSQVPVLCPDHSSMEL(SEQ ID NO:6)。
发明人发现的新的新突变体与SEQ ID NO:1相比,具有c.1457-1458insG突变,即相对于野生型EX T1基因,本发明的EX T1基因突变体在第1457位和第1458位碱基之间插入碱基G,也可以是在第1458位和第1459位或者在第1459位和第1460位插入碱基G。由此,其所编码的产物与野生型的EXT1相比,具有p.V487G突变,即该突变是由于c.1457-1458insG的移码突变而引起的,具体地,该突变表示:从第487位开始的33个氨基酸改变为GDPPGLSVPASVEASRGCSQVPVLCPDHSSMEL,且翻译提前终止于第519位氨基酸,导致EXT1基因编码蛋白的糖基转移酶功能域被截断。
EXT1基因包含11个外显子,编码一种分布于内质网的II型跨膜糖蛋白。研究发现,EXT1蛋白催化内质网合成肝素。肝素广泛分布于细胞和细胞外基质,在软骨细胞配受体结合、生长分化调控和信号转导等生理过程中重要作用。目前,已有研究发现EXT1基因是遗传性多发性软骨瘤疾病的致病基因,科学家预测EXT1基因突变可能导致软骨细胞内质网肝素合成障碍,进而诱发软骨细胞生长和分化调控异常。但是,本发明的EXT1基因突变位点并未见报道。
根据本发明的第二方面,本发明提出了一种分离的多肽。根据本发明的实施例,与野生型EXT1相比,该分离的多肽具有p.V487G突变,即该突变是由于c.1457-1458insG的移码突变而引起的,具体地,该突变表示:从第487位开始的33个氨基酸改变为GDPPGLSVPASVEASRGCSQVPVLCPDHSSMEL,且翻译提前终止于第519位氨基酸。根据本发明的一些具体示例,该多肽是由前述分离的编码EXT1突变体的核酸编码的。通过检测生物样品中是否表达该多肽,可以有效地检测生物样品是否易患遗传性多发性软骨瘤疾病,也可以通过检测这些多肽在生物体中是否存在,可以有效地预测生物体是否易患遗传性多发性软骨瘤疾病。
根据本发明的第三方面,本发明提出了一种筛选易患遗传性多发性软骨瘤疾病的生物样品的方法。根据本发明的实施例,该方法包括以下步骤:
从所述生物样品提取核酸样本。根据本发明的实施例,生物样品的类型并不受特别限制,只要从该生物样品中能够提取到反映生物样品EXT1是否存在突变的核酸样本即可。根据本发明的实施例,生物样品可以为选自外周血白细胞、软骨细胞中的至少一种。由此,可以方便地进行取样和检测,从而能够进一步提高筛选易患遗传性多发性软骨瘤疾病的生物样品的效率。根据本发明的实施例,这里所使用的术语“核酸样本”应做广义理解,其可以是任何能够反映生物样品中EXT1是否存在突变的样本,例如可以是从生物样品中直接提取的全基因组DNA,也可以是该全基因组中包含EXT1编码序列的一部分,可以是从生物样品中提取的总RNA,也可以是从生物样品中提取的mRNA。根据本发明的一个实施例,所述核酸样本为全基因组DNA。由此,可以扩大生物样品的来源范围,并且可以同时对生物样品的多种信息进行确定,从而能够提高筛选易患遗传性多发性软骨瘤疾病的生物样品的效率。另外,根据本发明的实施例,针对采用RNA作为核酸样本,从生物样品提取核酸样本可以进一步包括:从生物样品提取RNA样本,优选RNA样本为mRNA;以及基于所得到的RNA样本,通过反转录反应,获得cDNA样本,所得到的cDNA样本构成核酸样本。由此,可以进一步提高利用RNA作为核酸样本筛选易患遗传性多发性软骨瘤疾病的生物样品的效率。
接下来,在得到核酸样本之后,可以对核酸样本进行分析,从而能够确定所得到核酸样本的核酸序列。根据本发明的实施例,确定所得到核酸样本的核酸序列的方法和设备并不受特别限制。根据本发明的具体实施例,可以通过测序方法,确定核酸样本的核酸序列。根据本发明的实施例,可以用于进行测序的方法和设备并不受特别限制。根据本发明的实施例,可以采用第二代测序技术,也可以采用第三代以及第四代或者更先进的测序技术。根据本发明的具体示例,可以利用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种对核酸序列进行测序。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,能够提高后续对测序数据进行分析时的精确性和准确度。由此,根据本发明的实施例,确定核酸样本的核酸序列可以进一步包括:首先,针对所得到的核酸样本,构建核酸测序文库;以及对所得到的核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。根据本发明的一些实施例,可以采用选自Hiseq2000、SOLiD、454和单分子测序装置的至少一种对所得到的核酸测序文库进行测序。另外,根据本发明的实施例,可以对核酸样本进行筛选,富集EXT1外显子,该筛选富集可以在构建测序文库之前,构建测序文库过程中,或者构建测序文库之后进行。根据本发明的一个实施例,针对核酸样本,构建核酸测序文库进一步包括:利用EXT1外显子特异性引物,对核酸样本进行PCR扩增;以及针对所得到的扩增产物,构建核酸测序文库。由此,可以通过PCR扩增,富集EXT1外显子(尤其是第8号外显子),从而能够进一步提高筛选易患遗传性多发性软骨瘤疾病的生物样品的效率。根据本发明的实施例,EXT1外显子特异性引物的序列不受特别限制,根据本发明的优选实施例,这些EXT1外显子特异性引物具有SEQ ID NO:3和4所示的核苷酸序列:
GTAAGGAGGGCGGAGTCTCT(SEQ ID NO:3)
AAAGCCAAAGGGACATCACA(SEQ ID NO:4)
发明人惊奇地发现,通过采用这些引物,可以在PCR反应体系中通过显著有效地完成对EXT1外显子的扩增。需要说明的是,这些SEQ ID NO:3和SEQ ID NO:4所示的核苷酸序列是本发明的发明人在付出了艰苦的劳动后,意外获得的。
关于针对核酸样本,构建测序文库的方法和流程,本领域技术人员可以根据不同的测序技术进行适当选择,关于流程的细节,可以参见测序仪器的厂商例如Illumina公司所提供的规程,例如参见Illumina公司Multiplexing Sample Preparation Guide(Part#1005361;Feb 2010)或Paired-End SamplePrep Guide(Part#1005063;Feb 2010),通过参照将其并入本文。根据本发明的实施例,从生物样品提取核酸样本的方法和设备,也不受特别限制,可以采用商品化的核酸提取试剂盒进行。
需要说明的是,在这里所使用的术语“核酸序列”应作广义理解,其可以是在对核酸样本进行测序得到的测序数据进行组装后,得到的完整的核酸序列信息,也可以是直接采用通过对核酸样本进行测序所得到的测序数据(reads)作为核酸序列,只要这些核酸序列中含有对应EXT1的编码序列即可。
最后,在确定核酸样本的核酸序列之后,将所得到的核酸样本的核酸序列与SEQID NO:1的序列相比对。如果在所得到的核酸序列中具有c.1457-1458insG突变,则指示生物样品易患遗传性多发性软骨瘤疾病。由此,通过根据本发明实施例的筛选易患遗传性多发性软骨瘤疾病的生物样品的方法,可以有效地筛选易患遗传性多发性软骨瘤疾病的生物样品。根据本发明的实施例,对核酸序列与SEQ ID NO:1进行比对的方法和设备并不受特别限制,可以采用任意常规的软件进行操作,根据本发明的具体实例,可以采用SOAP软件进行比对。
需要说明的是,根据本发明实施例的“筛选易患遗传性多发性软骨瘤疾病的生物样品的方法”的用途不受特别限制,例如可以用作非诊断目的的筛选方法。
筛选易患遗传性多发性软骨瘤疾病的生物样品的系统和试剂盒
根据本发明的第四方面,本发明提出了一种能够有效实施上述筛选易患遗传性多发性软骨瘤疾病的生物样品的方法的系统。
参考图1,根据本发明的实施例,该筛选易患遗传性多发性软骨瘤疾病的生物样品的系统1000包括核酸提取装置100、核酸序列确定装置200以及判断装置300。
根据本发明的实施例,核酸提取装置100用于从生物样品提取核酸样本。如前所述,根据本发明的实施例,核酸样本的类型并不受特别限制,对于采用RNA作为核酸样本,则核酸提取装置进一步包括RNA提取单元101和反转录单元102,其中,提取单元101用于从生物样品提取RNA样本,反转录单元102与RNA提取单元101相连,用于对RNA样本进行反转录反应,以便获得cDNA样本,所得到的cDNA样本构成核酸样本。
根据本发明的实施例,核酸序列确定装置200与核酸提取装置100相连,用于对核酸样本进行分析,以便确定核酸样本的核酸序列。如前所示,可以采用测序的方法确定核酸样本的核酸序列。由此,根据本发明的一个实施例,所述核酸序列确定装置200可以进一步包括:文库构建单元201以及测序单元202。文库构建单元201用于针对核酸样本,构建核酸测序文库;测序单元202与文库构建单元201相连,用于对核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。如前所述,可以通过PCR扩增,富集EXT1外显子,进一步提高筛选易患遗传性多发性软骨瘤疾病的生物样品的效率。由此,文库构建单元201可以进一步包括PCR扩增模块(图中未示出),在该PCR扩增模块中设置有EXT1外显子特异性引物,以便利用EXT1外显子特异性引物,对所述核酸样本进行PCR扩增,根据本发明的具体实施例,EXT1外显子特异性引物具有如SEQ ID NO:3和4所示的核苷酸序列。根据本发明的实施例,测序单元202可以包括选自HISEQ2000、SOLiD、454和单分子测序装置的至少一种。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,提高后续对测序数据进行分析时的精确性和准确度。
根据本发明的实施例,判断装置300与核酸序列确定装置200相连,适于将核酸样本的核酸序列进行比对,以便基于核酸样本的核酸序列与SEQ ID NO:1的区别判断生物样品是否易患遗传性多发性软骨瘤疾病。具体地,基于核酸样本的核酸序列与SEQ ID NO:1相比,是否具有c.1457-1458insG突变,判断生物样品是否易患遗传性多发性软骨瘤疾病。如前所述,根据本发明的一个实施例,核酸样本的核酸序列与SEQ ID NO:1相比,具有c.1457-1458insG突变,是生物样品易患遗传性多发性软骨瘤疾病的指示。如前所述,根据本发明的实施例,对核酸序列与SEQ ID NO:1进行比对的设备并不受特别限制,可以采用任意常规的软件进行操作,根据本发明的具体实例,可以采用SOAP软件进行比对。
由此,利用该系统,能够有效地实施前述筛选易患遗传性多发性软骨瘤疾病的生物样品的方法,从而可以有效地筛选易患遗传性多发性软骨瘤疾病的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易患遗传性多发性软骨瘤疾病的生物样品的试剂盒。根据本发明的实施例,该用于筛选易患遗传性多发性软骨瘤疾病的生物样品的试剂盒包括:适于检测EXT1基因突变体的试剂,其中与SEQ ID NO:1相比,该EXT1基因突变体具有c.1457-1458insG突变。利用根据本发明的实施例的试剂盒,能够有效地筛选易患遗传性多发性软骨瘤疾病的生物样品。在本文中,所使用的术语“适于检测EXT1基因突变体的试剂”应做广义理解,即可以是检测EXT1编码基因的试剂,也可以是检测EXT1突变体多肽的试剂,例如可以采用识别特异性位点的抗体。根据本发明的一个实施例,所述试剂为核酸探针,由此,可以高效地筛选易患遗传性多发性软骨瘤疾病的生物样品。
需要说明的是,在本文前面筛选易患遗传性多发性软骨瘤疾病的生物样品的方法部分中所描述的特征和优点,同样适用于筛选易患遗传性多发性软骨瘤疾病的生物样品的系统或者试剂盒,在此不再赘述。
筛选治疗或预防遗传性多发性软骨瘤疾病的药物的方法
根据本发明的第六方面,本发明提出了一种筛选治疗或预防遗传性多发性软骨瘤疾病的药物的方法。根据本发明的实施例,该筛选治疗或预防遗传性多发性软骨瘤疾病的药物的方法可以包括以下步骤:
首先,将能够表达EXT1基因突变体的生物样品在存在候选试剂的情况下进行培养,其中EXT1基因突变体与SEQ ID NO:1相比,具有c.1457-1458insG突变。这里所使用的术语“培养”应做广义理解,是指使得生物样品以有活性的状态存在。根据本发明的实施例,生物样品的类型不受特别限制,只要该生物样品能够表达这样一种EXT1基因突变体即可,该突变体与SEQ ID NO:1相比,具有c.1457-1458insG突变。根据本发明的一些具体示例,生物样品可以为选自细菌、酵母、软骨细胞中的至少一种。
其次,将上述生物样品在不存在该候选试剂的情况下进行培养。
接着,确定上述生物样品在存在候选试剂和不存在候选试剂的情况下,细胞凋亡率或细胞生长率的变化,其中存在该候选试剂时,细胞凋亡率高于不存在该候选试剂时的细胞凋亡率,或者细胞生长率低于不存在该候选试剂时的细胞生长率,是该候选试剂作为治疗或预防遗传性多发性软骨瘤疾病的药物的指示。
利用本发明的筛选治疗或预防遗传性多发性软骨瘤疾病的药物的方法,能够有效地筛选治疗或预防遗传性多发性软骨瘤疾病的药物。
下面参考具体实施例,对本发明进行说明,需要说明的是,这些实施例仅仅是说明性的,而不能理解为对本发明的限制。
若未特别指明,实施例中所采用的技术手段为本领域技术人员所熟知的常规手段,可以参照《分子克隆实验指南》第三版或者相关产品进行,所采用的试剂和产品也均为可商业获得的。未详细描述的各种过程和方法是本领域中公知的常规方法,所用试剂的来源、商品名以及有必要列出其组成成分者,均在首次出现时标明,其后所用相同试剂如无特殊说明,均以首次标明的内容相同。
实施例1确定HME疾病致病基因
1、样本收集
发明人收集到一个遗传性多发性软骨瘤(在本文中有时也简称为HME)患者家系,其家系图见图2。如图2所示,其中,□表示正常男性,○表示正常女性,■表示男性患者,●表示女性患者。由图2可知,该家系共有19个成员,其中HME患者6名,正常成员13名。
此外,发明人对该家系中的所有患者均进行了X线片诊断、并对手术切除的瘤体组织进行了组织切片hematoxylin-eosin染色和Safranin O染色,结果分别见图3-5。其中,图3显示了该遗传性多发性软骨瘤患者家系中患者的膝关节X射线图,图4显示了该遗传性多发性软骨瘤患者家系中患者的手术切除瘤体组织切片hematoxylin-eosin染色图,图5显示了该遗传性多发性软骨瘤患者家系患者的手术切除瘤体组织切片Safranin O染色图。以上结果证明该家系中的患者所患疾病确实为遗传性多发性软骨瘤疾病。
2、全外显子组测序
发明人用NimbleGen SeqCap EZ Exome(44M)结合Illumina Hiseq 2000高通量测序技术对图2所示HME患者家系中的两名患者(HME1和HME5)的外显子组序列进行了测序。
具体如下:
2.1DNA提取
采集图2所示HME患者家系中的两名患者HME1和HME5的外周血,利用OMEGABloodDNA Midi Kit全血DNA提取试剂盒从该外周血样品中提取各患者的基因组DNA,并利用分光光度计测量DNA的浓度及纯度,所得各基因组DNA的OD260/OD280均应位于1.7-2.0之间,浓度不少于200ng/微升,总量不少于30微克。
2.2外显子捕获与测序
利用超声波仪(CovarisS2,Massachusetts,USA)将各基因组DNA样本随机打断成200-300bp左右的片段,随后按照制造商提供的操作说明书,在片段两端分别连接上接头制备文库(可参见:http://www.illumina.com/提供的Illumina/Solexa标准建库说明书,通过参照将其全文并入本文)。文库经纯化后经过Ligation-mediated PCR (LM-PCR)的线性扩增与Biotinylated DNA Library进行杂交富集,再经过LM-PCR的线性扩增,文库检测合格后即可上机测序,以便获得原始测序数据。其中,参照Illumina标准的成簇和测序的protocol进行测序,测序平台为Illumina Hiseq 2000,读取长度为90bp,样本的平均测序深度为50×。
3、变异检测、注释及数据库比较
利用Illumina basecalling Software 1.7对上述获得的原始测序数据进行处理,经过过滤去污染后,使用SOAPaligner/SOAP2(可参见:Li R,Li Y,Kristiansen K,etal,SOAP:shortoligonucleotide alignment program.Bioinformatics 2008,24(5):713-714;Li R,Yu C,Li Y,ea al,SOAP2:an improved ultrafast tool for short readalignment.Bioinformatics 2009,25(15):1966-1967,通过参照将其全文并入本文)比对到UCSC人类参考基因组(hg19,build37.1,http://genome.ucsc.edu/),以便获得比对到基因组上的唯一比对序列。然后利用SOAPsnp(可参见:Li R,Li Y,Fang X,Yang H,et al,SNPdetection for massively parallelwhole-genome resequencing.Genome Res 2009,19(6):1124-1132,通过参照将其全文并入本文)确定靶区域的基因型。
其中,在得到测序结果之后,对非同义突变、剪接受体/供体位点突变、编码区插入和缺失突变这三类最有可能与病理相关的突变进行研究。结果,在这些样本中分别发现:患者HME1中有107675个单核苷酸多态性(SNPs)和7427处的插入/缺失;患者HME 5中有101472个单核苷酸多态性(SNPs)和7244处的插入/缺失。随后通过四个公共数据库:dbSNP数据库(http://hgdownload.cse.ucsc.edu/goldenPath/hg19/database/snp132.txt.gz.)、HapMap数据库(ftp://ftp.ncbi.nlm.nih.gov/hapmap)、千人基因组数据库(ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp)、炎黄数据库(http://yh.genomics.org.cn/)的过滤,去掉所有已知的且在数据库中等位基因频率大于0.005的变异。
由此,发明人发现患者在EXT1基因8号外显子上存在一个插入的杂合的突变c.1457-1458insG。进一步,通过对遗传性多发性软骨瘤患者家系进行疾病共分离和正常人SNP筛查,发明人发现,EXT1基因8号外显子的该突变可能是该遗传性多发性软骨瘤患者家系的致病位点。
实施例2Sanger法测序验证
分别对实施例1中所述的遗传性多发性软骨瘤患者家系中的3名患者(HME1、HME2和HME5)和3名家系内正常人(HME3、HME4和HME6),以及200个家系外正常人的EXT1基因进行检测:针对EXT1基因的8号外显子的序列设计引物,然后通过PCR扩增、产物纯化和测序的方法获得EXT1有关序列,根据确定序列测定结果属于突变型还是野生型,验证EXT1基因的c.1457-1458insG突变与遗传性多发性软骨瘤和疾病之间的相关性。其中,下表示出了上述来自遗传性多发性软骨瘤患者家系的受试者的基本情况。
具体方法步骤如下:
1、DNA提取
按照实施例1中所述的提取DNA的方法,分别提取制备受试者外周静脉血中的基因组DNA,备用。
2、引物设计及PCR反应
首先,参考人类基因组序列数据库hg19/build36.3,设计得到具有SEQ ID NO:3-4所示的核苷酸序列的EXT1基因外显子特异性引物,具体序列见下表:
接着,分别按照以下配比配制各基因组DNA样本的PCR反应体系以及进行PCR反应:反应体系:25μL
体系组成 |
体积 |
LA Taq酶(5U/μL) |
0.25μL |
2×GC Buffer I(加入了Mg2+) |
2.5μL |
2mM dNTP |
2.5μL |
正向引物(100ng/μL) |
2μL |
反向引物(100ng/μL) |
1μL |
DNA模板 |
1μL |
dH2O |
加至25μL |
PCR反应条件:
由此,获得上述遗传性多发性软骨瘤患者家系中的3名患者和3名家系内正常人,以及200个家系外正常人的PCR扩增产物。
3、测序
将步骤2中获得的上述遗传性多发性软骨瘤患者家系中的3名患者和3名家系内正常人,以及200个家系外正常人的PCR扩增产物直接进行DNA测序(请发明人提供Sanger测序所采用设备及其型号),以便获得测序结果。
接着,基于测序结果,对上述各样本进行EXT1基因编码序列比对。
结果,发明人发现,遗传性多发性软骨瘤患者家系中患者HME 1、HME2和HME 5三名患者都携带有EXT1基因8号外显子c.1457-1458insG突变,而家系内正常人HME 3、HME4和HME 6都未携带该突变;200个家系外正常人均未携带EXT1基因8号外显子c.1457-1458insG突变。其中,所有受试者的突变验证结果见下表。由此,证明EXT1基因8号外显子的c.1457-1458insG突变是遗传性多发性软骨瘤疾病的致病突变。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。