SCAP基因突变体及其应用
优先权信息
本申请请求2015年12月23日向中国国家知识产权局提交的、专利申请号为201510980242.6的专利申请的优先权和权益,并且通过参照将其全文并入此处。
技术领域
本发明涉及SCAP基因突变体及其应用。具体地,本发明涉及分离编码SCAP突变体的核酸,分离的多肽,筛选易患早发心肌梗死的生物样品的方法,筛选遗憾早发心肌梗死的生物样品的系统,用于筛选易患早发心肌梗死的生物样品的试剂盒,构建体以及重组细胞。
背景技术
心肌梗死(Myocardial Infarction,MI)是一种由于冠状动脉粥样硬化斑块的纤维帽破裂而引起后续的血栓形成,从而使得血管堵塞并引起相应区域的心肌发生缺血缺氧,最终引起心肌坏死的严重致猝死性疾病。其中,部分人群呈现出发病年龄早(男性<50,女性<60)、家族聚集倾向等典型临床特点,称为早发心肌梗死(Premature Myocardial Infarction,PMI)。有研究显示,早发心肌梗死的遗传度高达63%。由于这类患者的首发症状即可表现为由急性心肌坏死引起的猝死,之前可无任何冠心病及其危险因素的相关症状,因此相比非早发性心肌梗死,其危险度更高。这使得通过早期检测潜在患病者的遗传信息,在出现致死性症状前提供风险预测、实现对早发心肌梗死的“初级预防”显得尤为重要。而目前该病的发病机制尚未完全清楚,致病基因和致病突变仍不明确,且尚未有足够的用于早期识别早发心梗患者的遗传标志物。
因而,目前对早发心肌梗死的致病基因和致病突变的研究仍有待深入。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出一种能够有效筛选易患早发心肌梗死的生物样品的方法。
本发明是基于发明人的下列工作完成的:发明人高通量外显子组测序联合候选基因突变验证的方法确定了SCAP基因为早发心肌梗死的致病基因,并且SCAP基因18号外显子上的c.3035C>T突变为早发心肌梗死的致病突变。
根据本发明的第一方面,本发明提出了一种分离的编码SCAP突变体的核酸。根据本发明的实施例,所述核酸与SEQ ID NO:1相比,具有c.3035C>T突变,即相对于野生型SCAP基因,本发明的SCAP基因突变体的第3035位碱基从C突变为T。根据本发明的实施例,发明人确定了SCAP基因以及该突变体与早发心肌梗死的发病密切相关,从而通过检测该突变体在生物样品中是否存在,可以有效地检测生物样品是否易患
早发心肌梗死。
根据本发明的第二方面,本发明提出了一种分离的多肽。根据本发明的实施例,与SEQ ID NO:2相比,所述分离的多肽具有p.A1012V突变,即该突变是由于c.3035C>T的无义突变而引起的,具体地,该突变表示:该分离的多肽,由野生型SCAP的第1012位氨基酸A(丙氨酸)突变为V(缬氨酸)。通过检测生物样品中是否表达该多肽,可以有效地检测生物样品是否易患早发心肌梗死。
根据本发明的第三方面,本发明提出了一种筛选易患早发心肌梗死的生物样品的方法。根据本发明的实施例,该方法包括以下步骤:从所述生物样品提取核酸样本;确定所述核酸样本的核酸序列;所述核酸样本的核酸序列与SEQ ID NO:1相比,具有c.3035C>T突变是所述生物样品易患早发心肌梗死的指示。通过根据本发明实施例的筛选易患早发心肌梗死的生物样品的方法,可以有效地筛选易患早发心肌梗死的生物样品。
根据本发明的第四方面,本发明提出了一种筛选易患早发心肌梗死的生物样品的系统。根据本发明的实施例,该系统包括:核酸提取装置,所述核酸提取装置用于从所述生物样品提取核酸样本;核酸序列确定装置,所述核酸序列确定装置与所述核酸提取装置相连,用于对所述核酸样本进行分析,以便确定所述核酸样本的核酸序列;判断装置,所述判断装置与所述核酸序列确定装置相连,以便基于所述核酸样本的核酸序列与SEQ ID NO:1相比,是否具有c.3035C>T突变,判断所述生物样品是否易患早发心肌梗死。利用该系统,能够有效地实施前述筛选易患早发心肌梗死的生物样品的方法,从而可以有效地筛选易患早发心肌梗死的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易患早发心肌梗死的生物样品的试剂盒。根据本发明的实施例,该试剂盒含有:适于检测SCAP基因突变体的试剂,其中与SEQ ID NO:1相比,该SCAP基因突变体具有c.3035C>T突变。利用根据本发明的实施例的试剂盒,能够有效地筛选易患早发心肌梗死的生物样品。
根据本发明的第六方面,本发明还提出了一种构建体。根据本发明的实施例,该构建体包含前面所述的分离的编码SCAP突变体的核酸。由此,利用本发明的构建体转化受体细胞获得的重组细胞,能够有效地用于筛选治疗早发心肌梗死的药物。
根据本发明的第七方面,本发明还提出了一种重组细胞。根据本发明的实施例,该重组细胞是通过前面所述的构建体转化受体细胞而获得的。根据本发明的一些实施例,利用本发明的重组细胞,能够有效地筛选治疗早发心肌梗死的药物。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1显示了根据本发明实施例的筛选易患早发心肌梗死的生物样品的系统及其组成部分的示意图,其中,
图1A为根据本发明实施例的筛选易患早发心肌梗死的生物样品的系统的示意图,
图1B为根据本发明实施例的核酸提取装置的示意图,
图1C为根据本发明实施例的核酸序列确定装置的示意图;
图2显示了根据本发明一个实施例的早发心肌梗死患者家系的家系图;
图3显示了根据本发明的一个实施例,早发心肌梗死患者家系中患者、家系内正常人以及家系外正常人的SCAP基因c.3035C>T突变位点的代表性Sanger测序验证峰图。
发明详细描述
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
SCAP基因突变体
根据本发明的第一方面,本发明提出了一种分离的编码SCAP突变体的核酸。根据本发明的实施例,所述核酸与SEQ ID NO:1相比,具有c.3035C>T突变。在本文中所使用的表达方式“编码SCAP突变体的核酸”,是指与编码SCAP突变体的基因相对应的核酸物质,即核酸的类型不受特别限制,可以是任何包含与SCAP突变体的编码基因相对应的脱氧核糖核苷酸和/或核糖核苷酸的聚合物,包括但不限于DNA、RNA或cDNA。根据本发明的一个具体示例,前面所述的编码SCAP突变体的核酸为DNA。根据本发明的实施例,发明人确定了SCAP基因的及该突变体与早发心肌梗死的发病密切相关,从而通过检测该突变体在生物样品中是否存在,可以有效地检测生物样品是否易患早发心肌梗死,也可以通过检测该突变体在生物体中是否存在,可以有效地预测生物体是否易患早发心肌梗死。
对于本发明说明书和权利要求书中,提及核酸,本领域技术人员应当理解,实际包括互补双链的任意一条,或者两条。为了方便,在本说明书和权利要求书中,虽然多数情况下只给出了一条链,但实际上也公开了与之互补的另一条链。例如,提及SEQ ID NO:1,实际包括其互补序列。本领域技术人员还可以理解,利用一条链可以检测另一条链,反之亦然。
该编码SCAP突变体的核酸,是本申请的发明人通过高通量外显子组测序联合候选基因突变验证的方法确定的早发心肌梗死的致病基因SCAP上的致病突变。该突变位点在现有技术中并未被提到。
其中,野生型SCAP基因的cDNA具有如下所示的核苷酸序列:
其编码的蛋白质具有如下所示的氨基酸序列:
发明人发现的该突变体与SEQ ID NO:1相比,具有c.3035C>T突变,即相对于野生型SCAP基因,本发明的SCAP基因突变体的第3035位碱基从C突变为T。由此,其所编码的产物与野生型的SCAP相比,具有p.A1012V突变,即该突变是由于c.3035C>T的无义突变而引起的,具体地,该突变表示:该分离的多肽,由野生型SCAP的第1012位氨基酸A(丙氨酸)突变为V(缬氨酸)。
需要说明的是,SCAP基因位于3号染色体,由23个外显子组成,共包含1279个氨基酸。它是哺乳动物脂质合成和摄入的“中心调节因子”,在细胞内胆固醇水平降低时,其可发生构象改变,并通过其酶切作用激活SREBP基因、促进其进入细胞核完成一系列的转录调控反应,进而上调包括LDLR、HMGCoA等一系列脂质代谢的关键酶,从而促进胆固醇的形成;相反,当细胞内胆固醇水平增高时,SCAP基因则可感受细胞内过高的胆固醇水平,并停止发挥其酶切作用。因此,SCAP是胆固醇代谢环节中的重要负反馈介质。有研究表明,位于SCAP基因上的点突变可造成其对于细胞内胆固醇水平变化的敏感性下降,导致其不能为升高的胆固醇水平抑制,进而使得细胞内胆固醇水平过度增高:当该过程发生于肝细胞等机体主要的胆固醇合成组织时,则会导致机体出现高胆固醇血症;而当该过程发生于巨噬细胞及平滑肌细胞时,则会导致其行为“泡沫细胞”,而“泡沫细胞”的形成,则是心肌梗死发生发展的重要机制及细胞学标志。进而,本发明的发明人经过一系列的实验发现并验证了SCAP基因为早发心肌梗死的致病基因,并进一步发现SCAP基因18号外显子上的c.3035C>T突变能够引起早发心肌梗死,为早发心肌梗死的致病突变。但是,本发明的SCAP基因突变位点c.3035C>T并未见报道。
根据本发明的第二方面,本发明提出了一种分离的多肽。根据本发明的实施例,与野生型SCAP相比,该分离的多肽具有p.A1012V突变,即该突变是由于c.3035C>T的无义突变而引起的,具体地,该突变表示:该分离的多肽,由野生型SCAP的第1012位氨基酸A(丙氨酸)突变为V(缬氨酸)。根据本发明的一些具体示例,该多肽是由前述分离的编码SCAP突变体的核酸编码的。通过检测生物样品中是否表达该多肽,可以有效地检测生物样品是否易患早发心肌梗死,也可以通过检测这些多肽在生物体中是否存在,可以有效地预测生物体是否易患早发心肌梗死。
根据本发明的第三方面,本发明提出了一种筛选易患早发心肌梗死的生物样品的方法。根据本发明的实施例,该方法包括以下步骤:
从所述生物样品提取核酸样本。根据本发明的实施例,生物样品的类型并不受特别限制,只要从该生物样品中能够提取到反映生物样品SCAP是否存在突变的核酸样本即可。根据本发明的实施例,生物样品可以为选自人体血液、皮肤、皮下组织的至少一种,优选外周血。由此,可以方便地进行取样和检测,从而能够进一步提高筛选易患早发心肌梗死的生物样品的效率。根据本发明的实施例,这里所使用的术语“核酸样本”应做广义理解,其可以
是任何能够反映生物样品中SCAP是否存在突变的样本,例如可以是从生物样品中直接提取的全基因组DNA,也可以是该全基因组中包含SCAP编码序列的一部分,可以是从生物样品中提取的总RNA,也可以是从生物样品中提取的mRNA。根据本发明的一个实施例,所述核酸样本为全基因组DNA。由此,可以扩大生物样品的来源范围,并且可以同时对生物样品的多种信息进行确定,从而能够提高筛选易患早发心肌梗死的生物样品的效率。另外,根据本发明的实施例,针对采用RNA作为核酸样本,从生物样品提取核酸样本可以进一步包括:从生物样品提取RNA样本,优选RNA样本为mRNA;以及基于所得到的RNA样本,通过反转录反应,获得cDNA样本,所得到的cDNA样本构成核酸样本。由此,可以进一步提高利用RNA作为核酸样本筛选易患早发心肌梗死的生物样品的效率。
接下来,在得到核酸样本之后,可以对核酸样本进行分析,从而能够确定所得到核酸样本的核酸序列。根据本发明的实施例,确定所得到核酸样本的核酸序列的方法和设备并不受特别限制。根据本发明的具体实施例,可以通过测序方法,确定核酸样本的核酸序列。根据本发明的实施例,可以用于进行测序的方法和设备并不受特别限制。根据本发明的实施例,可以采用第二代测序技术,也可以采用第三代以及第四代或者更先进的测序技术。根据本发明的具体示例,可以利用选自Illumina HiSeq4000、SOLiD、454和单分子测序装置的至少一种对核酸序列进行测序。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,能够提高后续对测序数据进行分析时的精确性和准确度。由此,根据本发明的实施例,确定核酸样本的核酸序列可以进一步包括:首先,针对所得到的核酸样本,构建核酸测序文库;以及对所得到的核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。根据本发明的一些实施例,可以采用选自Illumina HiSeq4000、SOLiD、454和单分子测序装置的至少一种对所得到的核酸测序文库进行测序。另外,根据本发明的实施例,可以对核酸样本进行筛选,富集SCAP外显子,该筛选富集可以在构建测序文库之前,构建测序文库过程中,或者构建测序文库之后进行。根据本发明的一个实施例,针对核酸样本,构建核酸测序文库进一步包括:利用SCAP外显子特异性引物,对核酸样本进行PCR扩增;以及针对所得到的扩增产物,构建核酸测序文库。由此,可以通过PCR扩增,富集SCAP外显子(尤其是第18号外显子),从而能够进一步提高筛选易患早发心肌梗死的生物样品的效率。根据本发明的实施例,SCAP外显子特异性引物的序列不受特别限制,根据本发明的优选实施例,这些SCAP外显子特异性引物(针对SCAP的18号外显子)具有SEQ ID NO:37和38所示的核苷酸序列:
SCAP-18F:gactccccaggctatgact(SEQ ID NO:37);
SCAP-18R:acagcagttgaagagaaccag(SEQ ID NO:38)。
发明人惊奇地发现,通过采用这些引物,可以在PCR反应体系中通过显著有效地完成对SCAP外显子的扩增。需要说明的是,这些SEQ ID NO:37和SEQ ID NO:38所示的核苷酸序列是本发明的发明人在付出了艰苦的劳动后,意外获得的。
关于针对核酸样本,构建测序文库的方法和流程,本领域技术人员可以根据不同的测
序技术进行适当选择,关于流程的细节,可以参见测序仪器的厂商例如Illumina公司所提供的规程,例如参见Illumina公司Multiplexing Sample Preparation Guide(Part#1005361;Feb2010)或Paired-End SamplePrep Guide(Part#1005063;Feb 2010),通过参照将其并入本文。根据本发明的实施例,从生物样品提取核酸样本的方法和设备,也不受特别限制,可以采用商品化的核酸提取试剂盒进行。
需要说明的是,在这里所使用的术语“核酸序列”应作广义理解,其可以是在对核酸样本进行测序得到的测序数据进行组装后,得到的完整的核酸序列信息,也可以是直接采用通过对核酸样本进行测序所得到的测序数据(reads)作为核酸序列,只要这些核酸序列中含有对应SCAP的编码序列即可。
最后,在确定核酸样本的核酸序列之后,将所得到的核酸样本的核酸序列与SEQ ID NO:1的序列相比对。如果在所得到的核酸序列中具有c.3035C>T突变,则指示生物样品易患早发心肌梗死。由此,通过根据本发明实施例的筛选易患早发心肌梗死的生物样品的方法,可以有效地筛选易患早发心肌梗死的生物样品。根据本发明的实施例,对核酸序列与SEQ ID NO:1进行比对的方法和设备并不受特别限制,可以采用任意常规的软件进行操作,根据本发明的具体实例,可以采用SOAP软件进行比对。
根据本发明的实施例,所述早发心肌梗死为常染色体遗传性心肌梗死。
需要说明的是,根据本发明实施例的“筛选易患早发心肌梗死的生物样品的方法”的用途不受特别限制,例如可以用作非诊断目的的筛选方法。
筛选易患早发心肌梗死的生物样品的系统和试剂盒
根据本发明的第四方面,本发明提出了一种能够有效实施上述筛选易患早发心肌梗死的生物样品的方法的系统。
参考图1,根据本发明的实施例,该筛选易患早发心肌梗死的生物样品的系统1000包括核酸提取装置100、核酸序列确定装置200以及判断装置300。
根据本发明的实施例,核酸提取装置100用于从生物样品提取核酸样本。如前所述,根据本发明的实施例,核酸样本的类型并不受特别限制,对于采用RNA作为核酸样本,则核酸提取装置进一步包括RNA提取单元101和反转录单元102,其中,提取单元101用于从生物样品提取RNA样本,反转录单元102与RNA提取单元101相连,用于对RNA样本进行反转录反应,以便获得cDNA样本,所得到的cDNA样本构成核酸样本。
根据本发明的实施例,核酸序列确定装置200与核酸提取装置100相连,用于对核酸样本进行分析,以便确定核酸样本的核酸序列。如前所示,可以采用测序的方法确定核酸样本的核酸序列。由此,根据本发明的一个实施例,所述核酸序列确定装置200可以进一步包括:文库构建单元201以及测序单元202。文库构建单元201用于针对核酸样本,构建核酸测序文库;测序单元202与文库构建单元201相连,用于对核酸测序文库进行测序,以便获得由多个测序数据构成的测序结果。如前所述,可以通过PCR扩增,富集SCAP外显子,进一步提高筛选易患早发心肌梗死的生物样品的效率。由此,文库构建单元201可以进一步包括
PCR扩增模块(图中未示出),在该PCR扩增模块中设置有SCAP外显子特异性引物,以便利用SCAP外显子特异性引物,对所述核酸样本进行PCR扩增,根据本发明的具体实施例,SCAP外显子特异性引物(针对SCAP的18号外显子)具有如SEQ ID NO:37和38所示的核苷酸序列。根据本发明的实施例,测序单元202可以包括选自ILLUMINA HISEQ4000、SOLiD、454和单分子测序装置的至少一种。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一步提高对核酸样本进行检测分析的效率。从而,提高后续对测序数据进行分析时的精确性和准确度。
根据本发明的实施例,判断装置300与核酸序列确定装置200相连,适于将核酸样本的核酸序列进行比对,以便基于核酸样本的核酸序列与SEQ ID NO:1的区别判断生物样品是否易患早发心肌梗死。具体地,基于核酸样本的核酸序列与SEQ ID NO:1相比,是否具有c.3035C>T突变,判断生物样品是否易患早发心肌梗死。如前所述,根据本发明的一个实施例,核酸样本的核酸序列与SEQ ID NO:1相比,具有c.3035C>T突变,是生物样品易患早发心肌梗死的指示。如前所述,根据本发明的实施例,对核酸序列与SEQ ID NO:1进行比对的设备并不受特别限制,可以采用任意常规的软件进行操作,根据本发明的具体实例,可以采用SOAP软件进行比对。
由此,利用该系统,能够有效地实施前述筛选易患早发心肌梗死的生物样品的方法,从而可以有效地筛选易患早发心肌梗死的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易患早发心肌梗死的生物样品的试剂盒。根据本发明的实施例,该用于筛选易患早发心肌梗死的生物样品的试剂盒包括:适于检测SCAP基因突变体的试剂,其中与SEQ ID NO:1相比,该SCAP基因突变体具有c.3035C>T突变。利用根据本发明的实施例的试剂盒,能够有效地筛选易患早发心肌梗死的生物样品。在本文中,所使用的术语“适于检测SCAP基因突变体的试剂”应做广义理解,即可以是检测SCAP编码基因的试剂,也可以是检测SCAP突变体多肽的试剂,例如可以采用识别特异性位点的抗体。根据本发明的一个实施例,所述试剂为核酸探针或引物,优选地,所述核酸探针或引物具有如SEQ ID NO:37-38所示的核苷酸序列。由此,可以高效地筛选易患早发心肌梗死的生物样品。
需要说明的是,在本文前面筛选易患早发心肌梗死的生物样品的方法部分中所描述的特征和优点,同样适用于筛选易患早发心肌梗死的生物样品的系统或者试剂盒,在此不再赘述。
构建体及重组细胞
根据本发明的第六方面,本发明还提出了一种构建体。根据本发明的实施例,该构建体包含前面所述的分离的编码SCAP突变体的核酸,即本发明的SCAP基因突变体。由此,利用本发明的构建体转化受体细胞获得的重组细胞,能够有效地用于筛选治疗早发心肌梗死的药物。其中,所述受体细胞的种类不受特别限制,例如可以为大肠杆菌细胞、哺乳动物
细胞,优选该受体细胞来源于哺乳动物。
在本发明中所使用的术语“构建体”是指这样的一种遗传载体,其包含特定核酸序列,并且能够将目的核酸序列转入宿主细胞中,以获得重组细胞。根据本发明的实施例,构建体的形式不受特别限制。根据本发明的实施例,其可以为质粒、噬菌体、人工染色体、粘粒(Cosmid)、病毒的至少一种,优选质粒。质粒作为遗传载体,具有操作简单,可以携带较大片段的性质,便于操作和处理。质粒的形式也不受特别限制,既可以是环形质粒,也可以是线性质粒,即可以是单链的,也可以是双链的。本领域技术人员可以根据需要进行选择。在本发明中所使用的术语“核酸”可以是任何包含脱氧核糖核苷酸或者核糖核苷酸的聚合物,包括但不限于经过修饰的或者未经修饰的DNA、RNA,其长度不受任何特别限制。对于用于构建重组细胞的构建体,优选所述核酸为DNA,因为DNA相对于RNA而言,其更稳定,并且易于操作。
根据本发明的第七方面,本发明还提出了一种重组细胞。根据本发明的实施例,该重组细胞是通过前面所述的构建体转化受体细胞而获得的。从而,本发明的重组细胞能够表达构建体所携带的SCAP基因突变体。根据本发明的一些实施例,利用本发明的重组细胞,能够有效地筛选治疗早发心肌梗死的药物。根据本发明的实施例,受体细胞的种类不受特别限制,例如可以为大肠杆菌细胞、哺乳动物细胞,优选所述受体细胞来源于非人哺乳动物。
下面参考具体实施例,对本发明进行说明,需要说明的是,这些实施例仅仅是说明性的,而不能理解为对本发明的限制。
若未特别指明,实施例中所采用的技术手段为本领域技术人员所熟知的常规手段,可以参照《分子克隆实验指南》第三版或者相关产品进行,所采用的试剂和产品也均为可商业获得的。未详细描述的各种过程和方法是本领域中公知的常规方法,所用试剂的来源、商品名以及有必要列出其组成成分者,均在首次出现时标明,其后所用相同试剂如无特殊说明,均以首次标明的内容相同。
实施例1确定PMI致病突变
1、样本收集
发明人收集到一个5代的中国早发心肌梗死(在本文中有时也简称为PMI)患者家系,其家系图见图2。如图2所示,如图2所示,●表示患病女性,■表示患病男性;○表示健康女性,□表示健康男性;
表示已故女性,
表示已故男性;箭头所指为先证者。该家系共有四代人存活,共19个成员,其中早发心肌梗死患者3人(男性2人,女性1人)。
发明人对所有患者均进行了全面的体格、血液生化及影像学检查。所有的临床诊断或排除诊断均基于心肌梗死诊断的金标准,即:结合患者典型心肌梗死症状及心电图表现的基础上,冠状动脉造影阳性确诊心肌梗死诊断,冠状动脉CT造影阴性作为排除心肌梗死诊断标准。其中,先证者PMI1-1(如图2示),为一中年女性,于39岁发生急性心肌梗死;
心肌梗死发生前3年间,间断出现典型劳力性心绞痛症状,并呈进行性加重,于39岁时发生心肌梗死,冠状动脉造影确诊为心肌梗死,后择期共植入支架4枚;既往有发现高血压、高血脂4年,未规律服药;有高脂血症及早发冠心病家族史。
发明人收集获得上述PMI患者家系中尚在世的3个患者以及16个非早发心梗患病者(即家系内正常人)的样本。
2、全外显子组测序
发明人利用Agilent SureSelect Human All ExonV5试剂盒结合illumina HiSeq4000平台,采用PE150测序策略,对图2所示的PMI患者家系中的三名患者(PMI1-1、PMI1-3及PMI1-8)和16个家系内正常人进行了全外显子组测序,具体步骤如下:
2.1DNA提取
采集图2所示PMI患者家系中的三名患者和16个家系内正常人的外周血,利用常规盐析法从外周血样品中提取各家系成员的基因组DNA,并利用分光光度计测量DNA的浓度及纯度,所得各基因组DNA的OD260/OD280均应位于1.7-2.0之间,浓度不少于200ng/微升,总量不少于3微克。
2.2外显子捕获与测序
利用超声波仪(CovarisS2,Massachusetts,USA)将各基因组DNA样本随机打断成150-200bp左右的片段,随后按照制造商提供的操作说明书,在片段两端分别连接上接头制备DNA文库(可参见:http://www.illumina.com/提供的Illumina/Solexa标准建库说明书,通过参照将其全文并入本文)。
然后,采用Agilent SureSelect Human All ExonV5试剂盒,将上述制备获得的DNA文库与生物素标记的RNA探针进行液相杂交(95℃5分钟,65℃24小时),再使用带链霉素的磁珠将DNA-RNA混合物捕获下来,然后用Qiagen提纯试剂盒将DNA洗脱下来,再利用Agilent PCR引物将捕获得到的DNA扩增12个循环,结果,50M区域的DNA序列,20,965个基因的334,378个外显子被捕获下来。
进一步,利用安捷伦生物分析仪DNA芯片进行文库质检,合格后即可上机测序,以便获得原始测序数据。其中,测序平台为Illumina Hiseq 4000,读取长度为90bp,各样本的平均测序深度最少为150×。
3、数据质控、变异检测、注释及变异过滤
3.1数据质控
Hiseq4000测序得到的原始图像数据raw data,以fastq文件格式存储(文件名:*.fq)。Raw data中会包含接头信息,低质量碱基,未测出的碱基(以N表示),这些信息会对后续的信息分析造成很大的干扰,分析前需要将这些干扰信息去除掉,最终得到的数据即为有效数据。
具体地,首先利用Illumina basecalling Software 1.7对上述获得的原始测序数据进行处理,即按照以下条件进行过滤去污染:
A.过滤掉含有接头序列的reads;
B.当单端测序read中含有的N的含量超过该条read长度比例的10%时,需要去除此对paired reads;
C.当单端测序read中含有的低质量(碱基质量值小于5)碱基数超过该条read长度比例的50%时,需要去除此对paired reads。经过对测序数据的严格过滤,得到高质量的clean data。
进而,对产出数据进行统计,包括测序read数量,数据产量,测序错误率,Q20含量,Q30含量,GC含量等。
3.2序列比对
进一步,使用SOAPaligner/SOAP2(可参见:Li R,Li Y,Kristiansen K,et al,SOAP:short oligonucleotide alignment program.Bioinformatics 2008,24(5):713-714;Li R,Yu C,Li Y,ea al,SOAP2:an improved ultrafast tool for short read alignment.Bioinformatics 2009,25(15):1966-1967,通过参照将其全文并入本文)比对到UCSC人类参考基因组(hg19,build37.1,http://genome.ucsc.edu/),以便获得比对到基因组上的唯一比对序列。
具体地,在制备文库的过程中,由于PCR扩增过程中会存在一些偏差,也就是说有的序列会被过量扩增。这样,在比对的时候,这些过量扩增出来的完全相同的序列就会比对到基因组的相同位置。而这些过量扩增的reads并不是基因组自身固有序列,不能作为变异检测的证据,因此,要尽量去除这些由PCR扩增所形成的duplicates,这一步可以使用picard来完成。对结果应该没有什么影响,GATK后期分析时可以忽略这一部分。并且,在indel附近的比对会出现大量的碱基错配,对碱基质量值进行重新校正和检测变异不利。因此,需要将比对到indel附近的reads进行局部重新比对,将比对的错误率降到最低。GATK分析流程中,Realigner Target Creator是用于确定要进行重新比对的区域,Indel Realigner是用于对这些区域内进行重新比对。
3.3变异检测和功能注释
然后利用SOAPsnp(可参见:Li R,Li Y,Fang X,Yang H,et al,SNP detection for massively parallel whole-genome resequencing.Genome Res 2009,19(6):1124-1132,通过参照将其全文并入本文)确定靶区域的基因型。
具体地,最终的BAM文件用GATK的HaplotypeCaller模块进行SNP/INDEL检测。变异结果利用ANNOVAR进行变异注释,其中,基于dbSNP和1000Genome数据库,进行突变位置,突变类型,保守区域预测。而针对外显子区突变,则基于CDS、RefSeq、数据库和UCSC进行。
3.4变异过滤
随后通过dbSNP数据库
(http://hgdownload.cse.ucsc.edu/goldenPath/hg19/database/snp135.txt.gz.)、HapMap数据库(ftp://ftp.ncbi.nlm.nih.gov/hapmap)、千人基因组数据库(ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp)、炎黄数据库(http://yh.genomics.org.cn/)、1000Genome(1000Genomes Project Consortium)等公共数据库的过滤,去掉所有已知的变异以及
与临床无关的位点;保留外显子区或剪切位点附近位点,可能导致氨基酸改变;过滤同义突变,保留非同义突变;最后利用PolyPhen和SIFT软件预测氨基酸保守性后,共得到249处SNP变异位点及361处插入/缺失变异位点。
进一步,基于变异位点的特征进行优先选择:(a)选择三个患者共有的同基因、同位点、同突变类型的变异;(b)根据家系图中的疾病的常染色体显性遗传方式(不完全显性)进行筛选;(c)基于文献检索及基因功能信息,进一步筛选经推断与心肌梗死的发生可能相关的位点。
结果,最终发现位于SCAP基因18号外显子的点突变c.3035C>T(p.A1012V)为PMI的潜在致病基因突变。其中,三个患者均携带上述突变(c.3035C>T),且都为杂合突变类型,而家系内正常人在此位置均未发生突变。
随后,在图2所示的上述PMI患者家系中对SCAP基因进行突变排查,即针对SCAP基因中的无义突变c.3035C>T进行Sanger测序验证,结果确认,该突变在家系中存在与疾病表型共分离的现象。
由此,初步判定SCAP基因为早发心肌梗死的致病基因,无义突变c.3035C>T(p.A1012V)为该早发心肌梗死家系中患者的致病原因,也即SCAP基因的c.3035C>T(p.A1012V)突变为早发心肌梗死的致病突变。
实施例2Sanger法测序验证
分别对实施例1中所述的早发心肌梗死患者家系中的三名患者(PMI1-1、PMI1-3及PMI1-8)和16个家系内正常人、70个中国汉族人群的早发心肌梗死患者、以及200名家系外正常人的SCAP基因进行检测:针对SCAP基因的外显子设计引物,然后通过PCR扩增、产物纯化和测序的方法获得SCAP有关序列,根据确定序列测定结果验证SCAP基因、SCAP基因的c.3035C>T(p.A1012V)突变与早发心肌梗死之间的相关性。
具体方法步骤如下:
1、DNA提取
按照实施例1中所述的提取DNA的方法,分别提取制备受试者外周血中的基因组DNA,备用。
2、引物设计及PCR反应
首先,参考人类基因组序列数据库GRCh38.p2,设计得到SEQ ID NO:3-48所示的SCAP基因外显子特异性引物,具体序列见下表:
引物名称 |
引物序列(5’-3’) |
SCAP-1F |
catacttccctccggtgtcc(3) |
SCAP-1R |
aacccaaacagcaccaaagc(4) |
SCAP-2F |
gtggccttttagcattgcct(5) |
SCAP-2R |
ttagctaaccaggccaggac(6) |
SCAP-3F |
ccagttgggcttcttcgtaag(7) |
SCAP-3R |
tacagtcccagctaatcggg(8) |
SCAP-4F |
gtgacatcggcaagctcatt(9) |
SCAP-4R |
ggctatgtgtgtgccatctg(10) |
SCAP-5F |
tagtacacttgcccgtcctc(11) |
SCAP-5R |
gggtgatggtgtaggagacc(12) |
SCAP-6F |
agcctaaaaccctgcagact(13) |
SCAP-6R |
caagagagaccagaggaggc(14) |
SCAP-7F |
ttgtgattttcccagtgccc(15) |
SCAP-7R |
aagctcctaagaccctgctg(16) |
SCAP-8F |
cctgtccctttcctttggtg(17) |
SCAP-8R |
tatacacacccagcccacaa(18) |
SCAP-9F |
gatgcaggtcttgttgggtg(19) |
SCAP-9R |
tgacacatgaaccaggacga(20) |
SCAP-10F |
ccacactctgcttcttccct(21) |
SCAP-10R |
gctgtagtgatctgcttgcc(22) |
SCAP-11F |
ttggatcaggccttcagtcc(23) |
SCAP-11R |
tcgcttgttcaggtctgcta(24) |
SCAP-12F |
tttcaccactgtcctgtcca(25) |
SCAP-12R |
tgcttctcccacaggcttat(26) |
SCAP-13F |
gcaagtgttggcaggtgtta(27) |
SCAP-13R |
gggaaaggggatggtgagtt(28) |
SCAP-14F |
gacctacctctgtccccaac(29) |
SCAP-14R |
cagcagcaccaagacgatg(30) |
SCAP-15F |
gagacgtcacgctgtacaag(31) |
SCAP-15R |
ggcacaaaggaggaaaggg(32) |
SCAP-16F |
catcgtcttggtgctgctg(33) |
SCAP-16R |
tgagaaggggcaagggaaaa(34) |
SCAP-17F |
Ttttcccttgccccttctca(35) |
SCAP-17R |
cacgctcaccttttgtccaa(36) |
SCAP-18F |
gactccccaggctatgact(37) |
SCAP-18R |
acagcagttgaagagaaccag(38) |
SCAP-19F |
gctttcctcttggccatgtc(39) |
SCAP-19R |
agcacccaagagacaagaca(40) |
SCAP-20F |
tgcagtttagaggtcggagg(41) |
SCAP-20R |
acctggtcaatgtacacggt(42) |
SCAP-21F |
tgtcttgtctcttgggtgct(43) |
SCAP-21R |
tgagcaaacacatggctgac(44) |
SCAP-22F |
atgtttgctgactcctggga(45) |
SCAP-22R |
caaaaggagacacagccctg(46) |
SCAP-23F |
gtcagccatgtgtttgctca(47) |
SCAP-23R |
gcctgacagatgatgatatggt(48) |
接着,分别按照以下配比配制各基因组DNA样本的PCR反应体系以及进行PCR反应:
总反应体系体积为25ul,反应管为0.2ml的Eppendorf离心管,体系中含有ddH2O 9.5ul,Mix 12.5ul,引物正向、反向各1ul,模板1ul(约50ng),混匀,迅速短暂离心。在PCR仪上进行扩增。
所有引物均采用Touchdown PCR方法,具体如下:95℃预变性5分钟;95℃变性30秒,68℃退火30秒,72℃延伸30秒,每个循环退火温度降1℃,10个循环降至58℃;然后95℃变性30秒,60℃退火30秒,72℃延伸30秒,30个循环。循环后72℃延伸10分钟。
由此,获得各样本的PCR扩增产物。
3、测序
针对步骤2中获得的各待测者的PCR产物,利用MultiScreen-PCR Plates(Millipore,Billerica,MA,USA)真空泵过膜纯化,然后利用BigDye Terminator DNA测序试剂盒(version3.1)和3730XL测序仪(Applied Biosystems,Foster City,CA,USA)进行直接测序(采用Sanger法进行)。且所有可疑突变均经反向测序确定。其中,纯化、测序过程由北京六合华大基因科技股份有限公司完成。
其中,图3显示了上述早发心肌梗死患者家系中患者、家系内正常人以及家系外正常人的SCAP基因c.3035C>T突变位点的代表性Sanger测序验证峰图。由图3可知,该早发心肌梗死患者家系中患者都携带有SCAP基因18号外显子的c.3035C>T突变,而家系内正常人以及家系外正常人都未携带该突变;而在70个早发心梗散发病例中,有一个患者携带位于SCAP基因9号外显子的点突变p.V468A(c.1403T>C),该突变在早发心肌梗死患者家系中以及家系外正常人中都未出现。
进一步的生物信息学分析显示,SCAP基因的c.3035C>T(p.A1012V)突变,以及p.V468A(c.1403T>C)突变在28,000个东亚人群中为阴性,且在物种间高度保守。
综上,证明SCAP基因为早发心肌梗死的致病基因,SCAP基因的c.3035C>T(p.A1012V)突变为早发心肌梗死的致病突变。
实施例3检测试剂盒
制备一检测试剂盒,其包含能够检测SCAP基因的c.3035C>T突变(位于18号外显子)的引物,用于筛选易患早发心肌梗死的生物样品,其中这些引物为SCAP基因外显子特异性
引物(针对SCAP基因18号外显子),其序列如实施例1中所述SEQ ID NO:37-38所示。
利用上述试剂盒筛选易患早发心肌梗死的生物样品的具体步骤为:按照实施例2的步骤1所述的方法提取待测者DNA,以所提取的DNA为模板与上述SCAP基因的外显子特异性引物进行PCR反应,并按照本领域常规方法对PCR产物纯化,将纯化的产物进行测序,然后通过观察测序所得到的序列是否具有c.3035C>T突变,能够有效地检测本发明的SCAP基因突变体在待测者DNA中是否存在,从而能够有效地检测待测者是否易患早发心肌梗死,进一步,能够从待测者中筛选出易患早发心肌梗死的生物样品。
具体地,利用上述试剂盒对实施例1中所述的早发心肌梗死患者家系中的三名患者(PMI1-1、PMI1-3及PMI1-8)和16个家系内正常人,以及200名家系外正常人的SCAP基因进行c.3035C>T突变检测,结果发现,该早发心肌梗死患者家系中患者都携带有c.3035C>T突变,而家系内正常人以及家系外正常人都未携带该突变。
工业实用性
本发明的SCAP基因突变体,与SEQ ID NO:1相比,具有c.3035C>T突变,通过检测该突变体在生物样品中是否存在,可以有效地检测生物样品是否易患早发心肌梗死。
尽管本发明的具体实施方式已经得到详细的描述,本领域技术人员将会理解。根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。