Alport综合征新的突变致病基因及其编码蛋白和应用
技术领域
本发明涉及一种人体变异的基因,尤其涉及一种Alport综合征新的突变致病基因。本发明还涉及Alport综合征新的突变致病基因的编码蛋白质和应用,包含突变的Alport综合征致病基因的载体、宿主细胞以及试剂盒。
背景技术
Alport综合征(Alport syndrome,ATS)是以家族性进行性出血性肾炎、眼疾和耳聋为特征的一种遗传病,发病率约为1/5000。1927年,Alprot首次报道该病,家系中受累患者表现为进行性血尿和耳聋,男性患者早年死于尿毒症,女性患者存活时间较长。ATS首发症状一般为肾脏症状,儿童期表现为周期性镜下或肉眼血尿,男性患者比女性患者发病早。其它症状还包括神经性耳聋和眼部疾病。典型病理改变为肾脏基底膜超微结构改变(变薄、增厚和破裂),但疾病早期可能观察不到患儿肾脏的病理改变,给病理学快速诊断带来一定难度。肾功能衰竭呈渐进性,约0.3%~2.3%的患者最终进展为末期肾病(endstagerenaldisease,ESRD)。X连锁ATS(X-linked ATS,XL-ATS)患者发生ESRD比例较高,12%的女性患者在40岁之前发展为ESRD,30%的女性患者在60岁前发展为ESRD,而男性患者几乎全部发展为ESRD。且大多数ATS患者存在耳聋症状。
ATS是一种单基因遗传病,由编码IV型胶原的基因突变引起。其致病基因包括COL4A3(the collagen of basement membrane,alpha-3chain gene)、COL4A4和COL4A5。最常见的ATS为XL(X连锁,X-linked),约占80%,其次为AR(常染色体隐性遗传性,autosomalrecessive),约占15%,还有少数患者呈AD(常染色体显性遗传性,autosomal dominant)。
常染色体隐性遗传性ATS(autosomal recessive ATS,AR-ATS)由COL4A3或COL4A4基因纯合或复合杂合突变引起。患者症状较严重,男女 无明显区别,一般在30岁左右发生ESRD。女性患者具有严重的临床表型,患者父母多为近亲结婚,男性患者的父亲存在镜下血尿和免疫组化检测缺乏α3-α5标记。已发现至少47种COL4A3基因突变和27种COL4A4基因突变与AR-ATS发病相关。常染色体显性遗传性ATS(autosomal dominant ATS,AD-ATS)较为罕见。共报道6个家系,3个由COL4A3基因突变引起,3个由COL4A4基因突变引起。可表现为父到子遗传传递模式,该类型症状较轻,男女表现类似症状,ESRD和听力损伤一般出现在50岁以后,无眼部疾病。X连锁显性遗传型ATS伴弥漫性平滑肌瘤患者有发现COL4A6及COLA4A5基因突变,这种突变多为COL4A6和COLA4A5基因5’端的缺失,导致肾小球及食管平滑肌瘤的基底膜的改变。
COL4A4基因定位于染色体2q36-37,其包含48个外显子,长度从9bp至287bp不等,其内含子、外显子的分界基本明确。ATS小鼠动物模型在插入了突变了的COL4A3和COL4A4表现出与人类ATS一样的表型与超微结构。该基因编码IV型胶原的α4链(1690个氨基酸残基)。IV型胶原是构成基底膜的主要成分,由三条α链构成一个三螺旋分子,两个IV型胶原分子以端端连接或端侧吻合/四个IV型胶原分子以侧侧吻合方式组成一个网状结构,形成基底膜的支架。到目前为止,通过特异的免疫组化染色发现已发现6种不同a链,分别称α1-α6,而构成IV型胶原的6条α链在参与构成IV型胶原三股螺旋结构时不一致,通常认为IV型胶原α1和α2链形成三股螺旋,构成一类IV型胶原网状结构;而由IV型胶原α3-α6链形成的三股螺旋,将构成另一类IV型胶原网状结构。α1和α2链广泛分布于几乎所有的基底膜,α3、α4和α4链仅局限性分布于肾小球,内耳及眼部。Boye等人通过PCR-SSCP法对31例来源于不同国家及地区的AR-ATS患者COL4A4基因所有外显子进行基因突变的检测,也发现移码突变、错义突变及连接点突变。Btlzza等也在该基因不同部位发现错义突变。
COL4A5基因位于Xq22.3,长250kb,含51个外显子,编码1685个氨基酸残基(α5(IV)链)。α5(IV)链由26个氨基酸信号肽、甘氨酸-X-Y三联结构(Gly-Xaa-Yaa-repeatsequence,GXY)反复串联而成的胶原区(1430个氨基酸)和羧基端非胶原区(carboxyl-terminal noncollagenous domain,NC1; 229个氨基酸)组成。NC1区对启动IV型胶原三股螺旋结构的形成有重要的作用。目前已发现的COL4A5基因突变超过440种,不同地区和种族患者的基因突变不同,且不存在突变热点。绝大部分突变为遗传性,也有10%-15%的突变是新发生的,提示该病存在很大的危害性。由于女性患者保留一条正常X染色体,基因功能未完全丧失,而男性患者只存在一条异常X染色体,因此男性患者一般比女性患者表现为更严重临床症状。
最近,外显子组测序(exome sequencing)被成功地应用于发现稀有单基因疾病的致病基因,如Freeman–Sheldon综合症的MYH3基因,Schinzel-Giedion综合征的SETBP1基因,以及严重大脑畸形的WDR62突变等。全外显子测序技术已被证明为降低稀有单基因疾病候选基因甚至发现其致病基因的有力、有效手段,仅通过对几个很少的个体(包括患者及正常对照)的全外显子进行测序来筛选与疾病相关的变异,其成功率大为提升。
发明内容
本发明的主要目的在于利用外显子组测序技术鉴别出Alport综合征致病基因新的突变位点。在此基础上,提供Alport综合征新位点突变的致病基因及其编码蛋白质和应用,包含Alport综合征新位点突变致病基因的载体、宿主细胞以及试剂盒,以对Alport综合征进行分子诊断和患病风险评价,为进一步治疗该疾病提供设计药物的靶点,同时为阐明该病的致病机制提供理论基础。
因此,一方面,本发明提供了一种突变的COL4A4基因,所述突变的COL4A4基因序列导致Alport综合征的发生,其基因序列如SEQ ID NO:2所示。野生型的COL4A4基因序列如SEQ ID NO:1所示,编码区具有5073个碱基,与野生型的COL4A4基因序列相比,突变的COL4A4基因发生了移码缺失突变(c.3213delA,p.Lys1071fs*5),即SEQ ID NO:1中第3213位的碱基A缺失了,只有5072个碱基,导致了第3213位后所有的碱基序列发生移码。
第二方面,本发明还提供了SEQ ID NO:2序列编码的蛋白质,由于突 变的COL4A4基因在第3213位发生了移码缺失突变,导致其编码的氨基酸序列在第1071位后与野生型的COL4A4蛋白质氨基酸序列完全不同,且移码导致了终止密码子的出现,使得SEQ ID NO:2序列编码的蛋白质翻译提前终止,突变的COL4A4基因编码的蛋白质只有1139个氨基酸,其氨基酸序列如SEQ ID NO:4所示。野生型的COL4A4蛋白质序列有1690个氨基酸,其序列如SEQID NO:3所示,比突变型的COL4A4蛋白质序列更长。
同时,本发明还提供了一种突变的COL4A5基因,所述突变的COL4A5基因序列导致Alport综合征的发生,其基因序列如SEQ ID NO:6所示。野生型的COL4A5基因序列如SEQ IDNO:5所示,编码区具有5058个碱基,与野生型的COL4A5基因序列相比,突变的COL4A5基因发生了移码缺失突变(c.499delC,p.Pro167Gln fs*36),即SEQ ID NO:5中第499位的碱基C缺失了,只有5057个碱基,且导致了第499位后所有的碱基序列发生移码。
同时,本发明还提供了SEQ ID NO:6序列编码的蛋白质,由于突变的COL4A5基因在第499位发生了移码缺失突变,导致其编码的氨基酸序列在第167位以后与野生型的COL4A5蛋白质氨基酸序列完全不同,且移码导致了终止密码子的出现,使得SEQ ID NO:6序列编码的蛋白质翻译提前终止,突变的COL4A5基因编码的蛋白质只有201个氨基酸,其氨基酸序列如SEQ ID NO:8所示。野生型的COL4A5蛋白质序列有1685个氨基酸,其序列如SEQ ID NO:7所示,比突变型的COL4A5蛋白质序列长很多。
第三方面,本发明还提供了含有上述突变的COL4A4基因和/或突变的COL4A5基因的载体。
第四方面,本发明还提供了被上述载体转化或转导的宿主细胞或者被上述突变的COL4A4基因和/或突变的COL4A5基因直接转化或转导的宿主细胞。
第五方面,本发明还提供了上述突变的COL4A4基因和/或突变的COL4A5基因在用作治疗Alport综合征的药物靶点或制备Alport综合征诊断试剂盒中的应用。
第六方面,本发明还提供了一种用于诊断Alport综合征的试剂盒,所述试剂盒包含能够特异性扩增上述突变的COL4A4基因和/或如突变的 COL4A5基因的引物,或能够特异性检测上述突变的COL4A4基因和/或突变的COL4A5基因的探针。
在一个优选的实施方案中,所述引物包括上游引物5’-GGATTTCCAGGGACACCAG-3’,下游引物5’-TGTAATAGCCAAGACCTGAAGACA-3’;和/或上游引物5’-TGAATCTTCAGATCATTTTTCTGG-3’,下游引5’-GAGGGATTGTTGTAATCTTCTGG-3’。
第七方面,本发明还提供了一种抗体,所述抗体与上述突变的COL4A4基因编码的突变COL4A4蛋白质特异性结合,且不作用于野生型COL4A4基因所编码的蛋白质。
同时,本发明还提供了一种抗体,所述抗体与上述突变的COL4A5基因编码的突变COL4A5蛋白质特异性结合,且不作用于野生型COL4A5基因所编码的蛋白质。
第八方面,本发明还提供了Alport综合征治疗剂,所述治疗剂包含了上述两种抗体中的至少一种。
本发明通过外显子组测序技术鉴定了与Alport综合征相关的两个致病基因的两个新发突变。一方面,通过检测受试者是否携带有这两个致病基因的两个新发突变,可以早期筛查Alport综合征致病突变基因携带者,提供优生优育指导;也可为Alport综合征患者提供分子诊断依据。特别地,本发明所提供的诊断试剂盒可用于快速、有效地预测或诊断Alport综合征。另一方面,本发明为Alport综合征的发病机制研究奠定了重要基础,为Alport综合征患者的治疗提供全新的理论依据。第三方面,本发明可以为治疗Alport综合征提供可能的药物靶点。
附图说明
图1是某四代Alport综合征家系1图,其中正方形表示男性,圆圈表示女性;带斜线为死亡,实心为患病个体,空心为正常个体;N/N表示normal,即正常个体,N/M表示携带有COL4A4c.3213delA突变的杂合个体,即患者。
图2是某四代Alport综合征家系2图,其中正方形表示男性,圆圈表示女性;带斜线为死亡,实心为患病个体,空心为正常个体;N/N表示normal,即正常个体,N/M表示携带有COL4A5c.499delC突变的杂合个体,即患者。
图3为移码缺失突变COL4A4基因(c.3213delA,p.Lys1071fs*5)序列分析示意图,箭头指示COL4A4基因中缺失突变的新位点c.3213delA(p.Lys1071fs*5),上部分为家系1正常人(III:1)测序峰图,下部分为家系1患者杂合c.3213delA突变(III:7)测序峰图,箭头指示COL4A4基因中缺失突变的新位点c.3213delA,(p.Lys1071fs*5)。
图4为移码缺失突变COL4A5基因(c.499delC,p.Pro167Gln fs*36)序列分析示意图,箭头指示COL4A5基因中缺失突变的新位点c.499delC(p.Pro167Gln fs*36),上部分为家系2正常人(II:2)序列图,下部分为家系2患者杂合c.499delC突变(Ⅳ:1)序列图。
具体实施方式
以下结合实施例对本发明进行更为详细的描述,但是以下描述仅用于对本发明进行解释性说明,并不对本发明的保护范围进行任何的限制,本发明的保护范围以权利要求书限定的范围为准。
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的分子遗传学、核酸化学和分子生物学相关术语和实验室操作步骤均为相应领域内广泛使用的术语和常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
在本发明中,术语“外显子”是指在成熟mRNA中被保留下的部分,即成熟mRNA对应于基因中的部分。内含子是在mRNA加工过程中被剪切掉的部分,在成熟mRNA中不存在。外显子和内含子都是对于基因而言的,编码的部分为外显子,不编码的为内含子,内含子没有遗传效应。
在本发明中,术语“外显子捕获”与“芯片杂交”可互换使用,指的是探针对文库中外显子区域的DNA片段进行特异性选择和结合的过程。DNA分子正常情况下是双链,因此捕获之前,DNA分子必须变为单链,一般是通过加热使其变性而达到解链目的,解链的DNA分子被迅速冷却,即保持单链状态。文库变性后在杂交平台与芯片进行捕获杂交。含有外显子区域的DNA片段与固定在芯片上的探针之间在严格的条件下进行分子杂交。较佳地,芯片上探针分子的浓度要远远高于靶分子浓度。待杂交完毕后,通过变性等方法收集捕获的序列并纯化,得到来自捕获后的序列混合物。
在本发明中,“高通量测序”是指采用三种第二代测序平台进行高通量测序:454FLX(Roche公司)、Solexa Genome Analyzer(Illumina公司)和Applied Biosystems公司的SOLID等。这些平台共同的特点是极高的测序通量,相对于传统测序的96道毛细管测序,高通量测序一次实验可以读取40万到400万条序列,根据平台的不同,读取长度从25bp到450bp不等,因此不同的测序平台在一次实验中,可以读取1G到14G不等的碱基数。
在本发明中,术语“DNA文库”是指对基因组的目的片段进行打断,获得一组具有一定大小的DNA片段混合物。DNA文库的制备方法为本领域技术人员所熟知。在一个优选例中,还可以对打断产物、末端修复产物、接头产物和富集产物进行纯化。对反应的条件进行一定的变化或优化也在本领域技术人员能力范围之内。
在本发明中,术语“突变”是指野生型的COL4A4基因和/或COL4A5基因多核苷酸序列发生改变,成为变异体,变异体可以是天然发生的或非天然发生的。
本发明还涉及与所述的突变的COL4A4基因或COL4A5基因杂交且两个序列之间具有至少80%,较佳地至少90%,更佳地至少95%,至少99%同源性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。
本发明野生型或突变的COL4A4基因或COL4A5基因核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
本发明中,“载体”包括但不限于克隆载体和表达载体。在一个优选的实施方案中,所述载体是例如质粒,粘粒,噬菌体,柯斯质粒等等。在一个优选的实施方案中,所述载体是商购可得的。在一个优选的实施方案中,所述载体包含与上述突变的COL4A4基因或COL4A5基因可操作地连接的表达控制序列,例如但不限于启动子,增强子和终止子。在一个优选的实施方案中,所述载体任选地还包含选择标记。
包含上述适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。此类宿主细胞包括但不限于,原核细胞例如大肠杆菌细胞,以及真核细胞例如酵母细胞,昆虫细胞,植物细胞和动物细胞(如哺乳动物细胞,例如小鼠细胞、人细胞等)。本发明的宿主细胞还可以是细胞系。
本发明还涉及到突变COL4A4基因或COL4A5基因编码的蛋白质,由于突变的COL4A4基因或COL4A5基因发生了移码缺失突变,导致缺失位点后的编码的氨基酸序列完全改变,且提前出现终止密码子,因此不具有野生型COL4A4蛋白质或COL4A5蛋白质正常的结构和功能。本发明的突变型的COL4A4或COL4A5蛋白质可以是重组蛋白质、天然蛋白质、合成蛋白质,优选重组蛋白质,即使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。
在本发明中,突变型COL4A4或COL4A5蛋白质还涉及具有与突变型COL4A4或COL4A5蛋白质相同功能的的变异形式。变异形式包括:同源序列、保守性变异体、诱导突变体等。发明还涉及突变型COL4A4或COL4A5蛋白质类似物。这些类似物与突变型COL4A4或COL4A5蛋白质的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。
本领域技术人员公知,致病基因具有多方面的用途。因此,本发明提供的突变COL4A4基因和/或COL4A5基因的用途包括但不限于:用作治疗Alport综合征的药物靶点;制备Alport综合征诊断试剂盒;用于产生疾病动物模型;为治疗Alport综合征提供新的药物作用途径。
本发明所述的“试剂盒”是指本领域技术人员以COL4A4基因和/或COL4A5野生型或突变型核苷酸序列为基因探针,根据基因杂交的原理,可以检测生物样本中是否存在与该探针序列互补的核苷酸序列,因此使用这种试剂盒可以检测出样本中是否存在着本发明的基因突变位点。试剂盒一般包括:引物、探针、核酸芯片、说明书等,还可能包括与活性成分相容的缓冲液、载体或媒介等。
在本发明中,“引物”指用于在PCR反应中扩增靶标核酸的多核苷酸片段,其通常为寡核苷酸,例如含有至少5个碱基,例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或者更多个碱基的多核苷酸片段。引物不必与待扩增的目的基因或其互补链完全互补,只要其能够特异性扩增目的基因。如本文中所使用的,术语“特异性扩增”是指引物能够通过PCR反应扩增目的基因,而不扩增其他基因。例如,特异性扩增COL4A5基因是指,在PCR反应中引物只扩增COL4A5基因,而不扩增其他基因,此类引物的设计是本领域技术人员公知的。
在本发明中,术语“特异性检测COL4A4基因和/或COL4A5突变的探针”是指探针能够区分出含有突变的COL4A4基因和/或COL4A5与不含有突变的COL4A4基因和/或COL4A5基因。一般而言,可以通过控制杂交条件的严紧性,使得探针能够区分出含有突变的基因与不含有突变的基因。例如,在高度严紧条件下,与COL4A4基因精确互补的探针可以与不含有突变的COL4A4基因杂交,而不与甚至只包含一个点突变的突变的COL4A4基因杂交,从而将二者区分开。同样,还可以设计与突变的COL4A4基因基因精确互补的探针,从而其在高度严紧条件下与突变的COL4A4基因杂交,而不与不含有突变的COL4A4基因杂交。在分子生物学领域中,探针的设计和杂交技术是熟知的。
本发明涉及对突变的COL4A4或COL4A5蛋白质具有特异性的多克隆抗体和单克隆抗体,尤其是单克隆抗体。这里,“特异性”是指抗体能结合于突变的COL4A4或COL4A5蛋白质。较佳地,指那些能与突变的COL4A4或COL4A5蛋白质产物或片段结合但不识别和结合于野生型的COL4A4或 COL4A5蛋白质相关抗原分子的抗体。本发明不仅包括完整的单克隆或多克隆抗体,而且还包括具有免疫活性的抗体片段,如Fab,或(Fab)2片段;抗体重链;抗体轻链;遗传工程改造的单链Fv分子或嵌合抗体。本发明的抗体可以通过本领域内技术人员已知的各种技术进行制备。
本发明的突变的COL4A4或COL4A5蛋白质抗体可以用来鉴定突变的COL4A4或COL4A5蛋白质。例如,可以用一种可检测的分子例如荧光素异硫氰酸(FITC)来标记突变的COL4A4蛋白质特异抗体,然后让突变的COL4A4蛋白质特异抗体与样品接触,再用荧光显微镜或流式细胞仪检测出与突变的COL4A4蛋白质特异抗体结合的样品,从而为预测或诊断患者是否存在Alport综合症提供依据和指导。
本发明的突变的COL4A4或COL4A5蛋白质抗体还可以用来中和突变的COL4A4或COL4A5蛋白质。如果有足够的数据表明某个体的Alport综合征与本发明突变COL4A4或COL4A5蛋白质的存在相关,可以考虑用突变的COL4A4或COL4A5蛋白质特异性抗体中和这些致病突变COL4A4或COL4A5蛋白质分子,从而缓解患者的病症。
实施例1:样本获取
发明人近几年在国内收集到两个ATS家系,家系1为4代30个汉族家系成员(图1),呈常染色体显性遗传,家系2为4代10个汉族家系成员(图2),呈X染色体显性遗传,家系1和家系2的所有家庭成员均进行了尿常规及肾功能的检查。家系1先证者(III:12,病例1)和家系2先证者(Ⅲ1,病例2)均通过肾活检发现全部和节段性硬化及系膜扩张,电子显微镜观察发现肾小球基底膜(GBMS)呈不规则增厚和分裂,依据临床和生化指标以及影像学证据,结合我们所收集到的家族性病例,提示ATS的可能性较大。在家系1中选取10例患者样本(II:1,II:3,II:5,II:7,III:7,III:9,III:10,III:12,III:14,和III:15),9例正常家系样本共19例样本作为研究样本,在家系2中选取4例患者样本(Ⅱ1,Ⅲ1,Ⅲ3和Ⅳ1),2例正常家系样本共6例样本作为研究样本,每个样本采集外周血样品2ml,加入EDTA抗凝,-80℃保存。
随机收集100位与所述家系1和家系2无关的正常个体作为二次验证样本,每位采集外周血样品2ml,加入EDTA抗凝,-80℃保存。
实施例2:样本DNA制备
采用OMEGA Blood DNA Midi Kit全血DNA提取试剂盒从外周血样品中提取DNA,提取步骤如下:
(1)取2ml全血样本,加入150ul OB Protease,2.1ml Buffer BL和20ul RNase A,最大速度漩涡1分钟,彻底混匀。
(2)65℃水浴15-20分钟,并在水浴过程中漩涡5次。
(3)加入2.2ml无水乙醇,最大速度漩涡30秒,彻底混匀。
(4)将3.5ml裂解液移入带过滤柱的15ml离心管,4000转离心5分钟,取出过滤柱,倒掉过滤液体,放回过滤柱。
(5)将第3步剩余裂解液加入带过滤柱的15ml离心管,4000转离心5分钟,取出过滤柱,倒掉过滤液体,放回过滤柱。
(6)加入3ml HB Buffer,洗涤过滤柱,4000转离心5分钟,取出过滤柱,倒掉过滤液体,放回过滤柱。
(7)加入3ml DNA Wash Buffer,4000转离心5分钟,取出过滤柱,倒掉过滤液体,放回过滤柱。
(8)再次加入3ml DNA Wash Buffer,4000转离心5分钟,取出过滤柱,倒掉过滤液体,放回过滤柱。
(9)4000转离心15分钟,甩干过滤柱。
(10)将过滤柱移至新的15ml离心管,加入500ul70摄氏度的Elution Buffer,室温静置5分钟,4000转离心5分钟,收集含有DNA的过滤液。
(11)再次将过滤柱移至新的15ml离心管,加入500ul70摄氏度的Elution Buffer,室温静置5分钟,4000转离心5分钟,收集含有DNA的过滤液。
(12)利用分光光度计测量DNA的浓度及纯度,所得的每个标本基因组DNA的OD260/OD280均位于1.7~2.0之间,浓度不少于200ng/ul,总量不少于30μg。
实施例3:外显子捕获与测序
发明人用Agilent SureSelect人全外显子捕获试剂盒(Agilent SureSelectHuman All Exon Kit)结合Solexa高通量测序技术对选取的实施例1的样本 的外显子组序列进行了测序,具体如下:
1)将基因组DNA随机打断成150-200bp左右的片段,随后在片段两端分别连接上接头制备杂交文库(参见http://www.illumina.com/提供的Illumina/Solexa标准建库说明书)。
2)文库经纯化后经过连接介导PCR(ligation-mediated PCR(LM-PCR))的线性扩增与SeqCap EZ Oligo pool进行杂交富集,再经过LM-PCR的线性扩增后进行上机测序。测序平台为Illumina Hiseq2000,读取长度为90bp,每个样本的平均测序深度最少为50×。
3)测序后获得的原始数据由Illumina basecalling Software1.7进行处理,经过过滤去污染、使用SOAPaligner2.20#比对参考基因组Hg19(参考Li R,Li Y,KristiansenK,et al,SOAP:short oligonucleotide alignment program.Bioinformatics2008,24(5):713-714;Li R,Yu C,Li Y,et al,SOAP2:an improved ultrafast tool for short readalignment.Bioinformatics2009,25(15):1966-1967,通过参考的方式将其全文并入本文),以便获得比对到基因组上的唯一比对序列。然后利用SOAP snp(可参见:Li R,Li Y,Fang X,Yang H,et al,SNP detection for massively parallel whole-genomeresequencing.Genome Res2009,19(6):1124-1132,通过参考的方式将其全文并入本文)确定靶区域的基因型。Indel(insertion-deletion,插入/缺失标记)采用BWA(通过Burrows-Wheeler变换比对)(version0.5.9-r16)比对到参考基因组Hg19(snp132),然后利用GATK(Genome Analysis Toolkit)(versionv1.0.4705)确定indel的类型。(可参见Li H,DurbinR.Fast and accurate long-read alignment with Burrows-Wheelertransform.Bioinformatics2010;26(5):589-595;McKenna,A,Hanna M,Banks E,etal.The genome analysis toolkit:a MapReduce framework for analyzing next-generation DNA sequencing data.Genome Research2010;20(9):1297-1303)。
结果显示,在病例1中发现有96772个单核苷酸多态性(SNP)和9712处的插入/缺失(Indel)。随后通过dbSNP数据库(http://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi),千人基因组数据库 (www.1000genomes.org/)、HapMap数据库(http://hapmap.ncbi.nlm.nih.gov/)等公共数据库的过滤,去掉所有已知的且在数据库中等位基因频率大于0.005的变异。通过比对正常样本,去掉所有已知变异、同义突变以及非编码区的变异,影响蛋白功能较小的位点,包括intron、intergenic、UTR、同义突变,并利用SIFT软件进行SNP功能预测,最终得到72个杂合可能具有致病意义的SNP位点和14个Indel。
在病例2中发现有105963个SNPs和7335个Indel。随后通过dbSNP数据库、千人基因组数据库、HapMap数据库等公共数据库的过滤,去掉所有已知的且在数据库中等位基因频率大于0.005的变异。通过比对正常样本,去掉所有已知变异、同义突变以及非编码区的变异,影响蛋白功能较小的位点,包括intron、intergenic、UTR、同义突变,并利用SIFT软件进行SNP功能预测,最终得到70个杂合可能具有致病意义的SNP位点和13个Indel。
实施例4:Sanger法测序验证
由于外显子组测序存在一定程度的假阳性,因此我们进一步利用Sanger测序法,对上述对家系1的72个杂合可能具有致病意义的SNP位点以及14个Indel进行验证,以及对家系2的70个杂合可能具有致病意义的SNP位点以及13个Indel进行验证,具体方法步骤如下:
1.DNA提取
对实施例1的样本以及100例无血缘关系的正常对照的外周血按照实施例2的方法提取基因组DNA。
2.引物设计及PCR反应
引物设计参考人类基因组序列数据库hg19/build37.1,具体如下。
检测移码缺失突变COL4A4基因(c.3213delA,p.Lys1071fs*5)的引物序列:
上游引物:5'GGATTTCCAGGGACACCAG3'
下游引物:5'TGTAATAGCCAAGACCTGAAGACA3'
检测移码缺失突变COL4A5基因上(c.499delC,p.Pro167Gln fs*36)的引物序列:
上游引物:5'TGAATCTTCAGATCATTTTTCTGG3'
下游引物:5'GAGGGATTGTTGTAATCTTCTGG3'
反应体系:
反应条件:
3.DNA测序
将获得的PCR扩增产物用QIAquick PCR扩增试剂盒(Qiagen公司)进行纯化,然后进行DNA测序。
在患者家族成员中对COL4A4基因和COL4A5基因的移码缺失突变位点进行突变排查,患者均为携带相应的移码缺失突变,其正常家属均不携带该致病突变。因此我们认为COL4A4基因和COL4A5基因的移码缺失突变位点是ATS致病基因COL4A4和COL4A5基因的另一致病位点。
实施例5:体外检测Alport综合征患者的COL4A4和/或COL4A5基因试剂盒
为了检测Alport综合征患者的致病突变,可以设计COL4A4和/或COL4A5基因编码区所有外显子和外显子与内含子交界处的引物序列。在该实施例中,试剂盒引物和扩增测序条件如实施例4。
1、试剂盒组成:
引物:如实施例4所示;
Taq酶
缓冲液
dNTP
从待检测的生物体样本中提取和纯化基因材料(DNA样本)
2、使用方法:
(1)基因组DNA提取:使用美国Promega公司的Wizard Genomic DNA提取试剂盒提取外周血液样本基因组DNA。
(2)先采用上述PCR引物、Taq酶、样本基因组DNA、缓冲液、dNTP等进行PCR扩增反应;
(3)对PCR扩增产物进行纯化;
(4)对纯化的PCR产物进行BigDye反应;
(5)对BiyDye反应产物纯化;
(6)对BiyDye反应产物测序,测序序列与正常序列相比较。