发明内容
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的分子遗传学、核酸化学和分子生物学相关术语和实验室操作步骤均为相应领域内广泛使用的术语和常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
如本文中所使用的,术语“COL14A1基因”是指编码胶原XIV(CXIV)的基因,其跨度为246,922bp,具有47个外显子,并且其示例性cDNA序列如SEQ ID NO:1所示。CXIV是一种具有不规则三螺旋结构的纤维相关胶原,它通过与纤维表面相互作用而调节原纤维的形成[28],并且主要表达在已分化的组织和晚期的胚胎组织中[29]。如本文中所使用的,COL14A1基因的第N个外显子被简称为外显子N(N为1-47的整数)。
如本文中所使用的,当用具体的序列来描述基因或核酸时,其不仅包括该具体序列所代表的基因或核酸,而且包括该具体序列的互补序列所代表的基因或核酸。在本申请中,虽然为了方便起见,在多数情况下针对基因或核酸只给出了一条链的序列,然而本领域技术人员可以明确获知其互补链的序列。因此,本申请事实上也公开了所述互补链的序列。
例如,当提及COL14A1基因的cDNA序列时,其不仅包括cDNA的实际序列,而且包括所述实际序列的互补序列。又如,当提及SEQ IDNO:1时,其不仅包括SEQ ID NO:1所示的序列,而且包括SEQ ID NO:1的互补序列。
本申请中的核酸序列包括DNA形式和RNA形式。除非上下文特别指明,否则本发明的核酸序列不仅包括DNA形式,而且包括RNA形式。例如,当提及SEQ ID NO:1时,其不仅包括DNA形式(例如,cDNA序列),而且包括RNA形式(例如,mRNA序列)。
如本文中所使用的,术语“突变”,当用于描述基因或DNA时,是指基因序列或DNA序列中一个或多个(例如,几个)碱基的添加、缺失和/或置换;当用于描述蛋白质时,是指蛋白质氨基酸序列中一个或多个(例如,几个)氨基酸残基的添加、缺失和/或置换。
如本文中所使用的,术语“沉默突变”是指这样的基因突变,其引起mRNA中的密码子发生改变,但由于密码子的简并性而未引起编码的氨基酸发生改变。如本文中所使用的,术语“非沉默突变”是指除了沉默突变以外的基因突变,包括但不限于,错义突变、无义突变和移码突变等。
如本文中所使用的,术语“功能丧失性突变”是指这样的突变,其导致突变基因所编码的蛋白丧失了对应的野生型蛋白的生物学功能,或与对应的野生型蛋白相比,具有异常的生物学功能。
如本文中所使用的,术语“杂合突变”是指这样的突变,其仅存在于一对等位基因中的一个基因中。如本文中所使用的,术语“纯合突变”是指这样的突变,其在一对等位基因中的两个基因中同时存在。
如本文中所使用的,术语“c.4505”是指cDNA序列的第4505位碱基(以起始密码子ATG的碱基A为第1位碱基),其中“c.”表示cDNA,数字“4505”表示第4505位碱基。本文中所使用的其他类似的术语具有类似的含义。
如本文中所使用的,术语“p.1502”是指蛋白质序列的第1502位氨基酸残基,其中“p.”表示蛋白质,数字“1502”表示第1502位氨基酸残基。本文中所使用的其他类似的术语具有类似的含义。
如本文中所使用的,术语“c.4505C→T”是指cDNA序列的第4505位碱基(以起始密码子ATG的碱基A为第1位碱基)由C突变为T。本文中所使用的其他类似的术语具有类似的含义。
如本文中所使用的,术语“p.Pro1502Leu”是指蛋白质序列的第1502位氨基酸残基由Pro突变为Leu。本文中所使用的其他类似的术语具有类似的含义。
如本文中所使用的,氨基酸通常用本领域公知的单字母和三字母缩写来表示。例如,丙氨酸可用A或Ala表示。另外,还用“*”表示终止密码子。
如本文中所使用的,术语“载体(vector)”是指,可将多聚核苷酸插入其中的一种核酸运载工具。当载体能使插入的多核苷酸编码的蛋白获得表达时,载体称为表达载体。此类载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌体;柯斯质粒等等。
载体中可包含与目的基因可操作地连接的表达控制序列。如本文中所使用的,术语“可操作地连接”是指所连接的分子的连接方式使得能够实现预期的功能。例如,表达控制序列与基因编码序列的可操作的连接可实现表达控制序列对基因编码序列的表达的控制作用。如本文中所使用的,术语“表达控制序列”是实现基因表达所需要的控制序列,其是本领域熟知的。表达控制序列通常必须包括启动子,常常也包括转录终止序列,并且还可以包含其他序列,如增强子序列。基因表达对于siRNA、miRNA等而言是指转录,并且还可以包括转录后加工;对于蛋白质编码序列而言通常是指转录和翻译,产生蛋白质。
另外,载体中还可包含选择标记。此类选择标记是本领域技术人员熟知的,例如但不限于抗生素抗性基因,例如青霉素抗性基因、红霉素抗性基因等等。
如本文中所使用的,“PCR引物”指用于在PCR反应中扩增靶标核酸的多核苷酸片段,其通常为寡核苷酸,例如含有至少5个碱基,例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或者更多个碱基的多核苷酸片段。
本领域技术人员公知,引物不必与待扩增的目的基因或其互补链完全互补,只要其能够特异性扩增目的基因。如本文中所使用的,术语“特异性扩增”是指引物能够通过PCR反应扩增目的基因,而不扩增其他基因。例如,特异性扩增COL14A1基因是指,在PCR反应中引物只扩增COL14A1基因,而不扩增其他基因。此类引物的设计是本领域技术人员公知的,参见例如,Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.(1989);和Ausubel等人,CurrentProtocols in Molecular Biology,Greene Publishing Associates(1992)。
通常,引物与待扩增的目的基因或其互补链具有大体上的同一性,从而能够特异性扩增目的基因。例如,引物与待扩增的目的基因或其互补链具有至少60%的序列同一性,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性。
如本文中所使用的,术语“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。例如,DNA序列CTGACT和CAGGTT共有50%的同一性(总共6个位置中有3个位置匹配)。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,可通过计算机程序例如Align程序(DNAs tar,Inc.)方便地进行的Needleman等人(1970)J.Mol.Biol.48:443-453的方法来实现。
如本文中所使用的,术语“杂交”是指相互间具有互补序列的两个单链核酸分子在一定条件下(适宜的温度及离子强度等)按碱基互补配对原则退火形成双链核酸的过程。核酸杂交可以在DNA-DNA之间,也可在DNA-RNA或RNA-RNA之间进行,只要它们之间存在互补序列,可以进行碱基配对。一般而言,杂交的双方是待测核酸分子和已知核酸分子。在杂交体系中已知的核酸分子称作探针(probe)。核酸杂交包括固-液相杂交和液相杂交。液相杂交是在溶液中进行的杂交反应,其是指待测核酸分子与已知核酸分子(探针)在溶液中退火形成杂交复合物。
如本文中所使用的,术语“特异性检测COL14A1基因突变”是指探针能够区分出含有突变的COL14A1基因与不含有突变的COL14A1基因。一般而言,可以通过控制杂交条件的严紧性,使得探针能够区分出含有突变的基因与不含有突变的基因。例如,在高度严紧条件下,与COL14A1基因精确互补的探针可以与不含有突变的COL14A1基因杂交,而不与甚至只包含一个点突变的突变的COL14A1基因杂交,从而将二者区分开。同样,还可以设计与突变的COL14A1基因精确互补的探针,从而其在高度严紧条件下与突变的COL14A1基因杂交,而不与不含有突变的COL14A1基因杂交。
在分子生物学领域中,探针的设计和杂交技术是熟知的,参见例如Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989);和Ausubel等人,Current Protocols in MolecularBiology,Greene Publishing Associates(1992)。为了举例说明的目的,杂交的条件可以是严紧条件,例如与滤膜结合的DNA在6×氯化钠/柠檬酸钠(SSC)中约45℃下杂交,之后在0.2×SSC/0.1%SDS中于约50-65℃下进行一次或多次洗涤;高度严紧条件,例如与滤膜结合的核酸在6×SSC中约45℃下杂交,之后在0.1×SSC/0.2%SDS中于约68℃下进行一次或多次洗涤;或本领域技术人员已知的其它严紧杂交条件。
通常,探针是经标记的,从而在杂交反应结束后,通过利用探针上的标记物,可以分离和检测杂交后的双链。同样,也可以对引物进行标记,从而在PCR后,通过利用引物上的标记物,可以分离和检测扩增产物。可用于标记探针和引物的标记物在本领域内是已知的,包括但不限于,放射性同位素如125I、酶、酶的底物、发光物质如异鲁米诺和吖啶酯、荧光物质如荧光素和罗丹明、生物素和有色物质如乳胶颗粒和胶体金等。标记用的酶可以是过氧化物酶(如辣根过氧化物酶HRP)、碱性磷酸酶、β半乳糖苷酶和葡萄糖氧化酶。对于这些反应中合适的底物有2,2'-连氮基-双(3-乙基苯并噻吡咯啉-6磺酸)、鲁米诺-过氧化氢、邻苯二胺-过氧化氢(针对过氧化物酶)、对硝基苯磷酸盐、4-甲基磷酸伞型酮、3-(2'-螺旋金刚烷)-4-甲氧基-4-(3"-磷酰基)苯基-1,2-二乙氧基烷(针对碱性磷酸酶)、对硝基苯-β-D-半乳糖和甲基伞形酮-β-D-半乳糖(针对β半乳糖苷酶)。其它的标记包括量子点标记、生色团标记、酶标记、亲和配体标记、电磁自旋标记、重原子标记、标记有纳米微粒光散射标记或其它纳米微粒的探针、异硫氰酸荧光素(FI TC)、TRITC、罗丹明、四甲基罗丹明、R-藻红蛋白、Cy-3、Cy-5、Cy-7、得克萨斯红、Phar-Red、异藻红蛋白(APC)、以及酶标记如碱性磷酸酶、辣根过氧化物酶、I2-半乳糖苷酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶和半抗原偶联物如洋地黄毒苷或二硝基苯酚、或能够形成配合物的结合配对如链霉抗生物素蛋白/生物素、抗生物素蛋白/生物素或抗原/抗体配合物如包括兔IgG和抗-兔IgG;荧光基团如伞形三糖(umbelliferone)、荧光素、异硫氰酸荧光素、罗丹明、四甲基罗丹明、伊红、绿荧光蛋白、藻红、香豆素、甲基香豆素、芘、孔雀绿、二苯乙烯、荧光黄、Cascade蓝、二氯三嗪基荧光素、丹磺酰氯、藻红蛋白、荧光镧系络合物如包括铕和铽、Cy3、Cy5、分子信标(molecular beacons)和其荧光衍生物、发光材料如鲁米诺;光散射或细胞质基因组共振材料如金或银颗粒或量子斑(quantum dot):或放射性材料如14C、123I、124I、131I、Tc99m、35S或3H;或球珠(sphericalshell),以及标记有本领域已知的任何其它信号产生标记物的探针。例如,可检测的分子包括但不限于荧光基团以及前面所述其它已知的,如在Joseph R.Lakowicz(Editor)所编的Principles ofFluorescence Spectroscopy,Plenum Pub Corp,第二版(July 1999)和Richard P.Hoagland的第六版的Molecular Probes Handbook所描述的。在某些实施方式中,标记物包括半导体纳米微晶如量子斑(即Qdots),参见U.S.P 6,207,392。Qdots可从Quantum Dot Corporation购得。用于本发明的半导体纳米微晶包括Group II-V半导体的纳米微晶如MgS、MgSe、MgTe、CaS、CaSe、CaTe、SrS、SrSe、SrTe、BaS、BaSe、BaTe、ZnS、ZnSe、ZnTe、CdS、CdSe、CdTe、HgS、HgSe、HgTe和其混合物以及Group III-V半导体的纳米微晶如GaAs、InGaAs、InP、InAs和其混合物。Group IV半导体如锗或硅的使用,或有机半导体的使用,在某些条件下可能是方便可行的。半导体纳米微晶也可以包括合金,其含有两种或多种选自于Group III-V化合物、GroupII-VI化合物、Group IV元素和其组合物的半导体。根据使用的标记物,相应的核酸分离和检测方法在本领域内也是已知的。参见例如,Henegariu O等人,(1999).“Custom fluorescent-nucleotidesynthesis as an alternative method for nucleic acid labeling”,Nature Biotechnology 18:345-348;Ezaki T等,1989.FluorometricDeoxyribonucleic Acid-Deoxyribonucleic Acid Hybridization inMicrodilution Wells as an Alternative to Membrane FilterHybridization in which Radioisotopes Are Used To DetermineGenetic Relatedness among Bacterial Strains.Int.J.ofSystemic Bacteriology 29(3):224-229;和Herrington C等人,1998.PCR 3:PCR in situ hybridization:a practical approach,Volume 3.Oxford:Oxford University Press。
如本文中所使用的,术语“能够特异性识别/结合突变的COL14A1蛋白的抗体或其抗原结合片段”是指这样的抗体或其抗原结合片段,其特异性识别/结合突变的COL14A1蛋白,而不识别或结合野生型COL14A1蛋白。此类抗体通常可采用Kohler等首次报道的杂交瘤技术(Nature,256:495,1975)来获得。
如本文中使用的,术语“特异性识别/结合”是指,两分子间的非随机的结合反应,如抗体和其所针对的抗原之间的反应。在某些实施方式中,特异性结合某抗原的抗体(或对某抗原具有特异性的抗体)是指,抗体以小于大约10-5M,例如小于大约10-6M、10-7M、10-8M、10-9M或10-10M或更小的亲和力(KD)结合该抗原。如本文中所使用的,术语“KD”是指特定抗体-抗原相互作用的解离平衡常数,其用于描述抗体与抗原之间的结合亲和力。平衡解离常数越小,抗体-抗原结合越紧密,抗体与抗原之间的亲和力越高。可使用本领域技术人员公知的技术,例如表面等离子体共振术(SPR)(例如使用BIACORE仪)来测定抗体-抗原相互作用的解离平衡常数。
如本文中所使用的,术语抗体的“抗原结合片段”是指包含全长抗体的片段的多肽,其保持特异性结合全长抗体所结合的相同抗原的能力,和/或与全长抗体竞争对抗原的特异性结合,其也被称为“抗原结合部分”。通常参见,Fundamental Immunology,Ch.7(Paul,W.,ed.,第2版,Raven Press,N.Y.(1989),其以其全文通过引用合并入本文,用于所有目的。可通过重组DNA技术或通过完整抗体的酶促或化学断裂产生抗体的抗原结合片段。在一些情况下,抗原结合片段包括Fab、Fab'、F(ab')2、Fd、Fv、dAb和互补决定区(CDR)片段、单链抗体(例如,scFv)、嵌合抗体、双抗体(diabody)和这样的多肽,其包含足以赋予多肽特异性抗原结合能力的抗体的至少一部分。
如本文中所使用的,术语“中和性抗体”是指,能阻断或抑制其所识别的抗原的活性或功能的抗体。
如本文中所使用的,术语“特异性靶向突变的COL14A1基因的siRNA”是指,siRNA能够通过RNA干扰特异性沉默或抑制突变的COL14A1基因的表达,而不影响野生型COL14A1基因的表达。
如本文中所使用的,术语“药学上可接受的载体和/或赋形剂”是指在药理学和/或生理学上与受试者和活性成分相容的载体和/或赋形剂,其是本领域公知的(参见例如Remington's PharmaceuticalSciences.Edited by Gennaro AR,19th ed.Pennsylvania:MackPublishing Company,1995),并且包括但不限于:pH调节剂,表面活性剂,佐剂,离子强度增强剂。例如,pH调节剂包括但不限于磷酸盐缓冲液;表面活性剂包括但不限于阳离子,阴离子或者非离子型表面活性剂,例如Tween-80;离子强度增强剂包括但不限于氯化钠。
如本文中所使用的,术语“有效量”是指足以获得或至少部分获得期望的效果的量。例如,预防疾病(例如PPPK)有效量是指,足以预防,阻止,或延迟疾病(例如PPPK)的发生的量;治疗疾病有效量是指,足以治愈或至少部分阻止已患有疾病的患者的疾病和其并发症的量。测定这样的有效量完全在本领域技术人员的能力范围之内。例如,对于治疗用途有效的量将取决于待治疗的疾病的严重度、患者自己的免疫系统的总体状态、患者的一般情况例如年龄,体重和性别,药物的施用方式,以及同时施用的其他治疗等等。
本发明至少部分基于发明人的发现:COL14A1基因的突变可导致PPPK。在此基础上,本发明提供了突变的COL14A1基因及其用途,包含突变的COL14A1基因的载体、宿主细胞以及试剂盒。此外,本发明还提供了用于诊断或治疗PPPK的方法,用于所述方法的诊断剂或治疗剂,以及包含所述诊断剂或治疗剂的试剂盒。
因此,在一个方面,本发明提供了突变的COL14A1基因,其与SEQID NO:1相比具有至少1个非沉默突变,并且所述突变的COL14A1基因编码与野生型COL14A1蛋白相比,功能异常(例如丧失了功能)的蛋白,或导致PPPK的发生。
在一个优选的实施方案中,所述非沉默突变选自添加,缺失和置换中的一种或多种。在一个优选的实施方案中,所述非沉默突变位于COL14A1基因的外显子区域。在一个优选的实施方案中,所述非沉默突变位于COL14A1基因的第37个外显子。在一个优选的实施方案中,所述非沉默突变位于:c.4505。在进一步优选的实施方案中,所述非沉默突变是:c.4505C→T。
在另一个方面,本发明提供了包含上述突变的COL14A1基因的载体。
在一个优选的实施方案中,所述载体包括但不限于克隆载体和表达载体。在一个优选的实施方案中,所述载体是例如质粒,粘粒,噬菌体,柯斯质粒等等。在一个优选的实施方案中,所述载体是商购可得的。在一个优选的实施方案中,所述载体包含与上述突变的COL14A1基因可操作地连接的表达控制序列,例如但不限于启动子,增强子和终止子。在一个优选的实施方案中,所述载体任选地还包含选择标记。
在另一个方面,本发明提供了包含上述突变的COL14A1基因和/或载体的宿主细胞。此类宿主细胞包括但不限于,原核细胞例如大肠杆菌细胞,以及真核细胞例如酵母细胞,昆虫细胞,植物细胞和动物细胞(如哺乳动物细胞,例如小鼠细胞、人细胞等)。本发明的宿主细胞还可以是细胞系,例如293T细胞。
本领域技术人员公知,可将致病基因用于产生疾病动物模型和/或用作药物靶点,从而研究疾病的发病机制和开发有效治疗疾病的药物。因此,在另一个方面,本发明提供了上述突变的COL14A1基因的用途,其用于产生PPPK动物模型,或用作药物靶点,或用于制备试剂盒,所述试剂盒用于产生PPPK动物模型,或用作药物靶点。在一个优选的实施方案中,所述动物包括但不限于,哺乳动物,例如小鼠,大鼠,兔和猴。
在另一个方面,本发明提供了上述载体或宿主细胞的用途,其用于产生PPPK动物模型,或用于制备试剂盒,所述试剂盒用于产生PPPK动物模型。
在另一个方面,本发明提供了试剂盒,其包含上述突变的COL14A1基因和/或载体和/或宿主细胞。
在另一个方面,本发明提供了用于诊断PPPK的诊断剂,其包含能够特异性扩增COL14A1基因或其片段的引物,或能够特异性检测COL14A1基因突变的探针,或能够特异性识别突变的COL14A1蛋白的抗体或其抗原结合片段。
在一个优选的实施方案中,所述引物能够特异性扩增COL14A1基因的外显子,优选第37个外显子。在一个优选的实施方案中,所述引物的序列选自SEQ ID NO:73和74。在进一步优选的实施方案中,所述引物是如SEQ ID NO:73和74所示的引物对。
在一个优选的实施方案中,所述COL14A1基因突变位于COL14A1基因的外显子,优选第37个外显子,更优选地位于:c.4505。在进一步优选的实施方案中,所述突变是c.4505C→T。
在一个优选的实施方案中,所述突变的COL14A1蛋白包含氨基酸突变p.Pro1502Leu。
在一个优选的实施方案中,所述引物、探针或抗体或其抗原结合片段是经标记的。
在另一个方面,本发明提供了试剂盒,其包含上文所述的诊断剂。在一个优选的实施方案中,所述试剂盒还包含其他试剂,例如用于PCR的试剂(例如dNTP和聚合酶),用于提取核酸的试剂,用于检测所述抗体或其抗原结合片段的二抗等。
在另一个方面,本发明提供了用于治疗PPPK的治疗剂,其包含分离的正常的COL14A1基因,或含有所述基因的载体,或具有正常生物学功能的COL14A1蛋白,或特异性靶向突变的COL14A1基因的siRNA,或特异性结合突变的COL14A1蛋白的中和性抗体。如本文中所使用的,术语“正常的COL14A1基因”是指编码具有正常生物学功能的COL14A1蛋白的COL14A1基因,其例如但不限于,如SEQ ID NO:1所示的COL14A1基因。
在一个优选的实施方案中,所述突变的COL14A1基因所包含的突变位于COL14A1基因的外显子,优选第37个外显子,更优选地位于:c.4505。在进一步优选的实施方案中,所述突变是c.4505C→T。在一个优选的实施方案中,所述突变的COL14A1蛋白包含氨基酸突变p.Pro1502Leu。
在另一个方面,本发明提供了一种药物组合物,其包含上文所述的治疗剂,和药学上可接受的载体和/或赋形剂。
在另一个方面,本发明提供了诊断受试者是否患有PPPK或处于发展PPPK的风险中的方法,其包括,检测受试者的COL14A1基因是否存在非沉默突变,如果存在所述非沉默突变,则判断受试者患有PPPK或处于发展PPPK的风险中。
在一个优选的实施方案中,所述非沉默突变选自添加,缺失和置换中的一种或多种。在一个优选的实施方案中,所述非沉默突变位于COL14A1基因的外显子区域。在一个优选的实施方案中,所述非沉默突变位于COL14A1基因的第37个外显子。在一个优选的实施方案中,所述非沉默突变位于c.4505。在一个优选的实施方案中,所述非沉默突变是c.4505C→T。
在另一个方面,本发明提供了诊断受试者是否患有PPPK或处于发展PPPK的风险中的方法,其包括:
1)获得来自所述受试者的核酸样品(例如,基因组DNA样品或总mRNA样品);
2)在所述核酸样品中确定COL14A1基因中是否存在导致COL14A1基因编码功能异常的蛋白的非沉默突变;和
3)如果存在所述非沉默突变,则判断受试者患有PPPK或处于发展PPPK的风险中。
在一个优选的实施方案中,所述非沉默突变选自添加,缺失和置换中的一种或多种。在一个优选的实施方案中,所述非沉默突变位于COL14A1基因的外显子区域。在一个优选的实施方案中,所述非沉默突变位于COL14A1基因的第37个外显子。在一个优选的实施方案中,所述非沉默突变位于c.4505。在一个优选的实施方案中,所述非沉默突变是c.4505C→T。
在另一个方面,本发明提供了检测COL14A1基因的突变的方法,其包括使用上文所述的诊断剂。在一个优选的实施方案中,所述方法不是诊断方法。例如,所述方法可以用于研究目的。
在另一个方面,本发明提供了治疗受试者的PPPK的方法,其包括给有此需要的受试者施用有效量的上文所述的治疗剂。
在另一个方面,本发明提供了上文所述的诊断剂在制备用于检测COL14A1基因的突变和/或用于诊断PPPK的试剂盒中的用途。
在另一个方面,本发明提供了上文所述的治疗剂在制备用于治疗PPPK的药物组合物中的用途。
本发明的试剂、试剂组合物、药物组合物或试剂盒中可进一步包含与活性成分相容的缓冲液、载体或媒介等,例如选自下列的一种或多种:水、生理盐水、磷酸缓冲液、左旋糖、甘油、乙醇和其他类似物,以及上述物质的组合。此类缓冲液、载体或媒介可进一步包括微量辅助物质,例如湿润剂、乳化剂、表面活性剂、防腐剂或助悬剂等。
发明的有益效果
本发明通过外显子组测序技术确定了PPPK的致病基因,这至少带来了以下有益效果。
一方面,本发明为PPPK的诊断和治疗提供了新的方法和工具。特别地,本发明所提供的诊断方法以及用于该方法的引物和/或探针和/或抗体可用于快速、有效地确定受试者是否患有PPPK或处于发展PPPK的风险中。
另一方面,本发明为PPPK的发病机制研究奠定了重要基础,为PPPK患者的治疗提供全新的理论依据。另外,PPPK的致病基因的鉴定对将来的遗传咨询、产前诊断及基因治疗具有重要意义。此外,利用PPPK致病基因所获得的疾病动物模型是研究PPPK的发病机制和治疗方法的有力工具。
下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。
具体实施方式
现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。
除非特别指明,否则基本上按照本领域内熟知的以及在各种参考文献中描述的常规方法进行实施例中描述的实验和方法(例如,分子生物学和核酸化学实验方法)。参见,例如,Sambrook等人,MolecularCloning:A Laboratory Manual,第2版,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.(1989);和Ausubel等人,Current Protocols in Molecular Biology,Greene PublishingAssociates(1992),其全部通过引用合并入本文。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。本文中提及的全部公开案和其他参考资料以其全文通过引用合并入本文。
实施例1.PPPK致病基因的鉴定
本研究所使用的家系PPPK703,共四代,共33名成员,其中患者9例(男4例,女5例)。患者的临床表现均为,掌跖部出现圆形或椭圆形角质性丘疹,随年龄的增长,皮损数目明显增多。所有参与研究的家系成员均经过专业皮肤科医生的仔细检查,不存在漏诊、误诊的现象。
家系PPPK703的家系图如图1所示。从家系图可知,PPPK疾病符合常染色体显性遗传模式。另外,我们还注意到了以下方面:1)以前报道的PPPK疾病的发病年龄通常在12岁到33岁之间[15],然而,我们所研究的家系显示,发病年龄可在10-35岁之间;2)在PPPK703家系中,我们观察到下一代比上一代的患病年龄轻,存在着明显的遗传早现现象,这点在其他种族或家系中尚未提到。
从该家系采集到了16例家系成员的血样(见图1),并从该家系获得了下列信息。
1)先证者II2,女,46岁。患者23岁时掌跖部开始出现圆形或椭圆形角质丘疹,质地坚硬,随年龄增长皮损逐渐增多。皮损对称分布于双手掌及足跖部,为圆形或椭圆形的角质丘疹,数目较多,排列分散,直径约为0.2-0.5cm,色泽暗黄,质地坚硬,部分融合。部分皮损被剥除角质丘疹或自行脱落后,可见喷火口形凹陷。掌跖受压部位皮损明显增多,发生于足跖部位的皮损可伴有明显的触痛,而手掌部自觉症状则不明显。其他部位无类似损害。无多汗、甲部可见甲增厚、甲纵裂,无恶性肿瘤病史。
2)先证者的父亲I1。患者于35岁时手掌开始出现皮损,而其跖部也是30岁以后开始出现角化性丘疹,但其发病较快,且融合成片。
3)第三代的患者均在10岁左右发病,临床均表现为掌跖部位出现圆形或椭圆形的角质丘疹,随年龄增长,皮损明显增多。
4)在该家系中年龄小的患者症状明显轻于年龄大的患者,该家系中先证者(II2)与先证者父亲症状最为严重,而111:17患者的症状最轻。家系中第四代尚未发现发病。
5)个体II10在35岁时死于结肠癌。家系中的其他患者除掌跖部位损害外,未见其他部位的类似皮损。
我们首先通过全基因组连锁分析的方法[40]将致病基因定位于基因组的8q24.13-8q24.21区域中。为了鉴定出致病基因,我们进一步从PPPK703家系中挑选了症状比较典型的4个病例(I1,II2,III2和III5)以及2个家系内正常对照(I2和III6),进行了全基因组外显子测序。全基因组外显子测序方法概述如下。
a)选取PPPK703家系中诊断明确的4个患者和2个家系内对照,获取各个受试者的基因组DNA(参见实施例2中的样品制备);
b)基因组DNA被自适应高聚焦超声技术(Covaris)随机打断为150-200bp的小片段;
c)对DNA片段进行末端修复和加A尾,然后将其与配对末端接头(Paired-end adapter)连接;
d)进行由接头介导的PCR扩增,从而获得扩增文库;
e)将扩增文库与SureSelct Human All Exon(Agilent公司)杂交,捕获杂交片段,并于24小时后洗脱非杂交片段;
f)使用Agilent 2100 Bioanalyzer检测PCR产物以评估富集量,然后使用Hiseq2000平台(BGI,Shenzhen,China)进行高通量的测序,测序深度为至少50X。
对获得的测序数据进行初步统计分析,SNP检测和注释,以及氨基酸替换的预测,主要步骤如下:
1)测序数据的初步统计分析主要包括:测序片段(reads)的长度分析、测序片段的数量、数据的产量、测序片段的序列与参考基因组序列的比对、比对到参考基因组的目标区域的测序片段的覆盖度(Coverage)与测序深度(Depth)等。根据以上初步统计分析,可得到通过外显子捕获的样品的基本信息,还可判断捕获的数据是否符合要求。
2)通过SOAPaligner 2.20比对软件,将每个样品的高质量的原始测序片段比对到参考基因组(NCBI build 36.3,hg18)上[24,25]。比对到参考基因组上的测序片段用于后续的SNP注释等分析。进一步,在使用SOAPaligner 2.20比对软件进行比对之后,采用SOAPsnp软件来进行一致性序列组装[26],以得到每个SNP位点的基因分型情况,从而进行SNP的检测。通过SOAPsnp软件组装可得到一致性序列CNS文件(*.cns),然后,按下述过滤标准对包含SNP位点的基因分型等详细信息的*.snp文件进行过滤,得到具有高可信度的SNP结果(*.s np.filter文件)。
过滤的标准为:质量值≥20(Q20);4≤总测序深度≤200;位点附近区域平均拷贝数约<2;相邻两个SNP的距离≥5b。
对所获得的*.snp.filter结果进行注释分类,包括SNP类型、质量值、碱基位置、可信度等,最后得到包含SNP详细信息的*.gff文件。
3)由于导致PPPK的基因突变十分罕见,因此,该突变不应该在一般人群中出现。也即,该突变是家系内病例中特有的,且不存于家系内对照和数据库(例如dbSNP129,eight HapMap[4]和1000Genomes)中。因此,我们使用了dbSNP129、eight HapMap、1000Genomes和家系内对照的测序数据对步骤2)中获得的SNP结果进行了逐步过滤,并最终在之前定位的连锁区域8q24.13-8q24.21附近鉴定到了1个新的变异位点:COL14A1基因的第37号外显子上存在一个错义突变(c.4505C->T;p.Pro1502Leu),此突变点位于连锁区域8q24.13-8q24.21的上游3.4Mb的位置处,并且为4个病例所共有,而不存在于2个家系内正常对照中。
由此,我们将COL14A1基因鉴定为PPPK的致病基因。
实施例2.PPPK致病基因的验证
为了证明实施例1的结果的可靠性,我们使用Sanger测序法进行了家系内验证和正常人群验证。
家系内验证
我们对PPPK703家系的另外4个患者(II3,III4,III7和III17)和6个对照(II1,II5,II7,II9,III18和IV1)进行了家系内验证(即,使用Sanger测序法对这些受试者的COL14A1基因进行了精确测序)。结果显示,这4个患者的基因组中都存在相同的错义突变(c.4505C->T;p.Pro1502Leu),而在这6个家系内正常对照中,均不存在此突变。
所使用的Sanger测序法概述如下。
1、样品制备
经受试者知情同意后,采集受试者的外周静脉血5mL放置于EDTAk3(或EDTANa4)抗凝管中,并置于-80℃超低温冰箱保存。利用改良的盐析法提取基因组DNA,利用紫外分光光度法和DNA电泳法测量所获得的DNA的浓度及纯度,所获得的每个基因组DNA样品的OD260/OD280均在1.7-2.0之间,浓度不少于200ng/ul,总量不少于30μg。
2、Sanger测序法验证
在本实验中,针对COL14A1基因的所有外显子序列设计了引物,然后通过PCR扩增,产物纯化,测序等步骤获得了各样品的COL14A1基因的序列,最后根据测序结果,验证了COL14A1基因与PPPK疾病之间的相关性。
a)引物设计
采用Primer3.0进行引物设计。所设计的引物的具体序列如表2所示。
表2:引物序列
b)PCR反应体系:
分别使用表2中所列的每一个引物对,对每一个受试者的COL14A1基因的47个外显子及其侧翼序列进行测序。Sanger测序法的15ul扩增反应体系(所有试剂购自Qiagen公司)如下:
Sanger测序法的扩增反应条件如下:
c)测序
使用ABI3730(ABI),分别对上述步骤中获得的所有样本(4个家系内患者(II3,III4,III7和III17)和6个家系内对照(II1,II5,II7,II9,III18和IV1))的PCR扩增产物进行DNA测序。
利用获得的测序结果,在所有受试者中对COL14A1基因的所有编码序列及侧翼序列进行突变排查。
结果显示,所测试的4个患者的基因组中都存在相同的错义突变(c.4505C->T;p.Pro1502Leu),而在6个家系内正常对照中,均不存在此突变。也即,所述错义突变在PPPK703家系内表现为与疾病共分离。图2示例性显示了患者和正常人的COL14A1基因的测序结果,其中患者具有杂合的c.4505C→T(p.Pro1502Leu)突变,而正常人不具有该突变(即,在c.4505处具有纯合的碱基C)。
因此,所获得的测序结果充分表明,本发明所鉴定到的杂合突变导致COL14A1蛋白的结构和功能发生变化,从而导致PPPK疾病。即,COL14A1基因为PPPK的致病基因,该基因的突变与PPPK疾病的发生具有相关性。
上述实验还表明,本发明所设计的引物(特别是,用于扩增第37个外显子的引物对)可用于检测COL14A1基因中是否存在突变(特别是,本发明所鉴定到的c.4505C→T(p.Pro1502Leu)突变),从而诊断受试者是否患有PPPK疾病。
正常人群验证
我们还在另外676例正常对照中和781例其他疾病患者(他们之间无亲缘关系、种族上和地理位置上的匹配)的全基因组外显子测序数据中筛查了此变异位点的错义突变(c.4505C->T;p.Pro1502Leu)。结果显示,在所有这些受试者中,均未发现上述错义突变。该结果表明,我们所鉴定到的这个错义突变是致病性突变,而不是一个多态性。
COL14A1基因的功能分析和验证
在遗传学中,基因变异对表型的影响意义较大。我们在COL14A1基因中鉴定到的错义突变(c.4505C->T)导致其所编码的蛋白质序列中的单氨基酸替换(p.Pro1502Leu)。为了分析该错义突变是否影响了蛋白质的结构和功能,并从而影响了表型,我们进行了下述分析。
我们通过在Pfam网站上进行序列比对,发现了17个与COL14A1蛋白序列相匹配的Pfam-A结构域,其中14个有意义,而3个无意义。在这14个有意义的结构域中,胶原三螺旋重复区(collagen triplehelix repeat(20copies)region)的氨基酸排列为COL14A1蛋白的第1460到1514位氨基酸。而我们所鉴定到的COL14A1基因第37号外显子上的错义突变(p.Pro1502Leu)恰好落在胶原三螺旋重复区这个结构域中(http://pfam.sanger.ac.uk/)。
在胶原中,胶原三螺旋或2-型螺旋是二级结构的主要模型,其由重复的氨基酸序列G l y-X-Y形成的三螺旋结构组成,其中X和Y是指脯氨酸或羟脯氨酸[30]。由于脯氨酸和羟脯氨酸残基的四氢化吡咯,三螺旋结构的每条链都主要靠空间排斥来维持[31,32]。因此,胶原三螺旋重复区中脯氨酸到亮氨酸的转变将导致氨基酸序列Gly-X-Y重复模式的改变,从而将影响到COL14A1蛋白的正常结构的维持,并进一步影响到COL14A1蛋白的功能。
已报道,在纤维母细胞上发现的CXIV受体是CD44的变异体[29]。CD44是一种普遍存在的细胞表面糖蛋白,其通过与透明质酸(HA)和其他可能的配体如骨桥蛋白、胶原和基质金属蛋白酶(MMPs)等相结合而参与重要的细胞功能(包括细胞-细胞识别、细胞基质相互作用等)[33]。还已报道,CD44与HA的相互粘附在调节角质细胞的增殖中起重要作用[34,35]。因此,COL14A1基因的结构和功能的变异将影响CD44和CXIV的相互作用和功能,并最终导致角质层的增生异常。这与PPPK常见的组织病理学特征(例如角质层增厚、显著角化过度、颗粒层增厚、棘层增厚、非典型增生的角化细胞)相符合。因此,这也进一步证实,COL14A1的突变(例如p.Pro1502Leu)在PPPK发病机制中的潜在作用。
进一步,我们还采用了ANNOVAR软件、SIFT(Sorting IntolerantFromTolerant)软件与Polyphen(Polymorphism Phenotyping)软件对上述单氨基酸替换(c.4505C->T;p.Pro1502Leu)进行了功能预测。结果显示,COL14A1基因的c.4505为高度保守的位点,并且该错义突变被ANNOVAR软件预测为“破坏性(damaging)”的突变,被PolyPhen软件预测为“可能破坏性(probably damaging)”的突变。
这些结果再次支持了我们的结论:COL14A1基因为PPPK的致病基因,该基因中的非沉默突变将导致PPPK疾病的发生。
尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公开的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
参考文献
1.Gao,M.,et al.,Refined localization of a punctate palmoplantar keratoderma gene to a5.06-cM region at 15q22.2-15q22.31.Br J Dermatol,2005.152(5):p.874-8.
2.Ku,C.S.,et al.,The pursuit of genome-wide association studies:where are we now?J HumGenet,2010.55(4):p.195-206.
3.Ng,S.B.,et al.,Targeted capture and massively parallel sequencing of 12 human exomes.Nature,2009.461(7261):p.272-6.
4.Ng,S.B.,et al.,Exome sequencing identifies the cause of a mendelian disorder.Nat Genet,2009.42(1):p.30-5.
5.Ng,S.B.,et al.,Exome sequencing identifies MLL2 mutations as a cause of Kabukisyndrome.Nat Genet,2010.42(9):p.790-3.
6.Johnson,J.O.,et al.,Exome sequencing in brown-vialetto-van laere syndrome.Am J HumGenet,2010.87(4):p.567-9.
7.Liu,Y.,et al.,Confirmation by Exome Sequencing of the Pathogenic Role of NCSTNMutations in Acne Inversa(Hidradenitis Suppurativa).J Invest Dermatol,2011.131(7):p.1570-2.
8.Wang,J.L.,et al.,TGM6 identified as a novel causative gene of spinocerebellar ataxias usingexome sequencing.Brain,2010.133(Pt 12):p.3510-8.
9.Hoischen,A.,et al.,De novo mutations of SETBP1 cause Schinzel-Giedion syndrome.NatGenet,2010
10.Walsh,Whole Exome Sequencing and Homozygosity Mapping Identify Mutation in the CellPolarity Protein GPSM2 as the Cause of Nonsyndromic Hearing Loss DFNB82.Ame J HumGene,2010.
11.Kahvejian,A.,J.Quackenbush,and J.F.Thompson,What would you do if you couldsequence everything?Nat Biotechnol,2008.26(10):p.1125-33.
12.Stevens,H.P.,et al.,Linkage of an American pedigree with palmoplantar keratoderma andmalignancy(palmoplantar ectodermal dysplasia type III)to 17q24.Literature survey andproposed updated classification of the keratodermas.Arch Dermatol,1996.132(6):p.640-51.
13.Stanimirovic,A.,et al.,Hereditary palmoplantar keratoderma,type papulosa,in Croatia.JAmAcad Dermatol,1993.29(3):p.435-7.
14.Miljkovic,J.and A.Kansky,Hereditary palmoplantar keratoderma type papulosa in Slovenia.Acta Dermatovenerol Alp Panonica Adriat,2009.18(3):p.114-6.
15.Stevens,H.P.,et al.,Punctate palmoplantar keratoderma and malignancy in a four-generationfamily.Br J Dermatol,1996.134(4):p.720-6.
16.Ena,P.,et al.,[Association of keratoderma punctata palmaris et plantaris with other morbidconditions(early grayness,carcinoma of the colon).Study of 3 families].G Ital DermatolVenereol,1986.121(1):p.45-54.
17.Bennion,S.D.and J.W.Patterson,Keratosis punctata palmaris et plantaris andadenocarcinoma of the colon.A possible familial association of punctate keratoderma andgastrointestinal malignancy.J Am Acad Dermatol,1984.10(4):p.587-91.
18.Al-Mutairi,N.,A.Joshi,and O.Nour-Eldin,Punctate palmoplantar keratoderma(Buschke-Fischer-Brauer disease)with psoriasis:a rare association showing excellentresponse to acitretin.J Drugs Dermatol,2005.4(5):p.627-34.
19.Ichihara,A.,et al.,microRNA-mediated keratinocyte hyperproliferation in psoriasis vulgaris.Br J Dermatol,2011.165(5):p.1003-10.
20.Zhang,X.J.,et al.,Psoriasis genome-wide association study identifies susceptibility variantswithin LCE gene cluster at 1q21.Nat Genet,2009.41(2):p.205-10.
21.Patrizi,A.,et al.,Porokeratosis palmaris et plantaris disseminata:an unusual clinicalpresentation.J Am Acad Dermatol,1989.21(2Pt 2):p.415-8.
22.Sakas,E.L.and R.H.Gentry,Porokeratosis punctata palmaris et plantaris(punctateporokeratosis).Case report and literature review.J Am Acad Dermatol,1985.13(5Pt 2):p.908-12.
23.Meziane,M.,et al.,Acrokeratoelastoidosis.Dermatol Online J,2008.14(9):p.11.
24.Lonergan,C.L.,et al.,Imiquimod cream 5% for the treatment of arsenic-induced cutaneousneoplasms.Cutis,2010.85(4):p.199-202.
25.El Amri,I.,et al.,[Clinical and genetic characteristics of Buschke-Fischer-Brauer's disease ina Tunisian family].Ann Dermatol Venereol,2010.137(4):p.269-75.
26.Choi,M.,et al.,Genetic diagnosis by whole exome capture and massively parallel DNAsequencing.Proc Natl Acad Sci U S A,2009.106(45):p.19096-101.
27.Otto,E.A.,et al.,Candidate exome capture identifies mutation of SDCCAG8 as the cause ofa retinal-renal ciliopathy.Nat Genet,2010.42(10):p.840-50.
28.Ostergaard,P.,et al.,Rapid identification of mutations in GJC2 in primary lymphoedemausing whole exome sequencing combined with linkage analysis with delineation of thephenotype.J Med Genet,2011.48(4):p.251-255.
29.Bolze,A.,et al.,Whole-Exome-Sequencing-Based Discovery of Human FADD Deficiency.Am J Hum Genet,2010.87(6):p.873-881.
30.Li,R.,et al.,SOAP:short oligonucleotide alignment program.Bioinformatics,2008.24(5):p.713-4.
31.Li,R.,et al.,SOAP2:an improved ultrafast tool for short read alignment.Bioinformatics,2009.25(15):p.1966-7.
32.Li,R.,et al.,SNP detection for massively parallel whole-genome resequencing.Genome Res,2009.19(6):p.1124-32.
33.Sevior,K.B.,et al.,Mitochondrial A7445G mutation in two pedigrees with palmoplantarkeratoderma and deafness.Am J Med Genet,1998.75(2):p.179-85.
34.Heathcote,K.,et al.,A connexin 26 mutation causes a syndrome of sensorineural hearingloss and palmoplantar hyperkeratosis(MIM 148350).J Med Genet,2000.37(1):p.50-1.
35.Natt,E.,et al.,Point mutations in the tyrosine aminotransferase gene in tyrosinemia type II.Proc Natl Acad Sci U S A,1992.89(19):p.9297-301..
36.Berisio,R.,et al.,Crystal structure of the collagen triple helix model[(Pro-Pro-Gly)(10)](3).Protein Sci,2002.11(2):p.262-70.
37.Brodsky,B.,et al.,Triple-helical peptides:an approach to collagen conformation,stability,and self-association.Biopolymers,2008.89(5):p.345-53.
38.Pasonen-Seppanen,S.,et al.,Role of CD44 in the organization of keratinocyte pericellularhyaluronan.Histochem Cell Biol,2011.
39.asova,M.,et al.,Hyaluronan minimizes effects of UV irradiation on human keratinocytes.Arch Dermatol Res,2011.303(4):p.277-84.
40.Zhang,X.J.,et al.,Identification of a locus for punctate palmoplantar keratodermas atchromosome 8q24.13-8q24.21.J Invest Dermatol,2004.122(5):p.1121-5.