CN1252446A - 一种新的人基因序列、其编码的多肽及制法和用途 - Google Patents

一种新的人基因序列、其编码的多肽及制法和用途 Download PDF

Info

Publication number
CN1252446A
CN1252446A CN98121960A CN98121960A CN1252446A CN 1252446 A CN1252446 A CN 1252446A CN 98121960 A CN98121960 A CN 98121960A CN 98121960 A CN98121960 A CN 98121960A CN 1252446 A CN1252446 A CN 1252446A
Authority
CN
China
Prior art keywords
sequence
polypeptide
seq
nucleotide
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN98121960A
Other languages
English (en)
Inventor
余龙
傅强
赵勇
刘擎
赵寿元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XINHUANGPU-FUDAN GENE ENGINEERING Co Ltd SHANGHAI
Original Assignee
XINHUANGPU-FUDAN GENE ENGINEERING Co Ltd SHANGHAI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XINHUANGPU-FUDAN GENE ENGINEERING Co Ltd SHANGHAI filed Critical XINHUANGPU-FUDAN GENE ENGINEERING Co Ltd SHANGHAI
Priority to CN98121960A priority Critical patent/CN1252446A/zh
Publication of CN1252446A publication Critical patent/CN1252446A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

本发明提供了一种新的人基因核苷酸序列。本发明提供了人E16H的cDNA序列及由该核苷酸序列编码的多肽。人E16H是与人E16蛋白高度同源的蛋白。本发明还提供了E16H多核苷酸和多肽的应用,以及所述多核苷酸和所述多肽的生产方法。

Description

一种新的人基因序列、其编码的多肽及制法和用途
本发明涉及基因工程领域,具体地,本发明涉及一种新的人基因核苷酸序列。更具体地说,本发明涉及人E16H的cDNA序列。本发明还涉及由该核苷酸序列编码的多肽,这些多核苷酸和多肽的应用,以及所述多核苷酸和所述多肽的生产方法。
E16是人活化的淋巴细胞中发现的一个基因,它与TA1被认为是细胞透性酶,与细胞吸收代谢物有关(J.Biol.Chem.267(16):11267-11273,1992)。在分化细胞中E16表达量极低,而在未分化细胞中则高得多,提示其与癌细胞有密切联系(Cancer Research 55:1152-1159,1995)。
E16于1992年被Gaugitsch等人发现(J.Biol.Chem.267:11267-11273,1992)。1995年,Sang等人从大鼠肝癌细胞中克隆E16的大鼠同源基因TA1(CancerResearch 55:1152-1159,1995)。1997年Spindler等人从非洲爪蟾(Xenopus laevis)A6肾细胞中分离到一个TA1/E16的同源基因ASUR4(Pflugers Arch-Eur J.Physiol.434:323-331,1997)。这三个基因被认为与细胞活化、肝脏发育、癌形成等有关。然而,在本发明之前,尚没有任何人公开过本申请中涉及的人E16H蛋白。
本发明的一个目的是提供一种新的多核苷酸序列,该多核苷酸序列编码与大鼠E16同源的蛋白,本发明的E16同源基因被命名为人E16H。
本发明的另一个目的是提供一种新的蛋白,该蛋白被命名为E16H蛋白。
本发明的再一个目的是提供一种利用重组技术生产所述的新的人E16H蛋白的方法。
本发明还提供了这种人E16H基因序列和多肽的应用。
在本发明的一个方面,提供了一种分离出的DNA分子,它包括:编码具有人E16H蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.3中从核苷酸118-1251位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.3中从核苷酸118-1251位的核苷酸序列杂交。较佳地,所述的序列编码一多肽,该多肽具有SEQ ID NO.4所示的序列。更佳地,该序列具有SEQ ID NO.3中从核苷酸118-1251位的核苷酸序列。
在本发明的另一方面,提供了一种分离的E16H蛋白多肽,它包括:具有SEQID NO.4氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.4序列的多肽。
在本发明的另一方面,提供了一种载体,它含有上述分离出的DNA。
在本发明的另一方面,提供了一种所述载体转化的宿主细胞。
在本发明的另一方面,提供了一种产生具有E16H蛋白活性的多肽的方法,该方法包括:
(a)将编码具有E16H蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成E16H蛋白表达载体,所述的核苷酸序列与SEQ ID NO.3中从核苷酸118-1251位的核苷酸序列有至少70%的同源性;
(b)将步骤(a)中的表达载体转入宿主细胞,形成E16H蛋白的重组细胞;
(c)在适合表达E16H蛋白多肽的条件下,培养步骤(b)中的重组细胞;
(d)分离出具有E16H蛋白活性的多肽。
在本发明的一个具体实施方案中,本发明的分离的多核苷酸全长为1273个核苷酸,其详细序列见SEQ ID NO.3,其中开放读框位于118-1251位核苷酸。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“E16H蛋白(或多肽)编码序列”指编码具有人E16H蛋白活性的多肽的核苷酸序列,如SEQ ID NO.3中118-1251位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.3序列的编码框118-1251位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.3中118-1251位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.4所述的序列。该术语还包括能在中度严紧条件下与SEQ ID NO.3中从核苷酸118-1251位的核苷酸序列杂交的核苷酸序列
该术语还包括能编码具有与人E16H相同功能的蛋白的、SEQ ID NO.3的开放阅读框序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“E16H蛋白或多肽”指具有E16H蛋白活性的SEQ ID NO.4序列的多肽。该术语还包括具有与人E16H蛋白相同功能的、SEQ ID NO.4序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括E16H蛋白的活性片段和活性衍生物。
该多肽的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严谨度条件下能与E16H DNA杂交的DNA所编码的蛋白、以及利用抗E16H多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含E16H多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还提供了E16H多肽的可溶性片段。通常,该片段具有E16H多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
发明还提供E16H蛋白或多肽的类似物。这些类似物与天然E16H多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还可以包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,“E16H保守性变异多肽”指与SEQ ID No.4的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
                           表1
  最初的残基     代表性的取代   优选的取代
Ala(A) Val;Leu;Ile     Val
Arg(R) Lys;Gln;Asn     Lys
Asn(N) Gln;His;Lys;Arg     Gln
Asp(D) Glu     Glu
Cys(C) Ser     Ser
Gln(Q) Asn     Asn
Glu(E) Asp     Asp
Gly(G) Pro;Ala     Ala
His(H) Asn;Gln;Lys;Arg     Arg
Ile(I) Leu;Val;Met;Ala;Phe;正亮氨酸     Leu
Leu(L) 正亮氨酸;Ile;Val;Met;Ala;Phe     Ile
Lys(K) Arg;Gln;Asn     Arg
Met(M) Leu;Phe;Ile     Leu
Phe(F) Leu;Val;Ile;Ala;Tyr     Leu
Pro(P) Ala     Ala
Ser(S) Thr     Thr
Thr(T) Ser     Ser
Trp(W) Tyr;Phe     Tyr
Tyr(Y) Trp;Phe;Thr;Ser     Phe
Val(V) Ile;Leu;Met;Phe;Ala;正亮氨酸     Leu
本发明还包括E16H多肽编码序列及其片段的反义序列。这种反义序列可用于抑制细胞内E16H的表达。
本发明还包括一种可用作探针的核酸分子,该分子通常具有E16H多肽编码序列的8-100个,较佳地15-50个连续核苷酸。该探针可用于检测样品中是否存在编码E16H的核酸分子。
本发明还包括检测E16H核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于E16H多肽的编码序列,可位于该编码序列的两侧或中间。引物长度一般为20-50个核苷酸。
在本发明中,可选用本领域已知的各种载体,如市售的载体。比如,选用市售的载体,可以将编码具有E16H蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成E16H蛋白表达载体。
如本文所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞,昆虫细胞、和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
另一方面,本发明还包括对E16H DNA或是其片段编码的多肽具有特异性抗体,尤其是单克隆抗体。这里,“特异性”是指抗体能结合于E16H基因产物或片段。较佳地,指那些能与E16H基因产物或片段结合但不识别和结合于其它非相关抗原分子的抗体。本发明中抗体包括那些能够结合并抑制E16H蛋白的分子,也包括那些并不影响E16H蛋白功能的抗体。本发明还包括那些能与修饰或未经修饰形式的E16H基因产物结合的抗体。
本发明不仅包括完整的单克隆或多克隆抗体,而且还包括具有免疫活性的抗体片段,如Fab′或(Fab)2片段;抗体重链;抗体轻链;遗传工程改造的单链Fv分子(Ladner等人,美国专利No.4,946,778);或嵌合抗体,如具有鼠抗体结合特异性但仍保留来自人的抗体部分的抗体。
本发明的抗体可以通过本领域内技术人员已知的各种技术进行制备。例如,纯化的E16H基因产物或者其具有抗原性的片段,可被施用于动物以诱导多克隆抗体的产生。与之相似的,表达E16H或其具有抗原性的片段的细胞可用来免疫动物来生产抗体。本发明的抗体也可以是单克隆抗体。此类单克隆抗体可以利用杂交瘤技术来制备(见Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6:511,1976;Kohler等人,Eur.J.Immunol.6:292,1976;Hammerling等人,InMonoclonal Antibodies and T Cell Hybridomas,Elsevier,N.Y.,1981)。本发明的抗体包括能阻断E16H功能的抗体以及不影响E16H功能的抗体。本发明的各类抗体可以利用E16H基因产物的片段或功能区,通过免疫技术获得。这些片段或功能区可以利用重组方法制备或利用多肽合成仪合成。与E16H基因产物的未修饰形式结合的抗体可以用原核细胞(例如E.Coli)中生产的基因产物来免疫动物而产生;与翻译后修饰形式结合的抗体(如糖基化或磷酸化的蛋白或多肽),可以用真核细胞(例如酵母或昆虫细胞)中产生的基因产物来免疫动物而获得。
本发明的人E16H核苷酸序列全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按已知方法制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
在本发明的一个实施例中,人E16H的cDNA核苷酸序列是如此获得的,以人睾丸λgt11cDNA文库(购自Clontech公司)为模板,合成正向引物A:5′-CTGCCAATCTGCTTATTG CTCCTC-3′和反向引物B:5′-TCTCACCACCCACACCAAAGTCC-3′,进行PCR,获得1273bp的目的片段。测序后得到SEQ ID NO.3的全长cDNA序列。
E16、TA1被认为是细胞透性酶,与细胞吸收代谢物有关。根据同源比较,它们与线虫及其它低等生物中的透性酶高度同源(Cancer Research 56:5012-5022,1996),这种进化上的同源性提示该蛋白在生物学功能上的重要性,TA1基因在胎肝和肝癌细胞中被表达,而在成熟肝细胞中无表达。这种表达模式说明了肝癌细胞未完全分化或非正确表达胚胎抗原的性质。该基因对肝癌形成的具体作用尚在研究之中,但至少可以作为诊断肝癌的标志物之一(Cancer Research 55:1152-1159,1995)。另外,E16/TA1被发现在结直肠癌、乳腺癌等癌细胞中表达,猜测其透性酶活力可能帮助癌细胞吸收代谢物质(Cancer Research 56:5012-5022,1996),因此该种基因的研究可以为抗肿瘤治疗提供一条新途径。
在附图中,
图1为本发明的人E16H与人E16的核酸序列(E16HN和E16N)的同源比较图。其中,相同的核苷酸用“|”标出。
图2为本发明的人E16H与人E16的氨基酸序列(E16HP和E16P)的同源比较图。其中,相同的氨基酸在两个序列之间用“|”标出,相似的氨基酸用“·”标出。相似的氨基酸是:A,S,T;D,E;N,Q;R,K;I,L,M,V;F,Y,W。
图3为本发明的人E16H与人E16的氨基酸序列(E16HP和ASURP)的同源比较图。其中,相同的氨基酸在两个序列之间用“|”标出,相似的氨基酸用“·”标出。相似的氨基酸是:A,S,T;D,E;N,Q;R,K;I,L,M,V;F,Y,W。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:ColdSpring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1
E16H的cDNA序列的克隆和测定
1.引物扩增
以人睾丸λgt11cDNA文库(购自Clontech公司)为模板,用一对寡核苷酸为引物——A:5′-CTGCCAATCTGCTTATTGCTCCTC-3′(SEQ ID NO:1)为正向引物,寡核苷酸B:5′-TCTCACCACCCACACCAAAGTCC-3’(SEQ ID NO:2)为反向引物,进行PCR。PCR条件为93℃4分钟,随之以93℃1分钟、68℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟。电泳检测得到的PCR片断,目的片段长度为1273bp的目的片段。
2.PCR产物的测序
将PCR扩增产物与pGEM-T载体(Promega)连接,转化大肠杆菌JM103,用QIAprep Plasmid试剂盒(QIAGEN)提取质粒,用双链嵌套式缺失试剂盒(Pharmacia)对插入片段进行定向系列缺失,然后用PCR对缺失子进行快速鉴定及排序。用SequiTherm EXCELTM DNA测序试剂盒(Epicentre Technologies)对依次截短的缺失子进行测序,最后用电脑软件拼接顺序,获得全长cDNA序列,共1273bp,详细序列见SEQ ID NO.3,其中开放读框位于118-1251位核苷酸。
根据得到的全长cDNA序列推导出E16H的氨基酸序列,共377个氨基酸残基,其氨基酸序列详见SEQ ID NO.4。
实施例2
同源比较
用本发明的人E16H的全长cDNA编码序列及其编码蛋白,在Non-redundantGenBank+EMBL+DDBJ+PDB数据库及Non-redundant GenBank CDStranslations+PDB+SwissProt+Spupdate+PIR数据库中,用BLAST软件进行核酸和蛋白同源检索。结果发现本发明的人E16H与已报道的人E16和非洲爪蟾ASUR4基因及其编码蛋白具有极高同源性,用PCGENE软件比较发现,人E16H和人E16在核酸水平上的同一性达到了83.2%,在蛋白水平上的同一性达到了44.4%,并另有17.4%的氨基酸相似(图1和2);人E16H和非洲爪蟾ASUR4在核酸水平上的同一性达到了69.8%,在蛋白水平上的同一性达到了36.1%,并另有11.9%的氨基酸相似(图3)。同时,E16H与大鼠TA1又有着一定同源性。这表明它们属于同一个家族,而且E16H具有相同或相似的功能。
E16、TA1被认为是细胞透性酶,与细胞吸收代谢物有关。E16蛋白分子含有六个穿膜区,其氨基端与羧基端都位于细胞内部。这些结构特性与A型的钾离子通道蛋白很相似(J.Biol.Chem.267(16):11267-11273,1992)。根据同源比较,它们与线虫及其它低等生物中的氨基酸透性酶高度同源(Cancer Research 56:5012-5022,1996),这种进化上的同源性提示该蛋白在生物学功能上的重要性。E16基因在成人的各器官中都未检测出有表达,而在各种细胞株系中均有表达,这种广泛的在迅速分裂细胞中存在的表达特性表明E16蛋白和细胞分裂过程直接相关。当外周血淋巴细胞被激活后,E16基因被迅速开启表达,随后其mRNA又被迅速降解,这种特点和外周血淋巴细胞的细胞因子相类似,它们可能都参与了细胞活化后的最早期变化(J.Biol.Chem.267(16):11267-11273,1992)。E16/TA1对外源活化信号的迅速响应为研究细胞生长和分化的调节机制提供了极大的帮助(CancerResearch 55:1152-1159,1995)。TA1基因在胎肝和肝癌细胞中被表达,而在成熟肝细胞中无表达。这种表达模式说明了肝癌细胞未完全分化或非正确表达胚胎抗原的性质。该基因对肝癌形成的具体作用尚在研究之中,但至少可以作为诊断肝癌的标志物之一。在无限扩张的癌细胞中,TA1基因的表达水平被提高至一个较高程度,提示TA1基因可能和癌形成过程,如侵入、代谢物运送、血管形成等的表型特征相关(CancerResearch 55:1152-1159,1995)。另外,E16/TA1被发现在结直肠癌、乳腺癌等癌细胞中表达,猜测其透性酶活力可能帮助癌细胞吸收代谢物质(Cancer Research 56:5012-5022,1996),因此该种基因的研究可以为抗肿瘤治疗提供一条新途径。
与E16、TA1等基因的高度同源性暗示,本发明的E16H与细胞透性有密切联系,而且与癌症细胞也有紧密相关。E16H的过度表达可能是导致癌症的因素之一,和/或是癌症症状的一种标志。
本发明的人E16H除了可作为该家族一员用于进一步的功能研究尤其是癌症方面的研究,还可用于与其他蛋白一起产生融合蛋白,比如与免疫球蛋白一起产生融合蛋白。此外,本发明人E16H还可以与该家族的其他成员进行融合或交换片段,以产生新的蛋白。例如将本发明人E16H的N端与人E16的N端进行交换,以产生新的活性更高或具有新特性的蛋白。
针对本发明人E16H的抗体,用于筛选该家族的其他成员,或者用于亲和纯化相关蛋白(该家族的其他成员,如人E16)。
此外,本发明的人E16H核酸(编码序列或反义序列及其片段)可以被引入细胞,以提高人E16H的表达水平或者抑制人E16H的过度表达。本发明的人E16H蛋白或其活性多肽片段可以施用于病人,以治疗或减轻因人E16H缺失、无功能或异常而导致的有关病症。此外,还可以用基于本发明的核酸序列或抗体进行有关的诊断或预后判断。
实施例3
E16H在大肠杆菌中的表达
在该实施例中,将编码E16H的cDNA序列用对应于该DNA序列的5′和3′端的PCR寡核苷酸引物进行扩增,获得E16H cDNA作为插入片段。
PCR反应中使用的5′寡核苷酸引物序列为:
5′-TTCAGGATCCATGGGGATTGTACAGATAT-3′(SEQ ID NO.5),该引物含有BamHI限制性内切酶的酶切位点,在该酶切位点之后是由起始密码子开始的E16H编码序列的19个核苷酸;
3′端引物序列为:
5’-AGGTGTCGACCTACCACTGCCTGACAAAA-3’(SEQ ID NO.6),该引物含有SalI限制性内切酶的酶切位点、翻译终止子和E16H的部分编码序列。
引物上的限制性内切酶的酶切位点对应于细菌表达载体pQE-9(Qiagen Inc.,Chatsworth,CA)上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr)、一个细菌复制起点(ori)、一个IPTG-可调启动子/操纵子(P/O)、一个核糖体结合位点(RBS)、一个6-组氨酸标记物(6-His)以及限制性内切酶克隆位点。
用BamHI和SalI消化pQE-9载体和插入片段,随后将插入片段连接到pQE-9载体并保持开放读框在细菌RBS起始。随后用连接混合物转化购自Qiagen,商品名为M15/rep4的E.coli菌株,M15/rep4含有多拷贝的质粒pREP4,其表达lacI阻遏物并携带卡那霉素抗性(Kanr)。在含有Amp和Kan的LB培养皿上筛选转化子,抽提质粒,测序验证E16H的cDNA片段已正确插入了载体。
在补加Amp(100μg/ml)和Kan(25μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的阳性转化子克隆。过夜(O/N)培养物以1∶100-1∶250的稀释率稀释,然后接种到大体积培养基中,培养细胞至600光密度(OD600)为0.4-0.6,随后加入IPTG(“异丙基硫代-β-D-半乳糖苷”)至终浓度为1mM。通过使lacI阻遏物失活,IPTG诱导启动P/O导致基因表达水平提高。继续培养细胞3-4小时,随后离心(6000×g,20分钟)。超声裂解包涵体,收集细胞并将细胞沉淀溶于6M的盐酸胍中。澄清后,通过在能使含6-His标记物蛋白紧密结合的条件下,用镍-螯合柱层析从溶液中纯化溶解的E16H。用6M盐酸胍(pH5.0)从柱中洗脱E16H。可用几种方法从盐酸胍中变性沉淀蛋白。首先,使用透析步骤除去盐酸胍,或者从镍-螯合柱中分离出的纯化蛋白可以结合到第二个柱中,该柱中具有递减的线性盐酸胍梯度。在结合到该柱时蛋白质变性,随后用盐酸胍(pH5.0)洗脱。最后,将可溶的蛋白质对含PBS进行透析,然后将蛋白质保存在终浓度为10%(w/v)甘油的贮存液中。
用12%的SDS-PAGE胶进行电泳,鉴定表达蛋白的分子量大小为约42KDa。
此外,用常规方法对表达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与SEQ ID NO.4的序列一致。
实施例4
E16H在真核细胞(CHO细胞株)中的表达
在该实施例中,将在实施例1中获得的片段用对应于该DNA序列的5′和3′端的PCR寡核苷酸引物进行扩增,获得E16H cDNA作为插入片段。
PCR反应中使用的5′寡核苷酸引物序列为:
5′-TTCAGGATCCATGGGGATTGTACAGATAT-3′(SEQ ID NO.5)
该引物含有BamHI限制性内切酶的酶切位点,在该酶切位点之后是由起始密码子开始的E16H编码序列的19个核苷酸;
3′端引物序列为:
5’-AGTCGGATCCCTACCACTGCCTGACAAAA-3’(SEQ ID NO.7)
该引物含有BamHI限制性内切酶的酶切位点、一个翻译终止子和E16H的部分编码序列。
引物上的限制性内切酶的酶切位点对应于CHO细胞表达载体pcDNA3上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr和Neor)、一个噬菌体复制起点(f1 ori)、一个病毒复制起点(SV40 ori)、一个T7启动子、一个病毒启动子(P-CMV)、一个Sp6启动子、一个SV40启动子、一个SV40加尾信号和相应的polyA顺序、一个BGH加尾信号和相应的polyA顺序。
用BamHI消化pcDNA3载体和插入片段,随后将插入片段连接到pcDNA3载体。随后用连接混合物转化E.coli DH5α菌株。在含有Amp的LB培养皿上筛选转化子,在补加Amp(100μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的克隆。抽提质粒,用KpnI酶切鉴定插入片段大小及方向,并测序验证E16H的cDNA片段已正确插入了载体。
质粒转染是采用脂转染法,用Lipofectin试剂盒(GiBco Life)进行的。转染48小时后,经2-3周的持续G418加压筛选,收集细胞及细胞上清测定表达蛋白酶活力。去G418,连续传代培养;对混合克隆细胞极限稀释,选择具有较高蛋白活性的细胞亚克隆。按常规方法大量培养上述阳性亚克隆。48小时后,开始收集细胞及上清,用超声裂解方法破碎细胞。以含0.05%Triton的50mMTris·HCl(pH7.6)溶液为平衡液及洗脱液,用经预平衡的Superdex G-75柱收集上述蛋白的活性峰。再用50mMTris·HCl(pH8.0)平衡的DEAE-Sepharose柱,以含0-1M NaCl的50mMTris.HCl(pH8.0)溶液为洗脱液进行梯度洗脱,收集上述蛋白的活性峰。然后以PBS(pH7.4)为透析液对表达蛋白溶液进行透析。最后冻干保存。
用12%的SDS-PAGE胶进行电泳,鉴定表达蛋白的分子量大小为42KDa。
此外,用常规方法对表达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与SEQ ID NO.4的序列一致。
实施例5
制备抗体
将实施例3和4获得的重组蛋白用来免疫动物以产生抗体,具体如下。重组分子用层析法进行分离备用。也可用SDS-PAGE凝胶电泳法进行分离,将电泳条带从凝胶中切下,并用等体积的完全Freund’s佐剂乳化。用50-100μg/0.2ml乳化过的蛋白,对小鼠进行腹膜内注射。14天后,用非完全Freund’s佐剂乳化的同样抗原对小鼠以50-100μg/0.2ml的剂量进行腹膜内注射以加强免疫。每隔14天进行一次加强免疫,至少进行三次。获得的抗血清的特异反应活性用它在体外沉淀人E16H基因翻译产物的能力加以评估。结果发现,抗体可特异性地与本发明蛋白特异性地发生沉淀。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
                     序列表(1)一般信息:(i)申请人:上海新黄浦复旦基因工程有限公司(ii)发明名称:一种新的人基因序列、其编码的多肽及制法和用途(iii)序列数目:7(2)SEQ ID NO:l的信息(i)序列特征
(A)长度:24碱基
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(ii)分子类型:寡核苷酸(xi)序列描述:SEQ ID NO:1CTGCCAATCT GCTTATTGCT CCTC              24(2)SEQ ID NO:2的信息(i)序列特征
(A)长度:23碱基
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(ii)分子类型:寡核苷酸(xi)序列描述:SEQ ID NO:2TCTCACCACC CACACCAAAG TCC               23(2)SEQ ID NO.3的信息:(i)序列特征
    (A)长度:1273bp
    (B)类型:核酸
    (C)链性:单链
    (D)拓扑结构:线性
  (ii)分子类型:cDNA
  (xi)序列描述:SEQ ID NO.3CTGCCAATCT GCTTATTGCT CCTCACATGG GTCAACTGTT CCAGTGTGCG GTGGGCCACC 60CGGGTTCAAG ACATCTTCAC AGTCGGGAAG CTCCTGGCCT TGGCCCTGAT TATCATCATG 120GGGATTGTAC AGATATGCAA AGGAGAGTAC TTCTGGCTGG AGCCAAAGAA TGCATTTGAG 180AATTTCCAGG AACTCGACAT CGGCCTCGTC GCACTGGCTT TCCTTCAGGG CTCCTTTGCC 240TATGGAGGCT GGAACTTTCT GAATTACGTG ACTGAGGAGC TTGTTGATCC CTACAAGAAC 300CTTCCCAGAG CCATCTTCAT CTCCATCCCA CTGGTCACAT TTGTGTATGT CTTTGCCAAT 360GTCGCTTATG TCACTGCAAT GTCCCCCCAG GAGCTGCTGG CATCGAACGC CGTCGCTGTG 420ACTTTTGGAG AGAAGCTCCT AGGAGTCATG GCCTGGATCA TGCCCATTTC TGTTGCCCTG 480TCCACATTTG GAGGAGTTAA TGGGTCTCTC TTCCACCTCC TCTCGGCTGT TCTTCGCTGG 540AGCCCGAGAG GCACCCTTCC CAGTGTGTTG GCCATGATCC ACGTGAAGCG CTGCACCCCA 600ATCCCAGCCC TGCTCTTCAC ATGCATCTCC ACCCTGCTGA TGCTGGTCAC CAGCGACATG 660TACACACTCA TCAACTACGT GGGCTTCATC AACTACCTCT TCTATGGGGT CACGGTTGCT 720GGACAGATAG TCCTTCGCTG GAAGAAGCCT GATATCCCCC GCCCCATCAA GATCAACCTG 780CTGTTCCCCA TCATCTACTT GCTGTTCTGG GCCTTCCTGC TGGTCTTCAG CCTGTGGTCA 840GAGCCGGTGG TGTGTGGCAT TGGCCTGGCC ATCATGCTGA CAGGAGTGCC TGTCTATTTC 900CTGGGTGTTT ACTGGCAACA CAAGCCCAAG TGTTTCAGTG ACTTCATTGA GCTGCTAACC 960CTGGTGAGCC AGAAGATGTG TGTGGTCGTG TACCCCGAGG TGGAGCGGGG CTCAGGGACA 1020GAGGAGGCTA ATGAGGACAT GGAGGAGCAG CAGCAGCCCA TGTACCAACC CACTCCCACG 1080AAGGACAAGG ACGTGGGCGG GGCAGCCCCA GCCCTTGAGG GACCACCATT TCCCTGGGCT 1140ACTTTCTTCC TTTCCTTCCC CTTTTTATTC CTACCTCCCT GCCTTTGGGT CCTGCCAAAC 1200ACATGCGAGT ACACACACAC CCCTCTCTCT GCTTTTGTCA GGCAGTGGTA GGACTTTGGT 1260GTGGGTGGTG AGA                                                    1273
(2)SEQ ID NO.4的信息:
  (i)序列特征
    (A)长度:377个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ii)分子类型:多肽
(xi)序列描述:SEQ ID NO.4Met Gly Ile Val Gln Ile Cys Lys Gly Glu Tyr Phe Trp Leu Glu 15Pro Lys Asn Ala Phe Glu Asn Phe Gln Glu Leu Asp Ile Gly Leu 30Val Ala Leu Ala Phe Leu Gln Gly Ser Phe Ala Tyr Gly Gly Trp 45Asn Phe Leu Asn Tyr Val Thr Glu Glu Leu Val AsD Pro Tyr Lys 60Asn Leu Pr0 Arg Ala Ile Phe Ile Ser Ile Pro Leu Val Thr Phe 75Val Tyr Val Phe Ala Asn Val Ala Tyr Val Thr Ala Met Ser Pro 90Gln Glu Leu Leu Ala Ser Asn Ala Val Ala Val Thr Phe Gly Glu 105Lys Leu Leu Gly Val Met Ala Trp Ile Met Pro Ile Ser Val Ala 120Leu Ser Thr Phe Gly Gly Val Asn Gly Ser Leu Phe His Leu Leu 135Ser Ala Val Leu Arg Trp Ser Pro Arg Gly Thr Leu Pro Ser Val 150Leu Ala Met Ile His Val Lys Arg Cys Thr Pro Ile Pro Ala Leu 165Leu Phe Thr Cys Ile Ser Thr Leu Leu Met Leu Val Thr Ser Asp 180Met Tyr Thr Leu Ile Ash Tyr Val Gly Phe Ile Asn Tyr Leu Phe 195Tyr Gly Val Thr Val Ala Gly Gln Ile Val Leu Arg Trp Lys Lys 210Pro Asp Ile Pro Arg Pro Ile Lys Ile Asn Leu Leu Phe Pro Ile 225Ile Tyr Leu Leu Phe Trp Ala Phe Leu Leu Val Phe Ser Leu Trp 240Ser Glu Pro Val Val Cys Gly Ile Gly Leu Ala Ile Met Leu Thr 255Gly Val Pro Val Tyr Phe Leu Gly Val Tyr Trp Gln His Lys Pro 270Lys Cys Phe Ser AsD Phe Ile Glu Leu Leu Thr Leu Val Ser Gln 285Lys Met Cys Val Val Val Tyr Pro Glu Val Glu Arg Gly Ser Gly 300Thr Glu Glu Ala Asn Glu Asp Met Glu Glu Gln Gln Gln Pro Met 315Tyr Gln Pro Thr Pro Thr Lys Asp Lys Asp Val Gly Gly Ala Ala 330Pro Ala Leu Glu Gly Pro Pro Phe Pro Trp Ala Thr Phe Phe Leu 345Ser Phe Pro Phe Leu Phe Leu Pro Pro Cys Leu Trp Val Leu Pro 360Asn Thr Cys Glu Tyr Thr His Thr Pro Leu Ser Ala Phe Val Arg 375Gln Trp                                                     377(2)SEQ ID NO:5的信息 (i)序列特征
(A)长度:29碱基
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(ii)分子类型:寡核苷酸(xi)序列描述:SEQ ID NO:5TTCAGGATCC ATGGGGATTG TACAGATAT             29(2)SEQ ID NO:6的信息(i)序列特征
(A)长度:29碱基
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(ii)分子类型:寡核苷酸(xi)序列描述:SEQ ID NO:6AGGTGTCGAC CTACCACTGC CTGACAAAA             29(2)SEQ ID NO:7的信息(i)序列特征
(A)长度:29碱基
(B)类型:核酸
(C)链性:单链
(D)拓扑结构:线性(ii)分子类型:寡核苷酸(xi)序列描述:SEQ ID NO:7AGTCGGATCC CTACCACTGC CTGACAAAA             29

Claims (14)

1.一种分离出的DNA分子,其特征在于,它包括:编码具有人E16H蛋白活性的多肽的核苷酸序列,
所述的核苷酸序列与SEQ ID NO.3中从核苷酸118-1251位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.3中从核苷酸118-1251位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码一多肽,该多肽具有SEQ ID NO.4所示的序列。
3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQ ID NO.3中从核苷酸118-1251位的序列。
4.一种分离的E16H蛋白多肽,其特征在于,它包括:具有SEQ ID NO.4氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQ ID NO.4序列的多肽。
6.一种载体,其特征在于,它含有权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞。
8.如权利要求7所述的宿主细胞,其特征在于,该细胞是大肠杆菌。
9.如权利要求7所述的宿主细胞,其特征在于,该细胞是真核细胞。
10.一种产生具有E16H蛋白活性的多肽的方法,其特征在于,该方法包括:
(a)将编码具有E16H蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成E16H蛋白表达载体,所述的核苷酸序列与SEQ ID NO.3中从核苷酸118-1251位的核苷酸序列有至少70%的同源性;
(b)将步骤(a)中的表达载体转入宿主细胞,形成E16H蛋白的重组细胞;
(c)在适合表达E16H蛋白多肽的条件下,培养步骤(b)中的重组细胞;
(d)分离出具有E16H蛋白活性的多肽。
11.如权利要求10所述的方法,其特征在于,该序列为SEQ ID NO.3中从核苷酸118-1251位。
12.一种能与权利要求4所述的E16H蛋白多肽特异性结合的抗体。
13.一种核苷酸分子,其特征在于,它是权利要求1所述DNA分子的反义序列。
14.一种探针分子,其特征在于,它含有权利要求1所述的DNA分子中约8-100个连续核苷酸。
CN98121960A 1998-10-22 1998-10-22 一种新的人基因序列、其编码的多肽及制法和用途 Pending CN1252446A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN98121960A CN1252446A (zh) 1998-10-22 1998-10-22 一种新的人基因序列、其编码的多肽及制法和用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN98121960A CN1252446A (zh) 1998-10-22 1998-10-22 一种新的人基因序列、其编码的多肽及制法和用途

Publications (1)

Publication Number Publication Date
CN1252446A true CN1252446A (zh) 2000-05-10

Family

ID=5227450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98121960A Pending CN1252446A (zh) 1998-10-22 1998-10-22 一种新的人基因序列、其编码的多肽及制法和用途

Country Status (1)

Country Link
CN (1) CN1252446A (zh)

Similar Documents

Publication Publication Date Title
CN1128878C (zh) 人甲硫氨酸亚砜还原酶编码序列、其编码的多肽及制备方法
CN1252446A (zh) 一种新的人基因序列、其编码的多肽及制法和用途
CN1132939C (zh) 一种新的焦磷酸合成酶编码序列、其编码的多肽及制备方法
CN1249347A (zh) 新的人钙调磷酸化酶调节亚基、其编码序列及制备方法
CN1125177C (zh) 人短链醇脱氢酶编码序列、其编码的多肽及制备方法
CN1125178C (zh) 人丝氨酸/苏氨酸激酶ⅱ编码序列、其编码的多肽及制备方法
CN1277259A (zh) 晚期胚胎丰富蛋白的同源蛋白及其编码序列
CN1251860A (zh) 一种新的人基因序列、其编码的多肽及制法和用途
CN1249345A (zh) 一种新的人基因编码序列、其编码的多肽及制备方法
CN1261102A (zh) 新的人纺锤素蛋白及其编码序列,及制法和用途
CN1248624A (zh) 新的人衣被蛋白亚基编码序列、其编码的多肽及制备方法
CN1249342A (zh) 人磷脂酰乙醇胺-n-甲基转移酶、其编码序列及制备方法
CN1264739A (zh) 新的人蛋白及其编码序列,以及制法和用途
CN1250097A (zh) 一种新的人基因编码序列、其编码的多肽及制法
CN1253180A (zh) 新的人神经内分泌特异性蛋白和编码序列、及制法和用途
CN1246532A (zh) 人热休克关联蛋白编码序列、其编码的多肽及制备方法
CN1257921A (zh) 新的人黑素瘤生长相关因子及其编码序列,及制法和用途
CN1274755A (zh) 人蛋白激酶抑制因子ⅱ及其编码序列,及其制法和用途
CN1287169A (zh) 新的人g蛋白亚基及其编码序列
CN1279290A (zh) 人信号识别颗粒受体β及其编码序列,以及制法和用途
CN1278557A (zh) 人蛋白激酶抑制因子γ及其编码序列、以及制法和用途
CN1277260A (zh) 一种人肌动蛋白相关蛋白亚基及其编码序列
CN1275621A (zh) 人λ晶状体蛋白及其编码序列,以及制法和用途
CN1252448A (zh) 人肌动蛋白相关蛋白基因、其编码的多肽及制法和用途
CN1251861A (zh) 人t细胞活化蛋白基因、其编码的多肽及制法和用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication