CN101161676A - 抑制hiv复制的突变型apobec3g分子及其应用 - Google Patents

抑制hiv复制的突变型apobec3g分子及其应用 Download PDF

Info

Publication number
CN101161676A
CN101161676A CNA2006100967034A CN200610096703A CN101161676A CN 101161676 A CN101161676 A CN 101161676A CN A2006100967034 A CNA2006100967034 A CN A2006100967034A CN 200610096703 A CN200610096703 A CN 200610096703A CN 101161676 A CN101161676 A CN 101161676A
Authority
CN
China
Prior art keywords
arg
leu
lys
phe
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006100967034A
Other languages
English (en)
Inventor
许弘展
石军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shi Xu Biological Medicine Technology (shanghai) Co Ltd
Original Assignee
Shi Xu Biological Medicine Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shi Xu Biological Medicine Technology (shanghai) Co Ltd filed Critical Shi Xu Biological Medicine Technology (shanghai) Co Ltd
Priority to CNA2006100967034A priority Critical patent/CN101161676A/zh
Publication of CN101161676A publication Critical patent/CN101161676A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了一种抑制HIV复制的突变型APOBEC3G分子及其应用。该突变型APOBEC3G分子是由为(a)或(b)表示的蛋白质:(a)由SEQIDNo.2、4、6或8所示的氨基酸序列组成的蛋白质;(b)在(a)中的氨基酸序列至少有一个或多个氨基酸替代,同时第129位的替代为D或F或其他的除了P以外的氨基酸,且能抵抗HIV-Vif引发的蛋白酶降解的由(a)衍生的蛋白质。本发明还公开了编码所述蛋白质的核苷酸序列,及其表达载体、转化体,所述蛋白质的特异性抗体,以及它们在制备抗HIV病毒药物中的应用。

Description

抑制HIV复制的突变型APOBEC3G分子及其应用
技术领域
本发明属于生物工程领域,涉及一种抑制HIV复制的突变型APOBEC3G分子及其应用。
背景技术
阿朴脂蛋白B mRNA编辑的酶催化多肽类3G(APOBEC3G,A3G),最初被确定为CEM15,是一种具有很强的抗病毒活性的宿主细胞蛋白(Sheehy et al.,2002)。在新合成的负链DNA中,脱氨基脱氧胞苷(dC)转变为脱氧尿苷(dU),引起病毒正链DNA的G到A的超突变,从而抑制多种逆转录酶病毒感染,参见Harris et al.《细胞》.113(6),803-809(2003)。
APOBEC3G基因是胞啶脱氧酶基因家族的一员。它是在基因簇中发现的七种相关基因或假基因之一,被认为是染色体22上的基因复制的结果。蛋白质被认为可能是RNA编译的酶,可促进生长或进行细胞周期控制。该基因编码的蛋白质已被发现在缺乏病毒体感染因子(Vifs)的情况下,能对人体免疫缺陷病毒-1(HIV-1)和一些猿免疫缺陷病毒感染进行特效的抑制。
人们已知HIV-1病毒体感染因子(Vif)保护病毒的复制免受诱使HIV-1基因组超变异的宿主限制因子的影响。参见Lecossier et al.,《科学》300,1112(2003);Mangeat et al.,《自然》424,99-103(2003);Zhang et al.,《自然》424,94-98(2003);Harris et al.,《细胞》113,803-809(2003)。病毒体感染因子粘结在APOBEC3G上,促使其迅速降解,这样,就将它从细胞中清除出去,并防止它进入HIV-1病毒体。Vif包含两个域,一个粘结在APOBEC3G上,另一个带有保守的SLQ(Y/F)LA基序,可以通过以蛋白酶依赖的方式,调节APOBEC3G的降解。参见Kabat et al.,美国专利出版号2004/0234956.
最近的研究显示,在人类和非洲绿猴的第128位上的单氨基酸变化,控制着这些蛋白质对Vif引介的病毒特异性的抑制。参见Mangeat et al.,J.Biol Chem.2004年4月9日;279(15):14481-3.Epub 2004年2月13日。此外,Vif对APOBEC3G的种类特异性,经证明是由第128位的单氨基酸变化决定的。参见Schrofelbauer et al.,Proc Natl Acad SciU S A.2004年3月16日;101(11):3927-32。Epub 2004年2月20日。虽然进行了这些研究及其它一些针对第128位的交换的研究,但是通过转变其它氨基酸来抑制降解,从而减少APOBEC3G的结合或抑制,这方面的努力并没能清楚地阐明。
对于Vif人们已经知道了很多,它与APOBEC3G相结合,促发了APOBEC3G的多泛素化和快速降解。参见Navarro and Landau,Curr Opin Immunol.2004年8月;16(4):477-82.人类免疫细胞拥有一个内在的机制,可以潜在地阻止诸如HIV-1等的逆转录酶病毒的复制。这个保护机制以APOBEC3G为中心,进入到病毒体中,最终能中止HIV完成一个生命周期。然而,HIV-1具有一种可专门抑制APOBEC3G活性的蛋白Vif。Vif是通过对细胞内APOBEC3G的储藏损耗来抑制其活性的,因此,使得这种抗病毒酶无法进入出芽的病毒体。APOBEC3G损耗包括通过Vif补充一种特殊的E3连接酶复合物,促使这种酶的多泛素化、及蛋白酶介导的这种酶的降解来实现。APOBEC3G的有效活性使得人们将浓厚的兴趣投在发现能中断Vif引发的降解过程的小分子上面。参见Stopak and Greene,Curr Opin Investig Drugs.2005年2月;6(2):141-7。
相应地,抑制Vif引发的APOBEC3G降解过程以及研制出抑制HIV复制的方法的需求也存在着。因此,人们需要的是一个蛋白分子,它可以抵抗Vif引发的降解,从而防止HIV-1和/或HIV-2的感染。
发明内容
本发明的目的是提供一种能够抑制HIV复制的突变型APOBEC3G分子。
本发明另一个目的是提供上述突变型APOBEC3G分子在制备抗HIV病毒药物中的应用。
本发明的目的是通过下列技术措施来实现的:
一种突变型人类APOBEC3G蛋白质,该蛋白质为(a)或(b):
(a).由SEQ ID No.2、4、6或8所示的氨基酸序列组成的蛋白质;
(b).在(a)中的氨基酸序列至少有一个或多个氨基酸替代,同时第129位的替代为D或F或其他的除了P以外的氨基酸,且能抵抗HIV-Vif引发的蛋白酶降解的由(a)衍生的蛋白质。
编码上述突变型人类APOBEC3G蛋白质的核苷酸。
所述的核苷酸,该核苷酸是(a)或(b):
(a).序列为SEQ ID No.1、3、5或7的核苷酸;
(b).在严格条件下与(a)限定的DNA核苷酸序列杂交且编码具有抵抗HIV-Vif引发的蛋白酶降解功能的变异的APOBEC3G蛋白质的核苷酸。
含有上述核苷酸的表达载体。
含有上述核苷酸的重组宿主细胞。
上述蛋白质的特异性抗体。
含有有效治疗剂量的上述蛋白质、核苷酸、表达载体、重组宿主细胞或特异性抗体的药物。
含有上述蛋白质、核苷酸、表达载体、重组宿主细胞或特异性抗体的试剂盒。
上述的突变型人类APOBEC3G蛋白质在制备抗HIV病毒药物中的应用。
上述的核苷酸在制备抗HIV病毒药物中的应用。
名词术语解释:
除非本文另有定义,与本发明相关的科技术语应采用业内具有普通技能者一般理解的含义。此外,除非在特定环境下另有要求,单数的术语应包含复数含义,复数的术语应包含单数含义。通常,本文中所述的与生物化学、酶学、分子和细胞生物学、微生物学、基因学、蛋白质、核酸化学及杂交相关的术语及技术在业内是众所周知和普遍使用着的。本发明中的方法和技术一般依据业内知名的常规方法及在现有规范中引用和讨论过的各种通用的或更加专业的参考文献中所描述的执行,除非另有说明。参见例如:Sambrook et al.《分子克隆法:实验室指南》,第二版,冷泉港实验室出版社,纽约冷泉港(1989);Ausubel et al.,《分子生物学现行草案》,Greene Publishing Associates(1992,及2002年增刊);Harlow and Lane,《抗体:实验室指南》,冷泉港实验室出版社,冷泉港,纽约(1990);Taylor and Drickamer,《糖生物学介绍》,牛津大学出版社(2003);《Worthington酶指南》,Worthington生化公司,Freehold,新泽西州;《生化便览:第一节蛋白质》,卷一,CRC出版社(1976);《生化便览:第一节蛋白质》,卷二,CRC出版社(1976);《糖生物学基础》,冷泉港实验室出版社(1999)。
本文所提及的所有的出版物、专利和其它参考文献都纳入本文作为全文参考。
以下的术语,除非另有说明,应理解为具有以下的含义:
术语“多聚核苷酸”或“核苷酸分子”指多聚体形式的核苷酸,长度为至少10个碱基。该术语包括DNA分子(例如:cDNA、或基因组、或合成的DNA)及RNA分子(例如:mRNA或合成的RNA),及含有非天然核苷相似体、非天然核苷酸间键合、或同时含有两者的DNA或RNA的相似体。核酸可以是任何拓朴结构的。比方说:核酸可以是单链、双链、三链、四链、部分双链、枝形、簪形、环形或U形的构造。
除非另有说明,“含有序列标识号:X的核酸”指一种核酸,它至少有一部分或者是(i)序列标识号:X序列,或者是(ii)序列标识号:X的互补序列。对于两者的选择视具体情况而定。例如:如果核酸作为探针使用,那么对于两者的选择由探针对理想目标的互补需要决定。
一个“孤立的”或“近乎纯粹的”核酸或多核苷酸(例如:RNA,DNA或混合的聚合体)是与其它的细胞成分显著分离的,在其宿主细胞内,天然伴生着天然多核苷酸,例如:与其有着天然关联的核糖体、聚合酶和基因组序列等。该术语包含核酸或多核苷酸,其(1)已经远离了天然存在的环境,(2)与多核苷酸的整体或部分没有联系,从本质上看是“孤立的多核苷酸”,(3)与天然不相联系的多核苷酸有效联接着,或(4)不会天然的存在。术语“孤立的”或“近乎纯粹的”还可以用在重组细胞或克隆DNA的分离上、用化学方法合成的多核苷酸相似体、或可通过异质系统进行生物合成的多核苷酸相似体上。
然而,“孤立的”不特别要求上述的核酸或多核苷酸本身从其天然环境中分离出来。例如:如果异源序列的位置邻近内生的核酸序列,那么生物体基因组中内生的核酸序列被认为是内在的“孤立的”,这样,内生的核酸序列的表达就改变了。在这种情况下,不管异源序列本身是否是内生的(起源于同一宿主细胞或其子代),或外生的(起源于不同的宿主细胞或子代)。异源序列不是天然性地邻近内生核酸序列的。举例来说,启动子序列可以用来替换(例如:通过同源重组)宿主细胞基因组中的基因的天然启动子,这样,这个基因就有了一个改变了的表达方式。这个基因由于至少从与其天然相邻的一些序列中分离开来,现在变为“孤立的”。
核酸如果包含了一些相对于基因组中的相应核酸是非天然性的修饰,那么也被视为是“孤立的”。例如:内生的编码序列如果包含插入、删除、或人工介导的点突变,例如:通过人为的干涉,那么被认为是“孤立的”。“孤立的核酸”还包括在异源位点与宿主细胞染色体结合起来的核酸,及结构显现为游离体的核酸。此外,当采用重组技术制造时,“孤立的核酸”可以充分地脱离于其它的细胞物质,或充分地脱离培养基,或当使用化学法合成时,可以充分地脱离于化学前体或其它化学物。
按照本文的用法,短语“简并变异体”,在参照核酸序列中,依据标准遗传密码,包含可以转译的核酸序列,以提供与参照核酸序列的转译结果相同的氨基酸序列。术语“简并寡核苷酸”或“简并引物”用来表示能够与目标核酸序列相杂交的寡核苷酸,序列不必是相同的,但是对于一个或更多的特定的片段,应是彼此同源的。
在核酸序列的情况下,术语“百分比序列匹配率”或“一致的”指在最大化对应状态下相同的两个序列的残基。序列匹配率比对的长度可以是至少大约9个核苷的长度,通常为至少大约20个核苷,更常见的是至少大约24个核苷,典型地,至少大约28个核苷,更为典型地,至少大约32个核苷,适宜地,至少大约36个或更多的核苷。在技术上已经知道了一些不同的运算法则,可以用来测量核苷酸序列匹配率。例如:多核苷酸序列可以采用FASTA,Gap或Bestfit进行比对,这些程序采用位于威斯康星州麦迪逊市的遗传学计算机集团(GCG)的Wisconsin Package 10.0版本编写而成。FASTA提供了查询与检索序列间的最佳交叠区域的对准和百分比序列匹配率。参见Pearson,Methods Enzymol.183:63-98(1990)(引入本文作为全文参考)。例如:核酸序列之间的百分比序列匹配率可以使用带有缺省参数的FASTA进行测定(单词长度为6及计分矩阵的NOPAM因子),或使用带有GCG6.1版所提供的缺省参数的Gap,引入本文以备参考。序列的比对还可以选择性地使用计算机程序BLAST(参见Altschul et al.,J.Mol.Biol.215:403-410(1990);Gish and States,Nature Genet.3:266-272(1993);Madden et al.,Meth.Enzymol.266:131-141(1996);Altschul et al.,Nucleic Acids Res.25:3389-3402(1997);Zhang and Madden,Genome Res.7:649-656(1997)),特别地,blastp或tblastn(Altschul etal.,Nucleic Acids Res.25:3389-3402(1997))。
术语“实质的同源”或“实质的相似”,当涉及核酸或核酸片段时,表示,当用适宜的核苷插入或删除来调整到最佳状态时,与另一个核酸(或它的互补链)间,根据使用任何一种著名的序列匹配率运算法则测量所得,例如上文讨论的FASTA,BLAST或Gap,核酸序列匹配率为至少大约90%,更适宜的为95%,通常至少大约96%,更常见的,至少大约80%,适宜的,至少大约90%,而更适宜的,至少大约95%,96%,97%,98%或99%。
或者,当一个核酸或核酸片段与另一个核酸、另一个核酸的链、或互补链进行杂交时,在严格的杂交状态下,存在着实质的同源或相似。在核酸杂交试验条件下,“严格的杂交状态”和“严格的洗涤状态”依赖于多个不同的物理参数。核酸杂交会受到诸如含盐浓度、温度、溶剂、杂交品种的碱基组成、互补区域长度、及杂交的核酸之间的核苷碱基错配等的多种条件的影响,业内技术娴熟者可以轻易地发现这些问题。业内具有普通技能的人知道怎样来改变这些参数,以实现特定的杂交严格度。
一般来说,对于一组特殊条件下的特定的DNA杂交,“严格的杂交”在大约25℃的热熔点(Tm)以下执行。对于一组特殊条件下的特定DNA杂交,“严格的洗涤”在大约5℃低于Tm的温度范围内执行。在Tm这一温度下,50%的目标序列与完美匹配的探针进行杂交。参见Sambrook et al.,《分子克隆法:实验室指南》第二版,冷泉港实验室出版社,纽约冷泉港(1989),第9.51页,引入本文以备参考。为实现文中所述目的,“严格的条件”定义为溶液相杂交,例如水相杂交,(即:不含甲酰胺),溶液为6XSSC(20X SSC含3.0M氯化钠和0.3M柠檬酸钠),1%SDS在65℃时放置8-12小时,接着采用两种洗涤剂,为0.2X SSC,0.1%SDS在65℃时放置20分钟。娴熟的技术工人会发现,杂交在65℃时发生,杂交的速率是不同的,取决于杂交序列的长度和百分比匹配率等多项因素。
本发明中的核酸(也指多核苷酸)可以同时包括RNA、cDNA、基因组DNA的正义链和反义链、及它们的合成形态及混合态聚合体。它们可以通过化学或生化方法进行修饰,或包含非天然的或衍生的核苷碱基,业内技术娴熟者可以轻易地发现它们。上述的修饰包括,例如:一个或多个天然生成的带有相似物的核苷酸的示踪、甲基化、及替换,及寡核苷酸修饰,例如:无电荷联接(如甲基膦酸酯、phosphotriesters,phosphoramidates,氨基甲酸盐等)、电荷联接(如phosphorothioates,phosphorodithioates等)、未定部分(如多肽)、插层剂(如吖啶、补骨脂素等)、整合剂、烷基类、及经过修饰的联接(如α-异构核酸等),还包括能够模仿多核苷酸,通过氢键结合及其它化学反应,与指定序列相结合的合成分子。这些分子是业内已知的,包括例如:在分子骨架上,用肽键替换了磷酸盐键的那些分子。其它的修饰包括例如:相似物,其核糖环含有桥层部分或其它的诸如在“锁定”核酸中发现的修饰结构。
术语“变异的”,当应用于核酸序列时,指核酸序列中的核苷,与参照核酸序列相对照,可以是插入、删除或改变的。单独的改变可以是在一个位点(点突变),或多个核苷在单一的位点被插入、删除或改变。此外,一个或多个改变可以在核酸序列内的任何数量的位点上发生。核酸序列可以采用业内任何已知的方法进行转变,包括但不限于突变形成技术如“错误倾向PCR”(在DNA聚合酶的复制保真度低的条件下,执行PCR的过程,因此,延PCR产品全长可获取高的点突变率;参见:例如Leung et al.,《技术》,1:11-15(1989),和Caldwell and Joyce,《PCR方法应用》.2:28-33(1992));及“寡核苷酸引导的突变”(能使任何克隆的DNA目的片段上发生位点特异性突变的过程;参见:例如Reidhaar-Olson and Sauer,《科学》241:53-57(1988))。
术语“载体”在本文中指一个核酸分子能够将另一个核酸运送到其联接区。一类载体是“质粒”,指环状双链DNA环,上面可以接入额外的DNA片段。其它载体包括cosmids、细菌染色体(BAC)和酵母人工染色体(YAC)。另一类载体是病毒载体,在上面可以接入额外的DNA片段,运送到病毒基因组内(下文详细论述)。特定的载体可以在它们引介的宿主细胞上自行复制(例如:具有复制起点的载体在宿主细胞内进行复制)。其它载体在引介进入宿主细胞后,可以与宿主细胞的基因组相结合,随后,与宿主基因组一起被复制。此外,特定的优选载体能够指导其有效联接着的基因的表达。这些载体在本文中指“重组表达载体”(或者简言之,“表达载体”)。此外,表达载体可以包括额外的元素。例如:表达载体可以具有两个复制系统,使它得以在两个生物体中维持,例如在哺乳动物或昆虫细胞内的表达,及在原核宿主内的克隆与扩增。此外,对于表达载体的结合,表达载体包含至少一个与宿主细胞基因组同源的序列,更为适宜的是位于表达结构侧面的两个同源序列。结合的载体可能通过选择与载体内物质相适宜的同源序列,被引介至宿主细胞内的特定的位点。结合的载体的结构是业内所熟知的。一个可供模仿的表达载体系统是逆转录病毒载体,如在PCT/US97/01019和PCT/US97/01048中所概述的,两者均引入本文中以备参考。结构的描述还可参见美国专利第6,153,380号。
正如文中所使用的,术语“APOBEC3G”,是阿朴脂蛋白B mRNA编辑的酶催化多肽类3G的简称,在文中定义为人类蛋白质,通过侵入病毒和破坏病毒的基因物质,可以抑制HIV的复制。病毒蛋白Vif可以从两种途径中断上述过程:(1)通过粘合到APOBEC3G上,防止其侵入病毒;及(2)靶向作用APOBEC3G加以破坏,几乎可以将其从细胞中消除干净。
术语“标记序列”或“标记基因”指能够表达活动的核酸序列,可以对宿主细胞内的存在或缺乏的序列做出正或负的选择。标记序列或基因无需同时显示正选择和负选择。表达载体可以包含一个可选的标记基因,以对转化的宿主细胞进行选择。选择基因是业内熟知的,会随着使用的宿主细胞的不同而变化。
“有效连锁的”表达控制序列指这样的连锁,它的表达控制序列紧邻目的基因,并控制目的基因,同时表达控制基因在转化中发挥作用,或在远处控制目的基因。
本文中使用的术语“表达控制序列”指多核苷酸序列,这些序列对于其有效连锁的编码序列的表达极为重要。表达控制序列是可以控制转录、转录后事件、及核酸序列转译的序列。表达控制序列包括适宜的转录起始、终止、启动子和增强子序列;有效的RNA处理信号如剪接和多聚腺苷化信号;稳定细胞质mRNA的序列;增强转译效率的序列(如核糖体粘合位点);增强蛋白质稳定性的序列;以及需要时,增强蛋白分泌的序列。此类控制序列的性质依宿主生物体而有所不同;在原核生物中,此类控制序列通常包括启动子、核糖体结合位点、及转录终止序列。术语“控制序列”希望至少包括所有的其存在对表达至关重要的成分,还可以包括额外的、其存在是有利的成分,例如:前导序列和融合伴侣序列。通常,转录与转译调控序列可以包括但不限于启动子序列、核糖结合位点、转录起始与终止序列、转译起始与终止序列、及增强子或激活子序列。举一个具体的例子:调控序列包括启动子和转录起始与终止序列。启动子序列对组成型启动子或诱导型启动子进行编码。启动子可以是自然存在的启动子或杂交启动子。杂交启动子,结合了超过一个启动子的元素,也是业内所熟知的,并且对于现有的发明是有用的。
本文中使用的术语“重组宿主细胞”(或简称“宿主细胞”)指一个已经将目的基因引介到重组载体内的细胞。对这些术语应理解为,细胞不仅指特定的主体细胞,而且指此细胞的后代。因为由于突变或环境影响,特定的修饰可能在后代出现,而事实上,这样的后代与祖细胞是不相同的,但是还包含在本文中使用的术语“宿主细胞”的范围之内。重组宿主细胞可以是在培养基中生长的孤立的细胞或细胞系,也可以是在活组织或生物体内存在的细胞。
本文中使用的术语“肽”指短多肽,例如:典型地小于大约50个氨基酸长、及更为典型地,小于大约30个氨基酸长的多肽。本文中使用的该术语包括相似体以及模仿结构和生物性功能的模拟物。
术语“多肽”同时包括自然存在的和非自然存在的蛋白质、和片段、突变体、衍生物及其相似体。
例如:保守的氨基酸修饰可以完成,虽然这些修饰会改变蛋白质或肽的一级序列,但是通常不改变其功能。保守的氨基酸替换典型地包括在以下群内的替换:氨基乙酸、丙胺酸、缬氨酸、异亮氨酸、亮氨酸、天冬氨酸、谷氨酸;天冬酰胺酸、谷氨酸盐、丝氨酸、苏氨酸、赖氨酸、精氨酸、苯基丙氨酸、酪氨酸。
修饰(通常不改变一级序列)包括在活的生物体内或在生物体外的多肽的化学衍生,例如:乙酰化作用、或羧化作用。还包括转译后的修饰;糖基化,例如:通过在多肽合成及处理或进一步的处理过程中,修饰多肽的糖基化模式而进行的修饰;例如:让多肽与可以影响糖基化的酶相接触,例如:糖基化的酶如糖基转移酶或糖苷酶等。还包括带有磷酸化的氨基酸残基的序列,例如:磷酸酪氨酸、磷酸丝氨酸、或磷酸苏氨酸。
术语“孤立的蛋白质”或“孤立的多肽”是一种蛋白质或多肽,由于它的衍生起源或来源,故:(1)没有在自然状态下与其有着天然联系的共生的成分相联接,(2)呈现自然界中不存在的纯粹状态,这种纯度可根据其它细胞物质的存在来判断(例如:不包含同种类的其它蛋白质)(3)由不同种类的细胞表达,或(4)自然界中不存在(例如:在自然中发现的多肽片段,或者包含不是天然存在的氨基酸相似物或衍生物,或者含有非标准的肽键的联接)。因此,在细胞系统中化学合成的或合成的多肽不同于自然起源的细胞,将会被从其天然相连的成分中“孤立”出来。多肽或者蛋白质还可以经过离析,采用业内已知的蛋白净化技术,与天然联系着的成分完全分离。根据这样的定义,“孤立的”不严格要求上述的蛋白质、多肽、肽或寡肽从其天然环境中物理性地移出。
文中使用的术语“多肽片段”指经过剪切的多肽,例如:相对于全长的多肽,氨基末端和/或羧基末端被剪切。举一个理想的例子,多肽片段是一个连续的序列,其片段的氨基酸序列与天然发生的序列的对应位置相同。片段典型地具有至少5,6,7,8,9或10个氨基酸长,适宜地,至少12,14,16或18个氨基酸长,更适宜地,至少20个氨基酸长,更适宜地,至少25,30,35,40或45个氨基酸长,更更适宜地,至少50或60个氨基酸长,而更更更适宜地,至少70个氨基酸长。
“修饰的衍生”指与一级结构序列大体同源的多肽或片段,但是包括例如:在活的生物体内或在生物体外经过化学或生物化学修饰的、或者包含天然多肽没有的氨基酸。这些修饰包括,例如:乙酰化作用、羧化作用、磷酸化作用、糖基化、泛素化、标记,例如:带放射性核、及各种酶的修饰,业内技术娴熟者可以轻易地发现这些。标记多肽的多种方法及对上述目的有用的替代或标记是业内熟知的,包括放射性同位素如125I,32P,35S,和3H,与作标记的配合基相结合的配合基(如抗体)、荧光团、化学发光剂、酶、及配合基,可作为标记配合基的特殊粘结对的选择取决于敏感度要求,与引物结合的轻易度,稳定度要求,及使用仪器的可获得性。标记多肽的方法是业内熟知的。参见:例如Ausubel et al.,《分子生物学现行草案》,Greene Publishing Associates(1992,及2002年增刊)(引入本文以备参考)。
术语“融合蛋白”指两个不同的基因通过融合而形成一个基因后表达的产物。含有与异源氨基酸序列结合的多肽或片段的多肽。融合蛋白很有用,因为其结构可以包含来自于两个或更多的不同蛋白质的两个或更多的理想的功能元素。融合蛋白由至少10个来自目的多肽的连续氨基酸构成,更适宜地,至少20或30个氨基酸,更适宜地,至少40,50或60个氨基酸,还要更适宜地,至少75,100或125个氨基酸。囊括了本发明中所有的蛋白质的融合具有特殊的功用。本发明中融合蛋白里面含有的异源多肽至少为6个氨基酸的长度,通常至少8个氨基酸长,有效地,至少15,20和25个氨基酸长。融合包括更大的多肽,如一个IgG Fc区域,甚至整个蛋白质,如绿荧光蛋白(“GFP”)含发色团蛋白具有特殊的功用。融合蛋白可以通过构造对多肽或多肽片段进行编码的核酸序列来重组制造,核酸序列编译出不同的蛋白质,然后对融合蛋白做出表达。替代的做法,融合蛋白可以通过将多肽或多肽片段与另一个蛋白质进行交联,用化学方法制造。
本文中使用的术语“抗体”指多肽,至少部分地被至少一个免疫球蛋白基因或片段编码,可以与理想的目的分子进行特殊的结合。本术语包括天然存在的形态,及片段和衍生物。
术语“抗体”范围内的片段包括经过各种蛋白酶消化而制造的片段,用化学分裂和/或化学离异法制造或重组制造的,只要片段保持了与目的分子进行特殊粘合的能力。这些片段包括Fab,Fab’,Fv,F(ab’)2,及单链Fv(scFv)片段。
术语范围内的衍生物包括序列中经过了修饰但仍保留着与目的分子进行特殊粘合的能力的抗体(或抗体片段),包括:种间嵌合抗体及人源化抗体;抗体融合;异聚抗体复合体和抗体融合,如双功能抗体(双特异性抗体)、单链双功能抗体、及内抗体(参见例如:《细胞内抗体:研究与疾病应用》(Marasco,ed.,Springer-Verlag New York,Inc.,1998),本文引用全文以备参考)。
本文中使用的抗体可以采用任何已知技术制造,包括天然B淋巴细胞培养的产物、杂种细胞培养产物、重组表达系统和噬菌体展示。
术语“非肽相似体”指具有与对照多肽相类似的属性的化合物。非肽化合物可以被称为“肽模拟物”或“多肽模拟物”,参见例如:Jones,《氨基酸和肽合成》,牛津大学出版社(1992);Jung,《组合肽与非肽库:便览》,John Wiley(1997);Bodanszkyet al.,《肽化学--实用课本》Springer Verlag(1993);《合成肽:用户指南》(Grant,ed.,W.H.Freeman and Co.,1992);Evans et al.,J.Med.Chem.30:1229(1987);Fauchere,J.Adv.Drug Res.15:29(1986);Veber and Freidinger,Trends Neurosci.,8:392-396(1985);及上述文献各自的参考资料,均引入本文以备参考。这些化合物经常采用计算机化分子模型来辅助研制。与本发明中的有用的肽在结构上类似的肽模拟物可以用来产生等量效果,因此被视为本发明的一部分。
“多肽突变体”或“突变蛋白质”指与天然或野生型态的蛋白质的氨基酸序列相比照,序列中包含一个或多个氨基酸的插入、复制、删除、重整或替换的多肽。突变蛋白质可以具有一个或多个氨基酸位点替换,在一个位点上的单个氨基酸已经变化为另一个氨基酸,一个或多个插入和/或删除,其中,一个或多个氨基酸分别被插入或删除了,在天然生成的蛋白质序列中,和/或氨基端或羧基端其中之一或两者的氨基酸序列截断。与天然生成的蛋白质相比照,突变蛋白质可以具有相同的,但是更为适宜地,具有不同的生物活性。
氨基酸替换可以包括以下的:(1)减少蛋白水解的敏感性,(2)减少氧化敏感性,(3)改变形成蛋白复合体的结合亲和力,(4)改变结合亲和力或酶的活性,及(5)赋予或修饰,使其具有类似相似物的其它的物理化学或功能属性。
文中使用的二十种常规的氨基酸及其缩写遵循传统用法。参见《免疫学--合成》(Golub and Gren eds.,Sinauer Associates,Sunderland,Mass.,2nd ed.1991),引入本文以备参考。二十种常规氨基酸的立体异构体(例如:D-氨基酸),非天然氨基酸如α-、α-位双取代氨基酸、N-烷基氨基酸、及其它非常规氨基酸也可以作为本发明的多肽的适宜成分。例举一些非常规的氨基酸,包括:4-羟(基)脯氨酸、γ-羧基谷氨酸、ε-N,N,N-三甲基赖氨酸、ε-N-乙酰赖氨酸、O-磷酸丝氨酸、N-乙酰丝氨酸、N-甲酰甲硫氨酸、3-甲基组氨酸、5-羟(基)赖氨酸、N-甲基精氨酸、及其它类似的氨基酸和亚氨基酸(例如:4-羟(基)脯氨酸)。文中使用的多肽符号,依据标准用法与惯例,左手末端对应氨基末端,右手末端对应羧基末端。
如果对一个蛋白质编码的核酸序列相似于对另一个蛋白质编码的核酸序列,那么这两个蛋白质是“同源”或是“同源的”。或者,如果两个蛋白质具有“相似的”氨基酸序列,那么一个蛋白质与另一个是同族关系。(因此,术语“同源蛋白质”定义为两个蛋白质具有类似的氨基酸序列。)举一个适宜的例子:同源的蛋白质是展示了至少80%序列与野生型蛋白质同源,更适宜地,至少85%的序列同源。还更适宜地,同源的蛋白质的至少86-90%序列与野生型蛋白质同源。举一个更适宜的例子,同源的蛋白质展示了至少95%,98%,99%或99.9%的序列一致。文中,两个区域的氨基酸序列的同源(特别是关于预见的结构相似)被解释为功能的隐含相似。
当引用“同源的”来描述蛋白质或多肽时,不相同的残余的位置通常与保守的氨基酸替换不同。“保守的氨基酸替换”是其中的氨基酸残基被另一个具有类似的化学属性(如电荷或疏水性)的侧链(R群)的氨基酸残基所替换。通常,保守的氨基酸替换不会实质地改变蛋白质的功能属性。在两个或更多的氨基酸序列在进行保守的替换后彼此不相同的情况下,百分比序列匹配率或同源度可以上调,以更正替换的保守性质。进行这种调整的方式是业内技术娴熟者所熟知的。参见例如:Pearson,1994,Methods Mol.Biol.24:307-331和25:365-389(引入本文以备参考)。
以下六个群中每个所包含的氨基酸彼此都可以保守的替换:1)丝氨酸(S),苏氨酸(T);2)天冬氨酸(D),谷氨酸(E);3)天冬酰胺酸(N),谷氨酸盐(Q);4)精氨酸(R),赖氨酸(K);5)异亮氨酸(I),亮氨酸(L),蛋氨酸(M),丙胺酸(A),缬氨酸(V),及6)苯基丙氨酸(F),酪氨酸(Y),色氨酸(W)。
多肽的序列同源,也指百分比序列匹配率,典型地可以使用序列分析软件来测量。参见例如:遗传学计算机集团(GCG)的序列分析软件包,威斯康星州生物技术中心大学,位于威斯康星州麦迪市大学街910号,邮编53705。蛋白质分析软件使用同源测量法将类似的序列配对,分配给各种替换,删除和其它修饰,包括保守的氨基酸替换。例如:GCG含有诸如“Gap”和“Bestfit”的程序,可以用来与缺省参数一同测定紧密切相关的多肽之间的序列同源或序列匹配率,例如有机物的不同种类的同源多肽,或野生型蛋白质与变异体之间的同源多肽。参见例如:GCG第6.1版。
当将特定的多肽序列与包含了来自于不同的生物体的大量序列的数据库相对照时,首选的运算法则是计算机程序BLAST(Ahschul et al.,J.Mol.Biol.215:403-410(1990);Gish and States,Nature Genet.3:266-272(1993);Madden et al.,Meth.Enzymol.266:131-141(1996);Altschul et al.,Nucleic Acids Res.25:3389-3402(1997);Zhang andMadden,Genome Res.7:649-656(1997)),especially blastp or tblastn(Altschul et al.,NucleicAcids Res.25:3389-3402(1997)).
BLASTp的首选参数包括:
期待值:10(缺省);筛选:seg(缺省);开口成本:11(缺省);扩口成本:1(缺省);最大调整:100(缺省);单词长:11(缺省);描述号:100(缺省);处罚矩阵:BLOWSUM62。
进行同源比对的多肽序列的长度通常至少大约16个氨基酸残基,通常至少大约20个残基,更常见地,至少大约24个残基,典型地,至少大约28个残基,适宜地,超过大约35个残基。当从大量的不同的生物体中查找一个包含了序列的数据库时,最好能比对氨基酸序列。使用氨基酸序列来进行数据库检索可以通过运算法则而不是业内已知的其它blastp来测量。例如:多肽序列的比对可以使用FASTA,一个GCG第6.1版本的程序。FASTA提供了查询与检索序列之间最佳重合区域的排比和百分比序列匹配率。参见Pearson,Methods Enzymol.183:63-98(1990)(纳入本文以备参考)。例如,氨基酸序列之间的百分比序列匹配率可以使用FASTA以及缺省参数来测定(单词长为2,PAM250计分矩阵),按照GCG第6.1版,纳入本文以备参考。
“特异性结合”指两个分子在所处环境下优先于与其它分子的结合而彼此结合的能力。典型地,“特异性结合”至少两倍、更典型地至少10倍、通常至少100倍地歧视反应中的偶发的结合。典型地,特异性结合反应的亲和力或活动性,以分裂常数量化表示,大约10-7M或更强(例如:大约10-8M、10-9M或更强)。
本文使用的术语“区域”指生物分子初级结构的物理相邻部分。在蛋白质情况下,区域定义为蛋白质氨基酸序列的相邻部分。
本文使用的术语“域”指属于生物分子的已知或可疑功能的结构。域可以与分子的区域或部分共存,域还可以包括生物分子的明显的,非相邻的区域。例举几个蛋白质域,包括但不限于Ig域、细胞外域、横跨膜域、及细胞质域。
文中使用的术语“分子”指任何复合物,包括但不限于,小分子、肽、蛋白质、糖、核苷、核酸、脂质等,此类复合物可以是天然的或合成的。
文中使用的术语“突变”指基因或染色体内DNA序列的任何变化。突变类型包括碱基替换位点突变(例如:转换或颠换)、删除、及插入。错义突变将不同的氨基酸引介进被编码的蛋白质序列中;错义突变引入新的终止密码子。对于插入或删除,突变可以是框架内(不改变序列整体结构)或框架飘移突变,可能造成大量密码子的误读,并且,由于终止密码子在可选框架中的存在,经常导致被编码的产品的非正常终止。
本文使用的术语“有效量”涉及药物成分(实施例4),是至少足够用来治疗、减轻、缓解或以其它方式来抑制给定的疾病状态的药量。在HIV-1情况下,指足以用来减轻、缓解或以其它方式抑制HIV-1的复制的药量。类似地,对于HIV-2,指足以用来减轻、缓解或以其它方式抑制HIV-2的复制的药量。
除非另有定义,本文中使用的所有的科技术语都具有与本发明适用的业内一般技能人士所普遍理解的相同的含义。方法和材料的例子在下文中做了描述,但是与本文所述的相似或相同的方法或材料也可以应用在本发明的实践中,并且对于业内技术人员是浅显的。文中提及的所有的出版物和其它参考资料都全文引用以备参考。如果出现冲突,以现行的规范包括定义为准。材料、方法和举例只起说明作用,而不是限制性的。
在本规范及要求的全文中,词语“包含”或其单数、现在分词等形式的变体应理解为包含了所说明的整数或整数群,而没有排除任何其它的整数或整数群。
APOBEC3G突变体的多肽和核酸编码:
本文所述的是能够抑制HIV-1和/或HIV-2的复制的重组核酸分子。本发明提供了重组核酸分子编码的、至少在野生型APOBEC3G(SEQ ID No.35和36)位点129上具有一个氨基酸替换的APOBEC3G。例如,核酸分子包括例如:SEQ ID No.1,3,5和7及相关的多肽序列例如:SEQ ID No.2,4,6和8、相似物、变异体、片段和融合物编码的突变APOBEC3G,以缓解或抵抗由HIV-Vif引起的蛋白酶降解。突变体P129A(在此的数字代表一个氨基酸在野生型APOBEC3G蛋白氨基酸序列即SEQ ID NO.35中的位置,数字左侧的字母代表替换前的氨基酸,数字右侧的字母代表替换后的氨基酸,下同)的全长核酸序列为SEQ ID No.1,编码的氨基酸序列为SEQ ID No.2。本发明的APOBEC3G突变和其它的APOBEC3G突变的产生见实施例1所述。
此外,突变体APOBEC3G P129G的全长核酸序列对已经识别和排序了的蛋白质进行编码(SEQ ID No.3),编码的氨基酸序列被规定为SEQ ID No.4。APOBEC3G蛋白质的第129位突变体在HIV-1编码的病毒蛋白质Vif存在的情况下,抑制了HIV-1的复制。
本文提供了突变体APOBEC3G P129D的全长核酸序列,它对已经识别和排序的蛋白质进行编码(SEQ ID No.5),编码的氨基酸序列被规定SEQ ID No.6。APOBEC3G蛋白质的第129位点突变在HIV-1编码病毒蛋白质Vif存在的情况下抑制HIV-1的复制。此外,突变体APOBEC3G蛋白质在HIV-2编码的病毒蛋白质Vif存在的情况下,抑制了HIV-2的复制。P129D突变体是对HIV-1或HIV-2的复制的有效的抑制剂。
对于抑制HIV-1或HIV-2复制的另一个突变体的核苷酸序列被规定为SEQ ID No.7,其编码的氨基酸被规定为SEQ ID No.8。P129F突变体蛋白质抑制了HIV-1或HIV-2的复制。
举一个具体的例子:突变体APOBEC3G多肽保存了脱氧胞嘧啶脱氨酶活性。因此,本发明的APOBEC3G蛋白质至少对于减少细胞内的HIV-1和/或HIV-2的复制特别有用。适宜地,突变体蛋白质抑制了人体内HIV-1和/或HIV-2的感染。
本发明还包括了上述能够中和或抑制HIV-1和/或HIV-2感染的蛋白质或多肽的相似物。相似物由于在保守的氨基酸序列上的差异、或不影响序列的修饰、或同时出于这两种原因,而与天然存在的蛋白质或多肽有所不同。本发明包括经过提纯的氨基酸序列,与序列标识号为2,4,6或8的氨基酸共享了至少大约90%的匹配率,适宜地,至少大约95%的匹配率,更适宜地,至少大约99.9%的匹配率,条件是这些相似物具有Vif抑制活性。特别地,APOBEC3G多肽在本发明的范围内,具有至少一个第129位点上的氨基酸替换。
不同于野生型APOBEC3G,它在第129位包含脯氨酸,本发明的APOBEC3G突变体在第129位包含一个氨基酸替换。本发明的多肽在HIV-1 Vif或HIV-2 Vif存在的情况下,抑制了HIV-1和/或HIV-2的复制,同时保留其功能。适宜地,APOBEC3G突变体P129A的静态蛋白质水平在HIV-1 Vif或HIV-2 Vif存在的情况下不受影响。举一个具体的例子:APOBEC3G蛋白质的突变体是一个P129A替换。另一个具体的例子:APOBEC3G蛋白质的突变体是一个P129G的替换。理想的情况下,APOBEC3G蛋白质的突变体是一个P129F替换。更为适宜的例子,APOBEC3G蛋白质的突变体是一个P129D的替换。另举一个例子:氨基酸序列第129位点的突变可以是除脯氨酸之外的任何氨基酸替换。在一些具体的情况下,其它的在129位发生了氨基酸替换的APOBEC3G蛋白质减少或抑制了宿主细胞或宿主体内的病毒传染和复制。
还包括采用普通的分子生物技术进行了修饰的多肽,以改善蛋白降解抗性或优化溶解性的属性。这类多肽的相似物包括那些包含非天然生成的L-氨基酸的残基,例如:D-氨基酸或非天然生成的合成的氨基酸。本发明的肽不限于文中所列举的任何特定的示例过程的产品。
除实质性的全长多肽外,本发明提供了多肽的酶活性片段。多肽可以是单节显性或聚合的。此外,多肽可以包括不同的域,每个域都具有一项或多项明显的活性。
在本发明的另一方面,本文提供了具有核酸序列的重组核酸分子,该核酸序列由突变体APOBEC3G序列(SEQ ID No.1,3,5或7)、相似体、同源体、变异体、及衍生物组成。本发明还提供了一个带有突变体APOBEC3G基因降解变异体序列的核酸分子。更为具体地,本发明提供了一个带有突变体APOBEC3G基因核变异体序列的核酸分子,具有与野生型基因至少90%的匹配率。核酸序列可以适宜地具有至少91-95%的相对于野生型基因的匹配率。更适宜地,核酸序列可以与野生型基因有着96%,97%,98%,99%,99.9%或更高的匹配率。
熟练的技工将能轻易地发现重组核酸分子可以用多种宿主细胞包括哺乳动物的细胞、酵母细胞、真菌细胞、昆虫细胞和细菌细胞来表达。相应地,核酸分子还可以是优化的密码子,其中的一个或多个氨基酸序列被改变了,包括保守的氨基酸的替换、增加、删除、或结合。
本发明还提供了在严格条件下与上述核酸分子杂交的核酸分子。正如上文的定义及业内众所周知的,严格的杂交在大约25℃以下的热熔点(Tm)执行,对于一套特殊条件下的特定的DNA杂交,Tm的温度是50%的目的序列与相匹配的探针完美地进行杂交。严格的洗涤在一组特殊的条件下的大约5℃低于Tm的特殊DNA杂交温度执行。
本文还提供了包含了上述任何一个核酸序列的片段的核酸分子。这些片段适宜地包含至少20个连续核苷。更适宜地,核酸序列的片段包含了至少25,30,35,40,45,50,60,70,80,90,100或更多的连续核苷。
本发明中的多肽和多核苷酸可以通过化学合成法制造,或者,更为常见地,通过对核酸的孤立片段进行人工处理、已知的基因工程技术来制造,特别是当有结构表达载体时。商业可行的肽合成器可以依照已知的协议来加以使用。肽的化学合成的说明参见:S.B.H.Kent,《生物医学聚合体》,eds.Goldberg and Nakajima,学术出版社,纽约,第213-242页,1980;Mitchell et al.,J.《有机化学》,43:2845-52,1978;Tam et al.,Tet.Letters,4033-6,1979;Mojsov et al.,J.《有机化学》,45:555-60,1980;Tam et al.,Tet.Letters,2851-4,1981;和Kent et al.,《第四届关于蛋白质序列分析方法的国际研讨会会议录》(Brookhaven Press,Brookhaven,纽约,1981.
本发明的核酸序列片段展示了多种系统和方法的功效。例如:片段可以用作各种杂交技术的探针。依凭此方法,目标核酸序列可以是DNA或RNA。目标核酸序列可以是在杂交前先进行分馏(例如:凝胶电泳),或在原位执行样品的杂交。业内的一项技术将对已知序列的核酸探针在测定染色体结构中(例如:通过Southern印迹杂交)和在测量基因表达(例如:通过Northern印迹杂交)的大显身手而加以赞赏。在这些实验中,最好对序列片段加以标记,以便它们与目标序列进行的特异性杂交可以被发现和有选择地加以量化。业内熟练技工可在大量的印迹杂交技术(非本文中特别说明的)中应用本发明的核酸片段。
本文所公布的核酸序列还可以用作探针,固定在微阵列上。通过在支撑基层上沉积和固定核酸来创建微阵列的方法是业内周知的。参见《DNA微阵列:实用方法》(实用方法系列),Schena(ed.),牛津大学出版社(1999)(ISBN:0199637768);Nature Genet.21(1)(suppl):1-60(1999);《微阵列生物芯片:工具与技术》,Schena(ed.),伊顿出版公司/生物技术书刊公司(2000)(ISBN:1881299376),本文引用上述披露的文献全文以备参考。分析,例如,对采用由核酸序列片段组成的微阵列做出的基因表达,如本文披露的核酸序列片段,是细胞和分子生物学领域内序列片段的重要的用途。固定在微阵列上的序列片段的其它用途参见Gerhold et al.,Trends Biochem.Sci.24:168-173(1999)和Zweiger,Trends Biotechnol.17:429-436(1999);《DNA微阵列:实用方法》(实用方法系列),Schena(ed.),牛津大学出版社(1999)(ISBN:0199637768);Nature Genet.21(1)(suppl):1-60(1999);《微阵列生物芯片:工具与技术》,Schena(ed.),伊顿出版公司/生物技术书刊公司(2000)(ISBN:1881299376),全文引用上述披露的每份文献的全文以备参考。
针对突变体APOBEC3G多肽的抗体:
本发明的另一方面,发明提供了特异的抗体,包括片段和衍生物,这些片段和衍生物特异性地结合到本发明中的孤立的多肽和多肽片段上,或由本发明的孤立的核酸所编码的一个或多个的多肽上。本发明的抗体可以是对线性抗原有特效的,不连续的抗原或此类多肽或多肽片段的构象表位,既可以是以天然结构呈现在多肽上,或者,在一些情况下,以变性的形态呈现在多肽上,例如:通过SDS溶解。在本发明中所提供的有用的抗体片段包括Fab,Fab’,Fv,F(ab’)2,和单链Fv(SCFvs)片段。这些抗体片段的定义如下:(1)Fab,包含了由整个抗体与木瓜蛋白酶消化而产生的抗体分子的单价抗原结合的片段,产生了一个完整的轻链和一部分的重链;(2)Fab’,通过用胃蛋白酶处理整个抗体而获得的抗体分子的片段,经过减数分裂,可产生一个完整的轻链和一部分的重链;(3)F(ab’)2,通过用胃蛋白酶处理整个抗体而不再经过差数分裂而获得的抗体的片段;(4)F(ab’)2,两个Fab′片段用两个二硫化键结合成的二聚物;(5)Fv,基因工程片段,包含轻链可变区和重链可变区,表达为两个链;及(6)单链抗体(″SCA″),基因工程分子,包含轻链的可变区,重链的可变区,由适宜的多肽连接链链接,作为一个基因融合的单链分子。制造这些片段的方法是常规的。
通过“特殊地结合”及“特定的结合”,本文指出抗体优先于与其它的分子种类相结合,而与首位分子种类相结合的能力,抗体和首位分子种类与这些其它的分子种类是混合在一起的。文中所述的抗体专门指当它可以与首位分子种类进行特定的结合的时候,“识别”了首位分子种类。
正如业内众所周知的,抗体在混合物中的多个分子种类中的分辨能力部分地依赖于混合物中种类的构象关系;典型地,本发明的抗体可以至少两倍地、更典型地至少5倍、典型地超过10倍、25倍、50倍、75倍,经常超过100倍,偶尔超过500倍或1000倍地分辨出与不相关的多肽的偶然的结合。
典型地,本发明中的抗体与本发明中的多肽或多肽片段的亲和力或强度(或抗体多聚体,在IgM五聚物的情况下)将是至少大约1×10-6M,典型地,至少大约5×10-7M,有用地,至少大约1×10-7M,亲和力和强度为1×10-8M,5×10-9M,1×10-10M及更强,经证实特别的有用。
本发明的孤立的抗体可以是来自任何哺乳动物种类的天然形态,如IgG,IgM,IgD,IgE,和IgA。例如:抗体可以有效地从以下种类中获取:啮齿动物--典型地,鼠,但是也有家鼠、豚鼠和仓鼠--兔类动物,典型地,野兔,也有更大的哺乳动物,如绵羊、山羊、母牛和马。按照标准免疫条约,动物是典型地肯定地经过了免疫的,具有本发明中的多肽或多肽片段。
事实上,本发明中的多肽的8个或更多的连续的氨基酸的所有片段,当与载体缀合时,都可以有效地用作免疫原,典型地,诸如牛甲状腺球蛋白、钥孔虫戚血蓝蛋白、或牛血清蛋白,方便地使用了双功能的连接链。免疫原性还可以通过本发明中的多肽及多肽片段与其它半族相融合而得到。例如:本发明中的肽可以通过在分支的多熔素核心矩阵上的固相合成法来制造;这些多抗原肽(MAPs)为疫苗的研发提供了高纯度,增强的强度,精确的化学定义和改善的安全性。参见例如:Tam et al.,Proc.Natl.Acad.Sci.USA 85:5409-5413(1988);Posnett et al.,J.Biol.Chem.263,1719-1725(1988).
免疫的协议是业内众所周知的。这些协议通常包括多种免疫,带有或不带有诸如Freund的完全佐剂和Freund的不完全佐剂等佐剂。本发明的抗体可以是多克隆的或单克隆的,多克隆的抗体在本发明中的蛋白质的免疫组织化学检测方面具有特定的优势,而单克隆的抗体在辨别与发现本发明中的蛋白质的特定的抗原表位方面具有优势。经过免疫之后,本发明中的抗体可以采用任何业内认可的技术制造。用于重组抗体生产的宿主细胞--或者是整个的抗体,抗体片段,或者是抗体的衍生物--可以是原核的或真核状态的。正如业内众所周知的,原核的宿主对于制造抗菌素显示的抗体特别的有用。真核细胞,包括哺乳动物、昆虫、植物和真菌细胞,也对本发明中的抗体、抗体片段以及抗体衍生物的表达很有用。本发明中的抗体还可以采用无细胞翻译法制备。
本发明中的孤立的抗体,包括抗体的片段和衍生物,可以被有效地加标记。因此,本发明的另一个方面,是提供作了标记的抗体,专门结合到本发明中的一个或多个多肽和多肽片段中。标记的选择,部分地依赖于理想的用途。在一些情况下,本发明中的抗体可以用酶来有效地标记。或者,抗体可以用胶体金或荧光团来标记。用加了标记的亲和素、链亲和素、captavidin或中性链亲和素进行第二次检测,本发明中的抗体可以采用生物素来有效地标记,例如:在western印迹杂交应用中,可以有效地采用放射性同位元素如33P,32P,35S,3H和125I来标记。正如人们所理解的那样,上述标记的使用不限于任何的特定的应用。
抗-X蛋白质抗体(例如:专门识别APOBEC3G蛋白质的抗体)可以采用大量文献中描述的标准程序来制造,包括Harlow and Lane(《抗体,实验室指南》CSHL,纽约1988)。对只与特定的蛋白质进行充分结合的特定试剂的测定可以采用或采取常规的程序。一种适宜的体外化验法采用western印迹程序(在许多标准文献中都有记述,包括Harlow and Lane(《抗体,实验室指南》,CSHL,纽约,1988)).本文印迹法可以用来测定特定的蛋白质结合,如只有X蛋白质结合的抗-X蛋白质单克隆抗体。
重组APOBEC3G突变体多肽的表达:
本发明中的蛋白质通过用由核酸编码的蛋白质构成的表达载体来转染、培养重组宿主细胞的方法制造(图2),在适宜的条件下,引起或促进蛋白质表达。蛋白质表达的适宜条件随所选择的表达载体和宿主细胞而变化,业内技术娴熟者可以采用常规实验轻易地加以确定。例如:在表达载体中使用组成型启动子需要优化宿主细胞的生长和增殖,而使用诱导型启动子要求具有诱导的适宜生长条件。
适宜的宿主细胞包括酵母、细菌、原生细菌、真菌类、和昆虫及动物细胞,包括哺乳动物的细胞。具有重大意义的有果蝇细胞、甲醇酵母和甲醇型酵母、酿酒酵母和其它酵母、大肠杆菌、枯草杆菌、SF9细胞、SF21细胞、C129细胞、骨肉瘤Saos-2细胞、Hi-细胞、293细胞、293T细胞、脉孢菌、BHK、CHO、COS、及海拉细胞。意义最为重大的有A549、海拉、HUVEC、Jurkat、BJAB、CHMC、及从T细胞或巨噬细胞中衍生而成的细胞系。
举一个具体的例子,蛋白质在哺乳动物细胞中特别是人体细胞中的重组表达。哺乳动物表达系统也是业内已知的,包括反病毒系统。哺乳动物启动子(即哺乳动物细胞中的启动子功能)是任何能将哺乳动物RNA聚合酶结合起来的DNA序列,并开启下游(3′)蛋白质进入mRNA的编码序列的转录。启动子具有一个转录开启区,通常放置在最靠近编码序列5′端,和一个TATA盒,使用转录开启位点的定位的25-30碱基对上游。TATA盒被认为是将RNA聚合酶II接引到适宜的位点去启动RNA的合成。哺乳动物启动子还包含上游启动子元素(加强子元素),典型地位于TATA盒的100至200个碱基对上游。上游启动子元素决定着转录启动的速率,可以是任何方向的。哺乳动物启动子的特别的用途是来自哺乳动物病毒基因的启动子,病毒基因经常是高度表达的,具有宽泛的宿主范围。例子包括SV40早期启动子、大鼠乳腺癌病毒LTR启动子、腺病毒主要晚期启动子、单纯疱疹病毒启动子、及CMV启动子。
典型地,哺乳动物细胞发现的转录终止和腺嘌呤序列是在调整区,将3’定位在转译终止密码子,这样,连同启动子元素一起,位于编码序列的侧面。成熟的mRNA的3′末端是通过特定位点的转译后分裂和多聚腺苷酸化而形成的。转录终止子和多聚腺苷酸信号的例子包括那些衍生的形态SV40。
将外源的核酸引介进哺乳动物宿主及其它宿主的方法是业内众所周知的,随使用的宿主细胞而变化。技术包括葡聚糖介导转染,磷酸钙沉淀、聚凝胺介导转染、原生质体融合、电穿孔、病毒传染、脂质体中的多核苷酸包复、及DNA直接进入细胞核的显微注射。
举个适宜的例子,实施例2描述了293T细胞转染核酸序列,通过宿主和重组核酸序列间的同源重组在选定的位置,将序列纳入诸如宿主基因组等。本发明中的序列可以适宜地联接到一个或多个表达控制序列中,以便序列编码的蛋白质可以在包含了孤立的核酸分子的宿主细胞中在适宜的条件下被表达。稳定的基因合成可以通过生化选择在哺乳动物细胞中获得,例如:新霉素(Southern and Berg,1982,J.Mol.Appl.Genet.1:327-41)和mycophoenolic酸(Mulligan and Berg,1981,Proc.Natl.Acad.Sci.美国78:2072-6).
将异源的核酸引介进宿主细胞中的方法是业内众所周知的,并随宿主细胞而变化。DNA到诸如人或其它哺乳动物细胞的真核状态的转染,是业内已知的技术。载体作为纯DNA(转染)被引入受体宿主细胞,例如,磷酸钙沉淀(Graham and vander Eb,1973,《病毒学》52:466)磷酸锶(Brash et al.,1987,《分子细胞生物学》7:2013),电穿孔(Neumann et al.,1982,EMBO J.1:841),脂染(Feigner et al.,1987,Proc.Natl.Acad.SciUSA 84:7413),DEAR葡聚糖(McCuthan et al..,1968,J.Natl.癌症研究所41:351),显微注射(Mueller et al.,1978,《细胞》15:579),protopiast融合(Schaiher,1980,Proc.Natl.Acad.Sci.USA 77:2163-7),或粒丸枪(Klein et al.,1987,《自然》327:70)。其它方法包括通过病毒载体传染来引介cDNA,例如逆转录病毒酶(Bernstein et al.,1985,Gen.Engrg.7:235)如腺病毒(Ahmad et al.,J.Virol.57:267,1986)或疱疹(Spaete et al.,Cell 30:295,1982).
APOBEC3G突变体多肽能在Vif存在的条件下抑制HIV-1或HIV-2的病毒复制:
本发明中的突变体APOBEC3G蛋白质显示了在HIV-1 Vif或HIV-2 Vif存在情况下,与野生型APOBEC3G相对比时,至少一些病毒抑制功能,及与其它的APOBEC3G突变体相比较,具有更高的抗逆转录病毒功能(见图3)。举一个例子,P129D蛋白质在HIV-Vif存在情况下抑制大约90%的病毒活性。适宜地,抑制率大约为95-99.9%。更适宜地,抑制为100%。在抗病毒活动中,APOBEC3G的单氨基酸替换突变效应(例如:P129D)由HIV-1 Vif或HIV-2 Vif的缺乏或存在的状态所决定。图3显示了野生型APOBEC3G蛋白质及其突变体在HIV Vifs缺乏或者在HIV-1或HIV-2 Vifs存在的情况下的抗逆转录病毒活性。在HIV-1或HIV-2 Vifs缺乏的情况下,图3A中显示的所有的APOBEC3G突变体和野生型蛋白质可以有效地抑制HIV的复制。在HIV-1 vif存在的情况下,野生型APOBEC3G丧失了抗逆转录病毒活性,而D128K,P129A,P129D和P129F仍然能有效地抑制HIV。在这些突变体中,P129D是最有效的一个。在HIV-2 vif存在的情况下,野生型APOBEC3G和D128K突变体部分地丧失了它们的抗逆转录活性,但是P129A,P129D和P129F突变体可以有效地抑制病毒的复制。而P129D再次成为最有效的一个。虽然几种突变体APOBEC3G在HIV-1 Vif或HIV-2 Vif存在的情况下抑制了HDV-EGFP的复制,并且展示了相对其它的突变体的Vif抗性,然而,结果显示,P129D突变体比D128K,P129A或P129F突变体略微更有效一些。相应地,另外举一个例子,P129D突变体蛋白质比其它的APOBEC3G突变体更加有效抑制了病毒的复制。
使用本发明中的APOBEC3G具有几个优势。HIV-1 Vif或HIV-2不减缓细胞内的APOBEC3G突变体的稳态水平,这是本发明的一个显著特点。P129D突变体显示了具有Vif抗性的显型。采用实施例2中描述的方法,突变体APOBEC3G抗病毒活生由HIV-1或HIV-2 Vif的存在或缺乏来决定。图4显示了P129D对HIV-1 Vif和HIV-2 Vif同时具有抵抗性。APOBEC3G表达载体(pcDNA-APO3G和pAPO3G-P129D)及Vif表达载体(pC-Help)被共同转染到293T细胞中。细胞溶菌在转染后48小时收获,并接受SDS-page上的电泳和免疫印迹分析(实施例3)。APOBEC3G由抗cMyc抗体检测得到。结果显示野生型APOBEC3G蛋白质的含量在HIV-1(vif+)存在的情况下减少了,但是D128K,P129A,P129D和P129F突变体蛋白质的含量在当Vif与APOBEC3G及其在病毒制造细胞中的突突体被共同表达时,没有减少,只有P129D对由HIV-2 Vif引介的降解具有抵抗性(图4C)。
本发明在另一方面,提供了一个减少细胞内的HIV-1和/或HIV-2感染的方法,包括通过引介可以管理突变体APOBEC3G多肽的疗效量的Vif来抑制蛋白酶降解,从而抑制、减低或防止宿主细胞内的病毒传染(实施例4)。举一个具体的例子,提供突变体APOBEC3G的方法仍然保持了脱氧胞嘧啶脱氨酶活性。通过管理突变体APOBEC3G作为抗病毒化合物,至少HIV-1和/或HIV-2感染减少了。举一个具体的例子:突变体APOBEC3G是与其它的抗病毒药物包括白介素、抗生素、蛋白酶抑制剂、非核苷逆转录酶抑制剂等结合而进行管理的。另外举一个例子:本方法提供本发明中的多肽的管理,使其作为细胞免疫防卫机制的一部分来抵抗Vif。
正如业内所知,病毒感染性测定显示,对病毒复制和病毒感染性的抑制可以通过多种方法来测量。例如:突变体APOBEC3G可以采用病毒感染性测定进行检测,参阅(例5)。另外的一些病毒感染性的例子也是业内众所周知的。其它的方法和技术也适用于病毒感染性的测量,正如业内技术娴熟者所知道的那样。
附图说明
图1显示了APOBEC3G序列和几种突变体,包括:P129F,P129D,P129A和D128K氨基酸替代的氨基酸序列示意图。
图2解释了APOBEC3G表达载体的质粒图,用来表达野生型APOBEC3G蛋白质或它的突变型蛋白质。
图3描述了结果图,显示在缺乏HIV Vifs时,或在HIV-1或HIV-2 Vifs存在的情况下,野生型APOBEC3G蛋白质及其突变体的抗逆转录病毒活性比较。
图4描述了SDS-PAGE图象关于细胞内APOBEC3G及其变异体的蛋白水平的分析,及APOBEC3G表达载体与Vif表达载体共同转染到293T细胞内的蛋白质表达的免疫杂交分析。
图5是本发明几个突变体抑制HIV复制比较图。
具体实施方式
以下通过实施例对本发明作进一步的阐述,但不限制本发明的范围。
实施例1:重组APOBEC3G突变体的获得
用以生成APOBEC3G突变结构的突变体采用多位点突变试剂盒(Stratagene)或基于PCR的变异,然后测定序列以验证突变。氨基酸替换被引介到pcDNA-APO3G内,参见Kao et al.,J.Virol.77,11398-11407(2003)。从APOBEC3G蛋白的N末端到C末端,通过氨基酸替换获得的典型的突变型APOBEC3G蛋白如下:
P129A(核苷酸序列为SEQ ID No.1,对应的氨基酸序列为SEQ ID No.2);
P129G(核苷酸序列为SEQ ID No.3,对应的氨基酸序列为SEQ ID No.4);
P129D(核苷酸序列为SEQ ID No.5,对应的氨基酸序列为SEQ ID No.6);
P129F(核苷酸序列为SEQ ID No.7,对应的氨基酸序列为SEQ ID No.8);
D128K(核苷酸序列为SEQ ID No.9,对应的氨基酸序列为SEQ ID No.10)。
上述突变型APOBEC3G蛋白与野生型APOBEC3G蛋白的氨基酸替代的示意图如图1所示。
以下的质粒在前文已有说明:pHDV-EGFP,参见Unutmaz et al.,J.Exp.Med.189,1735-1746(1999);pNL4-3,参见Adachi et al.,J.Virol.59,284-291(1986);pcDNA-APO3G,参见Kao et al.,J.Virol.77,11398-11407(2003);pC-Help,参见Mochizuki et al.,J.Virol.72,8873-8883(1998);pC-HelpΔVif,参见Kao et al.J.Virol.77:11398-407,2003;和pΔNC,参见Ott et al.,J.Virol.77,5547-5556(2003)。PcDNA表达载体包含APOBEC3G cDNA的第129位的氨基酸替换(Genbank AN BC024268)。依照生产商说明,转染采用PolyFect试剂(Qiagen,Inc.),所有质粒等摩尔比率,36小时后收获,除非另有说明。
实施例2:在宿主细胞中表达APOBEC3G。用于测定APOBEC3G变异体的抗HIV复制的能力。
其实验的流程为:
1、生产用于测试的含APOBEC3G变异体的病毒。使用野生型APOBEC3G及其突变体与pHDV-EGFP(HIV-1产生的载体),pCMV-g(VSVg膜表达载体)和pcHelpΔvif(Vif杆)或pcHelp(表达HIV-1 vif,Vif+杆)共转染293T细胞,采用CalPhos哺乳动物转染试剂盒(BD生物科学)。
2、使用上一步生产出的病毒来感染哺乳动物细胞。
病毒在转染后48小时收获,采用0.45mm针头式过滤器进行过滤(Corning)。每个病毒的p24衣壳采用P24 ELISA工具来测量(Perkin-Elmer),每个样器中等于p24的30ng的病毒被用来在6孔盘中感染293T细胞。
3、测定被感染的细胞比例,使用流式细胞分析的方法。
被感染的293T细胞在感染48小时后收获,进行FACScan分析(Becton-Dickinson)。样本中的被转染了pHDV-EGFP、pCMV-g、野生型APOBEC3G和pcHelp的GFP阳性细胞被设定为100%。
野生型APOBEC3G及其突变体与pHDV-EGFP(HIV-1产生的载体),pCMV-g(VSVg膜表达载体)和pcHelpΔvif(Vif杆)或pcHelp(表达HIV-1 vif,Vif+杆)到293T细胞的共转染采用CalPhos哺乳动物转染试剂盒(BD生物科学)。病毒在转染后48小时收获,采用0.45mm针头式过滤器进行过滤(Corning)。每个病毒的p24衣壳采用P24ELISA工具来测量(Perkin-Elmer),每个样器中等于p24的30ng的病毒被用来在6孔盘中感染293T细胞。被感染的293T细胞在感染48小时后收获,进行FACScan分析(Becton-Dickinson)。样本中的被转染了pHDV-EGFP、pCMV-g、野生型APOBEC3G和pcHelp的GFP阳性细胞被设定为100%。
为了测定野生型或突变体APOBEC3Gs在Vif存在的条件下对HIV-1或HIV-2复制的效果,pHDV-EGFP,pC-HelpΔVif,pHCMV-G和pcDNA-APO3G或pcDNA-APO3G的突变体分别采用20∶15∶4∶4μg的DNA来共同转染。pHDV-EGFP,pCHelpΔVif,pHCMV-G和pcDNA-APO3G或APOBEC3G突变质粒的摩尔比率分别为大约1∶1∶0.4∶0.4。
为了测定野生型或突变体APOBEC3Gs在Vif(Vif+)存在的条件下对HIV-1或HIV-2复制的效果,pHDV-EGFP,pC-Help,pHCMV-G和pcDNA-APO3G或pcDNA-APO3G的突变体分别采用20∶15∶4∶4μg的DNA来共同转染。pHDV-EGFP,pC-Help和pcDNA-APO3G野生型或突变体质粒的摩尔比率分别为大约1∶1∶0.4∶0.4。
为了测定是否突变体对野生型APOBEC3G,pHDV-EGFP,pC-Help和pHCMV-G具有优势,质粒与pcDNA-APO3G和/或突变体APOBEC3G质粒pAPO129D被共同转染。APOBEC3G质粒的总量在每次实验中是4μg,pHDV-EGFP,pC-Help,pHCMV-G和APOBEC3G质粒的摩尔比率是1∶1∶0.4∶0.4。
野生型和突变体APOBEC3G对于pHDV-EGFP的复制的效果见图3所示。突变体APOBEC3G在HIV-1 Vif表达不存在的条件下的效果显示了在GFP-阳性细胞内的重大减损直至低于10%。
突变体APOBEC3G在HIV-1 Vif或HIV-2 Vif存在的条件下的复制效果见图3所示。野生型APOBEC3G的表达没有减少感染细胞内的GFP表达水平,然而,P129DP129A和P129F突变体和D128K突变体显示了对HIV Vifs的抵抗性。这些突变体有效地抑制了HDV-EGFP的复制,即使是在pC-Help存在的条件下。
实施例3:APOBEC3G突变体P129A,P129D和P129F能够抵抗HIV-1和HIV-2 Vifs引起的蛋白酶降解。
细胞内的野生型APOBEC3G和突变体APOBEC3G蛋白质的稳态水平在HIV Vifs存在或缺乏的条件下,采用C端myc-标记的APOBEC3G蛋白质的western印迹检测法来测定。对于共同免疫沉淀反应,依照厂商说明(Dynal Biotech),抗c-Myc抗体(Sigma-Aldrich)连接到顺磁熔珠。293T细胞与APOBEC3G表达质粒以及pC-Help或pC-HelpΔVif共转染。转染之后大约36小时,2×106个细胞被收获,用冰冻的PBS洗涤两次,在1ml细胞抽提液中溶解(20mM Tris-Cl,pH8.0,137mM NaCl,1mM EDTA,1mM NaVO3,10%甘油,1%Triton X-100和蛋白酶抑制剂的混合物[Roche])。细胞提取物使用Bradford试剂调整为等量的蛋白质浓度(BioRad实验室),然后使用等分试样进行共免疫沉淀反应和western印迹分析。
细胞抽取物采用1,500×g分离4分钟,采用与顺磁熔珠相结合的抗c-Myc抗体培养上清液,4℃ RKDynal(Dynal Biotech)转子上缓慢转动3小时,培养后,熔珠用50mM碱-盐酸缓冲液,pH7.5,500mM氯化锂,1mM偏钒酸钠和0.5%Triton X-100洗涤3次,用50mM碱-盐酸缓冲液,pH7.5,500mM氯化锂,1mM偏钒酸钠洗涤3次,用1mM NaVO3偏钒酸钠洗涤1次。
粘合的蛋白质采用加热到90℃保持5分钟的方法在SDS-PAGE上样缓冲液中从熔珠上洗掉。对于细胞裂解,收获了2×106个细胞,转染后用冰冻的PBS洗涤36小时,在1×SDS-PAGE上样缓冲液中溶解,加热到90℃保持5分钟。对于western印迹分析,myc抗原表位标注的APOBEC3G蛋白质采用抗c-Myc抗原进行检测,HIV-1 Vif蛋白质采用抗HIV-1 HXB2 Vif抗血清(Dana Gabuzda,Dana-Farber癌症研究所)进行检测,这种抗血清通过美国国立卫生研究所(NIH)国立过敏与传染病研究所(NIAID)爱滋病研究部的爱滋病试剂与推荐计划而获得的。
图4中的结果显示野生型APOBEC3G蛋白质在HIV-1(Panel B)存在的情况下减少了,但是D128K,P129A,P129D和P129F的量没有减少。如果HIV-2 Vif与APOBEC3G及其突变体在病毒制造的细胞中被共同表达,只有P129D对由HIV-2 Vif(panel C)引介的降解有抵抗性,P129F和P129A部分具有抵抗性。野生型APOBEC3G蛋白质的稳态水平在HIV-1或HIV-2 Vif存在的情况下大量衰竭,但是突变体APOBEC3G蛋白质不存在这种情况。因此,P129D对由于HIV-1 Vif或HIV-2 Vif引起的蛋白酶降解具有更好的抵抗性。
实施例4:药物成分
药物配方中的突变体多肽成分可以通过阻止免疫缺陷病毒的复制,来治疗慢病毒感染,例如HIV和AIDS。测定速效药物成分的有效量可以采用常规的计算方法基于动物数据完成。一种试剂的治疗有效量可以在一次疗程中通过一次或许多次的剂量来控制。成分包括可以按需要管理的治疗试剂。
一项具体例子中,有效剂量包含每千克人体质量大约10ng和大约100μg之间的核酸分子。在另一项具体例子中,有效剂量包含有每千克人体质量大约100ng和大约10μg之间的核酸分子。在另一项具体例子中,有效剂量包含每千克人体质量大约1μg和大约5μg之间的核酸分子。在另一项具体例子中,有效剂量包含每千克人体质量大约10μg和大约100μg之间的核酸分子。在一项适宜的例子中,有效剂量包含每千克人体质量大约100μg和500μg之间的核酸分子。在另一项具体例子中,有效剂量包含每千克人体质量大约500μg和1000μg之间的核酸分子。在另一项具体例子中,有效剂量包含每千克人体质量大约1mg和2mg之间的核酸分子。
本发明中的化合物还可以混合,装入胶囊,组合或者用其它的方式与其它的分子、分子结构或化合物的混合物相结合,例如:脂质体、受体目标分子、口服、直肠、局部的、皮肤的、气管内的、吸服的或其它配方,来帮助摄取、分散和/或吸收。辅助性配方包括但不限于美国专利号:5,354,934;5,108,921;5,354,844;5,416,016;5,459,127;5,521,291;5,543,158;5,547,932;5,583,020;5,591,721;4,426,330;4,534,899;5,013,556;5,108,921;5,213,804;5,227,170;5,264,221;5,356,633;5,395,619;5,416,016;5,417,978;5,462,854;5,469,854;5,512,295;5,527,528;5,534,259;5,543,152;5,556,948;5,580,575;和5,595,756,这些编号中的每一个都引入本文以备参考。其它的药物传送机制诸如缓释(例如聚合体、微胶囊)、机械仪器包括可植入融合设备和泵,也是可以控制的。
药物成分的有效剂量可以控制在病人需要的剂量,每天或隔天服用1-8次或者更多次。剂量取决于被治疗的疾病的严重程度和药效反应,疗程持续几天至数月,直至痊愈或者症状减轻。实际的有效量,或剂量的控制应当考虑病人的体积和体重,治疗的性质是预防性的还是治疗性的,病人的年龄、体重、健康状况和性别,用药途径,及其它因素包括医生的处方。
药物成分还包含适用的赋形剂和助剂,以加快核酸进入药用制剂的过程。通常,发明中使用的药剂的配方既可以是非肠道的也可以是肠内形式的,通常是肠内形式的,特别是口服的药方。适宜地,发明中使用的试剂的配方是肠胃外用药,例如:通过皮肤、皮层内、腹膜腔内、静脉内、或肌肉注射。此外,肠胃外或口服药品的适宜药水和药物成分可以通过口腔或舌下吸收,包括化合物,含有有效成分的重量从大约0.1%到大约99%,以及赋形剂。
本发明的药物制剂采用业内众所周知的方式制造。例如:药物制剂可以通过常规的混合、粒化、糖衣丸、溶剂、或冻干方法制造。使用的方法最终取决于使用的活性成分的物理性质。
实施例5:从表达APOBEC3G变异体的细胞中生产出的病毒无法进行复制。
病毒感染性测定的方法在文献“A single amino acid substitution in humanAPOBEC3G antiretroviral enzyme confers resistance to HIV-1 virion infectivityfactor-induced depletion.”(Xu et al.,2004)中有详细的描述。
基于细胞的测定、基于膜囊的测定以及基于膜片断的测定可以用来识别在Vif调介的APOBEC3G降解途径中影响交互作用的化合物。表达Vif或APOBEC3G的细胞系,或者包含了上述蛋白质的一个域或片断(或它们的组合体)的融合蛋白质,或通过基因工程来表达蛋白质或融合蛋白质(例如:通过APOBEC3G或VifDNA的转染或转导)的细胞系(例如:COS细胞、CHO细胞、HEK293细胞等),都可以被使用。影响降解途径的测试化合物,例如:可以通过监控APOBEC3G、或者包含了域或片断的融化蛋白质的水平或量的变化或转换率来检测。
对于基于细胞的测定,大约20,000~250,000个细胞被理想的病原菌所感染,例如HIV-1,潜伏期持续3-7天。试验试剂可以在感染了病毒的前中后期应用于细胞。使用的病毒和试剂量的可以由娴熟技工来测定。在一些情况下,潜在治疗剂的几种不同的剂量可以用来识别最佳的剂量范围。转染后,执行化验来测定不同试剂下细胞对感染的抵抗性。
例如,HIV-1抗原的存在可以使用HIV-1蛋白质的特效抗原来测定,然后检测抗体。HIV-1抗体的举例包括在ELISA试剂盒(Perkin-Elmer)中针对HIV的p24的抗体,和针对H1V-1 Vif蛋白质的抗H1V-1 HXB2 Vif抗血清(Dana Gabuzda,Dana-Farber癌症研究所),可通过美国国立卫生研究所(NIH)国立过敏与传染病研究所(NIAID)爱滋病研究部的爱滋病试剂与推荐计划获得。举一个例子,专门与HIV-1蛋白质相结合的抗体被加上标记,例如可检测的标记光团等。或者,抗体也可以采用含标记的第二抗体来检测。然后,检测绑结抗体的存在性,例如:使用显微镜法、流式细胞术和ELISA。测定可以设计为有助于高通量测定。细胞可以在适宜的容器中培养,适宜采用高通筛选的容器(例如:多孔盘)。
本发明还公开了其他一些A3G变异体的核苷酸和氨基酸序列:129位上有变异的是A3G-CD系列;129位上无变异的为A3G-C系列,作为对照。
A3G-CD系列与A3G-P129D的相似率为:
similarity between two molecules
                         DNA     protein
A3G-P129D    A3G-CD1     89%    79%
A3G-P129D    A3G-CD2     93%    87%
A3G-P129D    A3G-CD3     95%    91%
A3G-P129D    A3G-CD4     96%    93%
A3G-P129D    A3G-CD5     98%    97%
A3G-P129D    A3G-CD6     99%    99%
图5显示了这些变异体在HIV-1或HIV-2 Vif存在或缺少的情况下抑制HIV复制的能力。从图5可以看出,129位上有变异的是A3G-CD系列抑制HIV复制的效果较好。
阿朴脂蛋白B mRNA编辑的酶催化多肽类3G(APOBEC3G),最初被确定为CEM15,是一种具有很强的抗病毒活性的宿主细胞蛋白,其cDNA序列被几个实验室先后确定(Sheehy et al.,2002)(Harris et al.,2003),并被克隆进质粒pcDNA-APO3G(由Dr.KlauseStrebel of NIH完成)。本发明中的所有APOBEC3G变异体都是由在该质粒的基础上进行特定位点的氨基酸替代而来。我们使用“多位点突变试剂盒(Stratagene)”根据生产厂商的说明书进行操作,或使用基于PCR的变异法用以生成APOBEC3G突变体。该步骤的产物为:带APOBEC3G变异体的表达载体(质粒)。我们使用DNA测序来鉴定这些载体,以确定其带有我们所需的APOBEC3G的变异体。
以下是本发明中所采用的一些实验方法,可作为本领域普通技术人员实现本发明的参考,但实现本发明的实验方法不限于以下的描述:
一、DNA质粒的转化
1、将100μl感受态细胞冰浴10分钟;
2、加入5-10μg DNA质粒,继续冰浴20~30分钟;
3、在42℃水浴槽中加温45-90秒,然后快速放回冰上1-2分钟;
4、加入900ml LB或SOC培养基,37℃摇床温育60分钟;
5、取100μl培养液均匀涂抹在含抗生素(Amp+)的培养皿上,37℃孵箱温育16小时(O/N)。
6、(可取舍步骤)将剩余的900μl培养液离心沉淀,涂抹在另一个培养皿上,37℃,O/N。(以备菌落太少时使用)
二、转化DNA的鉴定
1、挑取若干单个菌落分别接种在母板和1.5ml或5ml LB培养基中。(培养基内含相应抗生素,Amp+)
2、将母板放置37℃孵箱温育16小时;
3、将接种的培养基在37℃摇床中温育16小时;
4、第二天进行质粒DNA的小量制备,下面是Qiagen公司的QIAprep spin MiniprepKit(Cat 27104)的制备步骤:
(1)将培养基离心沉淀,13K,30”,收取细菌沉淀块;
(2)加入250μl P1缓冲液,重新悬浮细菌沉淀块;
(3)加入250μl P2缓冲液,上下倒置试管5-6次;
(4)加入350μl P3缓冲液,上下倒置试管5-6次;
(5)高速离心,13K,10’;
(6)小心将上清液转移到QIAprep过滤管柱中,离心30”;
(7)加入750μl PB缓冲液,清洗QIAprep过滤管柱,离心30”-60”;
(8)将过滤液倒弃,继续离心1分钟,13K;
(9)将QIAprep过滤管柱放到另一个干净的1.5ml离心管中,加入50μl或100μlddH2O(或EB缓冲液),放置1分钟后,13K离心1分钟;
(10)将所制备的DNA质粒放在-20℃冰柜中存放。
5、质粒的鉴定
(1)进行限制酶切分析;
(2)进行DNA测序;
(3)杂交筛选等其他方法。
三、DNA质粒的扩增和大量制备
1、在母板上排选一个正确的DNA质粒菌落,接种在5ml LB培养基中(含相应抗生素),在37℃摇床中温育6-8小时;
2、取100μl上述培养液加到500ml LB培养基中(含相应抗生素),在37℃摇床中温育16小时;
3、第二天进行DNA质粒的大量制备,下面Qiagen Plasmid Max Kit(Cat 12162)的制备步骤:
(1)离心6000g,15分钟,沉淀收集细菌;
(2)加入10ml P1缓冲液,重新悬浮沉淀的细菌;
(3)加入10ml P2缓冲液,温和混匀后放置3-5分钟;
(4)加入10ml P3缓冲液(4℃),混匀后冰浴20-30分钟;
(5)离心:20000g,30分钟,4℃;
(6)小心收取上清液。(若含有较多的浮渣,可再次离心或过滤);
(7)加入10ml QBT缓冲液到Qiagen-tip 500过滤柱中;
(8)当QBT缓冲液滴光时,加上步骤(6)上清液到过滤柱中;
(9)当上清液滴光时,用2×30ml QC缓冲液清洗过滤柱;
(10)用15ml QF缓冲液洗脱DNA;
(11)在上述洗脱液中加入10.5ml异丙醇,混匀后高速离心沉淀DNA质粒,≥15000×30’,4℃;
(12)小心倒去液体,加入5ml 75%酒精溶液;
(13)高速离心,≥15000×30’,4℃;
(14)小心倒去酒精溶液,将离心倒置5-10分钟;
(15)加入500μl ddH2O溶解DNA质粒后,存储在-20℃冰柜中。
四、转染
a.使用磷酸钙法(Sambrook and Russell,2001)表达载体转染宿主细胞。
(一)储备溶液制备:
1、2M CaCl2溶液,0.22μm过滤;
2、2×Hepes溶液:280mM NaCl
                 50mM Hepes
                 1.5mM Na2HPO4
调节pH值至7.1±0.02,0.22μm过滤;
(二)工作溶液制备:
1、溶液I
10cm培养皿(或者6孔板*)
ddH2O           597.7μl(upto 700μl)
2M CaCl2        86.8μl
DNA(in H2O)     根据需要(例如,表1中的DNA构成)
(*一个10cm培养皿相当于一个六孔板)
2、溶液II
2×Hepes溶液  700μl
(三)转染液制备:
将溶液I逐滴加入溶液II,混匀后置于室温下20分钟。
(四)转染细胞
1、293T细胞的准备
用1/2的10cm培养皿的细胞(80-90%饱和度),分到2块6孔板中,每孔中用3ml细胞培养液;
(1)即分即用:在转染前6小时分细胞,转染时不用更换培养液;
(2)隔夜分:在转染前夜分细胞,转染前需更换培养液。
2、制备溶液I
(一个10cm细胞培养皿=一个6孔板,一孔6孔板=1/6 10cm培养皿)
表1 在测定APOBEC3G变异体的抗病毒能力的试验中使用的质粒及其用量
sample  HIV_GFP VSVg cHelp cHelp_d_vif ApoWT D128K P129D P129F macVif RodVif
(1) 20μg 4μg 15μg 4μg
(2) 20μg 4μg 15μg 4μg
(3) 20μg 4μg 15μg 4μg
(4) 20μg 4μg 15μg 4μg
(5) 20μg 4μg 15μg 4μg
(6) 20μg 4μg 15μg 4μg
(7) 20μg 4μg 15μg 4μg
(8) 20μg 4μg 15μg 4μg
(9) 20μg 4μg 4μg 8μg
(10) 20μg 4μg 4μg 8μg
表2  生产HIV-GFP病毒试验中使用的质粒及其用量
Mi×I 1×10cm dish 2×10cm dish Concentration Volume(2 plates)
H2O 592.7μl 1185.4μl (1) 1185.4μl
CaCl2 86.8μl 173.6μl (1) 173.6μl
HIV_GFP 20μg 40μg 0.95μg/μl 42.105μl
VSVg 4 8 1.01μg/μl 7.921μl
Sunnary 1409.026μl
Each well 117.419μl
3、转染:
(1)制备转染用溶液I
(2)用移液管将溶液I滴注入溶液II(均匀缓慢地进行,每滴一滴,摇动一次)
(3)溶液I和溶液II混合液在室温下放置20分钟;
(4)(如果是隔夜分的细胞,则需要更换新鲜的细胞培养液)
(5)将步骤(3)的混合液均匀地滴注入6孔板细胞槽中(轻轻摇匀,在显微镜下可看到均匀细致的结晶颗粒)
(6)37℃,5%CO2,孵育8小时或O/N;
(7)小心吸去培养液,沿壁小心加入3ml新的培养液;
(8)37℃,5%CO2,孵育48小时;
(9)用5ml塑料针筒轻轻吸取细胞培养液,经0.45μm过滤后收集到2ml离心管内,以供病毒感染实验或储存在-20℃(短期)或液氮(长期)中;
4、GFP细胞观察:在转染后24小时,在荧光显微镜下可观察到GFP细胞。
b.宿主细胞的培养增殖的步骤;
已转染的细胞可用neomycin(300μg/ml)来进行筛选,然后置于37度CO2孵箱中让其生长。
五、在宿主细胞中的表达目标产物的步骤;
将表达质粒转染入细胞,APOBEC3G即可表达。
六、表达产物鉴定及生物学活性测定的步骤和结果。
1)使用标准的免疫印迹试验(Sambrook and Russell,2001)来检测该蛋白的表达。在试验中我们使用APOBEC3G多克隆抗体来检测该蛋白。
2)使用APOBEC3G活性试验来测定APOBEC3G变异体的活性。APOBEC3G活性试验的方法在发明人的论文(Svarovskaia et al.,2004)中有详尽的描述。
七、病毒的感染
1、在实验前6小时候,将293T细胞分到二块6孔板内;
2、在每个孔槽内加入0.5ml经0.45μm过滤的细胞转染培养液;
3、37℃,5%CO2,孵育6小时后,加入3ml细胞培养液;
4、37℃,5%CO2,孵育48小时;
5、小心移走细胞培养液,用3ml 1×PBS洗涤一次;
6、加入0.5ml用PBS制备的胰蛋白酶,将细胞收集到1.5ml离心管内。
7、加入0.1ml用PBS制备的6%福尔马林溶液,送检FACS
参考文献
Harris,R.S.,Bishop,K.N.,Sheehy,A.M.,Craig,H.M.,Petersen-Mahrt,S.K.,Watt,I.N.,Neuberger,M.S.,and Malim,M.H.(2003).DNA deamination mediates innate immunityto retroviral infection.Cell 113(6),803-9.
Sambrook,J.,and Russell,D.W.(2001).″Molecular Cloning:A Laboratory Manual.″Third Edition ed.,3.3 vols.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NewYork.
Sheehy,A.M.,Gaddis,N.C.,Choi,J.D.,and Malim,M.H.(2002).Isolation of ahuman gene that inhibits HIV-1 infection and is suppressed by the viral Vif protein.Nature418(6898),646-50.
Svarovskaia,E.S.,Xu,H.,Mbisa,J.L.,Barr,R.,Gorelick,R.J.,Ono,A.,Freed,E.O.,Hu,W.S.,and Pathak,V.K.(2004).Human apolipoprotein B mRNA-editingenzyme-catalytic polypeptide-like 3G(APOBEC3G)is incorporated into HIV-1 virionsthrough interactions with viral and nonviral RNAs.J Biol Chem 279(34),35822-8.
Xu,H.,Svarovskaia,E.S.,Barr,R.,Zhang,Y.,Khan,M.A.,Strebel,K.,and Pathak,V.K.(2004).A single amino acid substitution in human APOBEC3G antiretroviral enzymeconfers resistance to HIV-1 virion infectivity factor-induced depletion.Proc Natl Acad Sci US A 101(15),5652-7.
Harris,R.S.,Bishop,K.N.,Sheehy,A.M.,Craig,H.M.,Petersen-Mahrt,S.K.,Watt,I.N.,Neuberger,M.S.,and Malim,M.H.(2003).DNA deamination mediates innate immunityto retroviral infection.Cell 113(6),803-9.
Sambrook,J.,and Russell,D.W.(2001).″Molecular Cloning:A Laboratory Manual.″Third Edition ed.,3.3 vols.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NewYork.
Sheehy,A.M.,Gaddis,N.C.,Choi,J.D.,and Malim,M.H.(2002).Isolation of ahuman gene that inhibits HIV-1 infection and is suppressed by the viral Vif protein.Nature418(6898),646-50.
Svarovskaia,E.S.,Xu,H.,Mbisa,J.L.,Barr,R.,Gorelick,R.J.,Ono,A.,Freed,E.O.,Hu,W.S.,and Pathak,V.K.(2004).Human apolipoprotein B mRNA-editingenzyme-catalytic polypeptide-like 3G(APOBEC3G)is incorporated into HIV-1 virionsthrough interactions with viral and nonviral RNAs.J Biol Chem 279(34),35822-8.
序列表说明:
SEQ ID No.1是P129A核苷酸序列
SEQ ID No.2是P129A氨基酸序列
SEQ ID No.3是P129G核苷酸序列
SEQ ID No.4是P129G氨基酸序列
SEQ ID No.5是P129D核苷酸序列
SEQ ID No.6是P129D氨基酸序列
SEQ ID No.7是P129F核苷酸序列
SEQ ID No.8是P129F氨基酸序列
SEQ ID No.9是D128K核苷酸序列
SEQ ID No.10是D128K氨基酸序列
SEQ ID No.11是A3G_C1的核苷酸序列
SEQ ID No.12是A3G_C1的氨基酸序列
SEQ ID No.13是A3G_C2的核苷酸序列
SEQ ID No.14是A3G_C2的氨基酸序列
SEQ ID No.15是A3G_C3的核苷酸序列
SEQ ID No.16是A3G_C3的氨基酸序列
SEQ ID No.17是A3G_C4的核苷酸序列
SEQ ID No.18是A3G_C4的氨基酸序列
SEQ ID No.19是A3G_C5的核苷酸序列
SEQ ID No.20是A3G_C5的氨基酸序列
SEQ ID No.21是A3G_C6的核苷酸序列
SEQ ID No.22是A3G_C6的氨基酸序列
SEQ ID No.23是A3G_CD1的核苷酸序列
SEQ ID No.24是A3G_CD1的氨基酸序列
SEQ ID No.25是A3G_CD2的核苷酸序列
SEQ ID No.26是A3G_CD2的氨基酸序列
SEQ ID No.27是A3G_CD3的核苷酸序列
SEQ ID No.28是A3G_CD3的氨基酸序列
SEQ ID No.29是A3G_CD4的核苷酸序列
SEQ ID No.30是A3G_CD4的氨基酸序列
SEQ ID No.31是A3G_CD5的核苷酸序列
SEQ ID No.32是A3G_CD5的氨基酸序列
SEQ ID No.33是A3G_CD6的核苷酸序列
SEQ ID No.34是A3G_CD6的氨基酸序列
SEQ ID No.35是APOBEC3G野生型的cDNA核苷酸序列(基因库的索引号BC024268)
SEQ ID No.36是与SEQ ID No.35相对应的氨基酸序列
SEQ ID No.37是APOBEC3G His核苷酸序列
SEQ ID No.38是与SEQ ID No.37相对应的氨基酸序列
序列表
<110>时旭生物医药科技(上海)有限公司
<120>抑制HIV复制的突变型APOBEC3G分子及其应用
<160>38
<210>1
<211>1241
<212>DNA
<213>人工序列
<220>
<223>APOBEC3G P129A mutant
<220>
<221>CDS
<222>(5)..(1231)
<400>1
aagg atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac aca   52
     Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
     1               5                   10                  15
ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg aat acc  100
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
            20                  25                  30
gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca agg ccc cct  148
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
        35                  40                  45
ttg gac gca aag atc ttt cga ggc cag gtg tat tcc gaa ctt aag tac  196
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
    50                  55                  60
cac cca gag atg aga ttc ttc cac tgg ttc agc aag tgg agg aag ctg  244
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
cat cgt gac cag gag tat gag gtc acc tgg tac ata tcc tgg agc ccc  292
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
tgc aca aag tgt aca agg gat atg gcc acg ttc ctg gcc gag gac ccg  340
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
aag gtt acc ctg acc atc ttt gtt gcc cgc ctc tac tac ttc tgg gac  388
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
gca gat tac cag gag gcg ctt cgc agc ctg tgt cag aaa aga gac ggt  436
Ala Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
ccg cgt gcc acc atg aag atc atg aat tat gac gaa ttt cag cac tgt  484
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
tgg agc aag ttc gtg tac agc caa aga gag cta ttt gag cct tgg aat  532
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
aat ctg cct aaa tat tat ata tta ctg cac atc atg ctg ggg gag att  540
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
ctc aga cac tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat  628
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
gaa cct tgg gtc aga gga cgg cat gag act tac ctg tgt tat gag gtg  676
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
    210                 215                 220
gag cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cgc agg ggc  724
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
ttt cta tgc aac cag gct cca cat aaa cac ggt ttc ctt gaa ggc cgc  772
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
cat gca gag ctg tgc ttc ctg gac gtg att ccc ttt tgg aag ctg gac  820
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
ctg gac cag gac tac agg gtt acc tgc ttc acc tcc tgg agc ccc tgc  868
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
ttc agc tgt gcc cag gaa atg gct aaa ttc att tca aaa aac aaa cac    916
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
gtg agc ctg tgc atc ttc act gcc cgc atc tat gat gat caa gga aga    964
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
tgt cag gag ggg ctg cgc acc ctg gcc gag gct ggg gcc aaa att tca   1012
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
ata atg aca tac agt gaa ttt aag cac tgc tgg gac acc ttt gtg gac   1060
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
cac cag gga tgt ccc ttc cag ccc tgg gat gga cta gat gag cac agc   1108
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
caa gac ctg agt ggg agg ctg cgg gcc att ctc cag aat cag gaa aac   1156
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Aag ctt ggg ccc gaa caa aaa ctc atc tca gaa gag gat ctg aat agc   1204
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
gcc gtc gac cat cat cat cat cat cat tgagtttaaa      1241
Ala Val Asp His His His His His His
                405
<210>2
<211>409
<212>PRT
<213>人工序列
<220>
<223>APOBEC3G P129A mutant
<400>2
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1                5                  10                  15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
             20                 25                  30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
         35                 40                  45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
     50                 55                  60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
Ala Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu eys Tyr Glu Val
    210                 215                 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
lIe Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
Ala Val Asp His His His His His His
                405
<210>3
<211>1241
<212>DNA
<213>人工序列
<220>
<223>APOBEC3G P129G mutant
<220>
<221>CDS
<222>(5)..(1231)
<400>3
aagg atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac aca  52
     Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
     1               5                    10                 15
ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg aat acc  100
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
            20                  25                  30
gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca agg ccc cct  148
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
        35                  40                  45
ttg gac gca aag atc ttt cga ggc cag gtg tat tcc gaa ctt aag tac  196
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
    50                  55                  60
cac cca gag atg aga ttc ttc cac tgg ttc agc aag tgg agg aag ctg  244
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
cat cgt gac cag gag tat gag gtc acc tgg tac ata tcc tgg agc ccc  292
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
tgc aca aag tgt aca agg gat atg gcc acg ttc ctg gcc gag gac ccg  340
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
aag gtt acc ctg acc atc ttt gtt gcc cgc ctc tac tac ttc tgg gac  388
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
ggc gat tac cag gag gcg ctt cgc agc ctg tgt cag aaa aga gac ggt  436
Gly Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
ccg cgt gcc acc atg aag atc atg aat tat gac gaa ttt cag cac tgt  484
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
tgg agc aag ttc gtg tac agc caa aga gag cta ttt gag cct tgg aat  532
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
aat ctg cct aaa tat tat ata tta ctg cac atc atg ctg ggg gag att    580
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
ctc aga cac tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat    628
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
gaa cct tgg gtc aga gga cgg cat gag act tac ctg tgt tat gag gtg    676
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
    210                 215                 220
gag cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cgc agg ggc    724
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
ttt cta tgc aac cag gct cca cat aaa cac ggt ttc ctt gaa ggc cgc    772
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
cat gca gag ctg tgc ttc ctg gac gtg att ccc ttt tgg aag ctg gac    820
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
ctg gac cag gac tac agg gtt acc tgc ttc acc tcc tgg agc ccc tgc    868
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
ttc agc tgt gcc cag gaa atg gct aaa ttc att tca aaa aac aaa cac    916
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
gtg agc ctg tgc atc ttc act gcc cgc atc tat gat gat caa gga aga    964
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
tgt cag gag ggg ctg cgc acc ctg gcc gag gct ggg gcc aaa att tca   1012
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
ata atg aca tac agt gaa ttt aag cac tgc tgg gac acc ttt gtg gac   1060
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
cac cag gga tgt ccc ttc cag ccc tgg gat gga cta gat gag cac agc  1108
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
caa gac ctg agt ggg agg ctg cgg gcc att ctc cag aat cag gaa aac  1156
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Aag ctt ggg ccc gaa caa aaa ctc atc tca gaa gag gat ctg aat agc  1204
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
gcc gtc gac cat cat cat cat cat cat tgagtttaaa     1241
Ala Val Asp His His His His His His
                405
<210>4
<211>409
<212>PRT
<213>人工序列
<220>
<223>APOBEC3G P129G mutant
<400>4
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1               5                   10                  15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
            20                  25                  30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
        35                  40                  45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
    50                  55                  60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
Gly Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
    210                 215                 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
lIe Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
Ala Val Asp His His His His His His
<210>5
<211>1241
<212>DNA
<213>人工序列
<220>
<223>APOBEC3G P129D mutant
<220>
<221>CDS
<222>(5)..(1231)
<400>5
aagg atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac aca   52
     Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
     1               5                   10                  15
ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg aat acc  100
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
            20                  25                  30
gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca agg ccc cct  148
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
        35                  40                  45
ttg gac gca aag atc ttt cga ggc cag gtg tat tcc gaa ctt aag tac  196
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
    50                  55                  60
cac cca gag atg aga ttc ttc cac tgg ttc agc aag tgg agg aag ctg  244
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
cat cgt gac cag gag tat gag gtc acc tgg tac ata tcc tgg agc ccc  292
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
tgc aca aag tgt aca agg gat atg gcc acg ttc ctg gcc gag gac ccg    340
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
aag gtt acc ctg acc atc ttt gtt gcc cgc ctc tac tac ttc tgg gac    388
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
gac gat tac cag gag gcg ctt cgc agc ctg tgt cag aaa aga gac ggt    436
Asp Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
ccg cgt gcc acc atg aag atc atg aat tat gac gaa ttt cag cac tgt    484
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
tgg agc aag ttc gtg tac agc caa aga gag cta ttt gag cct tgg aat    532
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
aat ctg cct aaa tat tat ata tta ctg cac atc atg ctg ggg gag att    580
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
ctc aga cac tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat    628
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
gaa cct tgg gtc aga gga cgg cat gag act tac ctg tgt tat gag gtg    676
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
    210                 215                 220
gag cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cgc agg ggc    724
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
ttt cta tgc aac cag gct cca cat aaa cac ggt ttc ctt gaa ggc cgc    772
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
cat gca gag ctg tgc ttc ctg gac gtg att ccc ttt tgg aag ctg gac    820
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
ctg gac cag gac tac agg gtt acc tgc ttc acc tcc tgg agc ccc tgc   868
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
ttc agc tgt gcc cag gaa atg gct aaa ttc att tca aaa aac aaa cac   916
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
gtg agc ctg tgc atc ttc act gcc cgc atc tat gat gat caa gga aga   964
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
tgt cag gag ggg ctg cgc acc ctg gcc gag gct ggg gcc aaa att tca  1012
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
ata atg aca tac agt gaa ttt aag cac tgc tgg gac acc ttt gtg gac  1060
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
cac cag gga tgt ccc ttc cag ccc tgg gat gga cta gat gag cac agc  1108
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
         355                 360                 365
caa gac ctg agt ggg agg ctg cgg gcc att ctc cag aat cag gaa aac  1156
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Aag ctt ggg ccc gaa caa aaa ctc atc tca gaa gag gat ctg aat agc  1204
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
gcc gtc gac cat cat cat cat cat cat tgagtttaaa    1241
Ala Val Asp His His His His His His
                405
<210>6
<211>409
<212>PRT
<213>人工序列
<220>
<223>APOBEC3G P129D mutant
<400>6
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1               5                   10                  15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
            20                  25                  30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
        35                  40                  45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
    50                  55                  60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
Asp Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
    210                 215                 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
lIe Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
Ala Val Asp His His His His His His
                405
<210>7
<211>1241
<212>DNA
<213>人工序列
<220>
<223>APOBEC3G P129F mutant
<220>
<221>CDS
<222>(5)..(1231)
<400>7
aagg atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac aca  52
     Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
     1               5                   10                  15
ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg aat acc  100
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
            20                  25                  30
gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca agg ccc cct  148
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
        35                  40                  45
ttg gac gca aag atc ttt cga ggc cag gtg tat tcc gaa ctt aag tac  196
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
    50                  55                  60
cac cca gag atg aga ttc ttc cac tgg ttc agc aag tgg agg aag ctg  244
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
cat cgt gac cag gag tat gag gtc acc tgg tac ata tcc tgg agc ccc  292
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
tgc aca aag tgt aca agg gat atg gcc acg ttc ctg gcc gag gac ccg  340
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
aag gtt acc ctg acc atc ttt gtt gcc cgc ctc tac tac ttc tgg gac  388
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
ttc gat tac cag gag gcg ctt cgc agc ctg tgt cag aaa aga gac ggt  436
Phe Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
ccg cgt gcc acc atg aag atc atg aat tat gac gaa ttt cag cac tgt  484
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
tgg agc aag ttc gtg tac agc caa aga gag cta ttt gag cct tgg aat    532
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
aat ctg cct aaa tat tat ata tta ctg cac atc atg ctg ggg gag att    580
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
ctc aga cac tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat    628
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
gaa cct tgg gtc aga gga cgg cat gag act tac ctg tgt tat gag gtg    676
Glu Pro Trp Va1 Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
    210                 215                 220
gag cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cgc agg ggc    724
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
ttt cta tgc aac cag gct cca cat aaa cac ggt ttc ctt gaa ggc cgc    772
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
cat gca gag ctg tgc ttc ctg gac gtg att ccc ttt tgg aag ctg gac    820
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
ctg gac cag gac tac agg gtt acc tgc ttc acc tcc tgg agc ccc tgc    868
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
ttc agc tgt gcc cag gaa atg gct aaa ttc att tca aaa aac aaa cac    916
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
gtg agc ctg tgc atc ttc act gcc cgc atc tat gat gat caa gga aga    964
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
tgt cag gag ggg ctg cgc acc ctg gcc gag gct ggg gcc aaa att tca   1012
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
ata atg aca tac agt gaa ttt aag cac tgc tgg gac acc ttt gtg gac  1060
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
cac cag gga tgt ccc ttc cag ccc tgg gat gga cta gat gag cac agc  1108
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
caa gac ctg agt ggg agg ctg cgg gcc att ctc cag aat cag gaa aac  1156
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Aag ctt ggg ccc gaa caa aaa ctc atc tca gaa gag gat ctg aat agc  1204
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
gcc gtc gac cat cat cat cat cat cat tgagtttaaa     1241
Ala Val Asp His His His His His His
                405
<210>8
<211>409
<212>PRT
<213>人工序列
<220>
<223>APOBEC3G P129F mutant
<400>8
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1               5                   10                  15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
            20                  25                  30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
        35                  40                  45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
    50                  55                  60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
Phe Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
           180                 185                 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
    210                 215                 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
lIe Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
Ala Val Asp His His His His His His
                405
<210>9
<211>1241
<212>DNA
<213>人工序列
<220>
<223>APOBEC3G D128K mutant
<220>
<221>CDS
<222>(5)..(1231)
<400>9
aagg atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac aca   52
     Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
     1               5                   10                  15
ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg aat acc  100
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
                20                  25                  30
gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca agg ccc cct  148
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
            35                  40                  45
ttg gac gca aag atc ttt cga ggc cag gtg tat tcc gaa ctt aag tac  196
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
        50                  55                  60
cac cca gag atg aga ttc ttc cac tgg ttc agc aag tgg agg aag ctg  244
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
cat cgt gac cag gag tat gag gtc acc tgg tac ata tcc tgg agc ccc  292
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
tgc aca aag tgt aca agg gat atg gcc acg ttc ctg gcc gag gac ccg  340
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
aag gtt acc ctg acc atc ttt gtt gcc cgc ctc tac tac ttc tgg aag  388
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Lys
        115                 120                 125
cca gat tac cag gag gcg ctt cgc agc ctg tgt cag aaa aga gac ggt  436
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
ccg cgt gcc acc atg aag atc atg aat tat gac gaa ttt cag cac tgt  484
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
tgg agc aag ttc gtg tac agc caa aga gag cta ttt gag cct tgg aat  532
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
aat ctg cct aaa tat tat ata tta ctg cac atc atg ctg ggg gag att  580
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
ctc aga cac tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat  628
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
gaa cct tgg gtc aga gga cgg cat gag act tac ctg tgt tat gag gtg  676
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
    210                 215                 220
gag cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cgc agg ggc  724
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
ttt cta tgc aac cag gct cca cat aaa cac ggt ttc ctt gaa ggc cgc    772
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
cat gca gag ctg tgc ttc ctg gac gtg att ccc ttt tgg aag ctg gac    820
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
ctg gac cag gac tac agg gtt acc tgc ttc acc tcc tgg agc ccc tgc    868
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
ttc agc tgt gcc cag gaa atg gct aaa ttc att tca aaa aac aaa cac    916
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
gtg agc ctg tgc atc ttc act gcc cgc atc tat gat gat caa gga aga    964
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
tgt cag gag ggg ctg cgc acc ctg gcc gag gct ggg gcc aaa att tca   1012
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
ata atg aca tac agt gaa ttt aag cac tgc tgg gac acc ttt gtg gac   1060
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
cac cag gga tgt ccc ttc cag ccc tgg gat gga cta gat gag cac agc   1108
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
caa gac ctg agt ggg agg ctg cgg gcc att ctc cag aat cag gaa aac   1156
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Aag ctt ggg ccc gaa caa aaa ctc atc tca gaa gag gat ctg aat agc   1204
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
gcc gtc gac cat cat cat cat cat cat tgagtttaaa     1241
Ala Val Asp His His His His His His
                405
<210>10
<211>409
<212>PRT
<213>人工序列
<220>
<223>APOBEC3G D128K mutant
<400>10
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1               5                   10                  15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
            20                  25                  30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
        35                  40                  45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
    50                  55                  60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Lys
        115                 120                 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu eys Tyr Glu Val
    210                 215                 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
lIe Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
Ala Val Asp His His His His His His
                405
<210>11
<211>1131
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1131)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>11
atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac   45
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
aca ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg   90
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
agg ccc cct ttg gac gca aag atc ttt cga ggc cag gtg tat tcc  180
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
gaa ctt aag tac cac cca gag atg aga ttc ttc cac tgg ttc agc  225
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
aag tgg agg aag ctg cat cgt gac cag gag tat gag gtc acc tgg  270
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac ata tcc tgg agc ccc tgc aca aag tgt aca agg gat atg gcc  315
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttc gtt  360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac cca gat tac cag gag gcg ctt  405
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu
                125                 130                 135
cgc agc ctg tgt cag aaa aga gac ggt ccg cgt gcc acc atg aag  450
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
atc atg aat tat aac gaa ttt caa cac tgt tgg aac gag ttc gtg  495
Ile Met Asn Tyr Asn Glu Phe Gln His Cys Trp Asn Glu Phe Val
                155                 160                 165
gac ggc caa gga aag cca ttt aag cct cgg aag aac ctg cct aaa  540
Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys Asn Leu Pro Lys
                170                 175                 180
cat tat aca tta ctg cac gcc acg ctg ggg gag ctt ctc aga cat  585
His Tyr Thr Leu Leu His Ala Thr Leu Gly Gly Leu Leu Arg His
                185                 190                 195
gtg atg gat cca ggc acg ttc act tcc aac ttt aac aat aaa cct  630
Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
tgg gtc agt gga cag cgt gag act tac ctg tgt tac aag gtg gag  675
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Lys Tyr Lys Val Glu
                215                 220                 225
cgc tcg cac aat gac acc tgg gtc ctg ctg aac cag cac agg ggc  720
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
ttt cta cgc aac cag gct cca gat aga cac ggt ttc cct aaa ggc  765
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac ctg att ccc ttt tgg aag  810
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
ctg gat gac cag caa tac agg gtt acc tgc ttc acc tcc tgg agc  855
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
ccc tgc ttt agc tgt gcc cag aaa atg gct aaa ttc att tca aat  900
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
aac aaa cat gtg agc ttg tgc atc ttc gct gcc cgc atc tat gat  945
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
gat caa gga aga tgt cag gag ggg ctg cgc acc ctg cac agg gat  990
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
ggg gcc aaa att gca gtg atg aac tac agt gaa ttt gag tac tgc 1035
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc tgg 1080
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt cgg 1125
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
gcc att  1131
Ala Ile
<210>12
<211>377
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>12
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1                5                  10                  15
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu
                125                 130                 135
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asn Glu Phe Gln His Cys Trp Asn Glu Phe Val
                155                 160                 165
Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys Asn Leu Pro Lys
                170                 175                 180
His Tyr Thr Leu Leu His Ala Thr Leu Gly Gly Leu Leu Arg His
                185                 190                 195
Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Lys Tyr Lys Val Glu
                215                 220                 225
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
Ala Ile
<210>13
<211>1131
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1131)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>13
atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac   45
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
aca ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg   90
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
agg ccc cct ttg gac gca aag atc ttt cga ggc cag gtg tat tcc  180
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
gaa ctt aag tac cac cca gag atg aga ttc ttc cac tgg ttc agc   225
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
aag tgg agg aag ctg cat cgt gac cag gag tat gag gtc acc tgg   270
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac ata tcc tgg agc ccc tgc aca aag tgt aca agg gat atg gcc   315
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttc gtt   360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac cca gat tac cag gag gcg ctt   405
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu
                125                 130                 135
cgc agc ctg tgt cag aaa aga gac ggt ccg cgt gcc acc atg aag   450
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
atc atg aat tat gac gaa ttt cag cac tgt tgg agc aag ttc gtg   495
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
tac agc caa aga gag cta ttt gag cct tgg aat aat ctg cct aaa   540
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
tat tat ata tta ctg cac atc atg ctg ggg gag att ctc aga cat   585
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
tcg atg gat cca ggc acg ttc act tcc aac ttt aac aat aaa cct   630
Ser Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
tgg gtc agt gga cag cgt gag act tac ctg tgt tac aag gtg gag   675
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Lys Tyr Lys Val Glu
                215                 220                 225
cgc tcg cac aat gac acc tgg gtc ctg ctg aac cag cac agg ggc  720
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
ttt cta cgc aac cag gct cca gat aga cac ggt ttc cct aaa ggc  765
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac ctg att ccc ttt tgg aag  810
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
ctg gat gac cag caa tac agg gtt acc tgc ttc acc tcc tgg agc  855
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
ccc tgc ttt agc tgt gcc cag aaa atg gct aaa ttc att tca aat  900
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
aac aaa cat gtg agc ttg tgc atc ttc gct gcc cgc atc tat gat  945
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
gat caa gga aga tgt cag gag ggg ctg cgc acc ctg cac agg gat  990
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
ggg gcc aaa att gca gtg atg aac tac agt gaa ttt gag tac tgc 1035
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc tgg 1080
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt cgg 1125
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
gcc att  1131
Ala Ile
<210>14
<211>377
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>14
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu
                125                 130                 135
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
Ser Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Lys Tyr Lys Val Glu
                215                 220                 225
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
Ala Ile
<210>15
<211>1131
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1131)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>15
atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac   45
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
aca ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg   90
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
agg ccc cct ttg gac gca aag atc ttt cga ggc cag gtg tat tcc  180
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
gaa ctt aag tac cac cca gag atg aga ttc ttc cac tgg ttc agc  225
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
aag tgg agg aag ctg cat cgt gac cag gag tat gag gtc acc tgg  270
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac ata tcc tgg agc ccc tgc aca aag tgt aca agg gat atg gcc  315
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttc gtt  360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac cca gat tac cag gag gcg ctt  405
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu
                125                 130                 135
cgc agc ctg tgt cag aaa aga gac ggt ccg cgt gcc acc atg aag  450
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
atc atg aat tat gac gaa ttt cag cac tgt tgg agc aag ttc gtg  495
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
tac agc caa aga gag cta ttt gag cct tgg aat aat ctg cct aaa  540
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
tat tat ata tta ctg cac atc atg ctg ggg gag att ctc aga cat  585
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat gaa cct  630
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro
                200                 205                 210
tgg gtc aga gga cag cat gag act tac ctg tgt tat gag gtg gag  675
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cac agg ggc  720
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
ttt cta cgc aac cag gct cca gat aga cac ggt ttc cct aaa ggc  765
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac ctg att ccc ttt tgg aag  810
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
ctg gat gac cag caa tac agg gtt acc tgc ttc acc tcc tgg agc  855
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
ccc tgc ttt agc tgt gcc cag aaa atg gct aaa ttc att tca aat  900
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
aac aaa cat gtg agc ttg tgc atc ttc gct gcc cgc atc tat gat  945
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
gat caa gga aga tgt cag gag ggg ctg cgc acc ctg cac agg gat  990
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
ggg gcc aaa att gca gtg atg aac tac agt gaa ttt gag tac tgc 1035
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc tgg 1080
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt cgg 1125
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
gcc att  1131
Ala Ile
<210>16
<211>377
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>16
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu
                125                 130                 135
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn G1u Pro
                200                 205                 210
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
Ala Ile
<210>17
<211>1134
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1134)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>17
atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac   45
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
aca ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg   90
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
agg ccc cct ttg gac gca aag atc ttt cga ggc cag gtg tat tcc  180
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
gaa ctt aag tac cac cca gag atg aga ttc ttc cac tgg ttc agc  225
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
aag tgg agg aag ctg cat cgt gac cag gag tat gag gtc acc tgg  270
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac ata tcc tgg agc ccc tgc aca aag tgt aca agg gat atg gcc  315
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttc gtt  360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac cca gat tac cag gag gcg ctt  405
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu
                125                 130                 135
cgc agc ctg tgt cag aaa aga gac ggt ccg cgt gcc acc atg aag  450
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
atc atg aat tat gac gaa ttt cag cac tgt tgg agc aag ttc gtg  495
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
tac agc caa aga gag cta ttt gag cct tgg aat aat ctg cct aaa  540
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
tat tat ata tta ctg cac atc atg ctg ggg gag att ctc aga cat  585
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat gaa cct  630
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro
                200                 205                 210
tgg gtc aga gga cag cat gag act tac ctg tgt tat gag gtg gag  675
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cgc agg ggc  720
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
                230                 235                 240
ttt cta tgc aac cag gct cca cat aaa cac ggt ttc ctt gaa ggc  765
Phe Leu Lys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac gtg att ccc ttt tgg aag  810
Arg His Ala Glu Leu Lys Phe Leu Asp Val Ile Pro Phe Trp Lys
                260                 265                 270
ctg gac ctg gac cag gac tac agg gtt acc tgc ttc acc tcc tgg  855
Leu Asp Leu Asp Gln Asp Tyr Arg Val Thr Lys Phe Thr Ser Trp
                275                 280                 285
agc ccc tgc ttc agc tgt gcc cag gaa atg gct aaa ttc att tca  900
Ser Pro Lys Phe Ser Lys Ala Gln Glu Met Ala Lys Phe Ile Ser
                290                 295                 300
aaa aac aaa cac gtg agc ctg tgc atc ttc act gcc cgc atc tat  945
Lys Asn Lys His Val Ser Leu Lys Ile Phe Thr Ala Arg Ile Tyr
                305                 310                 315
gat gat caa gga aga tgt cag gag ggg ctg cgc acc ctg cac agg  990
Asp Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg
                320                 325                 330
gat ggg gcc aaa att gca gtg atg aac tac agt gaa ttt gag tac 1035
Asp Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr
                335                 340                 345
tgc tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc 1080
Lys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
                350                 355                 360
tgg gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt 1125
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu
                365                 370                 375
cgg gcc att                                                 1134
Arg Ala Ile
<210>18
<211>378
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>18
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu
                125                 130                 135
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro
                200                 205                 210
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
Arg Met His Asn Asp Thr Trp Val  Leu Leu Asn Gln Arg Arg Gly
                230                 235                 240
Phe Leu Lys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly
                245                 250                 255
Arg His Ala Glu Leu Lys Phe Leu Asp Val Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Leu Asp Gln Asp Tyr Arg Val Thr Lys Phe Thr Ser Trp
                275                 280                 285
Ser Pro Lys Phe Ser Lys Ala Gln Glu Met Ala Lys Phe Ile Ser
                290                 295                 300
Lys Asn Lys His Val Ser Leu Lys Ile Phe Thr Ala Arg Ile Tyr
                305                 310                 315
Asp Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg
                320                 325                 330
Asp Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr
                335                 340                 345
Lys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
                350                 355                 360
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu
                365                 370                 375
Arg Ala Ile
<210>19
<211>1134
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1134)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>19
atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac   45
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
aca ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg   90
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
agg ccc cct ttg gac gca aag atc ttt cga ggc cag gtg tat tcc  180
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
gaa ctt aag tac cac cca gag atg aga ttc ttc cac tgg ttc agc  225
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
aag tgg agg aag ctg cat cgt gac cag gag tat gag gtc acc tgg  270
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac ata tcc tgg agc ccc tgc aca aag tgt aca agg gat atg gcc  315
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                 100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttc gtt  360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac cca gat tac cag gag gcg ctt  405
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu
                125                 130                 135
cgc agc ctg tgt cag aaa aga gac ggt ccg cgt gcc acc atg aag  450
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
atc atg aat tat gac gaa ttt cag cac tgt tgg agc aag ttc gtg  495
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
tac agc caa aga gag cta ttt gag cct tgg aat aat ctg cct aaa  540
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
tat tat ata tta ctg cac atc atg ctg ggg gag att ctc aga cat  585
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat gaa cct  630
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro
                200                 205                 210
tgg gtc aga gga cag cat gag act tac ctg tgt tat gag gtg gag  675
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cgc agg ggc  720
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
                230                 235                 240
ttt cta tgc aac cag gct cca cat aaa cac ggt ttc ctt gaa ggc  765
Phe Leu Lys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac gtg att ccc ttt tgg aag  810
Arg His Ala Glu Leu Lys Phe Leu Asp Val Ile Pro Phe Trp Lys
                260                 265                 270
ctg gac ctg gac cag gac tac agg gtt acc tgc ttc acc tcc tgg  855
Leu Asp Leu Asp Gln Asp Tyr Arg Val Thr Lys Phe Thr Ser Trp
                275                 280                 285
agc ccc tgc ttc agc tgt gcc cag gaa atg gct aaa ttc att tca  900
Ser Pro Lys Phe Ser Lys Ala Gln Glu Met Ala Lys Phe Ile Ser
                290                 295                 300
aaa aac aaa cac gtg agc ctg tgc atc ttc act gcc cgc atc tat  945
Lys Asn Lys His Val Ser Leu Lys Ile Phe Thr Ala Arg Ile Tyr
                305                 310                 315
gat gat caa gga aga tgt cag gag ggg ctg cgc acc ctg gcc gag  990
Asp Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu Ala Glu
                320                 325                 330
gct ggg gcc aaa att tca ata atg aca tac agt gaa ttt aag cac 1035
Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr Ser Glu Phe Lys His
                335                 340                 345
tgc tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc 1080
Lys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
                350                 355                 360
tgg gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt 1125
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu
                365                 370                 375
cgg gcc att  1134
Arg Ala Ile
<210>20
<211>378
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>20
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu
                125                 130                 135
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro
                200                 205                 210
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
                230                 235                 240
Phe Leu Lys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly
                245                 250                 255
Arg His Ala Glu Leu Lys Phe Leu Asp Val Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Leu Asp Gln Asp Tyr Arg Val Thr Lys Phe Thr Ser Trp
                275                 280                 285
Ser Pro Lys Phe Ser Lys Ala Gln Glu Met Ala Lys Phe Ile Ser
                290                 295                 300
Lys Asn Lys His Val Ser Leu Lys Ile Phe Thr Ala Arg Ile Tyr
                305                 310                 315
Asp Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu Ala Glu
                320                 325                 330
Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr Ser Glu Phe Lys His
                335                 340                 345
Lys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
                350                 355                 360
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu
                365                 370                 375
Arg Ala Ile
<210>21
<211>1131
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1131)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>21
atg aat cct caa atc aga aac atg gtg gag caa atg gaa cca gac   45
Met Asn Pro Gln Ile Arg Asn Met Val Glu Gln Met Glu Pro Asp
1               5                   10                  15
ata ttc gtc tac tac ttc aat aac aga ccc atc ctt tct ggt cgg   90
Ile Phe Val Tyr Tyr Phe Asn Asn Arg Pro Ile Leu Ser Gly Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag gac cct tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Asp Pro Ser
                35                  40                  45
ggg ccc cct ttg gac gca aac atc ttt caa ggc aag ctg tac ccc  180
Gly Pro Pro Leu Asp Ala Asn Ile Phe Gln Gly Lys Leu Tyr Pro
                50                  55                  60
gag gct aag gac cac cca gag atg aag ttc ctc cac tgg ttc cgc  225
Glu Ala Lys Asp His Pro Glu Met Lys Phe Leu His Trp Phe Arg
                65                  70                  75
aag tgg agg cag ctg cat cgt gac cag gag tac gag gtc acc tgg  270
Lys Trp Arg Gln Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac gta tcc tgg agc ccc tgc aca agg tgt gca aac agt gtg gcc  315
Tyr Val Ser Trp Ser Pro Cys Thr Arg Cys Ala Asn Ser Val Ala
                95                  100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttt gtt  360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac cca gat tac cag cag gcg ctt  405
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Gln Ala Leu
                125                 130                 135
cgc atc ctg tgt cag gaa aga ggc ggt ccg cat gcc acc atg aag  450
Arg Ile Leu Cys Gln Glu Arg Gly Gly Pro His Ala Thr Met Lys
                140                 145                 150
atc atg aat tat aac gaa ttt caa cac tgt tgg aac gag ttc gtg  495
Ile Met Asn Tyr Asn Glu Phe Gln His Cys Trp Asn Glu Phe Val
                155                 160                 165
gac ggc caa gga aag cca ttt aag cct cgg aag aac ctg cct aaa  540
Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys Asn Leu Pro Lys
                170                 175                 180
cat tat aca tta ctg cac gcc acg ctg ggg gag ctt ctc aga cat  585
His Tyr Thr Leu Leu His Ala Thr Leu Gly Glu Leu Leu Arg His
                185                 190                 195
gtg atg gat cca ggc acg ttc act tcc aac ttt aac aat aaa cct  630
Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
tgg gtc agt gga cag cgt gag act tac ctg tgt tac aag gtg gag  675
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Cys Tyr Lys Val Glu
                215                 220                 225
cgc tcg cac aat gac acc tgg gtc ctg ctg aac cag cac agg ggc  720
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
ttt cta cgc aac cag gct cca gat aga cac ggt ttc cct aaa ggc  765
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac ctg att ccc ttt tgg aag  810
Arg His Ala Glu Leu Cys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
ctg gat gac cag caa tac agg gtt acc tgc ttc acc tcc tgg agc  855
Leu Asp Asp Gln Gln Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser
                275                 280                 285
ccc tgc ttt agc tgt gcc cag aaa atg gct aaa ttc att tca aat  900
Pro Cys Phe Ser Cys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
aac aaa cat gtg agc ttg tgc atc ttc gct gcc cgc atc tat gat  945
Asn Lys His Val Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
gat caa gga aga tgt cag gag ggg ctg cgc acc ctg cac agg gat  990
Asp Gln Gly Arg Cys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
ggg gcc aaa att gca gtg atg aac tac agt gaa ttt gag tac tgc 1035
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Cys
                335                 340                 345
tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc tgg 1080
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt cgg 1125
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
gcc att  1131
Ala Ile
<210>22
<211>377
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>22
Met Asn Pro Gln Ile Arg Asn Met Val Glu Gln Met Glu Pro Asp
1               5                   10                  15
Ile Phe Val Tyr Tyr Phe Asn Asn Arg Pro Ile Leu Ser Gly Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Asp Pro Ser
                35                  40                  45
Gly Pro Pro Leu Asp Ala Asn Ile Phe Gln Gly Lys Leu Tyr Pro
                50                  55                  60
Glu Ala Lys Asp His Pro Glu Met Lys Phe Leu His Trp Phe Arg
                65                  70                  75
Lys Trp Arg Gln Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Val Ser Trp Ser Pro Cys Thr Arg Cys Ala Asn Ser Val Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Gln Ala Leu
                125                 130                 135
Arg Ile Leu Cys Gln Glu Arg Gly Gly Pro His Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asn Glu Phe Gln His Cys Trp Asn Glu Phe Val
                155                 160                 165
Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys Asn Leu Pro Lys
                170                 175                 180
His Tyr Thr Leu Leu His Ala Thr Leu Gly Glu Leu Leu Arg His
                185                 190                 195
Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Cys Tyr Lys Val Glu
                215                 220                 225
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
Arg His Ala Glu Leu Cys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Asp Gln Gln Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser
                275                 280                 285
Pro Cys Phe Ser Cys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
Asn Lys His Val Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
Asp Gln Gly Arg Cys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Cys
                335                 340                 345
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
Ala Ile
<210>23
<211>1131
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1131)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>23
atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac   45
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
aca ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg   90
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
agg ccc cct ttg gac gca aag atc ttt cga ggc cag gtg tat tcc  180
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
gaa ctt aag tac cac cca gag atg aga ttc ttc cac tgg ttc agc  225
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
aag tgg agg aag ctg cat cgt gac cag gag tat gag gtc acc tgg  270
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac ata tcc tgg agc ccc tgc aca aag tgt aca agg gat atg gcc  315
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttc gtt  360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac gac gat tac cag gag gcg ctt  405
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Glu Ala Leu
                125                 130                 135
cgc agc ctg tgt cag aaa aga gac ggt ccg cgt gcc acc atg aag  450
Arg Ser Leu Cys Gln Lys ArgA sp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
atc atg aat tat aac gaa ttt caa cac tgt tgg aac gag ttc gtg  495
Ile Met Asn Tyr Asn Glu Phe Gln His Cys Trp Asn Glu Phe Val
                155                 160                 165
gac ggc caa gga aag cca ttt aag cct cgg aag aac ctg cct aaa   540
Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys Asn Leu Pro Lys
                170                 175                 180
cat tat aca tta ctg cac gcc acg ctg ggg gag ctt ctc aga cat   585
His Tyr Thr Leu Leu His Ala Thr Leu Gly Gly Leu Leu Arg His
                185                 190                 195
gtg atg gat cca ggc acg ttc act tcc aac ttt aac aat aaa cct   630
Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
tgg gtc agt gga cag cgt gag act tac ctg tgt tac aag gtg gag   675
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Lys Tyr Lys Val Glu
                215                 220                 225
cgc tcg cac aat gac acc tgg gtc ctg ctg aac cag cac agg ggc   720
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
ttt cta cgc aac cag gct cca gat aga cac ggt ttc cct aaa ggc   765
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac ctg att ccc ttt tgg aag   810
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
ctg gat gac cag caa tac agg gtt acc tgc ttc acc tcc tgg agc   855
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
ccc tgc ttt agc tgt gcc cag aaa atg gct aaa ttc att tca aat   900
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
aac aaa cat gtg agc ttg tgc atc ttc gct gcc cgc atc tat gat   945
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
gat caa gga aga tgt cag gag ggg ctg cgc acc ctg cac agg gat   990
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
ggg gcc aaa att gca gtg atg aac tac agt gaa ttt gag tac tgc  1035
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc tgg  1080
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt cgg  1125
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
gcc att  1131
Ala Ile
<210>24
<211>377
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>24
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Glu Ala Leu
                125                 130                 135
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asn Glu Phe Gln His Cys Trp Asn Glu Phe Val
                155                 160                 165
Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys Asn Leu Pro Lys
                170                 175                 180
His Tyr Thr Leu Leu His Ala Thr Leu Gly Gly Leu Leu Arg His
                185                 190                 195
Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Lys Tyr Lys Val Glu
                215                 220                 225
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
Ala Ile
<210>25
<211>1131
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1131)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>25
atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac   45
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
aca ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg   90
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
agg ccc cct ttg gac gca aag atc ttt cga ggc cag gtg tat tcc  180
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
gaa ctt aag tac cac cca gag atg aga ttc ttc cac tgg ttc agc  225
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
aag tgg agg aag ctg cat cgt gac cag gag tat gag gtc acc tgg  270
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac ata tcc tgg agc ccc tgc aca aag tgt aca agg gat atg gcc  315
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttc gtt  360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac gac gat tac cag gag gcg ctt  405
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Glu Ala Leu
                125                 130                 135
cgc agc ctg tgt cag aaa aga gac ggt ccg cgt gcc acc atg aag  450
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
atc atg aat tat gac gaa ttt cag cac tgt tgg agc aag ttc gtg  495
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
tac agc caa aga gag cta ttt gag cct tgg aat aat ctg cct aaa  540
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
tat tat ata tta ctg cac atc atg ctg ggg gag att ctc aga cat  585
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
tcg atg gat cca ggc acg ttc act tcc aac ttt aac aat aaa cct  630
Ser Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
tgg gtc agt gga cag cgt gag act tac ctg tgt tac aag gtg gag  675
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Lys Tyr Lys Val Glu
                215                 220                 225
cgc tcg cac aat gac acc tgg gtc ctg ctg aac cag cac agg ggc  720
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
ttt cta cgc aac cag gct cca gat aga cac ggt ttc cct aaa ggc  765
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac ctg att ccc ttt tgg aag  810
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
ctg gat gac cag caa tac agg gtt acc tgc ttc acc tcc tgg agc  855
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
ccc tgc ttt agc tgt gcc cag aaa atg gct aaa ttc att tca aat  900
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
aac aaa cat gtg agc ttg tgc atc ttc gct gcc cgc atc tat gat  945
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
gat caa gga aga tgt cag gag ggg ctg cgc acc ctg cac agg gat  990
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
ggg gcc aaa att gca gtg atg aac tac agt gaa ttt gag tac tgc 1035
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc tgg 1080
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt cgg 1125
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
gcc att  1131
Ala Ile
<210>26
<211>377
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>26
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Glu Ala Leu
                125                 130                 135
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
Ser Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Lys Tyr Lys Val Glu
                215                 220                 225
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
Ala Ile
<210>27
<211>1131
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1131)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>27
atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac   45
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
aca ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg   90
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
agg ccc cct ttg gac gca aag atc ttt cga ggc cag gtg tat tcc  180
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
gaa ctt aag tac cac cca gag atg aga ttc ttc cac tgg ttc agc  225
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
aag tgg agg aag ctg cat cgt gac cag gag tat gag gtc acc tgg  270
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac ata tcc tgg agc ccc tgc aca aag tgt aca agg gat atg gcc  315
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttc gtt  360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac gac gat tac cag gag gcg ctt  405
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Glu Ala Leu
                125                 130                 135
cgc agc ctg tgt cag aaa aga gac ggt ccg cgt gcc acc atg aag  450
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
atc atg aat tat gac gaa ttt cag cac tgt tgg agc aag ttc gtg  495
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
tac agc caa aga gag cta ttt gag cct tgg aat aat ctg cct aaa  540
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
tat tat ata tta ctg cac atc atg ctg ggg gag att ctc aga cat  585
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat gaa cct  630
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro
                200                 205                 210
tgg gtc aga gga cag cat gag act tac ctg tgt tat gag gtg gag  675
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cac agg ggc  720
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
ttt cta cgc aac cag gct cca gat aga cac ggt ttc cct aaa ggc  765
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac ctg att ccc ttt tgg aag  810
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
ctg gat gac cag caa tac agg gtt acc tgc ttc acc tcc tgg agc  855
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
ccc tgc ttt agc tgt gcc cag aaa atg gct aaa ttc att tca aat  900
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
aac aaa cat gtg agc ttg tgc atc ttc gct gcc cgc atc tat gat  945
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
gat caa gga aga tgt cag gag ggg ctg cgc acc ctg cac agg gat  990
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
ggg gcc aaa att gca gtg atg aac tac agt gaa ttt gag tac tgc 1035
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc tgg  1080
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt cgg  1125
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
gcc att  1131
Ala Ile
<210>28
<211>377
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>28
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Glu Ala Leu
                125                 130                 135
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro
                200                 205                 210
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
Arg His Ala Glu Leu Lys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Asp Gln Gln Tyr Arg Val Thr Lys Phe Thr Ser Trp Ser
                275                 280                 285
Pro Lys Phe Ser Lys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
Asn Lys His Val Ser Leu Lys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Lys
                335                 340                 345
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
Ala Ile
<210>29
<211>1134
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1134)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>29
atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac   45
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                 15
aca ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg   90
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
agg ccc cct ttg gac gca aag atc ttt cga ggc cag gtg tat tcc  180
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
gaa ctt aag tac cac cca gag atg aga ttc ttc cac tgg ttc agc  225
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
aag tgg agg aag ctg cat cgt gac cag gag tat gag gtc acc tgg  270
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac ata tcc tgg agc ccc tgc aca aag tgt aca agg gat atg gcc  315
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttc gtt  360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac gac gat tac cag gag gcg ctt  405
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Glu Ala Leu
                125                 130                 135
cgc agc ctg tgt cag aaa aga gac ggt ccg cgt gcc acc atg aag  450
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
atc atg aat tat gac gaa ttt cag cac tgt tgg agc aag ttc gtg  495
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
tac agc caa aga gag cta ttt gag cct tgg aat aat ctg cct aaa  540
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
tat tat ata tta ctg cac atc atg ctg ggg gag att ctc aga cat  585
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat gaa cct  630
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro
                200                 205                 210
tgg gtc aga gga cag cat gag act tac ctg tgt tat gag gtg gag  675
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cgc agg ggc  720
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
                230                 235                 240
ttt cta tgc aac cag gct cca cat aaa cac ggt ttc ctt gaa ggc  765
Phe Leu Lys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac gtg att ccc ttt tgg aag  810
Arg His Ala Glu Leu Lys Phe Leu Asp Val Ile Pro Phe Trp Lys
                260                 265                 270
ctg gac ctg gac cag gac tac agg gtt acc tgc ttc acc tcc tgg  855
Leu Asp Leu Asp Gln Asp Tyr Arg Val Thr Lys Phe Thr Ser Trp
                275                 280                 285
agc ccc tgc ttc agc tgt gcc cag gaa atg gct aaa ttc att tca  900
Ser Pro Lys Phe Ser Lys Ala Gln Glu Met Ala Lys Phe Ile Ser
                290                 295                 300
aaa aac aaa cac gtg agc ctg tgc atc ttc act gcc cgc atc tat  945
Lys Asn Lys His Val Ser Leu Lys Ile Phe Thr Ala Arg Ile Tyr
                305                 310                 315
gat gat caa gga aga tgt cag gag ggg ctg cgc acc ctg cac agg  990
Asp Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg
                320                 325                 330
gat ggg gcc aaa att gca gtg atg aac tac agt gaa ttt gag tac 1035
Asp Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr
                335                 340                 345
tgc tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc 1080
Lys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
                350                 355                 360
tgg gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt 1125
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu
                365                 370                 375
cgg gcc att  1134
Arg Ala Ile
<210>30
<211>378
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>30
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Glu Ala Leu
                125                 130                 135
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro
                200                 205                 210
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
                230                 235                 240
Phe Leu Lys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly
                245                 250                 255
Arg His Ala Glu Leu Lys Phe Leu Asp Val Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Leu Asp Gln Asp Tyr Arg Val Thr Lys Phe Thr Ser Trp
                275                 280                 285
Ser Pro Lys Phe Ser Lys Ala Gln Glu Met Ala Lys Phe Ile Ser
                290                 295                 300
Lys Asn Lys His Val Ser Leu Lys Ile Phe Thr Ala Arg Ile Tyr
                305                 310                 315
Asp Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu His Arg
                320                 325                 330
Asp Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr
                335                 340                 345
Lys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
                350                 355                 360
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu
                365                 370                 375
Arg Ala Ile
<210>31
<211>1134
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1134)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>31
atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac   45
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
aca ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg   90
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
agg ccc cct ttg gac gca aag atc ttt cga ggc cag gtg tat tcc  180
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
gaa ctt aag tac cac cca gag atg aga ttc ttc cac tgg ttc agc  225
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
aag tgg agg aag ctg cat cgt gac cag gag tat gag gtc acc tgg  270
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac ata tcc tgg agc ccc tgc aca aag tgt aca agg gat atg gcc  315
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttc gtt  360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac gac gat tac cag gag gcg ctt  405
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Glu Ala Leu
                125                 130                 135
cgc agc ctg tgt cag aaa aga gac ggt ceg cgt gcc acc atg aag  450
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
atc atg aat tat gac gaa ttt cag cac tgt tgg agc aag ttc gtg  495
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
tac agc caa aga gag cta ttt gag cct tgg aat aat ctg cct aaa  540
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
tat tat ata tta ctg cac atc atg ctg ggg gag att ctc aga cat  585
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat gaa cct  630
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro
                200                 205                 210
tgg gtc aga gga cag cat gag act tac ctg tgt tat gag gtg gag  675
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cgc agg ggc  720
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
                230                 235                 240
ttt cta tgc aac cag gct cca cat aaa cac ggt ttc ctt gaa ggc  765
Phe Leu Lys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac gtg att ccc ttt tgg aag  810
Arg His Ala Glu Leu Lys Phe Leu Asp Val Ile Pro Phe Trp Lys
                260                 265                 270
ctg gac ctg gac cag gac tac agg gtt acc tgc ttc acc tcc tgg  855
Leu Asp Leu Asp Gln Asp Tyr Arg Val Thr Lys Phe Thr Ser Trp
                275                 280                 285
agc ccc tgc ttc agc tgt gcc cag gaa atg gct aaa ttc att tca  900
Ser Pro Lys Phe Ser Lys Ala Gln Glu Met Ala Lys Phe Ile Ser
                290                 295                 300
aaa aac aaa cac gtg agc ctg tgc atc ttc act gcc cgc atc tat  945
Lys Asn Lys His Val Ser Leu Lys Ile Phe Thr Ala Arg Ile Tyr
                305                 310                 315
gat gat caa gga aga tgt cag gag ggg ctg cgc acc ctg gcc gag  990
Asp Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu Ala Glu
                320                 325                 330
gct ggg gcc aaa att tca ata atg aca tac agt gaa ttt aag cac 1035
Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr Ser Glu Phe Lys His
                335                 340                 345
tgc tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc 1080
Lys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
                350                 355                 360
tgg gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt 1125
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu
                365                 370                 375
cgg gcc att  1134
Arg Ala Ile
<210>32
<211>378
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>32
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp
1               5                   10                  15
Thr Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser
                35                  40                  45
Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser
                50                  55                  60
Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
                65                  70                  75
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Glu Ala Leu
                125                 130                 135
Arg Ser Leu Cys Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asp Glu Phe Gln His Cys Trp Ser Lys Phe Val
                155                 160                 165
Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn Asn Leu Pro Lys
                170                 175                 180
Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Gly Ile Leu Arg His
                185                 190                 195
Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro
                200                 205                 210
Trp Val Arg Gly Arg His Glu Thr Tyr Leu Lys Tyr Glu Val Glu
                215                 220                 225
Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
                230                 235                 240
Phe Leu Lys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly
                245                 250                 255
Arg His Ala Glu Leu Lys Phe Leu Asp Val Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Leu Asp Gln Asp Tyr Arg Va1 Thr Lys Phe Thr Ser Trp
                275                 280                 285
Ser Pro Lys Phe Ser Lys Ala Gln Glu Met Ala Lys Phe Ile Ser
                290                 295                 300
Lys Asn Lys His Val Ser Leu Lys Ile Phe Thr Ala Arg Ile Tyr
                305                 310                 315
Asp Asp Gln Gly Arg Lys Gln Glu Gly Leu Arg Thr Leu Ala Glu
                320                 325                 330
Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr Ser Glu Phe Lys His
                335                 340                 345
Lys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
                350                 355                 360
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu
                365                 370                 375
Arg Ala Ile
<210>33
<211>1131
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)…(1131)
<223>人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列
<400>33
atg aat cct caa atc aga aac atg gtg gag caa atg gaa cca gac   45
Met Asn Pro Gln Ile Arg Asn Met Val Glu Gln Met Glu Pro Asp
1               5                   10                  15
ata ttc gtc tac tac ttc aat aac aga ccc atc ctt tct ggt cgg   90
Ile Phe Val Tyr Tyr Phe Asn Asn Arg Pro Ile Leu Ser Gly Arg
                20                  25                  30
aat acc gtc tgg ctg tgc tac gaa gtg aaa aca aag gac cct tca  135
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Asp Pro Ser
                35                  40                  45
ggg ccc cct ttg gac gca aac atc ttt caa ggc aag ctg tac ccc  180
Gly Pro Pro Leu Asp Ala Asn Ile Phe Gln Gly Lys Leu Tyr Pro
                50                  55                  60
gag gct aag gac cac cca gag atg aag ttc ctc cac tgg ttc cgc  225
Glu Ala Lys Asp His Pro Glu Met Lys Phe Leu His Trp Phe Arg
                65                  70                  75
aag tgg agg cag ctg cat cgt gac cag gag tac gag gtc acc tgg  270
Lys Trp Arg Gln Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
tac gta tcc tgg agc ccc tgc aca agg tgt gca aac agt gtg gcc  315
Tyr Val Ser Trp Ser Pro Cys Thr Arg Cys Ala Asn Ser Val Ala
                95                  100                 105
acg ttc ctg gcc gag gac ccg aag gtt acc ctg acc atc ttt gtt  360
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
gcc cgc ctc tac tac ttc tgg gac gac gat tac cag cag gcg ctt  405
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Gln Ala Leu
                125                 130                 135
cgc atc ctg tgt cag gaa aga ggc ggt ccg cat gcc acc atg aag  450
Arg Ile Leu Cys Gln Glu Arg Gly Gly Pro His Ala Thr Met Lys
                140                 145                 150
atc atg aat tat aac gaa ttt caa cac tgt tgg aac gag ttc gtg  495
Ile Met Asn Tyr Asn Glu Phe Gln His Cys Trp Asn Glu Phe Val
                155                 160                 165
gac ggc caa gga aag cca ttt aag cct cgg aag aac ctg cct aaa  540
Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys Asn Leu Pro Lys
                170                 175                 180
cat tat aca tta ctg cac gcc acg ctg ggg gag ctt ctc aga cat  585
His Tyr Thr Leu Leu His Ala Thr Leu Gly Glu Leu Leu Arg His
                185                 190                 195
gtg atg gat cca ggc acg ttc act tcc aac ttt aac aat aaa cct  630
Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
tgg gtc agt gga cag cgt gag act tac ctg tgt tac aag gtg gag  675
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Cys Tyr Lys Val Glu
                215                 220                 225
cgc tcg cac aat gac acc tgg gtc ctg ctg aac cag cac agg ggc  720
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
ttt cta cgc aac cag gct cca gat aga cac ggt ttc cct aaa ggc  765
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
cgc cat gca gag ctg tgc ttc ctg gac ctg att ccc ttt tgg aag  810
Arg His Ala Glu Leu Cys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
ctg gat gac cag caa tac agg gtt acc tgc ttc acc tcc tgg agc  855
Leu Asp Asp Gln Gln Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser
                275                 280                 285
ccc tgc ttt agc tgt gcc cag aaa atg gct aaa ttc att tca aat  900
Pro Cys Phe Ser Cys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
aac aaa cat gtg agc ttg tgc atc ttc gct gcc cgc atc tat gat  945
Asn Lys His Val Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
gat caa gga aga tgt cag gag ggg ctg cgc acc ctg cac agg gat  990
Asp Gln Gly Arg Cys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
ggg gcc aaa att gca gtg atg aac tac agt gaa ttt gag tac tgc 1035
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Cys
                335                 340                 345
tgg gac acc ttt gtg gac cgc cag gga cgt ccc ttc cag ccc tgg 1080
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
gat gga cta gat gag cac agc caa gcc ctg agt ggg agg ctt cgg 1125
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
gcc att  1131
Ala Ile
<210>34
<211>377
<212>PRT
<213>人工序列
<220>
<223>人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列
<400>34
Met Asn Pro Gln Ile Arg Asn Met Val Glu Gln Met Glu Pro Asp
1               5                   10                  15
Ile Phe Val Tyr Tyr Phe Asn Asn Arg Pro Ile Leu Ser Gly Arg
                20                  25                  30
Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Asp Pro Ser
                35                  40                  45
Gly Pro Pro Leu Asp Ala Asn Ile Phe Gln Gly Lys Leu Tyr Pro
                50                  55                  60
Glu Ala Lys Asp His Pro Glu Met Lys Phe Leu His Trp Phe Arg
                65                  70                  75
Lys Trp Arg Gln Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp
                80                  85                  90
Tyr Val Ser Trp Ser Pro Cys Thr Arg Cys Ala Asn Ser Val Ala
                95                  100                 105
Thr Phe Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val
                110                 115                 120
Ala Arg Leu Tyr Tyr Phe Trp Asp Asp Asp Tyr Gln Gln Ala Leu
                125                 130                 135
Arg Ile Leu Cys Gln Glu Arg Gly Gly Pro His Ala Thr Met Lys
                140                 145                 150
Ile Met Asn Tyr Asn Glu Phe Gln His Cys Trp Asn Glu Phe Val
                155                 160                 165
Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys Asn Leu Pro Lys
                170                 175                 180
His Tyr Thr Leu Leu His Ala Thr Leu Gly Glu Leu Leu Arg His
                185                 190                 195
Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro
                200                 205                 210
Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Cys Tyr Lys Val Glu
                215                 220                 225
Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
                230                 235                 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly
                245                 250                 255
Arg His Ala Glu Leu Cys Phe Leu Asp Leu Ile Pro Phe Trp Lys
                260                 265                 270
Leu Asp Asp Gln Gln Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser
                275                 280                 285
Pro Cys Phe Ser Cys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn
                290                 295                 300
Asn Lys His Val Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp
                305                 310                 315
Asp Gln Gly Arg Cys Gln Glu Gly Leu Arg Thr Leu His Arg Asp
                320                 325                 330
Gly Ala Lys Ile Ala Val Met Asn Tyr Ser Glu Phe Glu Tyr Cys
                335                 340                 345
Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro Trp
                350                 355                 360
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
                365                 370                 375
Ala Ile
<210>35
<211>1155
<212>DNA
<213>homo sapiens
<220>
<221>CDS
<222>(1)..(1155)
<400>35
atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac aca   48
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1               5                   10                  15
ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg aat acc   96
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
            20                  25                  30
gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca agg ccc cct  144
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
        35                  40                  45
ttg gac gca aag atc ttt cga ggc cag gtg tat tcc gaa ctt aag tac    192
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
    50                  55                  60
cac cca gag atg aga ttc ttc cac tgg ttc agc aag tgg agg aag ctg    240
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
cat cgt gac cag gag tat gag gtc acc tgg tac ata tcc tgg agc ccc    288
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                 85                  90                  95
tgc aca aag tgt aca agg gat atg gcc acg ttc ctg gcc gag gac ccg    336
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
aag gtt acc ctg acc atc ttt gtt gcc cgc ctc tac tac ttc tgg gac    384
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
cca gat tac cag gag gcg ctt cgc agc ctg tgt cag aaa aga gac ggt    432
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
ccg cgt gcc acc atg aag atc atg aat tat gac gaa ttt cag cac tgt    480
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
tgg agc aag ttc gtg tac agc caa aga gag cta ttt gag cct tgg aat    528
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
aat ctg cct aaa tat tat ata tta ctg cac atc atg ctg ggg gag att    576
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
ctc aga cac tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat    624
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
gaa cct tgg gtc aga gga cgg cat gag act tac ctg tgt tat gag gtg    672
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
    210                 215                 220
gag cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cgc agg ggc  720
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
ttt cta tgc aac cag gct cca cat aaa cac ggt ttc ctt gaa ggc cgc  768
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
cat gca gag ctg tgc ttc ctg gac gtg att ccc ttt tgg aag ctg gac  816
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
ctg gac cag gac tac agg gtt acc tgc ttc acc tcc tgg agc ccc tgc  864
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
ttc agc tgt gcc cag gaa atg gct aaa ttc att tca aaa aac aaa cac  912
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
gtg agc ctg tgc atc ttc act gcc cgc atc tat gat gat caa gga aga  960
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
tgt cag gag ggg ctg cgc acc ctg gcc gag gct ggg gcc aaa att tca 1008
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
ata atg aca tac agt gaa ttt aag cac tgc tgg gac ace ttt gtg gac 1056
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
cac cag gga tgt ccc ttc cag ccc tgg gat gga cta gat gag cac agc 1104
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
caa gac ctg agt ggg agg ctg cgg gcc att ctc cag aat cag gaa aac 1152
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
tga           1155
<210>36
<211>384
<212>PRT
<213>homo sapiens
<400>36
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1               5                   10                  15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
            20                  25                  30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
        35                  40                  45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
    50                  55                  60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                 85                  90                  95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu eys Tyr Glu Val
    210                 215                 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
Cys Gln Glu Gly Leu ArgT hr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
lIe Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
<210>37
<211>1241
<212>DNA
<213>artificial  sequence
<220>
<223>APOBEC His
<220>
<221>CDS
<222>(5)..(1231)
<400>37
aagg atg aag cct cac ttc aga aac aca gtg gag cga atg tat cga gac aca  52
     Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
     1               5                   10                  15
ttc tcc tac aac ttt tat aat aga ccc atc ctt tct cgt cgg aat acc  100
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
                20                  25                  30
gtc tgg ctg tgc tac gaa gtg aaa aca aag ggt ccc tca agg ccc cct  148
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
            35                  40                  45
ttg gac gca aag atc ttt cga ggc cag gtg tat tcc gaa ctt aag tac  196
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
        50                  55                  60
cac cca gag atg aga ttc ttc cac tgg ttc agc aag tgg agg aag ctg  244
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
    65                  70                  75              80
cat cgt gac cag gag tat gag gtc acc tgg tac ata tcc tgg agc ccc  292
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
tgc aca aag tgt aca agg gat atg gcc acg ttc ctg gcc gag gac ccg  340
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
aag gtt acc ctg acc atc ttt gtt gcc cgc ctc tac tac ttc tgg gac  388
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
cca gat tac cag gag gcg ctt cgc agc ctg tgt cag aaa aga gac ggt  436
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
ccg cgt gcc acc atg aag atc atg aat tat gac gaa ttt cag cac tgt  484
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
tgg agc aag ttc gtg tac agc caa aga gag cta ttt gag cct tgg aat  532
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
aat ctg cct aaa tat tat ata tta ctg cac atc atg ctg ggg gag att  580
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
ctc aga cac tcg atg gat cca ccc aca ttc act ttc aac ttt aac aat  628
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
gaa cct tgg gtc aga gga cgg cat gag act tac ctg tgt tat gag gtg  676
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
    210                 215                 220
gag cgc atg cac aat gac acc tgg gtc ctg ctg aac cag cgc agg ggc  724
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
ttt cta tgc aac cag gct cca cat aaa cac ggt ttc ctt gaa ggc cgc  772
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
cat gca gag ctg tgc ttc ctg gac gtg att ccc ttt tgg aag ctg gac  820
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
ctg gac cag gac tac agg gtt acc tgc ttc acc tcc tgg agc ccc tgc  868
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
ttc agc tgt gcc cag gaa atg gct aaa ttc att tca aaa aac aaa cac  920
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
gtg agc ctg tgc atc ttc act gcc cgc atc tat gat gat caa gga aga  964
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
tgt cag gag ggg ctg cgc acc ctg gcc gag gct ggg gcc aaa att tca 1012
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
ata atg aca tac agt gaa ttt aag cac tgc tgg gac acc ttt gtg gac 1060
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
cac cag gga tgt ccc ttc cag ccc tgg gat gga cta gat gag cac agc    1108
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
caa gac ctg agt ggg agg ctg cgg gcc att ctc cag aat cag gaa aac    1156
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Aag ctt ggg ccc gaa caa aaa ctc atc tca gaa gag gat ctg aat agc    1204
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
gcc gtc gac cat cat cat cat cat cat tgagtttaaa                     1241
Ala Val Asp His His His His His His
                405
<210>38
<211>409
<212>PRT
<213>artificial sequence
<220>
<223>APOBEC His
<400>38
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1               5                   10                  15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
            20                  25                  30
Val  Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
         35                  40                  45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
    50                  55                  60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65                  70                  75                  80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
                85                  90                  95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
            100                 105                 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
        115                 120                 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
    130                 135                 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145                 150                 155                 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
                165                 170                 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
            180                 185                 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
        195                 200                 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu eys Tyr Glu Val
    210                 215                 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225                 230                 235                 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
                245                 250                 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
            260                 265                 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
        275                 280                 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
    290                 295                 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305                 310                 315                 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
                325                 330                 335
lIe Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
            340                 345                 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
        355                 360                 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
    370                 375                 380
Lys Leu Gly Pro Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser
385                 390                 395                 400
Ala Val Asp His His His His His His
                405

Claims (10)

1.一种突变型人类APOBEC3G蛋白质,该蛋白质为(a)或(b):
(a).由SEQ ID No.2、4、6或8所示的氨基酸序列组成的蛋白质;
(b).在(a)中的氨基酸序列至少有一个或多个氨基酸替代,同时第129位的替代为D或F或其他的除了P以外的氨基酸,且能抵抗HIV-Vif引发的蛋白酶降解的由(a)衍生的蛋白质。
2.编码权利要求1所述突变型人类APOBEC3G蛋白质的核苷酸。
3.根据权利要求2所述的核苷酸,该核苷酸是(a)或(b):
(a).序列为SEQ ID No.1、3、5或7的核苷酸;
(b).在严格条件下与(a)限定的DNA核苷酸序列杂交且编码具有抵抗HIV-Vif引发的蛋白酶降解功能的变异的APOBEC3G蛋白质的核苷酸。
4.含有权利要求2或3所述核苷酸的表达载体。
5.含有权利要求2或3所述核苷酸的重组宿主细胞。
6.权利要求1所述蛋白质的特异性抗体。
7.含有有效治疗剂量的上述蛋白质、核苷酸、表达载体、重组宿主细胞或特异性抗体的药物。
8.含有上述蛋白质、核苷酸、表达载体、重组宿主细胞或特异性抗体的试剂盒。
9.权利要求1所述的突变型人类APOBEC3G蛋白质在制备抗HIV病毒药物中的应用。
10.权利要求2所述的核苷酸在制备抗HIV病毒药物中的应用。
CNA2006100967034A 2006-10-10 2006-10-10 抑制hiv复制的突变型apobec3g分子及其应用 Pending CN101161676A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2006100967034A CN101161676A (zh) 2006-10-10 2006-10-10 抑制hiv复制的突变型apobec3g分子及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2006100967034A CN101161676A (zh) 2006-10-10 2006-10-10 抑制hiv复制的突变型apobec3g分子及其应用

Publications (1)

Publication Number Publication Date
CN101161676A true CN101161676A (zh) 2008-04-16

Family

ID=39296665

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006100967034A Pending CN101161676A (zh) 2006-10-10 2006-10-10 抑制hiv复制的突变型apobec3g分子及其应用

Country Status (1)

Country Link
CN (1) CN101161676A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102516370A (zh) * 2011-12-16 2012-06-27 吉林大学第一医院 抗hiv的药物靶点及其在制药中的用途
CN101591645B (zh) * 2008-05-29 2013-06-05 中国医学科学院医药生物技术研究所 一种抗hiv药物的筛选方法
CN104013616A (zh) * 2014-05-28 2014-09-03 中山大学 酰氨基-噻吩类化合物在制备抗hiv-1病毒药物中的应用
CN108753775A (zh) * 2018-05-04 2018-11-06 华南农业大学 靶向APOBEC3G基因的sgRNA及食蟹猴APOBEC3G基因敲除的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101591645B (zh) * 2008-05-29 2013-06-05 中国医学科学院医药生物技术研究所 一种抗hiv药物的筛选方法
CN102516370A (zh) * 2011-12-16 2012-06-27 吉林大学第一医院 抗hiv的药物靶点及其在制药中的用途
CN104013616A (zh) * 2014-05-28 2014-09-03 中山大学 酰氨基-噻吩类化合物在制备抗hiv-1病毒药物中的应用
CN108753775A (zh) * 2018-05-04 2018-11-06 华南农业大学 靶向APOBEC3G基因的sgRNA及食蟹猴APOBEC3G基因敲除的方法

Similar Documents

Publication Publication Date Title
AU743490B2 (en) NTN-2 member of TNF ligand family
CN103201286B (zh) 用于诊断和治疗抗间变性淋巴瘤激酶(alk)激酶抑制剂的癌症的方法和组合物
Rosenberg The eosinophil ribonucleases
JP4411330B2 (ja) 腫瘍壊死因子関連リガンド
AU7608898A (en) Ntn-2 member of tnf ligand family
KR100397244B1 (ko) 거핵구분화인자
US20090092594A1 (en) Mammalian genes involved in viral infection and tumor suppression
US8771700B2 (en) Interferon antagonists, antibodies thereto and associated methods of use
WO1999007738A2 (en) Human orphan receptor ntr-1
Qian et al. GRSF-1: a poly (A)+ mRNA binding protein which interacts with a conserved G-rich element
Yun et al. Bombyx mori transferrin: genomic structure, expression and antimicrobial activity of recombinant protein
CN101161676A (zh) 抑制hiv复制的突变型apobec3g分子及其应用
Nordlund Avidin engineering: modification of function, oligomerization, stability and structure topology
WO1997042321A9 (en) Osteoclast transporter protein
WO1997042321A1 (en) Osteoclast transporter protein
WO1991012272A1 (en) Protein factor
US5874264A (en) Gibbon ape leukemia virus receptor
US20050112553A1 (en) Mammalian genes involved in viral infection and tumor suppression
US20100111913A1 (en) Method of enhancing migration of neural precursor cells
EP1021536A2 (en) Mammalian genes involved in viral infection and tumor suppression
CN109821009B (zh) 轴突导向因子重组蛋白Semaphorin3G的医药用途
WO2002026965A1 (fr) Acide nucleique d&#39;un nouveau gene humain associe a la kinesine, proteine codees par cet acide nucleique, fragment de peptide de cet acide nucleique et agents anticancereux comprenant cet acide nucleique et similaire
CN106167524B (zh) 来源于东方蜜蜂的赛卡品肽
JP2007151401A (ja) イヌ顆粒球コロニー刺激因子の製造法
CN101195657A (zh) 一个i型细胞因子受体样分子及其编码基因与应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20080416