CN101684161A - 蛋白酶检测系统 - Google Patents

蛋白酶检测系统 Download PDF

Info

Publication number
CN101684161A
CN101684161A CN200910165761A CN200910165761A CN101684161A CN 101684161 A CN101684161 A CN 101684161A CN 200910165761 A CN200910165761 A CN 200910165761A CN 200910165761 A CN200910165761 A CN 200910165761A CN 101684161 A CN101684161 A CN 101684161A
Authority
CN
China
Prior art keywords
leu
gly
ala
signal
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910165761A
Other languages
English (en)
Inventor
黄仁焕
金旲宪
李勇直
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ahram Biosystems Inc
Original Assignee
Ahram Biosystems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ahram Biosystems Inc filed Critical Ahram Biosystems Inc
Publication of CN101684161A publication Critical patent/CN101684161A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/34Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase
    • C12Q1/37Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase involving peptidase or proteinase
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/04Screening involving studying the effect of compounds C directly on molecule A (e.g. C are potential ligands for a receptor A, or potential substrates for an enzyme A)

Abstract

本发明公开了细胞内蛋白酶检测系统。在一个实施方案中,该系统包括嵌合蛋白质,其包括共价连接成分:1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。本发明有广谱的应用,包括用于细胞和组织内新蛋白酶抑制剂的检测。

Description

蛋白酶检测系统
本申请是申请号028179005、发明名称“蛋白酶检测系统”、申请日为2002年8月8日的分案申请。
相关申请的交叉引用
本申请是韩国专利申请No.10-2001-0048123的继续申请,其于2001年8月10日提交,名称为蛋白酶抑制剂体内筛选系统,此处引用其内容作为参考。
发明领域
本发明一般涉及细胞内蛋白酶检测系统。优选的系统包括嵌合底物蛋白质,其包括共价连接成分:1)至少一种任选地掩蔽信号蛋白质(optionally mask signal protein);2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。本发明有广谱重要的应用,包括用于筛选以检测阻断一种或多种人类病原体产生的蛋白酶的化合物。
发明背景
蛋白酶是切割蛋白质特定肽键的酶。在生物组织中,蛋白酶有特异的蛋白水解活性,且其抑制剂参与调节多种生物功能。在多种生物过程中,生物必需的功能可通过导致活化蛋白质形成的蛋白酶对聚蛋白前体的蛋白酶剪切而被活化和调节。实例包括血液凝固、免疫防御过程、蛋白质通过细胞内膜的选择转运、宿主细胞中的病毒增殖等。因此,蛋白酶是特异的蛋白酶抑制剂作为新药开发中的主要靶标。
病毒蛋白酶抑制剂是作为新药开发的蛋白酶抑制剂的典型实例。由于病毒蛋白酶参与聚蛋白前体通过蛋白酶剪切的活化,因此蛋白酶是宿主细胞中病毒增殖起始及复制病毒正确衣壳装配的重要成分。
蛋白酶抑制剂已被开发以阻断导致获得性免疫缺陷综合症(AIDS)的HIV的增殖。例如安泼那韦(amprenavir)、那非那韦(nelfinavir)、印地那韦(indinavir)、利托那韦(ritonavir),和斯奎那韦(squinavir)已被FDA批准作为抑制HIV蛋白酶的药物,洛匹那韦(lopinavir)和依法韦仑(efavirenz)处于临床研究中。给予那些药物的患者显示HIV颗粒数降低到该药物疗法前的约10%。这显示蛋白酶抑制剂可用作有效的药物。但是,报道了这些治疗中的几种副作用(Miller,T.L.等人,2001),和报道了在长期治疗的情况下携带突变蛋白酶基因的突变体(Jacobsen,H等人,1996;Cote,H等人,2001)。因此,需要开发能特异阻断多种突变HIV病毒增殖的更多不同的蛋白酶抑制剂。
已经研究了蛋白酶抑制剂对其他人和动物病毒的抑制,例如HCV(Kasai,N.等人,2001)和HERV(Kuhelj,R.等人,2001)。基于同样的概念还进行了植物病毒病的研究。例如,通过在转基因植物中表达作为蛋白酶抑制剂的重组蛋白质,研究了由TEV(烟草蚀刻病毒)和PVY(马铃薯Y病毒)产生的聚蛋白的蛋白酶剪切抑制(Gutierres-Campos,R.等人,1999)。还进行了植物病毒蛋白酶蛋白水解位点鉴定的研究(Yoon,H.Y.等人,2000)。
已有多种尝试开发蛋白酶抑制剂。例如,多数情况下,在蛋白酶、其底物肽或蛋白质,和候选化学物质体外混合反应后,通过使用电泳检测底物切割进行蛋白酶抑制剂的筛选。由于已认识到重要的蛋白水解位点,因此氨基酸序列与蛋白水解位点相似的肽被合成并用于寻找蛋白酶抑制剂(Kettner,C.A.和Korant,B.D.,1987)。由于蛋白质三级结构的确定变得更容易并且还可能使用计算机模拟设计化学物质,所以已进行了许多研究以设计和合成与酶活性位点特异结合的分子(Wlodawer,A.和Erickson,J.W.,1993;Rodgers,J.D.等人,1998;Mardis,K.L.等人,2001)。并且,尝试使用荧光标记底物以提高蛋白酶活性检测的效率(Ermolief,J.等人,2000),并使用大肠杆菌(E.Coli)周质中表达的抗体片段作为蛋白酶抑制剂以扩大蛋白酶抑制剂的骨架结构(Kasai,N.等人,2001)。
现在使用的大多数蛋白酶活性筛选方法在体外进行。可是,在体外筛选方法中,不可能检测多种复杂的效果,例如候选药物转运入细胞的效率、候选药物在细胞中的稳定性和细胞毒性等。因此在体外筛选方法选择的候选药物活体检测前,需要许多另外的费时的实验。所以,需要开发更简单和更通用的体内筛选方法以检测候选蛋白酶抑制剂的细胞功能并筛选更特异的蛋白酶抑制剂。
已在多种体内或类似体内的条件下尝试检测蛋白酶剪切和筛选蛋白酶抑制剂。
例如,有使用存在于分离囊泡(vesicle)中的蛋白酶方法的报道(Hook,V.Y.,2001)。其他公开的方法包括使用组织切片的原位酶谱法(Yi,C.-F.等人,2001),和用蛋白酶的多肽底物处理细胞的方法(Kuhelj,R.等人,2001)。
然而对这些方法和相关方法缺点的认识渐增。
例如,多数方法据信仅近似体内环境。因此,这样的方法不一定反映可实质影响蛋白酶功能的细胞内环境。
另外,多数先前的的方法据信在敏感性、选择性,和便利性上有局限。据信这些缺点和其他缺点已经减低了过去筛选尝试的效率和可信度。
需要有更好的检测细胞内蛋白酶的体内方法,其更敏感和更易于使用。尤其需要有容易适合检测哺乳动物和病毒蛋白酶抑制剂的体内方法。
发明内容
本发明涉及细胞和组织内蛋白酶检测系统。在一个实施方案中,该系统包括至少一种嵌合蛋白质,其包括共价连接成分:1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。优选的嵌合蛋白质有作为“分子标志(molecularbeacon)”的功能,其在蛋白酶存在的细胞内改变位置。本发明有广泛的应用,包括用于体内筛选以检测抑制或阻断人类病原体相关蛋白酶的化合物。
本发明优选的用途要求受试细胞或组织中包括至少一种活性蛋白酶。适当的蛋白酶包括那些细胞内源的,例如,那些公知的“持家”酶。其他适当的蛋白酶包括那些细胞或组织非自然发生的。例如,这样的蛋白酶可以是病原体感染产生的。另外,该蛋白酶在细胞或组织内的存在可以是欲在其中引入蛋白酶的实验操作的结果。在这些实施方案中,嵌合蛋白质(或其可检测的成分)亚细胞位置的变化被作为细胞或组织内存在蛋白酶的指示。因此本发明提供作为空间敏感的“分子标志”,其在细胞或组织内的定位是存在(或缺失)受试蛋白酶的指示。
显而易见,本发明是一个有广泛应用的发明。即,它可用于检测细胞或组织内广谱的蛋白酶。优选的蛋白酶能切割(水解),尤其优选,在嵌合蛋白质中的切割位点。有时此处的嵌合蛋白质将作为嵌合底物蛋白质以指示目的蛋白酶的切割潜能。位点特异的切割理解为通常在特异的切割位点或其附近分裂嵌合分子,并从中释放至少一种成分,例如,可选地掩蔽信号蛋白质、切割位点,或可检测的氨基酸序列。优选的释放包括至少一种可检测的氨基酸序列,但根据用途可包括嵌合分子的其他成分。
嵌合分子一种或多种成分更优选的释放是为了提供空间敏感的分子标志。例如,在一个实施方案中,可检测的氨基酸序列从嵌合底物蛋白质中释放并基本上自由地在整个宿主细胞或组织扩散。该扩散信号易于检测并可作为蛋白酶存在的指示。然而在另一发明实施方案中,一种或多种可检测的氨基酸序列的释放与通过可选地掩蔽信号蛋白质指导分子到另一亚细胞位置相关。在本发明的这个实施例中,更集中和更高强度的信号作为蛋白酶的指示。
在本发明的一些实施方案中,甚至在细胞或组织内存在蛋白酶的情况下,嵌合分子保持至少一种可检测的氨基酸序列是有用的,优选以符合读框的融合。在这一情况下,当蛋白酶存在时,通过参照可检测的氨基酸序列可监测嵌合分子的定位。在多数情况下,可检测的氨基酸序列(单独或与另一可检测的嵌合蛋白质成分结合)的释放和后续的亚细胞定位,易于通过一种或组合常规检测策略原位显像。
因此本发明的一个目的是将目的蛋白酶的存在和优选其活性与嵌合蛋白质的定位改变结合起来。该改变因信号位置(并优选强度)的增加或减少是易于检测的。作为实例,可检测的标记嵌合蛋白质(或一种或多种成分)的亚细胞分布最初可限制在相对小的区域,例如细胞器。该限制产生相对高的信号强度。然而在特异切割嵌合蛋白质的蛋白酶存在的情况下,该分布受到更少的束缚甚至扩散。限制的缺少产生相对低的信号强度。在这个实例中,通过蛋白酶的特异切割可与嵌合蛋白质(或标记成分)从细胞器到更大空间(例如胞质溶胶)的运动相关。另外,在活性蛋白酶的存在通过本发明与标记蛋白质从胞质溶胶到更狭窄空间(例如,细胞器或液泡)的亚细胞移动相关的实施方案中,信号强度可突然升高。在另一实施方案中,活性蛋白酶的存在可与很少或没有变化的信号强度相关。替代的,通过标记蛋白质从一个亚细胞位置向另一个亚细胞位置的移动来监测这种变化,例如,嵌合底物蛋白质从一个细胞器到另一细胞器或液泡的移动。
本发明的实施提供了许多重要的优点。
例如,本发明提供嵌合蛋白质,其被受试蛋白酶特异切割产生标记(和非标记)组分蛋白质。本发明优选的实施将亚细胞位置,并且优选地,标记蛋白质的信号强度与受试蛋白酶的存在(或缺失)相关。这一“双因子”检测策略提供高度灵敏和可信的蛋白酶检测。即,细胞或组织内的标记蛋白质的位置和其信号强度均可作为活性蛋白酶存在的指示。本发明还是高度选择性的,即,其容易鉴别细胞内不同的蛋白酶或同工酶的存在及同一蛋白酶无活性和活性形式的存在。本发明优选的嵌合蛋白质可用可获得的试剂和标准的重组操作制备,其使本发明易于应用。
另外,本发明是灵活的,可用于检测多种细胞中的活性蛋白酶,尤其是真核细胞,包括那些衍生自植物、酵母、真菌、动物,和昆虫的细胞。优选的嵌合蛋白质对细胞或组织中的基因表达影响很小,因此避免了潜在复杂的遗传影响。本发明还适宜许多种适当的蛋白酶切割位点和可检测的氨基酸序列。
因此,一方面,本发明提供细胞内蛋白酶检测系统,该系统优选包括至少一种上述的嵌合蛋白质。对于嵌合蛋白质,只要达到预期的结果,每一种蛋白质成分(可选地掩蔽信号蛋白质、蛋白酶切割位点,和可检测的序列)的连接顺序并不重要。然而典型地,连接顺序从一种成分的N末端开始并在另一种成分的C末端结束。
如前所述,嵌合蛋白质包括共价连接成分:1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。优选地,该嵌合蛋白质包括少于约10种可选地掩蔽信号蛋白质,更优选少于约5种上述的蛋白质,一般约1、2,或3种这样的信号蛋白质。短语“可选地掩蔽”意指信号蛋白质的预期功能(一般是运输信号)被掩蔽或未掩蔽。术语“掩蔽”意指通过共价连接至少一种掩蔽序列到信号蛋白质上,可逆或不可逆地,基本上降低或优选地完全封闭信号蛋白质的预期功能。一般优选的被掩蔽的信号蛋白质包括约1种到约2种这样的掩蔽序列。一般优选的掩蔽序列由少于约200个氨基酸的残基组成,优选少于约50个残基,对于多数应用优选约3到约20个残基。多数发明应用特别优选的掩蔽序列为至少一种位点特异的蛋白酶切割位点,例如,1、2、3或4种这样的位点。
根据本发明另外的优选嵌合蛋白质包括,以共价连接成分,少于约10种蛋白酶特异的切割位点,优选少于约5种位点,其中经常优选约1、2、3,或4种这样的位点。
还进一步优选的嵌合蛋白质包括,作为共价连接成分,少于约10种可检测的氨基酸序列,优选少于约5种所述序列,其中一般优选约1、2、3,或4种这样的可检测的氨基酸序列。在一个实施方案中,该序列是荧光、磷光或化学发光的蛋白质或其功能片段。可检测的氨基酸序列的功能片段能以与全长序列基本上同样的敏感性被检测。在另一实施方案中,该氨酸序列是酶或其催化片段,其通过与适当的底物接触,可产生荧光、磷光或化学发光。来自可检测氨基酸序列的信号的检测和可选地定量的方法是本领域公知的并在下面更详细地解释。
另一方面,本发明提供基本上纯的嵌合蛋白质,其包括共价连接成分:1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。
再一方面,本发明涉及核酸,其包括编码嵌合蛋白质的序列。在一个实施方案中,编码的嵌合蛋白质包括共价连接成分:1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。
本发明还提供载体,其包括编码如此处所公开嵌合蛋白质的核酸。还提供细胞例如植物、酵母、动物,真菌或昆虫细胞,其包括并优选还表达嵌合蛋白质。
本发明还提供细胞内蛋白酶检测试剂盒。在一个实施方案中,试剂盒包括此处描述的系统,该系统优选包括至少一种:a)如此处所描述的嵌合蛋白质;和b)包含编码此处公开嵌合蛋白质的任一核酸的载体。可选地,试剂盒还可包括包含编码嵌合蛋白质特异蛋白酶的核酸的载体和/或细胞,其包括并优选还表达嵌合蛋白质和蛋白酶。试剂盒还可用于筛选蛋白酶的抑制剂。
本发明提供另外的用途和优点。例如,提供有效和通用的蛋白酶特异抑制剂的体内筛选方法也是本发明的目的。因此在一个实施方案中,本发明提供:
(1)嵌合底物蛋白质,其包含至少一种指导向亚细胞器转运的信号蛋白质,至少一种蛋白酶特异的蛋白酶剪切位点,和至少一种荧光蛋白标记,和构建嵌合底物蛋白质的通用方法;
(2)包含编码嵌合底物蛋白质的核酸序列的重组基因,其可用于转化细胞以表达嵌合底物蛋白质;
(3)一个系统,其中嵌合底物蛋白质和其特异的蛋白酶共存在一个活细胞中,以便蛋白酶对底物的蛋白酶剪切可发生在一个活细胞中;
(4)确定体内蛋白酶活性的有效分步的方法,其通过直接观测具有从与底物缀合的荧光蛋白标记发出的荧光信号的细胞,而直接鉴定活细胞中蛋白酶对嵌合底物蛋白质的切割;和
(5)筛选蛋白酶特异抑制剂的有效分步的方法,其使用以上构建的系统以确定活细胞中蛋白酶活性。
通过论述涉及的技术问题,本发明提供分析特定蛋白酶活性和筛选蛋白酶抑制剂的更现实的体内方法,其中蛋白酶和其特异的底物共存在一个活细胞中,以便蛋白酶对底物的切割可发生在一个活细胞中,结果可从活细胞直接观察。
在相关方面,本发明提供检测细胞或组织内蛋白酶非常有用的方法。在本发明的实例中,该方法包括下述至少一个并优选所有的步骤:
a)将包含编码嵌合蛋白质的核酸的第一载体引入受试细胞或组织,其中嵌合蛋白质包括共价连接成分:1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列,
b)在使第一载体编码的嵌合蛋白质表达的条件下培养细胞或组织;和
c)检测嵌合蛋白质(或其可检测的标记成分)的亚细胞定位和信号强度中的至少一个的变化作为细胞内蛋白酶存在的指示。
如上所述,该方法是灵活的并容易改变以适合预期使用。例如,如果需要,该方法还可包括引入第二载体到受试细胞或组织的步骤,该第二载体包含编码蛋白酶的核酸序列;并在细胞或组织中表达第二载体以在细胞或组织内产生蛋白酶。
本发明还提供蛋白酶抑制剂体内活性检测和可选地定量的方法。优选的抑制剂可以是目的细胞或组织内源的。然而,在许多发明实施方案中将给予细胞或组织该抑制剂,其包括自然发生的、合成的,和半合成的分子。这种分子可从化学文库中获得,并可包括那些已知的、可疑的或完全未知的抑制活性。例如,在特定蛋白酶抑制剂活性确定的实施方案中,本发明可用于证实蛋白酶在特定细胞、组织类型,或培养条件中的活性。在其他实施方案中,本发明可用于从化学文库中筛选候选化合物。在本发明的一个实例中,检测方法包括下述至少一个并优选所有的步骤:
a)将包含编码嵌合蛋白质的核酸的第一载体引入受试细胞或组织,其中嵌合蛋白质包括共价连接成分:1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列,
b)在细胞或组织中引入编码至少一种受试蛋白酶的第二载体,优选上述的一个蛋白酶,
c)将细胞或组织与候选化合物接触,
d)在使第一载体编码的嵌合蛋白质和第二载体编码的蛋白酶表达的条件下培养细胞或组织;和
e)检测嵌合蛋白质(或其可检测的标记成分)的亚细胞定位和信号强度中至少一个的变化作为蛋白酶抑制剂存在的指示。
上述检测方法是灵活的并容易适用于以单独的、低或高通量模式筛选候选化合物。例如,在一个实施方案中,该方法还包括使用自动或半自动设备,其优选来检测可检测的标记嵌合蛋白质或其标记蛋白质成分在亚细胞定位和信号强度的变化。更具体的设备包括适合检测细胞或组织内可检测序列的光学系统,该系统可向使用者提供实时结果或作为存储结果。
如果需要,通过参照适当的对照可监测嵌合蛋白质(或其可检测的标记成分)在亚细胞定位、信号强度(或二者)的可检测的变化。一种适当的对照是加入水、盐水或缓冲液,而不是步骤c)中要检测的化合物。当然,在特定方法的嵌合蛋白质、宿主细胞或组织等的性质已经确定的实施方案中,可不需要使用对照。
如上所述,本发明非常适合检测蛋白酶抑制剂。根据本发明,已知的蛋白酶抑制剂是确认的病毒疾病抑制剂。因为病毒蛋白酶对复制和病毒衣壳重新组装是必需的,所以蛋白酶抑制剂可通过抑制蛋白酶以抑制病毒增殖而用于病毒疾病的治疗。动物病毒可引起疾病,例如AIDS和肝炎等,植物病毒通过引起萎蔫的叶子和色斑而降低作物产量。
一方面,通过提供底物和多种蛋白酶特异抑制剂的体内筛选方法,本发明提供有效开发多种蛋白酶特异抑制剂的方案(framework)。该方法还可用于确定常规体外方法筛选的候选药物的效力。
附图简述
图1显示带有亚细胞器的运输信号并用荧光蛋白质标记的信号蛋白质的示意图。
图2(a)-(h)显示当荧光蛋白质标记的信号蛋白质在细胞中正确表达时它们定位分布的荧光照片。
(a)显示用绿色荧光蛋白质(GFP)标记的拟南芥属(Arabidopsis)外包膜蛋白质(AtOEP7)定位在叶绿体包膜;
(b)、(c)和(d)显示用GFP标记的Rubisco(核酮糖二磷酸羧化酶-加氧酶)小亚单位(RbcS)、叶绿素a/b结合蛋白质(Cab),Rubisco活化酶(Rubisco activase)(RA)定位在叶绿体基质;
(e)显示用GFP标记的F1-ATPase(F1-腺苷三磷酸酶)定位在线粒体;
(f)显示用GFP标记的过氧化物酶体靶向基序(SKL)定位在过氧化物酶体;和
(g)和(h)显示用GFP标记的H+-ATPase(H+-腺苷三磷酸酶)和Pleckstrin同源结构域(PH)(血小板-白细胞C激酶底物同源结构域)定位在质膜(plasma envelope)。
图3显示NIa蛋白酶重组基因和NIa蛋白酶体内底物,RFP:PS(NIa):AtOEP7:GFP的示意图:
(a)显示构建用以表达嵌合蛋白质RFP:PS(NIa):AtOEP7:GFP重组基因的结构,其用作本发明实施例2中NIa蛋白酶的体内底物,其中RFP、GFP、PS(NIa)、AtOEP7和35S分别代表红色荧光蛋白质、绿色荧光蛋白质、蛋白酶的蛋白酶剪切位点、拟南芥属外包膜蛋白质和CaMV35S启动子;和
(b)显示实施例2中使用的表达NIa蛋白酶的重组基因的结构,其中NIa代表来自TVMV的NIa蛋白酶的编码区。
图4显示嵌合蛋白质RFP:PS(NIa):AtOEP7:GFP在图3(a)显示的重组基因转化的拟南芥属原生质体中表达后观察到的荧光照片:
(a)、(b)、(c),和(d)分别是绿色荧光信号、红色荧光信号,和绿色和红色荧光重叠信号的图像,及在亮视野下获得的图像。叶绿体中观察到的红色荧光信号是叶绿体的自发荧光信号,且胞质溶胶中观察到的红色荧光信号来自红色荧光蛋白质。
图5显示嵌合蛋白质RFP:PS(NIa):AtOEP7:GFP和NIa蛋白酶,在图3(a)和3(b)显示的重组基因转化的拟南芥属原生质体中共表达后观察到的荧光图像,其显示可观察到NIa蛋白酶对RFP:PS(NIa):AtOEP7:GFP的切割:
(a)、(b)、(c),和(d)分别是绿色荧光信号、红色荧光信号,和绿色和红色荧光重叠信号的图像,及在亮视野下获得的图像。叶绿体中观察到的红色荧光信号是叶绿体的自发荧光信号,且胞质溶胶中观察到的红色荧光信号来自红色荧光蛋白质。
图6是Western印迹,显示NIa蛋白酶对嵌合蛋白质REP:PS(NIa):AtOEP7:GEP的切割发生在拟南芥属原生质体中。图3(a)中显示的RFP:PS(NIa):AtOEP7:GFP和图3(b)中显示的NIa蛋白酶共表达(+)的情况和RFP:PS(NIa):AtOEP7:GFP单独表达(-)的情况相比。在70kD和35kD观察到的蛋白质条带分别对应于完整的嵌合蛋白质RFP:PS(NIa):AtOEP7:GFP和由蛋后酶剪切产生的AtOEP7:GFP蛋白质片段。
图7(a)-(j)是显示用于表达图1中显示的融合蛋白质的不同构建体质粒图谱的图:(a)AtOEP7:GFP、(b)AtOEP7:RFP、(c)RbcS:GFP(d)RbcS:RFP、(e)Cab:GFP、(f)RA:GFP、(g)F1-ATPase:GFP、(h)GFP:SKL、(i)H+-ATPase:GFP、(j)GFP:PH。
图8(a)和(b)分别显示NIa蛋白酶和其嵌合底物蛋白质RFP:PS(NIa):AtOEP7:GFP的质粒图谱。标注了嵌合底物蛋白质的核酸序列的重要部分。
图9(a)和(b)分别显示HIV-1蛋白酶和其嵌合底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP的质粒图谱。标注了蛋白酶剪切位点的核酸和蛋白质序列(SEQ ID NO:57-74)。
图10显示编码可选地掩蔽嵌合底物蛋白质实例的重组基因的示意图,其中一种信号蛋白质的运输信号保持活性。PS代表蛋白酶剪切位点序列。FP-1和FP-2代表具有不同荧光波长的荧光蛋白质的编码序列。
图11显示嵌合底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP在图9(b)中显示的重组质粒中的一种转化的拟南芥属原生质体中表达后观察到的荧光图像。图11(a)、(b)和(c)分别是绿色荧光信号、红色荧光信号,和绿色和红色荧光重叠信号的图像。绿色荧光图像中观察到的微弱红色荧光信号是叶绿体的自发荧光。
图12显示HIV-1蛋白酶和嵌合底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP在图9(a)和(b)显示的重组基因转化的拟南芥属原生质体中共表达后观察到的荧光图像。图12(a)、(b)和(c)分别是绿色荧光信号、红色荧光信号,和绿色和红色荧光重叠信号的图像。绿色荧光图像中观察到的微弱红色荧光信号是叶绿体的自发荧光。
图13(a)和(b)显示嵌合底物蛋白质H+-ATPase:PS(NIa):GFP表达后观察到的图像。图13(c)和(d)显示NIa蛋白酶和嵌合底物蛋白质H+-ATPase:PS(NIa):GFP共表达后观察到的图像。图13(a)和(c)是绿色荧光信号的图像,图13(b)和(d)是在亮视野下获得的图像。绿色荧光图像中观察到的红色荧光是叶绿体的自发荧光。
实施本发明的最佳模式
如上所述,本发明提供检测细胞或组织内蛋白酶非常有用的系统。如果需要,该系统容易改变以适应检测一种以上的蛋白酶,优选少于约3种蛋白酶,通常约1种蛋白酶。优选地,该系统包括嵌合蛋白质,其包括共价连接成分:1)至少一种可选地掩蔽信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。一般优选的嵌合蛋白质由少于约20种成分组成,更优选少于约10种成分,对于大多数蛋白质通常优选约3种到约6种成分。本发明有广谱重要的应用,包括用于筛选以检测在体内降低或完全阻断蛋白酶活性的候选化合物。
根据本发明,“系统”包括一种或多种此处描述的嵌合分子及可向其添加的任何附加成分,例如可促进上述分子可溶性和稳定性的那些成分。实例包括但不限于血清蛋白质,例如牛血清白蛋白,缓冲液例如磷酸盐缓冲液,或可接受的载体或稳定剂。对可接受的载体、稳定剂等的详细论述,通常参见Reminington’s Pharmaceutical Sciences,Mack Pub.Co.,Easton,PA,1980。本发明的典型的系统还会包括至少一种此处描述的核酸、载体、处理细胞或组织。在这种发明实施方案中,嵌合蛋白质可作为有用的实验对照。优选的系统包括大约1到10、优选少于约5和更优选约1种溶解在可接受的载体中嵌合蛋白质,所述载体例如水或缓冲盐。优选地,系统以无菌提供。
短语“信号蛋白质”意指多肽序列,其具有靶向亚细胞器的特异运输信号或与其在细胞中的定位相关的特殊性质,例如聚集体形成。优选的信号蛋白质可参见整个此处公开内容,包括实施例部分。
本发明优选的嵌合蛋白质包括通过重组的、化学的或其他适当的方法共价连接到一起(即融合的)可选地掩蔽信号蛋白质、蛋白酶特异的切割位点和可检测的氨基酸序列。在大多数实施方案中,将优选重组方法。虽然大多数发明实施方案通常不需要,但一种或多种成分可通过肽接头序列在一个或几个位点融合。具体的肽接头序列会少于约30个氨基酸,更优选少于约15个氨基酸,还更优选约1个到约5个氨基酸。
该肽序列可包括一种或多种病原体诱导的或宿主细胞诱导的蛋白酶切割位点。可替代地,肽接头可用于协助嵌合蛋白质构建。特别优选的嵌合蛋白质可称为“符合读框的”融合分子。
如上所述,只要蛋白质有预期的功能,可几乎以任何方式组织此处公开的嵌合蛋白质成分。并如上所述,嵌合蛋白质的每一成分可通过至少一种适当的肽接头序列与另一成分隔开。
例如,嵌合蛋白质的任何一种成分均可包括该蛋白质的N末端。另外,任何一种成分均可包括嵌合蛋白质的C末端,该末端可包括另一成分,例如如下讨论的纯化标签序列。除另外指出外,对于氨基酸序列,短语“共价顺序连接”代表,肽键以N到C的方向连接到一起。对于核苷酸序列,该短语意味着表示一个核苷酸与另一个以5′到3′的方向连接。
作为该系统更具体的实例,嵌合蛋白质包括共价顺序连接的:1)信号蛋白质;2)蛋白酶特异的切割位点;和3)可检测的氨基酸序列。可替代地,嵌合蛋白质可包括共价顺序连接的:1)掩蔽序列;2)蛋白酶切割位点;3)信号蛋白质;和4)可检测的氨基酸序列。在另一实施方案中,根据系统特点使用的嵌合蛋白质共价顺序连接的:1)信号蛋白质;2)蛋白酶切割位点;3)掩蔽序列;和4)可检测的氨基酸序列。
在嵌合蛋白质需要一种以上信号蛋白质的发明实施方案中,这样的蛋白质可包括共价顺序连接的:1)第一信号蛋白质;2)蛋白酶切割位点;3)第二信号蛋白质;和4)可检测的氨基酸序列。更具体的,这样的蛋白质可包括共价顺序连接:1)第一信号蛋白质;2)第一蛋白酶切割位点;3)掩蔽序列;4)第二信号蛋白质;和5)可检测的氨基酸序列。
在某些情况下,使系统中的嵌合蛋白质包括一种以上的蛋白酶切割位点是有用的,例如1、2、3或4种。在这种情况下,嵌合蛋白质可包括共价顺序连接:1)掩蔽序列;2)第一蛋白酶切割位点;3)第一信号蛋白质;4)第二蛋白酶切割位点;5)第二信号蛋白质;和6)可检测的氨基酸序列。可替代地,嵌合蛋白质可包括共价顺序连接:1)第一信号蛋白质;2)第一蛋白酶切割位点;3)第二信号蛋白质;4)第二蛋白酶切割位点;5)掩蔽序列;和6)可检测的氨基酸序列。
在另一发明实施方案中,嵌合蛋白质包括共价顺序连接:1)蛋白酶特异切割位点;2)信号蛋白质;和3)可检测的氨基酸序列。可替代地,嵌合蛋白质可包括共价顺序连接:1)第一信号蛋白质;2)第一可检测序列;3)蛋白酶切割位点;和4)第二可检测序列。在这一发明实例中,蛋白质还可包括共价连接在蛋白酶切割位点C末端和第二可检测序列N末端之间的第二信号蛋白质。
本发明还进一步提供嵌合蛋白质,其包括共价顺序连接:1)第一信号蛋白质;2)蛋白酶切割位点;3)第二信号蛋白质;和4)第二可检测序列。可替代地,嵌合蛋白质可包括共价顺序连接:1)第一可检测序列;2)蛋白酶切割位点;3)信号蛋白质;和4)第二可检测序列。
使用适当的分子量标记通过标准的SDS PAGE凝胶电泳确定,本发明更优选的嵌合蛋白质将具有小于约250kDa的分子大小,优选小于约200kDa,更优选的分子大小约25到约175kDa。
“多肽”指优选基本上由20种天然氨基酸的任何氨基酸组成的任何大小的任何聚合体。尽管术语“蛋白质”经常用于指相对大的蛋白质,而“肽”经常用于指小的多肽,但本领域中这些术语的使用经常重叠。除非另外指明,术语“多肽”通常指蛋白质、多肽和肽。
如此处所使用,术语“细胞”包括任何原代细胞或永生化的细胞系,如组织或器官中任何这样的细胞群。优选的细胞包括那些如人源的哺乳动物细胞、植物细胞、酵母、真菌和昆虫细胞。根据本发明,“宿主细胞”可是感染细胞或其可是如此处所描述的可用于扩增核酸或载体的细胞,例如大肠杆菌(E.coli)。
应当理解,本发明的特殊用途会经常要求特异的嵌合蛋白质构型。通过已确认的参数指导特异嵌合蛋白质成分或成分组的选择,其中包括信号蛋白质、蛋白酶特异切割位点,和选择的可检测氨基酸序列、要监测的蛋白酶,和应用要求的敏感性或选择性水平。
举例来说,本发明包括的实施方案,其中嵌合蛋白质包括一种信号蛋白质、一种可检测序列和一种蛋白酶特异的切割位点。在这个实例中,包括与信号蛋白质N或C末端连接的掩蔽序列经常是有用的。即,对于一些发明用途,不希望掩蔽序列与可检测序列连接。
本发明其他特殊的用途一般会要求其他特异的嵌合蛋白质构型。例如,如果一种具体蛋白质有一种信号蛋白质,和位于两种可检测氨基酸序列之间的一种蛋白酶特异切割位点,经常希望除去其中一种可检测氨基酸序列以优化系统。
带有多掩蔽序列会促进本发明的其他用途,其中序列可是信号序列、可检测的氨基酸序列或其他适当的序列,例如蛋白酶特异的切割位点。在这些实施方案中,具有一种或多种另外的掩蔽序列,例如蛋白酶切割位点,对达到系统的最大应用可能并不是必需的。然而在包括两种不同信号蛋白质、一种蛋白酶切割位点和两种可检测的氨基酸序列的实施方案中,其上的一种或两种掩蔽序列是有用的。
另外,特异的嵌合蛋白质可能包括可移去的标签序列,其在一些实施方案中,可能协助嵌合蛋白质的鉴定和/或纯化。一个实例是6Xhis和MYC标签。其他适合的标签序列是本领域众所周知的,如果需要可与本发明一起应用。
本发明的实施完全适合多种掩蔽或暴露的信号蛋白质和其功能片段。优选的实例通常足以将嵌合蛋白质(或该蛋白质的可检测成分,例如可检测序列)定位到细胞器或其他亚细胞区室。术语“区室”代表内部限制空间,例如液泡、过氧化物酶体、线粒体等。
优选的植物信号蛋白质定位嵌合蛋白质或其至少一种成分到植物细胞的细胞核、高尔基体、溶解液泡、储存液泡、过氧化物酶体、线粒体、内质网、质膜,或叶绿体。更优选的植物信号蛋白质包括AtOEP7;RbcS;Cab;RA;SKL;F1-ATPase;PH;FAPP;H+-ATPase;或其功能片段。优选的动物信号蛋白质定位嵌合蛋白质或其至少一种成分到动物细胞的细胞核、高尔基体、储存液泡、溶酶体、过氧化物酶体、内质网、质膜或线粒体。实例包括人肽蛋氨酸亚砜还原酶(MSRA)、细胞色素b2、11-β-羟基类固醇脱氢酶(11β-HSD)、G9-AKL、过氧化物酶整合膜蛋白质47(PMP47);或其功能片段。参见以下优选动物信号蛋白质序列的实施例。
如上所述,本发明的实施适合使用动物细胞有效的信号蛋白质。一般实例包括,但不限于,下面表I中列出的动物信号。
表I
  蛋白质   细胞器   信号位置   类型1
  MSRA   线粒体   N末端   A
  细胞色素b2   线粒体   N末端   A
  11β-HSD   内质网   N末端   A&B
  G9-AKLPMP47   过氧化物酶体过氧化物酶体   C末端蛋白质中间区域   AB
1.类型A:信号蛋白质可用作掩蔽信号蛋白质。
类型B:信号蛋白质可用作暴露信号蛋白质。
参见Hansel等人FASEB J 2002年6月;16:911-31(human peptidemethionine sulfoxide reductase;″MSRA″);Bomer U等人(1997)J BiolChem 272 30439-30446(Cytochrome b2);Naray-Fej es-Toth A和Fejes-Toth G(1996)J Biol Chem 271 15436-1544(11β-hydroxysteroiddehydrogenase(11β-HSD));McNew JA和Goodman JM(1994)J CellBiol127 1245-1257(G9-AKL);Dyer等人,(1996)J Cell Biol133 269-280(PMP47(peroxisomal integral membrane protein 47))。
当此处用于描述信号蛋白质时,短语“功能片段”,代表特定信号蛋白质的片段,其能提供至少约70%、优选高于约90%的全长序列的穿梭功能。信号蛋白质功能的检测和定量方法是公知的,包括使用实施例部分描述的荧光成像技术定位和定量信号强度。
显而易见,本发明是灵活的并不限于使用任何特定的蛋白酶特异的切割位点。例如,切割位点可被哺乳动物或病毒蛋白酶特异切割。术语“特异切割”是指蛋白酶特异切割位点中的肽键被受试蛋白酶特异断裂(即,水解)。即,蛋白酶切割位点不被宿主细胞中天然存在的蛋白酶断裂,包括通常称为持家蛋白酶的那些。可用多种技术监测那些蛋白酶切割位点的特异切割,包括SDS聚丙烯酰胺凝胶电泳方法。
优选的蛋白酶切割位点是那些被人类病原体相关蛋白酶特异水解的位点,例如,酵母、细菌、真菌、线虫,病毒或原生动物。更具体的实例包括巨细胞病毒(CMV);单纯疱疹病毒(HSV);肝炎病毒,优选甲型或丙型;疟原虫、人类免疫缺陷病毒(HIV)、卡波济肉瘤相关疱疹病毒(KSHV)、黄热病病毒、黄病毒、鼻病毒,或疟原虫,例如恶性疟原虫(P.falciparum)、间日疟原虫(P.vivax)、卵形疟原虫(P.ovale),或三日疟原虫(P.malariae)。一般地,疟原虫导致疟疾或多种与疟疾相关的医学并发症。认识到疟原虫天冬氨酸蛋白酶I和II(plasmepsin I和plasmepsin II)是相互联系的。在HSV作为目标的实施方案中,蛋白酶是HSV成熟蛋白酶。
多种特定的HIV-1和HCV蛋白酶特异的切割位点已经公开。参见例如,Gluzman,I.Y.等人,J.Clin.Invest.,94:1602(1994);Grakoui,A.等人,J.of Virol.,67:2832(1993);Kolykholov,AA.等人,J.of Virol.,68:7525(1994);和Barrie,K.A.等人,Virology,219:407(1996),引用其内容作为参考。
另外的病原体特异的蛋白酶和特异切割位点已经公开,并可根据本发明应用。例如,HSV-1成熟蛋白酶和蛋白酶切割位点已经公开。参见例如,Hall,M.R.T.和W.Gibson,Virology,227:160(1997)。另外,已在恶性疟原虫消化液泡中发现了疟原虫天冬氨酸蛋白酶I和II。对应的蛋白酶切割位点也已公开。参见例如,Moon,R.P.,Eur.J.Biochem,244:552(1997)。
本发明使用的其他蛋白酶切割位点,被血液凝固、凋亡或细胞外基质相关的哺乳动物蛋白酶特异切割。参见下面的实施例和讨论。
本发明的实施适应使用一种或组合的可检测氨基酸序列,例如,那些直接或间接荧光、磷光,发光或化学发光的序列。在使用两种或更多这种可检测序列的实施方案中,其中一种可检测序列的发射波长总是与至少另一种可检测序列的发射波长不同。例如,优选的可检测序列衍生自某些众所周知的水母荧光蛋白质,包括那些已知在适当激发条件下,发射绿、红,和黄光的蛋白质。
如上所述,本发明还提供基本上纯的嵌合蛋白质。这种嵌合蛋白质可通过公知技术的适当组合分离和纯化。如需要,这种蛋白质可包括一种或多种此处所描述的纯化标签。这些方法包括,例如,利用溶解性的方法,例如盐沉淀和溶剂沉淀,利用分子量不同的方法,例如透析、超滤、凝胶过滤,和SDS聚丙烯酰胺凝胶电泳,利用电荷不同的方法,例如离子交换柱层析,利用特异亲和性的方法,例如亲和层析,利用疏水性不同的方法,例如反相高效液相色谱,和利用等电点不同的方法,例如等电聚焦电泳,金属亲和柱例如Ni-NTA。通常参见Sambrook等人,Molecular Cloning:A Laboratory Manual,2nd ed.(1989);Ausubel等人,Current Protocols in Molecular Biology,John Wiley&Sons,New York(1989);和Ausubel等人,Short Protocols in Molecular Biology,John Wiley&Sons,New York(1999)与这些方法相关的内容。
优选本发明的嵌合蛋白质是基本上纯的。即,嵌合蛋白质已经从其自然伴随的细胞取代物中分离出来,以便嵌合蛋白质优选以至少80%或90%到95%的同质性(W/W)存在。对于多数制药、临床和研究应用,嵌合蛋白质具有至少98到99%的同质性(W/W)是最优选的。一旦基本上纯化,嵌合蛋白质应当基本上没有细胞培养和相关应用的污染。一旦部分纯化或达到基本纯度,溶解的嵌合蛋白质可用于治疗,或进行如此处所公开的体外或体内试验。基本纯度可通过许多标准技术确定,例如色谱法和凝胶电泳。
适当的宿主细胞可用于制备目的以增殖编码目的嵌合蛋白质的核酸。因此宿主细胞可包括欲在其中产生嵌合蛋白质的原核、植物或真核细胞。因此宿主细胞尤其包括能增殖编码嵌合蛋白质的核酸的酵母、蝇、蠕虫、植物、蛙、哺乳动物细胞,植物细胞和器官。可使用的哺乳动物细胞系非限制性的实例包括CHO dhfl-细胞(Urlaub和Chasm,Proc.Natl.Acad.Sci.USA,77:4216(1980)),293细胞(Graham等人,J Gen.Virol.,36:59(1977)),骨髓瘤细胞,象SP2或NSO(Galfre和Milstein,Meth.Enzymol.,73(B):3(1981))。其他适当的细胞公开在Sambrook等人,同上。
能增殖编码目的嵌合蛋白质的核酸的宿主细胞,也包括非哺乳动物真核细胞,包括昆虫(例如,Sp.frugiperda)、酵母(例如,啤酒糖酵母(S.cerevisiae)、粟酒裂殖糖酵母(S.Pombe)、巴斯德毕赤氏酵母(P.Pastoris)、乳克鲁维氏酵母(K.lactis)、多态丝状单孢菌(H.polymorpha);如Fleer,R.所做的一般综述:Current Opinion in Biotechnology,3(5):486496(1992)),真菌和植物细胞(例如,拟南芥属和烟草属(Nicotinia))。还包括使用某些原核细胞,例如大肠杆菌和芽胞杆菌(Bacillus)。
编码目的嵌合蛋白质的核酸可通过转染细胞的标准技术引入宿主细胞。术语“转染”包含将核酸引入宿主细胞的所有常规技术,包括磷酸钙共沉淀、DEAE葡聚糖介导的转染、脂质转染、电穿孔、显微注射,病毒转导和/或整合。适当的转染宿主细胞的方法可见Sambrook等人(见上文)和其他实验室教科书。
本发明还提供分离目的嵌合蛋白质的制备方法。在该方法中,宿主细胞(例如,酵母、真菌、昆虫,细菌或动物细胞),其中已经引入与调控序列有效连接的编码目的蛋白质的核酸,在嵌合蛋白质存在下于生产规模的培养基中生长以刺激编码目的嵌合蛋白质的核苷酸序列转录。然后,从收获的宿主细胞或从培养基中分离目的嵌合蛋白质。可使用标准的蛋白质纯化技术从培养基或从收获的细胞中分离目的蛋白质。具体地,从许多种器具,包括滚瓶、旋转烧瓶、组织培养皿、生物反应器,或发酵罐中,可使用纯化技术大规模(即,至少毫克量)表达和纯化目的嵌合蛋白质。
因此本发明还提供编码嵌合底物蛋白质的核酸序列。编码嵌合底物蛋白质的核酸可用于转化细胞以在细胞中表达嵌合底物蛋白质。为转化细胞,重组基因必需包括启动子和其他与嵌合底物蛋白质编码区可操作连接的调控核酸序列。通过已知的参数指导启动子的选择,一般是宿主细胞的选择。
如上所述,本发明还提供核酸序列,尤其是编码本发明嵌合蛋白质的DNA序列。优选地,DNA序列由适合染色体外复制的载体携带,例如噬菌体、病毒、质粒、噬菌粒、粘粒、YAC,或附加体。特别地,编码目的嵌合蛋白质的DNA载体可用于促进此处描述的制备方法和获得大量嵌合蛋白质。DNA序列可插入适当的表达载体,即,含有插入蛋白质编码序列转录和翻译必需元件的载体。多种宿主载体系统可用于表达蛋白质编码序列。这些包括病毒(例如,痘苗病毒、腺病毒等)感染的哺乳动物细胞系统;病毒(例如,杆状病毒)感染的昆虫细胞系统;微生物,例如含有酵母载体的酵母,或用噬菌体DNA、质粒DNA或粘粒DNA转化的细菌。根据使用的宿主载体系统,可使用大量适当的转录和翻译成分中的任何一个。通常参见Sambrook等人,见上文和Ausubel等人,见上文。
大体上,根据本发明,优选的DNA载体包括磷酸二酯键连接的核苷酸序列,其包括,以5′到3′的方向,第一克隆位点,用于引入编码此处所描述的嵌合蛋白质的第一核苷酸序列。如果需要,蛋白质可与编码一种或多种适当标签序列的DNA连接。图7(a)-(j);8(a)-(b);和9(a)-(c)提供这种载体的实例。
在一些发明实施方案中,优选以“盒”的形式提供DNA载体编码的嵌合蛋白质。术语“盒”意思是编码的蛋白质(或其成分)易于通过标准的重组方法用另一成分取代。特别地,当用一种蛋白酶特异的切割位点或可检测的氨基酸序列与另一种“交换”时,以盒的形式装配的DNA载体是特别需要的。参见图7(a)-(j);8(a)-(b);和9(a)-(c),其中核心载体用于表达多种嵌合蛋白质。
更具体地,预见在一些实例中,某些病原体血清型,尤其是病毒株,可与个别该血清型或病毒株特异的蛋白酶切割位点相关。关于这一点,药物抗性HIV血清型的出现尤其成问题。在这种情况下,形式为盒的DNA载体中一种或多种存在的蛋白酶切割位点可用其他所需的预定的蛋白酶切割位点替换。具体的蛋白酶切割位点可根据特定病人中存在的病原体选择。
值得注意的是,本发明可作为显示受试细胞或组织中蛋白酶活性变化的有效“警告系统”。例如,在PCR或杂交实验已经表明编码病原体相关蛋白酶的基因组DNA存在的情况下,使用本发明可检测细胞或组织中活性蛋白酶的存在。本发明的这个特点在多种情况下是有用的,包括已知或怀疑病原体污染的细胞培养。
如上所述,本发明可用于检测目的宿主细胞或组织中一种或多种蛋白酶的存在。对于检测和分析蛋白酶抑制剂分子,此处描述的方法和组分尤其有用,如上所述,其中蛋白酶抑制剂分子可天然存在或是这种分子库(即,化学文库)的一部分。
A.使用本发明筛选候选蛋白酶抑制剂
1.一般论述
除本发明描述的实施例中使用的植物原生质体外,根据本发明,带细胞壁的正常植物细胞或人、动物,或昆虫细胞也可用于筛选蛋白酶抑制剂。因为更容易转化和培养及由于原生质体规则的球形也方便蛋白质定位的鉴定,因此经常优选植物细胞。然而,其他细胞和组织也是有用的,例如,目的蛋白酶不能以活性形式在植物细胞中表达时。例如,这种蛋白酶难以表达可能由于不适当的翻译后修饰。如果这个问题出现,可使用适当的动物或昆虫细胞解决它。在这种情况下,必需使用在所选细胞中有效的信号蛋白质。例如,如果人、动物,或昆虫细胞用于筛选,就不能使用叶绿体靶向的信号蛋白质,例如AtOEP7、RbcS、Cab和RA,因为叶绿体在这些细胞中不存在。对于人、动物,或昆虫细胞,可使用靶向到其他亚细胞器的信号蛋白质,例如线粒体、过氧化物酶体、质膜等。另外,必需根据使用的细胞正确选择包含启动子和其他调控元件的载体系统。
对于本发明的蛋白酶抑制剂的体内筛选,制备可表达目的蛋白酶和该蛋白酶特异的嵌合底物蛋白质的转化细胞。制备转化细胞最优选的方法是,用本发明提供的编码蛋白酶的重组质粒和编码嵌合底物蛋白质的重组质粒共转化细胞。如果蛋白酶是病毒蛋白酶,还可使用病毒感染在转化细胞中表达蛋白酶。
多种植物、动物、酵母、真菌和昆虫细胞的转化方法已经建立。例如,通过引入重组质粒转化细胞的方法包括,但不限于,使用PEG(聚乙二醇)、磷酸钾,或DEAE葡聚糖的化学介导方法,阳离子脂质介导的脂质转染、显微注射、电穿孔、电融合,和DNA轰击。根据使用的细胞类型,必需选择适当的转化方法并需要优化条件以达到有效转化。如果使用植物细胞的原生质体,例如拟南芥属或烟草原生质体,实施例1(c)中描述的PEG介导的转化方法是优选的方法。实施例1(c)中给出的条件对于拟南芥原生质体进行优化。如果使用带细胞壁的正常植物细胞,可根据植物细胞类型使用基因枪DNA轰击或PEG介导的转化方法。对于人、动物,或昆虫细胞,可使用磷酸钾介导或DEAE葡聚糖介导的转染方法或阳离子脂质介导的脂质转染方法转化细胞。
为筛选蛋白酶抑制剂,在表达蛋白酶和嵌合底物蛋白质时,转化细胞需要与候选化合物接触。一般地,候选化合物加入包含转化细胞的溶液,并将产生的溶液在适当的温度湿育。候选抑制剂可以选自化合物、肽、化合物或肽的混合物、和天然产物的提取物。根据细胞类型和温育温度,可改变表达蛋白质的温育时间。它可为约1小时到几天。对于拟南芥属原生质体,根据温育条件,温育时间可短至4小时和长至约1周。当拟南芥属原生质体在22℃于W5溶液中温育时,优选的温育时间是12到48小时。可以检测的候选抑制剂浓度为约0.1到100μg/ml。在一般筛选中,可使用的浓度为约1到几个μg/ml。在大量候选化合物需要筛选的情况下,在第一轮筛选中可使用约5-30种候选抑制剂的混合物。
根据本发明,可筛选几乎任何化合物或化合物组的抗蛋白酶活性。实例包括,但不限于,细胞因子、肿瘤抑制因子、抗体、受体、突变蛋白质、这种蛋白质的片段或部分,和活性RNA分子,例如,反义RNA分子或核酶。用于筛选的优选化合物是合成或半合成药物(有时指“小分子”)。例如,通过本方法容易检测已知人类病毒病原体抑制剂的衍生物库。参见例如,美国专利6,420,438;6,329,525;6,287,840;6,147,188;和6,046,190(其公开了多种可检测的分子和其衍生物)。
可使用本发明筛选另外的化合物。参见Pillay等人(1995)Rev.Med.Virol.(公开了多种潜在的病毒蛋白酶抑制剂化合物);和Wei等人(1995)Nature,373:117(公开了印地那韦、ABT-538);Ho等人(1992)Ann.Intern.Med.113:111(公开了抗疱疹剂)。另外,根据本发明,可筛选上述特异化合物的衍生物,包括但不限于,沙奎那韦(saquinavir)和其衍生物。
为鉴定候选化合物对蛋白酶活性的抑制,优选监测转化细胞作为时间函数的荧光图像。根据细胞条件表达时间可能改变,因此可能在不同时间出现蛋白水解活性或抑制。如果拟南芥属原生质体是要用的细胞,监测荧光图像的优选时间顺序是在表达开始后的12、18、24、36,和48小时。如果嵌合底物蛋白质有两种或多种不同的荧光标记,优选在两种或多种荧光标记特异的荧光波长上监测荧光图像。因为其可方便亚细胞器的鉴定,因此优选监测亮视野图像。为方便蛋白酶抑制剂的鉴定,为了比较,还优选监测未与候选抑制剂接触的转化细胞的荧光图像。装备有多色荧光滤光片装置的标准荧光显微镜,例如Zeiss Axioplan荧光显微镜或Nikon E800荧光显微镜,可以200×、400×,或600×的放大倍数用于监测荧光图像。扫描聚焦显微镜可用于获得更高分辨率的图像。
显而易见,本发明适合广谱嵌合底物蛋白质的构建和应用。例如,参见实施例1。
2.NIa蛋白酶的应用说明
为使用如上所述构建的嵌合底物蛋白质检测蛋白酶活性,在本发明实施例中使用烟草叶脉色斑病毒(vein mottling virus)(TVMV)NIa蛋白酶作为模型系统。NIa蛋白酶是定性最好的病毒蛋白酶之一,并已知其切割TVMV产生的聚蛋白的七个特异位点。为达到最佳的蛋白酶活性,需要N末端的六个氨基酸残基(P6-P1)和C末端的四个氨基酸残基(P1’-P4’),并必需包括底物蛋白质P4-P1位的四个保守氨基酸残基(V-R-F-Q)。如果四个保守氨基酸残基的任何一个突变成甘氨酸(Gly),底物蛋白质的蛋白酶剪切就不能发生(Yoon,H.Y.等人,2000)。
当表达嵌合底物蛋白质(包含NIa蛋白酶蛋白水解位点(PS(NIa))的RFP:PS(NIa):AtOEP7:GFP)的重组基因通过聚乙二醇介导的转化方法引入原生质体时,GFP和RFP在胞质溶胶中积聚成大的聚集体(图4)。这种结果对应于蛋白酶没有作用的情况。在这种情况下,怀疑胞质溶胶中聚集体的积聚是AtOEP7蛋白质疏水区中疏水相互作用的结果。如果嵌合底物蛋白质的红色荧光不易与叶绿体的自发荧光区别时(图4(b)),可通过使用两种不同的荧光标记,并观察重叠荧光图像(图4(c))中绿色荧光和红色荧光是否相合,而清楚地测定底物反应。当编码NIa蛋白酶的质粒和编码RFP:PS(NIa):AtOEP7:GFP的质粒在转化中一起引入时,绿色和红色荧光信号被分别分离到叶绿体外包膜和胞质溶胶中(图5)。这种结果说明NIa蛋白酶成功地切割了嵌合底物蛋白质的蛋白水解位点以产生两种蛋白质,RFP和AtOEP7:GFP。通过观察由于信号蛋白质的作用,绿色荧光信号易位到叶绿体外包膜(图5(a))、红色荧光信号在胞质溶胶中弥散(图5(b)),和两种荧光信号的重叠图像(图5(c)),可鉴定蛋白酶反应。
通过与对照实验对比,可更清楚地看到本发明鉴定酶反应结果的效率。比较图4(a)和5(a),可观察到蛋白酶剪切使信号蛋白质的掩蔽运输信号活化,引起荧光分布的改变。比较图4(b)和5(b),可观察到,红色荧光蛋白质用作信号掩蔽蛋白质除掩蔽运输信号外,还在改变荧光信号的分布中发挥作用。
因此建议,嵌合底物蛋白质,其包括带信号蛋白质和荧光蛋白质的嵌合蛋白质和带蛋白水解位点的信号掩蔽蛋白质,可用作底物以确定蛋白酶活性及体内筛选其抑制剂。
3.高通量筛选方法:总体考虑
本发明提供的体内蛋白酶抑制剂筛选方法容易适用于高通量试验。高通量筛选方法,包括表达蛋白酶和其嵌合底物蛋白质的转化细胞与候选化合物接触、温育转化细胞、获得转化细胞的荧光图像、将荧光图像转换成数字数据,并分析数字数据以确定候选化合物是否抑制了蛋白酶。
在本发明的高通量筛选中,等量的转化细胞溶液加入96或384孔微量滴定板的阵列孔中,并且每个孔中加入不同的候选化合物。然后在控制环境中(适宜的温度、湿度,和空气构成)温育微量滴定板中的转化细胞以表达蛋白酶和其嵌合底物蛋白质。在预选温育时间后,用荧光显微镜获得每孔转化细胞的荧光图像。
高通量筛选装置由以下部分组成:(1)多个微量滴定板中转化细胞样品阵列的培养箱、(2)自动采样器、(3)装备XY平移样品平台(XY-translation sample stage)和高分辨数字照相机的自动荧光显微镜。在预选温育时间后,自动采样器从每孔中取样一小部分转化细胞溶液并置于观察片上,例如载物玻片。采样可使用多吸头(tip)或吸管以平行方式或使用单吸头或吸管以连续方式进行。在每次采样后,吸头或吸管要用适当的洗液洗涤。转化细胞样品在预选位置以阵列的形式置于观察片上。XY平移平台在XY方向上固定和移动观察片以在显微镜物镜下定位每个样品。Z轴聚焦驱动器(focus drive)在Z方向上移动显微镜物镜或观察片以聚焦。对于每个样品,使用数字照相机在预选荧光波长上捕获荧光图像,输入个人计算机,并作为数字数据保存。装备自动控制器以控制吸管采样器、XY平移平台和Z聚焦驱动器。个人计算机提供显示器和数据分析软件。
通过检测亚细胞荧光分布可自动确定蛋白酶抑制剂。一般地,可从数字图像数据中计算观察细胞范围内荧光信号集中或分散的程度,并用作判断的标准。某些情况下,荧光信号分布的方式或形状可用作判断的标准。
适合本发明使用的高通量筛选实验方案的实例已经公开在美国专利号5,989,835和PCT申请WO 00/79241A2中。
下述表2和3提供本发明使用的序列信息:
表2
PCR引物的SEQ ID NO(序列识别号)
  5’引物   3’-引物
  部分AtOEP7   1   2
  部分RbcS   3   4
  部分Cab   5   6
  部分RA   7   8
  部分F1-ATPase   9   10
  SKL   11   12
  H+-ATPase   13   14
  NIa蛋白酶底物蛋白质   15   16
  HIV-1蛋白酶   17   18
  HIV-1蛋白酶底物蛋白质   19、20、21、22、23、24、25、26、27   28
表3
信号蛋白质的SEQ ID NO
  核酸序列   蛋白质序列
  部分AtOEP7   29   30
  部分RbcS   31   32
  部分Cab   33   34
  部分RA   35   36
  部分F1-ATPase   37   38
  H+-ATPase   39   40
  部分PH   41   42
  部分FAPP   43   44
下面提供本发明使用的说明性的核酸和蛋白质序列信息。蛋白酶和其切割位点的实例提供在SEQ ID NO:45-50、55-74,和77-120。实例包括NIa蛋白酶(SEQ ID NO:45和46)和其切割位点(SEQ ID NO:47-50)、HIV-1蛋白酶(SEQ ID NO:55和56)和其切割位点(SEQ IDNO:57-74)、HCV NS3蛋白酶(SEQ ID NO:77和78)和其切割位点(SEQ ID NO:79-84)、HSV-1蛋白酶(SEQ ID NO:85和86)和其切割位点(SEQ ID NO:87-90)、HTLV-1蛋白酶(SEQ ID NO:91和92)和其切割位点(SEQ ID NO:93-96)、HCMV蛋白酶(SEQ ID NO:97和98)和其切割位点(SEQ ID NO:99-102)、APP β-分泌酶(SEQ ID NO:103和104)和其切割位点(SEQ ID NO:105和106)、天冬氨酸特异性半胱氨酸蛋白酶(caspase)3(SEQ ID NO:107和108)和其切割位点(SEQID NO:113和114)、天冬氨酸特异性半胱氨酸蛋白酶3大亚单位(SEQID NO:109和110)、天冬氨酸特异性半胱氨酸蛋白酶3小亚单位(SEQID NO:111和112)、人凝血因子II(SEQ ID NO:115和116)和其切割位点(SEQ ID NO:117和118),和人凝血因子XI(SEQ ID NO:119和120)。
两种NIa蛋白酶底物蛋白质的核酸和蛋白质序列提供在SEQ IDNO:51-54,HIV-1蛋白酶底物蛋白质的那些序列提供在SEQ ID NO:55和56。
下面的论述涉及韩国申请No.10-2001-0048123,其中公开了本发明另外的用途和优点。
如其中所提供,本发明提供可用于筛选体内蛋白酶抑制剂的重要嵌合底物蛋白质。如其中特别公开的,本发明涉及筛选蛋白酶抑制剂的系统并且其提供:(i)通过蛋白酶的特异功能引起荧光亚细胞定位和分布改变的构建的嵌合底物蛋白质、(ii)包含编码嵌合底物蛋白质核酸序列的重组基因,其可用于在细胞中表达嵌合底物蛋白质、(iii)在蛋白酶和嵌合底物蛋白质一起出现在一个细胞中,以便通过蛋白酶的蛋白酶剪切可在细胞中发生的情况下,通过检测荧光的亚细胞定位和分布鉴定蛋白酶活性的方法,和(iv)使用嵌合底物蛋白质和上述方法体内筛选蛋白酶抑制剂的方法。
更具体地,韩国申请No.10-2001-0048123公开了这种嵌合底物蛋白质可用在细胞中,其中当信号蛋白质在细胞中表达时,其可指导向亚细胞器的运输。更详细地,指向特定亚细胞器的运输信号(包括在信号蛋白质中),可通过在信号蛋白质的N或C末端连接信号掩蔽蛋白质而失活。在本发明中,信号蛋白质与带蛋白酶的蛋白酶剪切位点的信号掩蔽蛋白质连接,以便根据蛋白水解位点的切割活化或失活信号蛋白质的运输。换言之,嵌合底物蛋白质的运输(其中用蛋白水解位点连接信号蛋白质和信号掩蔽蛋白质)直到信号掩蔽蛋白质被蛋白酶切掉时才发生。这种切割诱导信号蛋白质的正常运输。在本发明中,用荧光蛋白质标记信号蛋白质和/或信号掩蔽蛋白质,以便可通过检测荧光信号定位和分布特征的变化确定蛋白酶活性。因此,在本发明中用作蛋白酶底物的嵌合蛋白质有以下特点:
(1)嵌合底物蛋白质包括至少一种信号蛋白质,其具有指导向特定亚细胞器转运的运输信号。
(2)嵌合底物蛋白质包括至少一种特定蛋白酶的蛋白酶剪切位点。
(3)通过蛋白酶剪切位点与信号蛋白质的连接,或通过蛋白酶剪切位点将信号掩蔽蛋白质与信号蛋白质连接,可失活(1)中阐明的信号蛋白质的运输信号。
(4)当蛋白酶在蛋白水解位点上的切割时,可活化信号蛋白质的失活的运输信号。
(5)至少用一种荧光蛋白质标记嵌合底物蛋白质,来自细胞的荧光信号随蛋白酶的蛋白酶剪切而变化。
如韩国申请No.10-2001-0048123中所述,本发明还提供使用此处描述的嵌合底物蛋白质体内检测蛋白酶活性的方法。还提供使用蛋白酶活性检测方法筛选蛋白酶抑制剂的方法。
如韩国申请No.10-2001-0048123中进一步公开的那样,为体内检测蛋白酶活性,蛋白酶和蛋白酶特异的嵌合底物蛋白质必需共存在一个细胞中。
另外,根据一个发明方面,在细胞中引入嵌合底物蛋白质的重组基因以在细胞中表达嵌合底物蛋白质。筛选蛋白酶抑制剂的靶蛋白酶可以是存在于细胞中的内源性蛋白酶,或通过重组基因转化或病毒感染表达的外源性蛋白酶。然而,当内源性蛋白酶是靶标时,例如,由于蛋白酶表达调节及低水平蛋白酶表达下的检测困难,可降低筛选的精度和效率。因此,本发明提供测定体内蛋白酶活性效率更高的系统,其中可通过用重组基因转化细胞或用病毒感染细胞以调节方式过表达或表达特定的蛋白酶。对于病毒蛋白酶可使用病毒感染。然而,由于不完全明白病毒蛋白酶的表达调节,因此更优选使用通过编码蛋白酶的重组基因转化细胞表达的蛋白酶。因为表达的蛋白酶定位在胞质溶胶中,所以需要使嵌合底物蛋白质也定位在胞质溶胶中。因此,根据本发明的第一部分,可通过使用嵌合底物蛋白质构建有效检测体内蛋白酶活性的系统,其中包括在嵌合底物蛋白质中的信号蛋白质的运输信号被掩蔽。
另外,可通过检测荧光信号定位和分布的变化选择蛋白酶抑制剂,这种变化是通过在蛋白酶和其嵌合底物蛋白质在细胞中表达之前、之后,或同时,用候选化合物处理细胞引起。
在许多酶促反应中,反应物不能完全转化成产物。在反应被抑制剂抑制的情况下,其也可被部分抑制而非完全抑制。而且,当观察多细胞时,每个细胞中的蛋白酶活性水平可相当大地改变。因此,如果用于测定蛋白酶活性的方法具有低灵敏度或低对比度,可能在测定蛋白酶抑制剂的抑制活性上有相当大地错读(ambiguity)。为避免这种错读,在嵌合底物蛋白质的构建中,选择可因为蛋白酶剪切而引起荧光信号细胞定位和分布可清楚辨别变化的信号蛋白质是重要的。另外,通过使用两种或多种不同荧光波长的荧光蛋白质可增加测定抑制活性的效率。在本发明的实施例2中,在嵌合底物蛋白质的构建中使用了GFP和RFP,以便它们可根据蛋白酶剪切定位在不同的亚细胞器中。
如上所述,根据本发明某些信号蛋白质是可选地掩蔽的。在这个实施方案中,由于与信号蛋白质连接的蛋白水解位点或信号掩蔽蛋白质的信号掩蔽,本发明提供的包括在嵌合底物蛋白质中的信号蛋白质是失活的,因此嵌合底物蛋白质存在于胞质溶胶中。蛋白酶剪切可活化信号蛋白质以指导其运输到亚细胞器。在选择运输信号在嵌合底物蛋白质中失活的信号蛋白质时,需要考虑信号蛋白质的不同性质。内体运输蛋白质在它们刚一合成时就包封在内质网中转运到高尔基体、溶解液泡、储存液泡,或细胞膜中。内体运输蛋白质的运输信号在翻译过程中被识别。因此,不可能通过简单地连接和切掉有或没有信号掩蔽蛋白质的蛋白水解位点,失活和活化内体运输蛋白质的运输信号。因此,这些内体运输蛋白质不适合作为运输信号被失活的信号蛋白质用于本发明。根据本发明,因为可掩蔽其运输信号,所以在胞质溶胶中表达并直接运输到亚细胞器的蛋白质可用作信号蛋白质。在后面的信号蛋白质中,有核定位信号(NLS)的信号蛋白质不依赖N或C末端,因此通过连接或切掉有或没有信号掩蔽蛋白质的蛋白水解位点控制这些信号蛋白质的运输是困难的。因此希望选择靶向有线粒体、叶绿体,或过氧化物酶体的运输信号的信号蛋白质。对于植物细胞,更优选使用叶绿体靶向的信号蛋白质,因为叶绿体比较大并更容易检测其形状和分布。
包括在本发明嵌合底物蛋白质中的信号掩蔽蛋白质,通过蛋白水解位点与信号蛋白质连接而失活信号蛋白质的运输信号。信号掩蔽蛋白质可是通过蛋白水解位点与信号蛋白质连接的氨基酸、肽或蛋白质。对于一些实例,可通过蛋白水解位点单独与信号蛋白质的连接失活信号蛋白质的运输信号。信号掩蔽蛋白质和蛋白水解位点必需不干扰底物与蛋白酶的结合。除简单信号掩蔽外,信号掩蔽蛋白质还可用于改变嵌合底物蛋白质的整体性质,或附加另外的运输信号或荧光标记。例如,如果另一信号蛋白质被选作信号掩蔽蛋白质,当被蛋白酶切掉时,该信号蛋白质将移动到其靶细胞器。在这种情况中,如果还用荧光蛋白质标记该信号蛋白质,可通过检测两种不同的荧光信号更清楚地鉴定底物蛋白质的切割。在另一实例中,可使用荧光蛋白质作为信号掩蔽蛋白质。在这个情况中,通过蛋白酶剪切形成的荧光蛋白质将停留在胞质溶胶中。因此可通过分别观察来自胞质溶胶和亚细胞器的荧光信号,提高测定蛋白酶活性或检测蛋白酶抑制剂抑制活性的效率,其中通过蛋白酶剪切形成的信号蛋白质被转运到亚细胞器中。
可使用一种标准重组方法或方法组合制备此处公开的嵌合底物蛋白质。即,嵌合底物蛋白质的构建方法的特征在于其可扩充性(expandability)。例如,如果在蛋白酶的嵌合底物蛋白质中包括至少两种蛋白水解位点,则可观察到两种或多种信号蛋白质的运输。如果引入两种或多种不同蛋白酶的蛋白水解位点,则可同时检测两种或多种蛋白酶的活性。
信号蛋白质和信号掩蔽蛋白质的选择及嵌合底物蛋白质构建的详细方法如下。标志-↓-代表蛋白酶的蛋白水解位点,M代表信号掩蔽蛋白质。
(1)在运输信号在信号蛋白质N末端(nS)的情况中,信号掩蔽蛋白质置于信号蛋白质N末端一边:(M-↓-nS)。
(2)在运输信号在信号蛋白质C末端(Sc)的情况中,信号掩蔽蛋白质置于信号蛋白质C末端一侧:(Sc-↓-M)。
(3)在另一信号蛋白质S’用作信号掩蔽蛋白质的情况中,可选择S’在与S相对的一侧保持运输信号。可通过构建两个信号蛋白质运输信号部分连接的嵌合底物蛋白质,同时掩蔽两个信号蛋白质的运输信号:(Sc-↓-nS’或S’c-↓-nS)。
(4)在如(3)的构建中,如果引入两种蛋白水解位点,信号掩蔽蛋白质必需置于两种信号蛋白质之间:(Sc-↓-M-↓-nS’或Sc’-↓-M-↓-nS)。
(5)如果信号蛋白质(S)和用作信号掩蔽蛋白质的另一信号蛋白质(S’)的运输信号在同一侧,则需要连接掩蔽S’运输信号的另一信号掩蔽蛋白质:(M-↓-nS’-↓-nS或Sc-↓-Sc’-↓-M)。
通过扩展上述(1)到(5)的构建,可用三种或更多的蛋白水解位点构建嵌合底物蛋白质:(Scm-↓-......-↓-Sc2-↓-Sc1-↓-M-↓-nS1-↓-nS2-↓-......-↓-nSn)。
上述构建方法是可能构建方法的代表实例。
除上述包括在嵌合底物蛋白质中的所有信号蛋白质的运输信号都被掩蔽的实例外,有可以提供蛋白酶剪切在胞质溶胶中发生的嵌合底物蛋白质的其他构建方法。如果只有一种包括在嵌合底物蛋白质中的信号蛋白质的运输信号保持活性,而其余信号蛋白质的所有运输信号都被掩蔽,则嵌合底物蛋白质将被易位到活性信号蛋白质靶标的亚细胞器。在这当中,如果易位嵌合底物蛋白质位于亚细胞器膜,可构建嵌合底物蛋白质,其中暴露至少一种蛋白水解位点和至少一种失活信号蛋白质于胞质溶胶中,以便达到与使用所有信号蛋白质的运输信号都被掩蔽的嵌合底物蛋白质同样效果。如果该只有一种信号蛋白质保持活性的嵌合底物蛋白质用作底物,因为蛋白水解位点暴露于胞质溶胶中,所以可通过存在于胞质溶胶中的蛋白酶发生蛋白水解反应,尽管嵌合底物蛋白质不是自由分散在胞质溶胶中。在这种情况中,暴露于胞质溶胶的失活信号蛋白质通过蛋白酶剪切被活化。因此,包括该活化信号蛋白质的蛋白质片段将易位到与嵌合底物蛋白质居留的亚细胞器不同的特定亚细胞器,这导致附着于活化信号蛋白质的荧光信号定位和分布的改变。
构建只有一种信号蛋白质运输信号保持活性的嵌合底物蛋白质的另一可能方法是,无运输信号的荧光蛋白质,例如GFP或RFP,与暴露于胞质溶胶的蛋白水解位点连接,而不是连接信号蛋白质。在这种情况中,因为由蛋白酶剪切产生的荧光蛋白质分散在胞质溶胶中,所以荧光信号的分布从特定细胞器变成胞质溶胶。然而,在这种情况中,由于酶反应的不完全,所以荧光信号是否定位在膜或胞质溶胶的分辨清晰度是低的。另外,在构建只有一种信号蛋白质保持活性的嵌合底物蛋白质中可能有相当大的困难,因为不仅需要信号蛋白质易位到的亚细胞器的详细信息,而且需要易位信号蛋白质定向和位置的详细信息。
靶向到线粒体、叶绿体,和细胞核外膜、过氧化物酶体膜和质膜的信号蛋白质,可用作在嵌合底物蛋白质中保持活性的信号蛋白质。还可使用可特异结合磷脂的信号蛋白质。实例包括,如图2(h)中所显示的与磷脂酰肌醇4,5-二磷酸(PI(4,5)P2)结合的Pleckstrin同源结构域(PH),和与磷脂酰肌醇4-磷酸(PI(4)P)结合的FAPP(家族A(磷酸肌醇特异结合)成员3)的Pleckstrin同源结构域。
在实施例2中,对根据本发明构建的表达蛋白酶和其嵌合底物蛋白质的转化细胞进行Western印迹分析,并证实正确地发生了蛋白酶反应。与进行细胞溶解和粗提物电泳及抗体鉴定的Western印迹分析相比,本发明提供的系统可通过简单地观察细胞本身进行鉴定,因此在时间和成本两方面都是更高效的。
在本发明实施例1中,构建了可直观确定细胞中蛋白质的运输和分布的系统。通过选择具有至亚细胞器的运输信号的信号蛋白质并用荧光蛋白质标记构建嵌合蛋白质以显示易位后的蛋白质定位。这表明通过观察用包括嵌合蛋白质重组基因的重组质粒转化细胞的荧光图像,可鉴定嵌合蛋白质的定位。
在这些嵌合蛋白质中,选择AtOEP7:GFP并连接蛋白酶的蛋白水解位点,以构建可用于体内蛋白酶抑制剂筛选的嵌合底物蛋白质。AtOEP7是靶向拟南芥属叶绿体外包膜的蛋白质,前已述及,对于植物细胞更希望选择叶绿体靶向的蛋白质。因为AtOEP7在N末端有运输信号,所以信号掩蔽蛋白质被连接到AtOEP7:GFP的N末端一侧。选择红色荧光蛋白质作为信号掩蔽蛋白质。因此,构建了嵌合底物蛋白质,在蛋白酶剪切后绿色荧光定位到叶绿体外包膜,而红色荧光分布在胞质溶胶中。
一般而言,本发明融合分子的制备包括常规重组步骤,涉及,例如,聚合酶链扩增反应(PCR)、质粒DNA制备、限制性内切酶切割DNA、寡聚核苷酸制备、DNA连接、mRNA分离、DNA引入到适当细胞,和细胞培养。另外,根据众所周知的技术,包括那些包含标准电泳、离心和层析操作的方法,可分离和纯化此处描述的嵌合蛋白质。对于涉及这些方法的内容,一般参见,Sambrook等人,见上文;和Ausubel等人,见上文。
可从多种公共来源,包括那些特别提到的来源获得此处描述的DNA和蛋白质序列。优选的来源是位于National Library of Medicine,38A,8N05,Rockville Pike,Bethesda,MD 20894的National Center forBiotechnology Information(NCBI)-Genetic Sequence Data Bank(GenBank)。也可使用互联网上的GenBank。有关GenBank的描述,一般参见Benson,D.A.等人,Nucl.Acids,Res.,25:1(1997)。
实施例中使用的其他试剂,例如抗体、细胞和病毒,可从公认的商业或公共来源获得,例如Linscott’s Directory(40Glen Drive,Mill ValleyCalifornia 94941),和the American Type Culture Collection(ATCC)12301Parklawn Drive,Rockville,MD 20852。
此处引用这里提及的所有文献作为参考。
通过下面的实施例进一步说明本发明。提供的这些实施例是帮助理解本发明的,不能作为其限制解释。
实施例1:检测嵌合蛋白质和向亚细胞器运输
(a)表达嵌合蛋白质重组质粒的构建
拟南芥属外包膜蛋白质AtOEP7(是豌豆OEP14的同系物)的编码区,使用设计除去天然终止密码子的两条特异引物(5’-GACGACGACGCAGCGATG和5’-GGATCCCCAAACCCTCTTTGGATGT),从拟南芥属基因组DNA中通过聚合酶链反应(PCR)扩增。然后,其符合读框地连接到绿色或红色荧光蛋白质编码区的5’末端,以分别构建重组质粒AtOEP7:GFP和AtOEP7:RFP。重组质粒中连接基因由35S启动子调节。同样的方法用于此后描述的其他重组质粒的构建。
对于嵌合蛋白质Rubisco复合蛋白质的表达,使用两条特异引物(5’-CCTCAGTCACACAAAGAG和5’-ACTCGAGGGAATCGGTAAGGTCAG),从λZAPII cDNA文库PCR扩增Rubisco复合体小亚单位转运肽的编码区。获得的PCR产物亚克隆到pBluescript,然后符合读框地连接到GFP或RFP编码区的5’末端,以分别构建重组质粒RbcS:GFP和RbcS:RFP。
对于叶绿素a/b结合蛋白质的表达,使用两条特异引物(5’-TAGAGAGAAACGATGGCG和5’-GGATCCCGTTTGGGAGTGGAACTCC),从λZAPII cDNA文库PCR扩增对应的基因,以构建重组质粒Cab:GFP。
使用两条特异引物(5’-TCTAGAATGGCCGCCGCAGTTTCC和5’-GGATCCATCTGTCTCCATCGGTTTG),从λZAPII cDNA文库PCR扩增rubisco活化酶(RA)的转运肽编码区,并连接到GFP编码区的5’末端,构建重组质粒RA:GFP。
使用两条特异引物(5’-CTTTAATCAATGGCAATG  和5’-CCATGGCCTGAACTGCTCTAAGCTT),从λZAPII cDNA文库PCR扩增F1-ATPase(登录号:D88374)转运肽编码区,并连接到GFP编码区的5’末端,构建F1-ATPase:GFP。
过氧化物酶体靶向蛋白质重组质粒,GFP:SKL,通过使用两条特异引物(5’-CCGTATGTTACATCACC和5’-TTATAGCTTTGATTTGTATAGTTCATCCAT),以326GFP(Davis,S.J.和Viestra,R.D.,1998)为模版PCR扩增构建。
使用上述方法,以两条特异引物(5’-GAGATGTCGAGTCTCGAA和5’-CTCGAGCACAGTGTAGTGACTGG)扩增全长H+-ATPase(拟南芥属的AHA2),并连接到GFP编码区的5’末端,构建H+-ATPase:GFP的重组质粒。
PH结构域(Pleckstrin同源结构域)的嵌合蛋白质GFP:PH的重组质粒,根据Kost,B.等人(1998)描述的方法构建。
图1中显示从根据上述方法构建的重组质粒表达的嵌合蛋白质的结构图解。
(b)原生质体制备
用新刀片,将生长在温室土壤上的3-4周龄的拟南芥属植物叶组织(5g)切成小方块(5-10mm2),并用50ml酶溶液(0.25%解析酶R-10、1.0%纤维素酶R-10、400mM甘露醇、8mM CaCl2、5mM Mes-KOH,pH 5.6)于22℃轻轻搅拌(50-75rpm)温育。温育以后,100μm筛目过滤原生质体悬液,并于46xg离心5分钟收集原生质体。在5到10ml W5溶液(154mM NaCl、125mM CaCl2、5mM KCl、5mM葡萄糖、1.5mMMes-KOH,pH 5.6)中重悬原生质体沉淀,在上面覆盖20ml 21%的蔗糖,并于78xg离心10分钟。转移界面上完整的原生质体到20ml W5溶液中。在55xg离心5分钟,再次沉淀原生质体,在20ml W5溶液中中重悬,然后在冰上温育30分钟。
(c)重组质粒DNA的分离和原生质体的转化
根据产品说明书,使用Qiagen columns(Valencia,CA)纯化重组质粒。为了用DNA转化原生质体,46xg 5分钟再次沉淀原生质体,并以5×106原生质体/ml的密度重悬于MaMg溶液(400mM甘露醇、15mMMgCl2、5mM Mes-KOH,pH 5.6)。通过PEG(聚乙二醇)介导的转化方法(Jin等人,2001)在拟南芥属原生质体中引入重组质粒构建体。约20-50μg浓度为2μg/μl的质粒DNA与300μl原生质体悬液混合,加入325μl PEG(聚乙二醇)溶液(400mM甘露醇、100mM Ca(NO3)2、40%PEG 4000)并轻轻混合。混合物室温温育30分钟。温育后,混合物用10ml W5溶液稀释。50xg离心5分钟重新收集原生质体,在3ml W5溶液中重悬,并在黑暗中于22℃温育。
(d)嵌合蛋白质的表达和其亚细胞定位的观察
根据实施例1(c)中描述的方法,用实施例1(a)中构建的重组质粒DNA转化原生质体。使用带冷电荷耦合装置照相机(cooledcharge-coupled device camera)的荧光显微镜(Axioplan荧光显微镜,Zeiss,德国)捕捉图像,监测转化后嵌合蛋白质表达的时间函数。对于GFP、RFP,和叶绿素的自发荧光,分别使用的滤光设置为XF116(激光器:474AF20、分色镜(dichroic):500DRLP、发射器:510AF23)、XF33/E(激光器:535DF35、分色镜:570DRLP、发射器:605DF50),和XF137(激光器:540AF30、分色镜:570DRLP、发射器:585ALP)(Omega,Inc.,Brattleboro,VT)。然后用Adobe(Mountain View,CA)Photoshop软件处理数据并以伪彩色格式呈现。
在叶绿体外包膜上可观察到嵌合蛋白质AtOEP7:GFP的绿色荧光(图2(a))。这一结果表明包含叶绿体包膜靶向信号蛋白质和荧光蛋白质标记的嵌合蛋白质正确靶向到叶绿体包膜。
图2(b)、(c),和(d)分别表示来自嵌合蛋白质RbcS:GFP、Cab:GFP和RA:GFP的绿色荧光定位。如图中所显示,RbcS:GFP定位在叶绿体间质,及Cab:GFP和RA:GFP也在叶绿体中发射荧光。这些结果表明包含RbcS、Cab,或RA信号肽及荧光蛋白质标记的嵌合蛋白质靶向到叶绿体。
分别在线粒体、过氧化物酶体和质膜上观察到嵌合蛋白质F1-ATPase:GFP、GFP:SKL,和H+-ATPase:GFP的绿色荧光(图2(e)-(g))。这些结果中的红色荧光信号是叶绿体的自发荧光。
GFP:PH的绿色荧光信号,分布在磷脂酰肌醇4,5-二磷酸(PI(4,5)P2)存在的质膜上,其中GFP:PH包含与磷脂特异结合的PH结构域(Pleckstrin同源结构域)。
下面更详细的解释图7(a)-(j)。图中显示了用于表达图1所示融合蛋白质重组质粒质粒图谱。本实施例中描述构建这些重组质粒的方法。SEQ ID NO:29-42中提供了包括在这些融合蛋白质中的信号蛋白质的核酸和蛋白质序列。另外,SEQ ID NO:43和44中提供部分FAPP(家族A(特异结合磷酸肌醇)成员3)Pleckstrin同源结构域的核酸和蛋白质序列。
这些信号蛋白质是可用作本发明失活信号蛋白质或活性信号蛋白质的信号蛋白质的实例。AtOEP7、RbcS、Cab、RA、F1-ATPase和SKL(过氧化物酶体靶向序列)是嵌合底物蛋白质中可通过掩蔽失活的信号蛋白质的实例。AtOEP7、H+-ATPase:GFP、PH和FAPP是在嵌合底物蛋白质中保持活性的信号蛋白质的实例。
实施例2:蛋白酶对嵌合底物蛋白质切割的检测
(a)重组质粒的构建
通过将NIa蛋白酶编码区置于pUC载体35S启动子的控制之下,构建NIa蛋白酶的重组质粒。
无终止密码子的AtOEP7编码区与326GFP载体(从ArabidopsisBiological Resource Center,Ohio University,美国,获得)中的绿色荧光蛋白质编码区5’末端连接,构建拟南芥属外包膜蛋白质:绿色荧光蛋白质(AtOEP7:GFP)的重组质粒。通过用两条引物(5’引物5’-CCCGGGGTGTGCGCTTCCAGGGAAAAACTTCGGGAGCG和3’引物5’-GAGCTCTTATTTGTATAGTTCATC)PCR扩增该质粒,将蛋白酶切割位点VRFQ连接到AtOEP7:GFP的N末端。然后将PCR产物(SmaI和XhoI片段)与326RFP-nt载体的HindIII(补平)和XhoI位点连接,构建嵌合底物蛋白质RFP:VRFQ:AtOEP7:GFP的重组质粒(图3(a))。
(b)重组质粒转化
如实施例1(b)和(c)进行转化。
(c)用荧光显微镜检测荧光蛋白质
如实施例1(d)进行荧光蛋白质检测。将表达嵌合底物蛋白质RFP:VRFQ:AtOEP7:GFP的最终的重组质粒引入原生质体,并在转化后的24-36小时检测亚细胞运输。如图4中所示,嵌合底物蛋白质以大斑点或聚集体定位在原生质体中,但不进入叶绿体。在同一个斑点上可观察到红色和绿色两种荧光信号。
在下一个实验中,检测NIa蛋白酶是否能切割嵌合底物蛋白质中的切割位点。当用NIa蛋白酶的重组质粒共转化原生质体时,如图5所示,在叶绿体包膜上可观察到绿色荧光信号,而观察到红色荧光信号均匀地分散在胞质溶胶中。另外,红色和绿色荧光信号不再互相重叠,这强烈表明NIa蛋白酶体内切割了嵌合底物蛋白质。
(d)Western印迹分析
收集转化原生质体,并在50μl细胞溶解缓冲液(50mM Tris-HCl,pH7.5、1mM DTT、1mM EDTA、50mM NaCl)中溶解。用抗GFP的单克隆抗体(Clontech,Inc)和ECL试剂盒(Amersham,Inc),通过Western印迹分析鉴定嵌合底物蛋白质RFP:VRFQ:AtOEP7:GFP的表达,和NIa蛋白酶将嵌合底物蛋白质切割成RFP和AtOEP7:GFP。
如图6所示,当NIa蛋白酶不被共转化时,以70kDa的预期大小检测到嵌合底物蛋白质RFP:VRFQ:AtOEP7:GFP。相反,当NIa蛋白酶共转化时,抗GFP的抗体在AtOEP7:GFP预期大小的35kDa检测到蛋白质。这一结果表明嵌合底物蛋白质RFP:VRFQ:AtOEP7:GFP被切割成两个蛋白质,RFP和AtOEP7:GFP。因此,这一结果清楚地表明NIa蛋白酶可在体内切割嵌合底物蛋白质,并通过检测绿色荧光信号在叶绿体包膜的定位和红色荧光信号在胞质溶胶中的分散分布,可轻易地测定切割反应。
图8(a)-(b)更详细的解释如下。此图分别显示本实施例中用于表达NIa蛋白酶和其嵌合底物蛋白质RFP:PS(NIa):AtOEP7:GFP重组质粒的质粒图谱。SEQ ID NO:45-50中提供NIa蛋白酶和其切割位点的核酸和蛋白质序列。SEQ ID NO:51和52中分别提供该嵌合底物蛋白质的完整核酸和蛋白质序列。
实施例3:HIV-1蛋白酶抑制剂的体内筛选系统
检测人免疫缺陷病毒(HIV-1)蛋白酶抑制剂的便利的体内筛选系统如下所示。
(a)表达HIV-1蛋白酶重组质粒的构建
以pHX2BΔRT为模版,用两条引物(5’-TCTAGAATGCCTCAGGTCACTCTTTGG-3’和5’-CTCGAGTCAAAAATTTAAAGTGCAACC-3’)PCR扩增HIV-1蛋白酶编码区,构建HIV-1蛋白酶的重组质粒。PHX-2BΔRT是包含无逆转录酶编码区的HX2B(GenBank登录号K03455)的质粒克隆。扩增产物亚克隆到pBluescript-T载体,然后克隆到35S启动子控制下的pUC载体的XbaI和XhoI位点。
图9(a)中显示HIV-1蛋白酶的质粒图谱,SEQ ID NO:55和56中分别提供核酸和蛋白质序列。
(b)表达HIV-1蛋白酶嵌合底物蛋白质的重组质粒构建
共构建了9种嵌合底物蛋白质的重组质粒,使用的引物如下:正向引物是5’-CCCGGGTAGCCAAAATTACCCTATAGTGGGAAAAACTTCGGGAGCG-3’,
5’-CCCGGGTGCAAGAGTTTTGGCTGAAGCAGGAAAAACTTCGGGAGCG-3’,
5’-CCCGGGTGCTACCATAATGATGCAGAGAGGAAAAACTTCGGGAGCG-3’,
5’-CCCGGGTAGACAGGCTAATTTTTTAGGGGGAAAAACTTCGGGAGCG-3’,
5’-CCCGGGTCCAGGGAATTTTCTTCAGAGCGGAAAAACTTCGGGA GCG-3’,
5’-CCCGGGTAGCGTGCCTCAAATAGGAAAACTTCGGGAGCG-3’,
5’-CCCGGGTACTTTAAATTTTCCCATTAGCGGAAAAACTTCGGGA GCG-3’,
5’-CCCGGGTGCAGAAACCTFCTATGTAGATGGAAAAACTTCGGGAGCG-3’,
5’-CCCGGGTAGGAAAGTACTATTTTTAGATGGAAAAACTTCGGGAGCG-3’.
使用的通用反向引物是5’-CTCGAGTTATTTGTATAGTTCATC-3’。这些引物设计包含HIV-1蛋白酶的蛋白水解位点。正向引物的下划线部分对应蛋白水解位点序列(SEQ ID NO:57、59、61、63、65、67、69、71,和73)。以NIa蛋白酶底物蛋白质(SEQ ID NO:51)的质粒为模版,用上述正向引物之一和通用引物进行PCR扩增。用SmaI和XhoI限制性消化PCR产物,并亚克隆到HindIII(补平)和XhoI消化的326RFP-nt载体。因此,9种所得质粒的每一种包含编码组成为RFP:PS(HIV-1):AtOEP7:GFP的嵌合底物蛋白质之一的DNA序列,其中PS(HIV-1)是HIV-1蛋白酶蛋白水解位点之一。SEQ ID NO:75和76提供这些嵌合底物蛋白质之一的核酸和蛋白质序列。
(c)HIV-1蛋白酶抑制剂的体内筛选
根据实施例1(b)和(c)描述的方法进行拟南芥属叶组织原生质体的制备和转化。如实施例1(d)中所描述(使用同类型的滤光片装置,但使用Nikon E800荧光显微镜),进行转化原生质体荧光图像的检测。
作为体内检测HIV-1蛋白酶抑制的工作实施例,用HIV-1蛋白酶底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP的重组质粒转化原生质体。包括在嵌合底物蛋白质中的蛋白水解位点序列是RQANFLG(SEQ ID NO:64)。转化原生质体在22℃于W5溶液中温育18-48小时以表达嵌合底物蛋白质,用荧光显微镜监测来自表达嵌合底物蛋白质的荧光信号的亚细胞定位。
如图11所示,在胞质溶胶的同一位置可观察到绿色和红色荧光两种信号都形成大斑点或聚集体,但不靶向到叶绿体。这一结果表明嵌合底物蛋白质未被切割,因此它们以未切割的形式存在于胞质溶胶中。这一数据对应于发生HIV-1蛋白酶完全抑制时的结果。
如下进行HIV-1蛋白水解活性的检测。用HIV-1蛋白酶的重组质粒和HIV-1蛋白酶底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP的重组质粒共转化原生质体。包括在嵌合底物蛋白质中的蛋白水解位点序列是RQANFLG(SEQ ID NO:64)。用荧光显微镜监测转化后18-48小时,来自表达嵌合底物蛋白质的荧光信号的亚细胞定位。如图12所示,观察到红色荧光信号均匀地分散在胞质溶胶中,而观察到大部分绿色荧光信号在叶绿体周围。这些结果表明嵌合底物蛋白质已被HIV-1蛋白酶切割。
该系统可用于检测那些减少分散的红色荧光信号和叶绿体靶向的绿色荧光信号,并因此在原生质体中封闭或抑制HIV-1蛋白酶活性的分子。
图9(a)和(b)更详细的解释如下。该图显示HIV-1蛋白酶和嵌合底物蛋白质RFP:PS(HIV-1):AtOEP7:GFP重组质粒的质粒图谱。这些重组质粒可用于在植物细胞例如鼠耳芥(Arabidopsis thaliana)、烟草等中表达HIV-1蛋白酶和嵌合底物蛋白质。SEQ ID NO:55-74中提供HIV-1蛋白酶和其切割位点的核酸和蛋白质序列。SEQ ID NO:75和76中分别提供实施例3中使用的嵌合底物蛋白质的完整核酸和蛋白质序列。
实施例4:一种信号蛋白质保持活性的可选地掩蔽嵌合蛋白质的制备和使用
如上所述,本发明的一个目的是提供重组嵌合蛋白质,其中至少一些信号蛋白质被至少一种适当的氨基酸序列掩蔽。例如,根据本发明,特定嵌合蛋白质的所有信号蛋白质可根据需要掩蔽或暴露。可替代地,可暴露嵌合蛋白质的部分信号成分,而其余信号被掩蔽。对于本发明,这种“可选地掩蔽”嵌合蛋白质提供了重要的灵活性并有广泛而重要的应用。
例如,这种嵌合蛋白质可用于根据嵌合蛋白质一或多种荧光信号亚细胞定位的变化,检测体内蛋白酶活性的筛选。这种筛选高度灵敏,就是因为其可显示嵌合蛋白质空间分布的微小变化。预期的发明应用将指导选择是否掩蔽或暴露包括在受试嵌合分子中的一种或一种以上的信号蛋白质。
图10提供一些说明性的“可选地掩蔽”嵌合蛋白质。更具体地,该图显示编码一种信号蛋白质的运输信号保持活性的嵌合底物蛋白质的重组基因的示意图。H+-ATPase用作活性信号蛋白质的实例,其在嵌合底物蛋白质中的运输信号不被掩蔽。可用作活性信号蛋白质的其他实例包括AtOEP7、PH和FAPP。AtOEP7用作失活信号蛋白质的实例,其运输信号通过连接蛋白酶剪切位点或通过蛋白酶剪切位点连接信号掩蔽蛋白质而被掩蔽。可用作失活信号蛋白质的其他实例包括RbcS、Cab、RA、F1-ATPase和SKL。这些嵌合底物蛋白质设计根据蛋白酶剪切诱导亚细胞荧光信号分布的改变。几乎此处公开的任何蛋白酶切割序列均可用于提供图10中举例说明的嵌合蛋白质的切割位点(PS)。因此,这种可选地掩蔽嵌合蛋白质可用于检测广泛的蛋白酶抑制剂分子。当然,几乎此处公开的任何蛋白酶切割序列均可用于提供图10中举例说明的嵌合蛋白质的切割位点(PS)。
图10更详细的解释如下。图10(a)显示构建体,其中荧光信号(FP-1)因蛋白酶剪切从质膜易位到胞质溶胶。在图10(b)的情况中,一种荧光信号(FP-2)以图10(a)情况中的同样方式易位,但另一种荧光信号(FP-1)仍留在质膜上。在图10(c)的情况中,荧光信号(FP-1)因蛋白酶剪切从质膜易位到叶绿体。在图10(d)的情况中,一种荧光信号(FP-2)以图10(c)情况中的同样方式易位,但另一种荧光信号(FP-1)仍留在质膜上。
(a)表达一种信号蛋白质保持活性的嵌合底物蛋白质的重组质粒的构建
图10中描述的重组质粒的实例构建如下。
编码H+-ATPase:PS:GFP(图10(a))的两个重组质粒构建如下,其中蛋白酶剪切位点序列是VRFQ(SEQ ID NO:48)和RQANFLG(SEQID NO:64)。
正向引物5’-CTCGAG PS ATGAGTAAAGGAGAAGAA-3’(这里PS对于VRFQ NIa切割位点是GTGCGCTTCCAG,或对于RQANFLG HIV-1切割位点是AGACAGGCTAATTTTTTAGGG)和反向引物5’-GAGCTCTTATTTGTATAGTTCATC-3’用于326GFP载体的PCR扩增。这些PCR产物,其中包括NIa或HIV-1蛋白酶的蛋白酶剪切位点、亚克隆的限制性位点(XhoI和Sac I),和GFP C末端的终止密码子,被亚克隆到pBluscript-T载体。这些亚克隆的Xho I/Sac I片段连接到Xho I和Sac I消化的pH+ATPase-G载体(图7(i))。
编码H+-ATPase:GFP:PS:RFP(图10(b))的两个重组质粒构建如下,其中蛋白酶剪切位点序列是VRFQ(SEQ ID NO:48)和RQANFLG(SEQ ID NO:64)。
为制备无终止密码子的GFP,用引物5’-CTCGAGATGAAAGGAGAAGAACTT-3’和5’-GAGCTCTTTGTATAGTTCATCCAT-3’进行PCR扩增。包含XhoI和Sac I位点的PCR产物亚克隆到pBluscript-T载体,然后用Xho I和Sac I限制性消化。该XhoI/Sac I片段亚克隆到XhoI和Sac I消化的pH+ATPase-G载体(图7(i))。
为将蛋白酶剪切位点置于RFP的上游,正向引物5’-GAGCTC  PSATGGTGCGCTCCTCCAAG-3’(这里PS对于VRFQ NIa切割位点是GTGCGCTTCCAG,或对于RQANFLG HIV-1切割位点是AGACAGGCTAATTTTTTAGGG)和反向引物5’-GAGCTCCTACAGGAACAGGTGGTG-3’用于326GFP载体的PCR扩增。构建体包括PS:RFP,还包括Sac I位点,其用Sac I限制性消化,这些Sac I片段亚克隆到如上所述制备的H+-ATPase:GFP(无终止密码子)亚克隆的Sac I位点,产生H+-ATPase:GFP:PS:RFP的重组质粒。
编码H+-ATPase:PS:AtOEP7:GFP(图10(c))的两个重组质粒构建如下,其中蛋白酶剪切位点序列是VRFQ(SEQ ID NO:48)和RQANFLG(SEQ ID NO:64)。
用引物5’-CTCGAG  PS  GGAAAAACTTCGGGAGCG-3’(这里PS对于VRFQ NIa切割位点是GTGCGCTTCCAG,或对于RQANFLGHIV-1切割位点是AGACAGGCTAATTTTTTAGGG  )和5’-GAGCTCTTATTTGTATAGTTCATC-3’PCR扩增pSub-NIa1载体(图8(b))。因此,PCR产物包括XhoI和Sac I位点。这些亚克隆的XhoI/Sac I片段连接到XhoI和Sac I消化的pH+ATPase-G载体(图7(i)),产生H+-ATPase:PS:AtOEP7:GFP的重组质粒。
编码H+-ATPase:RFP:PS:AtOEP7:GFP(图10(d))的两个重组质粒构建如下,其中蛋白酶剪切位点序列是VRFQ(SEQ ID NO:48)和RQANFLG(SEQ ID NO:64)。
引物5’-CTCGAGATGGTGCGCTCCTCCAAG-3’和5’-GAGCTCTTATTTGTATAGTTCATC-3’用于PCR扩增pSub-NIa1载体(图8(b))和pSub-HTV4载体(图9(b))。因此,这些PCR产物包括XhoI和Sac I位点。这些亚克隆的Xho I/Sac I片段连接到XhoI和Sac I消化的pH+ATPase-G载体(图7(i)),产生H+-ATPase:RFP:PS:AtOEP7:GFP的重组质粒。
(b)使用图10(a)中描述的重组质粒的工作实施例
根据实施例1(b)和(c)描述的方法,进行拟南芥属叶组织原生质体的制备和转化。如实施例1(d)中所描述(使用同类型的滤光片装置,但使用Nikon E800荧光显微镜),进行转化原生质体荧光图像的检测。
作为检测NIa蛋白酶抑制的工作实施例,用如实施例4(a)所描述制备的编码嵌合底物蛋白质H+-ATPase:PS:GFP的重组质粒转化原生质体。包括在嵌合底物蛋白质中的蛋白水解位点序列是VRQF(SEQ IDNO:48)。转化原生质体在22℃于W5溶液中温育18-48小时以表达嵌合底物蛋白质,用荧光显微镜监测来自表达嵌合底物蛋白质的荧光信号的亚细胞定位。如图13(a)所示,绿色荧光信号易位到质膜。这一结果表明嵌合底物蛋白质如预期的那样未被切割,因此附加的绿色荧光蛋白质通过H+-ATPase的运输信号靶向到质膜。这一数据对应于发生蛋白酶完全抑制时的结果。
如下进行NIa蛋白水解活性的检测。用NIa蛋白酶的重组质粒(SEQID NO:45)和嵌合底物蛋白质H+-ATPase:PS:GFP的重组质粒(SEQ IDNO:53)共转化原生质体。包括在嵌合底物蛋白质中的蛋白水解位点序列是VRQF(SEQ ID NO:48)。用荧光显微镜监测转化后18-48小时,来自表达嵌合底物蛋白质的荧光信号的亚细胞定位。如图13(c)所示,观察到绿色荧光信号在胞质溶胶中,而不靶向到质膜。这一结果表明GFP被蛋白酶从嵌合底物蛋白质上切割掉。
引用此处公开的所有参考文献作为参考。特别引用以下参考文献作为参考。
Hook,V.Y.H.US 6,245,884(2001).
Kettner,C.A.and Korant,B.D.US 4,644,055(1987).
Cote,H.C.F.,Brumme,Z.L.,and Harrigan,P.R.(2001).J.Virol.75,589-594.
Davis,S.J.and Vierstra,R.D.(1998).Plant Physiol.112,833-844.
Ermolieff,J.,Loy,J.A.,Koelsch,G.,and Tang,J.(2000).Biochem.39,12450-12456.
Gillooly,D.J.,Morrow,I.C.,Lindsay,M.,Gould,R.,Bryant,N.J.,Gaullier,J.-M.,Parton,R.G.,and Stenmark,H.(2000).EMBO J.19,4577-4588.
Gutierrez-Campos,R.,Torress-Acosta,J.A.,Saucedo-Arias,L.et al.(1999).Nat.Biotechnol.17,1223-1226.
Jacobsen,H.,Hanggi,M.,Ott,M.,Duncan,I.B.,and Owen,S.(1996).J.Infect.Dis.173,1379-1387.
Kasai,N.,Tsumoto,K.,Niwa,S.,Misawa,S.,Ueno,T.,Hayashi,H.,and Kumagai,I.(2001).Biochem.Biophys.Res.Comm.281,416-424.
Kuhelj,R.,Rizzo,C.J.,Chang,C.-H.,Jadha,P.K.,Towler,E.M.,and Korant,B.D.(2001).J.Biol.Chem.276,16674-16682.
Kost,B.,Spielhofer,P.,and Chua,N.H.(1998).Plant J.16,383-401.
Mardis,K.L.,Luo,R.,and Gilson,M.K.(2001).J.Mol.Biol.309,507-517.
Miller.T.L.,Mawn,B.E.,Orav,E.J.,Wilk,D.,Weinberg,G.A.,Nicchitta,J.,Furuta,L.,Cutroni,R.,McIntosh,K.,Burchett,S.K.,and Gorbach,S.L.(2001).Pediat.107-5,1-6.
Morise,H.,Shimomura,O.,Johnson,F.H.,and Winant,J.(1974).Biochem.13,2656-2662.
Pih,K.T.,Yi,M.J.,Liang,Y.S.,Shin,B.J.,Cho,M.J.,Hwang,I.,and Son,D.(2000).Plant Physiol.123,51-58.
Rogers,J.D.,Lam,P.Y.,Johnson,BL.,Wang,H.S.,Ko,S.S.,Seits,S.P.,Trainor,G.L.,Anderson,P.S.,Klabe,R.M.,Bachelor,L.T.,Cordova,B.,Garber,S.,Reid,C.,Wright,M.R.,Chang,C.H.,and Erickson-Biitanen,S.(1998).Chem.Biol.5,597-608.
Wlodawer,A.and Erickson,J.W.(1983).Annu.Rev.Biochem.61,543-585.
Yi,C.-F.,Gosiewska,A.,Burtis,D.,and Geesin,J.(2001).Anal.Biochem.291,27-33.
Yoon,H.Y,Hwang,D.C.,Choi,K.Y.,and Song,B.D.(2000).Mol.Cell 10,213-219.
通过参考本发明优选的实施例,已对本发明进行了详细的描述。然而,应当理解,本领域的那些技术人员,通过参考本公开内容,可在本发明的精神和范围内进行变更和改进。
序列表
<110>AHRAM BIOSYSTEMS INC.
HWANG,Inhwan
KIM,Dae Heon
LEE,Yong Jik
<120>蛋白酶检测系统
<130>APB02_KR_PCT
<150>KR 10-2001-0048123
<151>2001-08-10
<160>120
<170>PatentIn version 3.1
<210>1
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(18)
<223>部分AtOEP7编码序列的5’PCR引物
<400>1
gacgacgacg cagcgatg                                                        18
<210>2
<211>25
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(15)
<223>部分AtOEP7编码序列的3’PCR引物
<400>2
ggatccccaa accctctttg gatgt                                                    25
<210>3
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(18)
<223>部分rubisco小亚基编码序列的5’PCR引物
<400>3
cctcagtcac acaaagag                                                            18
<210>4
<211>24
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(24)
<223>部分rubisco小亚基编码序列的3’PCR引物
<400>4
actcgaggga atcggtaagg tcag                                                24
<210>5
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(18)
<223>部分叶绿素a/b结合蛋白质编码序列5¢PCR引物
<400>5
tagagagaaa cgatggcg                                                      18
<210>6
<211>25
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(25)
<223>部分叶绿素a/b结合蛋白质编码序列3¢PCR引物
<400>6
ggatcccgtt tgggagtgga actcc                                                25
<210>7
<211>24
<212>DNA
<213>人工序列
<220>
<223>合成quence
<220>
<221>misc_特征
<222>(1)..(24)
<223>部分rubisco活化酶编码序列的5’PCR引物
<400>7
tctagaatgg ccgccgcagt ttcc                                                24
<210>8
<211>25
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(25)
<223>部分rubisco活化酶编码序列的3’PCR引物
<400>8
ggatccatct gtctccatcg gtttg                                                    25
<210>9
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(18)
<223>部分F1-ATPase编码序列的5’PCR引物
<400>9
ctttaatcaa tggcaatg                                                            18
<210>10
<211>25
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(25)
<223>部分F1-ATPase编码序列的3’PCR引物
<400>10
ccatggcctg aactgctcta agctt                                                25
<210>11
<211>17
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(17)
<223>过氧化物酶体靶向序列的5’PCR引物
<400>11
ccgtatgtta catcacc                                                         17
<210>12
<211>30
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(30)
<223>过氧化物酶体靶向序列的3’PCR引物
<400>12
ttatagcttt gatttgtata gttcatccat                                            30
<210>13
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(18)
<223>H+-ATPase编码序列的5’PCR引物
<400>13
gagatgtcga gtctcgaa                                                         18
<210>14
<211>23
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1).(23)
<223>H+-ATPase编码序列的3’PCR引物
<400>14
ctcgagcaca gtgtagtgac tgg                                                23
<210>15
<211>38
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(38)
<223>NIa蛋白酶底物蛋白质编码序列的5′PCR引物
<400>15
cccggggtgt gcgcttccag ggaaaaactt cgggagcg                                38
<210>16
<211>24
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(24)
<223>NIa蛋白酶底物蛋白质编码序列的3′PCR引物
<400>16
gagctcttat ttgtatagtt catc                                               24
<210>17
<211>27
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(27)
<223>HIV-1蛋白酶编码序列的5’PCR引物
<400>17
tctagaatgc ctcaggtcac tctttgg                                                27
<210>18
<211>27
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(27)
<223>HIV-1蛋白酶编码序列的3’PCR引物
<400>18
ctcgagtcaa aaatttaaag tgcaacc                                                27
<210>19
<211>46
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(46)
<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物
<400>19
cccgggtagc caaaattacc ctatagtggg aaaaacttcg ggagcg                         46
<210>20
<211>46
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(46)
<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物
<400>20
cccgggtgca agagttttgg ctgaagcagg aaaaacttcg ggagcg                        46
<210>21
<211>46
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(46)
<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物
<400>21
cccgggtgct accataatga tgcagagacc aaaaacttcg ggagcg                       46
<210>22
<211>46
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(46)
<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物
<400>22
cccgggtaga caggctaatt ttttaggggg aaaaacttcg ggagcg                       46
<210>23
<211>46
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(46)
<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物
<400>23
cccgggtcca gggaattttc ttcagagcgg aaaaacttcg ggagcg                           46
<210>24
<211>41
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(41)
<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物
<400>24
cccgggtagc gtgcctcaaa taggaaaaaa cttcgggagc g                                41
<210>25
<211>46
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(46)
<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物
<400>25
cccgggtact ttaaattttc ccattagcgg aaaaacttcg ggagcg                             46
<210>26
<211>46
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(46)
<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物
<400>26
cccgggtgca gaaaccttct atgtagatgg aaaaacttcg ggagcg                            46
<210>27
<211>46
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(46)
<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的5’PCR引物
<400>27
cccgggtagg aaagtactat ttttagatgg aaaaacttcg ggagcg                    46
<210>28
<211>24
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>misc_特征
<222>(1)..(24)
<223>包含HIV-1蛋白酶的蛋白水解位点的编码序列的3’PCR引物
<400>28
ctcgagttat ttgtatagtt catc                                            24
<210>29
<211>192
<212>DNA
<213>鼠耳芥
<220>
<221>CDS
<222>(1)..(192)
<223>包含叶绿体(外包膜)靶向序列的部分AtOEP7(豌豆DEP14的同系物)
<300>
<308>GenBank/NM_115102
<309>2002-01-10
<400>29
atg gga aaa act tcg gga gcg aaa cag gcg act gtg gtg gtc gca gcg    48
Met Gly Lys Thr Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala
  1               5                  10                  15
atg gcg tta gga tgg tta gcc ata gag atc gct ttc aag cct ttc ctc    96
Met Ala Leu Gly Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu
             20                  25                  30
gat aaa ttc cgc tcc tca atc gac aaa tct gac cca acc aaa gac ccc    144
Asp Lys Phe Arg Ser Ser Ile Asp Lys Ser Asp Pro Thr Lys Asp Pro
         35                  40                  45
gat gac ttc gac acc gcc gct act gca acc aca tcc aaa gag ggt ttg    192
Asp Asp Phe Asp Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu
     50                  55                  60
<210>30
<211>64
<212>PRT
<213>鼠耳芥
<400>30
Met Gly Lys Thr Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala
  1               5                  10                  15
Met Ala Leu Gly Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu
             20                  25                  30
Asp Lys Phe Arg Ser Ser Ile Asp Lys Ser Asp Pro Thr Lys Asp Pro
         35                  40                  45
Asp Asp Phe Asp Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu
     50                  55                  60
<210>31
<211>237
<212>DNA
<213>鼠耳芥
<220>
<22l>CDS
<222>(1)..(237)
<223>包含叶绿体(基质)靶向序列的部分rubisco小亚基
<300>
<308>GenBank/NM_105379
<309>2002-01-10
<400>31
atg gct tcc tct atg ctc tct tcc gct act atg gtt gcc tct ccg gct    48
Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala
  1               5                  10                  15
cag gcc act atg gtc gct cct ttc aac gga ctt aag tcc tcc gc tgcc    96
Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala
             20                  25                  30
ttc cca gcc acc cgc aag gct aac aac gac att act tcc atc aca agc    144
Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser
         35                  40                  45
aac ggc gga aga gtt aac tgc atg cag gtg tgg cct ccg att gga aag    192
Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys
     50                  55                  60
aag aag ttt gag act ctc tct tac ctt cct gac ctt acc gat tcc        237
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser
 65                  70                  75
<210>32
<211>79
<212>PRT
<213>鼠耳芥
<400>32
Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala
  1               5                  10                  15
Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala
             20                  25                  30
Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser
         35                  40                  45
Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys
     50                  55                  60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser
 65                  70                  75
<210>33
<211>105
<212>DNA
<213>鼠耳芥
<220>
<221>CDS
<222>(1)..(105)
<223>包含叶绿体(基质)靶向序列的部分叶绿素a/b结合蛋白质
<300>
<308>GenBank/X56062
<309>1992-10-12
<400>33
atg gcg tcg aac tcg ctt atg agc tgt ggc ata gcc gcc gtg tac cct    48
Met Ala Ser Asn Ser Leu Met Ser Cys Gly Ile Ala Ala Val Tyr Pro
  1               5                  10                  15
tcg ctt ctc tct tct tcc aag tct aaa ttc gta tcc gcc gga gtt cca    96
Ser Leu Leu Ser Ser Ser Lys Ser Lys Phe Val Ser Ala Gly Val Pro
             20                  25                  30
ctc cca aac                                                        105
Leu Pro Asn
         35
<210>34
<211>35
<212>PRT
<213>鼠耳芥
<400>34
Met Ala Ser Asn Ser Leu Met Ser Cys Gly Ile Ala Ala Val Tyr Pro
  1               5                  10                  15
Ser Leu Leu Ser Ser Ser Lys Ser Lys Phe Val Ser Ala Gly Val Pro
             20                  25                  30
Leu Pro Asn
         35
<210>35
<211>204
<212>DNA
<213>鼠耳芥
<220>
<221>CDS
<222>(1)..(204)
<223>包含叶绿体(基质)靶向序列的部分rubiSco活化酶
<300>
<308>GenBank/X14212
<309>1993-09-12
<400>35
atg gcc gcc gca gtt tcc acc gtc ggt gcc atc aac aga gct ccg ttg    48
Met Ala Ala Ala Val Ser Thr Val Gly Ala Ile Asn Arg Ala Pro Leu
  1               5                  10                  15
agc ttg aac ggg tca gga tca gga gct gta tca gcc cca gct tca acc    96
Ser Leu Asn Gly Ser Gly Ser Gly Ala Val Ser Ala Pro Ala Ser Thr
             20                  25                  30
ttc ttg gga aag aaa gtt gta act gtg tcg aga ttc gca cag agc aac    144
Phe Leu Gly Lys Lys Val Val Thr Val Ser Arg Phe Ala Gln Ser Asn
         35                  40                  45
aag aag agc aac gga tca ttc aag gtg ttg gct gtg aaa gaa gac aaa    192
Lys Lys Ser Asn Gly Ser Phe Lys Val Leu Ala Val Lys Glu Asp Lys
     50                  55                  60
caa acc gat gga                                                    204
Gln Thr Asp Gly
 65
<210>36
<211>68
<212>PRT
<213>鼠耳芥
<400>36
Met Ala Ala Ala Val Ser Thr Val Gly Ala Ile Asn Arg Ala Pro Leu
  1               5                  10                  15
Ser Leu Asn Gly Ser Gly Ser Gly Ala Val Ser Ala Pro Ala Ser Thr
             20                  25                  30
Phe Leu Gly Lys Lys Val Val Thr Val Ser Arg Phe Ala Gln Ser Asn
         35                  40                  45
Lys Lys Ser Asn Gly Ser Phe Lys Val Leu Ala Val Lys Glu Asp Lys
     50                  55                  60
Gln Thr Asp Gly
 65
<210>37
<211>234
<212>DNA
<213>鼠耳芥
<220>
<221>CDS
<222>(1)..(234)
<223>包含线粒体靶向序列的部分线粒体F1-ATPaseg亚基
<300>
<308>GenBank/D88374
<309>1999-02-07
<400>37
atg gca atg gct gtt ttc cgt cgc gaa ggg agg cgt ctc ctc cct tca    48
Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser
  1               5                  10                  15
atc gcc gct cgc cca atc gct gct atc cga tct cct ctc tct tct gac    96
Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp
             20                  25                  30
cag gag gaa gga ctt ctt gga gtt cga tct atc tca act caa gtg gtg    144
Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val
         35                  40                  45
cgt aac cgc atg aag agt gtt aag aac atc caa aag atc aca aag gca    192
Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala
     50                  55                  60
atg aag atg gtt gct gct tcc aag ctt aga gca gtt cag gcc            234
Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Ala
 65                  70                  75
<210>38
<211>78
<212>PRT
<213>鼠耳芥
<400>38
Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser
  1               5                  10                  15
Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp
             20                  25                  30
Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val
         35                  40                  45
Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala
     50                  55                  60
Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Ala
 65                  70                  75
atg tgg aat cca ctt tca tgg gtc atg gaa atg gct gca atc atg gcc    240
Met Trp Asn Pro Leu Ser Trp Val Met Glu Met Ala Ala Ile Met Ala
 65                  70                  75                  80
att gct ttg gcc aac ggt gat ggt agg cct ccg gat tgg cag gat ttt    288
Ile Ala Leu Ala Asn Gly Asp Gly Arg Pro Pro Asp Trp Gln Asp Phe
                 85                  90                  95
gtt ggt att atc tgt ctg ttg gtt atc aac tct acc atc agt ttt atc    336
Val Gly Ile Ile Cys Leu Leu Val Ile Asn Ser Thr Ile Ser Phe Ile
            100                 105                 110
gaa gaa aac aat gct ggt aat gct gct gct gct ctt atg gct ggt ctt    384
Glu Glu Asn Asn Ala Gly Asn Ala Ala Ala Ala Leu Met Ala Gly Leu
        115                 120                 125
gct cct aaa acc aag gtt ctt agg gat gga aag tgg agt gaa caa gaa    432
Ala Pro Lys Thr Lys Val Leu Arg Asp Gly Lys Trp Ser Glu Gln Glu
    130                 135                 140
gct gct att ctt gtc cca gga gat att gtt agc att aaa tta gga gac    480
Ala Ala Ile Leu Val Pro Gly Asp Ile Val Ser Ile Lys Leu Gly Asp
145                 150                 155                 160
att atc cca gct gat gcc cgt cta ctt gaa ggt gat cct tta aag gtt    528
Ile Ile Pro Ala Asp Ala Arg Leu Leu Glu Gly Asp Pro Leu Lys Val
                165                 170                 175
gac caa tct gct cta act gga gag tcc ctt cct gta acc aag cac ccg    576
Asp Gln Ser Ala Leu Thr Gly Glu Ser Leu Pro Val Thr Lys His Pro
            180                 185                 190
ggt caa gaa gtt ttc tct ggt tca acc tgc aaa caa gga gaa atc gag    624
Gly Gln Glu Val Phe Ser Gly Ser Thr Cys Lys Gln Gly Glu Ile Glu
        195                 200                 205
gcg gtt gtt att gcc act ggg gtt cat acc ttc ttc ggt aaa gct gct    672
Ala Val Val Ile Ala Thr Gly Val His Thr Phe Phe Gly Lys Ala Ala
    210                 215                 220
<210>39
<211>2847
<212>DNA
<213>鼠耳芥
<220>
<221>基因
<222>(1)..(2847)
<223>包含质膜靶向序列的H+-ATPase基因
<220>
<221>CDS
<222>(1)..(2844)
<223>包含质膜靶向序列的H+-ATPase
<300>
<308>GenBank/J05570
<309>1993-04-27
<400>39
atg tcg agt ctc gaa gat atc aag aac gag act gtt gat ctg gaa aaa    48
Met Ser Ser Leu Glu Asp Ile Lys Asn Glu Thr Val Asp Leu Glu Lys
  1               5                  10                  15
att ccg att gag gaa gtt ttc cag cag cta aaa tgt tca agg gaa gga    96
Ile Pro Ile Glu Glu Val Phe Gln Gln Leu Lys Cys Ser Arg Glu Gly
             20                  25                  30
ttg aca acg cag gaa ggg gag gac agg att cag atc ttt ggc ccc aac    144
Leu Thr Thr Gln Glu Gly Glu Asp Arg Ile Gln Ile Phe Gly Pro Asn
         35                  40                  45
aag ctc gaa gag aaa aag gaa agc aaa ctt ctg aag ttt ttg ggg ttt    192
Lys Leu Glu Glu Lys Lys Glu Ser Lys Leu Leu Lys Phe Leu Gly Phe
    50                  55                  60
cac ctt gtg gac agc act aac caa gtt gga cat ttc cag aag gtt ctt    720
His Leu Val Asp Ser Thr Asn Gln Val Gly His Phe Gln Lys Val Leu
225                 230                 235                 240
aca gcc att ggg aac ttc tgt atc tgt tcc att gct atc ggt atg gtg    768
Thr Ala Ile Gly Asn Phe Cys Ile Cys Ser Ile Ala Ile Gly Met Val
                245                 250                 255
att gag atc atc gtc atg tat ccg atc caa cgc cga aag tac aga gat    816
Ile Glu Ile Ile Val Met Tyr Pro Ile Gln Arg Arg Lys Tyr Arg Asp
            260                 265                 270
gga att gac aac ctt ttg gtc ctc ttg atc ggt ggt atc ccc att gct    864
Gly Ile Asp Asn Leu Leu Val Leu Leu Ile Gly Gly Ile Pro Ile Ala
        275                 280                 285
atg cct aca gtc ttg tcc gtg acc atg gct att ggg tct cac agg ttg    912
Met Pro Thr Val Leu Ser Val Thr Met Ala Ile Gly Ser His Arg Leu
    290                 295                 300
tct cag caa ggt gcc atc acc aag cgt atg act gcc att gaa gag atg    960
Ser Gln Gln Gly Ala Ile Thr Lys Arg Met Thr Ala Ile Glu Glu Met
305                 310                 315                 320
gca gga atg gat gtc ctg tgc agt gac aaa acc ggg aca cta acc ctc    1008
Ala Gly Met Asp Val Leu Cys Ser Asp Lys Thr Gly Thr Leu Thr Leu
                325                 330                 335
aac aaa ttg agt gtg gac aaa aac ttg gtc gag gtt ttc tgc aag ggt    1056
Asn Lys Leu Ser Val Asp Lys Asn Leu Val Glu Val Phe Cys Lys Gly
            340                 345                 350
gtg gag aaa gat caa gtc cta tta ttt gca gct atg gct tcc agg gtt    1104
Val Glu Lys Asp Gln Val Leu Leu Phe Ala Ala Met Ala Ser Arg Val
        355                 360                 365
gag aac cag gat gcc att gat gca gcc atg gtt ggg atg ctt gct gat    1152
Glu Asn Gln Asp Ala Ile Asp Ala Ala Met Val Gly Met Leu Ala Asp
    370                 375                 380
cca aag gag gct aga gct gga atc agg gaa gtt cac ttc ctt cca ttc    1200
Pro Lys Glu Ala Arg Ala Gly Ile Arg Glu Val His Phe Leu Pro Phe
385                 390                 395                 400
aac cct gtg gat aag aga act gct ttg act tac att gac ggc agt ggt    1248
Asn Pro Val Asp Lys Arg Thr Ala Leu Thr Tyr Ile Asp Gly Ser Gly
                405                 410                 415
aac tgg cac aga gtc agt aaa ggt gct cct gag cag atc ctc gaa ctt    1296
Asn Trp His Arg Val Ser Lys Gly Ala Pro Glu Gln Ile Leu Glu Leu
            420                 425                 430
gcc aaa gcc agc aat gat ctt agc aag aag gtg ctc tcc att att gac    1344
Ala Lys Ala Ser Asn Asp Leu Ser Lys Lys Val Leu Ser Ile Ile Asp
        435                 440                 445
aag tat gct gag cgt ggt ctt agg tcg ttg gct gtt gct cgc cag gtg    1392
Lys Tyr Ala Glu Arg Gly Leu Arg Ser Leu Ala Val Ala Arg Gln Val
    450                 455                 460
gtg cca gag aaa aca aag gaa agc cca ggt gcg cca tgg gaa ttt gtt    1440
Val Pro Glu Lys Thr Lys Glu Ser Pro Gly Ala Pro Trp Glu Phe Val
465                 470                 475                 480
ggc ttg ttg cca ctt ttt gat ccc cca aga cat gac agt gct gaa aca    1488
Gly Leu Leu Pro Leu Phe Asp Pro Pro Arg His Asp Ser Ala Glu Thr
                485                 490                 495
att cga cgg gct ttg aat ctt ggt gtt aac gtc aag atg atc act ggt    1536
Ile Arg Arg Ala Leu Asn Leu Gly Val Asn Val Lys Met Ile Thr Gly
            500                 505                 510
gac caa ctt gct att ggt aag gaa act ggt cgc aga ctt gga atg gga    1584
Asp Gln Leu Ala Ile Gly Lys Glu Thr Gly Arg Arg Leu Gly Met Gly
        515                 520                 525
aca aac atg tat cca tct tcg gct ctt ctt ggt aca cac aaa gac gca    1632
Thr Asn Met Tyr Pro Ser Ser Ala Leu Leu Gly Thr His Lys Asp Ala
    530                 535                 540
aac ctc gca tcc att cct gtt gag gag ttg att gaa aag gct gat gga    1680
Asn Leu Ala Ser Ile Pro Val Glu Glu Leu Ile Glu Lys Ala Asp Gly
545                 550                 555                 560
ttt gcc gga gtc ttc cca gag cac aaa tac gaa att gtg aaa aag ttg    1728
Phe Ala Gly Val Phe Pro Glu His Lys Tyr Glu Ile Val Lys Lys Leu
                565                 570                 575
cag gag agg aag cat att gtt gga atg act ggt gat ggt gtc aat gat    1776
Gln Glu Arg Lys His Ile Val Gly Met Thr Gly Asp Gly Val Asn Asp
            580                 585                 590
gcc cct gct cta aag aaa gct gat atc ggt att gct gtt gct gat gct    1824
Ala Pro Ala Leu Lys Lys Ala Asp Ile Gly Ile Ala Val Ala Asp Ala
        595                 600                 605
aca gat gct gct cgt ggt gct tca gat atc gtg ctc act gag cct gga    1872
Thr Asp Ala Ala Arg Gly Ala Ser Asp Ile Val Leu Thr Glu Pro Gly
    610                 615                 620
ctc agc gtt att atc agt gct gtt ctc acc agc aga gct att ttc cag    1920
Leu Ser Val Ile Ile Ser Ala Val Leu Thr Ser Arg Ala Ile Phe Gln
625                 630                 635                 640
aga atg aag aac tat act atc tat gca gtc tca atc acc atc cgt att    1968
Arg Met Lys Asn Tyr Thr Ile Tyr Ala Val Ser Ile Thr Ile Arg Ile
                645                 650                 655
gtg ttt ggt ttc atg ctt att gct ttg ata tgg gaa ttt gac ttc tca    2016
Val Phe Gly Phe Met Leu Ile Ala Leu Ile Trp Glu Phe Asp Phe Ser
            660                 665                 670
gcc ttc atg gtt ctg atc att gcc att ctt aac gac ggt acc atc atg    2064
Ala Phe Met Val Leu Ile Ile Ala Ile Leu Asn Asp Gly Thr Ile Met
        675                 680                 685
aca atc tca aag gac aga gtt aag cca tct ccc aca cct gat agc tgg    2112
Thr Ile Ser Lys Asp Arg Val Lys Pro Ser Pro Thr Pro Asp Ser Trp
    690                 695                 700
aaa ctt aaa gaa att ttt gct act gga gtc gtt cta gga ggc tac cag    2160
Lys Leu Lys Glu Ile Phe Ala Thr Gly Val Val Leu Gly Gly Tyr Gln
705                 710                 715                 720
gcc atc atg act gtt att ttc ttc tgg gcg gcg cac aag act gac ttt    2208
Ala Ile Met Thr Val Ile Phe Phe Trp Ala Ala His Lys Thr Asp Phe
                725                 730                 735
ttc tcg gac aca ttc ggt gtg agg tcc att agg gac aat aac cac gag    2256
Phe Ser Asp Thr Phe Gly Val Arg Ser Ile Arg Asp Asn Asn His Glu
            740                 745                 750
cta atg ggt gcg gtg tac tta caa gtt agt atc att agt caa gct ctg    2304
Leu Met Gly Ala Val Tyr Leu Gln Val Ser Ile Ile Ser Gln Ala Leu
        755                 760                 765
atc ttc gtc aca aga tca agg agt tgg tct ttt gtt gaa cgt cct gga    2352
Ile Phe Val Thr Arg Ser Arg Ser Trp Ser Phe Val Glu Arg Pro Gly
    770                 775                 780
gca ttg ctg atg att gct ttc ctc att gca caa ctg att gct act ttg    2400
Ala Leu Leu Met Ile Ala Phe Leu Ile Ala Gln Leu Ile Ala Thr Leu
785                 790                 795                 800
att gcg gtt tac gcc aac tgg gaa ttt gca aag att agg ggt att gga    2448
Ile Ala Val Tyr Ala Asn Trp Glu Phe Ala Lys Ile Arg Gly Ile Gly
                805                 810                 815
tgg gga tgg gct ggt gtg atc tgg cta tac agt att gtc aca tac ttc    2496
Trp Gly Trp Ala Gly Val Ile Trp Leu Tyr Ser Ile Val Thr Tyr Phe
            820                 825                 830
cca ttg gac gtt ttc aag ttt gcc att cga tac atc ttg agc gga aag    2544
Pro Leu Asp Val Phe Lys Phe Ala Ile Arg Tyr Ile Leu Ser Gly Lys
        835                 840                 845
gcg tgg ctc aac ttg ttt gag aac aag acg gct ttc acg atg aag aaa    2592
Ala Trp Leu Asn Leu Phe Glu Asn Lys Thr Ala Phe Thr Met Lys Lys
    850                 855                 860
gat tac gga aaa gaa gag aga gag gct caa tgg gca ctt gct caa agg    2640
Asp Tyr Gly Lys Glu Glu Arg Glu Ala Gln Trp Ala Leu Ala Gln Arg
865                 870                 875                 880
aca ctt cac ggt tta cag cca aaa gaa gct gtt aac atc ttc cct gag    2688
Thr Leu His Gly Leu Gln Pro Lys Glu Ala Val Asn Ile Phe Pro Glu
                885                 890                 895
aaa gga agt tac aga gaa ttg tct gag atc gct gag caa gct aag aga    2736
Lys Gly Ser Tyr Arg Glu Leu Ser Glu Ile Ala Glu Gln Ala Lys Arg
            900                 905                 910
aga gct gag atc gct agg ctt agg gag ctg cac aca ctc aag gga cat    2784
Arg Ala Glu Ile Ala Arg Leu Arg Glu Leu His Thr Leu Lys Gly His
        915                 920                 925
gtg gaa tca gtc gtg aag cta aag ggc ttg gac att gaa act ccc agt    2832
Val Glu Ser Val Val Lys Leu Lys Gly Leu Asp Ile Glu Thr Pro Ser
    930                 935                 940
cac tac act gtg           tag                                      2847
His Tyr Thr Val
945
<210>40
<211>948
<212>PRT
<213>鼠耳芥
<400>40
Met Ser Ser Leu Glu Asp Ile Lys Asn Glu Thr Val Asp Leu Glu Lys
  1               5                  10                  15
Ile Pro Ile Glu Glu Val Phe Gln Gln Leu Lys Cys Ser Arg Glu Gly
             20                  25                  30
Leu Thr Thr Gln Glu Gly Glu Asp ArgIle Gln Ile Phe Gly Pro Asn
         35                  40                  45
Lys Leu Glu Glu Lys Lys Glu Ser Lys Leu Leu Lys Phe Leu Gly Phe
     50                  55                  60
Met Trp Asn Pro Leu Ser Trp Val Met Glu Met Ala Ala Ile Met Ala
 65                  70                  75                  80
Ile Ala Leu Ala Asn Gly Asp Gly Arg Pro Pro Asp Trp Gln Asp Phe
                 85                  90                  95
Val Gly Ile Ile Cys Leu Leu Val Ile Asn Ser Thr Ile Ser Phe Ile
            100                 105                 110
Glu Glu Asn Asn Ala Gly Asn Ala Ala Ala Ala Leu Met Ala Gly Leu
        115                 120                 125
Ala Pro Lys Thr Lys Val Leu Arg Asp Gly Lys Trp Ser Glu Gln Glu
    130                 135                 140
Ala Ala Ile Leu Val Pro Gly Asp Ile Val Ser Ile Lys Leu Gly Asp
145                 150                 155                 160
Ile Ile Pro Ala Asp Ala Arg Leu Leu Glu Gly Asp Pro Leu Lys Val
                165                 170                 175
Asp Gln Ser Ala Leu Thr Gly Glu Ser Leu Pro Val Thr Lys His Pro
            180                 185                 190
Gly Gln Glu Val Phe Ser Gly Ser Thr Cys Lys Gln Gly Glu Ile Glu
        195                 200                 205
Ala Val Val Ile Ala Thr Gly Val His Thr Phe Phe Gly Lys Ala Ala
    210                 215                 220
His Leu Val Asp Ser Thr Asn Gln Val Gly His Phe Gln Lys Val Leu
225                 230                 235                 240
Thr Ala Ile Gly Asn Phe Cys Ile Cys Ser Ile Ala Ile Gly Met Val
                245                 250                 255
Ile Glu Ile Ile Val Met Tyr Pro Ile Gln Arg Arg Lys Tyr Arg Asp
            260                 265                 270
Gly Ile Asp Asn Leu Leu Val Leu Leu Ile Gly Gly Ile Pro Ile Ala
        275                 280                 285
Met Pro Thr Val Leu Ser Val Thr Met Ala Ile Gly Ser His Arg Leu
    290                 295                 300
Ser Gln Gln Gly Ala Ile Thr Lys Arg Met Thr Ala Ile Glu Glu Met
305                 310                 315                 320
Ala Gly Met Asp Val Leu Cys Ser Asp Lys Thr Gly Thr Leu Thr Leu
                325                 330                 335
Asn Lys Leu Ser Val Asp Lys Asn Leu Val Glu Val Phe Cys Lys Gly
            340                 345                 350
Val Glu Lys Asp Gln Val Leu Leu Phe Ala Ala Met Ala Ser Arg Val
        355                 360                 365
Glu Asn Gln Asp Ala Ile Asp Ala Ala Met Val Gly Met Leu Ala Asp
    370                 375                 380
Pro Lys Glu Ala Arg Ala Gly Ile Arg Glu Val His Phe Leu Pro Phe
385                 390                 395                 400
Asn Pro Val Asp Lys Arg Thr Ala Leu Thr Tyr Ile Asp Gly Ser Gly
                405                 410                 415
Asn Trp His Arg Val Ser Lys Gly Ala Pro Glu Gln Ile Leu Glu Leu
            420                 425                 430
Ala Lys Ala Ser Asn Asp Leu Ser Lys Lys Val Leu Ser Ile Ile Asp
        435                 440                 445
Lys Tyr Ala Glu Arg Gly Leu Arg Ser Leu Ala Val Ala Arg Gln Val
    450                 455                 460
Val Pro Glu Lys Thr Lys Glu Ser Pro Gly Ala Pro Trp Glu Phe Val
465                 470                 475                 480
Gly Leu Leu Pro Leu Phe Asp Pro Pro Arg His Asp Ser Ala Glu Thr
                485                 490                 495
Ile Arg Arg Ala Leu Asn Leu Gly Val Asn Val Lys Met Ile Thr Gly
            500                 505                 510
Asp Gln Leu Ala Ile Gly Lys Glu Thr Gly Arg Arg Leu Gly Met Gly
        515                 520                 525
Thr Asn Met Tyr Pro Ser Ser Ala Leu Leu Gly Thr His Lys Asp Ala
    530                 535                 540
Asn Leu Ala Ser Ile Pro Val Glu Glu Leu Ile Glu Lys Ala Asp Gly
545                 550                 555                 560
Phe Ala Gly Val Phe Pro Glu His Lys Tyr Glu Ile Val Lys Lys Leu
                565                 570                 575
Gln Glu Arg Lys His Ile Val Gly Met Thr Gly Asp Gly Val Asn Asp
            580                 585                 590
Ala Pro Ala Leu Lys Lys Ala Asp Ile Gly Ile Ala Val Ala Asp Ala
        595                 600                 605
Thr Asp Ala Ala Arg Gly Ala Ser Asp Ile Val Leu Thr Glu Pro Gly
    610                 615                 620
Leu Ser Val Ile Ile Ser Ala Val Leu Thr Ser Arg Ala Ile Phe Gln
625                 630                 635                 640
Arg Met Lys Asn Tyr Thr Ile Tyr Ala Val Ser Ile Thr Ile Arg Ile
                645                 650                 655
Val Phe Gly Phe Met Leu Ile Ala Leu Ile Trp Glu Phe Asp Phe Set
            660                 665                 670
Ala Phe Met Val Leu Ile Ile Ala Ile Leu Asn Asp Gly Thr Ile Met
        675                 680                 685
Thr Ile Ser Lys Asp Arg Val Lys Pro Ser Pro Thr Pro Asp Ser Trp
    690                 695                 700
Lys Leu Lys Glu Ile Phe Ala Thr Gly Val Val Leu Gly Gly Tyr Gln
705                 710                 715                 720
Ala Ile Met Thr Val Ile Phe Phe Trp Ala Ala His Lys Thr Asp Phe
                725                 730                 735
Phe Ser Asp Thr Phe Gly Val Arg Ser Ile Arg Asp Asn Asn His Glu
             740                 745                 750
Leu Met Gly Ala Val Tyr Leu Gln Val Ser Ile Ile Ser Gln Ala Leu
        755                 760                 765
Ile Phe Val Thr Arg Ser Arg Ser Trp Ser Phe Val Glu Arg Pro Gly
    770                 775                 780
Ala Leu Leu Met Ile Ala Phe Leu Ile Ala Gln Leu Ile Ala Thr Leu
785                 790                 795                 800
Ile Ala Val Tyr Ala Asn Trp Glu Phe Ala Lys Ile Arg Gly Ile Gly
                805                 810                 815
Trp Gly Trp Ala Gly Val Ile Trp Leu Tyr Ser Ile Val Thr Tyr Phe
            820                 825                 830
Pro Leu Asp Val Phe Lys Phe Ala Ile Arg Tyr Ile Leu Ser Gly Lys
        835                 840                 845
Ala Trp Leu Asn Leu Phe Glu Asn Lys Thr Ala Phe Thr Met Lys Lys
    850                 855                 860
Asp Tyr Gly Lys Glu Glu Arg Glu Ala Gln Trp Ala Leu Ala Gln Arg
865                 870                 875                 880
Thr Leu His Gly Leu Gln Pro Lys Glu Ala Val Asn Ile Phe Pro Glu
                885                 890                 895
Lys Gly Ser Tyr Arg Glu Leu Ser Glu Ile Ala Glu Gln Ala Lys Arg
            900                 905                 910
Arg Ala Glu Ile Ala Arg Leu Arg Glu Leu His Thr Leu Lys Gly His
        915                 920                 925
Val Glu Ser Val Val Lys Leu Lys Gly Leu Asp Ile Glu Thr Pro Ser
    930                 935                 940
His Tyr Thr Val
945
<210>41
<211>525
<212>DNA
<213>褐家鼠
<220>
<221>基因
<222>(1)..(525)
<223>包含磷脂酰肌醇4,5-二磷酸靶向序列的磷脂酶C-delta 1的部分pleckstrin同源结构域的
<220>
<221>CDS
<222>(1)..(522)
<223>包含磷脂酰肌醇4,5-二磷酸靶向序列的磷脂酶C-delta 1的部分pleckstrin同源结构域
<300>
<308>GenBank/NM_017035
<309>2000-11-01
<400>41
gac tcg ggt agg gac ttc ctg acc ctg cac ggg ctc cag gat gac ccg             48
Asp Ser Gly Arg Asp Phe Leu Thr Leu His Gly Leu Gln Asp Asp Pro
  1               5                  10                  15
gac ctt cag gcc ctt ctg aag ggc agc cag ctt ctg aag gtg aag tcc    96
Asp Leu Gln Ala Leu Leu Lys Gly Ser Gln Leu Leu Lys Val Lys Ser
             20                  25                  30
agc tcg tgg cgt agg gaa cgc ttc tac aag cta cag gag gac tgc aag    144
Ser Ser Trp Arg Arg Glu Arg Phe Tyr Lys Leu Gln Glu Asp Cys Lys
         35                  40                  45
acc atc tgg cag gaa tct cga aag gtc atg agg tcc ccg gag tcg cag    192
Thr Ile Trp Gln Glu Ser Arg Lys Val Met Arg Ser Pro Glu Ser Gln
     50                  55                  60
ctg ttc tcc atc gag gac att cag gag gta cgg atg gga cac cgc aca    240
Leu Phe Ser Ile Glu Asp Ile Gln Glu Val Arg Met Gly His Arg Thr
 65                  70                  75                  80
gaa ggc ctg gag aag ttt gcc cga gac atc ccc gag gat cga tgc ttc    288
Glu Gly Leu Glu Lys Phe Ala Arg Asp Ile Pro Glu Asp Arg Cys Phe
                 85                  90                  95
tcc att gtc ttc aag gac cag cgc aac acc cta gac ctc att gcc cca    336
Ser Ile Val Phe Lys Asp Gln Arg Asn Thr Leu Asp Leu Ile Ala Pro
            100                 105                 110
tca cca gct gac gct cag cac tgg gtg cag ggc ctg cgc aag atc atc    384
Ser Pro Ala Asp Ala Gln His Trp Val Gln Gly Leu Arg Lys Ile Ile
        115                 120                 125
cac cac tcc ggc tcc atg gac cag cgg cag aag ctg cag cac tgg att    432
His His Ser Gly Ser Met Asp Gln Arg Gln Lys Leu Gln His Trp Ile
    130                 135                 140
cac tcc tgc ttg cga aag gct gat aaa aac aag gac aac aag atg aac    480
His Ser Cys Leu Arg Lys Ala Asp Lys Asn Lys Asp Asn Lys Met Asn
145                 150                 155                 160
ttc aag gag ctg aag gac ttc ctg aag gag ctc aac atc cag  tga       525
Phe Lys Glu Leu Lys Asp Phe Leu Lys Glu Leu Asn Ile Gln
                165                 170
<210>42
<211>174
<212>PRT
<213>褐家鼠
<400>42
Asp Ser Gly Arg Asp Phe Leu Thr Leu His Gly Leu Gln Asp Asp Pro
  1               5                  10                  15
Asp Leu Gln Ala Leu Leu Lys Gly Ser Gln Leu Leu Lys Val Lys Ser
             20                  25                  30
Ser Ser Trp Arg Arg Glu Arg Phe Tyr Lys Leu Gln Glu Asp Cys Lys
         35                  40                  45
Thr Ile Trp Gln Glu Ser Arg Lys Val Met Arg Ser Pro Glu Ser Gln
     50                  55                  60
Leu Phe Ser Ile Glu Asp Ile Gln Glu Val Arg Met Gly His Arg Thr
 65                  70                  75                  80
Glu Gly Leu Glu Lys Phe Ala Arg Asp Ile Pro Glu Asp Arg Cys Phe
                 85                  90                  95
Ser Ile Val Phe Lys Asp Gln Arg Asn Thr Leu Asp Leu Ile Ala Pro
            100                 105                 110
Ser Pro Ala Asp Ala Gln His Trp Val Gln Gly Leu Arg Lys Ile Ile
        115                 120                 125
His His Ser Gly Ser Met Asp Gln Arg Gln Lys Leu Gln His Trp Ile
    130                 135                 140
His Ser Cys Leu Arg Lys Ala Asp Lys Asn Lys Asp Asn Lys Met Asn
145                 150                 155                 160
Phe Lys Glu Leu Lys Asp Phe Leu Lys Glu Leu Asn Ile Gln
                165                 170
<210>43
<211>282
<212>DNA
<213>小家鼠(Mus musculus)
<220>
<221>CDS
<222>(1)..(282)
<223>包含磷脂酰肌醇4-磷酸靶向序列的FAPP(家族A(磷酸肌醇结合特异)成员3)的部分
pleckstrin同源结构域
<300>
<308>GenBank/BC031110
<309>2002-06-13
<400>43
atg gag ggg gtt ctg tac aag tgg acc aac tat ctc aca ggt tgg cag    48
Met Glu Gly Val Leu Tyr Lys Trp Thr Asn Tyr Leu Thr Gly Trp Gln
  1               5                  10                  15
cct cga tgg ttt gtt ctg gat aat gga atc ctg tcc tac tat gac tca    96
Pro Arg Trp Phe Val Leu Asp Asn Gly Ile Leu Ser Tyr Tyr Asp Ser
             20                  25                  30
cag gat gat gtc tgc aaa ggg agc aaa ggg agt ata aag atg gcg gtc    144
Gln Asp Asp Val Cys Lys Gly Ser Lys Gly Ser Ile Lys Met Ala Val
         35                  40                  45
tgt gag att aaa gtc cat ccc gca gac aac aca aga atg gag tta atc    192
Cys Glu Ile Lys Val His Pro Ala Asp Asn Thr Arg Met Glu Leu Ile
     50                  55                  60
att cca gga gag cag cat ttc tac atg aag gca gta aat gcc gcc gag    240
Ile Pro Gly Glu Gln His Phe Tyr Met Lys Ala Val Asn Ala Ala Glu
 65                  70                  75                  80
aga cag agg tgg ctg gtt gcc ctt ggg agc tcc aaa gcg tgc                282
Arg Gln Arg Trp Leu Val Ala Leu Gly Ser Ser Lys Ala Cys
                 85                  90
<210>44
<211>94
<212>PRT
<213>小家鼠
<400>44
Met Glu Gly Val Leu Tyr Lys Trp Thr Asn Tyr Leu Thr Gly Trp Gln
  1               5                  10                  15
Pro Arg Trp Phe Val Leu Asp Asn Gly Ile Leu Ser Tyr Tyr Asp Ser
             20                  25                  30
Gln Asp Asp Val Cys Lys Gly Ser Lys Gly Ser Ile Lys Met Ala Val
         35                  40                  45
Cys Glu Ile Lys Val His Pro Ala Asp Asn Thr Arg Met Glu Leu Ile
     50                  55                  60
Ile Pro Gly Glu Gln His Phe Tyr Met Lys Ala Val Asn Ala Ala Glu
 65                  70                  75                  80
Arg Gln Arg Trp Leu Val Ala Leu Gly Ser Ser Lys Ala Cys
                 85                  90
<210>45
<211>741
<212>DNA
<213>烟草叶脉斑点病毒
<220>
<221>基因
<222>(1)..(741)
<223>NIa蛋白酶基因
<220>
<221>CDS
<222>(1)..(738)
<223>NIa蛋白酶
<300>
<308>GenBank/AF222050
<309>2000-02-07
<400>45
atg tca aag gcg cta ctt aag gga gtg cga gat ttt aat cca atc tct    48
Met Ser Lys Ala Leu Leu Lys Gly Val Arg Asp Phe Asn Pro Ile Ser
  1               5                  10                  15
gct tgc gta tgc ctc ctt gag aac tcc tcg gat ggg cat agt gag aga    96
Ala Cys Val Cys Leu Leu Glu Asn Ser Ser Asp Gly His Ser Glu Arg
             20                  25                  30
ctg ttt ggc att ggt ttt ggc cca tat atc att gcc aac caa cat ctt    144
Leu Phe Gly Ile Gly Phe Gly Pro Tyr Ile Ile Ala Asn Gln His Leu
         35                  40                  45
ttt aga agg aac aat gga gag ttg act atc aaa acc atg cat ggt gag    192
Phe Arg Arg Asn Asn Gly Glu Leu Thr Ile Lys Thr Met His Gly Glu
     50                  55                  60
ttc aaa gtc aag aac tca aca caa ttg cag atg aaa cca gtt gag ggc    240
Phe Lys Val Lys Asn Ser Thr Gln Leu Gln Met Lys Pro Val Glu Gly
 65                  70                  75                  80
aga gac ata ata gtt atc aaa atg gct aag gac ttc cca cca ttc cct    288
Arg Asp Ile Ile Val Ile Lys Met Ala Lys Asp Phe Pro Pro Phe Pro
                 85                  90                  95
caa aaa cta aaa ttc aga cag cct acc atc aaa gat aga gtg tgc atg    336
Gln Lys Leu Lys Phe Arg Gln Pro Thr Ile Lys Asp Arg Val Cys Met
            100                 105                 110
gta tcc aca aat ttt cag cag aaa agt gtc tct agt cta gtg tct gag    384
Val Ser Thr Asn Phe Gln Gln Lys Ser Val Ser Ser Leu Val Ser Glu
        115                 120                 125
tca tca cac att gtg cat aaa gag gac act tca ttc tgg caa cac tgg    432
Ser Ser His Ile Val His Lys Glu Asp Thr Ser Phe Trp Gln His Trp
    130                 135                 140
ata aca aca aag gat gga caa tgt gga agt ccg ctg gtt tca atc att    480
Ile Thr Thr Lys Asp Gly Gln Cys Gly Ser Pro Leu Val Ser Ile Ile
145                 150                 155                 160
gat gga aat att ttg ggg atc cac agc ctg acg cat acg acc aat ggt    528
Asp Gly Asn Ile Leu Gly Ile His Ser Leu Thr His Thr Thr Asn Gly
                165                 170                 175
agc aat tac ttc gtg gaa ttt cct gag aag ttc gta gct aca tat ctt    576
Ser Asn Tyr Phe Val Glu Phe Pro Glu Lys Phe Val Ala Thr Tyr Leu
            180                 185                 190
gat gcc gct gat ggt tgg tgc aag aat tgg aag ttc aat gct gat aag    624
Asp Ala Ala Asp Gly Trp Cys Lys Asn Trp Lys Phe Asn Ala Asp Lys
        195                 200                 205
atc agt tgg ggt tcc ttt aca tta gtt gag gat gcg ccc gaa gat gac    672
Ile Ser Trp Gly Ser Phe Thr Leu Val Glu Asp Ala Pro Glu Asp Asp
    210                 215                 220
ttc atg gcc aag aaa act gtt gcc gcc atc atg gac gat ttg gtc cgc    720
Phe Met Ala Lys Lys Thr Val Ala Ala Ile Met Asp Asp Leu Val Arg
225                 230                 235                 240
act caa ggg gga gaa gct      tg a                                  741
Thr Gln Gly Gly Glu Ala
                245
<210>46
<211>246
<212>PRT
<213>烟草叶脉斑点病毒
<400>46
Met Ser Lys Ala Leu Leu Lys Gly Val Arg Asp Phe Asn Pro Ile Ser
  1               5                  10                  15
Ala Cys Val Cys Leu Leu Glu Asn Ser Ser Asp Gly His Ser Glu Arg
             20                  25                  30
Leu Phe Gly Ile Gly Phe Gly Pro Tyr Ile Ile Ala Asn Gln His Leu
         35                  40                  45
Phe Arg Arg Asn Asn Gly Glu Leu Thr Ile Lys Thr Met His Gly Glu
     50                  55                  60
Phe Lys Val Lys Asn Ser Thr Gln Leu Gln Met Lys Pro Val Glu Gly
 65                  70                  75                  80
Arg Asp Ile Ile Val Ile Lys Met Ala Lys Asp Phe Pro Pro Phe Pro
                 85                  90                  95
Gln Lys Leu Lys Phe Arg Gln Pro Thr Ile Lys Asp Arg Val Cys Met
            100                 105                 110
Val Ser Thr Asn Phe Gln Gln Lys Ser Val Ser Ser Leu Val Ser Glu
        115                 120                 125
Ser Ser His Ile Val His Lys Glu Asp Thr Ser Phe Trp Gln His Trp
    130                 135                 140
Ile Thr Thr Lys Asp Gly Gln Cys Gly Ser Pro Leu Val Ser Ile Ile
145                 150                 155                 160
Asp Gly Asn Ile Leu Gly Ile His Ser Leu Thr His Thr Thr Asn Gly
                165                 170                 175
Ser Asn Tyr Phe Val Glu Phe Pro Glu Lys Phe Val Ala Thr Tyr Leu
            180                 185                 190
Asp Ala Ala Asp Gly Trp Cys Lys Asn Trp Lys Phe Asn Ala Asp Lys
        195                 200                 205
Ile Ser Trp Gly Ser Phe Thr Leu Val Glu Asp Ala Pro Glu Asp Asp
    210                 215                 220
Phe Met Ala Lys Lys Thr Val Ala Ala Ile Met Asp Asp Leu Val Arg
225                 230                 235                 240
Thr Gln Gly Gly Glu Ala
                245
<210>47
<211>12
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(12)
<223>NIa蛋白酶切割序列
<400>47
gtg cgc ttc cag                                                       12
Val Arg Phe Gln
  1
<210>48
<211>4
<212>PRT
<213>人工序列
<400>48
Val Arg Phe Gln
  1
<210>49
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(21)
<223>NIa蛋白酶切割序列
<300>
<308>GenBank/AX427722
<309>2002-06-20
<400>49
gaa cca gtc tat ttc caa ggg                                                       21
Glu Pro Val Tyr Phe Gln Gly
  1               5
<210>50
<211>7
<212>PRT
<213>人工序列
<400>50
Glu Pro Val Tyr Phe Gln Gly
  1               5
<210>51
<211>1638
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>基因
<222>(1)..(1638)
<223>RFP:PS(NIa蛋白酶):AtOEP7:GEP基因
<220>
<221>CDS
<222>(1)..(1635)
<223>RFP:PS(NIa蛋白酶):AtOEP7:GFP杂合蛋白
<220>
<221>misc_特征
<222>(1)..(1638)
<223>CDS:RFP(1..678)+ADs-CDS:NIa蛋白酶水解位点(700..711)+ADs-C
DS:AtOEP7(712..900)+ADs-CDS:GFP(922..1635)
<400>51
atg gtg cgc tcc tcc aag aac gtc atc aag gag ttc atg cgc ttc aag    48
Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys
  1               5                  10                  15
gtg cgc atg gag ggc acc gtg aac ggc cac gag ttc gag atc gag ggc    96
Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly
             20                  25                  30
gag ggc gag ggc cgc ccc tac gag ggc cac aac acc gtg aag ctg aag    144
Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys
         35                  40                  45
gtg acc aag ggc ggc ccc ctg ccc ttc gcc tgg gac atc ctg tcc ccc    192
Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro
     50                  55                  60
cag ttc cag tac ggc tcc aag gtg tac gtg aag cac ccc gcc gaG atc    240
Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile
 65                  70                  75                  80
ccc gac tac aag aag ctg tcc ttc ccc gag ggc ttc aag tgg gag cgc    288
Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg
                 85                  90                  95
gtg atg aac ttc gag gac ggc ggc gtg gtg acc gtg acc cag gac tcc    336
Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser
            100                 105                 110
tcc ctg cag gac ggc tgc ttc atc tac aag gtg aag ttc atc ggc gtg    384
Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val
        115                 120                 125
aac ttc ccc tcc gac ggc ccc gta atg cag aag aag acc atg ggc tgg    432
Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp
    130                 135                 140
gag gcc tcc acc gag cgc ctg tac ccc cgc gac ggc gtg ctg aag ggc    480
Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly
145                 150                 155                 160
gag atc cac aag gcc ctg aag ctg aag gac ggc ggc cac tac ctg gtg    528
Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val
                165                 170                 175
gag ttc aag tcc atc tac atg gcc aag aag ccc gtg cag ctg ccc ggc    576
Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly
            180                 185                 190
tac tac tac gtg gac tcc aag ctg gac atc acc tcc cac aac gag gac    624
Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp
        195                 200                 205
tac acc atc gtg gag cag tac gag cgc acc gag ggc cgc cac cac ctg    672
Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu
    210                 215                 220
ttc ctg ccc cgg gca atc aag ctg ggt gtg cgc ttc cag gga aaa act    720
Phe Leu Pro Arg Ala Ile Lys Leu Gly Val Arg Phe Gln Gly Lys Thr
225                 230                 235                 240
tcg gga gcg aaa cag gcg act gtg gtg gtc gca gcg atg gcg tta gga    768
Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala Met Ala Leu Gly
                245                 250                 255
tgg tta gcc ata gag atc gct ttc aag cct ttc ctc gat aaa ttc cgc    816
Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu Asp Lys Phe Arg
            260                 265                 270
tcc tca atc gac aaa tct gac cca acc aaa gac ccc gat gac ttc gac    864
Ser Ser Ile Asp Lys Ser Asp Pro Thr Lys Asp Pro Asp Asp Phe Asp
        275                 280                 285
acc gcc gct act gca acc aca tcc aaa gag ggt ttg ggg atc caa gga    912
Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu Gly Ile Gln Gly
    290                 295                 300
gat ata aca atg agt aaa gga gaa gaa ctt ttc act gga gtt gtc cca    960
Asp Ile Thr Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro
305                 310                 315                 320
att ctt gtt gaa tta gat ggt gat gtt aat ggg cac aaa ttt tct gtc    1008
Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val
                325                 330                 335
agt gga gag ggt gaa ggt gat gca aca tac gga aaa ctt acc ctt aaa    1056
Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys
            340                 345                 350
ttt att tgc act act gga aaa cta cct gtt cca tgg cca aca ctt gtc    1104
Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val
        355                 360                 365
act act ttc tct tat ggt gtt caa tgc ttt tca aga tac cca gat cat    1152
Thr Thr Phe Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His
    370                 375                 380
atg aag cgg cac gac ttc ttc aag agc gcc atg cct gag gga tac gtg    1200
Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val
385                 390                 395                 400
cag gag agg acc atc tct ttc aag gac gac ggg aac tac aag aca cgt    1248
Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg
                405                 410                 415
gct gaa gtc aag ttt gag gga gac acc ctc gtc aac agg atc gag ctt    1296
Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu
            420                 425                 430
aag gga atc gat ttc aag gag gac gga aac atc ctc ggc cac aag ttg    1344
Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu
        435                 440                 445
gaa tac aac tac aac tcc cac aac gta tac atc acg gca gac aaa caa    1392
Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln
    450                 455                 460
aag aat gga atc aaa gct aac ttc aaa att aga cac aac att gaa gat    1440
Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile Glu Asp
465                 470                 475                 480
gga agc gtt caa cta gca gac cat tat caa caa aat act cca att ggc    1488
Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly
                485                 490                 495
gat ggc cct gtc ctt tta cca gac aac cat tac ctg tcc aca caa tct    1536
Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser
            500                 505                 510
gcc ctt tcg aaa gat ccc aac gaa aag aga gac cac atg gtc ctt ctt    1584
Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu
        515                 520                 525
gag ttt gta aca gct gct ggg att aca cat ggc atg gat gaa cta tac    1632
Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr
    530                 535                 540
aaa taa                                                              1638
Lys
545
<210>52
<211>545
<212>PRT
<213>人工序列
<400>52
Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys
  1               5                  10                  15
Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly
             20                  25                  30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys
         35                  40                  45
Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro
     50                  55                  60
Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile
 65                  70                  75                  80
Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg
                 85                  90                  95
Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser
            100                 105                 110
Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val
        115                 120                 125
Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp
    130                 135                 140
Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly
145                 150                 155                 160
Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val
                165                 170                 175
Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly
            180                 185                 190
Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp
        195                 200                 205
Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu
    210                 215                 220
Phe Leu Pro Arg Ala Ile Lys Leu Gly Val Arg Phe Gln Gly Lys Thr
225                 230                 235                 240
Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala Met Ala Leu Gly
                245                 250                 255
Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu Asp Lys Phe Arg
            260                 265                 270
Ser Ser Ile Asp Lys Ser Asp Pro Thr Lys Asp Pro Asp Asp Phe Asp
        275                 280                 285
Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu Gly Ile Gln Gly
    290                 295                 300
Asp Ile Thr Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro
305                 310                 315                 320
Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val
                325                 330                 335
Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys
            340                 345                 350
Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val
        355                 360                 365
Thr Thr Phe Ser Tyr Gly Val Gl nCys Phe Ser Arg Tyr Pro Asp His
    370                 375                 380
Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val
385                 390                 395                 400
Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg
                405                 410                 415
Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu
            420                 425                 430
Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu
        435                 440                 445
Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln
    450                 455                 460
Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile Glu Asp
465                 470                 475                 480
Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly
                485                 490                 495
Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser
            500                 505                 510
Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu
        515                 520                 525
Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr
    530                 535                 540
Lys
545
<210>53
<211>3579
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>基因
<222>(1)..(3579)
<223>H+-ATPase:PS(NIa蛋白酶):GTP杂合蛋白基因
<220>
<221>CDS
<222>(1)..(3576)
<223>H+-ATPase:PS(NIa蛋白酶):GFP杂合蛋白
<220>
<221>mi sc_特征
<222>(1)..(3579)
<223>CDS:H+-ATPase(1..2844)+ADs-CDS:NIa蛋白酶切割序列(2851..
2862)+ADs-CDS:GFP(2863..3576)
<400>53
atg tcg agt ctc gaa gat atc aag aac gag act gtt gat ctg gaa aaa    48
Met Ser Ser Leu Glu Asp Ile Lys Asn Glu Thr Val Asp Leu Glu Lys
  1               5                  10                  15
att ccg att gag gaa gtt ttc cag cag cta aaa tgt tca agg gaa gga    96
Ile Pro Ile Glu Glu Val Phe Gln Gln Leu Lys Cys Ser Arg Glu Gly
             20                  25                  30
ttg aca acg cag gaa ggg gag gac agg att cag atc ttt ggc ccc aac    144
Leu Thr Thr Gln Glu Gly Glu Asp Arg Ile Gln Ile Phe Gly Pro Asn
         35                  40                  45
aag ctc gaa gag aaa aag gaa agc aaa ctt ctg aag ttt ttg ggg ttt    192
Lys Leu Glu Glu Lys Lys Glu Ser Lys Leu Leu Lys Phe Leu Gly Phe
     50                  55                  60
atg tgg aat cca ctt tca tgg gtc atg gaa atg gct gca atc atg gcc    240
Met Trp Asn Pro Leu Ser Trp Val Met Glu Met Ala Ala Ile Met Ala
 65                  70                  75                  80
att gct ttg gcc aac ggt gat ggt agg cct ccg gat tgg cag gat ttt    288
Ile Ala Leu Ala Asn Gly Asp Gly Arg Pro Pro Asp Trp Gln Asp Phe
                 85                  90                  95
gtt ggt att atc tgt ctg ttg gtt atc aac tct acc atc agt ttt atc    336
Val Gly Ile Ile Cys Leu Leu Val Ile Asn Ser Thr Ile Ser Phe Ile
            100                 105                 110
gaa gaa aac aat gct ggt aat gct gct gct gct ctt atg gct ggt ctt    384
Glu Glu Asn Asn Ala Gly Asn Ala Ala Ala Ala Leu Met Ala Gly Leu
        115                 120                 125
gct cct aaa acc aag gtt ctt agg gat gga aag tgg agt gaa caa gaa    432
Ala Pro Lys Thr Lys Val Leu Arg Asp Gly Lys Trp Ser Glu Gln Glu
    130                 135                 140
gct gct att ctt gtc cca gga gat att gtt agc att aaa tta gga gac    480
Ala Ala Ile Leu Val Pro Gly Asp Ile Val Ser Ile Lys Leu Gly Asp
145                 150                 155                 160
att atc cca gct gat gcc cgt cta ctt gaa ggt gat cct tta aag gtt    528
Ile Ile Pro Ala Asp Ala Arg Leu Leu Glu Gly Asp Pro Leu Lys Val
                165                 170                 175
gac caa tct gct cta act gga gag tcc ctt cct gta acc aag cac ccg    576
Asp Gln Ser Ala Leu Thr Gly Glu Ser Leu Pro Val Thr Lys His Pro
            180                 185                 190
ggt caa gaa gtt ttc tct ggt tca acc tgc aaa caa gga gaa atc gag    624
Gly Gln Glu Val Phe Ser Gly Ser Thr Cys Lys Gln Gly Glu Ile Glu
        195                 200                 205
gcg gtt gtt att gcc act ggg gtt cat acc ttc ttc ggt aaa gct gct    672
Ala Val Val Ile Ala Thr Gly Val His Thr Phe Phe Gly Lys Ala Ala
    210                 215                 220
cac ctt gtg gac agc act aac caa gtt gga cat ttc cag aag gtt ctt    720
His Leu Val Asp Ser Thr Asn Gln Val Gly His Phe Gln Lys Val Leu
225                 230                 235                 240
aca gcc att ggg aac ttc tgt atc tgt tcc att gct atc ggt atg gtg    768
Thr Ala Ile Gly Asn Phe Cys Ile Cys Ser Ile Ala Ile Gly Met Val
                245                 250                 255
att gag atc atc gtc atg tat ccg atc caa cgc cga aag tac aga gat    816
Ile Glu Ile Ile Val Met Tyr Pro Ile Gln Arg Arg Lys Tyr Arg Asp
            260                 265                 270
gga att gac aac ctt ttg gtc ctc ttg atc ggt ggt atc ccc att gct    864
Gly Ile Asp Asn Leu Leu Val Leu Leu Ile Gly Gly Ile Pro Ile Ala
        275                 280                 285
atg cct aca gtc ttg tcc gtg acc atg gct att ggg tct cac agg ttg    912
Met Pro Thr Val Leu Ser Val Thr Met Ala Ile Gly Ser His Arg Leu
    290                 295                 300
tct cag caa ggt gcc atc acc aag cgt atg act gcc att gaa gag atg    960
Ser Gln Gln Gly Ala Ile Thr Lys Arg Met Thr Ala Ile Glu Glu Met
305                 310                 315                 320
gca gga atg gat gtc ctg tgc agt gac aaa acc ggg aca cta acc ctc    1008
Ala Gly Met Asp Val Leu Cys Ser Asp Lys Thr Gly Thr Leu Thr Leu
                325                 330                 335
aac aaa ttg agt gtg gac aaa aac ttg gtc gag gtt ttc tgc aag ggt    1056
Asn Lys Leu Ser Val Asp Lys Asn Leu Val Glu Val Phe Cys Lys Gly
            340                 345                 350
gtg gag aaa gat caa gtc cta tta ttt gca gct atg gct tcc agg gtt    1104
Val Glu Lys Asp Gln Val Leu Leu Phe Ala Ala Met Ala Ser Arg Val
        355                 360                 365
gag aac cag gat gcc att gat gca gcc atg gtt ggg atg ctt gct gat    1152
Glu Asn Gln Asp Ala Ile Asp Ala Ala Met Val Gly Met Leu Ala Asp
    370                 375                 380
cca aag gag gct aga gct gga atc agg gaa gtt cac ttc ctt cca ttc    1200
Pro Lys Glu Ala Arg Ala Gly Ile Arg Glu Val His Phe Leu Pro Phe
385                 390                 395                 400
aac cct gtg gat aag aga act gct ttg act tac att gac ggc agt ggt    1248
Asn Pro Val Asp Lys Arg Thr Ala Leu Thr Tyr Ile Asp Gly Ser Gly
                405                 410                 415
aac tgg cac aga gtc agt aaa ggt gct cct gag cag atc ctc gaa ctt    1296
Asn Trp His Arg Val Ser Lys Gly Ala Pro Glu Gln Ile Leu Glu Leu
            420                 425                 430
gcc aaa gcc agc aat gat ctt agc aag aag gtg ctc tcc att att gac    1344
Ala Lys Ala Ser Asn Asp Leu Ser Lys Lys Val Leu Ser Ile Ile Asp
        435                 440                 445
aag tat gct gag cgt ggt ctt agg tcg ttg gct gtt gct cgc cag gtg    1392
Lys Tyr Ala Glu Arg Gly Leu Arg Ser Leu Ala Val Ala Arg Gln Val
    450                 455                 460
gtg cca gag aaa aca aag gaa agc cca ggt gcg cca tgg gaa ttt gtt    1440
Val Pro Glu Lys Thr Lys Glu Ser Pro Gly Ala Pro Trp Glu Phe Val
465                 470                 475                 480
ggc ttg ttg cca ctt ttt gat ccc cca aga cat gac agt gct gaa aca    1488
Gly Leu Leu Pro Leu Phe Asp Pro Pro Arg His Asp Ser Ala Glu Thr
                485                 490                 495
att cga cgg gct ttg aat ctt ggt gtt aac gtc aag atg atc act ggt    1536
Ile Arg Arg Ala Leu Asn Leu Gly Val Asn Val Lys Met Ile Thr Gly
            500                 505                 510
gac caa ctt gct att ggt aag gaa act ggt cgc aga ctt gga atg gga    1584
Asp Gln Leu Ala Ile Gly Lys Glu Thr Gly Arg Arg Leu Gly Met Gly
        515                 520                 525
aca aac atg tat cca tct tcg gct ctt ctt ggt aca cac aaa gac gca    1632
Thr Asn Met Tyr Pro Ser Ser Ala Leu Leu Gly Thr His Lys Asp Ala
    530                 535                 540
aac ctc gca tcc att cct gtt gag gag ttg att gaa aag gct gat gga    1680
Asn Leu Ala Ser Ile Pro Val Glu Glu Leu Ile Glu Lys Ala Asp Gly
545                 550                 555                 560
ttt gcc gga gtc ttc cca gag cac aaa tac gaa att gtg aaa aag ttg    1728
Phe Ala Gly Val Phe Pro Glu His Lys Tyr Glu Ile Val Lys Lys Leu
                565                 570                 575
cag gag agg aag cat att gtt gga atg act ggt gat ggt gtc aat gat    1776
Gln Glu Arg Lys His Ile Val Gly Met Thr Gly Asp Gly Val Asn Asp
            580                 585                 590
gcc cct gct cta aag aaa gct gat atc ggt att gct gtt gct gat gct    1824
Ala Pro Ala Leu Lys Lys Ala Asp Ile Gly Ile Ala Val Ala Asp Ala
        595                 600                 605
aca gat gct gct cgt ggt gct tca gat atc gtg ctc act gag cct gga    1872
Thr Asp Ala Ala Arg Gly Ala Ser Asp Ile Val Leu Thr Glu Pro Gly
    610                 615                 620
ctc agc gtt att atc agt gct gtt ctc acc agc aga gct att ttc cag    1920
Leu Ser Val Ile Ile Ser Ala Val Leu Thr Ser Arg Ala Ile Phe Gln
625                 630                 635                 640
aga atg aag aac tat act atc tat gca gtc tca atc acc atc cgt att    1968
Arg Met Lys Asn Tyr Thr Ile Tyr Ala Val Ser Ile Thr Ile Arg Ile
                645                 650                 655
gtg ttt ggt ttc atg ctt att gct ttg ata tgg gaa ttt gac ttc tca    2016
Val Phe Gly Phe Met Leu Ile Ala Leu Ile Trp Glu Phe Asp Phe Ser
            660                 665                 670
gcc ttc atg gtt ctg atc att gcc att ctt aac gac ggt acc atc atg    2064
Ala Phe Met Val Leu Ile Ile Ala Ile Leu Asn Asp Gly Thr Ile Met
        675                 680                 685
aca atc tca aag gac aga gtt aag cca tct ccc aca cct gat agc tgg    2112
Thr Ile Ser Lys Asp Arg Val Lys Pro Ser Pro Thr Pro Asp Ser Trp
    690                 695                 700
aaa ctt aaa gaa att ttt gct act gga gtc gtt cta gga ggc tac cag    2160
Lys Leu Lys Glu Ile Phe Ala Thr Gly Val Val Leu Gly Gly Tyr Gln
705                 710                 715                 720
gcc atc atg act gtt att ttc ttc tgg gcg gcg cac aag act gac ttt    2208
Ala Ile Met Thr Val Ile Phe Phe Trp Ala Ala His Lys Thr Asp Phe
                725                 730                 735
ttc tcg gac aca ttc ggt gtg agg tcc att agg gac aat aac cac gag    2256
Phe Ser Asp Thr Phe Gly Val Arg Ser Ile Arg Asp Asn Asn His Glu
            740                 745                 750
cta atg ggt gcg gtg tac tta caa gtt agt atc att agt caa gct ctg    2304
Leu Met Gly Ala Val Tyr Leu Gln Val Ser Ile Ile Ser Gln Ala Leu
        755                 760                 765
atc ttc gtc aca aga tca agg agt tgg tct ttt gtt gaa cgt cct gga    2352
Ile Phe Val Thr Arg Ser Arg Ser Trp Ser Phe Val Glu Arg Pro Gly
    770                 775                 780
gca ttg ctg atg att gct ttc ctc att gca caa ctg att gct act ttg    2400
Ala Leu Leu Met Ile Ala Phe Leu Ile Ala Gln Leu Ile Ala Thr Leu
785                 790                 795                 800
att gcg gtt tac gcc aac tgg gaa ttt gca aag att agg ggt att gga    2448
Ile Ala Val Tyr Ala Asn Trp Glu Phe Ala Lys Ile Arg Gly Ile Gly
                805                 810                 815
tgg gga tgg gct ggt gtg atc tgg cta tac agt att gtc aca tac ttc    2496
Trp Gly Trp Ala Gly Val Ile Trp Leu Tyr Ser Ile Val Thr Tyr Phe
            820                 825                 830
cca ttg gac gtt ttc aag ttt gcc att cga tac atc ttg agc gga aag    2544
Pro Leu Asp Val Phe Lys Phe Ala Ile Arg Tyr Ile Leu Ser Gly Lys
        835                 840                 845
gcg tgg ctc aac ttg ttt gag aac aag acg gct ttc acg atg aag aaa    2592
Ala Trp Leu Asn Leu Phe Glu Asn Lys Thr Ala Phe Thr Met Lys Lys
    850                 855                 860
gat tac gga aaa gaa gag aga gag gct caa tgg gca ctt gct caa agg    2640
Asp Tyr Gly Lys Glu Glu Arg Glu Ala Gln Trp Ala Leu Ala Gln Arg
865                 870                 875                 880
aca ctt cac ggt tta cag cca aaa gaa gct gtt aac atc ttc cct gag    2688
Thr Leu His Gly Leu Gln Pro Lys Glu Ala Val Asn Ile Phe Pro Glu
                885                 890                 895
aaa gga agt tac aga gaa ttg tct gag atc gct gag caa gct aag aga    2736
Lys Gly Ser Tyr Arg Glu Leu Ser Glu Ile Ala Glu Gln Ala Lys Arg
            900                 905                 910
aga gct gag atc gct agg ctt agg gag ctg cac aca ctc aag gga cat    2784
Arg Ala Glu Ile Ala Arg Leu Arg Glu Leu His Thr Leu Lys Gly His
        915                 920                 925
gtg gaa tca gtc gtg aag cta aag ggc ttg gac att gaa act ccc agt    2832
Val Glu Ser Val Val Lys Leu Lys Gly Leu Asp Ile Glu Thr Pro Ser
    930                 935                 940
cac tac act gtg ctc gag gtg cgc ttc cag atg agt aaa gga gaa gaa    2880
His Tyr Thr Val Leu Glu Val Arg Phe Gln Me tSer Lys Gly Glu Glu
945                 950                 955                 960
ctt ttc act gga gtt gtc cca att ctt gtt gaa tta gat ggt gat gtt    2928
Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val
                965                 970                 975
aat ggg cac aaa ttt tct gtc agt gga gag ggt gaa ggt gat gca aca    2976
Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr
            980                 985                 990
tac gga aaa ctt acc ctt aaa ttt att tgc act act gga aaa cta cct    3024
Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro
        995                1000                1005
gtt cca tgg cca aca ctt gtc act act ttc tct tat ggt gtt caa tgc    3072
Val Pro Trp Pro Thr Leu Val Thr Thr Phe Ser Tyr Gly Val Gln Cys
   1010                1015                1020
ttt tca aga tac cca gat cat atg aag cgg cac gac ttc ttc aag agc    3120
Phe Ser Arg Tyr Pro Asp His Met Lys Arg His Asp Phe Phe Lys Ser
1025               1030                1035                1040
gcc atg cct gag gga tac gtg cag gag agg acc atc tct ttc aag gac    3168
Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp
               1045                1050                1055
gac ggg aac tac aag aca cgt gct gaa gtc aag ttt gag gga gac acc    3216
Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr
           1060                1065                1070
ctc gtc aac agg atc gag ctt aag gga atc gat ttc aag gag gac gga    3264
Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly
       1075                1080                1085
aac atc ctc ggc cac aag ttg gaa tac aac tac aac tcc cac aac gta    3312
Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val
   1090                1095                1100
tac atc acg gca gac aaa caa aag aat gga atc aaa gct aac ttc aaa    3360
Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys
1105               1110                1115                1120
att aga cac aac att gaa gat gga agc gtt caa cta gca gac cat tat    3408
Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr
               1125                1130                1135
caa caa aat act cca att ggc gat ggc cct gtc ctt tta cca gac aac    3456
Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn
           1140                1145                1150
cat tac ctg tcc aca caa tct gcc ctt tcg aaa gat ccc aac gaa aag    3504
His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys
       1155                1160                1165
aga gac cac atg gtc ctt ctt gag ttt gta aca gct gct ggg att aca    3552
Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr
   1170                1175                1180
cat ggc atg gat gaa cta tac aaa       taa                          3579
His Gly Met Asp Glu Leu Tyr Lys
1185               1190
<210>54
<211>1192
<212>PRT
<213>人工序列
<400>54
Met Ser Ser Leu Glu Asp Ile Lys Asn Glu Thr Val Asp Leu Glu Lys
  1               5                  10                  15
Ile Pro Ile Glu Glu Val Phe Gln Gln Leu Lys Cys Ser Arg Glu Gly
             20                  25                  30
Leu Thr Thr Gln Glu Gly Glu Asp Arg Ile Gln Ile Phe Gly Pro Asn
         35                  40                  45
Lys Leu Glu Glu Lys Lys Glu Ser Lys Leu Leu Lys Phe Leu Gly Phe
     50                  55                  60
Met Trp Asn Pro Leu Ser Trp Val Met Glu Met Ala Ala Ile Met Ala
 65                  70                  75                  80
Ile Ala Leu Ala Asn Gly Asp Gly Arg Pro Pro Asp Trp Gln Asp Phe
                 85                  90                  95
Val Gly Ile Ile Cys Leu Leu Val Ile Asn Ser Thr Ile Ser Phe Ile
            100                 105                 110
Glu Glu Asn Asn Ala Gly Asn Ala Ala Ala Ala Leu Met Ala Gly Leu
        115                 120                 125
Ala Pro Lys Thr Lys Val Leu Arg Asp Gly Lys Trp Ser Glu Gln Glu
    130                 135                 140
Ala Ala Ile Leu Val Pro Gly Asp Ile Val Ser Ile Lys Leu Gly Asp
145                 150                 155                 160
Ile Ile Pro Ala Asp Ala Arg Leu Leu Glu Gly Asp Pro Leu Lys Val
                165                 170                 175
Asp Gln Ser Ala Leu Thr Gly Glu Ser Leu Pro Val Thr Lys His Pro
            180                 185                 190
Gly Gln Glu Val Phe Ser Gly Ser Thr Cys Lys Gln Gly Glu Ile Glu
        195                 200                 205
Ala Val Val Ile Ala Thr Gly Val His Thr Phe Phe Gly Lys Ala Ala
    210                 215                 220
His Leu Val Asp Ser Thr Asn Gln Val Gly His Phe Gln Lys Val Leu
225                 230                 235                 240
Thr Ala Ile Gly Asn Phe Cys Ile Cys Ser Ile Ala Ile Gly Met Val
                245                 250                 255
Ile Glu Ile Ile Val Met Tyr Pro Ile Gln Arg Arg Lys Tyr Arg Asp
            260                 265                 270
Gly Ile Asp Asn Leu Leu Val Leu Leu Ile Gly Gly Ile Pro Ile Ala
        275                 280                 285
Met Pro Thr Val Leu Ser Val Thr Met Ala Ile Gly Ser His Arg Leu
    290                 295                 300
Ser Gln Gln Gly Ala Ile Thr Lys Arg Met Thr Ala Ile Glu Glu Met
305                 310                 315                 320
Ala Gly Met Asp Val Leu Cys Ser Asp Lys Thr Gly Thr Leu Thr Leu
                325                 330                 335
Asn Lys Leu Ser Val Asp Lys Asn Leu Val Glu Val Phe Cys Lys Gly
            340                 345                 350
Val Glu Lys Asp Gln Val Leu Leu Phe Ala Ala Met Ala Ser Arg Val
        355                 360                 365
Glu Asn Gln Asp Ala Ile Asp Ala Ala Met Val Gly Met Leu Ala Asp
    370                 375                 380
Pro Lys Glu Ala Arg Ala Gly Ile Arg Glu Val His Phe Leu Pro Phe
385                 390                 395                 400
Asn Pro Val Asp Lys Arg Thr Ala Leu Thr Tyr Ile Asp Gly Ser Gly
                405                 410                 415
Asn Trp His Arg Val Ser Lys Gly Ala Pro Glu Gln Ile Leu Glu Leu
            420                 425                 430
Ala Lys Ala Ser Asn Asp Leu Ser Lys Lys Val Leu Ser Ile Ile Asp
        435                 440                 445
Lys Tyr Ala Glu Arg Gly Leu Arg Ser Leu Ala Val Ala Arg Gln Val
    450                 455                 460
Val Pro Glu Lys Thr Lys Glu Ser Pro Gly Ala Pro Trp Glu Phe Val
465                 470                 475                 480
Gly Leu Leu Pro Leu Phe Asp Pro Pro Arg His Asp Ser Ala Glu Thr
                485                 490                 495
Ile Arg Arg Ala Leu Asn Leu Gly Val Asn Val Lys Met Ile Thr Gly
            500                 505                 510
Asp Gln Leu Ala Ile Gly Lys Glu Thr Gly Arg Arg Leu Gly Met Gly
        515                 520                 525
Thr Asn Met Tyr Pro Ser Ser Ala Leu Leu Gly Thr His Lys Asp Ala
    530                 535                 540
Asn Leu Ala Ser Ile Pro Val Glu Glu Leu Ile Glu Lys Ala Asp Gly
545                 550                 555                 560
Phe Ala Gly Val Phe Pro Glu His Lys Tyr Glu Ile Val Lys Lys Leu
                565                 570                 575
Gln Glu Arg Lys His Ile Val Gly Met Thr Gly Asp Gly Val Asn Asp
            580                 585                 590
Ala Pro Ala Leu Lys Lys Ala Asp Ile Gly Ile Ala Val Ala Asp Ala
        595                 600                 605
Thr Asp Ala Ala Arg Gly Ala Ser Asp Ile Val Leu Thr Glu Pro Gly
    610                 615                 620
Leu Ser Val Ile Ile Ser Ala Val Leu Thr Ser Arg Ala Ile Phe Gln
625                 630                 635                 640
Arg Met Lys Asn Tyr Thr Ile Tyr Ala Val Ser Ile Thr Ile Arg Ile
                645                 650                 655
Val Phe Gly Phe Met Leu Ile Ala Leu Ile Trp Glu Phe Asp Phe Ser
            660                 665                 670
Ala Phe Met Val Leu Ile Ile Ala Ile Leu Asn Asp Gly Thr Ile Met
        675                 680                 685
Thr Ile Ser Lys Asp Arg Val Lys Pro Ser Pro Thr Pro Asp Ser Trp
    690                 695                 700
Lys Leu Lys Glu Ile Phe Ala Thr Gly Val Val Leu Gly Gly Tyr Gln
705                 710                 715                 720
Ala Ile Met Thr Val Ile Phe Phe Trp Ala Ala His Lys Thr Asp Phe
                725                 730                 735
Phe Ser Asp Thr Phe Gly Val Arg Ser Ile Arg Asp Asn Asn His Glu
            740                 745                 750
Leu Met Gly Ala Val Tyr Leu Gln Val Ser Ile Ile Ser Gln Ala Leu
        755                 760                 765
Ile Phe Val Thr Arg Ser Arg Ser Trp Ser Phe Val Glu Arg Pro Gly
    770                 775                 780
Ala Leu Leu Met Ile Ala Phe Leu Ile Ala Gln Leu Ile Ala Thr Leu
785                 790                 795                 800
Ile Ala Val Tyr Ala Asn Trp Glu Phe Ala Lys Ile Arg Gly Ile Gly
                805                 810                 815
Trp Gly Trp Ala Gly Val Ile Trp Leu Tyr Ser Ile Val Thr Tyr Phe
            820                 825                 830
Pro Leu Asp Val phe Lys Phe Ala Ile Arg Tyr Ile Leu Ser Gly Lys
        835                 840                 845
Ala Trp Leu Asn Leu Phe Glu Asn Lys Thr Ala Phe Thr Met Lys Lys
    850                 855                 860
Asp Tyr Gly Lys Glu Glu Arg Glu Ala Gln Trp Ala Leu Ala Gln Arg
865                 870                 875                 880
Thr Leu His Gly Leu Gln Pro Lys Glu Ala Val Asn Ile Phe Pro Glu
                885                 890                 895
Lys Gly Ser Tyr Arg Glu Leu Ser Glu Ile Ala Glu Gln Ala Lys Arg
            900                 905                 910
Arg Ala Glu Ile Ala Arg Leu Arg Glu Leu His Thr Leu Lys Gly His
        915                 920                 925
Val Glu Ser Val Val Lys Leu Lys Gly Leu Asp Ile Glu Thr Pro Ser
    930                 935                 940
His Tyr Thr Val Leu Glu Val Arg Phe Gln Met Ser Lys Gly Glu Glu
945                 950                 955                 960
Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val
                965                 970                 975
Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr
            980                 985                 990
Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro
        995                1000                1005
Val Pro Trp Pro Thr Leu Val Thr Thr Phe Ser Tyr Gly Val Gln Cys
   1010                1015                1020
Phe Ser Arg Tyr Pro Asp His Met Lys Arg His Asp Phe Phe Lys Ser
1025               1030                1035                1040
Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp
               1045                1050                1055
Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr
           1060                1065               1070
Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly
       1075                1080                1085
Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val
   1090                1095                1100
Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys
1105               1110                1115                1120
Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr
               1125                1130                1135
Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn
           1140                1145                1150
His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys
       1155                1160                1165
Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr
   1170                1175                1180
His Gly Met Asp Glu Leu Tyr Lys
1185               1190
<210>55
<211>303
<212>DNA
<213>人类免疫缺陷病毒型1
<220>
<221>基因
<222>(1)..(303)
<223>HIV蛋白基因
<220>
<221>CDS
<222>(1)..(300)
<223>HIV-1蛋白酶
<300>
<308>GenBank/U31398
<309>1996-03-07
<400>55
atg cct cag gtc act ctt tgg caa cga ccc ctc gtc aca ata aag ata    48
Met Pro Gln Val Thr Leu Trp Gln Arg Pro Leu Val Thr Ile Lys Ile
  1               5                  10                  15
ggg ggg caa cta aag gaa gct cta tta gat aca gga gca gat gat aca    96
Gly Gly Gln Leu Lys Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr
             20                  25                  30
gta tta gaa gaa atg agt ttg cca gga aga tgg aaa cca aaa atg ata    144
Val Leu Glu Glu Met Ser Leu Pro Gly Arg Trp Lys Pro Lys Met Ile
         35                  40                  45
ggg gga att gga ggt ttt atc aaa gta aga cag tat gat cag ata ctc    192
Gly Gly Ile Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Gln Ile Leu
     50                  55                  60
ata gaa atc tgt gga cat aaa gct ata ggt aca gta tta gta gga cct    240
Ile Glu Ile Cys Gly His Lys Ala Ile Gly Thr Val Leu Val Gly Pro
 65                  70                  75                  80
aca cct gtc aac ata att gga aga aat ctg ttg act cag att ggt tgc    288
Thr Pro Val Asn Ile Ile Gly Arg Asn Leu Leu Thr Gln Ile Gly Cys
                 85                  90                  95
act tta aat ttt       tga                                          303
Thr Leu Asn Phe
            100
<210>56
<211>100
<212>PRT
<213>人类免疫缺陷病毒型1
<400>56
Met Pro Gln Val Thr Leu Trp Gln Arg Pro Leu Val Thr Ile Lys Ile
  1               5                  10                  15
Gly Gly Gln Leu Lys Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr
             20                  25                  30
Val Leu Glu Glu Met Ser Leu Pro Gly Arg Trp Lys Pro Lys Met Ile
         35                  40                  45
Gly Gly Ile Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Gln Ile Leu
     50                  55                  60
Ile Glu Ile Cys Gly His Lys Ala Ile Gly Thr Val Leu Val Gly Pro
 65                  70                  75                  80
Thr Pro Val Asn Ile Ile Gly Arg Asn Leu Leu Thr Gln Ile Gly Cys
                 85                  90                  95
Thr Leu Asn Phe
            100
<210>57
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(21)
<223>HIV-1蛋白酶切割序列
<400>57
agc caa aat tac cct ata gtg                                        21
Ser Gln Asn Tyr Pro Ile Val
  1               5
<210>58
<211>7
<212>PRT
<213>人工序列
<400>58
Ser Gln Asn Tyr Pro Ile Val
  1               5
<210>59
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(21)
<223>HIV-1蛋白酶切割序列
<400>59
gca aga gtt ttg gct gaa gca                                            21
Ala Arg Val Leu Ala Glu Ala
  1               5
<210>60
<211>7
<212>PRT
<213>人工序列
<400>60
Ala Arg Val Leu Ala Glu Ala
  1               5
<210>61
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(21)
<223>HIV-1蛋白酶切割序列
<400>61
gct acc ata atg atg cag aga                                            21
Ala Thr Ile Met Met Gln Arg
  1               5
<210>62
<211>7
<212>PRT
<213>人工序列
<400>62
Ala Thr Ile Met Met Gln Arg
  1               5
<210>63
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(21)
<223>HIV-1蛋白酶切割序列
<400>63
aga cag gct aat ttt tta ggg                                            21
Arg Gln Ala Asn Phe Leu Gly
  1               5
<210>64
<211>7
<212>PRT
<213>人工序列
<400>64
Arg Gln Ala Asn Phe Leu Gly
  1               5
<210>65
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(21)
<223>HIV-1蛋白酶切割序列
<400>65
cca ggg aat ttt ctt cag agc                                                21
Pro Gly Asn Phe Leu Gln Ser
  1               5
<210>66
<211>7
<212>PRT
<213>人工序列
<400>66
Pro Gly Asn Phe Leu Gln Ser
  1               5
<210>67
<211>15
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(15)
<223>HIV-1蛋白酶切割序列
<400>67
agc gtg cct caa ata                                                15
Ser Val Pro Gln Ile
  1               5
<210>68
<211>5
<212>PRT
<213>人工序列
<400>68
Ser Val Pro Gln Ile
  1               5
<210>69
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(21)
<223>HIV-1蛋白酶切割序列
<400>69
act tta aat ttt ccc att agc                                                21
Thr Leu Asn Phe Pro Ile Ser
  1               5
<210>70
<211>7
<212>PRT
<213>人工序列
<400>70
Thr Leu Asn Phe Pro Ile Ser
  1               5
<210>71
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(21)
<223>HIV-1蛋白酶切割序列
<400>71
gca gaa acc ttc tat gta gat                                                21
Ala Glu Thr Phe Tyr Val Asp
  1               5
<210>72
<211>7
<212>PRT
<213>人工序列
<400>72
Ala Glu Thr Phe Tyr Val Asp
  1               5
<210>73
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(21)
<223>HIV-1蛋白酶切割序列
<400>73
agg aaa gta cta ttt tta gat                                                21
Arg Lys Val Leu Phe Leu Asp
  1               5
<210>74
<211>7
<212>PRT
<213>人工序列
<400>74
Arg Lys Val Leu Phe Leu Asp
  1               5
<210>75
<211>1647
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>基因
<222>(1)..(1647)
<223>RFP:PS(HIV-1蛋白酶):AtOEP7:GFP杂合蛋白基因
<220>
<221>CDS
<222>(1)..(1644)
<223>RFP:PS(HIV-1蛋白酶):AtOEP7:GFP杂合蛋白
<220>
<221>misc_特征
<222>(1)..(1647)
<223>CDS:RFP(1..678)+ADs-CDS:HIV-1蛋白酶水解位点(700..720)+ADs-
CDS:AtOEP7(721..909)+ADs-CDS:GFP(931..1644)
<400>75
atg gtg cgc tcc tcc aag aac gtc atc aag gag ttc atg cgc ttc aag    48
Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys
  1               5                  10                  15
gtg cgc atg gag ggc acc gtg aac ggc cac gag ttc gag atc gag ggc    96
Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly
             20                  25                  30
gag ggc gag ggc cgc ccc tac gag ggc cac aac acc gtg aag ctg aag    144
Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys
         35                  40                  45
gtg acc aag ggc ggc ccc ctg ccc ttc gcc tgg gac atc ctg tcc ccc    192
Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro
     50                  55                  60
cag ttc cag tac ggc tcc aag gtg tac gtg aag cac ccc gcc gac atc    240
Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile
 65                  70                  75                  80
ccc gac tac aag aag ctg tcc ttc ccc gag ggc ttc aag tgg gag cgc    288
Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg
                 85                  90                  95
gtg atg aac ttc gag gac ggc ggc gtg gtg acc gtg acc cag gac tcc    336
Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser
            100                 105                 110
tcc ctg cag gac ggc tgc ttc atc tac aag gtg aag ttc atc ggc gtg    384
Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val
        115                 120                 125
aac ttc ccc tcc gac ggc ccc gta atg cag aag aag acc atg ggc tgg    432
Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp
    130                 135                 140
gag gcc tcc acc gag cgc ctg tac ccc cgc gac ggc gtg ctg aag ggc    480
Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly
145                 150                 155                 160
gag atc cac aag gcc ctg aag ctg aag gac ggc ggc cac tac ctg gtg    528
Glu Ile His Lys Ala Leu Lys Leu Lys AsP Gly Gly His Tyr Leu Val
                165                 170                 175
gag ttc aag tcc atc tac atg gcc aag aag ccc gtg cag ctg ccc ggc    576
Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly
            180                 185                 190
tac tac tac gtg gac tcc aag ctg gac atc acc tcc cac aac gag gac    624
Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp
        195                 200                 205
tac acc atc gtg gag cag tac gag cgc acc gag ggc cgc cac cac ctg    672
Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu
    210                 215                 220
ttc ctg ccc cgg gca atc aag ctg ggt aga cag gct aat ttt tta ggg    720
Phe Leu Pro Arg Ala Ile Lys Leu Gly Arg Gln Ala Asn Phe Leu Gly
225                 230                 235                 240
gga aaa act tcg gga gcg aaa cag gcg act gtg gtg gtc gca gcg atg    768
Gly Lys Thr Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala Met
                245                 250                 255
gcg tta gga tgg tta gcc ata gag atc gct ttc aag cct ttc ctc gat    816
Ala Leu Gly Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu Asp
            260                 265                 270
aaa ttc cgc tcc tca atc gac aaa tct gac cca acc aaa gac ccc gat    864
Lys Phe Arg Ser Ser Ile Asp Lys Ser Asp Pro Thr Lys Asp Pro Asp
        275                 280                 285
gac ttc gac acc gcc gct act gca acc aca tcc aaa gag ggt ttg ggg    912
Asp Phe Asp Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu Gly
    290                 295                 300
atc caa gga gat ata aca atg agt aaa gga gaa gaa ctt ttc act gga    960
Ile Gln Gly Asp Ile Thr Met Ser Lys Gly Glu Glu Leu Phe Thr Gly
305                 310                 315                 320
gtt gtc cca att ctt gtt gaa tta gat ggt gat gtt aat ggg cac aaa    1008
Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys
                325                 330                 335
ttt tct gtc agt gga gag ggt gaa ggt gat gca aca tac gga aaa ctt    1056
Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu
            340                 345                 350
acc ctt aaa ttt att tgc act act gga aaa cta cct gtt cca tgg cca    1104
Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro
        355                 360                 365
aca ctt gtc act act ttc tct tat ggt gtt caa tgc ttt tca aga tac    1152
Thr Leu Val Thr Thr Phe Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr
    370                 375                 380
cca gat cat atg aag cgg cac gac ttc ttc aag agc gcc atg cct gag    1200
Pro Asp His Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu
385                 390                 395                 400
gga tac gtg cag gag agg acc atc tct ttc aag gac gac ggg aac tac    1248
Gly Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Asn Tyr
                405                 410                 415
aag acs cgt gct gaa gtc aag ttt gag gga gac acc ctc gtc aac agg    1296
Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg
            420                 425                 430
atc gag ctt aag gga atc gat ttc aag gag gac gga aac atc ctc ggc    1344
Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly
        435                 440                 445
cac aag ttg gaa tac aac tac aac tcc cac aac gta tac atc acg gca    1392
His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala
    450                 455                 460
gac aaa caa aag aat gga atc aaa gct aac ttc aaa att aga cac aac    1440
Asp Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn
465                 470                 475                 480
att gaa gat gga agc gtt caa cta gca gac cat tat caa caa aat act    1488
Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr
                485                 490                 495
cca att ggc gat ggc cct gtc ctt tta cca gac aac cat tac ctg tcc    1536
Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser
            500                 505                 510
aca caa tct gcc ctt tcg aaa gat ccc aac gaa aag aga gac cac atg    1584
Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met
        515                 520                 525
gtc ctt ctt gag ttt gta aca gct gct ggg att aca cat ggc atg gat    1632
Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp
    530                 535                 540
gaa cta tac aaa          taa                                       1647
Glu Leu Tyr Lys
545
<210>76
<211>548
<212>PRT
<213>人工序列
<400>76
Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys
  1               5                  10                  15
Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly
             20                  25                  30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys
         35                  40                  45
Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro
     50                  55                  60
Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile
 65                  70                  75                  80
Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg
                 85                  90                  95
Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser
            100                 105                 110
Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val
        115                 120                 125
Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp
    130                 135                 140
Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly
145                 150                 155                 160
Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val
                165                 170                 175
Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly
            180                 185                 190
Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp
        195                 200                 205
Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu
    210                 215                 220
Phe Leu Pro Arg Ala Ile Lys Leu Gly Arg Gln Ala Asn Phe Leu Gly
225                 230                 235                 240
Gly Lys Thr Ser Gly Ala Lys Gln Ala Thr Val Val Val Ala Ala Met
                245                 250                 255
Ala Leu Gly Trp Leu Ala Ile Glu Ile Ala Phe Lys Pro Phe Leu Asp
            260                 265                 270
Lys Phe Arg Ser Ser Ile Asp Lys Ser Asp Pro Thr Lys Asp Pro Asp
        275                 280                 285
Asp Phe Asp Thr Ala Ala Thr Ala Thr Thr Ser Lys Glu Gly Leu Gly
    290                 295                 300
Ile Gln Gly Asp Ile Thr Met Ser Lys Gly Glu Glu Leu Phe Thr Gly
305                 310                 315                 320
Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys
                325                 330                 335
Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu
            340                 345                 350
Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro
        355                 360                 365
Thr Leu Val Thr Thr Phe Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr
    370                 375                 380
Pro Asp His Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu
385                 390                 395                 400
Gly Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Asn Tyr
                405                 410                 415
Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg
            420                 425                 430
Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly
        435                 440                 445
His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala
    450                 455                 460
Asp Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn
465                 470                 475                 480
Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr
                485                 490                 495
Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser
            500                 505                 510
Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met
        515                 520                 525
Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp
    530                 535                 540
Glu Leu Tyr Lys
545
<210>77
<211>1893
<212>DNA
<213>丙肝病毒
<220>
<221>CDS
<222>(1)..(1893)
<223>HCV NS3蛋白酶
<300>
<308>GenBank/D16435
<309>2000-02-01
<400>77
gcg cct atc acg gcc tat tcc caa caa acg cgg ggc ctg ctt ggc tgt    48
Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly Cys
  1               5                  10                  15
atc atc act agc ctc aca ggt cgg gac aag aac cag gtc gat ggg gag    96
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Asp Gly Glu
             20                  25                  30
gtt cag gtg ctc tcc acc gca acg caa tct ttc ctg gcg acc tgc gtc    144
Val Gln Val Leu Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys Val
         35                  40                  45
aat ggc gtg tgt tgg acc gtc tac cat ggt gcc ggc tcg aag acc ctg    192
Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr Leu
     50                  55                  60
gcc ggc ccg aag ggt cca atc acc caa atg tac acc aat gta gac cag    240
Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp Gln
 65                  70                  75                  80
gac ctc gtc ggc tgg ccg gcg ccc ccc ggg gcg cgc tcc atg aca ccg    288
Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Ala Arg Ser Met Thr Pro
                 85                  90                  95
tgc acc tgc ggc agc tcg gac ctt tac ttg gtc acg agg cat gcc gat    336
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
            100                 105                 110
gtc att ccg gtg cgc cgg cga ggc gac agc agg ggg agt cta ctc tcc    384
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
        115                 120                 125
cct agg ccc gtc tcc tac ctg aag ggc tcc tcg ggt gga cca ctg ctt    432
Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
    130                 135                 140
tgc cct tcg ggg cac gtt gta ggc atc ttc cgg gct gct gtg tgc acc    480
Cys Pro Ser Gly His Val Val Gly Ile Phe Arg Ala Ala Val Cys Thr
145                 150                 155                 160
cgg ggg gtt gcg aag gcg gtg gac ttc ata ccc gtt gag tct atg gaa    528
Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Met Glu
                165                 170                 175
act acc atg cgg tct ccg gtc ttc aca gac aac tca tcc cct ccg gcc    576
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala
            180                 185                 190
gta ccg caa aca ttc caa gtg gca cat tta cac gct ccc act ggc agc    624
Val Pro Gln Thr Phe Gln Val Ala His Leu His Ala Pro Thr Gly Ser
        195                 200                 205
ggc aag agc acc aaa gtg ccg gct gca tat gca gcc caa ggg tac aag    672
Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr Lys
    210                 215                 220
gtg ctc gtc cta aac ccg tcc gtt gct gcc aca ttg ggc ttt gga gcg    720
Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Ala
225                 230                 235                 240
tat atg tcc aag gca cat ggc atc gag cct aac atc aga act ggg gta    768
Tyr Met Ser Lys Ala His Gly Ile Glu Pro Asn Ile Arg Thr Gly Val
                245                 250                 255
agg acc atc acc acg ggc ggc ccc atc acg tac tcc acc tat ggc aag    816
Arg Thr Ile Thr Thr Gly Gly Pro Ile Thr Tyr Ser Thr Tyr Gly Lys
            260                 265                 270
ttc ctt gcc gac ggt gga tgc tcc ggg ggc gcc tat gac atc ata ata    864
Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile
        275                 280                 285
tgt gac gaa tgc cac tca act gac tgg aca acc atc ttg ggc atc ggc    912
Cys Asp Glu Cys His Ser Thr Asp Trp Thr Thr Ile Leu Gly Ile Gly
    290                 295                 300
aca gtc ctg gat cag gca gag acg gct gga gcg cgg ctc gtc gtg ctc    960
Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val Leu
305                 310                 315                 320
gcc acc gcc acg cct ccg gga tcg atc acc gtg cca cac ccc aac atc    1008
Ala Thr Ala Thr Pro Pro Gly Ser Ile Thr Val Pro His Pro Asn Ile
                325                 330                 335
gag gaa gtg gcc ctg tcc aac act ggg gag att ccc ttc tat ggc aaa    1056
Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly Lys
            340                 345                 350
gcc atc ccc att gag gcc atc aag ggg gga agg cat ctc atc ttc tgc    1104
Ala Ile Pro Ile Glu Ala Ile Lys Gly Gly Arg His Leu Ile Phe Cys
        355                 360                 365
cat tcc aag aag aag tgt gac gag ctc gcc gca aag ctg aca ggc ctc    1152
His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Thr Gly Leu
    370                 375                 380
gga ctc aat gct gta gcg tat tac cgg ggt ctc gat gtg tcc gtc ata    1200
Gly Leu Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile
385                 390                 395                 400
ccg act agc gga gac gtc gtt gtc gtg gca aca gac gct cta atg acg    1248
Pro Thr Ser Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met Thr
                405                 410                 415
ggc ttt acc ggc gac ttt gac tca gtg atc gac tgc aac aca tgt gtc    1296
Gly Phe Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys Val
            420                 425                 430
acc cag aca gtc gat ttc agc ttg gat ccc acc ttc acc att gag acg    1344
Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr
        435                 440                 445
aca acc gtg ccc caa gac gcg gtg tcg cgc tcg cag cgg cga ggt agg    1392
Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly Arg
    450                 455                 460
act ggc agg ggc agg agt ggc atc tac agg ttt gtg act cca gga gaa    1440
Thr Gly Arg Gly Arg Ser Gly Ile Tyr Arg Phe Val Thr Pro Gly Glu
465                 470                 475                 480
cgg ccc tca ggc atg ttc gac tcc tcg gtc ctg tgt gag tgc tat gac    1488
Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp
                485                 490                 495
gca ggc tgc gct tgg tat gag ctc acg ccc gct gag act aca gtc agg    1536
Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Val Arg
            500                 505                 510
ttg cgg gct tac ctg aat aca cca ggg ttg ccc gtc tgc cag gac cat    1584
Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp His
        515                 520                 525
ctg gag ttc tgg gaa agc gtc ttc aGa ggc ctc acc cac ata gat gcc    1632
Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp Ala
    530                 535                 540
cac ttc ctg tcc caa acc aag cag gca gga gac aac ttc ccc tac ctg    1680
His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr Leu
545                 550                 555                 560
gtg gca tac caa gcc acg gtg tgc gcc agg gct cag gct cca cct cca    1728
Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro Pro
                565                 570                 575
tcg tgg gat caa atg tgg aag tgt ctc ata cgg ctt aaa cct acg ctg    1776
Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu
            580                 585                 590
cac ggg cca aca ccc ctg ctg tat agg cta gga gcc gtt caa aat gag    1824
His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu
        595                 600                 605
atc acc ctc aca cat ccc ata acc aaa ttc gtc atg gca tgc atg tcg    1872
Ile Thr Leu Thr His Pro Ile Thr Lys Phe Val Met Ala Cys Met Ser
    610                 615                 620
gcc gac ctg gag gtc gtc act                                        1893
Ala Asp Leu Glu Val Val Thr
625                 630
<210>78
<211>631
<212>PRT
<213>丙肝病毒
<400>78
Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly Cys
  1               5                  10                  15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Asp Gly Glu
             20                  25                  30
Val Gln Val Leu Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys Val
         35                  40                  45
Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr Leu
     50                  55                  60
Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp Gln
 65                  70                  75                  80
Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Ala Arg Ser Met Thr Pro
                 85                  90                  95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
            100                 105                 110
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
        115                 120                 125
Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
    130                 135                 140
Cys Pro Ser Gly His Val Val Gly Ile Phe Arg Ala Ala Val Cys Thr
145                 150                 155                 160
Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Met Glu
                165                 170                 175
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala
            180                 185                 190
Val Pro Gln Thr Phe Gln Val Ala His Leu His Ala Pro Thr Gly Ser
        195                 200                 205
Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr Lys
    210                 215                 220
Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Ala
225                 230                 235                 240
Tyr Met Ser Lys Ala His Gly Ile Glu Pro Asn Ile Arg Thr Gly Val
                245                 250                 255
Arg Thr Ile Thr Thr Gly Gly Pro Ile Thr Tyr Ser Thr Tyr Gly Lys
            260                 265                 270
Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile
        275                 280                 285
Cys Asp Glu Cys His Ser Thr Asp Trp Thr Thr Ile Leu Gly Ile Gly
    290                 295                 300
Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val Leu
305                 310                 315                 320
Ala Thr Ala Thr Pro Pro Gly Ser Ile Thr Val Pro His Pro Asn Ile
                325                 330                 335
Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly Lys
            340                 345                 350
Ala Ile Pro Ile Glu Ala Ile Lys Gly Gly Arg His Leu Ile Phe Cys
        355                 360                 365
His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Thr Gly Leu
    370                 375                 380
Gly Leu Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile
385                 390                 395                 400
Pro Thr Ser Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met Thr
                405                 410                 415
Gly Phe Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys Val
            420                 425                 430
Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr
        435                 440                 445
Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly Arg
    450                 455                 460
Thr Gly Arg Gly Arg Ser Gly Ile Tyr Arg Phe Val Thr Pro Gly Glu
465                 470                 475                 480
Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp
                485                 490                 495
Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Thr Val Arg
            500                 505                 510
Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp His
        515                 520                 525
Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp Ala
    530                 535                 540
His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr Leu
545                 550                 555                 560
Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro Pro
                565                 570                 575
Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu
            580                 585                 590
His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu
        595                 600                 605
Ile Thr Leu Thr His Pro Ile Thr Lys Phe Val Met Ala Cys Met Ser
    610                 615                 620
Ala Asp Leu Glu Val Val Thr
625                 630
<210>79
<211>30
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(30)
<223>HCV NS3蛋白酶切割序列
<400>79
gat gaa atg gaa gag tgc gcc tca cac ctc                                    30
Asp Glu Met Glu Glu Cys Ala Ser His Leu
  1               5                  10
<210>80
<211>10
<212>PRT
<213>人工序列
<400>80
Asp Glu Met Glu Glu Cys Ala Ser His Leu
  1               5                  10
<210>81
<211>30
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(30)
<223>HCV NS3蛋白酶切割序列
<400>81
gac tgc tcc acg cca tgc tcc ggc tcg tgg                                    30
Asp Cys Ser Thr Pro Cys Ser Gly Ser Trp
  1               5                  10
<210>82
<211>10
<212>PRT
<213>人工序列
<400>82
Asp Cys Ser Thr Pro Cys Ser Gly Ser Trp
  1               5                  10
<210>83
<211>30
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(30)
<223>HCV NS3蛋白酶切割序列
<400>83
gac gac atc gtc tgc tgc tca atg tcc tac                                        30
Asp Asp Ile Val Cys Cys Ser Met Ser Tyr
  1               5                  10
<210>84
<211>10
<212>PRT
<213>人工序列
<400>84
Asp Asp Ile Val Cys Cys Ser Met Ser Tyr
  1               5                  10
<210>85
<211>1908
<212>DNA
<213>人疱疹病毒1
<220>
<221>基因
<222>(1)..(1908)
<223>HSV-1蛋白酶基因
<220>
<221>CDS
<222>(1)..(1905)
<223>HSV-1蛋白酶
<300>
<308>GenBank/X14112
<309>1997-04-17
<400>85
atg gca gcc gat gcc ccg gga gac cgg atg gag gag ccc ctg ccc gac    48
Met Ala Ala Asp Ala Pro Gly Asp Arg Met Glu Glu Pro Leu Pro Asp
  1               5                  10                  15
agg gcc gtg ccc att tac gtg gct ggg ttt ttg gcc ctg tat gac agc    96
Arg Ala Val Pro Ile Tyr Val Ala Gly Phe Leu Ala Leu Tyr Asp Ser
             20                  25                  30
ggg gac tcg ggc gag ttg gca ttg gat ccg gat acg gtg cgg gcg gcc    144
Gly Asp Ser Gly Glu Leu Ala Leu Asp Pro Asp Thr Val Arg Ala Ala
         35                  40                  45
ctg cct ccg gat aac cca ctc ccg att aac gtg gac cac cgc gct ggc    192
Leu Pro Pro Asp Asn Pro Leu Pro Ile Asn Val Asp His Arg Ala Gly
     50                  55                  60
tgc gag gtg ggg cgg gtg ctg gcc gtg gtc gac gac ccc cgc ggg ccg    240
Cys Glu Val Gly Arg Val Leu Ala Val Val Asp Asp Pro Arg Gly Pro
 65                  70                  75                  80
ttt ttt gtg ggg ctg atc gcc tgc gtg cag ctg gag cgc gtc ctc gag    288
Phe Phe Val Gly Leu Ile Ala Cys Val Gln Leu Glu Arg Val Leu Glu
                 85                  90                  95
acg gcc gcc agc gct gcg att ttc gag cgc cgc ggg ccg ccg ctc tcc    336
Thr Ala Ala Ser Ala Ala Ile Phe Glu Arg Arg Gly Pro Pro Leu Ser
            100                 105                 110
cgg gag gag cgc ctg ttg tac ctg atc acc aac tac ctg ccc tcg gtc    384
Arg Glu Glu Arg Leu Leu Tyr Leu Ile Thr Asn Tyr Leu Pro Ser Val
        115                 120                 125
tcc ctg gcc aca aaa cgc ctg ggg ggc gag gcg cac ccc gat cgc acg    432
Ser Leu Ala Thr Lys Arg Leu Gly Gly Glu Ala His Pro Asp Arg Thr
    130                 135                 140
ctg ttc gcg cac gtc gcg ctg tgc gcg atc ggg cgg cgc ctc ggc act    480
Leu Phe Ala His Val Ala Leu Cys Ala Ile Gly Arg Arg Leu Gly Thr
145                 150                 155                 160
atc gtc acc tac gac acc ggt ctc gac gcc gcc atc gcg ccc ttt cgc    528
Ile Val Thr Tyr Asp Thr Gly Leu Asp Ala Ala Ile Ala Pro Phe Arg
                165                 170                 175
cac ctg tcg ccg gcg tct cgc gag ggg gcg cgg cga ctg gcc gcc gag    576
His Leu Ser Pro Ala Ser Arg Glu Gly Ala Arg Arg Leu Ala Ala Glu
            180                 185                 190
gcc gag ctc gcg ctg tcc ggg cgc acc tgg gcg ccc ggc gtg gag gcg    624
Ala Glu Leu Ala Leu Ser Gly Arg Thr Trp Ala Pro Gly Val Glu Ala
        195                 200                 205
ctg acc cac acg ctg ctt tcc acc gcc gtt aac aac atg atg ctg cgg    672
Leu Thr His Thr Leu Leu Ser Thr Ala Val Asn Asn Met Met Leu Arg
    210                 215                 220
gac cgc tgg agc ctg gtg gcc gag cgg cgg cgg cag gcc ggg atc gcc    720
Asp Arg Trp Ser Leu Val Ala Glu Arg Arg Arg Gln Ala Gly Ile Ala
225                 230                 235                 240
gga cac acc tac ctc cag gcg agc gaa aaa ttc aaa atg tgg ggg gcg    768
Gly His Thr Tyr Leu Gln Ala Ser Glu Lys Phe Lys Met Trp Gly Ala
                245                 250                 255
gag cct gtt tcc gcg ccg gcg cgc ggg tat aag aac ggg gcc ccg gag    816
Glu Pro Val Ser Ala Pro Ala Arg Gly Tyr Lys Asn Gly Ala Pro Glu
            260                 265                 270
tcc acg gac ata ccg ccc ggc tcg atc gct gcc gcg ccg cag ggt gac    864
Ser Thr Asp Ile Pro Pro Gly Ser Ile Ala Ala Ala Pro Gln Gly Asp
        275                 280                 285
cgg tgc cca atc gtc cgt cag cgc ggg gtc gcc ttg tcc ccg gta ctg    912
Arg Cys Pro Ile Val Arg Gln Arg Gly Val Ala Leu Ser Pro Val Leu
    290                 295                 300
ccc ccc atg aac ccc gtt ccg aca tcg ggc acc ccg gcc ccc gcg ccg    960
Pro Pro Met Asn Pro Val Pro Thr Ser Gly Thr Pro Ala Pro Ala Pro
305                 310                 315                 320
ccc ggc gac ggg agc tac ctg tgg atc ccg gcc tcc cat tac aac cag    1008
Pro Gly Asp Gly Ser Tyr Leu Trp Ile Pro Ala Ser His Tyr Asn Gln
                325                 330                 335
ctc gtc gcc ggc cat gcc gcg ccc caa ccc cag ccg cat tcc gcg ttt    1056
Leu Val Ala Gly His Ala Ala Pro Gln Pro Gln Pro His Ser Ala Phe
            340                 345                 350
ggt ttc ccg gct gcg gcg ggg tcc gtg gcc tat ggg cct cac ggt gcg    1104
Gly Phe Pro Ala Ala Ala Gly Ser Val Ala Tyr Gly Pro His Gly Ala
        355                 360                 365
ggt ctt tcc cag cat tac cct ccc cac gtc gcc cat cag tat ccc ggg    1152
Gly Leu Ser Gln His Tyr Pro Pro His Val Ala His Gln Tyr Pro Gly
    370                 375                 380
gtg ctg ttc tcg gga ccc agc cca ctc gag gcg cag ata gcc gcg ttg    1200
Val Leu Phe Ser Gly Pro Ser Pro Leu Glu Ala Gln Ile Ala Ala Leu
385                 390                 395                 400
gtg ggg gcc ata gcc gcg gac cgc cag gcg ggc ggt cag ccg gcc gcg    1248
Val Gly Ala Ile Ala Ala Asp Arg Gln Ala Gly Gly Gln Pro Ala Ala
                405                 410                 415
gga gac cct ggg gtc cgg ggg tcg gga aag cgt cgc cgg tac gag gcg    1296
Gly Asp Pro Gly Val Arg Gly Ser Gly Lys Arg Arg Arg Tyr Glu Ala
            420                 425                 430
ggg ccg tcg gag tcc tac tgc gac cag gac gaa ccg gac gcg gac tac    1344
Gly Pro Ser Glu Ser Tyr Cys Asp Gln Asp Glu Pro Asp Ala Asp Tyr
        435                 440                 445
ccg tac tac ccc ggg gag gct cga ggc gcg ccg cgc ggg gtc gac tcc    1392
Pro Tyr Tyr Pro Gly Glu Ala Arg Gly Ala Pro Arg Gly Val Asp Ser
    450                 455                 460
cgg cgc gcg gcc cgc cat tct ccc ggg acc aac gag acc atc acg gcg    1440
Arg Arg Ala Ala Arg His Ser Pro Gly Thr Asn Glu Thr Ile Thr Ala
465                 470                 475                 480
ctg atg ggg gcg gtg acg tct ctg cag cag gaa ctg gcg cac atg cgg    1488
Leu Met Gly Ala Val Thr Ser Leu Gln Gln Glu Leu Ala His Met Arg
                485                 490                 495
gct cgg acc agc gcc ccc tat gga atg tac acg ccg gtg gcg cac tat    1536
Ala Arg Thr Ser Ala Pro Tyr Gly Met Tyr Thr Pro Val Ala His Tyr
            500                 505                 510
cgc cct cag gtg ggg gag ccg gaa cca aca acg acc cac ccg gcc ctt    1584
Arg Pro Gln Val Gly Glu Pro Glu Pro Thr Thr Thr His Pro Ala Leu
        515                 520                 525
tgt ccc ccg gag gcc gtg tat cgc ccc cca cca cac agc gcc ccc tac    1632
Cys Pro Pro Glu Ala Val Tyr Arg Pro Pro Pro His Ser Ala Pro Tyr
    530                 535                 540
ggt cct ccc cag ggt ccg gcg tcc cat gcc ccc act ccc ccg tat gcc    1680
Gly Pro Pro Gln Gly Pro Ala Ser His Ala Pro Thr Pro Pro Tyr Ala
545                 550                 555                 560
cca gct gcc tgc ccg cca ggc ccg cca ccg ccc cca tgt cct tcc acc    1728
Pro Ala Ala Cys Pro Pro Gly Pro Pro Pro Pro Pro Cys Pro Ser Thr
                565                 570                 575
cag acg cgc gcc cct cta ccg acg gag ccc gcg ttc ccc ccc gcc gcc    1776
Gln Thr Arg Ala Pro Leu Pro Thr Glu Pro Ala Phe Pro Pro Ala Ala
            580                 585                 590
acc gga tcc caa ccg gag gca tcc aac gcg gag gcc ggg gcc ctt gtc    1824
Thr Gly Ser Gln Pro Glu Ala Ser Asn Ala Glu Ala Gly Ala Leu Val
        595                 600                 605
aac gcc agc agc gca gca cac gtg gac gtt gac acg gcc cgc gcc gcc    1872
Asn Ala Ser Ser Ala Ala His Val Asp Val Asp Thr Ala Arg Ala Ala
    610                 615                 620
gat ttg ttc gtc tct cag atg atg ggg gcc cgc      tga               1908
Asp Leu Phe Val Ser Gln Met Met Gly Ala Arg
625                 630                 635
<210>86
<211>635
<212>PRT
<213>人疱疹病毒1
<400>86
Met Ala Ala Asp Ala Pro Gly Asp Arg Met Glu Glu Pro Leu Pro Asp
  1               5                  10                  15
Arg Ala Val Pro Ile Tyr Val Ala Gly Phe Leu Ala Leu Tyr Asp Ser
             20                  25                  30
Gly Asp Ser Gly Glu Leu Ala Leu Asp Pro Asp Thr Val Arg Ala Ala
         35                  40                  45
Leu Pro Pro Asp Asn Pro Leu Pro Ile Asn Val Asp His Arg Ala Gly
     50                  55                  60
Cys Glu Val Gly Arg Val Leu Ala Val Val Asp Asp Pro Arg Gly Pro
 65                  70                  75                  80
Phe Phe Val Gly Leu Ile Ala Cys Val Gln Leu Glu Arg Val Leu Glu
                 85                  90                  95
Thr Ala Ala Ser Ala Ala Ile Phe Glu Arg Arg Gly Pro Pro Leu Ser
            100                 105                 110
Arg Glu Glu Arg Leu Leu Tyr Leu Ile Thr Asn Tyr Leu Pro Ser Val
        115                 120                 125
Ser Leu Ala Thr Lys Arg Leu Gly Gly Glu Ala His Pro Asp Arg Thr
    130                 135                 140
Leu Phe Ala His Val Ala Leu Cys Ala Ile Gly Arg Arg Leu Gly Thr
145                 150                 155                 160
Ile Val Thr Tyr Asp Thr Gly Leu Asp Ala Ala Ile Ala Pro Phe Arg
                165                 170                 175
His Leu Ser Pro Ala Ser Arg Glu Gly Ala Arg Arg Leu Ala Ala Glu
            180                 185                 190
Ala Glu Leu Ala Leu Ser Gly Arg Thr Trp Ala Pro Gly Val Glu Ala
        195                 200                 205
Leu Thr His Thr Leu Leu Ser Thr Ala Val Asn Asn Met Met Leu Arg
    210                 215                 220
Asp Arg Trp Ser Leu Val Ala Glu Arg Arg Arg Gln Ala Gly Ile Ala
225                 230                 235                 240
Gly His Thr Tyr Leu Gln Ala Ser Glu Lys Phe Lys Met Trp Gly Ala
                245                 250                 255
Glu Pro Val Ser Ala Pro Ala Arg Gly Tyr Lys Asn Gly Ala Pro Glu
            260                 265                 270
Ser Thr Asp Ile Pro Pro Gly Ser Ile Ala Ala Ala Pro Gln Gly Asp
        275                 280                 285
Arg Cys Pro Ile Val Arg Gln Arg Gly Val Ala Leu Ser Pro Val Leu
    290                 295                 300
Pro Pro Met Asn Pro Val Pro Thr Ser Gly Thr Pro Ala Pro Ala Pro
305                 310                 315                 320
Pro Gly Asp Gly Ser Tyr Leu Trp Ile Pro Ala Ser His Tyr Asn Gln
                325                 330                 335
Leu Val Ala Gly His Ala Ala Pro Gln Pro Gln Pro His Ser Ala Phe
            340                 345                 350
Gly Phe Pro Ala Ala Ala Gly Ser Val Ala Tyr Gly Pro His Gly Ala
        355                 360                 365
Gly Leu Ser Gln His Tyr Pro Pro His Val Ala His Gln Tyr Pro Gly
    370                 375                 380
Val Leu Phe Ser Gly Pro Ser Pro Leu Glu Ala Gln Ile Ala Ala Leu
385                 390                 395                 400
Val Gly Ala Ile Ala Ala Asp Arg Gln Ala Gly Gly Gln Pro Ala Ala
                405                 410                 415
Gly Asp Pro Gly Val Arg Gly Ser Gly Lys Arg Arg Arg Tyr Glu Ala
            420                 425                 430
Gly Pro Ser Glu Ser Tyr Cys Asp Gln Asp Glu Pro Asp Ala Asp Tyr
        435                 440                 445
Pro Tyr Tyr Pro Gly Glu Ala Arg Gly Ala Pro Arg Gly Val Asp Ser
    450                 455                 460
Arg Arg Ala Ala Arg His Ser Pro Gly Thr Asn Glu Thr Ile Thr Ala
465                 470                 475                 480
Leu Met Gly Ala Val Thr Ser Leu Gln Gln Glu Leu Ala His Met Arg
                485                 490                 495
Ala Arg Thr Ser Ala Pro Tyr Gly Met Tyr Thr Pro Val Ala His Tyr
            500                 505                 510
Arg Pro Gln Val Gly Glu Pro Glu Pro Thr Thr Thr His Pro Ala Leu
        515                 520                 525
Cys Pro Pro Glu Ala Val Tyr Arg Pro Pro Pro His Ser Ala Pro Tyr
    530                 535                 540
Gly Pro Pro Gln Gly Pro Ala Ser His Ala Pro Thr Pro Pro Tyr Ala
545                 550                 555                 560
Pro Ala Ala Cys Pro Pro Gly Pro Pro Pro Pro Pro Cys Pro Ser Thr
                565                 570                 575
Gln Thr Arg Ala Pro Leu Pro Thr Glu Pro Ala Phe Pro Pro Ala Ala
            580                 585                 590
Thr Gly Ser Gln Pro Glu Ala Ser Asn Ala Glu Ala Gly Ala Leu Val
        595                 600                 605
Asn Ala Ser Ser Ala Ala His Val Asp Val Asp Thr Ala Arg Ala Ala
    610                 615                 620
Asp Leu Phe Val Ser Gln Met Met Gly Ala Arg
625                 630                 635
<210>87
<211>15
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(15)
<223>HSV-1蛋白酶切割序列
<220>
<221>misc_特征
<222>(1)..(15)
<223>n=a,g,c,ort;r=a or g;y=c or t
<400>87
ctn gtn ctn gcn agy                                                    15
Xaa Xaa Xaa Xaa Xaa
  1               5
<210>88
<211>5
<212>PRT
<213>人工序列
<400>88
Xaa Xaa Xaa Xaa Xaa
  1               5
<210>89
<211>18
<212>DNA
<213>人工序列
<220>
<223>Synthetic Sequence
<220>
<221>CDS
<222>(1)..(18)
<223>HSV-1蛋白酶切割序列
<220>
<221>misc_特征
<222>(1)..(18)
<223>n+AD0-a,g,c,或t+ADs-y+AD0-c或t
<400>89
ctn gtn ctn gcn agy agy                                                18
Xaa Xaa Xaa Xaa Xaa Xaa
  1               5
<210>90
<211>6
<212>PRT
<213>人工序列
<400>90
Xaa Xaa Xaa Xaa Xaa Xaa
  1               5
<210>91
<211>501
<212>DNA
<213>人嗜T淋巴细胞病毒1
<220>
<221>基因
<222>(1)..(501)
<223>HTLV-1蛋白酶基因
<220>
<221>CDS
<222>(1)..(498)
<223>HTLV-1蛋白酶
<300>
<308>GenBank/L36905
<309>1996-01-18
<400>91
atg aca gtc ctt ccg ata gcc ttg ttc tca agt aat act ccc ctc aga    48
Met Thr Val Leu Pro Ile Ala Leu Phe Ser Ser Asn Thr Pro Leu Arg
  1               5                  10                  15
aat aca tcc gta tta ggg gca ggg ggc caa acc caa gat cac ttt aag    96
Asn Thr Ser Val Leu Gly Ala Gly Gly Gln Thr Gln Asp His Phe Lys
             20                  25                  30
ctc acc tcc ctt cct gta cta ata cgc ctc cct ttc cgg aca acg cct    144
Leu Thr Ser Leu Pro Val Leu Ile Arg Leu Pro Phe Arg Thr Thr Pro
         35                  40                  45
att gtt tta aca tct tgc cta gtt gat acc aaa aac aac tgg gcc atc    192
Ile Val Leu Thr Ser Cys Leu Val Asp Thr Lys Asn Asn Trp Ala Ile
     50                  55                  60
ata ggt cgt gat gcc tta caa caa tgc caa ggc gcc ctg tac ctc cct    240
Ile Gly Arg Asp Ala Leu Gln Gln Cys Gln Gly Ala Leu Tyr Leu Pro
 65                  70                  75                  80
gag gca aaa ggg ccg cct gta atc ttg cca ata cag gcg cca gcc gtc    288
Glu Ala Lys Gly Pro Pro Val Ile Leu Pro Ile Gln Ala Pro Ala Val
                 85                  90                  95
ctt ggg cta gaa cac ctc cca agg ccc ccc gaa atc agc cag ttc cct    336
Leu Gly Leu Glu His Leu Pro Arg Pro Pro Glu Ile Ser Gln Phe Pro
            100                 105                 110
tta aac cag aac ggc tcc agg cct tgc aac act tgg tcc gga agg ccc    384
Leu Asn Gln Asn Gly Ser Arg Pro Cys Asn Thr Trp Ser Gly Arg Pro
        115                 120                 125
tgg agg cag gcc ata tcg aac cct aca ccg ggc cag gaa ata acc cag    432
Trp Arg Gln Ala Ile Ser Asn Pro Thr Pro Gly Gln Glu Ile Thr Gln
    130                 135                 140
tat tcc cag tta aaa agg cca atg gaa cct ggc gat tca tcc acg acc    480
Tyr Ser Gln Leu Lys Arg Pro Met Glu Pro Gly Asp Ser Ser Thr Thr
145                 150                 155                 160
tgc ggg cca cta act ctc      ta a                                  501
Cys Gly Pro Leu Thr Leu
                165
<210>92
<211>166
<212>PRT
<213>人嗜T淋巴细胞病毒1
<400>92
Met Thr Val Leu Pro Ile Ala Leu Phe Ser Ser Asn Thr Pro Leu Arg
  1               5                  10                  15
Asn Thr Ser Val Leu Gly Ala Gly Gly Gln Thr Gln Asp His Phe Lys
             20                  25                  30
Leu Thr Ser Leu Pro Val Leu Ile Arg Leu Pro Phe Arg Thr Thr Pro
         35                  40                  45
Ile Val Leu Thr Ser Cys Leu Val Asp Thr Lys Asn Asn Trp Ala Ile
     50                  55                  60
Ile Gly Arg Asp Ala Leu Gln Gln Cys Gln Gly Ala Leu Tyr Leu Pro
 65                  70                  75                  80
Glu Ala Lys Gly Pro Pro Val Ile Leu Pro Ile Gln Ala Pro Ala Val
                 85                  90                  95
Leu Gly Leu Glu His Leu Pro Arg Pro Pro Glu Ile Ser Gln Phe Pro
            100                 105                 110
Leu Asn Gln Asn Gly Ser Arg Pro Cys Asn Thr Trp Ser Gly Arg Pro
        115                 120                 125
Trp Arg Gln Ala Ile Ser Asn Pro Thr Pro Gly Gln Glu Ile Thr Gln
    130                 135                 140
Tyr Ser Gln Leu Lys Arg Pro Met Glu Pro Gly Asp Ser Ser Thr Thr
145                 150                 155                 160
Cys Gly Pro Leu Thr Leu
                165
<210>93
<211>36
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(36)
<223>HTLV-1蛋白酶切割序列
<220>
<221>misc_特征
<222>(1)..(36)
<223>n+AD0-a,g,c,或t+ADs-r+AD0-a或g+ADs-y+AD0-c或t
<400>93
tcn cgn ccn car gtn ctn ccn gtn atg cay ccn aay                        36
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Met Xaa Xaa Xaa
  1               5                  10
<210>94
<211>12
<212>PRT
<213>人工序列
<400>94
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Met Xaa Xaa Xaa
  1               5                  10
<210>95
<211>36
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(36)
<223>HTLV-1蛋白酶切割序列
<220>
<221>misc_特征
<222>(1)..(36)
<223>n+AD0-a,g,c,或t+ADs-r+AD0-a或g+ADs-y+AD0-c或t
<400>95
tcn aar acn aar gtn ctn gtn gtn car ccn aar aay                            36
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
  1               5                  10
<210>96
<211>12
<212>PRT
<213>人工序列
<400>96
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
  1               5                  10
<210>97
<211>768
<212>DNA
<213>人巨细胞病毒
<220>
<221>CDS
<222>(1)..(768)
<223>包含于“UT80”中的HCMV次晶蛋白(蛋白酶)
<300>
<308>GenBank/X17403,P167
<309>1999-02-10
<400>97
atg acg atg gac gag cag cag tcg cag gct gtg gcg ccg gtc tac gtg    48
Met Thr Met Asp Glu Gln Gln Ser Gln Ala Val Ala Pro Val Tyr Val
  1               5                  10                  15
ggc ggc ttt ctc gcc cgc tac gac cag tct ccg gac gag gcc gaa ttg    96
Gly Gly Phe Leu Ala Arg Tyr Asp Gln Ser Pro Asp Glu Ala Glu Leu
             20                  25                  30
ctg ttg ccg cgg gac gta gtg gag cac tgg ttg cac gcg cag ggc cag    144
Leu Leu Pro Arg Asp Val Val Glu His Trp Leu His Ala Gln Gly Gln
         35                  40                  45
gga cag cct tcg ttg tcg gtc gcg ctc ccg ctc aac atc aac cac gac    192
Gly Gln Pro Ser Leu Ser Val Ala Leu Pro Leu Asn Ile Asn His Asp
     50                  55                  60
gac acg gcc gtt gta gga cac gtt gcg gcg atg cag agc gtc cgc gac    240
Asp Thr Ala Val Val Gly His Val Ala Ala Met Gln Ser Val Arg Asp
 65                  70                  75                  80
ggt ctt ttt tgc ctg ggc tgc gtc act tcg ccc agg ttt ctg gag att    288
Gly Leu Phe Cys Leu Gly Cys Val Thr Ser Pro Arg Phe Leu Glu Ile
                 85                  90                  95
gta cgc cgc gct tcg gaa aag tcc gag ctg gtt tcg cgc ggg ccc gtc    336
Val Arg Arg Ala Ser Glu Lys Ser Glu Leu Val Ser Arg Gly Pro Val
            100                 105                 110
agt ccg ctg cag cca gac aag gtg gtg gag ttt ctc agc ggc agc tac    384
Ser Pro Leu Gln Pro Asp Lys Val Val Glu Phe Leu Ser Gly Ser Tyr
        115                 120                 125
gcc ggc ctc tcg ctc tcc agc cgg cgc tgc gac gac gtg gag gcc gcg    432
Ala Gly Leu Ser Leu Ser Ser Arg Arg Cys Asp Asp Val Glu Ala Ala
    130                 135                 140
acg tcg ctt tcg ggc tcg gaa acc acg ccg ttc aaa cac gtg gct ttg    480
Thr Ser Leu Ser Gly Ser Glu Thr Thr Pro Phe Lys His Val Ala Leu
145                 150                 155                 160
tgc agc gtg ggt cgg cgt cgc ggt acg ttg gcc gtg tac ggg cgc gat    528
Cys Ser Val Gly Arg Arg Arg Gly Thr Leu Ala Val Tyr Gly Arg Asp
                165                 170                 175
ccc gag tgg gtc aca cag cgg ttt cca gac ctc acg gcg gcc gac cgt    576
Pro Glu Trp Val Thr Gln Arg Phe Pro Asp Leu Thr Ala Ala Asp Arg
            180                 185                 190
gac ggg cta cgt gca cag tgg cag cgc tgc ggc agc act gct gtc gac    624
Asp Gly Leu Arg Ala Gln Trp Gln Arg Cys Gly Ser Thr Ala Val Asp
        195                 200                 205
gcg tcg ggc gat ccc ttt cgc tca gac agc tac ggc ctg ttg ggc aac    672
Ala Ser Gly Asp Pro Phe Arg Ser Asp Ser Tyr Gly Leu Leu Gly Asn
    210                 215                 220
agc gtg gac gcg ctc tac atc cgt gag cga ctg ccc aag ctg cgc tac    720
Ser Val Asp Ala Leu Tyr Ile Arg Glu Arg Leu Pro Lys Leu Arg Tyr
225                 230                 235                 240
gac aag caa cta gtc ggc gtg acg gag cgc gag tca tac gtc aag gcg        768
Asp Lys Gln Leu Val Gly Val Thr Glu Arg Glu Ser Tyr Val Lys Ala
                245                 250                 255
<210>98
<211>256
<212>PRT
<213>人巨细胞病毒
<400>98
Met Thr Met Asp Glu Gln Gln Ser Gln Ala Val Ala Pro Val Tyr Val
  1               5                  10                  15
Gly Gly Phe Leu Ala Arg Tyr Asp Gln Ser Pro Asp Glu Ala Glu Leu
             20                  25                  30
Leu Leu Pro Arg Asp Val Val Glu His Trp Leu His Ala Gln Gly Gln
         35                  40                  45
Gly Gln Pro Ser Leu Ser Val Ala Leu Pro Leu Asn Ile Asn His Asp
     50                  55                  60
Asp Thr Ala Val Val Gly His Val Ala Ala Met Gln Ser Val Arg Asp
 65                  70                  75                  80
Gly Leu Phe Cys Leu Gly Cys Val Thr Ser Pro Arg Phe Leu Glu Ile
                 85                  90                  95
Val Arg Arg Ala Ser Glu Lys Ser Glu Leu Val Ser Arg Gly Pro Val
            100                 105                 110
Ser Pro Leu Gln Pro Asp Lys Val Val Glu Phe Leu Ser Gly Ser Tyr
        115                 120                 125
Ala Gly Leu Ser Leu Ser Ser Arg Arg Cys Asp Asp Val Glu Ala Ala
    130                 135                 140
Thr Ser Leu Ser Gly Ser Glu Thr Thr Pro Phe Lys His Val Ala Leu
145                 150                 155                 160
Cys Ser Val Gly Arg Arg Arg Gly Thr Leu Ala Val Tyr Gly Arg Asp
                165                 170                 175
Pro Glu Trp Val Thr Gln Arg Phe Pro Asp Leu Thr Ala Ala Asp Arg
            180                 185                 190
Asp Gly Leu Arg Ala Gln Trp Gln Arg Cys Gly Ser Thr Ala Val Asp
        195                 200                 205
Ala Ser Gly Asp Pro Phe Arg Ser Asp Ser Tyr Gly Leu Leu Gly Asn
    210                 215                 220
Ser Val Asp Ala Leu Tyr Ile Arg Glu Arg Leu Pro Lys Leu Arg Tyr
225                 230                 235                 240
Asp Lys Gln Leu Val Gly Val Thr Glu Arg Glu Ser Tyr Val Lys Ala
                245                 250                 255
<210>99
<211>15
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(15)
<223>HCMV蛋白酶切割序列
<400>99
gtg gtg aac gcc agt                                                15
Val Val Asn Ala Ser
  1               5
<210>100
<211>5
<212>PRT
<213>人工序列
<400>100
Val Val Asn Ala Ser
  1               5
<210>101
<211>15
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(15)
<223>HCMV蛋白酶切割序列
<400>101
tac gtc aag gcg agc                                                    15
Tyr Val Lys Ala Ser
  1               5
<210>102
<211>5
<212>PRT
<213>人工序列
<400>102
Tyr Val Lys Ala Ser
  1               5
<210>103
<211>1506
<212>DNA
<213>人类
<220>
<221>基因
<222>(1)..(1506)
<223>APPβ-分泌酶基因
<220>
<221>CDS
<222>(1)..(1503)
<223>APP β-分泌酶
<300>
<308>GenBank/AF201468
<309>1999-12-19
<400>103
atg gcc caa gcc ctg ccc tgg ctc ctg ctg tgg atg ggc gcg gga gtg    48
Met Ala Gln Ala Leu Pro Trp Leu Leu Leu Trp Met Gly Ala Gly Val
  1               5                  10                  15
ctg cct gcc cac ggc acc cag cac ggc atc cgg ctg ccc ctg cgc agc    96
Leu Pro Ala His Gly Thr Gln His Gly Ile Arg Leu Pro Leu Arg Ser
             20                  25                  30
ggc ctg ggg ggc gcc ccc ctg ggg ctg cgg ctg ccc cgg gag acc gac    144
Gly Leu Gly Gly Ala Pro Leu Gly Leu Arg Leu Pro Arg Glu Thr Asp
         35                  40                  45
gaa gag ccc gag gag ccc ggc cgg agg ggc agc ttt gtg gag atg gtg    192
Glu Glu Pro Glu Glu Pro Gly Arg Arg Gly Ser Phe Val Glu Met Val
     50                  55                  60
gac aac ctg agg ggc aag tcg ggg cag ggc tac tac gtg gag atg acc    240
Asp Asn Leu Arg Gly Lys Ser Gly Gln Gly Tyr Tyr Val Glu Met Thr
 65                  70                  75                  80
gtg ggc agc ccc ccg cag acg ctc aac atc ctg gtg gat aca ggc agc    288
Val Gly Ser Pro Pro Gln Thr Leu Asn Ile Leu Val Asp Thr Gly Ser
                 85                  90                  95
agt aac ttt gca gtg ggt gct gcc ccc cac ccc ttc ctg cat cgc tac    336
Ser Asn Phe Ala Val Gly Ala Ala Pro His Pro Phe Leu His Arg Tyr
            100                 105                 110
tac cag agg cag ctg tcc agc aca tac cgg gac ctc cgg aag ggt gtg    384
Tyr Gln Arg Gln Leu Ser Ser Thr Tyr Arg Asp Leu Arg Lys Gly Val
        115                 120                 125
tat gtg ccc tac acc cag ggc aag tgg gaa ggg gag ctg ggc acc gac    432
Tyr Val Pro Tyr Thr Gln Gly Lys Trp Glu Gly Glu Leu Gly Thr Asp
    130                 135                 140
ctg gta agc atc ccc cat ggc ccc aac gtc act gtg cgt gcc aac att    480
Leu Val Ser Ile Pro His Gly Pro Asn Val Thr Val Arg Ala Asn Ile
145                 150                 155                 160
gct gcc atc act gaa tca gac aag ttc ttc atc aac ggc tcc aac tgg    528
Ala Ala Ile Thr Glu Ser Asp Lys Phe Phe Ile Asn Gly Ser Asn Trp
                165                 170                 175
gaa ggc atc ctg ggg ctg gcc tat gct gag att gcc agg cct gac gac    576
Glu Gly Ile Leu Gly Leu Ala Tyr Ala Glu Ile Ala Arg Pro Asp Asp
            180                 185                 190
tcc ctg gag cct ttc ttt gac tct ctg gta aag cag acc cac gtt ccc    624
Ser Leu Glu Pro Phe Phe Asp Ser Leu Val Lys Gln Thr His Val Pro
        195                 200                 205
aac ctc ttc tcc ctg cag ctt tgt ggt gct ggc ttc ccc ctc aac cag    672
Asn Leu Phe Ser Leu Gln Leu Cys Gly Ala Gly Phe Pro Leu Asn Gln
    210                 215                 220
tct gaa gtg ctg gcc tct gtc gga ggg agc atg atc att gga ggt atc    720
Ser Glu Val Leu Ala Ser Val Gly Gly Ser Met Ile Ile Gly Gly Ile
225                 230                 235                 240
gac cac tcg ctg tac aca ggc agt ctc tgg tat aca ccc atc cgg cgg    768
Asp His Ser Leu Tyr Thr Gly Ser Leu Trp Tyr Thr Pro Ile Arg Arg
                245                 250                 255
gag tgg tat tat gag gtc atc att gtg cgg gtg gag atc aat gga cag    816
Glu Trp Tyr Tyr Glu Val Ile Ile Val Arg Val Glu Ile Asn Gly Gln
            260                 265                 270
gat ctg aaa atg gac tgc aag gag tac aac tat gac aag agc att gtg    864
Asp Leu Lys Met Asp Cys Lys Glu Tyr Asn Tyr Asp Lys Ser Ile Val
        275                 280                 285
gac agt ggc acc acc aac ctt cgt ttg ccc aag aaa gtg ttt gaa gct    912
Asp Ser Gly Thr Thr Asn Leu Arg Leu Pro Lys Lys Val Phe Glu A1a
    290                 295                 300
gca gtc aaa tcc atc aag gca gcc tcc tcc acg gag aag ttc cct gat    960
Ala Val Lys Ser Ile Lys Ala Ala Ser Ser Thr Glu Lys Phe Pro Asp
305                 310                 315                 320
ggt ttc tgg cta gga gag cag ctg gtg tgc tgg caa gca ggc acc acc    1008
Gly Phe Trp Leu Gly Glu Gln Leu Val Cys Trp Gln Ala Gly Thr Thr
                325                 330                 335
cct tgg aac att ttc cca gtc atc tca ctc tac cta atg ggt gag gtt    1056
Pro Trp Asn Ile Phe Pro Val Ile Ser Leu Tyr Leu Met Gly Glu Val
            340                 345                 350
acc aac cag tcc ttc cgc atc acc atc ctt ccg cag caa tac ctg cgg    1104
Thr Asn Gln Ser Phe Arg Ile Thr Ile Leu Pro Gln Gln Tyr Leu Arg
        355                 360                 365
cca gtg gaa gat gtg gcc acg tcc caa gac gac tgt tac aag ttt gcc    1152
Pro Val Glu Asp Val Ala Thr Ser Gln Asp Asp Cys Tyr Lys Phe Ala
    370                 375                 380
atc tca cag tca tcc acg ggc act gtt atg gga gct gtt atc atg gag    1200
Ile Ser Gln Ser Ser Thr Gly Thr Val Met Gly Ala Val Ile Met Glu
385                 390                 395                 400
ggc ttc tac gtt gtc ttt gat cgg gcc cga aaa cga att ggc ttt gct    1248
Gly Phe Tyr Val Val Phe Asp Arg Ala Arg Lys Arg Ile Gly Phe Ala
                405                 410                 415
gtc agc gct tgc cat gtg cac gat gag ttc agg acg gca gcg gtg gaa    1296
Val Ser Ala Cys His Val His Asp Glu Phe Arg Thr Ala Ala Val Glu
            420                 425                 430
ggc cct ttt gtc acc ttg gac atg gaa gac tgt ggc tac aac att cca    1344
Gly Pro Phe Val Thr Leu Asp Met Glu Asp Cys Gly Tyr Asn Ile Pro
        435                 440                 445
cag aca gat gag tca acc ctc atg acc ata gcc tat gtc atg gct gcc    1392
Gln Thr Asp Glu Ser Thr Leu Met Thr Ile Ala Tyr Val Met Ala Ala
    450                 455                 460
atc tgc gcc ctc ttc atg ctg cca ctc tgc ctc atg gtg tgt cag tgg    1440
Ile Cys Ala Leu Phe Met Leu Pro Leu Cys Leu Met Val Cys Gln Trp
465                 470                 475                 480
cgc tgc ctc cgc tgc ctg cgc cag cag cat gat gac ttt gct gat gac    1488
Arg Cys Leu Arg Cys Leu Arg Gln Gln His Asp Asp Phe Ala Asp Asp
                485                 490                 495
atc tcc ctg ctg aag      tga                                       1506
Ile Ser Leu Leu Lys
500
<210>104
<211>501
<212>PRT
<213>人类
<400>104
Met Ala Gln Ala Leu Pro Trp Leu Leu Leu Trp Met Gly Ala Gly Val
  1               5                  10                  15
Leu Pro Ala His Gly Thr Gln His Gly Ile Arg Leu Pro Leu Arg Ser
             20                  25                  30
Gly Leu Gly Gly Ala Pro Leu Gly Leu Arg Leu Pro Arg Glu Thr Asp
         35                  40                  45
Glu Glu Pro Glu Glu Pro Gly Arg Arg Gly Ser Phe Val Glu Met Val
     50                  55                  60
Asp Asn Leu Arg Gly Lys Ser Gly Gln Gly Tyr Tyr Val Glu Met Thr
 65                  70                  75                  80
Val Gly Ser Pro Pro Gln Thr Leu Asn Ile Leu Val Asp Thr Gly Ser
                 85                  90                  95
Ser Asn Phe Ala Val Gly Ala Ala Pro His Pro Phe Leu His Arg Tyr
            100                 105                 110
Tyr Gln Arg Gln Leu Ser Ser Thr Tyr Arg Asp Leu Arg Lys Gly Val
        115                 120                 125
Tyr Val Pro Tyr Thr Gln Gly Lys Trp Glu Gly Glu Leu Gly Thr Asp
    130                 135                 140
Leu Val Ser Ile Pro His Gly Pro Asn Val Thr Val Arg Ala Asn Ile
145                 150                 155                 160
Ala Ala Ile Thr Glu Ser Asp Lys Phe Phe Ile Asn Gly Ser Asn Trp
                165                 170                 175
Glu Gly Ile Leu Gly Leu Ala Tyr Ala Glu Ile Ala Arg Pro Asp Asp
            180                 185                 190
Ser Leu Glu Pro Phe Phe Asp Ser Leu Val Lys Gln Thr His Val Pro
        195                 200                 205
Asn Leu Phe Ser Leu Gln Leu Cys Gly Ala Gly Phe Pro Leu Asn Gln
    210                 215                 220
Ser Glu Val Leu Ala Ser Val Gly Gly Ser Met Ile Ile Gly Gly Ile
225                 230                 235                 240
Asp His Ser Leu Tyr Thr Gly Ser Leu Trp Tyr Thr Pro Ile Arg Arg
                245                 250                 255
Glu Trp Tyr Tyr Glu Val Ile Ile Val Arg Val Glu Ile Asn Gly Gln
            260                 265                 270
Asp Leu Lys Met Asp Cys Lys Glu Tyr Asn Tyr Asp Lys Ser Ile Val
        275                 280                 285
Asp Ser Gly Thr Thr Asn Leu Arg Leu Pro Lys Lys Val Phe Glu Ala
    290                 295                 300
Ala Val Lys Ser Ile Lys Ala Ala Ser Ser Thr Glu Lys Phe Pro Asp
305                 310                 315                 320
Gly Phe Trp Leu Gly Glu Gln Leu Val Cys Trp Gln Ala Gly Thr Thr
                325                 330                 335
Pro Trp Asn Ile Phe Pro Val Ile Ser Leu Tyr Leu Met Gly Glu Val
            340                 345                 350
Thr Asn Gln Ser Phe Arg Ile Thr Ile Leu Pro Gln Gln Tyr Leu Arg
        355                 360                 365
Pro Val Glu Asp Val Ala Thr Ser Gln Asp Asp Cys Tyr Lys Phe Ala
    370                 375                 380
Ile Ser Gln Ser Ser Thr Gly Thr Val Met Gly Ala Val Ile Met Glu
385                 390                 395                 400
Gly Phe Tyr Val Val Phe Asp Arg Ala Arg Lys Arg Ile Gly Phe Ala
                405                 410                 415
Val Ser Ala Cys His Val His Asp Glu Phe Arg Thr Ala Ala Val Glu
            420                 425                 430
Gly Pro Phe Val Thr Leu Asp Met Glu Asp Cys Gly Tyr Asn Ile Pro
        435                 440                 445
Gln Thr Asp Glu Ser Thr Leu Met Thr Ile Ala Tyr Val Met Ala Ala
    450                 455                 460
Ile Cys Ala Leu Phe Met Leu Pro Leu Cys Leu Met Val Cys Gln Trp
465                 470                 475                 480
Arg Cys Leu Arg Cys Leu Arg Gln Gln His Asp Asp Phe Ala Asp Asp
                485                 490                 495
Ile Ser Leu Leu Lys
            500
<210>105
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(18)
<223>APP β-分泌酶切割序列
<400>105
gaa gta aag atg gat gca                                             18
Glu Val Lys Met Asp Ala
  1               5
<210>106
<211>6
<212>PRT
<213>人工序列
<400>106
Glu Val Lys Met Asp Ala
  1               5
<210>107
<211>834
<212>DNA
<213>人类
<220>
<221>基因
<222>(1)..(834)
<223>天冬氨酸特异性半胱氮酸蛋白酶3的基因
<220>
<221>CDS
<222>(1)..(831)
<223>天冬氨酸特异性半胱氨酸蛋白酶3前原蛋白
<220>
<221>misc_特征
<222>(1)..(834)
<223>CDS:天冬氨酸特异性半胱氨酸蛋白酶3,信号肽(1..84)+ADs-CDS:天冬酸特异性半胱
氨酸蛋白酶3,大亚基(85..525)+ADs-CDS:天冬氨酸特异性半胱氨酸蛋白酶3,小亚基
(526..831)
<300>
<308>GenBank/NM_004346
<309>2001-07-13
<400>107
atg gag aac act gaa aac tca gtg gat tca aaa tcc att aaa aat ttg     48
Met Glu Asn Thr Glu Asn Ser Val Asp Ser Lys Ser Ile Lys Asn Leu
  1               5                  10                  15
gaa cca aag atc ata cat gga agc gaa tca atg gac tct gga ata tcc    96
Glu Pro Lys Ile Ile His Gly Ser Glu Ser Met Asp Ser Gly Ile Ser
             20                  25                  30
ctg gac aac agt tat aaa atg gat tat cct gag atg ggt tta tgt ata    144
Leu Asp Asn Ser Tyr Lys Met Asp Tyr Pro Glu Met Gly Leu Cys Ile
         35                  40                  45
ata att aat aat aag aat ttt cat aaa agc act gga atg aca tct cgg    192
Ile Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly Met Thr Ser Arg
     50                  55                  60
tct ggt aca gat gtc gat gca gca aac ctc agg gaa aca ttc aga aac    240
Ser Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu Thr Phe Arg Asn
 65                  70                  75                  80
ttg aaa tat gaa gtc agg aat aaa aat gat ctt aca cgt gaa gaa att    288
Leu Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr Arg Glu Glu Ile
                 85                  90                  95
gtg gaa ttg atg cgt gat gtt tct aaa gaa gat cac agc aaa agg agc    336
Val Glu Leu Met Arg Asp Val Ser Lys Glu Asp His Ser Lys Arg Ser
            100                 105                 110
agt ttt gtt tgt gtg ctt ctg agc cat ggt gaa gaa gga ata att ttt    384
Ser Phe Val Cys Val Leu Leu Ser His Gly Glu Glu Gly Ile Ile Phe
        115                 120                 125
gga aca aat gga cct gtt gac ctg aaa aaa ata aca aac ttt ttc aga    432
Gly Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr Asn Phe Phe Arg
    130                 135                 140
ggg gat cgt tgt aga agt cta act gga aaa ccc aaa ctt ttc att att    480
Gly Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys Leu Phe Ile Ile
145                 150                 155                 160
cag gcc tgc cgt ggt aca gaa ctg gac tgt ggc att gag aca gac agt    528
Gln Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly Ile Glu Thr Asp Ser
                165                 170                 175
ggt gtt gat gat gac atg gcg tgt cat aaa ata cca gtg gag gcc gac    576
Gly Val Asp Asp Asp Met Ala Cys His Lys Ile Pro Val Glu Ala Asp
            180                 185                 190
ttc ttg tat gca tac tcc aca gca cct ggt tat tat tct tgg cga aat    624
Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly Tyr Tyr Ser Trp Arg Asn
        195                 200                 205
tca aag gat ggc tcc tgg ttc atc cag tcg ctt tgt gcc atg ctg aaa    672
Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser Leu Cys Ala Met Leu Lys
    210                 215                 220
cag tat gcc gac aag ctt gaa ttt atg cac att ctt acc cgg gtt aac    720
Gln Tyr Ala Asp Lys Leu Glu Phe Met His Ile Leu Thr Arg Val Asn
225                 230                 235                 240
cga aag gtg gca aca gaa ttt gag tcc ttt tcc ttt gac gct act ttt    768
Arg Lys Val Ala Thr Glu Phe Glu Ser Phe Ser Phe Asp Ala Thr Phe
                245                 250                 255
cat gca aag aaa cag att cca tgt att gtt tcc atg ctc aca aaa gaa    816
His Ala Lys Lys Gln Ile Pro Cys Ile Val Ser Met Leu Thr Lys Glu
            260                 265                 270
ctc tat ttt tat cac   taa                                          834
Leu Tyr Phe Tyr His
        275
<210>108
<211>277
<212>PRT
<213>人类
<400>108
Met Glu Asn Thr Glu Asn Ser Val Asp Ser Lys Ser Ile Lys Asn Leu
  1               5                  10                  15
Glu Pro Lys Ile Ile His Gly Ser Glu Ser Met Asp Ser Gly Ile Ser
             20                  25                  30
Leu Asp Asn Ser Tyr Lys Met Asp Tyr Pro Glu Met Gly Leu Cys Ile
         35                  40                  45
Ile Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly Met Thr Ser Arg
     50                  55                  60
Ser Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu Thr Phe Arg Asn
 65                  70                  75                  80
Leu Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr Arg Glu Glu Ile
                 85                  90                  95
Val Glu Leu Met Arg Asp Val Ser Lys Glu Asp His Ser Lys Arg Ser
            100                 105                 110
Ser Phe Val Cys Val Leu Leu Ser His Gly Glu Glu Gly Ile Ile Phe
        115                 120                 125
Gly Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr Asn Phe Phe Arg
    130                 135                 140
Gly Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys Leu Phe Ile Ile
145                 150                 155                 160
Gln Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly Ile Glu Thr Asp Ser
                165                 170                 175
Gly Val Asp Asp Asp Met Ala Cys His Lys Ile Pro Val Glu Ala Asp
            180                 185                 190
Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly Tyr Tyr Ser Trp Arg Asn
        195                 200                 205
Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser Leu Cys Ala Met Leu Lys
    210                 215                 220
Gln Tyr Ala Asp Lys Leu Glu Phe Met His Ile Leu Thr Arg Val Asn
225                 230                 235                 240
Arg Lys Val Ala Thr Glu Phe Glu Ser Phe Ser Phe Asp Ala Thr Phe
                245                 250                 255
His Ala Lys Lys Gln Ile Pro Cys Ile Val Ser Met Leu Thr Lys Glu
            260                 265                 270
Leu Tyr Phe Tyr His
        275
<210>109
<211>441
<212>DNA
<213>人类
<220>
<221>CDS
<222>(1)..(441)
<223>天冬氨酸特异性半胱氨酸蛋白酶3,大亚基
<300>
<308>GenBank/XM 054686
<309>2002-05-13
<400>109
tct gga ata tcc ctg gac aac agt tat aaa atg gat tat cct gag atg    48
Ser Gly Ile Ser Leu Asp Asn Ser Tyr Lys Met Asp Tyr Pro Glu Met
  1               5                  10                  15
ggt tta tgt ata ata att aat aat aag aat ttt cat aaa agc act gga    96
Gly Leu Cys Ile Ile Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly
         20                  25                  30
atg aca tct cgg tct ggt aca gat gtc gat gca gca aac ctc agg gaa    144
Met Thr Ser Arg Ser Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu
     35                  40                  45
aca ttc aga aac ttg aaa tat gaa gtc agg aat aaa aat gat ctt aca    192
Thr Phe Arg Asn Leu Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr
     50                  55                 60
cgt gaa gaa att gtg gaa ttg atg cgt gat gtt tct aaa gaa gat cac    240
Arg Glu Glu Ile Val Glu Leu Met Arg Asp Val Ser Lys Glu Asp His
 65                  70                 75                  80
agc aaa agg agc agt ttt gtt tgt gtg ctt ctg agc cat ggt gaa gaa    288
Ser Lys Arg Ser Ser Phe Val Cys Val Leu Leu Ser His Gly Glu Glu
                 85                  90                  95
gga ata att ttt gga aca aat gga cct gtt gac ctg aaa aaa ata aca    336
Gly Ile Ile Phe Gly Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr
            100                 105                 110
aac ttt ttc aga ggg gat cgt tgt aga agt cta act gga aaa ccc aaa    384
Asn Phe Phe Arg Gly Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys
        115                 120                 125
ctt ttc att att cag gcc tgc cgt ggt aca gaa ctg gac tgt ggc att    432
Leu Phe Ile Ile Gln Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly Ile
    130                 135                 140
gag aca gac                                                        441
Glu Thr Asp
145
<210>110
<211>147
<212>PRT
<213>Homo sapiens
<400>110
Ser Gly Ile Ser Leu Asp Asn Ser Tyr Lys Met Asp Tyr Pro Glu Met
  1               5                  10                  15
Gly Leu Cys Ile Ile Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly
             20                  25                  30
Met Thr Ser Arg Ser Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu
         35                  40                  45
Thr Phe Arg Asn Leu Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr
     50                  55                  60
Arg Glu Glu Ile Val Glu Leu Met Arg Asp Val Ser Lys Glu Asp His
 65                  70                  75                  80
Ser Lys Arg Ser Ser Phe Val Cys Val Leu Leu Ser His Gly Glu Glu
                 85                  90                  95
Gly Ile Ile Phe Gly Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr
            100                 105                 110
Asn Phe Phe Arg Gly Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys
        115                 120                 125
Leu Phe Ile Ile Gln Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly Ile
    130                 135                 140
Glu Thr Asp
145
<210>111
<211>306
<212>DNA
<213>人类
<220>
<221>CDS
<222>(1)..(306)
<223>天冬氨酸特异性半胱氨酸蛋白酶3,小亚基
<300>
<308>GenBank/XM_054686
<309>2002-05-13
<400>111
agt ggt gtt gat gat gac atg gcg tgt cat aaa ata cca gtg gag gcc    48
Ser Gly Val Asp Asp Asp Met Ala Cys His Lys Ile Pro Val Glu Ala
  1               5                  10                  15
gac ttc ttg tat gca tac tcc aca gca cct ggt tat tat tct tgg cga    96
Asp Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly Tyr Tyr Ser Trp Arg
             20                  25                  30
aat tca aag gat ggc tcc tgg ttc atc cag tcg ctt tgt gcc atg ctg    144
Asn Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser Leu Cys Ala Met Leu
         35                  40                  45
aaa cag tat gcc gac aag ctt gaa ttt atg cac att ctt acc cgg gtt    192
Lys Gln Tyr Ala Asp Lys Leu Glu Phe Met His Ile Leu Thr Arg Val
     50                  55                  60
aac cga aag gtg gca aca gaa ttt gag tcc ttt tcc ttt gac gct act    240
Asn Arg Lys Val Ala Thr Glu Phe Glu Ser Phe Ser Phe Asp Ala Thr
 65                  70                  75                  80
ttt cat gca aag aaa cag att cca tgt att gtt tcc atg ctc aca aaa    288
Phe His Ala Lys Lys Gln Ile Pro Cys Ile Val Ser Met Leu Thr Lys
                 85                  90                  95
gaa ctc tat ttt tat cac                                            306
Glu Leu Tyr Phe Tyr His
            100
<210>112
<211>102
<212>PRT
<213>人类
<400>112
Ser Gly Val Asp Asp Asp Met Ala Cys His Lys Ile Pro Val Glu Ala
  1               5                  10                  15
Asp Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly Tyr Tyr Ser Trp Arg
             20                  25                  30
Asn Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser Leu Cys Ala Met Leu
         35                  40                  45
Lys Gln Tyr Ala Asp Lys Leu Glu Phe Met His Ile Leu Thr Arg Val
     50                  55                  60
Asn Arg Lys Val Ala Thr Glu Phe Glu Ser Phe Ser Phe Asp Ala Thr
 65                  70                  75                  80
Phe His Ala Lys Lys Gln Ile Pro Cys Ile Val Ser Met Leu Thr Lys
                 85                  90                  95
Glu Leu Tyr Phe Tyr His
            100
<210>113
<211>12
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(12)
<223>天冬氮酸特异性半胱氨酸蛋白酶3蛋白酶切割序列
<220>
<221>misc_特征
<222>(1)..(12)
<223>r+AD0-a或g+ADs-y+AD0-c或t
<400>113
gar agy atg gay                                                12
Xaa Xaa Met Xaa
  1
<210>114
<211>4
<212>PRT
<213>人工序列
<400>114
Xaa Xaa Met Xaa
  1
<210>115
<211>1869
<212>DNA
<213>人类
<220>
<221>基因
<222>(1)..(1869)
<223>人凝血因子II(凝血酶)的基因
<220>
<221>CDS
<222>(1)..(1866)
<223>凝血因子II前体
<220>
<221>misc_特征
<222>(1)..(1869)
<223>CDS:凝血因子II信号肽(1..129)+ADs-CDS:凝血因子II(130..1866)
<300>
<308>GenBank/NM_000506
<309>2000-10-31
<400>115
atg gcg cac gtc cga ggc ttg cag ctg cct ggc tgc ctg gcc ctg gct    48
Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala
  1               5                  10                  15
gcc ctg tgt agc ctt gtg cac agc cag cat gtg ttc ctg gct cct cag    96
Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln
             20                  25                  30
caa gca cgg tcg ctg ctc cag cgg gtc cgg cga gcc aac acc ttc ttg    144
Gln Ala Arg Ser Leu Leu Gln Arg Val Arg Arg Ala Asn Thr Phe Leu
         35                  40                  45
gag gag gtg cgc aag ggc aac cta gag cga gag tgc gtg gag gag acg    192
Glu Glu Val Arg Lys Gly Asn Leu Glu Arg Glu Cys Val Glu Glu Thr
     50                  55                  60
tgc agc tac gag gag gcc ttc gag gct ctg gag tcc tcc acg gct acg    240
Cys Ser Tyr Glu Glu Ala Phe Glu Ala Leu Glu Ser Ser Thr Ala Thr
 65                  70                  75                  80
gat gtg ttc tgg gcc aag tac aca gct tgt gag aca gcg agg acg cct    288
Asp Val Phe Trp Ala Lys Tyr Thr Ala Cys Glu Thr Ala Arg Thr Pro
                 85                  90                  95
cga gat aag ctt gct gca tgt ctg gaa ggt aac tgt gct gag ggt ctg    336
Arg Asp Lys Leu Ala Ala Cys Leu Glu Gly Asn Cys Ala Glu Gly Leu
            100                 105                 110
ggt acg aac tac cga ggg cat gtg aac atc acc cgg tca ggc att gag    384
Gly Thr Asn Tyr Arg Gly His Val Asn Ile Thr Arg Ser Gly Ile Glu
        115                 120                 125
tgc cag cta tgg agg agt cgc tac cca cat aag cct gaa atc aac tcc    432
Cys Gln Leu Trp Arg Ser Arg Tyr Pro His Lys Pro Glu Ile Asn Ser
    130                 135                 140
act acc cat cct ggg gcc gac cta cag gag aat ttc tgc cgc aac ccc    480
Thr Thr His Pro Gly Ala Asp Leu Gln Glu Asn Phe Cys Arg Asn Pro
145                 150                 155                 160
gac agc agc acc acg gga ccc tgg tgc tac act aca gac ccc acc gtg    528
Asp Ser Ser Thr Thr Gly Pro Trp Cys Tyr Thr Thr Asp Pro Thr Val
                165                 170                 175
agg agg cag gaa tgc agc atc cct gtc tgt ggc cag gat caa gtc act    576
Arg Arg Gln Glu Cys Ser Ile Pro Val Cys Gly Gln Asp Gln Val Thr
            180                 185                 190
gta gcg atg act cca cgc tcc gaa ggc tcc agt gtg aat ctg tca cct    624
Val Ala Met Thr Pro Arg Ser Glu Gly Ser Ser Val Asn Leu Ser Pro
        195                 200                 205
cca ttg gag cag tgt gtc cct gat cgg ggg cag cag tac cag ggg cgc    672
Pro Leu Glu Gln Cys Val Pro Asp Arg Gly Gln Gln Tyr Gln Gly Arg
    210                 215                 220
ctg gcg gtg acc aca cat ggg ctc ccc tgc ctg gcc tgg gcc agc gca    720
Leu Ala Val Thr Thr His Gly Leu Pro Cys Leu Ala Trp Ala Ser Ala
225                 230                 235                 240
cag gcc aag gcc ctg agc aag cac cag gac ttc aac tca gct gtg cag    768
Gln Ala Lys Ala Leu Ser Lys His Gln Asp Phe Asn Ser Ala Val Gln
                245                 250                 255
ctg gtg gag aac ttc tgc cgc aac cca gac ggg gat gag gag ggc gtg    816
Leu Val Glu Asn Phe Cys Arg Asn Pro Asp Gly Asp Glu Glu Gly Val
            260                 265                 270
tgg tgc tat gtg gcc ggg aag cct ggc gac ttt ggg tac tgc gac ctc    864
Trp Cys Tyr Val Ala Gly Lys Pro Gly Asp Phe Gly Tyr Cys Asp Leu
        275                 280                 285
aac tat tgt gag gag gcc gtg gag gag gag aca gga gat ggg ctg gat    912
Asn Tyr Cys Glu Glu Ala Val Glu Glu Glu Thr Gly Asp Gly Leu Asp
    290                 295                 300
gag gac tca gac agg gcc atc gaa ggg cgt acc gcc acc agt gag tac    960
Glu Asp Ser Asp Arg Ala Ile Glu Gly Arg Thr Ala Thr Ser Glu Tyr
305                 310                 315                 320
cag act ttc ttc aat ccg agg acc ttt ggc tcg gga gag gca gac tgt    1008
Gln Thr Phe Phe Asn Pro Arg Thr Phe Gly Ser Gly Glu Ala Asp Cys
                325                 330                 335
ggg ctg cga cct ctg ttc gag aag aag tcg ctg gag gac aaa acc gaa    1056
Gly Leu Arg Pro Leu Phe Glu Lys Lys Ser Leu Glu Asp Lys Thr Glu
            340                 345                 350
aga gag ctc ctg gaa tcc tac atc gac ggg cgc att gtg gag ggc tcg    1104
Arg Glu Leu Leu Glu Ser Tyr Ile Asp Gly Arg Ile Val Glu Gly Ser
        355                 360                 365
gat gca gag atc ggc atg tca cct tgg cag gtg atg ctt ttc cgg aag    1152
Asp Ala Glu Ile Gly Met Ser Pro Trp Gln Val Met Leu Phe Arg Lys
    370                 375                 380
agt ccc cag gag ctg ctg tgt ggg gcc agc ctc atc agt gac cgc tgg    1200
Ser Pro Gln Glu Leu Leu Cys Gly Ala Ser Leu Ile Ser Asp Arg Trp
385                 390                 395                 400
gtc ctc acc gcc gcc cac tgc ctc ctg tac ccg ccc tgg gac aag aac    1248
Val Leu Thr Ala Ala His Cys Leu Leu Tyr Pro Pro Trp Asp Lys Asn
                405                 410                 415
ttc acc gag aat gac ctt ctg gtg cgc att ggc aag cac tcc cgc aca    1296
Phe Thr Glu Asn Asp Leu Leu Val Arg Ile Gly Lys His Ser Arg Thr
            420                 425                 430
agg tac gag cga aac att gaa aag ata tcc atg ttg gaa aag atc tac    1344
Arg Tyr Glu Arg Asn Ile Glu Lys Ile Ser Met Leu Glu Lys Ile Tyr
        435                 440                 445
atc cac ccc agg tac aac tgg cgg gag aac ctg gac cgg gac att gcc    1392
Ile His Pro Arg Tyr Asn Trp Arg Glu Asn Leu Asp Arg Asp Ile Ala
    450                 455                 460
ctg atg aag ctg aag aag cct gtt gcc ttc agt gac tac att cac cct    1440
Leu Met Lys Leu Lys Lys Pro Val Ala Phe Ser Asp Tyr Ile His Pro
465                 470                 475                 480
gtg tgt ctg ccc gac agg gag acg gca gcc agc ttg ctc cag gct gga    1488
Val Cys Leu Pro Asp Arg Glu Thr Ala Ala Ser Leu Leu Gln Ala Gly
                485                 490                 495
tac aag ggg cgg gtg aca ggc tgg ggc aac ctg aag gag acg tgg aca    1536
Tyr Lys Gly Arg Val Thr Gly Trp Gly Asn Leu Lys Glu Thr Trp Thr
            500                 505                 510
gcc aac gtt ggt aag ggg cag ccc agt gtc ctg cag gtg gtg aac ctg    1584
Ala Asn Val Gly Lys Gly Gln Pro Ser Val Leu Gln Val Val Asn Leu
        515                 520                 525
ccc att gtg gag cgg ccg gtc tgc aag gac tcc acc cgg atc cgc atc    1632
Pro Ile Val Glu Arg Pro Val Cys Lys Asp Ser Thr Arg Ile Arg Ile
    530                 535                 540
act gac aac atg ttc tgt gct ggt tac aag cct gat gaa ggg aaa cga    1680
Thr Asp Asn Met Phe Cys Ala Gly Tyr Lys Pro Asp Glu Gly Lys Arg
545                 550                 555                 560
ggg gat gcc tgt gaa ggt gac agt ggg gga ccc ttt gtc atg aag agc    1728
Gly Asp Ala Cys Glu Gly Asp Ser Gly Gly Pro Phe Val Met Lys Ser
                565                 570                 575
ccc ttt aac aac cgc tgg tat caa atg ggc atc gtc tca tgg ggt gaa    1776
Pro Phe Asn Asn Arg Trp Tyr Gln Met Gly Ile Val Ser Trp Gly Glu
            580                 585                 590
ggc tgt gac cgg gat ggg aaa tat ggc ttc tac aca cat gtg ttc cgc    1824
Gly Cys Asp Arg Asp Gly Lys Tyr Gly Phe Tyr Thr His Val Phe Arg
        595                 600                 605
ctg aag aag tgg ata cag aag gtc at tgat cag ttt gga gag     tag    1869
Leu Lys Lys Trp Ile Gln Lys Val Ile Asp Gln Phe Gly Glu
    610                 615                 620
<210>116
<211>622
<212>PRT
<213>人类
<400>116
Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala
  1               5                  10                  15
Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln
             20                  25                  30
Gln Ala Arg Ser Leu Leu Gln Arg Val Arg Arg Ala Asn Thr Phe Leu
         35                  40                  45
Glu Glu Val Arg Lys Gly Asn Leu Glu Arg Glu CysVal  Glu Glu Thr
     50                  55                  60
Cys Ser Tyr Glu Glu Ala Phe Glu Ala Leu Glu Ser Ser Thr Ala Thr
 65                  70                  75                  80
Asp Val Phe Trp Ala Lys Tyr Thr Ala Cys Glu Thr Ala Arg Thr Pro
                 85                  90                  95
Arg Asp Lys Leu Ala Ala Cys Leu Glu Gly Asn Cys Ala Glu Gly Leu
            100                 105                 110
Gly Thr Asn Tyr Arg Gly His Val Asn Ile Thr Arg Ser Gly Ile Glu
        115                 120                 125
Cys Gln Leu Trp Arg Ser Arg Tyr Pro His Lys Pro Glu Ile Asn Ser
    130                 135                 140
Thr Thr His Pro Gly Ala Asp Leu Gln Glu Asn Phe Cys Arg Asn Pro
145                 150                 155                 160
Asp Ser Ser Thr Thr Gly Pro Trp Cys Tyr Thr Thr Asp Pro Thr Val
                165                 170                 175
Arg Arg Gln Glu Cys Ser Ile Pro Val Cys Gly Gln Asp Gln Val Thr
            180                 185                 190
Val Ala Met Thr Pro Arg Ser Glu Gly Ser Ser Val Asn Leu Ser Pro
        195                 200                 205
Pro Leu Glu Gln Cys Val Pro Asp Arg Gly Gln Gln Tyr Gln Gly Arg
    210                 215                 220
Leu Ala Val Thr Thr His Gly Leu Pro Cys Leu Ala Trp Ala Ser Ala
225                 230                 235                 240
Gln Ala Lys Ala Leu Ser Lys His Gln Asp Phe Asn Ser Ala Val Gln
                245                 250                 255
Leu Val Glu Asn Phe Cys Arg Asn Pro Asp Gly Asp Glu Glu Gly Val
            260                 265                 270
Trp Cys Tyr Val Ala Gly Lys Pro Gly Asp Phe Gly Tyr Cys Asp Leu
        275                 280                 285
Asn Tyr Cys Glu Glu Ala Val Glu Glu Glu Thr Gly Asp Gly Leu Asp
    290                 295                 300
Glu Asp Ser Asp Arg Ala Ile Glu Gly Arg Thr Ala Thr Ser Glu Tyr
305                 310                 315                 320
Gln Thr Phe Phe Asn Pro Arg Thr Phe Gly Ser Gly Glu Ala Asp Cys
                325                 330                 335
Gly Leu Arg Pro Leu Phe Glu Lys Lys Ser Leu Glu Asp Lys Thr Glu
            340                 345                 350
Arg Glu Leu Leu Glu Ser Tyr Ile Asp Gly Arg Ile Val Glu Gly Ser
        355                 360                 365
Asp Ala Glu Ile Gly Met Ser Pro Trp Gln Val Met Leu Phe Arg Lys
    370                 375                 380
Ser Pro Gln Glu Leu Leu Cys Gly Ala Ser Leu Ile Ser Asp Arg Trp
385                 390                 395                 400
Val Leu Thr Ala Ala His Cys Leu Leu Tyr Pro Pro Trp Asp Lys Asn
                405                 410                 415
Phe Thr Glu Asn Asp Leu Leu Val Arg Ile Gly Lys His Ser Arg Thr
            420                 425                 430
Arg Tyr Glu Arg Asn Ile Glu Lys Ile Ser Met Leu Glu Lys Ile Tyr
        435                 440                 445
Ile His Pro Arg Tyr Asn Trp Arg Glu Asn Leu Asp Arg Asp Ile Ala
    450                 455                 460
Leu Met Lys Leu Lys Lys Pro Val Ala Phe Ser Asp Tyr Ile His Pro
465                 470                 475                 480
Val Cys Leu Pro Asp Arg Glu Thr Ala Ala Ser Leu Leu Gln Ala Gly
                485                 490                 495
Tyr Lys Gly Arg Val Thr Gly Trp Gly Asn Leu Lys Glu Thr Trp Thr
            500                 505                 510
Ala Asn Val Gly Lys Gly Gln Pro Ser Val Leu Gln Val Val Asn Leu
        515                 520                 525
Pro Ile Val Glu Arg Pro Val Cys Lys Asp Ser Thr Arg Ile Arg Ile
    530                 535                 540
Thr Asp Asn Met Phe Cys Ala Gly Tyr Lys Pro Asp Glu Gly Lys Arg
545                 550                 555                 560
Gly Asp Ala Cys Glu Gly Asp Ser Gly Gly Pro Phe Val Met Lys Ser
                565                 570                 575
Pro Phe Asn Asn Arg Trp Tyr Gln Met Gly Ile Val Ser Trp Gly Glu
            580                 585                 590
Gly Cys Asp Arg Asp Gly Lys Tyr Gly Phe Tyr Thr His Val Phe Arg
        595                 600                 605
Leu Lys Lys Trp Ile Gln Lys Val Ile Asp Gln Phe Gly Glu
    610                 615                 620
<210>117
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成序列
<220>
<221>CDS
<222>(1)..(21)
<223>血小板糖蛋白V凝血酶切割序列
<400>117
ccc ggg ccc cgg ggc ccg cct                                            21
Pro G1y Pro Arg Gly Pro Pro
  1               5
<210>118
<211>7
<212>PRT
<213>人工序列
<400>118
Pro Gly Pro Arg Gly Pro Pro
  1               5
<210>119
<211>1878
<212>DNA
<213>人类
<220>
<221>基因
<222>(1)..(1878)
<223>人因子XI(血液凝固因子)的基因
<220>
<221>CDS
<222>(1)..(1875)
<223>前原因子XI
<220>
<221>misc_特征
<222>(1)..(1878)
<223>CDS:因子XI信号肽(1..54)+ADs-CDS:因子XI重链(55..1161)+ADs-CDS:因子XI轻链
(1162...1875)
<300>
<308>GenBank/M13142
<309>1994-11-08
<400>119
atg att ttc tta tat caa gtg gta cat ttc att tta ttt act tca gtt    48
Met Ile Phe Leu Tyr Gln Val Val His Phe Ile Leu Phe Thr Ser Val
  1               5                  10                  15
tct ggt gaa tgt gtg act cag ttg ttg aag gac acc tgc ttt gaa gga    96
Ser Gly Glu Cys Val Thr Gln Leu Leu Lys Asp Thr Cys Phe Glu Gly
             20                  25                  30
ggg gac att act acg gtc ttc aca cca agc gcc aag tac tgc cag gta    144
Gly Asp Ile Thr Thr Val Phe Thr Pro Ser Ala Lys Tyr Cys Gln Val
         35                  40                  45
gtc tgc act tac cac cca aga tgt tta ctc ttc act ttc acg gcg gaa    192
Val Cys Thr Tyr His Pro Arg Cys Leu Leu Phe Thr Phe Thr Ala Glu
     50                  55                  60
tca cca tct gag gat ccc acc cga tgg ttt act tgt gtc ctg aaa gac    240
Ser Pro Ser Glu Asp Pro Thr Arg Trp Phe Thr Cys Val Leu Lys Asp
 65                  70                  75                  80
agt gtt aca gaa aca ctg cca aga gtg aat agg aca gca gcg att tct    288
Ser Val Thr Glu Thr Leu Pro Arg Val Asn Arg Thr Ala Ala Ile Ser
                 85                  90                  95
ggg tat tct ttc aag caa tgc tca cac caa ata agc gct tgc aac aaa    336
Gly Tyr Ser Phe Lys Gln Cys Ser His Gln Ile Ser Ala Cys Asn Lys
            100                 105                 110
gac att tat gtg gac cta gac atg aag ggc ata aac tat aac agc tca    384
Asp Ile Tyr Val Asp Leu Asp Met Lys Gly Ile Asn Tyr Asn Ser Ser
        115                 120                 125
gtt gcc aag agt gct caa gaa tgc caa gaa aga tgc acg gat gac gtc    432
Val Ala Lys Ser Ala Gln Glu Cys Gln Glu Arg Cys Thr Asp Asp Val
    130                 135                 140
cac tgc cac ttt ttc acg tac gcc aca agg cag ttt ccc agc ctg gag    480
His Cys His Phe Phe Thr Tyr Ala Thr Arg Gln Phe Pro Ser Leu Glu
145                 150                 155                 160
cat cgt aac att tgt cta ctg aag cac acc caa aca ggg aca cca acc    528
His Arg Asn Ile Cys Leu Leu Lys His Thr Gln Thr Gly Thr Pro Thr
                165                 170                 175
aga ata acg aag ctc gat aaa gtg gtg tct gga ttt tca ctg aaa tcc    576
Arg Ile Thr Lys Leu Asp Lys Val Val Ser Gly Phe Ser Leu Lys Ser
            180                 185                 190
tgt gca ctt tct aat ctg gct tgt att agg gac att ttc cct aat acg    624
Cys Ala Leu Ser Asn Leu Ala Cys Ile Arg Asp Ile Phe Pro Asn Thr
        195                 200                 205
gtg ttt gca gac agc aac atc gac agt gtc atg gct ccc gat gct ttt    672
Val Phe Ala Asp Ser Asn Ile AsP Ser Val Met Ala Pro Asp Ala Phe
    210                 215                 220
gtc tgt ggc cga atc tgc act cat cat ccc ggt tgc ttg ttt ttt acc    720
Val Cys Gly Arg Ile Cys Thr His His Pro Gly Cys Leu Phe Phe Thr
225                 230                 235                 240
ttc ttt tcc cag gaa tgg ccc aaa gaa tct caa aga aat ctt tgt ctc    768
Phe Phe Ser Gln Glu Trp Pro Lys Glu Ser Gln Arg Asn Leu Cys Leu
                245                 250                 255
ctt aaa aca tct gag agt gga ttg ccc agt aca cgc att aaa aag agc    816
Leu Lys Thr Ser Glu Ser Gly Leu Pro Ser Thr Arg Ile Lys Lys Ser
            260                 265                 270
aaa gct ctt tct ggt ttc agt cta caa agc tgc agg cac agc atc cca    864
Lys Ala Leu Ser Gly Phe Ser Leu Gln Ser Cys Arg His Ser Ile Pro
        275                 280                 285
gtg ttc tgc cat tct tca ttt tac cat gac act gat ttc ttg gga gaa    912
Val Phe Cys His Ser Ser Phe Tyr His Asp Thr Asp Phe Leu Gly Glu
    290                 295                 300
gaa ctg gat att gtt gct gca aaa agt cac gag gcc tgc cag aaa ctg    960
Glu Leu Asp Ile Val Ala Ala Lys Ser His Glu Ala Cys Gln Lys Leu
305                 310                 315                 320
tgc acc aat gcc gtc cgc tgc cag ttt ttt acc tat acc cca gcc caa    1008
Cys Thr Asn Ala Val Arg Cys Gln Phe Phe Thr Tyr Thr Pro Ala Gln
                325                 330                 335
gca tcc tgc aac gaa ggg aag ggc aag tgt tac tta aag ctt tct tca    1056
Ala Ser Cys Asn Glu Gly Lys Gly Lys Cys Tyr Leu Lys Leu Ser Ser
            340                 345                 350
aac gga tct cca act aaa ata ctt cac ggg aga gga ggc atc tct gga    1104
Asn Gly Ser Pro Thr Lys Ile Leu His Gly Arg Gly Gly Ile Ser Gly
        355                 360                 365
tac aca tta agg ttg tgt aaa atg gat aat gag tgt acc acc aaa atc    1152
Tyr Thr Leu Arg Leu Cys Lys Met Asp Asn Glu Cys Thr Thr Lys Ile
    370                 375                 380
aag ccc agg atc gtt gga gga act gcg tct gtt cgt ggt gag tgg ccg    1200
Lys Pro Arg Ile Val Gly Gly Thr Ala Ser Val Arg Gly Glu Trp Pro
385                 390                 395                 400
tgg cag gtg acc ctg cac aca acc tca ccc act cag aga cac ctg tgt    1248
Trp Gln Val Thr Leu His Thr Thr Ser Pro Thr Gln Arg His Leu Cys
                405                 410                 415
gga ggc tcc atc att gga aac cag tgg ata tta aca gcc gct cac tgt    1296
Gly Gly Ser Ile Ile Gly Asn Gln Trp Ile Leu Thr Ala Ala His Cys
            420                 425                 430
ttc tat ggg gta gag tca cct aag att ttg cgt gtc tac agt ggc att    1344
Phe Tyr Gly Val Glu Ser Pro Lys Ile Leu Arg Val Tyr Ser Gly Ile
        435                 440                 445
tta aat caa tct gaa ata aaa gag gac aca tct ttc ttt ggg gtt caa    1392
Leu Asn Gln Ser Glu Ile Lys Glu Asp Thr Ser Phe Phe Gly Val Gln
    450                 455                 460
gaa ata ata atc cat gat cag tat aaa atg gca gaa agc ggg tat gat    1440
Glu Ile Ile Ile His Asp Gln Tyr Lys Met Ala Glu Ser Gly Tyr Asp
465                 470                 475                 480
att gcc ttg ttg aaa ctg gaa acc aca gtg aat tac aca gat tct caa    1488
Ile Ala Leu Leu Lys Leu Glu Thr Thr Val Asn Tyr Thr Asp Ser Gln
                485                 490                 495
cga ccc ata tgc ctg cct tcc aaa gga gat aga aat gta ata tac act    1536
Arg Pro Ile Cys Leu Pro Ser Lys Gly Asp Arg Asn Val Ile Tyr Thr
            500                 505                 510
gat tgc tgg gtg act gga tgg ggg tac aga aaa cta aga gac aaa ata    1584
Asp Cys Trp Val Thr Gly Trp Gly Tyr Arg Lys Leu Arg Asp Lys Ile
        515                 520                 525
caa aat act ctc cag aaa gcc aag ata ccc tta gtg acc aac gaa gag    1632
Gln Asn Thr Leu Gln Lys Ala Lys Ile Pro Leu Val Thr Asn Glu Glu
    530                 535                 540
tgc cag aag aga tac aga gga cat aaa ata acc cat aag atg atc tgt    1680
Cys Gln Lys Arg Tyr Arg Gly His Lys Ile Thr His Lys Met Ile Cys
545                 550                 555                 560
gcc ggc tac agg gaa gga ggg aag gac gct tgc aag gga gat tcg gga    1728
Ala Gly Tyr Arg Glu Gly Gly Lys Asp Ala Cys Lys Gly Asp Ser Gly
                565                 570                 575
ggc cct ctg tcc tgc aaa cac aat gag gtc tgg cat ctg gta ggc atc    1776
Gly Pro Leu Ser Cys Lys His Asn Glu Val Trp His Leu Val Gly Ile
            580                 585                 590
acg agc tgg ggc gaa ggc tgt gct caa agg gag cgg cca ggt gtt tac    1824
Thr Ser Trp Gly Glu Gly Cys Ala Gln Arg Glu Arg Pro Gly Val Tyr
        595                 600                 605
acc aac gtg gtc gag tac gtg gac tgg att ctg gag aaa act caa gca    1872
Thr Asn Val Val Glu Tyr Val Asp Trp Ile Leu Glu Lys Thr Gln Ala
    610                 615                 620
gtg tga                                                            1878
Val
625
<210>120
<211>625
<212>PRT
<213>人类
<400>120
Met Ile Phe Leu Tyr Gln Val Val His Phe Ile Leu Phe Thr Ser Val
  1               5                  10                  15
Ser Gly Glu Cys Val Thr Gln Leu Leu Lys Asp Thr Cys Phe Glu Gly
             20                  25                  30
Gly Asp Ile Thr Thr Val Phe Thr Pro Ser Ala Lys Tyr Cys Gln Val
         35                  40                  45
Val Cys Thr Tyr His Pro Arg Cys Leu Leu Phe Thr Phe Thr Ala Glu
     50                  55                  60
Ser Pro Ser Glu Asp Pro Thr Arg Trp Phe Thr Cys Val Leu Lys Asp
 65                  70                  75                  80
Ser Val Thr Glu Thr Leu Pro Arg Val Asn Arg Thr Ala Ala Ile Ser
                 85                  90                  95
Gly Tyr Ser Phe Lys Gln Cys Ser His Gln Ile Ser Ala Cys Asn Lys
            100                 105                 110
Asp Ile Tyr Val Asp Leu Asp Met Lys Gly Ile Asn Tyr Asn Ser Ser
        115                 120                 125
Val Ala Lys Ser Ala Gln Glu Cys Gln Glu Arg Cys Thr Asp Asp Val
    130                 135                 140
His Cys His Phe Phe Thr Tyr Ala Thr Arg Gln Phe Pro Ser Leu Glu
145                 150                 155                 160
His Arg Asn Ile Cys Leu Leu Lys His Thr Gln Thr Gly Thr Pro Thr
                165                 170                 175
Arg Ile Thr Lys Leu Asp Lys Val Val Ser Gly Phe Ser Leu Lys Ser
            180                 185                 190
Cys Ala Leu Ser Asn Leu Ala Cys Ile Arg Asp Ile Phe Pro Asn Thr
        195                 200                 205
Val Phe Ala Asp Ser Asn Ile Asp Ser Val Met Ala Pro Asp Ala Phe
    210                 215                 220
Val Cys Gly Arg Ile Cys Thr His His Pro Gly Cys Leu Phe Phe Thr
225                 230                 235                 240
Phe Phe Ser Gln Glu Trp Pro Lys Glu Ser Gln Arg Asn Leu Cys Leu
                245                 250                 255
Leu Lys Thr Ser Glu Ser Gly Leu Pro Ser Thr Arg Ile Lys Lys Ser
            260                 265                 270
Lys Ala Leu Ser Gly Phe Ser Leu Gln Ser Cys Arg His Ser Ile Pro
        275                 280                 285
Val Phe Cys His Ser Ser Phe Tyr His Asp Thr Asp Phe Leu Gly Glu
    290                 295                 300
Glu Leu Asp Ile Val Ala Ala Lys Ser His Glu Ala Cys Gln Lys Leu
305                 310                 315                 320
Cys Thr Asn Ala Val Arg Cys Gln Phe Phe Thr Tyr Thr Pro Ala Gln
                325                 330                 335
Ala Ser Cys Asn Glu Gly Lys Gly Lys Cys Tyr Leu Lys Leu Ser Ser
            340                 345                 350
Asn Gly Ser Pro Thr Lys Ile Leu His Gly Arg Gly Gly Ile Ser Gly
        355                 360                 365
Tyr Thr Leu Arg Leu Cys Lys Met Asp Asn Glu Cys Thr Thr Lys Ile
    370                 375                 380
Lys Pro Arg Ile Val Gly Gly Thr Ala Ser Val Arg Gly Glu Trp Pro
385                 390                 395                 400
Trp Gln Val Thr Leu His Thr Thr Ser Pro Thr Gln Arg His Leu Cys
                405                 410                 415
Gly Gly Ser Ile Ile Gly Asn Gln Trp Ile Leu Thr Ala Ala His Cys
            420                 425                 430
Phe Tyr Gly Val Glu Ser Pro Lys Ile Leu Arg Val Tyr Ser Gly Ile
        435                 440                 445
Leu Asn Gln Ser Glu Ile Lys Glu Asp Thr Ser Phe Phe Gly Val Gln
    450                 455                 460
Glu Ile Ile Ile His Asp Gln Tyr Lys Met Ala Glu Ser Gly Tyr Asp
465                 470                 475                 480
Ile Ala Leu Leu Lys Leu Glu Thr Thr Val Asn Tyr Thr Asp Ser Gln
                485                 490                 495
Arg Pro Ile Cys Leu Pro Ser Lys Gly Asp Arg Asn Val Ile Tyr Thr
            500                 505                 510
Asp Cys Trp Val Thr Gly Trp Gly Tyr Arg Lys Leu Arg Asp Lys Ile
        515                 520                 525
Gln Asn Thr Leu Gln Lys Ala Lys Ile Pro Leu Val Thr Asn Glu Glu
    530                 535                 540
Cys Gln Lys Arg Tyr Arg Gly His Lys Ile Thr His Lys Met Ile Cys
545                 550                 555                 560
Ala Gly Tyr Arg Glu Gly Gly Lys Asp Ala Cys Lys Gly Asp Ser Gly
                565                 570                 575
Gly Pro Leu Ser Cys Lys His Asn Glu Val Trp His Leu Val Gly Ile
            580                 585                 590
Thr Ser Trp Gly Glu Gly Cys Ala Gln Arg Glu Arg Pro Gly Val Tyr
        595                 600                 605
Thr Asn Val Val Glu Tyr Val Asp Trp Ile Leu Glu Lys Thr Gln Ala
    610                 615                 620
Val
625

Claims (64)

1.嵌合蛋白质,其包含至少一种有靶向到亚细胞器的运输信号的信号蛋白质和至少一种蛋白酶的蛋白酶剪切位点,将其构建为:
(a)通过连接蛋白水解位点或通过蛋白水解位点连接信号掩蔽蛋白质至信号蛋白质的N或C末端,失活所有信号蛋白质的运输信号,因此嵌合蛋白质存在于胞质溶胶中;
(b)当蛋白酶剪切位点被蛋白酶切割时,至少一种信号蛋白质的运输信号被活化,并导致至少一种包含活化信号蛋白质的片段蛋白质被转运到亚细胞器;和
(c)用至少一种荧光蛋白质标记嵌合蛋白质,荧光标记信号在细胞中的位置和强度分布根据蛋白酶的切割而改变。
2.嵌合蛋白质,其包含至少两种有靶向到亚细胞器的运输信号的信号蛋白质和至少一种蛋白酶的蛋白酶剪切位点,将其构建为:
(a)一种信号蛋白质的运输信号保持活性,通过连接蛋白水解位点或通过蛋白水解位点连接信号掩蔽蛋白质至信号蛋白质的N或C末端,失活其余信号蛋白质的运输信号,因此嵌合蛋白质被转运到特定的通过活性信号蛋白质运输信号靶向的亚细胞器;
(b)在嵌合蛋白质转运到亚细胞器后,至少一种蛋白水解位点和至少一种失活信号蛋白质暴露于胞质溶胶中;
(c)当蛋白酶剪切位点被蛋白酶切割时,所述的至少一种暴露于胞质溶胶的失活信号蛋白质的运输信号被活化,并导致包含活化信号蛋白质的片段蛋白质被转运到与嵌合蛋白质被转运的亚细胞器不同的亚细胞器;和
(d)用至少一种荧光蛋白质标记嵌合蛋白质,荧光信号在细胞中的位置和强度分布根据蛋白酶的切割而改变。
3.根据权利要求1和2任一权利要求的嵌合蛋白质,其中在蛋白酶剪切产生的片段蛋白质中,至少两种有不同的细胞定位特点的片段蛋白质,其各自包括一种荧光蛋白质,使用的荧光蛋白质由至少两种不同波长的荧光蛋白质组成。
4.根据权利要求1和2任一权利要求的嵌合蛋白质,其中在包含失活运输信号被蛋白酶剪切活化的信号蛋白质的片段蛋白质中,至少一种片段蛋白质包含荧光蛋白质。
5.嵌合蛋白质,其包含有靶向到亚细胞器的运输信号的信号蛋白质和通过蛋白酶的蛋白酶剪切位点与信号蛋白质连接的荧光蛋白质,将其构建为:
(a)由于嵌合蛋白质中信号蛋白质的运输信号保持活性,因此嵌合蛋白质被转运到亚细胞器;
(b)在嵌合蛋白质转运到亚细胞器后,蛋白酶剪切位点和荧光蛋白质暴露于胞质溶胶中;和
(c)因此,当暴露于胞质溶胶的蛋白酶剪切位点被蛋白酶切割时,暴露于胞质溶胶的荧光蛋白质被释放到胞质溶胶中。
6.权利要求5的嵌合蛋白质,其中保持活性的信号蛋白质用与暴露到胞质溶胶的荧光蛋白质荧光波长不同的荧光蛋白质进一步标记,且该另外的荧光蛋白质在蛋白酶剪切发生后仍附着在活性信号蛋白质上。
7.根据权利要求1和2任一权利要求的嵌合蛋白质,其中失活信号蛋白质的运输信号是靶向到选自线粒体、叶绿体和过氧化物酶体亚细胞器的信号。
8.根据权利要求1和2任一权利要求的嵌合蛋白质,其中失活信号蛋白质是选自拟南芥属外包膜蛋白质7(AtOEP7)、Rubisco小亚单位(RbcS)、叶绿素a/b结合蛋白质(Cab)、Rubisco活化酶(RA)、F1-ATPase和过氧化物酶体靶向基序(SKL)的全长蛋白质或其包含运输信号的片段。
9.根据权利要求2和5任一权利要求的嵌合蛋白质,其中保持活性的信号蛋白质的运输信号是靶向到选自线粒体、叶绿体和细胞核的外膜、过氧化物酶体膜和质膜之一的信号。
10.根据权利要求2和5任一权利要求的嵌合蛋白质,其中保持活性的信号蛋白质是与特定磷脂特异结合的蛋白质。
11.根据权利要求2和5任一权利要求的嵌合蛋白质,其中保持活性的信号蛋白质是选自拟南芥属外包膜蛋白质7(AtOEP7)、H+-ATPase、Pleckstrin同源结构域(PH)和FAPP(家族A(磷酸肌醇结合特异)成员3)的Pleckstrin同源结构域的全长蛋白质或其包含运输信号的片段。
12.根据权利要求1和2任一权利要求的嵌合蛋白质,其中信号掩蔽蛋白质选自氨基酸、肽和蛋白质。
13.根据权利要求1、2,和5任一权利要求的嵌合蛋白质,其中荧光蛋白质选自绿色荧光蛋白质(GFP)、红色荧光蛋白质(RFP)、其突变体和其衍生物。
14.包含编码权利要求1、2,和5任一权利要求的嵌合蛋白质的核酸序列的重组基因,其被构建以在细胞中表达该嵌合蛋白质。
15.用权利要求14的重组基因转化的细胞。
16.权利要求15的细胞,其中细胞是真核细胞。
17.权利要求16的细胞,其中真核细胞是植物细胞。
18.分析体内蛋白酶活性的方法,包括
(a)用权利要求14的重组基因转化细胞;
(b)在步骤(a)之前、之后或同时转化该细胞以表达蛋白酶;
(c)温育转化细胞以表达蛋白质;
(d)观察温育细胞中荧光信号分布的图像;和
(e)通过步骤(d)中观察到的荧光图像与无步骤(b)制备的对照转化细胞的荧光图像对比,确定蛋白酶的活性。
19.筛选体内蛋白酶抑制剂的方法,包括
(a)用权利要求14的重组基因转化细胞;
(b)在步骤(a)之前、之后,或同时转化该细胞以表达蛋白酶;
(c)在步骤(b)之前、之后,或同时用抑制蛋白酶的候选药物处理转化细胞;
(d)温育转化细胞以表达蛋白质;
(e)观察温育细胞中荧光信号分布的图像;和
(f)通过步骤(e)中观察到的荧光图像与无步骤(b)制备的对照转化细胞、无步骤(c)制备的对照转化细胞、及无步骤(b)和(c)制备的对照转化细胞中至少一个的荧光图像对比,确定候选药物的蛋白酶抑制活性。
20.权利要求18和19任一权利要求的方法,其中转化细胞表达蛋白酶的步骤是插入表达蛋白酶的重组基因的步骤,或用能表达蛋白酶的病毒感染的步骤。
21.权利要求18和19任一权利要求的方法,其中被转化的细胞是真核细胞。
22.权利要求18和19任一权利要求的方法,其中被转化的细胞是植物细胞。
23.检测细胞中蛋白酶的系统,其中系统包含嵌合蛋白质,其包含共价连接成分:1)至少一种可选地掩蔽的信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。
24.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的:1)信号蛋白质;2)蛋白酶特异的切割位点;和3)可检测的氨基酸序列。
25.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的:1)掩蔽序列;2)蛋白酶切割位点;3)信号蛋白质;和4)可检测的氨基酸序列。
26.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的:1)信号蛋白质;2)蛋白酶切割位点;3)掩蔽序列;和4)可检测的氨基酸序列。
27.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的:1)第一信号蛋白质;2)蛋白酶切割位点;和3)第二信号蛋白质;和4)可检测的氨基酸序列。
28.权利要求27的系统,其中嵌合蛋白质包含共价顺序连接的:1)第一信号蛋白质;2)第一蛋白酶切割位点;3)掩蔽序列;4)第二信号蛋白质;和5)可检测的氨基酸序列。
29.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的:1)掩蔽序列;2)第一蛋白酶切割位点;3)第一信号蛋白质;4)第二蛋白酶切割位点;5)第二信号蛋白质;和6)可检测的氨基酸序列。
30.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的:1)第一信号蛋白质;2)第一蛋白酶切割位点;3)第二信号蛋白质;4)第二蛋白酶切割位点;5)掩蔽序列;和6)可检测的氨基酸序列。
31.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的:1)蛋白酶特异的切割位点;2)信号蛋白质;和3)可检测的氨基酸序列。
32.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的:1)第一信号蛋白质;2)第一可检测序列;3)蛋白酶切割位点;和4)第二可检测序列。
33.权利要求32的系统,其中嵌合蛋白质进一步包含共价连接在蛋白酶切割位点C末端和第二可检测序列N末端之间的第二信号蛋白质。
34.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的:1)第一信号蛋白质;2)蛋白酶切割位点;3)第二信号蛋白质;和4)第二可检测序列。
35.权利要求23的系统,其中嵌合蛋白质包含共价顺序连接的:1)第一可检测序列;2)蛋白酶切割位点;3)信号蛋白质;和4)第二可检测序列。
36.权利要求23的系统,其中任何一种成分构成嵌合蛋白质的N末端。
37.权利要求23的系统,其中任何一种成分构成嵌合蛋白质的C末端。
38.权利要求23的系统,其中信号蛋白质足以将嵌合蛋白质或至少一种其成分定位到植物或动物细胞的细胞器。
39.权利要求38的系统,其中信号蛋白质将嵌合蛋白质或至少一种其成分定位到植物细胞的细胞核、高尔基体、溶解液泡、储存液泡、过氧化物酶体、线粒体、内质网、质膜或叶绿体。
40.权利要求39的系统,其中信号蛋白质是AtOEP7;RbcS;Cab;RA;SKL;F1-ATPase;PH;FAPP;H+-ATPase之一;或其功能片段。
41.权利要求38的系统,其中信号蛋白质将嵌合蛋白质定位到动物细胞的细胞核、高尔基体、储存液泡、溶酶体、过氧化物酶体、内质网、质膜或线粒体。
42.权利要求41的系统,其中信号蛋白质是人肽蛋氨酸亚砜还原酶(MSRA)、细胞色素b2、11-β-羟基类固醇脱氢酶(11β-HSD)、G9-AKL、过氧化物酶体整合膜蛋白质47(PMP47)之一;或其功能片段。
43.权利要求23的系统,其中切割位点被哺乳动物或病毒蛋白酶特异切割。
44.权利要求43的系统,其中切割位点被人类病原体相关的蛋白酶特异切割。
45.权利要求44的系统,其中蛋白酶由巨细胞病毒(CMV);单纯疱疹病毒(HSV);肝炎病毒;疟原虫、人类免疫缺陷病毒(HIV)、卡波济肉瘤相关疱疹病毒(KSHV)、黄热病病毒、黄病毒或鼻病毒表达。
46.权利要求43的系统,其中蛋白酶是丝氨酸类型的蛋白酶。
47.权利要求45的系统,其中疟原虫是恶性疟原虫,蛋白酶是疟原虫天冬氨酸蛋白酶I和疟原虫天冬氨酸蛋白酶II之一。
48.权利要求45的系统,其中切割位点被HSV成熟蛋白酶特异切割。
49.权利要求45的系统,其中肝炎病毒是丙型。
50.权利要求44的系统,其中人类病原体是酵母、细菌、真菌、线虫、病毒或原生动物。
51.权利要求43的系统,其中切割位点被与血液凝固、凋亡或细胞外基质相关的哺乳动物蛋白酶特异切割。
52.权利要求23的系统,其中至少一种可检测的序列是荧光、磷光或化学发光的序列。
53.权利要求52的系统,其中一种可检测序列的发射波长与至少一种其它的可检测序列的发射波长不同。
54.权利要求52的系统,其中可检测序列是水母荧光蛋白质或其衍生物。
55.基本上纯的嵌合蛋白质,包含共价连接成分:1)至少一种可选地掩蔽的信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。
56.包含编码用于检测细胞中蛋白酶活性的嵌合蛋白质的序列的核酸,其中嵌合蛋白质包含共价连接成分:1)至少一种可选地掩蔽的信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列。
57.包含权利要求56的核酸的载体。
58.用权利要求57的载体转化的细胞。
59.检测细胞内蛋白酶的试剂盒,该试剂盒包含至少下列之一:
a)嵌合蛋白质,其包含共价连接成分:i)至少一种可选地掩蔽的信号蛋白质;ii)至少一种蛋白酶特异的切割位点;和iii)至少一种可检测的氨基酸序列;和b)包含核酸的载体,其中核酸包含编码嵌合蛋白质的序列。
60.检测细胞或组织内蛋白酶的方法,该方法包含:
a)将包含编码嵌合蛋白质的核酸的第一载体引入受试细胞或组织,其中嵌合蛋白质包含共价连接成分:1)至少一种可选地掩蔽的信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列,
b)在使第一载体编码的嵌合蛋白质表达的条件下温育细胞或组织;和
c)检测嵌合蛋白质亚细胞定位的变化作为细胞内蛋白酶存在的指示。
61.权利要求60的方法,其中该方法还包含:将包含编码蛋白酶的核酸序列的第二载体引入受试细胞或组织;并在细胞或组织中表达第二载体以在其中产生蛋白酶。
62.检测体内蛋白酶抑制剂的方法,该方法包含:
a)将包含编码嵌合蛋白质的核酸的第一载体引入受试细胞或组织,其中嵌合蛋白质包含共价连接成分:1)至少一种可选地掩蔽的信号蛋白质;2)至少一种蛋白酶特异的切割位点;和3)至少一种可检测的氨基酸序列,
b)将编码受试蛋白酶的第二载体引入细胞或组织,
c)细胞或组织与候选化合物接触,
d)在使第一载体编码的嵌合蛋白质和第二载体编码的蛋白酶表达的条件下温育细胞或组织;和
e)检测嵌合蛋白质亚细胞定位的变化作为蛋白酶抑制剂存在的指示。
63.权利要求62的方法,其中该方法还包含使用自动或半自动的设备检测嵌合蛋白质亚细胞定位的变化。
64.权利要求63的方法,其中自动或半自动的设备包含适于检测细胞或组织内可检测序列的光学系统。
CN200910165761A 2001-08-10 2002-08-08 蛋白酶检测系统 Pending CN101684161A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20010048123 2001-08-10
KR20010048123 2001-08-10

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB028179005A Division CN100535123C (zh) 2001-08-10 2002-08-08 蛋白酶检测系统

Publications (1)

Publication Number Publication Date
CN101684161A true CN101684161A (zh) 2010-03-31

Family

ID=19713067

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB028179005A Expired - Fee Related CN100535123C (zh) 2001-08-10 2002-08-08 蛋白酶检测系统
CN200910165761A Pending CN101684161A (zh) 2001-08-10 2002-08-08 蛋白酶检测系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNB028179005A Expired - Fee Related CN100535123C (zh) 2001-08-10 2002-08-08 蛋白酶检测系统

Country Status (8)

Country Link
US (3) US7109293B2 (zh)
EP (1) EP1423527A4 (zh)
JP (2) JP4522697B2 (zh)
KR (1) KR100522974B1 (zh)
CN (2) CN100535123C (zh)
AU (2) AU2002330756B2 (zh)
CA (1) CA2457059A1 (zh)
WO (1) WO2003014381A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110018143A (zh) * 2019-03-29 2019-07-16 深圳大学 检测甲藻细胞凋亡的方法

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002330756B2 (en) 2001-08-10 2009-07-16 Ahram Biosystems Inc. System for detecting protease
EP1678202B1 (en) 2003-10-27 2012-06-13 Vertex Pharmaceuticals Incorporated Hcv ns3-ns4a protease resistance mutants
US20050214890A1 (en) * 2003-11-26 2005-09-29 Zhiqun Tan Novel "Cleave-N-Read" system for protease activity assay and methods of use thereof
AU2006230803B8 (en) * 2005-04-04 2011-03-17 Suntory Holdings Limited Plant genetic sequences associated with vacuolar pH and uses thereof
CA2603584A1 (en) * 2005-04-04 2006-10-12 Vereniging Voor Christelijk Hoger Onderwijs Wetenschappelijk Onderzoek E N Patieentenzorg Plant genetic sequences associated with vacuolar ph and uses thereof
US7705138B2 (en) * 2005-11-11 2010-04-27 Vertex Pharmaceuticals Incorporated Hepatitis C virus variants
US8629258B2 (en) 2006-06-01 2014-01-14 Vereniging Voor Christelijk Hoger Onderwijs, Wetenschappelijk Onderzoek En Patientenzorg Plant nucleic acids associated with cellular pH and uses thereof
SG188082A1 (en) 2007-10-02 2013-03-28 Theranos Inc Modular point-of-care devices and uses thereof
US7881965B2 (en) 2008-10-02 2011-02-01 ecoATM, Inc. Secondary market and vending system for devices
US11010841B2 (en) 2008-10-02 2021-05-18 Ecoatm, Llc Kiosk for recycling electronic devices
EP3255753A1 (en) 2008-10-02 2017-12-13 EcoATM, Inc. Secondary market and vending system for devices
US10853873B2 (en) 2008-10-02 2020-12-01 Ecoatm, Llc Kiosks for evaluating and purchasing used electronic devices and related technology
US9518254B2 (en) * 2009-05-04 2016-12-13 San Diego State University Research Foundation Compositions and methods for identifying enzyme and transport protein inhibitors
US9169312B2 (en) 2010-09-21 2015-10-27 San Diego State University Research Foundation Compositions and methods for identifying enzyme and transport protein inhibitors
US8940297B2 (en) 2010-12-22 2015-01-27 Saint Louis University Expression of thrombin variants
TWI690594B (zh) 2011-01-21 2020-04-11 美商賽瑞諾斯Ip有限責任公司 樣本使用最大化之系統及方法
JP5965925B2 (ja) * 2011-03-11 2016-08-10 メルツ ファルマ ゲーエムベーハー ウント コンパニー カーゲーアーアー ボツリヌス神経毒生物活性の決定のための方法
US9619627B2 (en) 2011-09-25 2017-04-11 Theranos, Inc. Systems and methods for collecting and transmitting assay results
US9268915B2 (en) 2011-09-25 2016-02-23 Theranos, Inc. Systems and methods for diagnosis or treatment
US9632102B2 (en) 2011-09-25 2017-04-25 Theranos, Inc. Systems and methods for multi-purpose analysis
US8435738B2 (en) 2011-09-25 2013-05-07 Theranos, Inc. Systems and methods for multi-analysis
US20140170735A1 (en) 2011-09-25 2014-06-19 Elizabeth A. Holmes Systems and methods for multi-analysis
US8840838B2 (en) 2011-09-25 2014-09-23 Theranos, Inc. Centrifuge configurations
US8475739B2 (en) 2011-09-25 2013-07-02 Theranos, Inc. Systems and methods for fluid handling
US9664702B2 (en) 2011-09-25 2017-05-30 Theranos, Inc. Fluid handling apparatus and configurations
US9250229B2 (en) 2011-09-25 2016-02-02 Theranos, Inc. Systems and methods for multi-analysis
US10012664B2 (en) 2011-09-25 2018-07-03 Theranos Ip Company, Llc Systems and methods for fluid and component handling
US9810704B2 (en) 2013-02-18 2017-11-07 Theranos, Inc. Systems and methods for multi-analysis
US10466233B2 (en) 2012-04-13 2019-11-05 Centro De Estudios Cientificos De Valdivia Genetically encoded probe for quantification of lactate and methods for quantifying metabolic rates and lactate transport
BR112014030281A2 (pt) * 2012-06-07 2017-09-12 Futuragene Israel Ltd planta transgênica, e, métodos de cocultivar plantas, de desenvolver uma planta em condição sombreada, e de aumentar o nível de nitrogênio em solo
KR101523548B1 (ko) * 2014-02-19 2015-05-29 울산대학교 산학협력단 아미노산 검출용 재조합 미생물 및 그 제조 방법
KR101633473B1 (ko) * 2014-05-12 2016-06-27 부산대학교 산학협력단 단백질분해효소 검출센서
CA2964214C (en) 2014-10-02 2020-08-04 ecoATM, Inc. Wireless-enabled kiosk for recycling consumer devices
CA2964223C (en) 2014-10-02 2020-04-14 ecoATM, Inc. Application for device evaluation and other processes associated with device recycling
US10445708B2 (en) 2014-10-03 2019-10-15 Ecoatm, Llc System for electrically testing mobile devices at a consumer-operated kiosk, and associated devices and methods
WO2016069738A1 (en) 2014-10-31 2016-05-06 ecoATM, Inc. Systems and methods for recycling consumer electronic devices
WO2016094789A1 (en) * 2014-12-12 2016-06-16 ecoATM, Inc. Systems and methods for recycling consumer electronic devices
WO2018035387A1 (en) * 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems
US11352647B2 (en) 2016-08-17 2022-06-07 The Broad Institute, Inc. Crispr enzymes and systems
CN108535240A (zh) * 2018-04-13 2018-09-14 江南大学 以牛血清蛋白-铜纳米簇催化鲁米诺化学发光检测胰蛋白酶的方法
WO2020167849A1 (en) 2019-02-12 2020-08-20 Ecoatm, Llc Connector carrier for electronic device kiosk
KR20210126068A (ko) 2019-02-12 2021-10-19 에코에이티엠, 엘엘씨 중고 전자 디바이스를 평가하고 구매하기 위한 키오스크
JP2021530793A (ja) 2019-02-18 2021-11-11 エコエーティーエム, エルエルシー 電子デバイスの物理的状態評価に基づくニューラルネットワーク、および関連付けられるシステムおよび方法
US11922467B2 (en) 2020-08-17 2024-03-05 ecoATM, Inc. Evaluating an electronic device using optical character recognition
WO2022147138A1 (en) * 2020-12-31 2022-07-07 /1Glympse Bio, Inc. Ex vivo detection of pathogens in body fluid samples

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4644055A (en) * 1984-12-17 1987-02-17 E. I. Du Pont De Nemours And Company Method for preparing specific inhibitors of virus-specified proteases
US5171662A (en) * 1990-09-13 1992-12-15 The Upjohn Company Method of detecting HIV protease activity
US5989838A (en) * 1992-03-11 1999-11-23 Institute Of Virology, Slovak Academy Of Sciences Immunological methods of detecting MN proteins and MN polypeptides
US5491084A (en) * 1993-09-10 1996-02-13 The Trustees Of Columbia University In The City Of New York Uses of green-fluorescent protein
US5958713A (en) * 1995-01-31 1999-09-28 Novo Nordisk A/S Method of detecting biologically active substances by using green fluorescent protein
US5861267A (en) * 1995-05-01 1999-01-19 Vertex Pharmaceuticals Incorporated Methods, nucleotide sequences and host cells for assaying exogenous and endogenous protease activity
US5767233A (en) * 1995-05-12 1998-06-16 Schering Corporation Soluble cleavable substrates of the hepatitis C virus protease
WO1998016657A1 (en) 1996-10-17 1998-04-23 Chiron Corporation Protease regulator screening assay
US6265204B1 (en) * 1997-01-17 2001-07-24 Genencor International, Inc. DNA sequences, vectors, and fusion polypeptides for secretion of polypeptides in filamentous fungi
US6280940B1 (en) * 1998-08-05 2001-08-28 Agouron Pharmaceuticals, Inc. Reporter gene system for use in cell-based assessment of inhibitors of the Hepatitis C virus protease
US6326354B1 (en) * 1998-08-19 2001-12-04 Washington University Modulation of apoptosis with bid
US6117639A (en) * 1998-08-31 2000-09-12 Vertex Pharmaceuticals Incorporated Fusion proteins, DNA molecules, vectors, and host cells useful for measuring protease activity
US6245884B1 (en) * 1998-10-16 2001-06-12 Vivian Y. H. Hook Secretases related to alzheimer's dementia
EP1055929A1 (en) 1999-05-26 2000-11-29 Tibotec N.V. Means and methods for drug discovery and the phenotypic characterisation of cells
FI106364B (fi) 1999-06-21 2001-01-31 Lehtoluoto Eeva Liisa Ihonpuhdistuslaite
AU7131900A (en) 1999-06-21 2001-01-09 Cellomics, Inc. A system for cell-based screening
US20020025508A1 (en) * 2000-01-06 2002-02-28 Katja Fechteler Process for finding a protease inhibitor
US6333167B1 (en) * 2000-03-10 2001-12-25 American Home Products Corp. Methods and reagents for identifying inhibitors of proteolysis of membrane-associated proteins
CA2454238A1 (en) * 2001-07-31 2003-02-13 Clontech Laboratories, Inc. Method of detecting protease activity in a cell
AU2002330756B2 (en) 2001-08-10 2009-07-16 Ahram Biosystems Inc. System for detecting protease

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110018143A (zh) * 2019-03-29 2019-07-16 深圳大学 检测甲藻细胞凋亡的方法

Also Published As

Publication number Publication date
AU2009225327A1 (en) 2009-11-05
CA2457059A1 (en) 2003-02-20
WO2003014381A1 (en) 2003-02-20
CN1553962A (zh) 2004-12-08
CN100535123C (zh) 2009-09-02
WO2003014381A9 (en) 2004-05-13
EP1423527A1 (en) 2004-06-02
US20030100707A1 (en) 2003-05-29
JP4522697B2 (ja) 2010-08-11
US7855072B2 (en) 2010-12-21
US20110294697A1 (en) 2011-12-01
US20070269812A1 (en) 2007-11-22
KR100522974B1 (ko) 2005-10-19
JP2004538006A (ja) 2004-12-24
EP1423527A4 (en) 2005-04-27
AU2002330756B2 (en) 2009-07-16
KR20030014184A (ko) 2003-02-15
JP2009100754A (ja) 2009-05-14
US7109293B2 (en) 2006-09-19

Similar Documents

Publication Publication Date Title
CN100535123C (zh) 蛋白酶检测系统
AU2002330756A1 (en) System for detecting protease
US6884870B2 (en) Fusion proteins for identifying proteases, protease target sites and regulators of protease activity in living cells
Molloy et al. Intracellular trafficking and activation of the furin proprotein convertase: localization to the TGN and recycling from the cell surface.
US5958713A (en) Method of detecting biologically active substances by using green fluorescent protein
JP2012254988A (ja) 改変された特異性を有するプロテアーゼを作製する方法およびスクリーニングする方法
US7883863B2 (en) Apparatuses and methods for determining protease activity
JP2004538006A5 (zh)
JP2002505077A (ja) 抗病原体システムおよびその使用方法
US6890745B1 (en) Protease specific cleavable luciferases and methods of use thereof
CA2454238A1 (en) Method of detecting protease activity in a cell
KR100919637B1 (ko) 세포내 과정의 관측 및 신약 검색을 위한 시스템
US7015023B1 (en) Compositions and methods for detection of active proteases
US7354735B2 (en) Nucleic acid encoding fluorescent protein constructs and methods for detecting apoptosis
Gunne et al. Efficient secretion of attacin from insect fat‐body cells requires proper processing of the prosequence
US20040042961A1 (en) Development of an in vivo functional assay for proteases
US7148018B2 (en) Protease-activated receptor (par) modulator assays
JP4708326B2 (ja) タンパク質分解酵素の検出のための改善された方法
Valverde et al. Autoprocessing of the human immunodeficiency virus type 1 protease precursor expressed in Escherichia coli from a synthetic gene
KR101187513B1 (ko) 변경된 특이성을 갖는 프로테아제의 제조 및 선별 방법
Dalal Baculovirus expression vector system: Tools for aiding protein expression

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100331