CN108289428A - 一种方法 - Google Patents

一种方法 Download PDF

Info

Publication number
CN108289428A
CN108289428A CN201680067126.8A CN201680067126A CN108289428A CN 108289428 A CN108289428 A CN 108289428A CN 201680067126 A CN201680067126 A CN 201680067126A CN 108289428 A CN108289428 A CN 108289428A
Authority
CN
China
Prior art keywords
leu
ala
gly
ser
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680067126.8A
Other languages
English (en)
Inventor
S·珀恩
K·S·哈里斯
M·A·安德森
D·科莱克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HIRSCHMAN CO Ltd
University of Queensland UQ
Original Assignee
HIRSCHMAN CO Ltd
University of Queensland UQ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2015903984A external-priority patent/AU2015903984A0/en
Application filed by HIRSCHMAN CO Ltd, University of Queensland UQ filed Critical HIRSCHMAN CO Ltd
Publication of CN108289428A publication Critical patent/CN108289428A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本公开教导了用于在植物中产生环状肽的方法。术语“环状肽”包括但不限于环肽。环状肽可以是天然地环状的,或者可以是在植物中导致呈环状的天然线性肽。在一个实施方案中,从植物提取环状肽以用于多种应用,包括药理学应用,诸如癌症、心血管疾病、传染病、免疫疾病和疼痛的治疗。在另一个实施方案中,环状肽保护植物或植物部分免受病原体感染或侵染。

Description

一种方法
申请数据
本申请与2015年9月30日提交的标题为“A method”的澳大利亚临时专利申请No.2015903984和2015年10月5日提交的标题为“A method”的澳大利亚临时专利申请No.2015904036相关并要求其优先权,所述临时专利申请的全部内容通过引用并入本文。本说明书涉及序列表。“ST25.txt”文件是ANSI格式。该文件通过引用整体并入本说明书。
背景
领域
本公开总体上涉及在植物中生产环状肽。
相关领域的描述
本说明书中由作者引用的出版物的著录项目内容按字母顺序收集在说明书结尾处。
本说明书中对任何现有技术的引用不是且不应被视为承认或以任何方式暗示该现有技术构成任何国家的公知常识的一部分。
蛋白酶在整个自然界中是丰富的,并且对于广泛的细胞过程是必不可少的。它们通常用于水解多肽链,导致靶序列降解或成熟为生物活性形式。不太常见的是,蛋白酶可以充当连接酶来连接不同的多肽,产生新的或以变通方式剪接的变体。已报道了用于诸如以下的过程的这种不常见的功能:外源凝集素伴刀豆球蛋白A的成熟(Sheldon等(1996)Biochem.J.320:865–870)、通过主要组织相容性复合物I类分子的肽呈递(Hanada等(2004)Nature 427:252-256)以及细菌蛋白至细胞壁的锚定(Mazmanian等(1999)Science(80)285:760–763)。这种酶促转肽作用还涉及核糖体合成的环状肽的骨架环化(Barber等(2013)J.Biol.Chem.288:12500–12510;Nguyen等.(2014)Nat.Chem.Biol.10:732–738;Luo等(2014)Chem.Biol.21:1610-1617;Lee等(2009)J.Am.Chem.Soc.131:2122–2124)。
基因编码的环状肽已经在包括植物、真菌、细菌和动物的一系列生物体中被鉴定(Arnison等(2013)Nat Prod Rep 30:108–160)。在植物中,它们被分成四类:环肽类(例如原型环肽kalata B1[kB1])[Gillon等(2008)Plant J.53:505–515;Saska等(2007)J.Biol.Chem.282:29721–29728];PawS衍生的胰蛋白酶抑制剂(例如,向日葵胰蛋白酶抑制剂(SFTI))[Mylne等(2011)Nat.Chem.Biol.7:257–9];knottin胰蛋白酶抑制剂(例如,木鳖子胰蛋白酶抑制剂(MCoTI-II))[Mylne等(2012)Plant Cell 24:2765–78];和orbitides(例如segetalins)[Barber等(2013)同上]。其中,虽然环肽是研究得最深入的,但它们在植物中的重组生产迄今已经面临重大的技术挑战。
环肽最早在非洲植物白花蛇舌草(Oldenlandia affinis)中被鉴定出来,其显示针对农业相关害虫的杀虫、杀线虫和杀钉螺活性(Jennings等(2001)Proc.Natl.Acad.Sci.U.S.A.98:10614–10619;Plan等(2008)J.Agric.Food Chem.56:5237–5241;Colgrave等(2008)Biochemistry 47:5581–5589;Colgrave等(2009)ActaTrop.109:163–6)。其它报道的功能包括神经降压肽拮抗作用(Witherup等(1994)J.Nat.Prod 57:1619–1625)、抗HIV活性(Gustafson等(2000)J.Nat.Prod 63:176–178)、抗微生物活性(Tam等(1999)Proc.Natl.Acad.Sci.U.S.A.96:8913–8918)、细胞毒性活性(Lindholm等(2002)Mol.Cancer Ther.1:365–369)、子宫收缩活性(Gran(1973)Actapharmacol.toxicol.33:400–408)以及溶血(Tam等(1999)同上)和防污性质(Goransson等(2004)J.Nat.Prod.67:1287–1290)。环肽的特征在于胱氨酸结基序,其与主链环化一起赋予优异的稳定性。这已在环肽框架作为药物支架方面备受关注;通过将生物活性序列成功嫁接到和胰蛋白酶抑制剂环肽中(Poth等(2013)Biopolymers 100:480–91)提高了这一潜力。主链环化还可增加生物活性线性肽的稳定性和口服活性,表明这种修饰将获得广泛的应用(Clark等(2005)Proc.Natl.Acad.Sci.United States Am.102:13767-13772;Clark等(2010)Angew.Chem.Int.Ed.Engl.49:6545–8;Chan等(2013)Chembiochem14:617–24)。然而,在非天然环肽生产者的转基因植物中环肽的表达很差,阻碍了农业相关生物活性向其它植物的转移(Gillon等(2008)同上;Conlan等(2012)J.Biol.Chem.287:28037–46)。因此,阐明环肽生物合成固有的酶促环化机制不仅对于实现环肽的药物和农业潜力、而且对于提高不相关的生物活性肽的环化效率都是重要的。
环肽由前体分子产生,在所述前体分子中环肽序列通常侧接N-末端和C-末端前肽。第一加工事件是除去N-末端前肽,产生与C-末端前结构域保持连接的线性前体(Gillon等(2008)同上)。最终的成熟步骤涉及该C末端区域的酶促切割以及随后的游离C端和N端的连接。然而,迄今为止仅鉴定了四种天然环化酶(Barber等(2013)同上;Nguyen等(2014)同上;Luo等(2014)同上;Lee等(2009)同上;Gillon等(2008)同上)。这些酶中获得最确切表征的是丝氨酸蛋白酶PatG,其负责细菌蓝细菌素的成熟(Lee等(2009)同上)。在植物中,据报道丝氨酸蛋白酶PCY1促进segetalins(来自石竹科的环状肽)的环化(Barber等(2013)同上)。在其它三类植物来源的环状肽中,C-末端切割位点的P1残基处的强Asx序列保守性表明称为液泡加工酶(VPE)或天冬酰胺酰内肽酶(AEP)的一组半胱氨酸蛋白酶参与该过程(Gillon等(2008)同上)。
从产生环肽的植物蝶豆中分离出称为蝶豆粘酶-1(butelase-1)的AEP,其显示环化来自白花蛇舌草的kB1的经修饰的前体,证实了该组酶体外介导环化的能力(Nguyen等(2014)同上),条件是在待环化的多肽前体的末端添加适当的识别序列。已经重组地生产了仅一种具有任何环化能力的AEP,该AEP是非常低效的,主要产生水解底物(Bernath-Levin等(2015)Chemistry&Biology 22:1-12)。还没有AEP被有效地用于在植物中生产环状肽。存在开发在植物中高效产生环状肽的方法的需要。
概述
本公开教导了用于在植物中产生环状肽的方法。术语“环状肽”包括但不限于环肽。环状肽可以是天然地环状的,或者可以是在植物中呈环状的天然线性肽。在一个实施方案中,从植物提取环状肽以用于多种应用,包括药理学应用,诸如癌症、心血管疾病、传染病、免疫疾病和疼痛的治疗。在另一个实施方案中,环状肽保护植物或植物的部分免受病原体感染或侵染。
因此,在本文中提供了一种在植物或植物的种子或者其后代或后代的种子中产生环状肽的方法,所述方法包括在足以产生环状肽的条件下共表达编码具有肽环化活性的天冬酰胺酰内肽酶(AEP)液泡加工酶和编码环状肽的线性多肽前体的重组核酸一段时间。“重组核酸”包括单个多核苷酸或多个多核苷酸。可将重组核酸整合至染色体中或作为染色体外元件维持。核酸可以是一种或多种微生物真核或病毒载体的一部分。提及“环状肽”时也包括“环肽”。在一个实施方案中,将编码多肽前体的重组核酸引入包含稳定引入的编码AEP的重组核酸的植物细胞中,其中再生表达该AEP的植物。因此,本文考虑了编码多肽前体的核酸的瞬时表达。或者,将编码AEP的核酸引入编码多肽前体的植物或种子细胞。
本文中教授了其中编码AEP和多肽前体的每一种的重组核酸在两种相应的核酸构建体中表达的方面。或者,编码AEP和多肽前体的每一种的重组核酸在单个核酸构建体中表达。后者的实例是由包含两个或更多个转录区段的多核苷酸组成的多基因表达载体(MGEV),每个区段编码功能性蛋白质,每个区段通过编码接头肽的接头转录区段以线性序列连接至下一个区段,所述转录区段全部处于与单个启动子和终止子可操作连接的相同阅读框架中,其中至少一个区段编码AEP并且至少一个其它区段编码所述多肽前体。或者,核酸构建体是病毒表达载体,诸如但不限于病毒载体内的MGEV构建体。如上所示,在一个实施方案中,植物用AEP或前体多肽之一来稳定地转化并表达,然后将编码和表达AEP或多肽中另一种的核酸引入植物细胞。然后将转化的植物细胞再产生植物。病毒载体或微生物载体或鸟枪转化可用于引入第二核酸。
可将核酸可操作地连接至诱导型或组成型启动子。在一个实施方案中,启动子是组织特异性启动子。实例包括对选自叶、茎、花、种子和根的组织特异的组织特异性启动子。在一个实施方案中,启动子是种子特异性启动子。
所述线性多肽前体包含C末端AEP加工位点。通常但非排他地,所述C-末端加工位点是定义为在实际切割位点之前包含P3至P1并且在朝向C-末端的切割位点之后包含P1'至P3”的氨基酸序列。在一个实施方案中,P3至P1和P1'至P3'具有以下氨基酸序列:
X2X3X4X5X6X7
其中X为氨基酸残基,并且:
X2为任选的或任何氨基酸;
X3为任选的或任何氨基酸;
X4为N或D;
X5为G、F、S或A;
X6为L、A或I;和
X7为任选的或任何氨基酸。
在一个实施方案中,X2至X7包含以下氨基酸序列:
X2X3NGLX7
其中X2、X3和X7是如上所定义的。
线性多肽前体的N-末端可以不含特异性AEP加工位点,或者可以含有由P1"至P3"中任一个定义的加工位点,其中P1"至P3"由以下定义:
X9X10X11
其中X为氨基酸残基:
X9为G;
X10为任选的或任何氨基酸或L、A、F或I或疏水性氨基酸;
X11为任选的和任何氨基酸。
在一个实施方案中,X9至X11包含氨基酸序列:
GLX11
其中X11是如上所定义的。
在一个实施方案中,AEP加工位点包含含有以下序列的N端和C端末端序列:
GLX11[Xn]X2X3NGLX7
其中X11、X2、X3和X7为如上所定义的,并且[Xn]不存在(n=0)或为1至2000个氨基酸的序列中的任何氨基酸残基。
在一个实施方案中,C-末端加工位点包含P4至P1和P1'至P4',其中P1至P4和P1'至P4'包含X1X2X3X4X5X6X7X8,其中X2至X7为如上所定义的,并且X1为任选的或任何氨基酸,以及X8为任选的或任何氨基酸。
AEP可以来自任何来源,诸如但不限于来自耳草属(Oldenlandia)。一个这样的物种是白花蛇舌草。实例包括OaAEP1b(SEQ ID NO:2)、OaAEP1(SEQ ID NO:4)、OaAEP2(SEQ IDNO:6)和OaAEP3(SEQ ID NO:4)或其保留天冬酰胺酰内肽酶和环化活性的变体、衍生物或杂合体形式。在一个实施方案中,AEP具有在最佳比对后与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6或SEQ ID NO:8中的任一个有至少80%相似性的氨基酸序列。在一个实施方案中,AEP具有在最佳比对后与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:8中的任一个有至少80%相似性的氨基酸序列。在一个实施方案中,AEP具有在最佳比对后与SEQ ID NO:6中的任何一个有至少80%相似性的氨基酸序列。在一个实施方案中,AEP由选自SEQ ID NO:2、4、6和8或SEQ ID NO:2、4和8或SEQ ID NO:6的氨基酸序列定义。
在一个实施方案中,从植物中提取环状肽。其可具有许多活性中的任一种,诸如可用于治疗癌症、心血管疾病、传染病、免疫疾病和疼痛的药理学活性。环状肽还可包含融合或嵌入在环肽主链框架中的功能部分。还可以产生环状肽以保护植物免受病原体感染或侵染(诸如抗真菌、细菌、线虫、血吸虫、软体动物、蠕虫、病毒或原生动物生物体)。
通常在可被大量生产来提取肽的植物中实施该方法。植物的例子包括选自本塞姆氏烟草(N.benthamiana)、烟草、卡罗拉(canola)、马铃薯、布什豆(bush bean)、玉米、大豆、小麦、苜蓿、大麦、蓖麻子、三叶草、棉花、亚麻、燕麦、油菜、水稻、黑麦、黑麦草、红花、高粱、甜菜、向日葵、番茄、莴苣、芹菜、西兰花、花椰菜、葫芦、洋葱和观赏性开花植物的植物。在一个实施方案中,植物选自本塞姆氏烟草、烟草、卡罗拉、马铃薯和布什豆。拟南芥(Arabidopsis)也是一种有用的测试模型。
本文还进一步提供一种经遗传修饰的植物或其遗传修饰的后代或者所述植物的种子或来自其后代的种子,其中具有包含编码具有肽环化活性的天冬酰胺酰内肽酶(AEP)液泡加工酶和编码环状肽的线性多肽前体的重组核酸的细胞,其中所述细胞产生所述环状肽。其可包含编码AEP和多肽前体的两个相应的核酸构建体或单个核酸构建体(诸如但不限于由包含通过接头肽彼此连接在线性序列中的一个或多个功能性蛋白质的多核苷酸组成的多基因表达载体),所述多核苷酸被编码在可操作地连接至单个启动子和终止子的单个阅读框架中,其中至少一个蛋白质是AEP并且另一个蛋白质是环状肽的多肽前体。如上所示,可使用稳定表达AEP或前体多肽中的一种或另一种的植物细胞作为宿主来接受编码AEP或前体多肽中的另一种的核酸。
或者,核酸构建体是病毒表达载体。例如,病毒表达载体可含有编码AEP和通过接头多肽连接的前体多肽的MGEV,所述接头多肽被切割以产生两种分开的蛋白质。或者,可将编码AEP或前体多肽中的一个或另一个的病毒表达载体引入稳定表达AEP或前体多肽中的另一种的植物。所述植物可在所有组织或特定组织诸如但不限于叶、茎、花、根或种子中产生环状肽。
在一个实施方案中,AEP来源于白花蛇舌草,诸如但不限于OaAEP1b、OaAEP1、OaAEP2、OaAEP3或保留天冬酰胺酰内肽酶和环化活性的其变体、衍生物或杂合体形式。在一个实施方案中,AEP是OaAEP1b、OaAEP1或OaAEP3。在一个实施方案中,AEP是OaAEP2。在另一个实施方案中,AEP来源于产生环肽的植物的属。在又一个实施方案中,AEP来自产生环肽的植物。实例包括碧冬茄属(Petunia)、苦瓜属(Momordica)和堇菜属(Viola)的种。在另外一个实施方案中,AEP来自蝶豆(Clitoria ternatea),诸如但不限于CtAEP2(SEQ ID NO:26)和CtAEP6(先前称为CtAEP5)[SEQ ID NO:28]。
如上所述,环状肽是从植物中提取的,并且表现出活性,诸如可用于治疗癌症、肥胖症、心血管疾病、传染病、免疫疾病和疼痛的治疗性活性。环状肽还可包含融合或嵌入在环肽主链框架中的功能性肽。或者,环状肽保护植物或种子免受病原体感染或侵染。在一个实施方案中,病原体是真菌、细菌、线虫、蠕虫、血吸虫、软体动物、病毒或原生动物生物体。
经遗传修饰的植物包括选自下述的植物:烟草、塞姆氏烟草、马铃薯、布什豆、玉米、大豆、小麦、苜蓿、大麦、蓖麻子、三叶草、棉花、亚麻、燕麦、油菜、水稻、黑麦、黑麦草、红花、高粱、甜菜、向日葵、番茄、莴苣、芹菜、西兰花、花椰菜、葫芦、鹰嘴豆、甘蔗、香蕉、洋葱和观赏性开花植物以及拟南芥。
本文提供了用于从植物产生和提取环状肽的系统,所述系统包括维持经遗传修饰的植物,所述植物包含表达编码具有肽环化活性的天冬酰胺酰内肽酶(AEP)液泡加工酶的重组核酸的细胞,其中该系统需要将能够表达环状肽的线性多肽前体的核酸分子导入植物细胞,再生植物并在足以使植物细胞产生环状肽的条件下培育植物或其后代,然后提取环状肽。环状肽可呈分离形式或包含在提取物或分离的植物或种子组织中。
本文还教导了用于从植物产生和提取环状肽的系统,所述系统包括维持经遗传修饰的植物,所述经遗传修饰的植物包含表达编码前体多肽的重组核酸的细胞,其中所述系统需要将能够表达天冬酰胺酰内肽酶(AEP)的核酸分子引入植物细胞,并在足以使植物细胞产生环状肽的条件下生长植物或其后代,然后提取环状肽。
这种系统是在植物中产生环状肽的有用方法。可将该系统按比例扩大用于大规模生产可收获的植物材料,然后将其进行处理以提取环状肽。
在另一个实施方案中,该系统包括引入环状肽的前体以用于稳定转化,或具有表达AEP的稳定转化的植物,然后引入前体或病毒载体用于瞬时表达和收获。病毒载体可以包含编码AEP和前体多肽两者的MGEV。
表1中提供了在整个说明书中使用的序列标识符的概述。
表1
序列标识符的概述
附图简述
一些图包含颜色表示或实体。可以专利权人应要求或从合适的专利局获取彩色照片。如果从专利局获取,则可能会收费。
图1A是Oak1基因的示意图。由Oak1基因编码的前体蛋白质被蛋白水解加工以产生成熟的kB1。依次显示的结构域是:ER信号肽(ER SP)、N-末端前肽(NTPP)、N-末端重复序列(NTR)、环肽结构域(kalata B1)、C-末端前肽(CTPP)。虚线表示N末端和C末端加工位点,粗体星号表示rOaAEP1b切割位点。指示了C末端P1/P1’-P3/P3’位点。P1”-P3”表示在C-末端前肽释放后替代P1’-P3’残基的N末端残基。图1B是由Oak1基因(SEQ ID NO:14)编码的氨基酸序列的图示。按顺序显示的结构域是ER信号肽(斜体)、NTPP(灰色)、NTR(下划线)、环肽结构域和CTPP(粗体)。
图2A是由从白花蛇舌草基因组DNA(SEQ ID NO:2)分离的OaAEP1b基因编码的氨基酸序列的图示。预测的ER信号序列以灰色显示;N-末端前肽以斜体显示;推定的信号肽酶切割位点由空心三角形表示,并且自动催化加工位点由实心三角形表示。成熟的OaAEP-1环化酶结构域以下划线表示。推测对催化活性很重要的Cys216和His175以粗体显示并用星号标记。图2B是由来自蝶豆的Cter M前体基因编码的氨基酸序列(SEQ ID NO:56)的图示。ER信号肽加以双下划线;Cter M环肽结构域以粗体显示;间隔子区域以斜体显示;白蛋白-1链a区加下划线,并且C末端尾以灰色显示。
图3A是包含ER信号肽(ER SP)和OaAEP1b编码序列的OaAEP1b基因构建体的示意图。图3B是kalata B1基因构建体的示意图。为了环化其它肽,ER SP、NTPP、NTR和CTPP被保留,并且kalata B1肽结构域被外源肽结构域取代。图3C是其中CTPP已被氨基酸组氨酸和缬氨酸(蝶豆粘酶1的识别序列)的密码子替代的kalata B1基因构建体的示意图。另外,可以用另一种肽替代kalata B1肽结构域来进行环化。
图4A和4B是编码由MGEV接头EEKKND连接的OaAEP1b和肽结构域的构建体的示意图。图4A显示具有OaAEP1b ER信号、接着与kalata B1 NTPP和NTR连接的OaAEP1b基因、接着肽结构域的构建体。图4B显示具有kalata B1 ER信号、NTPP和NTR、接着与OaAEP1b连接的肽结构域的构建体。
图5A和5B是编码OaAEP1b和多个肽结构域的示例性构建体的示意图。OaAEP1b之前是ER信号肽,肽结构域侧接kalata B1 NTR和CTPP。OaAEP1b结构域和肽结构域可通过MGEV接头(EEKKN)连接(图5A)或直接连接(图5B)。
图6A和6B是具有多个肽结构域的示例性构建体的示意图。图6A显示具有kalataB1 ER信号、NTPP和NTR、第一肽结构域和通过MGEV接头(EEKKN)连接至第二肽结构域的kalata B1 CTPP、接着第二kalata B1 CTPP的构建体。图6B显示具有在N末端直接侧接kalata B1 ER信号、NTPP和NTR并且在C末端直接侧接kalata B1 CTPP的两个肽结构域的构建体。
图7A是具有kalata ER信号、NTPP和NTR、kalata B2环肽结构域、CTPP、NTR、kalataB3结构域和CTPP的Oak2a(kB2-kB3)构建体(SEQ ID NO:52)的示意图。图7B是具有kalataER信号、NTPP和NTR、kalata B2环肽结构域、CTPP、NTR、kalata B2结构域、CTPP、NTR、kalataB2结构域和CTPP的Oak4构建体(SEQ ID NO:54)的示意图。
图8A和8B是适用于稳定植物转化的双叠加构建体的示意图。构建体包含已被克隆至pBIN19二元载体的多克隆位点(Bevan(1984)Nucleic Acids Res 12:8711-8721)的Oak1和OaAEP1b(图8A)或Oak1-HV和CtAEP1(图8B)植物转录单位。
图9是用于线性肽前体表达的示例性构建体的示意图。该构建体包含Oak1侧翼序列,其中kalata B1肽结构域被待环化的肽的序列替换。所述肽序列包括向日葵胰蛋白酶抑制剂1(SFTI-1)[SEQ ID NO:31]和Momordica cochinchinensis胰蛋白酶抑制剂II(V03R)(MCoTI-II)[SEQ ID NO:36]、手链型环肽、cycloviolacin O13[SEQ ID NO:32]、移植至kalata B1的抗血管产生肽(cpr-3)[SEQ ID NO:33]和非环状肽α-芋螺毒素(Vcl.1)[SEQID NOs:34和35]。
图10是当OaAEP1b经由MGEV接头连接至Oak1时用于测试最小前体肽需求的构建体的示意图。构建体是pHEX 231(SEQ ID NO:74)、pHEX257(SEQ ID NO:76)、pHEX269(SEQ IDNO:78)和pHEX270(SEQ ID NO:80)。
图11是当Oak 1通过MGEV接头连接至OaAEP1b时用于测试最小前体肽需求的构建体的示意图。构建体是pHEX 232(SEQ ID NO:82)、pHEX286(SEQ ID NO:84)和pHEX269(SEQID NO:86)。
图12是用于测试Cter M前体的最小前体肽需求的构建体的示意图。构建体是CterM截短1(无白蛋白-1a链)[SEQ ID NO:88]、Cter M截短2(ER信号肽、环肽结构域和间隔子区域)[SEQ ID NO:90]和Cter M截短3(仅ER信号肽和环肽结构域)[SEQ ID NO:92]。
图13显示指示当在塞姆氏烟草中在OaAEP1b共表达或不共表达的情况下瞬时表达时,环状Oak1-MOG3和Oak1-MOG3D的存在或不存在的MALDI-TOF迹线。
图14是rOaAEP1b((~5μg/mL总蛋白)和rhuLEG(1.1μg/mL总蛋白)随时间推移针对荧光底物Z-AAN-MCA(100μM)的活性的图示。使用分别为320nm和420nm的激发和发射波长,以1分钟间隔跟踪活性90分钟。显示了单个代表性实验。RFU,相对荧光单位。
图15是在蛋白酶抑制剂存在下rOaAEP1b针对IQF肽Abz-STRNGLPS-Y(3NO2)[SEQ IDNO:49]的活性的图示。让rOaAEP1b(4.4μg/mL总蛋白)切割IQF肽(11μM)达90分钟。在90分钟时间点相对于无抑制剂对照报道在Ac-YVAD-CHO或Ac-STRN-CHO抑制剂存在时针对IQF肽的酶活性。
图16A和16B是植物和人AEP对wt(SEQ ID NO:49)和L31A(SEQ ID NO:50)IQF肽底物的底物特异性的图示。显示了rOaAEP1b(~3.5μg/mL总蛋白)(16A)和rhuLEG(1.1μg/mL总蛋白)(16B)针对50μM IQF肽底物的起始速度。显示两个独立实验的平均值,误差棒报告范围。
详述
在整个本说明书中,除非上下文另有要求,否则词语“包含”或变型诸如“包括”或“具有”将被理解为暗示包括所陈述的要素或整数或方法步骤,或者要素或整数或方法步骤的组,但不排除任何其它要素或整数或方法步骤,或者要素或整数或方法步骤的组。
如本说明书中所用,除非上下文另外明确指出,否则单数形式“一个/种(a)”、“一个/种(an)”和“该(the)”包括复数方面。因此,例如,“一个/种环状肽”包括单个/种环状肽以及两个/种或更多个/种环状肽;“一个/种AEP”包括单个/种AEP,以及两个/种或更多个/种AEP;提及“本公开”时包括由本公开教导的单个和多个方面等。术语“发明”涵盖本文教导和能够实现的方面。在本发明的范围内能够实现所有此类方面。在本发明的范围内实现所有此类方面。本文考虑的任何变体和衍生物均被本发明的“形式”所涵盖。术语“aa”在本文中用于表示“氨基酸”;“na”是指“核酸”。
本说明书教导了在植物或种子或其后代或后代的种子中产生环状肽的方法。术语“环状肽”涵盖“环肽”。该方法包括在植物的植物细胞中共表达编码以下物质的载体中的重组核酸:(i)具有肽环化活性的天冬酰胺酰内肽酶(AEP)液泡加工酶;和(ii)包含适当的酶识别序列的环状肽的线性多肽前体。AEP催化多肽前体的加工以促进环状肽的切除和环化。“线性多肽前体”或术语“多肽”包括“肽”。“肽”包括“多肽”。使用术语“蛋白质”、“多肽”或“肽”并不暗示大小限制或界定。
因此,对植物进行工程化以表达编码(i)AEP和(ii)环状肽的多肽前体的单个或多个载体。术语“植物”包括来自亲本或后代植物的后代和种子。
或者,所述方法包括维持经遗传修饰以稳定地产生异源AEP或前体多肽的植物或植物细胞,然后引入编码并且能够表达AEP或前体多肽中的另一种的核酸以使得能够产生环状肽。
线性多肽前体包含C末端AEP加工位点。通常但非排它地,C末端加工位点是定义为在实际切割位点之前包含P3至P1并且在朝向C末端的切割位点之后包含P1'至P3”的氨基酸序列。在一个实施方案中,P3至P1和P1'至P3'具有以下氨基酸序列:
X2X3X4X5X6X7
其中X为氨基酸残基,并且:
X2为任选的或任何氨基酸;
X3为任选的或任何氨基酸;
X4为N或D;
X5为G、F、S或A;
X6为L、A或I;以及
X7为任选的或任何氨基酸。
在一个实施方案中,X2至X7包含氨基酸序列:
X2X3NGLX7
其中X2、X3和X7是如上所定义的。
线性多肽前体的N-末端可以不含特异性AEP加工位点,或可包含由P1"至P3"中的任一个定义的加工位点,其中P1"至P3"由以下定义:
X9X10X11
其中X为氨基酸残基:
X9为G;
X10为任选的或任何氨基酸或L、A、F或I或疏水性氨基酸残基;
X11为任选的和任何氨基酸。
在一个实施方案中,X9至X11包含氨基酸序列:
GLX11
其中X11是如上定义的。
在一个实施方案中,AEP加工位点包含含有以下序列的N末端和C末端序列:
GLX11[Xn]X2X3NGLX7
其中X11、X2、X3和X7是如上文所定义的,并且[Xn]不存在(n=0)或为1至2000个氨基酸的序列中的任何氨基酸残基。
在一个实施方案中,C-末端加工位点包含P4至P1和P1'至P4',其中P1至P4和P1'至P4'包含X1X2X3X4X5X6X7X8,其中X2至X7是如上定义的,并且X1是任选的或任何氨基酸以及X8是任选的或任何氨基酸。
“载体”是指包含待递送到宿主植物细胞中的多核苷酸的重组质粒或病毒。待递送的多核苷酸包含AEP和/或多肽前体的编码序列。该术语包括主要用于将DNA或RNA插入至植物细胞中的载体和用于DNA或RNA的转录和/或翻译的表达载体。还包括提供不止一种上述功能的载体。
载体包括如国际专利申请第PCT/AU2007/000712号中所述的多基因表达载体(MGEV)。MGEV由包含2至8个区段的多核苷酸组成,每个区段编码功能性蛋白质,每个区段通过编码接头肽的接头区段以线性序列连接至下一区段,所述区段全部在可操作地连接至单个启动子和终止子的同一阅读框架中。根据本发明,至少一个区段编码AEP并且至少一个另外的区段编码多肽前体。载体还包括病毒表达载体。
在一个实施方案中,本文教导了编码在两个相应的核酸构建体中表达的AEP和多肽前体中的每一种的重组核酸。或者,编码AEP和多肽前体中的每一种的重组核酸在单个核酸构建体中表达。这些构建体在植物细胞或植物种子或其后代或后代的种子中表达。一个实例是由包含两个或更多个区段的多核苷酸组成的多基因表达载体,每个区段编码功能性蛋白质,每个区段通过编码接头肽的接头转录区段以线性序列连接至下一个区段,转录区段全都处于与单个启动子和终止子可操作连接的同一阅读框架中,其中至少一个区段编码AEP并且至少一个另外的区段编码多肽前体。
本文还教导了用于从植物产生和提取环状肽的系统,所述系统包括维持经遗传修饰的植物,所述经遗传修饰的植物包含表达编码前体多肽的重组核酸的细胞,其中所述系统需要将能够表达天冬酰胺酰内肽酶(AEP)的核酸分子引入植物细胞,并在足以使植物细胞产生环状肽的条件下培育植物或其后代,然后提取环状肽。
“植物细胞”是指由原生质体和细胞壁组成的植物的结构和生理学单位。
“原生质体”是没有细胞壁的分离的细胞,其具有再生成细胞培养物、组织或完整植物的潜力。
“宿主”细胞包括植物细胞。“宿主”也包括完整植物。
术语“核酸”、“多核苷酸”和“核苷酸”序列可互换使用。它们指具有任何长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)的聚合形式。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、由基因或基因片段的连锁限定的基因座、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和引物。
“基因”是指含有编码AEP或多肽前体并且能够被转录和翻译的至少一个开放阅读框的多核苷酸。
如本文中所用,“表达”是指籍以将多核苷酸转录单位转录成mRNA的过程和/或籍以随后将转录的mRNA(也称为“转录物”)翻译成AEP或多肽前体的过程。转录本和编码的多肽统称为“基因产物”。
在线性多肽前体的情况下,“线性序列”是多肽中氨基酸在N末端至C末端方向上的顺序,其中序列中彼此相邻的氨基酸残基在多肽的一级结构中邻接的。
“植物”包括本塞姆氏烟草、烟草、卡罗拉、马铃薯、布什豆、玉米、大豆、小麦、苜蓿、大麦、蓖麻子、三叶草、棉花、亚麻、燕麦、油菜、水稻、黑麦、黑麦草、红花、高粱、甜菜、向日葵、番茄、莴苣、芹菜、西兰花、花椰菜、葫芦、鹰嘴豆、甘蔗、香蕉、洋葱和观赏开花植物以及拟南芥。这些植物也可以被“遗传修饰”以表达待缀合的AEP和/或多肽前体或肽。因此,可以产生稳定表达编码AEP或线性多肽前体之一的核酸序列的植物。然后使用这种植物分别引入编码线性多肽前体或AEP中的另一种的重组核酸序列。拟南芥是有用的测试模型。
“病原体”包括选自真菌、细菌、线虫、蠕虫、血吸虫、软体动物、病毒和原生动物生物体的植物病原体。
在本文中提供了用于在植物或植物的种子或者其后代或后代的种子中产生环状肽的方法,所述方法包括在足以产生环状肽的条件下共表达包含重组核酸的载体一段时间,所述重组核酸编码具有肽环化活性的天冬酰胺酰内肽酶(AEP)液泡加工酶和编码环状肽的线性多肽前体。
本文中教导了用于在植物或植物种子或其后代或后代的种子中产生环状肽的方法,所述方法包括将能够表达AEP或前体蛋白质中的一种或另一种的核酸分子引入植物细胞,所述植物细胞已被遗传修饰以稳定地产生AEP或前体多肽中的另一种,从而使得能够在足以产生环状肽的条件下共表达AEP和前体多肽一段时间。
本发明扩展至具有肽环化活性的任何AEP。本文包括AEP,诸如但不限于来自白花蛇舌草的AEP:OaAEP1b(SEQ ID NO:2)、OaAEP1(SEQ ID NO:4)、OaAEP2(SEQ ID NO:6)和OaAEP3(SEQ IDNO:8)。其它AEP包括在最佳比对后与SEQ ID NO:2(OaAEP1b)、SEQ ID NO:4(OaAEP1)、SEQ ID NO:6(OaAEP2)或SEQ ID NO:8(OaAEP3)具有至少80%氨基酸相似性并保留天冬酰胺酰内肽酶和肽环化活性的AEP。在本文中还提供了在最佳比对后与SEQ ID NO:2(OaAEP1b)、SEQ ID NO:4(OaAEP1)或SEQ ID NO:8(OaAEP3)具有至少80%氨基酸相似性并且保留天冬酰胺酰内肽酶和肽环化活性的AEP。本文教导了在最佳比对后与SEQ ID NO:6(OaAEP2)具有至少80%氨基酸相似性的AEP。AEP也可来自产生环肽的植物,诸如但不限于碧冬茄属的多个种(例如矮牵牛(Petunia hybrida))、苦瓜属的多个种(例如,木鳖(Momordica cochinchinesis))和堇菜属的多个种(Viola spp.)。在另外一个实施方案中,AEP来自蝶豆,诸如但不限于CtAEP2(SEQ ID NO:26)和CtAEP6(先前称为CtAEP5)[SEQ IDNO:28]。
“至少80%”包括80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%和100%。
如本文所用,术语“相似性”包括在氨基酸水平上比较的序列之间的确切同一性。在氨基酸水平存在非同一性的情况下,“相似性”包括在结构、功能、生物化学和/或构象水平上仍然彼此相关的氨基酸。在一个特别优选的实施方案中,在同一性而非相似性的水平上进行氨基酸序列比较。
用于描述两个或更多个多肽之间的序列关系的术语包括“参考序列”、“比较窗口”、“序列相似性”、“序列同一性”、“序列相似性百分比”、“序列同一性百分比”、“基本上相似”和“实质等同”。“参考序列”包括至少10个连续氨基酸残基(例如10至100个氨基酸)。“比较窗口”是指与参考序列比较的通常10个连续氨基酸残基的概念区段。比较窗口与参照序列(其不包含添加或缺失)相比可以包含约20%或更少的添加或缺失(即缺口),以用于两个序列的最佳比对。用于比对比较窗口的序列的最佳比对可通过计算机化的算法运行(Wisconsin Genetics Software Package Release 7.0中BLASTP 2.2.32+、GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575Science Drive Madison,WI,USA)或通过检查通过所选择的各种方法中的任何方法产生的最佳比对(即导致比较窗口中最高百分比同源性)来进行。还可参考例如由Altschul等(1997)Nucl.Acids.Res.25:3389-3402公开的BLAST程序家族。序列分析的详细讨论可见于Ausubel等(1994-1998)In:CurrentProtocols in Molecular Biology,John Wiley&Sons Inc的单元19.3中。
如本文中所用,术语“序列相似性”和“序列同一性”是指序列在比较窗口中在逐个氨基酸基础上相同或者在功能上或结构上相似的程度。因此,例如,通过以下步骤计算“序列同一性百分比”:在比较窗口中比较两个最佳比对的序列,测定两个序列中在其上存在相同氨基酸残基(例如Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys和Met)的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置总数(即窗口大小),并将结果乘以100得到序列同一性的百分比。为了本发明的目的,“序列同一性”将被理解为意指通过BLASTP2.2.32+计算机程序计算的“匹配百分比”。类似的注解适用于序列相似性。
在一个实施方案中,本文教导了用于在植物或植物种子或者其后代或后代种子中产生环状肽的方法,所述方法包括在足以产生环状肽的条件下共表达重组核酸一段时间,所述重组核酸编码在最佳比对后与SEQ ID NO:2具有至少80%相似性的氨基酸序列的具有肽环化活性的AEP液泡加工酶和编码所述环状肽的线性多肽前体。
在一个相关实施方案中,本文提供了用于在植物或植物种子或其后代或后代的种子中产生环状肽的方法,所述方法包括在足以产生环状肽的条件下共表达重组核酸一段时间,所述重组核酸编码具有在最佳比对后与SEQ ID NO:4具有至少80%相似性的氨基酸序列的具有肽环化活性的AEP液泡加工酶和编码所述环状肽的线性多肽前体。
在一个相关实施方案中,本文中公开了用于在植物或植物种子或其后代或后代的种子中产生环状肽的方法,所述方法包括在足以产生环状肽的条件下共表达重组核酸一段时间,所述重组核酸编码具有在最佳比对后与SEQ ID NO:6具有至少80%相似性的氨基酸序列的具有肽环化活性的AEP液泡加工酶和编码所述环状肽的线性多肽前体。
在一个相关实施方案中,本文中教导了用于在植物或植物种子或其后代或后代的种子中产生环状肽的方法,所述方法包括在足以产生环状肽的条件下共表达重组核酸一段时间,所述重组核酸编码具有在最佳比对后与SEQ ID NO:8具有至少80%相似性的氨基酸序列的具有肽环化活性的AEP液泡加工酶和编码所述环状肽的线性多肽前体。
如上所示,“至少80%”意指80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
可对植物或植物种子的细胞进行工程化以稳定共表达AEP和前体多肽,或者植物、种子或者植物或种子的细胞可以稳定表达AEP或前体多肽中的一种或另一种,随后将其用于引入编码并表达AEP或前体多肽中的另一种的遗传物质。所述遗传物质可呈任何形式,诸如病毒、微生物或真核生物载体,并且可以涉及或可以不涉及MGEV。
在一个实施方案中,基于AEP被鉴定为具有环化能力来选择AEP。因此,本文教导了用于鉴定具有环化能力的AEP的方法,所述方法包括将待测试的AEP与荧光肽底物共孵育并使用针对这些底物的酶活性模式来鉴定环化AEP。该方法中的底物包含通用AEP底物Z-AAN-MCA(其中Z为羧基苄基;MCA为7-酰氨基-4-甲基香豆素)和8个残基的内部猝灭的荧光(IQF)肽。由于荧光供体/猝灭剂对的空间隔离,通过荧光强度随时间推移的升高来指示每种底物的酶切割。在一个实施方案中,在针对通用Z-AAN-MCA底物的活性不存在的情况下针对IQF肽的活性指示环化能力。在一个实施方案中,测试的IQF肽是Abz-STRNGLPS-Y(3NO2)和Abz-STRNGAPS-Y(3NO2)[其中Abz是邻氨基苯甲酸,并且(Y[3NO2])是3-硝基酪氨酸],并且在针对第二肽的活性不存在的情况下针对第一肽的活性指示环化能力。在一个实施方案中,在激发/发射波长320/420nm(IQF肽)或360/460nm(通用AEP底物)处随时间推移监测荧光强度。此类AEP包括与SEQ ID NO:2、4、6和/或8具有至少80%相似性的那些AEP。AEP包括与SEQ IDNO:2、4和/或8具有至少80%相似性的那些AEP。AEP包括与SEQ ID NO:6具有至少80%的相似性的那些AEP。
编码AEP和多肽前体的核酸可存在于分开的核酸载体中或为单个载体诸如多基因表达载体的一部分。在任一情况下,核酸都与载体中的启动子可操作地连接,所述启动子使得能够表达核酸以产生AEP和多肽前体的线性形式,然后其被加工成环状肽。在另一个实施方案中,维持包含经遗传修饰以产生AEP的细胞的植物,然后随后用任何给定的编码多肽前体的核酸转化所述植物的细胞。这包括在稳定地表达AEP的植物中瞬时表达编码多肽前体或肽的核酸。
本文中教导了用于在植物或植物种子或其后代或后代的种子中生产环状肽的方法,所述方法包括在足以产生所述环状肽的条件下共表达重组核酸一段时间,所述重组核酸编码具有肽环化活性的AEP和编码环状肽的线性多肽前体,其中编码所述AEP和所述多肽前体中的每一种的所述重组核酸在单个核酸构建体中表达,并且其中所述单个构建体是由包含至少两个转录区段的多核苷酸组成的多基因表达载体(MGEV),每个转录区段编码功能性蛋白质,每个转录区段通过编码接头肽的接头区段以线性序列连接至下一个区段,转录区段全部位于与单个启动子可操作地连接的同一阅读框架中,其中至少一个转录区段编码AEP并且至少一个另外的转录区段编码多肽前体。
在一个实施方案中,AEP包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6和/或SEQID NO:8中任何一个或多个具有至少80%相似性的氨基酸序列。在一个实施方案中,AEP包含与SEQ ID NO:2、SEQ ID NO:4和/或SEQ ID NO:8中的任何一个或多个具有至少80%相似性的氨基酸序列。在一个实施方案中,AEP包含与SEQ ID NO:6中的任一个或多个具有至少80%相似性的氨基酸序列。再次地,对“至少80%”意指80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。所述至少两个转录区段意指从2至8.
在另一个实施方案中,本文提供了用于在植物或植物种子或其后代或后代的种子中产生环状肽的方法,所述方法包括在足以产生所述环状肽的条件下共表达重组核酸一段时间,所述重组核酸编码具有肽环化活性的AEP和编码所述环状肽的线性多肽前体,其中编码AEP和多肽前体中的每一种的重组核酸在两个相应的核酸构建体中表达。
AEP包含与SEQ具有至少80%相似性的氨基酸序列。如上所述,“至少80%”意指80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
用于将异源DNA或RNA引入植物细胞和/或组织并选择所述异源DNA或RNA在其中的存在的技术和试剂是公知的。允许在植物细胞中选择异源DNA或RNA的遗传标记是公知的,例如,具有针对抗生素诸如卡那霉素、潮霉素、庆大霉素或博来霉素的抗性的基因。标记允许选择在含有适当抗生素的培养基中生长的成功转化的植物细胞,因为它们将具有相应的抗性基因。
通过土壤杆菌(Agrobacterium)介导的转化、电穿孔、显微注射、粒子轰击或本领域已知的其它技术,利用包含与异源编码序列或转录单元融合的诱导型启动子或嵌合启动子和转录终止序列的表达盒对植物细胞和/或组织进行遗传工程化,以引入植物细胞或组织。
可通过任何合适的方法将具有植物可表达的AEP基因或编码多肽前体的转录单位的核酸构建体插入植物的基因组中。此类方法可涉及例如脂质体、电穿孔、扩散、粒子轰击、显微注射、基因枪、增加游离DNA摄取的化学物质(例如磷酸钙共沉淀)、病毒载体和本领域实施的其它技术的使用。合适的植物转化载体包括来源于根癌土壤杆菌(Agrobacteriumtumefaciens)的Ti质粒的那些载体,诸如由Herrera-Estrella等(1983)EMBO J 2:987-995;Bevan等(1983)Nucleic Acids Res 11(2):369-385;Klee等(1985)Bio/Technology3:637-642和EPO公开120,516(Schilperoort等,欧洲专利公开120,516)公开的那些载体。除了来源于土壤杆菌的Ti或根诱导(Ri)质粒的植物转化载体以外,还可使用替代方法来将本发明的DNA构建体插入植物细胞中。
如本领域所熟知的,其中可操作地连接编码AEP或多肽前体的核酸的载体的选择直接取决于所需的功能特性,例如复制、蛋白质表达以及待转化的宿主细胞,这些是构建重组核酸分子领域中所固有的限制。
能够在植物细胞中表达重组核酸序列并且能够在宿主植物细胞中指导稳定整合的典型表达载体包括源自根癌土壤杆菌的肿瘤诱导(Ti)质粒的载体。
也称为经遗传修饰的植物的转基因植物可以通过本领域已知的任何标准方法产生,所述方法包括但不限于通常利用卸甲T-DNA载体的根癌土壤杆菌介导的DNA转移、电穿孔、直接DNA转移和粒子轰击。本领域公知用于将DNA引入单子叶植物以及双子叶植物的技术,以及用于培养此类植物组织和再生这些组织的技术。转基因植物的实例包括烟草、卡罗拉、马铃薯、布什豆、玉米、大豆、小麦、苜蓿、大麦、蓖麻、三叶草、棉花、亚麻、燕麦、油菜、水稻、黑麦、黑麦草、红花、高粱、甜菜、向日葵、番茄、莴苣、芹菜、西兰花、花椰菜、葫芦、洋葱和观赏性开花植物。
因为并非所有植物都是土壤杆菌的天然宿主,可以采用替代方法诸如原生质体的转化来将主题载体引入宿主细胞。对于某些单子叶植物,可使用基于磷酸钙沉淀、聚乙二醇处理、电穿孔和这些处理的组合的方法实现植物原生质体的转化。例如,参见Potrykus等(1985)Mol.Gen.Genet.,199:169 177,Fromm等(1986)Nature,319:791-793(1986)和Callis等(1987)Genes and Development,1:1183-1200。这些技术对不同植物物种的适用性可能取决于从原生质体再生该特定植物物种的可行性。用于从原生质体再生谷物的各种方法是本领域已知的。
除了原生质体转化以外,粒子轰击是用于将本发明载体递送至植物宿主细胞中的一种替代和方便的技术。具体而言,植物细胞可以用涂覆有多个主题载体的微粒轰击。用涂覆有DNA的微粒轰击已被成功地用于在植物和动物中产生稳定的转化体(参见,例如,Sanford等(1993)Methods in Enzymology,217:483 509)。适于将载体引入植物细胞的微粒通常由金属优选钨或金制成。这些微粒可以例如从BioRad(例如,Bio-Rad's PDS-1000/He)获得。本领域技术人员将会知道,通过改变参数诸如He压力、涂覆颗粒的数量、大载体与阻止屏幕之间的距离以及从阻止屏幕至靶标的飞行距离等,可以针对任何植物优化粒子轰击方案。
如Zhou等(1983)Methods in Enzymology,101:433所述,还可通过将DNA直接转移至花粉中来将载体引入植物中。用于将核酸引入植物细胞的其它技术包括:(a)手接种。手接种使用中性pH、低摩尔浓度磷酸盐缓冲液,加入硅藻土或金刚砂(通常约1%)来进行。将1至4滴制剂置于叶片的上表面并轻轻摩擦。(b)植物床的机械化接种。植物床接种通过将载体溶液喷雾(气体推进的)至牵引器驱动的割草机中同时切割叶子来进行。或者,将植物床进行割草并将载体溶液直接喷洒在切割的叶上。(c)单叶高压喷雾。单株植物接种还可通过用在缓冲的载体溶液中含有约1%金刚砂的窄的定向喷雾(50psi,距离叶片15-30cm)喷洒叶片来进行。(d)真空浸渗。接种可以通过使宿主生物体经受基本上真空压力的环境下促进感染来实现。
一旦被引入合适的宿主细胞中,就可使用本领域已知的任何测定法来测定转基因的表达。例如,转基因的转录的有义或反义链的存在可以通过常规杂交测定法(例如Northern印迹分析)、扩增程序(例如RT-PCR)、SAGE(美国专利第5,695,937号)和基于阵列的技术(参见,例如,美国专利第5,405,783号、第5,412,087号和第5,445,934号)来检测和/或定量。转基因编码待缀合的AEP或多肽前体或肽。
多核苷酸的表达还可通过检查蛋白质产物来测定。本领域有多种技术可用于蛋白质分析。它们包括但不限于放射免疫测定法、ELISA(酶联免疫放射测定法)、“夹心”免疫测定法、免疫放射测定法、原位免疫测定法(使用例如胶体金、酶或放射性同位素标记)、Western印迹分析、免疫沉淀测定、免疫荧光测定、质谱和PAGE-SDS。
通常,测定蛋白质水平涉及(a)提供含有多肽的生物样品;和(b)测量与转基因产物反应的抗体与样品中的组分之间发生的任何免疫特异性结合的量,其中免疫特异性结合的量指示表达的蛋白质的水平。特异性识别并结合转基因的蛋白质产物的抗体是免疫测定所必需的。这些可以从商业供应商处购买,或者使用本领域公知的方法产生和筛选。可通过匀浆植物细胞转化体或由其制备的后代或来自其的种子,并任选地使用去垢剂,优选非还原去垢剂诸如曲拉通和洋地黄皂苷增溶测试蛋白来制备测试蛋白质样品。可以例如使用已用测试蛋白质固定的组织切片或固体支持物,在溶液中或在固体组织样品上进行允许测试蛋白质与检测抗体相互作用的结合反应。复合物的形成可通过本领域已知的许多技术来检测。例如,可给抗体提供标记物,并且可以从复合物中除去未反应的抗体;剩余标记的量由此指示形成的复合物的量。将使用任何此类测定对来自植物转化体或其后代的样品获得的结果与来自作为对照的非转化来源的那些进行比较。
将本发明的植物宿主细胞在有利的条件下生长以实现多核苷酸的转录。还可将宿主细胞用于产生包含本发明的重组DNA或RNA载体的转基因植物。这些宿主细胞的实例包括能够再生成本文所列的植物的细胞。
因此,本发明提供了转基因植物或来自其的种子或其后代或其种子,其中携带编码AEP和多肽前体的一种或两种载体。从单种植物原生质体或各种外植体再生植物是本领域公知的。参见,例如Methods for Plant Molecular Biology,Weissbach和Weissbach,编辑,Academic Press,Inc.,San Diego,California,USA(1988)。该再生和生长过程包括选择转化体细胞和嫩芽,使转化体嫩芽生根并使小植株在土壤中生长的步骤。
从叶外植体再生包含通过根癌土壤杆菌引入的一种或多种主题载体的植物可如由Fraley等(1983)Proc.Natl.Acad.Sci.USA.,80:4803-4807所述来实现。在该过程中,在选择剂存在的情况下,在待转化的植物物种中诱导嫩芽再生的培养基中生长转化体。该方法通常在2至4周内产生嫩芽,然后将这些转化子嫩芽转移至含有选择剂和抗生素的适当根诱导培养基中以防止细菌生长。然后将在选择剂存在的情况下生根的转化体嫩芽移植至土壤中以产生根。如对于本领域普通技术人员来说是显而易见的,这些方法将根据所采用的具体植物种类而变化。
后代群体可以通过本领域熟知的方法从植物物种的第一和第二转化体产生,所述方法包括异体受精和无性繁殖。本发明中体现的转基因植物可用于生产所需的肽。环状肽可用于保护植物免受病原体感染或侵染,或被提取用于植物外使用。
本发明还考虑了用于产生环状肽的商业模式。在这一点上,本文提供了从植物产生和提取环状肽的系统,所述系统包括维持经遗传修饰的植物,所述经遗传修饰的植物包含表达编码具有肽环化活性的AEP的重组核酸的细胞,其中所述系统需要将能够表达环状肽的线性多肽前体的核酸分子引入植物细胞,再生植物并在足以使植物细胞产生环状肽的条件下培育植物或其后代,然后提取环肽。
所述商业模式使得能够收获植物或植物的一部分并提取环肽。商业模式是用于在可按比例放大以用于批量生产的系统中产生环状肽的有用方法。可收获植物材料并对其处理以提取环状肽。例如,烟草种植园可容易地适应大规模生产经遗传修饰的植物,所述经遗传修饰的植物产生用于提取的环状肽。这也适用于许多其它农作物。
提取的环状肽具有一系列有用的性质中的任一种,包括抗病原体、治疗性、疼痛缓解性、宫缩性和/或药理学活性。治疗活性(包括治疗肥胖症、癌症、心血管疾病、传染病和免疫疾病的治疗)的实例是神经降压素(neurotension)拮抗作用。还可将肽配制成农学上可接受的组合物,用于向植物或种子局部施用。
将农艺上可接受的载体用于配制本文公开的用于本方法实施的肽。本文中还能够确定适合于全身和表面施用的剂量,并且这在本领域普通技术的水平之内。通过适当选择载体和合适的制造实践,可将组合物(诸如配制成溶液的那些组合物)施用于植物表面(包括地上部分和/或根部),或作为包衣施用于种子表面。
适用于本文公开的系统的农学上有用的组合物包括其中以实现预期目的的有效量包含活性成分的组合物。有效量的确定完全在本领域技术人员的能力范围内,特别是根据本文提供的公开内容。
除了活性成分以外,用于抵抗植物病原体的这些组合物可含有合适的农学上可接受的载体,所述载体包含促进活性化合物加工成可用于田间、温室或实验室环境中的制剂的赋形剂和助剂。
抗病原体制剂包括水溶性形式的活性化合物的水溶液。另外,可将肽的悬浮液制备成适当的油性悬浮液。合适的亲脂性溶剂或载体包括脂肪油诸如芝麻油,或合成脂肪酸酯诸如油酸乙酯或甘油三酯,或脂质体。含水注射悬浮液可含有增加悬浮液粘度的物质,诸如羧甲基纤维素钠、山梨糖醇或葡聚糖。任选地,悬浮液还可含有合适的稳定剂或增加化合物溶解度以允许制备高浓度溶液的试剂。其它组分可包括增粘剂、凝胶、润湿剂、紫外线防护剂等。
用于表面施用的制剂可通过以下过程获得:将活性环状肽与固体赋形剂组合,任选研磨所得混合物,并在加入合适的助剂(如果需要)后加工颗粒混合物以获得用于直接施用或用于在溶解后喷洒在待保护的植物上的粉末。合适的赋形剂特别地是填充剂诸如糖,包括乳糖、蔗糖、甘露糖醇或山梨糖醇;纤维素或淀粉制剂、明胶、黄蓍胶、甲基纤维素、羟丙基甲基纤维素、羧甲基纤维素钠和/或聚乙烯吡咯烷酮(PVP)。如果需要,可添加崩解剂,诸如交联的聚乙烯吡咯烷酮、琼脂或海藻酸或其盐诸如海藻酸钠。
本文还提供经遗传修饰的植物或其经遗传修饰的后代,或者该植物或其后代的种子,或后代的种子,其中具有包含编码具有肽环化活性的AEP和编码环状肽的线性多肽前体的重组核酸的细胞,其中所述细胞产生环状肽。
AEP包括与SEQ ID NO:2、4、6和/或8中的任一个或多个具有至少80%相似性,诸如与SEQ ID NO:2、4和/或8具有至少80%相似性或与SEQ ID NO:6具有至少80%相似性的蛋白质。如上所述,“至少80%”包括80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或100%。
本文考虑的经遗传修饰的植物包括烟草、本塞姆氏烟草、卡罗拉、马铃薯、布什豆、玉米、大豆、小麦、苜蓿、大麦、蓖麻子、三叶草、棉花、亚麻、燕麦、油菜、水稻、黑麦、黑麦草、红花、高粱、甜菜、向日葵、番茄、莴苣、芹菜、西兰花、花椰菜、葫芦、鹰嘴豆、甘蔗、香蕉、洋葱和观赏性开花植物。在一个实施方案中,植物选自由塞姆氏烟草、烟草、卡罗拉、马铃薯和布什豆组成的组。拟南芥也是有用的测试系统,并且考虑在本文中使用。
经遗传修饰的植物还可包含编码AEP和多肽前体的多基因表达载体。
本文中教导了经遗传修饰的植物或其经遗传修饰的后代,或者所述植物或其后代的种子,或后代的种子,其中具有包含编码具有肽环化活性的AEP和编码环状肽的线性多肽前体的的重组核酸的细胞,其中所述细胞产生环状肽;其中编码AEP和多肽前体中的每一种的重组核酸在单个核酸构建体中表达;并且其中所述单个构建体是由包含两个或更多个区段的多核苷酸组成的多基因表达载体(MGEV),每个区段编码功能性蛋白质,每个区段通过编码接头肽的接头区段以线性序列连接至下一个区段,所述区段全部位于与单个启动子可操作连接的同一阅读框架中,其中至少一个区段编码AEP并且至少一个另外的区段编码多肽前体,其中AEP包含与SEQ ID NO:2、4、6和/或8中的任一个或多个具有至少80%相似性,或与SEQ ID NO:2、4和/或8中的任一个或多个具有至少80%相似性或与SEQ ID NO:6中的任一个或多个具有至少80%相似性的氨基酸序列。
本文中教导了经遗传修饰的植物或其经遗传修饰的后代,或者所述植物或其后代的种子,或后代的种子,其中具有包含编码具有肽环化活性的AEP的重组核酸的细胞。编码AEP的重组核酸可存在于植物细胞中,或通过任何类型的载体(包括但不限于通过MGEV)引入植物细胞中。MGEV含有两个或更多个区段,其中至少一个区段包含重组核酸,或者重组核酸可通过MGEV内的接头核苷酸序列连接至另一个编码第二AEP或另一种肽或多肽的核酸。MGEV可存在于病毒载体、微生物载体(例如土壤杆菌载体)或植物载体(例如病毒载体与微生物载体的杂合体)中。
至少80%的相似性包括80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99或100%。
实施例
通过以下非限制性实施例进一步描述本文公开的各方面。
材料和方法
基因构建体
将编码OaAEP1b(SEQ ID NO:1)和Oak1(SEQ ID NO:13)的cDNA克隆入pAM9载体中以掺入35S-花椰菜花叶病毒启动子和终止子序列(Tabe等(1995)J Anim Sci 73:2752-2759),然后将其转移至二元载体pBIN19(Bevan(1984)同上)。然后通过电穿孔将pBIN19表达载体转化入根癌土壤杆菌(菌株LBA4404)。
植物中土壤杆菌介导的瞬时基因表达
将土壤杆菌细胞作为细菌菌苔铺在含有补充有卡那霉素(50ug/mL)和链霉素(100ug/mL)的酵母甘露醇培养基(Vincent(1985)A manual for the practical study ofroot-nodule bacteria IPB Handbook No.15)的琼脂平板上。将细胞在28℃下于黑暗中生长三天。收获细菌的菌苔,并将其在浸润缓冲液(10mM MgCl2和10μM乙酰丁香酮)中重新悬浮至OD600为1.0。将重新悬浮的细菌在室温下孵育2-4小时。在25℃的温室或生长室中从种子生长本塞姆氏烟草植物,持续约六周。将布什豆子叶(菜豆cv.Royal Burgundy))生长10天,并在25℃的生长箱中将莴苣(莴苣cv.Green Cos)生长约4周。通过将1mL注射器(无针)轻轻按压在叶片的下侧,用重悬浮的土壤杆菌浸渗叶子。叶子的浸渗区域用永久性标记画出。将植物再生长4天,然后切取浸渗区域。
称量浸渗的叶区段,将其置于具有滚珠的微量离心管中,并使用混合磨在液氮中研磨成细粉末(30s-1,2x 15s)。使用1uL/mg组织(湿重)以及5mg不溶性PVPP,用含有0.1%(v/v)TFA的50%(v/v)乙腈提取蛋白质。将样品离心,然后通过MALDI-TOF质谱法分析上清液。
追踪线性肽的环化的MS
使用C18ziptips将叶提取物脱盐并浓缩,然后将其与α-氰基-4-羟基肉桂酸的饱和溶液以1:1混合,然后将其点样在样品板上并风干。在Bruker ultraflex III MALDITOF/TOF质谱仪(Bruker AXS GmbH,Karlsruhe,Germany)上以阳离子反射器模式进行质量分析。使用MS阳离子反射模式获取方法,在1000与5000Da之间的每个点累积在随机选择的10个位置中的每一个处的200个谱图。使用肽标准品混合物(Bruker Daltonics)进行校准。使用Bruker flex-Analysis软件采集和处理数据。
为了相对定量环状肽和非环状肽,将对应于指定肽的总积分峰面积表示为表达肽的100%。然后可计算样品中的环状肽和非环状肽的百分比。
OaAEP1-3克隆
将来自白花蛇舌草转录组装配体的全长AEP转录物用于设计一组引物。由于每个全长转录物的5'区域内的起始密码子处的单个核苷酸位置处的可变性,因此手动设计单个简并正向引物(OaAEPdegen-F,5`-ATG GTT CGA TAT CYC GCC GG-3`-SEQ ID NO:9)以扩增所有序列。借助Primer3设计的三种反向引物成功地扩增了AEP序列(OaAEP1-R,5`-TCA TGAACT AAA TCC TCC ATG GAA AGA GC-3`-SEQ ID NO:10;OaAEP2-R,5`-TTA TGC ACT GAATCC TTT ATG GAG GG-3`-SEQ ID NO:11;OaAEP3-R 5`-TTA TGC ACT GAA TCC TCC ATC G-3`-SEQ ID NO:12)。
为了克隆表达的OaAEPs,使用TRIzol(LifeTechnologies)从白花蛇舌草叶和嫩芽提取总RNA,然后按照制造商的说明书用SuperScript III逆转录酶(Life Technologies)进行反转录。使用Phusion High Fidelity聚合酶(New England BioLabs)和上述引物在推荐的反应条件下从所得cDNA中扩增靶序列。将凝胶提取的PCR产物通过与Invitrogen Taq聚合酶(Life Technologies)和所供应的缓冲液中的0.5μL 10mM dA一起孵育来对所述PCR产物进行dA-接尾。将加工产物克隆入pCR8-TOPO(Life Technologies)并转化至大肠杆菌(E.coli)中。将来自对于AEP插入物呈PCR阳性的克隆的纯化DNA送至澳大利亚基因组研究机构(Australian Genome Research Facility)进行Sanger测序。已将编码序列记录在Genbank中(登录码:OaAEP1(KR259377)、OaAEP2(KR259378)、OaAEP3(KR259379))。
平行地,使用DNeasy Plant Mini试剂盒,根据制造商的说明书从白花蛇舌草的叶组织中提取基因组DNA。来自该DNA的PCR扩增使用特异性靶向OaAEP1核苷酸序列的引物。将凝胶提取的产物如上所述进行dA接尾,克隆入TOPO(Life Technologies)中并转化到大肠杆菌中。将来自PCR阳性克隆的DNA送至澳大利亚基因组研究机构进行测序。随后将使用该方法鉴定的AEP序列(OaAEP1b)表达为重组蛋白质。
实施例1
Oak1和OaAEP1b在本塞姆氏烟草中的共表达
如材料和方法中所述,将具有Oak1(编码kB1的SEQ ID NO:13)和OaAEP1b(SEQ IDNO:1)[分别为图3B和3A]的重悬浮土壤杆菌(OD600为1.0)的1:1混合物用于浸渗本塞姆氏烟草的叶。如材料和方法中所述提取蛋白质并通过MALDI-TOF质谱术分析。将仅用Oak1浸渗的本塞姆氏烟草的叶纳入作为对照。
结果
在本塞姆氏烟草对照中,当OaAEP1b不存在时,约10%±1%的线性的环状kB1前体被转化成环状产物。其余的以线性kB1产物(38%±3%)存在或以各种线性形式存在,其中仍然存在来源于C-末端前肽的一个或多个氨基酸。当将Oak1与OaAEP1b一起转染时,线性前体至环状产物的转化率为89%±1%。显示的结果是最少三个重复的平均值±标准误差。
实施例2
连接的Oak1和OaAEP1b在本塞姆氏烟草中的表达
使用可切割的六残基接头EEKKND(SEQ ID NO:18)来自多结构域花烟草蛋白酶抑制剂(Heath等(1995)同上)将Oak1的序列(除去信号序列)连接至OaAEP1b的全长序列,以产生由SEQ ID NO:20定义的构建体[图4A]。或者,将OaAEP1b的序列(除去信号序列)连接至Oak1的全长序列(SEQ ID NO:22)[图4B]。这些构建物通过剪接重叠PCR(Horton等(1990)同上)制备并用于如材料和方法中所述的瞬时表达测定。
结果
当被转染入本塞姆氏烟草时,构建体OaAEP1b-EEKKND-Oak1(图4A)产生100%环状kalata B1产物。
实施例3
连接至多个肽结构域的OaAEP1b的表达
用(图5A)或不用(图5B)可切割的五残基MGEV接头EEKKN(来自多结构域花烟草蛋白酶抑制剂)将两个(或更多个)Kalata B1结构域(每个侧接N末端重复序列和C末端前肽)连接至OaAEP1b的全长序列。这些构建物通过剪接重叠PCR(Horton等(1990)同上)制备并用于如材料和方法中所述的瞬时表达测定。
实施例4
酶识别位点处的氨基酸取代对环化的影响
使用Phusion定点诱变试剂盒(Finnzymes)从野生型Oak1构建体产生Oak1变体。在Kalata B1前体(图1)的N-末端P1”–P4”位点和C末端P4-P4’位点内进行氨基酸取代,以测试OaAEP1b对肽底物进行高效加工和环化所需的序列。将所有构建体亚克隆入pAM9载体中,然后克隆入二元载体pBIN19中。将pBIN19表达载体转化入土壤杆菌中并用于如材料和方法中所述的瞬时表达测定。
结果
表2中显示了前体中各种氨基酸取代或缺失对环化的kalata B1产物%的影响。只显示了kalata B1的最开始(GLP)和最后一些(TRN)氨基酸的序列(序列的中间氨基酸由“......”表示)以及CTPP(GLPSLAA)。显示的结果是最少三次重复的平均值±标准误差。
实施例5
本塞姆氏烟草中的OaAEP1b和Oak1双叠加
通过PCR扩增具有3'和5'XbaI限制性位点的Oak1植物转录单位。用XbaI消化PCR产物,然后将其连接至已用XbaI消化并用Antractic磷酸酶(NEB)处理的OaAEP1b pBIN19表达载体中。通过限制性消化检查插入的Oak1植物转录单位以确保其与OaAEP1b基因的取向相同。然后将构建体(图8A)转化入土壤杆菌并用于如材料和方法中所述的瞬时表达测定。
结果
Oak1-OaAEP1b双叠加在本塞姆氏烟草中的瞬时表达产生88%±1%的环状产物。
实施例6
Oak1和其它AEP在本塞姆氏烟草中的共表达
将编码OaAEP1b、OaAEP2(SEQ ID NO:5)、OaAEP3(SEQ ID NO:7)、CtAEP1(蝶豆粘酶1,Nguyen等(2014)同上)(SEQ ID NO:23)、CtAEP2(SEQ ID NO:25)和CtAEP6(以前称为CtAEP5)[SEQ ID NO:27]的DNA序列克隆入pAM9中,转移至pBIN19中并转化至土壤杆菌中。然后将Oak1与这些AEP中的每一种单独地在本塞姆氏烟草中共表达,如材料和方法中所述的。为了与CtAEP1、CtAEP2和CtAEP6共表达,通过用HV(SEQ ID NO:30)(CtAEP1的识别序列(Nguyen等(2014)同上))替换CTPP(GLPSLAA)来修饰Oak1基因[图3C]。除CtAEP1//Oak1-HV(其中符号“//”表示元件被克隆入双叠加构建体中用于瞬时转化至本塞姆氏烟草中(图8B))外,在每一种情况下将Oak1与AEP一起共浸渗。在外源AEP不存在的情况下表达Oak1或Oak1-HV作为对照。
结果示于表3中。
表3
构建体 %环状kB1产物
Oak1 10%±1%
OaAEP1b+Oak1 89%±1%
OaAEP2+Oak1 30%±5%
OaAEP3+Oak1 85%±1%
Oak1-HV 5%±1%
CtAEP1+Oak1-HV 88%±2%
CtAEP1//Oak1-HV 88%±1%
CtAEP2+Oak1-HV 14±3%
CtAEP6+Oak1-HV 23±5%
OaAEP1b+Oak1-HV 56
实施例7
Cter M前体内环肽结构域的环化
将Cter M肽前体(野生型(SEQ ID NO:55)或kB1环肽结构域(CterM-kB1)替代CterM环肽结构域[SEQ ID NO:57](图11))与来源于蝶豆(C.ternatea)的AEP(CtAEP1(SEQ IDNO:23)、CtAEP2(SEQ ID NO:25)或CtAEP6(SEQ ID NO:27))一起在本塞姆氏烟草中瞬时表达。另外,将Cter M-kB1-GLP(SEQ ID NO:59)与OaAEP1b(SEQ ID NO:1)一起在本塞姆氏烟草中瞬时表达。将分别用单独的Cter M或单独的Cter M-kB1浸渗的本塞姆氏烟草叶包括在内作为对照。
如材料和方法中所述,将具有Cter M、CterM-kB1或CterM-kB1-GLP之一和CtAEP1、CtAEP2、CtAEP6或OaAEP1b之一的重悬浮土壤杆菌(OD600为1.0)的1:1混合物用于浸渗本塞姆氏烟草叶。如材料和方法中所述提取蛋白质并通过MALDI-TOF质谱术进行分析。
结果示于表4中。Cter M前体内的天然Cter M和kB1环肽结构域均能够被CtAEP 1环化,但不能被CtAEP2或CtAEP6环化。在Cter M单独对照中未检测到环状和线性Cter M。当识别序列GLP被添加到C-ter M前体内的KB1的C-末端时,OaAEP1b能够高效地环化kB1。
表4
构建体 %环状产物±SE
Cter M 0%
CterM+CtAEP1 100%(环状Cter M)
Cter M-kB1 11%±2%
CterM-kB1+CtAEP1 90%±1%
CterM-kB1+CtAEP2 19%±0%
CterM-kB1+CtAEP6 14%±0%
CterM-kB1-GLP 7%±2%
CterM-kB1-GLP+OaAEP1b 87%±3%
实施例8
从Oak 1前体产生环状肽的前体要求
产生Oak1的各种N-末端截短,并通过MGEV接头将其在OaAEP1b C末端(图10)或OaAEP1b N末端(图11)连接至OaAEP1b,以确定环状kB1产生的最小肽前体要求。
如材料和方法中所述,通过剪接重叠PCR(Horton等(1990)BioTechniques 8:528-535)制备这些构建体,并将其用于本塞姆氏烟草中的瞬时表达测定。
结果
当AEP首先被置于构建体中时(图10),如果删除整个N-末端区域(ER信号肽、N-末端前肽和N-末端重复序列),则消除了环状kB1产生。对于环状kB1产生至少需要α-NTR(11个残基DQVFLKQLQLK(SEQ ID NO:97))。先前已显示该结构域以及NTPP是液泡靶向序列(Conlan等(2011)Amer.J.Botany 98(12):2018-2026)。α-NTR对于产生环肽结构域的原N末端的高效切割也可能是必需的。当AEP为第二个时(图11),植物细胞中ER信号肽的加工可以在MGEV连接的构建体中产生环肽结构域的原N末端。α-NTR不是必需的。为了本实施例的目的,并且不将本发明限制于任一种理论或作用模式,推测来自OaAEP1b的液泡靶向信号将连接的前体分子引导至液泡。
实施例9
从Cter M前体产生环状肽的前体要求
Cter M前体结构包括连接至白蛋白1α链的环肽结构域。制备白蛋白结构域和间隔子区域的截短(图12)以确定环状肽产生的最低要求。在植物细胞中加工ER信号肽以产生环状肽结构域的原N末端是来自蝶豆的环肽前体使用的策略。这些前体,诸如Cter M前体,缺乏白花蛇舌草环肽前体的NTPP和NTR。
前体的环肽结构域为天然Cter M(SEQ ID NO:56)或被kB1环肽结构域(SEQ IDNO:58)取代。如材料和方法中所述,通过剪接重叠PCR(Horton等(1990)同上)制备这些构建体,并在本塞姆氏烟草中的瞬时表达测定中将其与CtAEP1一起进行共浸渗。
结果
可以通过用kB1替代Cter M环肽结构域并共表达CtAEP1来产生环状kB1。这进一步证明了NTPP和NTR本身对于环状kB1产生不是必需的,并且至少NTR的作用(液泡靶向和提供用于高效切割以产生原N末端的残基)有可能被替代元件和策略替代。每个缺少至少白蛋白-1α链的截短的Cter M构建体不产生环状Cter M,表明该结构域含有液泡靶向信号。
实施例10
通过OaAEPs环化连接的肽结构域
测试OaAEPs环化所连接的肽结构域的能力。使用的酶是OaAEP1b(SEQ ID NO:2)、OaAEP2(SEQ ID NO:6)和OaAEP3(SEQ ID NO:8),连接的肽是Oak2a(其编码与kB3连接的kB2(SEQ ID NO:51)[图7A])和Oak4(其编码三个连接的kB2结构域(SEQ ID NO:53)[图7B])。将这些基因单独地克隆入pBIN19表达载体中,转化入土壤杆菌中以用于瞬时表达测定。
如材料和方法中所述,将具有Oak2a或Oak4之一和OaAEP1b、OaAEP2或OaAEP3之一的重悬浮土壤杆菌(OD600为1.0)的1:1混合物浸渗本塞姆氏烟草叶中。如材料和方法中所述提取蛋白质,并通过MALDI-TOF质谱法进行分析。将用单独的Oak2a或单独Oak4浸渗的本塞姆氏烟草叶包括在内作为对照。
结果示于表5中。OaAEP1b和OaAEP3能够切割并环化来自Oak2a和Oak 4构建体的连接的kalata前体肽。从Oak2a连接的构建体产生环化的kB2和kB3以相同的效率进行。
表5
构建体 %环状产物±SE
Oak2(kB2-kB3) 1%±1%(环状kB2);1%±1%(环状kB3)
Oak2(kB2-kB3)+OaAEP1b 91%±1%(环状kB2);87%±1%(环状kB3)
Oak2(kB2-kB3)+OaAEP2 1%±1%(环状kB2);1%±1%(环状kB3)
Oak2(kB2-kB3)+OaAEP3 84%±2%(环状kB2);83%±2%(环状kB3)
Oak4 0%(环状kB2)
Oak4+OaAEP1b 89%±0%(环状kB2)
Oak4+OaAEP2 0%(环状kB2)
Oak4+OaAEP3 79%±2%(环状kB2)
实施例11
通过OaAEP1b对天然环状胰蛋白酶抑制剂进行环化
将向日葵胰蛋白酶抑制剂1(SFTI-1)的序列[Mylne等(2011)同上]或具有作为前列腺癌抑制剂的潜在应用的移植的向日葵胰蛋白酶抑制剂(SFTI-FCQR)(Swedberg等(2009)Chem Biol 16:633-643)用于替代Oak1全长序列(图9和SEQ ID NO:70和72)内的kB1。合成所得的构建体并针对在烟草中的表达优化密码子用法。然后如材料和方法中所述,将构建体与OaAEP1b在本塞姆氏烟草中共表达。结果表明,环状SFTI-1和环状移植SFTI-FCQR产品被检测到。
实施例12
OaAEP1b对手链型环肽的环化
从全长cDNA扩增cycloviolacin O13的成熟序列(Ireland等(2006)Biochem.J.400:1–12),并将其用于替代Oak1的全长序列内的kB1[SEQ ID NO NO:32](图9)。如材料和方法中所述,通过剪接重叠PCR(Horton等(1990)同上)制备该构建体,并将其用于利用OaAEP1b的瞬时表达测定。
实施例13
通过OaAEP1b对移植kalata B1肽进行环化
将来自手链型环肽的三个残基(KNK)取代至kB1(环肽(SEQ ID NO:62))的环5中;或者,用两个带电荷的残基(DK)取代形成kB1的环5中的表面暴露的疏水片一部分的残基(SEQ ID NO:64)。最初是化学合成这些移植的kB1分子,以显示该环肽框架可耐受残基取代(Clark等(2006)Biochem.J.394:85–93)。将抗多发性硬化症肽MOG3(RSPFSRV)的序列移植至kB1的环5(SEQ ID NO:66)上[Wang等(2014)ACS Chem.Biol.9:156–163]。环4中的kB1变体(T20K)[SEQ ID NO:68]也是用于多发性硬化症的潜在治疗(Thell等(2016)ProcNatl Acad Sci USA 113:3960–3965(2016))。如材料和方法中所述,通过剪接重叠PCR(Horton等(1990)同上)制备这些构建体并将其用于利用OaAEP1b和/或OaAEP3的瞬时表达测定中。
将抗血管生成肽(RRKRRR)的序列移植到kB1的环3(SEQ ID NO:33)上[Gunasekera等(2008)J.Med.Chem.51:7697–7704](图9)。如材料和方法中所述,通过剪接重叠PCR(Horton等(1990)同上)制备该构建体,并将其用于利用OaAEP1b的瞬时表达测定。
结果
结果示于表6中。
表6
构建体 %环状产物±SE
[W19K/P20N/V21K]kB1 43%±9%(环状KNK-kB1)
[W19K/P20N/V21K]kB1+OaAEP1b 83%±2%(环状KNK-kB1)
[P20D/V21K]kB1 23%±11%(环状DK-kB1)
[P20D/V21K]kB1+OaAEP1b 69%±3%(环状DK-kB1)
Oak1-MOG3 0%
Oak1-MOG3+OaAEP1b 51%±6%(环状MOG3)
Oak1(T20K) 16%±2%(环状kB1(T20K))
Oak1(T20K)+OaAEP1b 31%±8%(环状kB1(T20K))
Oak1(T20K)+OaAEP3 61%±3%(环状kB1(T20K))
实施例14
通过OaAEP1b对在原C末端具有N或D的环状肽进行环化
天冬酰胺酰内肽酶优先在C末端天冬酰胺处切割它们的底物,尽管C末端天冬氨酸也是允许的。通过用天冬氨酸残基取代Oak1-MOG3(SEQ ID NO:66)的原-C末端天冬酰胺残基以产生Oak1-MOG3D(SEQ ID NO:94)来研究C末端N或D残基的作用。相反地,将Oak1-SFTI(SEQ ID NO:70)的天然C端天冬氨酸残基突变为天冬酰胺残基以产生Oak1-SFTI-N(SEQ IDNO:96)。通过剪接重叠PCR(Horton等(1990)同上)制备这些构建体,并将其用于其中共表达和不共表达OaAEP1b的瞬时表达测定。方法是如材料和方法中所述的。
结果示于图13中。当Oak1-MOG3单独在本塞姆氏烟草中表达时,未检测到环状MOG3,线性MOG3(linMOG3)和除去N端G残基的线性MOG3(linMOG3-G)为主要产物。相反地,当将原C-末端天冬酰胺残基改变为天冬氨酸残基(Oak1-MOG3D)时产生环状MOG3D,表明该残基是通过内源性AEP进行环化的更好底物;未检测到linMOG3D-G,但存在显著的linMOG3D+G峰。该种类是仍然附接有C末端G(源自C末端GLPSLAA(CTPP))的MOG3。两种构建体之间在线性产物方面的差异表明天冬酰胺残基在本塞姆氏烟草中被内源性水解AEP优先选择。尽管推测具有任一残基的前体被内源性AEP切割,导致linMOG3和linMOG3D两者,但来自Oak1-MOG3的显著linMOG3-G表明linMOG3的库较大,从而允许氨肽酶切割N-末端甘氨酸残基。相反,显著的linMOG3D+G峰表明该前体不太可能在天冬氨酸残基处水解,从而允许羧肽酶在C末端切割残基。OaAEP1b的共表达导致环状MOG3和MOG3D的比例增加,尽管环状产物的比例在后者中较高。
向日葵胰蛋白酶抑制剂SFTI天然地在其原C末端具有天冬氨酸残基。OaAEP1b与Oak1前体中的SFTI(Oak1-SFTI)在本塞姆氏烟草中的共表达导致环状SFTI产生。然而,当天冬酰胺残基取代天冬氨酸残基时,未检测到产物(环状或线性的)。为了本实施例的目的,推测所述前体被内源AEP水解,随后被其它蛋白酶消化。
因此,可以通过在原C末端用天冬氨酸残基替代天冬酰胺残基来提高本塞姆氏烟草中的环肽产生。
实施例15
OaAEP1b对非环状肽的环化
将具有6个残基的接头(GGAAGN)的α-芋螺毒素Vc1.1的序列(Clark等(2010)同上)用于替代Oak1的全长序列(SEQ ID NO:34)内的kB1。如材料和方法中所述,通过使用重叠引物的多轮PCR制备该构建体,并将其用于利用OaAEP1b的瞬时表达测定。或者,将无接头的Vc1.1用于替代Oak1全长序列(SEQ ID NO:35)内的kB1,但保留来自kalata B1序列末端的N-末端GLP和C末端TRN三肽(图9)。
实施例16
OaAEP1b在布什豆和莴苣中的共表达
如材料和方法中所述,将重悬浮的具有构建体(所用的构建体列于表7中)的土壤杆菌(OD600为1.0)用于浸渗布什豆子叶(肾豆cv.Royal Burgundy)和莴苣叶(莴苣cv.GreenCos)。当共浸渗两种构建体(例如OaAEP1b+Oak1)时,制备土壤土壤杆菌的1:1混合物。如材料和方法中所述,提取蛋白质并通过MALDI-TOF质谱法进行分析。
表7
植物 构建体 %环状kB1产物
布什豆 Oak1 5环状7%
Oak1-HV 35%±5%
OaAEP1b+Oak1 64%
Oak1//OaAEP1b 91%±1%
Oak1-HV+CtAEP1 74%
Oak1-HV//CtAEP1 88%±1%
OaAEP1b-LD-Oak1 100%
Oak1-LD-OaAEP1b 100%
莴苣 Oak1 10%±0%
Oak1-HV 3%±2%
OaAEP1b+Oak1 52%
OaAEP1b-LD-Oak1 100%
Oak1-LD-OaAEP1b 100%
Oak1//OaAEP1b 79%±1%
Oak1-HV+CtAEP1 67%
Oak1-HV//CtAEP1 83%±3%
实施例17
在烟草中的稳定转化
通过土壤杆菌介导的转化(Svab等(1975)In“Methods in Plant MolecularBiology-A Laboratory Manual”,P.Maliga等,编辑Cold Spring Harbor Press:55–77.)产生稳定转化的烟草(烟草(Nicotiana tabacum))或本塞姆氏烟草植物。用于转化的构建体是Oak1、OaAEP1b、Oak1//OaAEP1b双重堆叠和空载体对照(本塞姆氏烟草)以及OaAEP1b、OaAEP3和空载体对照(本塞姆氏烟草)。如材料和方法中所述,从叶中提取蛋白质并通过MALDI-TOF质谱法进行分析。使用利用Oak1或编码用于环化的肽的其它序列转化的土壤杆菌,将表达OaAEP1b和OaAEP3的植物用于瞬时表达测定。
结果
从利用Oak1//OaAEP1b双重堆叠的稳定转化产生14株烟草植物。通过MALDI-TOF分析叶的kB1。10株植物产生对应于主要为环状kB1的物质。
如材料和方法中所述,从OaAEP1稳定转化产生12株本塞姆氏烟草植物,并测试8株的OaAEP1b表达以及通过Oak1的瞬时表达产生环状kB1的能力。6株植物产生对应于主要为环状kB1的物质。
从OaAEP3稳定转化产生15株植物,并且8株植物产生对应于>79%环状kB1的物质。
实施例18
通过底物特异性鉴定环化AEP
已通过监测荧光底物Z-AAN-MCA(其中Z是羧基苄基;MCA是7-酰胺基-4-甲基香豆素)的切割来常规地追踪AEP活性[Saska等(2007)同上;Rotari等(2001)Biol.Chem.382:953-959]。切割Asn的C-末端释放荧光团,然后所述荧光团发荧光以报告底物切割。然而,蝶豆粘酶-1(Nguyen等(2014)同上)和rOaAEP1b(图14)均没有针对该底物的活性。此外,两个AEP活性位点抑制剂在高浓度下具有有限的针对rOaAEP1b的活性(图15)。它们是常规用于鉴定AEP活性的Ac-YVAD-CHO(Hatsugai等(2004)Science 305(5685):855-858)以及代表C-末端kB1切割位点的P1-P4残基的Ac-STRN-CHO。这些鉴定AEP活性的常规途径因此可能对鉴定具有环化能力的AEP无效。
然而,包含P1-P4以及P1'-P4'残基的IQF肽被rOaAEP1b有效地靶向。这些肽含有荧光供体/猝灭剂对,在酶切割之后该对空间分离时观察到荧光。针对此类IQF报道分子肽的活性而不具有针对通用底物(Z-AAN-MCA)的相应活性可允许快速鉴定可能具有环化能力的AEP家族的成员。在IQF肽的形式中,rOaAEP1b显示在P2'位置处需要体积庞大的疏水残基[图16A和16B],该位置不被水解性AEP(人豆荚蛋白(rhuLEG))共享。还可将此类P2’特异性用于预测环化能力和/或选择在待环化的底物中具有不同序列要求的AEP。
本领域技术人员将认识到,除了具体描述的那些以外,本文所述方面的各方面可以进行变化和修改。应该理解,这些方面包括所有此类变化和修改。这些方面还包括单独地或共同地在本说明书中提到或指示的所有步骤、特征、组合物和化合物,以及任何两个或更多个所述步骤或特征的任意和所有组合。
文献目录
Altschul et al.(1997)Nucl.Acids.Res.25:3389-3402
Arnison et al.(2013)Nat Prod Rep 30:108–160
Ausubel et al.(1994-1998)In:Current Protocols in Molecular Biology,John Wiley&Sons Inc.
Barber et al.(2013)J.Biol.Chem.288:12500–12510
Bernath-Levin et al.(2015)Chemistry&Biology 22:1-12
Bevan et al.(1983)Nucleic Acids Res 11(2):369-385
Bevan(1984)Nucleic Acids Res 12:8711-8721
Callis et al.(1987)Genes and Development,1:1183-1200
Chan et al.(2013)Chembiochem 14:617–24
Clark et al.(2005)Proc.Natl.Acad.Sci.United States Am.102:2–7
Clark et al.(2006)Biochem.J.394:85–93
Clark et al.(2010)Angew.Chem.Int.Ed.Engl.49:6545–8
Colgrave et al.(2008)Biochemistry 47:5581–5589
Colgrave et al.(2009)Acta Trop.109:163–6
Conlan et al(2011)Amer.J.Botany 98(12):2018-2026
Conlan et al.(2012)J.Biol.Chem.287:28037–46
Fraley et al.(1983)Proc.Natl.Acad.Sci.USA.,80:4803-4807
Fromm et al.(1986)Nature,319:791-793
Gillon et al.(2008)Plant J.53:505–515
Goransson et al.(2004)J.Nat.Prod.67:1287–1290
Gran(1973)Acta pharmacol.toxicol.33:400–408
Gunasekera et al.(2008)J.Med.Chem.51:7697–7704
Gustafson et al.(2000)J.Nat.Prod 63:176–178
Hanada et al.(2004)Nature 427:252-256
Hatsugai et al.(2004)Science 305(5685):855-858
Heath et al.(1995)Eur J Biochem 230:250-257
Hernandez et al.(2000)Biochemistry 39:5722-5730
Herrera-Estrella et al.(1983)EMBO J 2:987-995
Horton et al.(1990)BioTechniques 8:528-535
Ireland et al.(2006)Biochem.J.400:1–12
Jennings et al.(2001)Proc.Natl.Acad.Sci.U.S.A.98:10614–10619
Klee et al.(1985)Bio/Technology 3:637-642
Lee et al.(2009)J.Am.Chem.Soc.131:2122–2124
Lindholm et al.(2002)Mol.Cancer Ther.1:365–369
Luo et al.(2014)Chem.Biol.26:1610-1617
Mazmanian et al.(1999)Science(80)285:760–763
Mylne et al.(2011)Nat.Chem.Biol.7:257–9
Mylne et al.(2012)Plant Cell 24:2765–78
Nguyen et al.(2014)Nat.Chem.Biol.10:732–738
Plan et al.(2008)J.Agric.Food Chem.56:5237–5241
Poth et al.(2013)Biopolymers 100:480–91
Potrykus et al(1985)Mol.Gen.Genet.,199:169 177
Rotari et al.(2001)Biol.Chem.382:953-959
Sanford et al.(1993)Methods in Enzymology,217:483 509
Saska et al.(2007)J.Biol.Chem.282:29721–29728
Schilperoort et al,European Patent Publication 120,516
Sheldon et al.(1996)Biochem.J.320:865–870
Svab et al.(1975)In“Methods in Plant Molecular Biology-A LaboratoryManual”,P.Maliga et al.,eds.Cold Spring Harbor Press:55–77
Swedberg et al.(2009)Chem Biol 16:633-643
Tabe et al.(1995)J Anim Sci 73:2752-2759
Tam et al.(1999)Proc.Natl.Acad.Sci.U.S.A.96:8913–8918
Thell et al.(2016)Proc Natl Acad Sci USA 113:3960–3965
Vincent(1985)A manual for the practical study of root-nodule bacteriaIPB Handbook No.15
Wang et al.(2014)ACS Chem.Biol.9:156–163
Weissbach and Weissbach(1988)[Eds],Methods for Plant MolecularBiology,Academic Press,Inc.,San Diego,California,USA
Witherup et al.(1994)J.Nat.Prod 57:1619–1625
Zhou et al.(1983)Methods in Enzymology,101:433-481。
序列表
<110> Hexima Limited
The University of Queensland
<120> 一种方法
<130> 35256177/EJH
<150> AU 2015903984
<151> 2015-09-30
<150> AU 2015904036
<151> 2015-10-05
<160> 97
<170> PatentIn version 3.5
<210> 1
<211> 1392
<212> DNA
<213> 人工的
<220>
<223> OaAEP1b
<400> 1
ggatccatgg ttcggtatct cgccggagca gtcctactcc tagttgtact ttcagttgcc 60
gccgccgtat ccggagctcg tgatggcgac tatctacatc tgccatcgga agtttcccga 120
tttttccggc cacaggagac caacgacgac cacggcgaag actcggtcgg aactagatgg 180
gctgtcctga tcgctgggtc gaaaggttat gcaaactacc ggcatcaggc tggtgtttgt 240
catgcatatc aaatattgaa aagaggaggt cttaaagatg aaaacattgt ggtattcatg 300
tatgacgaca ttgcctacaa tgaatcgaac cctaggcctg gagttatcat caacagccca 360
cacggcagtg atgtttatgc cggagtccca aaggattata caggggaaga ggttaatgct 420
aagaactttt tggcagctat tcttggcaac aagtctgcta ttacgggggg tagcggcaag 480
gtggttgata gtggtccaaa tgatcacatc ttcatctact atacagatca cggtgccgct 540
ggggtaattg ggatgccttc aaaaccttac ctttatgcgg atgaattaaa tgatgctttg 600
aagaagaagc atgcttctgg gacatataag agcttggtgt tttacctgga agcttgtgag 660
tcgggtagca tgtttgaggg aatactccct gaggatctta atatctacgc gctaacatct 720
acaaacacaa cagaaagcag ttggtgttat tattgccctg cacaggaaaa tccccctccc 780
ccggaatata acgtttgctt gggtgactta tttagtgttg cgtggttgga agacagtgac 840
gtacaaaatt cgtggtatga aactttgaac cagcaatatc accatgttga caagagaatc 900
tcgcatgcct cccatgccac gcaatatgga aatttgaagc tgggtgagga aggtctattc 960
gtctatatgg gttctaaccc tgctaatgat aattacactt ctttggatgg caatgctctt 1020
actccatctt caatagttgt taatcagcgt gatgctgatt tattgcactt gtgggaaaag 1080
ttccgtaagg ctcctgaagg ctctgcaagg aaagaagtag ctcaaacaca gatctttaaa 1140
gcgatgtccc atcgagtgca catcgacagc agcataaaat taattggaaa gcttctcttt 1200
ggtattgaga aatgcactga aattcttaat gctgtcaggc cagctggtca gcctcttgtt 1260
gatgactggg cctgcctcag atctttggtc ggaacatttg agacacattg tggctcgctg 1320
tcggaatatg gaatgagaca tactcggacc attgcaaata tctgcaatgc tggaatctct 1380
gaggaacaga tg 1392
<210> 2
<211> 474
<212> PRT
<213> 人工的
<220>
<223> OaAEP1b
<400> 2
Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser
1 5 10 15
Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu
20 25 30
Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp
35 40 45
His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly
50 55 60
Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala
65 70 75 80
Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val
85 90 95
Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly
100 105 110
Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro
115 120 125
Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala
130 135 140
Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val
145 150 155 160
Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly
165 170 175
Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp
180 185 190
Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys
195 200 205
Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu
210 215 220
Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn
225 230 235 240
Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro
245 250 255
Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala
260 265 270
Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn
275 280 285
Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala
290 295 300
Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr
305 310 315 320
Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn
325 330 335
Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu
340 345 350
Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg
355 360 365
Lys Glu Val Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val
370 375 380
His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile
385 390 395 400
Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro
405 410 415
Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu
420 425 430
Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr
435 440 445
Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu
450 455 460
Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro
465 470
<210> 3
<211> 1425
<212> DNA
<213> 人工的
<220>
<223> OaAEP1
<400> 3
atggttcgat atctcgccgg agcagtccta ctcctagttg tactttcagt tgccgccgcc 60
gtatccggag ctcgtgatgg cgactatcta catctgccat cggaagtttc ccgatttttc 120
cggccacagg agaccaacga cgaccacggc gaagactcgg tcggaactag atgggctgtc 180
ctgatcgctg ggtcgaaagg ttatgcaaac taccggcatc aggctggtgt ttgtcatgca 240
tatcaaatat tgaaaagagg aggtcttaaa gatgaaaaca ttgtggtatt catgtatgac 300
gacattgcct acaatgaatc gaaccctagg cctggagtta tcatcaacag cccacacggc 360
agtgatgttt atgccggagt cccaaaggat tatacagggg aagaggttaa tgctaagaac 420
tttttggcag ctattcttgg caacaagtct gctattacgg ggggtagcgg caaggtggtt 480
gatagtggtc caaatgatca catcttcatc tactatacag atcacggtgc cgctggggta 540
attgggatgc cttcaaaacc ttacctttat gcggatgaat taaatgatgc tttgaagaag 600
aagcatgctt ctgggacata taagagcttg gtgttttacc tggaagcttg tgagtcgggt 660
agcatgtttg agggaatact ccctgaggat cttaatatct acgcgctaac atctacaaac 720
acaacagaaa gcagttggtg ttattattgc cctgcacagg aaaatccccc tcccccggaa 780
tataacgttt gcttgggtga cttatttagt gttgcgtggt tggaagacag tgacgtacaa 840
aattcgtggt atgaaacttt gaaccagcaa tatcaccatg ttgacaagag aatctcgcat 900
gcctcccatg ccacgcaata tggaaatttg aagctgggtg aggaaggtct attcgtctat 960
atgggttcta accctgctaa tgataattac acttctttgg atggcaatgc tcttactcca 1020
tcttcaatag ttgttaatca gcgtgatgct gatttattgc acttgtggga aaagttccgt 1080
aaggctcctg aaggctctgc aaggaaagaa gaagctcaaa cacagatctt taaagcgatg 1140
tcccatcgag tgcacatcga cagcagcata aaattaattg gaaagcttct ctttggtatt 1200
gagaaatgca ctgaaattct taatgctgtc aggccagctg gtcagcctct tgttgatgac 1260
tgggcctgcc tcagatcttt ggtcggaaca tttgagacac attgtggctc gctgtcggaa 1320
tatggaatga gacatactcg gaccattgca aatatctgca atgctggaat ctctgaggaa 1380
cagatggcgg aggcagcctc gcaggcttgt gctagtattc cttga 1425
<210> 4
<211> 474
<212> PRT
<213> 人工的
<220>
<223> OaAEP1
<400> 4
Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser
1 5 10 15
Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu
20 25 30
Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp
35 40 45
His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly
50 55 60
Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala
65 70 75 80
Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val
85 90 95
Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly
100 105 110
Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro
115 120 125
Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala
130 135 140
Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val
145 150 155 160
Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly
165 170 175
Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp
180 185 190
Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys
195 200 205
Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu
210 215 220
Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn
225 230 235 240
Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro
245 250 255
Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala
260 265 270
Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn
275 280 285
Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala
290 295 300
Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr
305 310 315 320
Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn
325 330 335
Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu
340 345 350
Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg
355 360 365
Lys Glu Glu Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val
370 375 380
His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile
385 390 395 400
Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro
405 410 415
Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu
420 425 430
Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr
435 440 445
Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu
450 455 460
Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro
465 470
<210> 5
<211> 1467
<212> DNA
<213> 人工的
<220>
<223> OaAEP2
<400> 5
atggttcgat atctcgccgg agcagtccta ctcctcgtcg tactttcagt cgtcgccgta 60
gatggagcac gtgacggcta cctaaaactt ccctcggaag tctccgattt tttccgacct 120
aggaatacga acgacggcga cgactctgtc ggaactagat gggctgtcct gctcgccgga 180
tcgaacggtt attggaatta ccggcatcag gctgatttat gtcatgcata tcaaatactg 240
aaaagaggag gtctgaagga tgaaaacatt gtggtgttca tgtacgatga cattgcctac 300
aatgaagaga accctaggcc tggagttatc atcaacagcc cacacggcag tgatgtttat 360
gcaggagtcc ctaaggatta tacaggggat caagttaatg cgaaaaactt tttagcggct 420
atccttggca acaaatcagc tataacgggg ggtagcggta aggtggttaa tagtggtcca 480
aatgatcaca tattcatcta ctatacagat catggtggtc ctggagttct tgggatgcct 540
gtggggcctt acatctatgc ggatgatctg attgatactt tgaagaagaa gcatgcttca 600
gggacatata agagcttggt gttttacctg gaagcttgtg agtctggtag catgtttgag 660
ggactacttc ctgaaggtct caatatctat gcaaccacag cctcaaatgc agaggaaagc 720
agttggggaa cctattgtcc aggagagtat cctagccctc ccccagaata tgatacatgc 780
ttgggtgacc tatatagtgt tgcttggatg gaagacagtg aggtacacaa tttgcggtct 840
gaaactttga agcagcaata tcacctggtt aaagcgagaa cctcaaatgg taattcagct 900
tatggctccc atgtcatgca atatggtgat ttgaagctga gtgtggacaa tcttttcctc 960
tatatgggta ctaaccctgc aaatgataat tacacttttg tggatgacaa tgctcttcgt 1020
ccatcttcaa aagctgttaa tcagcgtgat gctgatttat tgcatttctg ggacaagttc 1080
cgtaaggctc ctgaaggttc tgcaagaaaa gaagaagctc gcaaacaggt ttttgaagct 1140
atgtcccacc ggatgcacat tgacaacagc atcaaattag ttggaaagct tctctttggt 1200
attgagagag gcgctgaaat tcttgatgct gtcaggccag ccggtcagcc tctggctgat 1260
gactggacct gcctcaaatc tttggtcaga acatttgaga cacattgtgg ctcgttgtcg 1320
cagtatggaa tgaagcatat gcggaccatt gctaatatct gcaatgctgg aatcacgaag 1380
gaacagatgg cggaggcatc tgcgcaggca tgttccagtg ttccttcaaa tccttggagc 1440
tccctccata aaggattcag tgcataa 1467
<210> 6
<211> 488
<212> PRT
<213> 人工的
<220>
<223> OaAEP2
<400> 6
Met Val Arg Tyr Pro Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser
1 5 10 15
Val Val Ala Val Asp Gly Ala Arg Asp Gly Tyr Leu Lys Leu Pro Ser
20 25 30
Glu Val Ser Asp Phe Phe Arg Pro Arg Asn Thr Asn Asp Gly Asp Asp
35 40 45
Ser Val Gly Thr Arg Trp Ala Val Leu Leu Ala Gly Ser Asn Gly Tyr
50 55 60
Trp Asn Tyr Arg His Gln Ala Asp Leu Cys His Ala Tyr Gln Ile Leu
65 70 75 80
Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val Phe Met Tyr Asp
85 90 95
Asp Ile Ala Tyr Asn Glu Glu Asn Pro Arg Pro Gly Val Ile Ile Asn
100 105 110
Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr
115 120 125
Gly Asp Gln Val Asn Ala Lys Asn Phe Leu Ala Ala Ile Leu Gly Asn
130 135 140
Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val Asn Ser Gly Pro
145 150 155 160
Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly Gly Pro Gly Val
165 170 175
Leu Gly Met Pro Val Gly Pro Tyr Ile Tyr Ala Asp Asp Leu Ile Asp
180 185 190
Thr Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe
195 200 205
Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu Gly Leu Leu Pro
210 215 220
Glu Gly Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Glu Glu Ser
225 230 235 240
Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro Pro Glu
245 250 255
Tyr Asp Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp
260 265 270
Ser Glu Val His Asn Leu Arg Ser Glu Thr Leu Lys Gln Gln Tyr His
275 280 285
Leu Val Lys Ala Arg Thr Ser Asn Gly Asn Ser Ala Tyr Gly Ser His
290 295 300
Val Met Gln Tyr Gly Asp Leu Lys Leu Ser Val Asp Asn Leu Phe Leu
305 310 315 320
Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn Tyr Thr Phe Val Asp Asp
325 330 335
Asn Ala Leu Arg Pro Ser Ser Lys Ala Val Asn Gln Arg Asp Ala Asp
340 345 350
Leu Leu His Phe Trp Asp Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala
355 360 365
Arg Lys Glu Glu Ala Arg Lys Gln Val Phe Glu Ala Met Ser His Arg
370 375 380
Met His Ile Asp Asn Ser Ile Lys Leu Val Gly Lys Leu Leu Phe Gly
385 390 395 400
Ile Glu Arg Gly Ala Glu Ile Leu Asp Ala Val Arg Pro Ala Gly Gln
405 410 415
Pro Leu Ala Asp Asp Trp Thr Cys Leu Lys Ser Leu Val Arg Thr Phe
420 425 430
Glu Thr His Cys Gly Ser Leu Ser Gln Tyr Gly Met Lys His Met Arg
435 440 445
Thr Ile Ala Asn Ile Cys Asn Ala Gly Ile Thr Lys Glu Gln Met Ala
450 455 460
Glu Ala Ser Ala Gln Ala Cys Ser Ser Val Pro Ser Asn Pro Trp Ser
465 470 475 480
Ser Leu His Lys Gly Phe Ser Ala
485
<210> 7
<211> 1470
<212> DNA
<213> 人工的
<220>
<223> OaAEP3
<400> 7
atggttcgat atctcgccgg agcattccaa gtagtactcc tcgtcgtcat actttcagac 60
atcgccatat ctgaagaacg tactgatggc tacctaaagc tgccgacgga agtttcccgg 120
tttttccgta ctcctgagca gtcgagcgac ggcggtgatg actctattgg aactagatgg 180
gctgtcctga tcgccggatc caaaggttat gacaactacc ggcatcaggc tgatgtctgt 240
catgcatatc aaatcctgaa aagaggaggc cttaaagatg agaacattgt agtattcatg 300
tatgatgaca ttgcctacaa tgaatcgaac ccgaggcctg gagtaataat caacagccca 360
cacggcagtg atgtttatgc cggagtccca aaggattata caggggatga ggttaatgct 420
aagaactttt tagcagctat tcttggcaac aagtcagcta ttactggggg tagcggcaag 480
gtggttgata gcggtccaaa tgatcacatt ttcatctact atacagatca tggtgctcct 540
ggggtcattg ggatgccttc gaaaccttac ctctacgcgg atgaattgaa tgatgctttg 600
aggaagaagc atgcttctgg aacatataag agcatggtgt tttacctgga agcttgtgag 660
gcgggtagca tgtttgacgg actacttcct gacggtctca atatctacgc gctgacagcc 720
tcaaacacaa cagaaggcag ttggtgctat tattgccctg gacaggatgc tggccctccc 780
ccagaataca gtgtttgctt gggtgacttt tttagtattg cttggttgga agacagtgac 840
gtacacaatt tgcggtctga aactttgaac cagcaatatc acaatgttaa gaacagaatc 900
tcatatgcct cccatgccac gcaatatggt gatttgaagc gcggtgttga aggccttttc 960
ctctatttag gttctaaccc ggaaaatgat aattacactt ttgtggatga caatgtggtt 1020
cgtccatctt ccaaagctgt taatcagcgt gacgctgatt tagtgcactt ctgggaaaag 1080
tttcgtaagg ctcctgaagg ttcttcgaag aaagaagaag ctcaaaaaca gatccttgaa 1140
gctatgtccc atcgagtgca cattgacagc agcataaatt taattggaaa gcttctcttt 1200
ggtattgaga aaggccacaa aattcttact gctgtccggt cagccggcca ccctcttgtt 1260
gatgactggg cctgcctcag atctttggtt agaacatttg agacacattg tggctcgctg 1320
tcgcagtatg gaatgaaaca tactcggaca cttgcaaata tttgcaatgc tggaatcact 1380
gaggaacaga tggcggaggc agcctcgcag gcctgtgtca gtattccttc aaatccttgg 1440
agctctcacg atggaggatt cagtgcataa 1470
<210> 8
<211> 489
<212> PRT
<213> 人工的
<220>
<223> OaAEP3
<400> 8
Met Val Arg Tyr Leu Ala Gly Ala Phe Gln Val Val Leu Leu Val Val
1 5 10 15
Ile Leu Ser Asp Ile Ala Ile Ser Glu Glu Arg Thr Asp Gly Tyr Leu
20 25 30
Lys Leu Pro Thr Glu Val Ser Arg Phe Phe Arg Thr Pro Glu Gln Ser
35 40 45
Ser Asp Gly Gly Asp Asp Ser Ile Gly Thr Arg Trp Ala Val Leu Ile
50 55 60
Ala Gly Ser Lys Gly Tyr Asp Asn Tyr Arg His Gln Ala Asp Val Cys
65 70 75 80
His Ala Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile
85 90 95
Val Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg
100 105 110
Pro Gly Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly
115 120 125
Val Pro Lys Asp Tyr Thr Gly Asp Glu Val Asn Ala Lys Asn Phe Leu
130 135 140
Ala Ala Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys
145 150 155 160
Val Val Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp
165 170 175
His Gly Ala Pro Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr
180 185 190
Ala Asp Glu Leu Asn Asp Ala Leu Arg Lys Lys His Ala Ser Gly Thr
195 200 205
Tyr Lys Ser Met Val Phe Tyr Leu Glu Ala Cys Glu Ala Gly Ser Met
210 215 220
Phe Asp Gly Leu Leu Pro Asp Gly Leu Asn Ile Tyr Ala Leu Thr Ala
225 230 235 240
Ser Asn Thr Thr Glu Gly Ser Trp Cys Tyr Tyr Cys Pro Gly Gln Asp
245 250 255
Ala Gly Pro Pro Pro Glu Tyr Ser Val Cys Leu Gly Asp Phe Phe Ser
260 265 270
Ile Ala Trp Leu Glu Asp Ser Asp Val His Asn Leu Arg Ser Glu Thr
275 280 285
Leu Asn Gln Gln Tyr His Asn Val Lys Asn Arg Ile Ser Tyr Ala Ser
290 295 300
His Ala Thr Gln Tyr Gly Asp Leu Lys Arg Gly Val Glu Gly Leu Phe
305 310 315 320
Leu Tyr Leu Gly Ser Asn Pro Glu Asn Asp Asn Tyr Thr Phe Val Asp
325 330 335
Asp Asn Val Val Arg Pro Ser Ser Lys Ala Val Asn Gln Arg Asp Ala
340 345 350
Asp Leu Val His Phe Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser
355 360 365
Ser Lys Lys Glu Glu Ala Gln Lys Gln Ile Leu Glu Ala Met Ser His
370 375 380
Arg Val His Ile Asp Ser Ser Ile Asn Leu Ile Gly Lys Leu Leu Phe
385 390 395 400
Gly Ile Glu Lys Gly His Lys Ile Leu Thr Ala Val Arg Ser Ala Gly
405 410 415
His Pro Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Arg Thr
420 425 430
Phe Glu Thr His Cys Gly Ser Leu Ser Gln Tyr Gly Met Lys His Thr
435 440 445
Arg Thr Leu Ala Asn Ile Cys Asn Ala Gly Ile Thr Glu Glu Gln Met
450 455 460
Ala Glu Ala Ala Ser Gln Ala Cys Val Ser Ile Pro Ser Asn Pro Trp
465 470 475 480
Ser Ser His Asp Gly Gly Phe Ser Ala
485
<210> 9
<211> 20
<212> DNA
<213> 人工的
<220>
<223> OaAEPdegen-F, 5'
<400> 9
atggttcgat atcycgccgg 20
<210> 10
<211> 29
<212> PRT
<213> 人工的
<220>
<223> OaAEP1-R, 5'
<400> 10
Thr Cys Ala Thr Gly Ala Ala Cys Thr Ala Ala Ala Thr Cys Cys Thr
1 5 10 15
Cys Cys Ala Thr Gly Gly Ala Ala Ala Gly Ala Gly Cys
20 25
<210> 11
<211> 26
<212> DNA
<213> 人工的
<220>
<223> OaAEP2-R, 5'
<400> 11
ttatgcactg aatcctttat ggaggg 26
<210> 12
<211> 22
<212> DNA
<213> 人工的
<220>
<223> OaAEP3-R, 5'
<400> 12
ttatgcactg aatcctccat cg 22
<210> 13
<211> 387
<212> DNA
<213> 人工的
<220>
<223> Oak1 (kalata B1)
<400> 13
ggatccatgg ctaagttcac cgtctgtctc ctcctgtgct tgcttcttgc agcatttgtt 60
ggggcgtttg gatctgagct ttctgactcc cacaagacca ccttggtcaa tgaaatcgct 120
gagaagatgc tacaaagaaa gatattggat ggggtggaag ctactttggt cactgatgtc 180
gccgagaaga tgttcctaag aaagatgaag gctgaagcga aaacttctga aaccgccgat 240
caggtgttcc tgaaacagtt gcagctcaaa ggacttccag tatgcggtga gacttgtgtt 300
gggggaactt gcaacactcc aggctgcact tgctcctggc ctgtttgcac acgcaatggc 360
cttcctagtt tggccgcata agtcgac 387
<210> 14
<211> 124
<212> PRT
<213> 人工的
<220>
<223> Kalata B1
<400> 14
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr
85 90 95
Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Trp Pro
100 105 110
Val Cys Thr Arg Asn Gly Leu Pro Ser Leu Ala Ala
115 120
<210> 15
<211> 29
<212> PRT
<213> 人工的
<220>
<223> Kalata B1
<400> 15
Gly Leu Pro Val Cys Gly Glu Thr Cys Val Gly Gly Thr Cys Asn Thr
1 5 10 15
Pro Gly Cys Thr Cys Ser Trp Pro Val Cys Thr Arg Asn
20 25
<210> 16
<211> 7
<212> PRT
<213> 人工的
<220>
<223> Kalata B1 C-terminal pro-hepta-peptide
<400> 16
Gly Leu Pro Ser Leu Ala Ala
1 5
<210> 17
<211> 5
<212> PRT
<213> 人工的
<220>
<223> MGEV 接头
<400> 17
Glu Glu Lys Lys Asn
1 5
<210> 18
<211> 6
<212> PRT
<213> 人工的
<220>
<223> MGEV 接头
<400> 18
Glu Glu Lys Lys Asn Asp
1 5
<210> 19
<211> 1767
<212> DNA
<213> 人工的
<220>
<223> SSOaVPE1-OaAEP1b-EEKKND-Oak1
<400> 19
ggatccatgg ttcggtatct cgccggagca gtcctactcc tagttgtact ttcagttgcc 60
gccgccgtat ccggagctcg tgatggcgac tatctacatc tgccatcgga agtttcccga 120
tttttccggc cacaggagac caacgacgac cacggcgaag actcggtcgg aactagatgg 180
gctgtcctga tcgctgggtc gaaaggttat gcaaactacc ggcatcaggc tggtgtttgt 240
catgcatatc aaatattgaa aagaggaggt cttaaagatg aaaacattgt ggtattcatg 300
tatgacgaca ttgcctacaa tgaatcgaac cctaggcctg gagttatcat caacagccca 360
cacggcagtg atgtttatgc cggagtccca aaggattata caggggaaga ggttaatgct 420
aagaactttt tggcagctat tcttggcaac aagtctgcta ttacgggggg tagcggcaag 480
gtggttgata gtggtccaaa tgatcacatc ttcatctact atacagatca cggtgccgct 540
ggggtaattg ggatgccttc aaaaccttac ctttatgcgg atgaattaaa tgatgctttg 600
aagaagaagc atgcttctgg gacatataag agcttggtgt tttacctgga agcttgtgag 660
tcgggtagca tgtttgaggg aatactccct gaggatctta atatctacgc gctaacatct 720
acaaacacaa cagaaagcag ttggtgttat tattgccctg cacaggaaaa tccccctccc 780
ccggaatata acgtttgctt gggtgactta tttagtgttg cgtggttgga agacagtgac 840
gtacaaaatt cgtggtatga aactttgaac cagcaatatc accatgttga caagagaatc 900
tcgcatgcct cccatgccac gcaatatgga aatttgaagc tgggtgagga aggtctattc 960
gtctatatgg gttctaaccc tgctaatgat aattacactt ctttggatgg caatgctctt 1020
actccatctt caatagttgt taatcagcgt gatgctgatt tattgcactt gtgggaaaag 1080
ttccgtaagg ctcctgaagg ctctgcaagg aaagaagtag ctcaaacaca gatctttaaa 1140
gcgatgtccc atcgagtgca catcgacagc agcataaaat taattggaaa gcttctcttt 1200
ggtattgaga aatgcactga aattcttaat gctgtcaggc cagctggtca gcctcttgtt 1260
gatgactggg cctgcctcag atctttggtc ggaacatttg agacacattg tggctcgctg 1320
tcggaatatg gaatgagaca tactcggacc attgcaaata tctgcaatgc tggaatctct 1380
gaggaacaga tggcggaggc agcctcgcag gcttgtgcta gtattcctga agaaaagaag 1440
aacgattttg gatctgagct ttctgactcc cacaagacca ccttggtcaa tgaaatcgct 1500
gagaagatgc tacaaagaaa gatattggat ggggtggaag ctactttggt cactgatgtc 1560
gccgagaaga tgttcctaag aaagatgaag gctgaagcga aaacttctga aaccgccgat 1620
caggtgttcc tgaaacagtt gcagctcaaa ggacttccag tatgcggtga gacttgtgtt 1680
gggggaactt gcaacactcc aggctgcact tgctcctggc ctgtttgcac acgcaatggc 1740
cttcctagtt tggccgcata agtcgac 1767
<210> 20
<211> 584
<212> PRT
<213> 人工的
<220>
<223> SSOaVPE1-OaAEP1b-EEKKND-Oak1
<400> 20
Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser
1 5 10 15
Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu
20 25 30
Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp
35 40 45
His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly
50 55 60
Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala
65 70 75 80
Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val
85 90 95
Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly
100 105 110
Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro
115 120 125
Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala
130 135 140
Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val
145 150 155 160
Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly
165 170 175
Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp
180 185 190
Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys
195 200 205
Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu
210 215 220
Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn
225 230 235 240
Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro
245 250 255
Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala
260 265 270
Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn
275 280 285
Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala
290 295 300
Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr
305 310 315 320
Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn
325 330 335
Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu
340 345 350
Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg
355 360 365
Lys Glu Val Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val
370 375 380
His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile
385 390 395 400
Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro
405 410 415
Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu
420 425 430
Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr
435 440 445
Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu
450 455 460
Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro Glu Glu Lys Lys Asn Asp
465 470 475 480
Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr Leu Val Asn Glu
485 490 495
Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp Gly Val Glu Ala
500 505 510
Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu Arg Lys Met Lys
515 520 525
Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val Phe Leu Lys Gln
530 535 540
Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr Cys Val Gly Gly
545 550 555 560
Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Trp Pro Val Cys Thr Arg
565 570 575
Asn Gly Leu Pro Ser Leu Ala Ala
580
<210> 21
<211> 1758
<212> DNA
<213> 人工的
<220>
<223> SSOak1-Oak1-EEKKND-OaAep1b
<400> 21
ggatccatgg ctaagttcac cgtctgtctc ctcctgtgct tgcttcttgc agcatttgtt 60
ggggcgtttg gatctgagct ttctgactcc cacaagacca ccttggtcaa tgaaatcgct 120
gagaagatgc tacaaagaaa gatattggat ggggtggaag ctactttggt cactgatgtc 180
gccgagaaga tgttcctaag aaagatgaag gctgaagcga aaacttctga aaccgccgat 240
caggtgttcc tgaaacagtt gcagctcaaa ggacttccag tatgcggtga gacttgtgtt 300
gggggaactt gcaacactcc aggctgcact tgctcctggc ctgtttgcac acgcaatggc 360
cttcctagtt tggccgcaga agaaaagaag aacgatgctc gtgatggcga ctatctacat 420
ctgccatcgg aagtttcccg atttttccgg ccacaggaga ccaacgacga ccacggcgaa 480
gactcggtcg gaactagatg ggctgtcctg atcgctgggt cgaaaggtta tgcaaactac 540
cggcatcagg ctggtgtttg tcatgcatat caaatattga aaagaggagg tcttaaagat 600
gaaaacattg tggtattcat gtatgacgac attgcctaca atgaatcgaa ccctaggcct 660
ggagttatca tcaacagccc acacggcagt gatgtttatg ccggagtccc aaaggattat 720
acaggggaag aggttaatgc taagaacttt ttggcagcta ttcttggcaa caagtctgct 780
attacggggg gtagcggcaa ggtggttgat agtggtccaa atgatcacat cttcatctac 840
tatacagatc acggtgccgc tggggtaatt gggatgcctt caaaacctta cctttatgcg 900
gatgaattaa atgatgcttt gaagaagaag catgcttctg ggacatataa gagcttggtg 960
ttttacctgg aagcttgtga gtcgggtagc atgtttgagg gaatactccc tgaggatctt 1020
aatatctacg cgctaacatc tacaaacaca acagaaagca gttggtgtta ttattgccct 1080
gcacaggaaa atccccctcc cccggaatat aacgtttgct tgggtgactt atttagtgtt 1140
gcgtggttgg aagacagtga cgtacaaaat tcgtggtatg aaactttgaa ccagcaatat 1200
caccatgttg acaagagaat ctcgcatgcc tcccatgcca cgcaatatgg aaatttgaag 1260
ctgggtgagg aaggtctatt cgtctatatg ggttctaacc ctgctaatga taattacact 1320
tctttggatg gcaatgctct tactccatct tcaatagttg ttaatcagcg tgatgctgat 1380
ttattgcact tgtgggaaaa gttccgtaag gctcctgaag gctctgcaag gaaagaagta 1440
gctcaaacac agatctttaa agcgatgtcc catcgagtgc acatcgacag cagcataaaa 1500
ttaattggaa agcttctctt tggtattgag aaatgcactg aaattcttaa tgctgtcagg 1560
ccagctggtc agcctcttgt tgatgactgg gcctgcctca gatctttggt cggaacattt 1620
gagacacatt gtggctcgct gtcggaatat ggaatgagac atactcggac cattgcaaat 1680
atctgcaatg ctggaatctc tgaggaacag atggcggagg cagcctcgca ggcttgtgct 1740
agtattcctt gagtcgac 1758
<210> 22
<211> 601
<212> PRT
<213> 人工的
<220>
<223> SSOak1-Oak1-EEKKND-OaAEP1b
<400> 22
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr
85 90 95
Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Trp Pro
100 105 110
Val Cys Thr Arg Asn Gly Leu Pro Ser Leu Ala Ala Glu Glu Lys Lys
115 120 125
Asn Asp Ala Arg Asp Gly Asp Tyr Leu His Leu Pro Ser Glu Val Ser
130 135 140
Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp His Gly Glu Asp Ser
145 150 155 160
Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Lys Gly Tyr Ala
165 170 175
Asn Tyr Arg His Gln Ala Gly Val Cys His Ala Tyr Gln Ile Leu Lys
180 185 190
Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val Phe Met Tyr Asp Asp
195 200 205
Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly Val Ile Ile Asn Ser
210 215 220
Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly
225 230 235 240
Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala Ile Leu Gly Asn Lys
245 250 255
Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn
260 265 270
Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly Ala Ala Gly Val Ile
275 280 285
Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp Glu Leu Asn Asp Ala
290 295 300
Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe Tyr
305 310 315 320
Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu Gly Ile Leu Pro Glu
325 330 335
Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn Thr Thr Glu Ser Ser
340 345 350
Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro Pro Pro Pro Glu Tyr
355 360 365
Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala Trp Leu Glu Asp Ser
370 375 380
Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn Gln Gln Tyr His His
385 390 395 400
Val Asp Lys Arg Ile Ser His Ala Ser His Ala Thr Gln Tyr Gly Asn
405 410 415
Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr Met Gly Ser Asn Pro
420 425 430
Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn Ala Leu Thr Pro Ser
435 440 445
Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu Leu His Leu Trp Glu
450 455 460
Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg Lys Glu Val Ala Gln
465 470 475 480
Thr Gln Ile Phe Lys Ala Met Ser His Arg Val His Ile Asp Ser Ser
485 490 495
Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile Glu Lys Cys Thr Glu
500 505 510
Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp
515 520 525
Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu Thr His Cys Gly Ser
530 535 540
Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr Ile Ala Asn Ile Cys
545 550 555 560
Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu Ala Ala Ser Gln Ala
565 570 575
Cys Ala Ser Ile Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu Ala
580 585 590
Ala Ser Gln Ala Cys Ala Ser Ile Pro
595 600
<210> 23
<211> 1449
<212> DNA
<213> 人工的
<220>
<223> CtAEP1 (butelase 1) (KF918345)
<400> 23
atgaagaatc cacttgcaat ccttttcctc atcgccaccg tcgtggccgt cgtctccggt 60
atccgtgacg attttctccg attgccctcc caagcttcca agttcttcca agcagacgac 120
aacgttgagg ggaccaggtg ggctgtctta gtcgccggtt ccaagggcta cgtcaattac 180
aggcatcagg ctgatgtttg tcatgcatat caaattctga agaaaggtgg cttgaaagat 240
gaaaacatta ttgtatttat gtatgatgat attgcctaca atgaatcgaa cccgcatcca 300
ggagtaatta ttaaccaccc atatggaagt gatgtttaca aaggagtccc taaggattac 360
gtcggtgaag acattaatcc tcccaacttt tatgctgttc tacttgcaaa taagtctgct 420
cttactggta ctggtagcgg caaggttttg gacagtggtc ccaatgatca tgtatttata 480
tactacactg accatggagg tgcaggagta cttgggatgc cttctaagcc atacattgct 540
gcgtctgatc tgaatgatgt tttgaagaag aagcatgctt ctggaacata taaaagcata 600
gtattttatg tagagtcttg tgaatccggg agtatgtttg atggtcttct tcctgaagac 660
cataatatct atgtaatggg agcttcagat acaggagaaa gcagttgggt aacatattgt 720
cctttacagc atcctagccc tcctccagaa tatgatgtct gcgtcggtga cctcttcagt 780
gttgcttggt tggaagactg tgatgtacac aatttgcaaa cagaaacttt ccaacagcaa 840
tatgaagtgg taaaaaataa gaccatcgtg gcactaatag aagatggtac ccatgttgtg 900
cagtatggtg acgtaggact tagcaaacag actctcttcg tatatatggg tacagatcct 960
gctaatgata ataatacttt tacggacaaa aattcattag ggacacctag aaaagcagtt 1020
agtcaacggg atgcagatct catccattac tgggaaaagt atcgtagagc tcctgagggt 1080
tcttctagga aagctgaagc taagaaacaa cttcgggaag taatggctca cagaatgcat 1140
atagacaaca gtgtgaaaca cattggaaag ctcttatttg gcattgaaaa gggtcataaa 1200
atgctcaaca atgttagacc tgcagggcta ccagttgtag atgactggga ttgcttcaaa 1260
acactgatta ggacttttga gacacattgt ggatccctgt cagagtatgg tatgaaacat 1320
atgcggtcgt ttgcaaactt gtgcaacgct ggaatacgga aagagcaaat ggctgaggcc 1380
tctgcacaag cttgcgtcag tattcctgat aatccatgga gttctctaca cgctggtttc 1440
agtgtatag 1449
<210> 24
<211> 482
<212> PRT
<213> 人工的
<220>
<223> CtAEP1 (butelase1)
<400> 24
Met Lys Asn Pro Leu Ala Ile Leu Phe Leu Ile Ala Thr Val Val Ala
1 5 10 15
Val Val Ser Gly Ile Arg Asp Asp Phe Leu Arg Leu Pro Ser Gln Ala
20 25 30
Ser Lys Phe Phe Gln Ala Asp Asp Asn Val Glu Gly Thr Arg Trp Ala
35 40 45
Val Leu Val Ala Gly Ser Lys Gly Tyr Val Asn Tyr Arg His Gln Ala
50 55 60
Asp Val Cys His Ala Tyr Gln Ile Leu Lys Lys Gly Gly Leu Lys Asp
65 70 75 80
Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser
85 90 95
Asn Pro His Pro Gly Val Ile Ile Asn His Pro Tyr Gly Ser Asp Val
100 105 110
Tyr Lys Gly Val Pro Lys Asp Tyr Val Gly Glu Asp Ile Asn Pro Pro
115 120 125
Asn Phe Tyr Ala Val Leu Leu Ala Asn Lys Ser Ala Leu Thr Gly Thr
130 135 140
Gly Ser Gly Lys Val Leu Asp Ser Gly Pro Asn Asp His Val Phe Ile
145 150 155 160
Tyr Tyr Thr Asp His Gly Gly Ala Gly Val Leu Gly Met Pro Ser Lys
165 170 175
Pro Tyr Ile Ala Ala Ser Asp Leu Asn Asp Val Leu Lys Lys Lys His
180 185 190
Ala Ser Gly Thr Tyr Lys Ser Ile Val Phe Tyr Val Glu Ser Cys Glu
195 200 205
Ser Gly Ser Met Phe Asp Gly Leu Leu Pro Glu Asp His Asn Ile Tyr
210 215 220
Val Met Gly Ala Ser Asp Thr Gly Glu Ser Ser Trp Val Thr Tyr Cys
225 230 235 240
Pro Leu Gln His Pro Ser Pro Pro Pro Glu Tyr Asp Val Cys Val Gly
245 250 255
Asp Leu Phe Ser Val Ala Trp Leu Glu Asp Cys Asp Val His Asn Leu
260 265 270
Gln Thr Glu Thr Phe Gln Gln Gln Tyr Glu Val Val Lys Asn Lys Thr
275 280 285
Ile Val Ala Leu Ile Glu Asp Gly Thr His Val Val Gln Tyr Gly Asp
290 295 300
Val Gly Leu Ser Lys Gln Thr Leu Phe Val Tyr Met Gly Thr Asp Pro
305 310 315 320
Ala Asn Asp Asn Asn Thr Phe Thr Asp Lys Asn Ser Leu Gly Thr Pro
325 330 335
Arg Lys Ala Val Ser Gln Arg Asp Ala Asp Leu Ile His Tyr Trp Glu
340 345 350
Lys Tyr Arg Arg Ala Pro Glu Gly Ser Ser Arg Lys Ala Glu Ala Lys
355 360 365
Lys Gln Leu Arg Glu Val Met Ala His Arg Met His Ile Asp Asn Ser
370 375 380
Val Lys His Ile Gly Lys Leu Leu Phe Gly Ile Glu Lys Gly His Lys
385 390 395 400
Met Leu Asn Asn Val Arg Pro Ala Gly Leu Pro Val Val Asp Asp Trp
405 410 415
Asp Cys Phe Lys Thr Leu Ile Arg Thr Phe Glu Thr His Cys Gly Ser
420 425 430
Leu Ser Glu Tyr Gly Met Lys His Met Arg Ser Phe Ala Asn Leu Cys
435 440 445
Asn Ala Gly Ile Arg Lys Glu Gln Met Ala Glu Ala Ser Ala Gln Ala
450 455 460
Cys Val Ser Ile Pro Asp Asn Pro Trp Ser Ser Leu His Ala Gly Phe
465 470 475 480
Ser Val
<210> 25
<211> 1494
<212> DNA
<213> 人工的
<220>
<223> CtAEP2
<400> 25
atggcggttg atcactgttt cctcaagaaa aaaacatgtt attatgggtt tgtattatgg 60
tcatggatgt tgatgatgag cttgcatagt aaagccgcaa ggctgaaccc acagaaggag 120
tgggattcgg ttattcgctt accaactgaa ccggtagacg ctgacacgga tgaagtggga 180
acacgatggg ccgttctcgt cgctggttca aacggctatg aaaattatag gcatcaagcc 240
gatgtatgcc atgcatacca gttgttgata aaaggtggat taaaagaaga gaatattgtg 300
gtgtttatgt acgatgacat agcatggcac gagttgaatc ccaggcctgg agtcatcatc 360
aacaatcctc ggggggaaga tgtgtatgcg ggtgtcccta aagattacac tggtgaggac 420
gtgacagcgg agaacctatt tgcagtcatt cttggggaca ggagtaaagt gaagggagga 480
agtggcaaag tgatcaacag taaacctgag gacaggatat ttatttttta ctctgatcat 540
ggaggtcccg gagttcttgg gatgccgaac gagcaaatcc tttacgccat ggattttatt 600
gatgttttga agaagaaaca tgcttcagga gggtacaggg aaatggttat atacgtggaa 660
gcttgtgaaa gtgggagcct ctttgagggt atcatgccca aggatctgaa tgtttttgtc 720
acaactgcat caaacgcaca agagaatagc tggggaactt attgtcctgg gacggagcct 780
tctccaccac cagagtacac cacttgcttg ggtgatttgt acagcgttgc ttggatggaa 840
gacagtgaga gtcacaattt gagaagggaa acggtgaacc aacaataccg ctcggtaaag 900
gaacggactt caaattttaa agactatgca atgggatctc atgtgatgca atacggtgac 960
actaacatca cagctgaaaa gctttactta ttccaaggtt ttgatcccgc cacagtgaat 1020
ttacctccac acaacggcag gatagaagct aaaatggaag ttgttcacca gagagatgca 1080
gaacttctct tcatgtggca aatgtatcag agatcaaacc atctactagg aaagaagaca 1140
cacatcctta agcaaattgc agagacagtg aagcatagga atcacttaga tggtagcgtg 1200
gaactgattg gagttttact gtatggacca gggaaaggtt ctccagttct acaatccgtg 1260
agggatcctg gtctgcccct tgttgacaac tgggcatgtt taaaatcaat ggttcgggta 1320
ttcgagtctc actgtgggtc actgactcag tatggtatga aacacatgcg agcattcgcc 1380
aacatatgca acagtggtgt ttccgagtcc tcaatggaag aggcttgtat ggtagcatgt 1440
ggtggccatg atgctggaca tctacatcca tccaagagag gctatattgc ttga 1494
<210> 26
<211> 497
<212> PRT
<213> 人工的
<220>
<223> CtAEP2
<400> 26
Met Ala Val Asp His Cys Phe Leu Lys Lys Lys Thr Cys Tyr Tyr Gly
1 5 10 15
Phe Val Leu Trp Ser Trp Met Leu Met Met Ser Leu His Ser Lys Ala
20 25 30
Ala Arg Leu Asn Pro Gln Lys Glu Trp Asp Ser Val Ile Arg Leu Pro
35 40 45
Thr Glu Pro Val Asp Ala Asp Thr Asp Glu Val Gly Thr Arg Trp Ala
50 55 60
Val Leu Val Ala Gly Ser Asn Gly Tyr Glu Asn Tyr Arg His Gln Ala
65 70 75 80
Asp Val Cys His Ala Tyr Gln Leu Leu Ile Lys Gly Gly Leu Lys Glu
85 90 95
Glu Asn Ile Val Val Phe Met Tyr Asp Asp Ile Ala Trp His Glu Leu
100 105 110
Asn Pro Arg Pro Gly Val Ile Ile Asn Asn Pro Arg Gly Glu Asp Val
115 120 125
Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly Glu Asp Val Thr Ala Glu
130 135 140
Asn Leu Phe Ala Val Ile Leu Gly Asp Arg Ser Lys Val Lys Gly Gly
145 150 155 160
Ser Gly Lys Val Ile Asn Ser Lys Pro Glu Asp Arg Ile Phe Ile Phe
165 170 175
Tyr Ser Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Asn Glu Gln
180 185 190
Ile Leu Tyr Ala Met Asp Phe Ile Asp Val Leu Lys Lys Lys His Ala
195 200 205
Ser Gly Gly Tyr Arg Glu Met Val Ile Tyr Val Glu Ala Cys Glu Ser
210 215 220
Gly Ser Leu Phe Glu Gly Ile Met Pro Lys Asp Leu Asn Val Phe Val
225 230 235 240
Thr Thr Ala Ser Asn Ala Gln Glu Asn Ser Trp Gly Thr Tyr Cys Pro
245 250 255
Gly Thr Glu Pro Ser Pro Pro Pro Glu Tyr Thr Thr Cys Leu Gly Asp
260 265 270
Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Glu Ser His Asn Leu Arg
275 280 285
Arg Glu Thr Val Asn Gln Gln Tyr Arg Ser Val Lys Glu Arg Thr Ser
290 295 300
Asn Phe Lys Asp Tyr Ala Met Gly Ser His Val Met Gln Tyr Gly Asp
305 310 315 320
Thr Asn Ile Thr Ala Glu Lys Leu Tyr Leu Phe Gln Gly Phe Asp Pro
325 330 335
Ala Thr Val Asn Leu Pro Pro His Asn Gly Arg Ile Glu Ala Lys Met
340 345 350
Glu Val Val His Gln Arg Asp Ala Glu Leu Leu Phe Met Trp Gln Met
355 360 365
Tyr Gln Arg Ser Asn His Leu Leu Gly Lys Lys Thr His Ile Leu Lys
370 375 380
Gln Ile Ala Glu Thr Val Lys His Arg Asn His Leu Asp Gly Ser Val
385 390 395 400
Glu Leu Ile Gly Val Leu Leu Tyr Gly Pro Gly Lys Gly Ser Pro Val
405 410 415
Leu Gln Ser Val Arg Asp Pro Gly Leu Pro Leu Val Asp Asn Trp Ala
420 425 430
Cys Leu Lys Ser Met Val Arg Val Phe Glu Ser His Cys Gly Ser Leu
435 440 445
Thr Gln Tyr Gly Met Lys His Met Arg Ala Phe Ala Asn Ile Cys Asn
450 455 460
Ser Gly Val Ser Glu Ser Ser Met Glu Glu Ala Cys Met Val Ala Cys
465 470 475 480
Gly Gly His Asp Ala Gly His Leu His Pro Ser Lys Arg Gly Tyr Ile
485 490 495
Ala
<210> 27
<211> 1431
<212> DNA
<213> 人工的
<220>
<223> CtAEP5
<400> 27
atggactctt tcccaactct tctcctcttc ctcttcctcc tctcccttgc aacccttgtc 60
tctgctcgcc atgctcttcc cggagacttt ctccggtttc cctccgacca agacaacctt 120
cccggtacaa gttgggctgt ccttcttgct ggttccaaag attactggaa ctacagacac 180
caggctgata tttgtcatgc gtatcaaata ttgaggaaag gtgggttgaa agaggaaaat 240
atcattgttt ttatgtatga tgacattgct ttcaatgaaa ataacccaag gcctggagtc 300
atcattaaca aacctgatgg ggatgatgtt tatgaaggag ttccaaagga ttacacaggt 360
gaagatgtta atgttaataa cttctttgct gttttacttg gaaataagtc agcacttaca 420
ggtggcagcg gaaaggtttt gaacagtggc cctaatgatc atatatttat attctattct 480
gatcatggag gtccaggagt gcttggaatg cccactcatc cttacttata tgcggatgat 540
ttgaatgaag tgttaaagaa aaagcatgct tctgggacgt ataaacgctt agtattttat 600
attgaggcat gtgaatctgg gagtattttt gaaggtcttc ttcctgaaga tatcgatatt 660
tatgcaacaa cagcttcaaa tgctacagaa agtagttctc caacatattg tcctcgcccg 720
cctgcagaac atgctccttt tccagaatat acaacttgct tgggtgacct gtatagtatt 780
acttggatgg aagacagtga aaaacacaat ttgcaaacag aaactttaca ccaacaatat 840
aaattgctta aggagagagt ttccttgcgc tctaatgtga tgcagtatgg tgatatagac 900
attagtagtg atgttctctt ccaatatttg ggtacaaatc ctactaatga aaattttact 960
tttatggatg agaactactt gagatcatct tcaaaatcaa tcaatcaacg tgatgccgat 1020
ctcatccatt tttggcataa gttccacaaa gctcttgagg gttctaccca taaaaataca 1080
gctcagaaac aagtcttgga agtaatgtct cacagaatgc atattgacaa cagtgtgcaa 1140
cttattagaa aacttctgtt tagcattgaa aagggtccag aaacactcaa caaagttagg 1200
cctgctgggt cagtacttgt tgatgactgg ggctgcctaa aaaccatggt aaggactttt 1260
gagacacatt gtggatcttt gtctcagtat gggatgaaac atatgaggtc ctttgcaaac 1320
atctgcaatg caagaataaa gaatgagcaa atggctaagg cttcagcaca agcatgtgtc 1380
agtattccaa ccaatccttg gagttctctt caaagaggtt tcagtgcata a 1431
<210> 28
<211> 476
<212> PRT
<213> 人工的
<220>
<223> CtAEP5
<400> 28
Met Asp Ser Phe Pro Thr Leu Leu Leu Phe Leu Phe Leu Leu Ser Leu
1 5 10 15
Ala Thr Leu Val Ser Ala Arg His Ala Leu Pro Gly Asp Phe Leu Arg
20 25 30
Phe Pro Ser Asp Gln Asp Asn Leu Pro Gly Thr Ser Trp Ala Val Leu
35 40 45
Leu Ala Gly Ser Lys Asp Tyr Trp Asn Tyr Arg His Gln Ala Asp Ile
50 55 60
Cys His Ala Tyr Gln Ile Leu Arg Lys Gly Gly Leu Lys Glu Glu Asn
65 70 75 80
Ile Ile Val Phe Met Tyr Asp Asp Ile Ala Phe Asn Glu Asn Asn Pro
85 90 95
Arg Pro Gly Val Ile Ile Asn Lys Pro Asp Gly Asp Asp Val Tyr Glu
100 105 110
Gly Val Pro Lys Asp Tyr Thr Gly Ile Ile Asn Lys Pro Asp Gly Asp
115 120 125
Asp Val Tyr Glu Gly Val Pro Lys Asp Tyr Thr Gly Gly Gly Ser Gly
130 135 140
Lys Val Leu Asn Ser Gly Pro Asn Asp His Ile Phe Ile Phe Tyr Ser
145 150 155 160
Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Thr His Pro Tyr Leu
165 170 175
Tyr Ala Asp Asp Leu Asn Glu Val Leu Lys Lys Lys His Ala Ser Gly
180 185 190
Thr Tyr Lys Arg Leu Val Phe Tyr Ile Glu Ala Cys Glu Ser Gly Ser
195 200 205
Ile Phe Glu Gly Leu Leu Pro Glu Asp Ile Asp Ile Tyr Ala Thr Thr
210 215 220
Ala Ser Asn Ala Thr Glu Ser Ser Ser Pro Thr Tyr Cys Pro Arg Pro
225 230 235 240
Pro Ala Glu His Ala Pro Phe Pro Glu Tyr Thr Thr Cys Leu Gly Asp
245 250 255
Leu Tyr Ser Ile Thr Trp Met Glu Asp Ser Glu Lys His Asn Leu Gln
260 265 270
Thr Glu Thr Leu His Gln Gln Tyr Lys Leu Leu Lys Glu Arg Val Ser
275 280 285
Leu Arg Ser Asn Val Met Gln Tyr Gly Asp Ile Asp Ile Ser Ser Asp
290 295 300
Val Leu Phe Gln Tyr Leu Gly Thr Asn Pro Thr Asn Glu Asn Phe Thr
305 310 315 320
Phe Met Asp Glu Asn Tyr Leu Arg Ser Ser Ser Lys Ser Ile Asn Gln
325 330 335
Arg Asp Ala Asp Leu Ile His Phe Trp His Lys Phe His Lys Ala Leu
340 345 350
Glu Gly Ser Thr His Lys Asn Thr Ala Gln Lys Gln Val Leu Glu Val
355 360 365
Met Ser His Arg Met His Ile Asp Asn Ser Val Gln Leu Ile Arg Lys
370 375 380
Leu Leu Phe Ser Ile Glu Lys Gly Pro Glu Thr Leu Asn Lys Val Arg
385 390 395 400
Pro Ala Gly Ser Val Leu Val Asp Asp Trp Gly Cys Leu Lys Thr Met
405 410 415
Val Arg Thr Phe Glu Thr His Cys Gly Ser Leu Ser Gln Tyr Gly Met
420 425 430
Lys His Met Arg Ser Phe Ala Asn Ile Cys Asn Ala Arg Ile Lys Asn
435 440 445
Glu Gln Met Ala Lys Ala Ser Ala Gln Ala Cys Val Ser Ile Pro Thr
450 455 460
Asn Pro Trp Ser Ser Leu Gln Arg Gly Phe Ser Ala
465 470 475
<210> 29
<211> 360
<212> DNA
<213> 人工的
<220>
<223> Oak1-HV
<400> 29
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 120
atgctacaaa gaaagatatt ggatggggtg gaagctactt tggtcactga tgtcgccgag 180
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 240
ttcctgaaac agttgcagct caaaggactt ccagtatgcg gtgagacttg tgttggggga 300
acttgcaaca ctccaggctg cacttgctcc tggcctgttt gcacacgcaa tcatgtttaa 360
<210> 30
<211> 119
<212> PRT
<213> 人工的
<220>
<223> Kalata B1-HV
<400> 30
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu
20 25 30
Leu Leu Ala Ala Phe Val Gly Ala Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr
85 90 95
Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Trp Pro
100 105 110
Val Cys Thr Arg Asn His Val
115
<210> 31
<211> 14
<212> PRT
<213> 人工的
<220>
<223> SFTI-1
<400> 31
Gly Arg Cys Thr Lys Ser Ile Pro Pro Ile Cys Phe Pro Asp
1 5 10
<210> 32
<211> 30
<212> PRT
<213> 人工的
<220>
<223> VoO13
<400> 32
Gly Ile Pro Cys Gly Glu Ser Cys Val Trp Ile Pro Cys Ile Ser Ala
1 5 10 15
Ala Ile Gly Cys Ser Cys Lys Ser Lys Val Cys Tyr Arg Asn
20 25 30
<210> 33
<211> 34
<212> PRT
<213> 人工的
<220>
<223> cpr3
<400> 33
Gly Leu Pro Val Cys Gly Glu Thr Cys Val Gly Gly Thr Cys Asn Thr
1 5 10 15
Arg Arg Lys Arg Arg Arg Gly Cys Thr Cys Ser Trp Pro Val Cys Thr
20 25 30
Arg Asn
<210> 34
<211> 22
<212> PRT
<213> 人工的
<220>
<223> Vc1.1-GGAAGN
<400> 34
Gly Cys Cys Ser Asp Pro Arg Cys Asn Tyr Asp His Pro Glu Ile Cys
1 5 10 15
Gly Gly Ala Ala Gly Asn
20
<210> 35
<211> 22
<212> PRT
<213> 人工的
<220>
<223> GLP-Vc1.1-TRN
<400> 35
Gly Leu Pro Gly Cys Cys Ser Asp Pro Arg Cys Asn Tyr Asp His Pro
1 5 10 15
Glu Ile Cys Thr Arg Asn
20
<210> 36
<211> 34
<212> PRT
<213> 人工的
<220>
<223> McoTI-II (V03R)
<400> 36
Gly Gly Arg Cys Pro Lys Ile Leu Lys Lys Cys Arg Arg Asp Ser Asp
1 5 10 15
Cys Pro Gly Ala Cys Ile Cys Arg Gly Asn Gly Tyr Cys Gly Ser Gly
20 25 30
Ser Asp
<210> 37
<211> 330
<212> DNA
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-SFTI-CTPPOak1
<400> 37
atggctaagt ttactgtgtg tcttttattg tgtttattat tggctgcttt tgttggtgct 60
tttggttcag agttatcaga ttctcacaag actacactcg ttaatgagat tgctgagaag 120
atgctccaaa gaaaaatctt agatggagtg gaagctaccc ttgttactga tgtggcagag 180
aagatgtttt tgaggaagat gaaagctgaa gcaaaaacat ctgagaccgc agatcaggtt 240
ttcttgaagc aacttcagtt gaaaggtaga tgcaccaagt ctattcctcc tatttgtttc 300
cctgatggat taccttcttt agcagcataa 330
<210> 38
<211> 109
<212> PRT
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-SFTI-CTPPOak1
<400> 38
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Arg Cys Thr Lys Ser Ile Pro
85 90 95
Pro Ile Cys Phe Pro Asp Gly Leu Pro Ser Leu Ala Ala
100 105
<210> 39
<211> 378
<212> DNA
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-VoO13-CTPPOak1
<400> 39
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 120
atgctacaaa gaaagatatt ggatggggtg gaagctactt tggtcactga tgtcgccgag 180
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 240
ttcctgaaac agttgcagct caaaggcatc ccttgcggtg aaagttgcgt ttggattcca 300
tgcatctctg ctgccattgg gtgttcctgc aagagcaaag tttgctacag gaacggcctt 360
cctagtttgg ccgcataa 378
<210> 40
<211> 125
<212> PRT
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-VoO13-CTPPOak1
<400> 40
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Ile Pro Cys Gly Glu Ser Cys
85 90 95
Val Trp Ile Pro Cys Ile Ser Ala Ala Ile Gly Cys Ser Cys Lys Ser
100 105 110
Lys Val Cys Tyr Arg Asn Gly Leu Pro Ser Leu Ala Ala
115 120 125
<210> 41
<211> 390
<212> DNA
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-cpr3-CTPPOak1
<400> 41
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 120
atgctacaaa gaaagatatt ggatggggtg gaagctactt tggtcactga tgtcgccgag 180
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 240
ttcctgaaac agttgcagct caaaggactt ccagtatgcg gtgagacttg tgttggggga 300
acttgcaaca ctagaaggaa gagaagaagg ggctgcactt gctcctggcc tgtttgcaca 360
cgcaatggcc ttcctagttt ggccgcataa 390
<210> 42
<211> 129
<212> PRT
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-cpr3-CTPPOak1
<400> 42
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr
85 90 95
Cys Val Gly Gly Thr Cys Asn Thr Arg Arg Lys Arg Arg Arg Gly Cys
100 105 110
Thr Cys Ser Trp Pro Val Cys Thr Arg Asn Gly Leu Pro Ser Leu Ala
115 120 125
Ala
<210> 43
<211> 354
<212> DNA
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-Vc1.1-GGAAGN-CTPPOak1
<400> 43
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 120
atgctacaaa gaaagatatt ggatggggtg gaagctactt tggtcactga tgtcgccgag 180
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 240
ttcctgaaac agttgcagct caaaggatgt tgttctgatc caagatgcaa ttatgatcat 300
cctgaaattt gtggaggtgc agctggaaat ggccttccta gtttggccgc ataa 354
<210> 44
<211> 117
<212> PRT
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-Vc1.1-GGAAGN-CTPPOak1
<400> 44
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Cys Cys Ser Asp Pro Arg Cys
85 90 95
Asn Tyr Asp His Pro Glu Ile Cys Gly Gly Ala Ala Gly Asn Gly Leu
100 105 110
Pro Ser Leu Ala Ala
115
<210> 45
<211> 354
<212> DNA
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-GLP-Vc1.1-TRN-CTPPOak1
<400> 45
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 120
atgctacaaa gaaagatatt ggatggggtg gaagctactt tggtcactga tgtcgccgag 180
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 240
ttcctgaaac agttgcagct caaaggactt ccaggatgtt gttctgatcc aagatgcaat 300
tatgatcatc ctgaaatttg cacacgcaat ggccttccta gtttggccgc ataa 354
<210> 46
<211> 117
<212> PRT
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-GLP-Vc1.1-TRN-CTPPOak1
<400> 46
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Gly Cys Cys Ser Asp
85 90 95
Pro Arg Cys Asn Tyr Asp His Pro Glu Ile Cys Thr Arg Asn Gly Leu
100 105 110
Pro Ser Leu Ala Ala
115
<210> 47
<211> 390
<212> DNA
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-MCoTI-II(V03R)-CTPPOak1
<400> 47
atggctaagt ttactgtgtg tcttttattg tgtttattat tggctgcttt tgttggtgct 60
tttggttcag agttatcaga ttctcacaag actacactcg ttaatgagat tgctgagaag 120
atgctccaaa gaaaaatctt agatggagtg gaagctaccc ttgttactga tgtggcagag 180
aagatgtttt tgaggaagat gaaagctgaa gcaaaaacat ctgagaccgc agatcaggtt 240
ttcttgaagc aacttcagtt gaaaggaggt agatgtccaa agattcttaa gaaatgtaga 300
agggattctg attgccctgg agcttgtatt tgcaggggaa atggttattg cggatctggt 360
tcagatggat taccttcttt agcagcataa 390
<210> 48
<211> 129
<212> PRT
<213> 人工的
<220>
<223> SSOak1-NTPPOak1-NTROak1-MCoTI-II(V03R)-CTPPOak1
<400> 48
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Gly Arg Cys Pro Lys Ile Leu
85 90 95
Lys Lys Cys Arg Arg Asp Ser Asp Cys Pro Gly Ala Cys Ile Cys Arg
100 105 110
Gly Asn Gly Tyr Cys Gly Ser Gly Ser Asp Gly Leu Pro Ser Leu Ala
115 120 125
Ala
<210> 49
<211> 8
<212> PRT
<213> 人工的
<220>
<223> Ab3
<400> 49
Ser Thr Arg Asn Gly Leu Pro Ser
1 5
<210> 50
<211> 8
<212> PRT
<213> 人工的
<220>
<223> Ab3
<400> 50
Ser Thr Arg Asn Gly Ala Pro Ser
1 5
<210> 51
<211> 474
<212> DNA
<213> 人工的
<220>
<223> Oak2a (kB2-kB3)
<400> 51
atggctaagt tcaccaagtc tctcgtcctg tgcttgcttc ttgcagcttt tgttggggct 60
ttcggagctg agctttctga agctgacaaa gccaacgtgg tcaatgaaat cgctgccaat 120
attcaacgag agatactgaa gggagtgaaa agttcagaaa ccacccttac catgttcctg 180
aaagagatgc agctcaaagg tcttccagta tgcggcgaga cttgctttgg gggaacttgc 240
aacactccag gctgctcgtg cacctggcct atctgcacac gcgatggcct tcctaagagg 300
gctggagtga aaagttcaga aaccaccctt accatgttcc tgaaagagat gcagctcaaa 360
ggtcttccaa catgtggtga gacttgcttt gggggaactt gcaacactcc tggatgcact 420
tgcgatccct ggccgatttg cacacgcgat ggccttccta gtgcggccgc ataa 474
<210> 52
<211> 157
<212> PRT
<213> 人工的
<220>
<223> Oak2a (kB2-kB3)
<400> 52
Met Ala Lys Phe Thr Lys Ser Leu Val Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ala Glu Leu Ser Glu Ala Asp Lys Ala Asn
20 25 30
Val Val Asn Glu Ile Ala Ala Asn Ile Gln Arg Glu Ile Leu Lys Gly
35 40 45
Val Lys Ser Ser Glu Thr Thr Leu Thr Met Phe Leu Lys Glu Met Gln
50 55 60
Leu Lys Gly Leu Pro Val Cys Gly Glu Thr Cys Phe Gly Gly Thr Cys
65 70 75 80
Asn Thr Pro Gly Cys Ser Cys Thr Trp Pro Ile Cys Thr Arg Asp Gly
85 90 95
Leu Pro Lys Arg Ala Gly Val Lys Ser Ser Glu Thr Thr Leu Thr Met
100 105 110
Phe Leu Lys Glu Met Gln Leu Lys Gly Leu Pro Thr Cys Gly Glu Thr
115 120 125
Cys Phe Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Asp Pro Trp
130 135 140
Pro Ile Cys Thr Arg Asp Gly Leu Pro Ser Ala Ala Ala
145 150 155
<210> 53
<211> 633
<212> DNA
<213> 人工的
<220>
<223> Oak4 (Genbank登录号AF393828)
<400> 53
atggctaagt tcaccaactg tctcgtcctg agcttgcttc tagcagcatt tgttggggct 60
ttcggagctg agttttctga agccgacaag gccaccttgg tcaatgatat cgctgagaat 120
atccaaaaag agatactggg cgaagtgaag acttctgaaa ccgtccttac gatgttcctg 180
aaagagatgc agctcaaagg tcttccagta tgcggcgaga cttgctttgg gggaacttgc 240
aacactccag gctgctcttg cacctggcct atctgcacac gcgatagcct tcctatgagg 300
gctggaggaa aaacatctga aaccaccctt catatgttcc tgaaagagat gcagctcaag 360
ggtcttccag tttgcggcga gacttgcttt gggggaactt gcaacactcc aggctgctcg 420
tgcacctggc ctatctgcac acgcgatagc cttcctatga gtgctggagg aaaaacatct 480
gaaaccaccc ttcatatgtt cctgaaagag atgcagctca agggtcttcc agtttgcggc 540
gagacttgct ttgggggaac ttgcaacact ccaggctgct cgtgcacctg gcctatatgc 600
acacgtgata gccttcctct tgtggctgca taa 633
<210> 54
<211> 210
<212> PRT
<213> 人工的
<220>
<223> Oak4 (Genbank 登录号AF393828)
<400> 54
Met Ala Lys Phe Thr Asn Cys Leu Val Leu Ser Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ala Glu Phe Ser Glu Ala Asp Lys Ala Thr
20 25 30
Leu Val Asn Asp Ile Ala Glu Asn Ile Gln Lys Glu Ile Leu Gly Glu
35 40 45
Val Lys Thr Ser Glu Thr Val Leu Thr Met Phe Leu Lys Glu Met Gln
50 55 60
Leu Lys Gly Leu Pro Val Cys Gly Glu Thr Cys Phe Gly Gly Thr Cys
65 70 75 80
Asn Thr Pro Gly Cys Ser Cys Thr Trp Pro Ile Cys Thr Arg Asp Ser
85 90 95
Leu Pro Met Arg Ala Gly Gly Lys Thr Ser Glu Thr Thr Leu His Met
100 105 110
Phe Leu Lys Glu Met Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr
115 120 125
Cys Phe Gly Gly Thr Cys Asn Thr Pro Gly Cys Ser Cys Thr Trp Pro
130 135 140
Ile Cys Thr Arg Asp Ser Leu Pro Met Ser Ala Gly Gly Lys Thr Ser
145 150 155 160
Glu Thr Thr Leu His Met Phe Leu Lys Glu Met Gln Leu Lys Gly Leu
165 170 175
Pro Val Cys Gly Glu Thr Cys Phe Gly Gly Thr Cys Asn Thr Pro Gly
180 185 190
Cys Ser Cys Thr Trp Pro Ile Cys Thr Arg Asp Ser Leu Pro Leu Val
195 200 205
Ala Ala
210
<210> 55
<211> 384
<212> DNA
<213> 人工的
<220>
<223> Cter M (Genbank 登录号 JF501210)
<400> 55
atggcttacg ttagacttac ttctcttgcc gttctcttct tccttgctgc ttccgttatg 60
aagacagaag gaggacttcc tacatgcgga gaaacttgta ccctggggac atgttatgtg 120
ccagattgtt catgttcatg gccaatttgc atgaaaaatc atatcattgc agctaatgca 180
aaaacagtga atgaacatcg tctcttatgt acatctcatg aagactgttt taagaaaggc 240
actggaaact attgtgcttc ttttcccgat tctaacatcc attttggttg gtgtttccat 300
gctgaatctg aaggatattt gttgaaagac tttatgaata tgtcaaagga tgacttaaag 360
atgcctttgg aaagtaccaa ctaa 384
<210> 56
<211> 127
<212> PRT
<213> 人工的
<220>
<223> Cter M (Genbank登录号 JF501210)
<400> 56
Met Ala Tyr Val Arg Leu Thr Ser Leu Ala Val Leu Phe Phe Leu Ala
1 5 10 15
Ala Ser Val Met Lys Thr Glu Gly Gly Leu Pro Thr Cys Gly Glu Thr
20 25 30
Cys Thr Leu Gly Thr Cys Tyr Val Pro Asp Cys Ser Cys Ser Trp Pro
35 40 45
Ile Cys Met Lys Asn His Ile Ile Ala Ala Asn Ala Lys Thr Val Asn
50 55 60
Glu His Arg Leu Leu Cys Thr Ser His Glu Asp Cys Phe Lys Lys Gly
65 70 75 80
Thr Gly Asn Tyr Cys Ala Ser Phe Pro Asp Ser Asn Ile His Phe Gly
85 90 95
Trp Cys Phe His Ala Glu Ser Glu Gly Tyr Leu Leu Lys Asp Phe Met
100 105 110
Asn Met Ser Lys Asp Asp Leu Lys Met Pro Leu Glu Ser Thr Asn
115 120 125
<210> 57
<211> 384
<212> DNA
<213> 人工的
<220>
<223> Cter M-kB1 (经过密码子优化以便在烟草中表达)
<400> 57
atggcttatg tgaggcttac cagtcttgct gtgttattct tccttgctgc ttctgtgatg 60
aaaaccgagg gtggattacc tgtgtgtgga gaaacttgtg ttggaggtac ttgcaataca 120
cctggttgta cctgcagttg gccagtttgt actagaaacc atattatcgc tgcaaatgct 180
aagacagtga acgaacatag gcttttgtgt acctctcacg aggattgctt caagaaggga 240
acaggaaact actgtgcttc tttccctgat tcaaacattc attttggatg gtgcttccac 300
gcagaatcag agggttacct ccttaaagat tttatgaata tgtctaagga tgatttgaag 360
atgccattgg agtctactaa ctaa 384
<210> 58
<211> 127
<212> PRT
<213> 人工的
<220>
<223> Cter M-kB1 (经过密码子优化以便在烟草中表达)
<400> 58
Met Ala Tyr Val Arg Leu Thr Ser Leu Ala Val Leu Phe Phe Leu Ala
1 5 10 15
Ala Ser Val Met Lys Thr Glu Gly Gly Leu Pro Val Cys Gly Glu Thr
20 25 30
Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Trp Pro
35 40 45
Val Cys Thr Arg Asn His Ile Ile Ala Ala Asn Ala Lys Thr Val Asn
50 55 60
Glu His Arg Leu Leu Cys Thr Ser His Glu Asp Cys Phe Lys Lys Gly
65 70 75 80
Thr Gly Asn Tyr Cys Ala Ser Phe Pro Asp Ser Asn Ile His Phe Gly
85 90 95
Trp Cys Phe His Ala Glu Ser Glu Gly Tyr Leu Leu Lys Asp Phe Met
100 105 110
Asn Met Ser Lys Asp Asp Leu Lys Met Pro Leu Glu Ser Thr Asn
115 120 125
<210> 59
<211> 384
<212> DNA
<213> 人工的
<220>
<223> Cter M-kB1-GLP (经过密码子优化以便在烟草中表达)
<400> 59
atggcttatg tgaggcttac cagtcttgct gtgttattct tccttgctgc ttctgtgatg 60
aaaaccgagg gtggattacc tgtgtgtgga gaaacttgtg ttggaggtac ttgcaataca 120
cctggttgta cctgcagttg gccagtttgt actagaaacg gattacctgc tgcaaatgct 180
aagacagtga acgaacatag gcttttgtgt acctctcacg aggattgctt caagaaggga 240
acaggaaact actgtgcttc tttccctgat tcaaacattc attttggatg gtgcttccac 300
gcagaatcag agggttacct ccttaaagat tttatgaata tgtctaagga tgatttgaag 360
atgccattgg agtctactaa ctaa 384
<210> 60
<211> 127
<212> PRT
<213> 人工的
<220>
<223> Cter M-kB1-GLP (经过密码子优化以便在烟草中表达)
<400> 60
Met Ala Tyr Val Arg Leu Thr Ser Leu Ala Val Leu Phe Phe Leu Ala
1 5 10 15
Ala Ser Val Met Lys Thr Glu Gly Gly Leu Pro Val Cys Gly Glu Thr
20 25 30
Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Trp Pro
35 40 45
Val Cys Thr Arg Asn Gly Leu Pro Ala Ala Asn Ala Lys Thr Val Asn
50 55 60
Glu His Arg Leu Leu Cys Thr Ser His Glu Asp Cys Phe Lys Lys Gly
65 70 75 80
Thr Gly Asn Tyr Cys Ala Ser Phe Pro Asp Ser Asn Ile His Phe Gly
85 90 95
Trp Cys Phe His Ala Glu Ser Glu Gly Tyr Leu Leu Lys Asp Phe Met
100 105 110
Asn Met Ser Lys Asp Asp Leu Lys Met Pro Leu Glu Ser Thr Asn
115 120 125
<210> 61
<211> 375
<212> DNA
<213> 人工的
<220>
<223> [W19K/P20N/V21K] kalata B1
<400> 61
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 120
atgctacaaa gaaagatatt ggatggggtg gaagctactt tggtcactga tgtcgccgag 180
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 240
ttcctgaaac agttgcagct caaaggactt ccagtatgcg gtgagacttg tgttggggga 300
acttgcaaca ctccaggctg cacttgctcc aagaataagt gcacacgcaa tggccttcct 360
agtttggccg cataa 375
<210> 62
<211> 124
<212> PRT
<213> 人工的
<220>
<223> [W19K/P20N/V21K] kalata B1
<400> 62
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr
85 90 95
Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Lys Asn
100 105 110
Lys Cys Thr Arg Asn Gly Leu Pro Ser Leu Ala Ala
115 120
<210> 63
<211> 375
<212> DNA
<213> 人工的
<220>
<223> [P20D/V21K] kalata B1
<400> 63
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 120
atgctacaaa gaaagatatt ggatggggtg gaagctactt tggtcactga tgtcgccgag 180
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 240
ttcctgaaac agttgcagct caaaggactt ccagtatgcg gtgagacttg tgttggggga 300
acttgcaaca ctccaggctg cacttgctcc tgggataagt gcacacgcaa tggccttcct 360
agtttggccg cataa 375
<210> 64
<211> 124
<212> PRT
<213> 人工的
<220>
<223> [P20D/V21K] kalata B1
<400> 64
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr
85 90 95
Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Trp Asp
100 105 110
Lys Cys Thr Arg Asn Gly Leu Pro Ser Leu Ala Ala
115 120
<210> 65
<211> 384
<212> DNA
<213> 人工的
<220>
<223> Oak1-MOG3
<400> 65
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 120
atgctacaaa gaaagatatt ggatggggtg gaagctactt tggtcactga tgtcgccgag 180
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 240
ttcctgaaac agttgcagct caaaggactt ccagtatgcg gtgagacttg tgttggggga 300
acttgcaaca ctccaggctg cacttgcaga tctccatttt ctagagtttg cacacgcaat 360
ggccttccta gtttggccgc ataa 384
<210> 66
<211> 127
<212> PRT
<213> 人工的
<220>
<223> Oak1-MOG3
<400> 66
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr
85 90 95
Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Arg Ser Pro
100 105 110
Phe Ser Arg Val Cys Thr Arg Asn Gly Leu Pro Ser Leu Ala Ala
115 120 125
<210> 67
<211> 375
<212> DNA
<213> 人工的
<220>
<223> Oak1 (T20K)
<400> 67
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 120
atgctacaaa gaaagatatt ggatggggtg gaagctactt tggtcactga tgtcgccgag 180
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 240
ttcctgaaac agttgcagct caaaggactt ccagtatgcg gtgagacttg tgttggggga 300
acttgcaaca ctccaggctg caagtgctcc tggcctgttt gcacacgcaa tggccttcct 360
agtttggccg cataa 375
<210> 68
<211> 124
<212> PRT
<213> 人工的
<220>
<223> Oak1 (T20K)
<400> 68
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr
85 90 95
Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Lys Cys Ser Trp Pro
100 105 110
Val Cys Thr Arg Asn Gly Leu Pro Ser Leu Ala Ala
115 120
<210> 69
<211> 330
<212> DNA
<213> 人工的
<220>
<223> Oak1-SFTI (经过密码子优化以便在烟草中表达)
<400> 69
atggctaagt ttactgtgtg tcttttattg tgtttattat tggctgcttt tgttggtgct 60
tttggttcag agttatcaga ttctcacaag actacactcg ttaatgagat tgctgagaag 120
atgctccaaa gaaaaatctt agatggagtg gaagctaccc ttgttactga tgtggcagag 180
aagatgtttt tgaggaagat gaaagctgaa gcaaaaacat ctgagaccgc agatcaggtt 240
ttcttgaagc aacttcagtt gaaaggtaga tgcaccaagt ctattcctcc tatttgtttc 300
cctgatggat taccttcttt agcagcataa 330
<210> 70
<211> 109
<212> PRT
<213> 人工的
<220>
<223> Oak1-SFTI (经过密码子优化以便在烟草中表达)
<400> 70
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Arg Cys Thr Lys Ser Ile Pro
85 90 95
Pro Ile Cys Phe Pro Asp Gly Leu Pro Ser Leu Ala Ala
100 105
<210> 71
<211> 330
<212> DNA
<213> 人工的
<220>
<223> Oak1-SFTI-FCQR (经过密码子优化以便在烟草中表达)
<400> 71
atggctaagt ttactgtgtg tcttttattg tgtttattat tggctgcttt tgttggtgct 60
tttggttcag agttatcaga ttctcacaag actacactcg ttaatgagat tgctgagaag 120
atgctccaaa gaaaaatctt agatggagtg gaagctaccc ttgttactga tgtggcagag 180
aagatgtttt tgaggaagat gaaagctgaa gcaaaaacat ctgagaccgc agatcaggtt 240
ttcttgaagc aacttcagtt gaaaggtttt tgccagaggt ctattcctcc tatttgtttc 300
cctgatggat taccttcttt agcagcataa 330
<210> 72
<211> 109
<212> PRT
<213> 人工的
<220>
<223> Oak1-SFTI-FCQR (经过密码子优化以便在烟草中表达)
<400> 72
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Phe Cys Gln Arg Ser Ile Pro
85 90 95
Pro Ile Cys Phe Pro Asp Gly Leu Pro Ser Leu Ala Ala
100 105
<210> 73
<211> 3510
<212> DNA
<213> 人工的
<220>
<223> pHEX231
<400> 73
atggttcggt atctcgccgg agcagtccta ctcctagttg tactttcagt tgccgccgcc 60
gtatccggag ctcgtgatgg cgactatcta catctgccat cggaagtttc ccgatttttc 120
cggccacagg agaccaacga cgaccacggc gaagactcgg tcggaactag atgggctgtc 180
ctgatcgctg ggtcgaaagg ttatgcaaac taccggcatc aggctggtgt ttgtcatgca 240
tatcaaatat tgaaaagagg aggtcttaaa gatgaaaaca ttgtggtatt catgtatgac 300
gacattgcct acaatgaatc gaaccctagg cctggagtta tcatcaacag cccacacggc 360
agtgatgttt atgccggagt cccaaaggat tatacagggg aagaggttaa tgctaagaac 420
tttttggcag ctattcttgg caacaagtct gctattacgg ggggtagcgg caaggtggtt 480
gatagtggtc caaatgatca catcttcatc tactatacag atcacggtgc cgctggggta 540
attgggatgc cttcaaaacc ttacctttat gcggatgaat taaatgatgc tttgaagaag 600
aagcatgctt ctgggacata taagagcttg gtgttttacc tggaagcttg tgagtcgggt 660
agcatgtttg agggaatact ccctgaggat cttaatatct acgcgctaac atctacaaac 720
acaacagaaa gcagttggtg ttattattgc cctgcacagg aaaatccccc tcccccggaa 780
tataacgttt gcttgggtga cttatttagt gttgcgtggt tggaagacag tgacgtacaa 840
aattcgtggt atgaaacttt gaaccagcaa tatcaccatg ttgacaagag aatctcgcat 900
gcctcccatg ccacgcaata tggaaatttg aagctgggtg aggaaggtct attcgtctat 960
atgggttcta accctgctaa tgataattac acttctttgg atggcaatgc tcttactcca 1020
tcttcaatag ttgttaatca gcgtgatgct gatttattgc acttgtggga aaagttccgt 1080
aaggctcctg aaggctctgc aaggaaagaa gtagctcaaa cacagatctt taaagcgatg 1140
tcccatcgag tgcacatcga cagcagcata aaattaattg gaaagcttct ctttggtatt 1200
gagaaatgca ctgaaattct taatgctgtc aggccagctg gtcagcctct tgttgatgac 1260
tgggcctgcc tcagatcttt ggtcggaaca tttgagacac attgtggctc gctgtcggaa 1320
tatggaatga gacatactcg gaccattgca aatatctgca atgctggaat ctctgaggaa 1380
cagatggcgg aggcagcctc gcaggcttgt gctagtattc ctgaagaaaa gaagaacgat 1440
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 1500
atgctacaaa gaaagatatt ggatggagtg gaagctactt tggtcactga tgtcgccgag 1560
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 1620
ttcctgaaac agttgcagct caaaggactt ccagtatgcg gtgagacttg tgttggggga 1680
acttgcaaca ctccaggctg cacttgctcc tggcctgttt gcacacgcaa tggccttcct 1740
agtttggccg cataaatggt tcggtatctc gccggagcag tcctactcct agttgtactt 1800
tcagttgccg ccgccgtatc cggagctcgt gatggcgact atctacatct gccatcggaa 1860
gtttcccgat ttttccggcc acaggagacc aacgacgacc acggcgaaga ctcggtcgga 1920
actagatggg ctgtcctgat cgctgggtcg aaaggttatg caaactaccg gcatcaggct 1980
ggtgtttgtc atgcatatca aatattgaaa agaggaggtc ttaaagatga aaacattgtg 2040
gtattcatgt atgacgacat tgcctacaat gaatcgaacc ctaggcctgg agttatcatc 2100
aacagcccac acggcagtga tgtttatgcc ggagtcccaa aggattatac aggggaagag 2160
gttaatgcta agaacttttt ggcagctatt cttggcaaca agtctgctat tacggggggt 2220
agcggcaagg tggttgatag tggtccaaat gatcacatct tcatctacta tacagatcac 2280
ggtgccgctg gggtaattgg gatgccttca aaaccttacc tttatgcgga tgaattaaat 2340
gatgctttga agaagaagca tgcttctggg acatataaga gcttggtgtt ttacctggaa 2400
gcttgtgagt cgggtagcat gtttgaggga atactccctg aggatcttaa tatctacgcg 2460
ctaacatcta caaacacaac agaaagcagt tggtgttatt attgccctgc acaggaaaat 2520
ccccctcccc cggaatataa cgtttgcttg ggtgacttat ttagtgttgc gtggttggaa 2580
gacagtgacg tacaaaattc gtggtatgaa actttgaacc agcaatatca ccatgttgac 2640
aagagaatct cgcatgcctc ccatgccacg caatatggaa atttgaagct gggtgaggaa 2700
ggtctattcg tctatatggg ttctaaccct gctaatgata attacacttc tttggatggc 2760
aatgctctta ctccatcttc aatagttgtt aatcagcgtg atgctgattt attgcacttg 2820
tgggaaaagt tccgtaaggc tcctgaaggc tctgcaagga aagaagtagc tcaaacacag 2880
atctttaaag cgatgtccca tcgagtgcac atcgacagca gcataaaatt aattggaaag 2940
cttctctttg gtattgagaa atgcactgaa attcttaatg ctgtcaggcc agctggtcag 3000
cctcttgttg atgactgggc ctgcctcaga tctttggtcg gaacatttga gacacattgt 3060
ggctcgctgt cggaatatgg aatgagacat actcggacca ttgcaaatat ctgcaatgct 3120
ggaatctctg aggaacagat ggcggaggca gcctcgcagg cttgtgctag tattcctgaa 3180
gaaaagaaga acgattttgg atctgagctt tctgactccc acaagaccac cttggtcaat 3240
gaaatcgctg agaagatgct acaaagaaag atattggatg gagtggaagc tactttggtc 3300
actgatgtcg ccgagaagat gttcctaaga aagatgaagg ctgaagcgaa aacttctgaa 3360
accgccgatc aggtgttcct gaaacagttg cagctcaaag gacttccagt atgcggtgag 3420
acttgtgttg ggggaacttg caacactcca ggctgcactt gctcctggcc tgtttgcaca 3480
cgcaatggcc ttcctagttt ggccgcataa 3510
<210> 74
<211> 584
<212> PRT
<213> 人工的
<220>
<223> pHex231
<400> 74
Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser
1 5 10 15
Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu
20 25 30
Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp
35 40 45
His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly
50 55 60
Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala
65 70 75 80
Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val
85 90 95
Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly
100 105 110
Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro
115 120 125
Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala
130 135 140
Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val
145 150 155 160
Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly
165 170 175
Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp
180 185 190
Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys
195 200 205
Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu
210 215 220
Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn
225 230 235 240
Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro
245 250 255
Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala
260 265 270
Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn
275 280 285
Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala
290 295 300
Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr
305 310 315 320
Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn
325 330 335
Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu
340 345 350
Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg
355 360 365
Lys Glu Val Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val
370 375 380
His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile
385 390 395 400
Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro
405 410 415
Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu
420 425 430
Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr
435 440 445
Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu
450 455 460
Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro Glu Glu Lys Lys Asn Asp
465 470 475 480
Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr Leu Val Asn Glu
485 490 495
Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp Gly Val Glu Ala
500 505 510
Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu Arg Lys Met Lys
515 520 525
Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val Phe Leu Lys Gln
530 535 540
Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr Cys Val Gly Gly
545 550 555 560
Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Trp Pro Val Cys Thr Arg
565 570 575
Asn Gly Leu Pro Ser Leu Ala Ala
580
<210> 75
<211> 1548
<212> DNA
<213> 人工的
<220>
<223> pHEX257
<400> 75
atggttcggt atctcgccgg agcagtccta ctcctagttg tactttcagt tgccgccgcc 60
gtatccggag ctcgtgatgg cgactatcta catctgccat cggaagtttc ccgatttttc 120
cggccacagg agaccaacga cgaccacggc gaagactcgg tcggaactag atgggctgtc 180
ctgatcgctg ggtcgaaagg ttatgcaaac taccggcatc aggctggtgt ttgtcatgca 240
tatcaaatat tgaaaagagg aggtcttaaa gatgaaaaca ttgtggtatt catgtatgac 300
gacattgcct acaatgaatc gaaccctagg cctggagtta tcatcaacag cccacacggc 360
agtgatgttt atgccggagt cccaaaggat tatacagggg aagaggttaa tgctaagaac 420
tttttggcag ctattcttgg caacaagtct gctattacgg ggggtagcgg caaggtggtt 480
gatagtggtc caaatgatca catcttcatc tactatacag atcacggtgc cgctggggta 540
attgggatgc cttcaaaacc ttacctttat gcggatgaat taaatgatgc tttgaagaag 600
aagcatgctt ctgggacata taagagcttg gtgttttacc tggaagcttg tgagtcgggt 660
agcatgtttg agggaatact ccctgaggat cttaatatct acgcgctaac atctacaaac 720
acaacagaaa gcagttggtg ttattattgc cctgcacagg aaaatccccc tcccccggaa 780
tataacgttt gcttgggtga cttatttagt gttgcgtggt tggaagacag tgacgtacaa 840
aattcgtggt atgaaacttt gaaccagcaa tatcaccatg ttgacaagag aatctcgcat 900
gcctcccatg ccacgcaata tggaaatttg aagctgggtg aggaaggtct attcgtctat 960
atgggttcta accctgctaa tgataattac acttctttgg atggcaatgc tcttactcca 1020
tcttcaatag ttgttaatca gcgtgatgct gatttattgc acttgtggga aaagttccgt 1080
aaggctcctg aaggctctgc aaggaaagaa gtagctcaaa cacagatctt taaagcgatg 1140
tcccatcgag tgcacatcga cagcagcata aaattaattg gaaagcttct ctttggtatt 1200
gagaaatgca ctgaaattct taatgctgtc aggccagctg gtcagcctct tgttgatgac 1260
tgggcctgcc tcagatcttt ggtcggaaca tttgagacac attgtggctc gctgtcggaa 1320
tatggaatga gacatactcg gaccattgca aatatctgca atgctggaat ctctgaggaa 1380
cagatggcgg aggcagcctc gcaggcttgt gctagtattc ctgaagaaaa gaagaacgga 1440
cttccagtat gcggtgagac ttgtgttggg ggaacttgca acactccagg ctgcacttgc 1500
tcctggcctg tttgcacacg caatggcctt cctagtttgg ccgcataa 1548
<210> 76
<211> 515
<212> PRT
<213> 人工的
<220>
<223> pHEX257
<400> 76
Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser
1 5 10 15
Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu
20 25 30
Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp
35 40 45
His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly
50 55 60
Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala
65 70 75 80
Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val
85 90 95
Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly
100 105 110
Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro
115 120 125
Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala
130 135 140
Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val
145 150 155 160
Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly
165 170 175
Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp
180 185 190
Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys
195 200 205
Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu
210 215 220
Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn
225 230 235 240
Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro
245 250 255
Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala
260 265 270
Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn
275 280 285
Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala
290 295 300
Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr
305 310 315 320
Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn
325 330 335
Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu
340 345 350
Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg
355 360 365
Lys Glu Val Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val
370 375 380
His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile
385 390 395 400
Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro
405 410 415
Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu
420 425 430
Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr
435 440 445
Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu
450 455 460
Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro Glu Glu Lys Lys Asn Gly
465 470 475 480
Leu Pro Val Cys Gly Glu Thr Cys Val Gly Gly Thr Cys Asn Thr Pro
485 490 495
Gly Cys Thr Cys Ser Trp Pro Val Cys Thr Arg Asn Gly Leu Pro Ser
500 505 510
Leu Ala Ala
515
<210> 77
<211> 1614
<212> DNA
<213> 人工的
<220>
<223> pHEX269
<400> 77
atggttcggt atctcgccgg agcagtccta ctcctagttg tactttcagt tgccgccgcc 60
gtatccggag ctcgtgatgg cgactatcta catctgccat cggaagtttc ccgatttttc 120
cggccacagg agaccaacga cgaccacggc gaagactcgg tcggaactag atgggctgtc 180
ctgatcgctg ggtcgaaagg ttatgcaaac taccggcatc aggctggtgt ttgtcatgca 240
tatcaaatat tgaaaagagg aggtcttaaa gatgaaaaca ttgtggtatt catgtatgac 300
gacattgcct acaatgaatc gaaccctagg cctggagtta tcatcaacag cccacacggc 360
agtgatgttt atgccggagt cccaaaggat tatacagggg aagaggttaa tgctaagaac 420
tttttggcag ctattcttgg caacaagtct gctattacgg ggggtagcgg caaggtggtt 480
gatagtggtc caaatgatca catcttcatc tactatacag atcacggtgc cgctggggta 540
attgggatgc cttcaaaacc ttacctttat gcggatgaat taaatgatgc tttgaagaag 600
aagcatgctt ctgggacata taagagcttg gtgttttacc tggaagcttg tgagtcgggt 660
agcatgtttg agggaatact ccctgaggat cttaatatct acgcgctaac atctacaaac 720
acaacagaaa gcagttggtg ttattattgc cctgcacagg aaaatccccc tcccccggaa 780
tataacgttt gcttgggtga cttatttagt gttgcgtggt tggaagacag tgacgtacaa 840
aattcgtggt atgaaacttt gaaccagcaa tatcaccatg ttgacaagag aatctcgcat 900
gcctcccatg ccacgcaata tggaaatttg aagctgggtg aggaaggtct attcgtctat 960
atgggttcta accctgctaa tgataattac acttctttgg atggcaatgc tcttactcca 1020
tcttcaatag ttgttaatca gcgtgatgct gatttattgc acttgtggga aaagttccgt 1080
aaggctcctg aaggctctgc aaggaaagaa gtagctcaaa cacagatctt taaagcgatg 1140
tcccatcgag tgcacatcga cagcagcata aaattaattg gaaagcttct ctttggtatt 1200
gagaaatgca ctgaaattct taatgctgtc aggccagctg gtcagcctct tgttgatgac 1260
tgggcctgcc tcagatcttt ggtcggaaca tttgagacac attgtggctc gctgtcggaa 1320
tatggaatga gacatactcg gaccattgca aatatctgca atgctggaat ctctgaggaa 1380
cagatggcgg aggcagcctc gcaggcttgt gctagtattc ctgaagaaaa gaagaacatg 1440
aaggctgaag cgaaaacttc tgaaaccgcc gatcaggtgt tcctgaaaca gttgcagctc 1500
aaaggacttc cagtatgcgg tgagacttgt gttgggggaa cttgcaacac tccaggctgc 1560
acttgctcct ggcctgtttg cacacgcaat ggccttccta gtttggccgc ataa 1614
<210> 78
<211> 537
<212> PRT
<213> 人工的
<220>
<223> pHEX269
<400> 78
Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser
1 5 10 15
Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu
20 25 30
Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp
35 40 45
His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly
50 55 60
Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala
65 70 75 80
Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val
85 90 95
Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly
100 105 110
Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro
115 120 125
Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala
130 135 140
Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val
145 150 155 160
Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly
165 170 175
Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp
180 185 190
Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys
195 200 205
Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu
210 215 220
Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn
225 230 235 240
Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro
245 250 255
Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala
260 265 270
Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn
275 280 285
Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala
290 295 300
Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr
305 310 315 320
Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn
325 330 335
Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu
340 345 350
Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg
355 360 365
Lys Glu Val Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val
370 375 380
His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile
385 390 395 400
Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro
405 410 415
Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu
420 425 430
Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr
435 440 445
Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu
450 455 460
Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro Glu Glu Lys Lys Asn Met
465 470 475 480
Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val Phe Leu Lys
485 490 495
Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr Cys Val Gly
500 505 510
Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Trp Pro Val Cys Thr
515 520 525
Arg Asn Gly Leu Pro Ser Leu Ala Ala
530 535
<210> 79
<211> 1581
<212> DNA
<213> 人工的
<220>
<223> pHEX270
<400> 79
atggttcggt atctcgccgg agcagtccta ctcctagttg tactttcagt tgccgccgcc 60
gtatccggag ctcgtgatgg cgactatcta catctgccat cggaagtttc ccgatttttc 120
cggccacagg agaccaacga cgaccacggc gaagactcgg tcggaactag atgggctgtc 180
ctgatcgctg ggtcgaaagg ttatgcaaac taccggcatc aggctggtgt ttgtcatgca 240
tatcaaatat tgaaaagagg aggtcttaaa gatgaaaaca ttgtggtatt catgtatgac 300
gacattgcct acaatgaatc gaaccctagg cctggagtta tcatcaacag cccacacggc 360
agtgatgttt atgccggagt cccaaaggat tatacagggg aagaggttaa tgctaagaac 420
tttttggcag ctattcttgg caacaagtct gctattacgg ggggtagcgg caaggtggtt 480
gatagtggtc caaatgatca catcttcatc tactatacag atcacggtgc cgctggggta 540
attgggatgc cttcaaaacc ttacctttat gcggatgaat taaatgatgc tttgaagaag 600
aagcatgctt ctgggacata taagagcttg gtgttttacc tggaagcttg tgagtcgggt 660
agcatgtttg agggaatact ccctgaggat cttaatatct acgcgctaac atctacaaac 720
acaacagaaa gcagttggtg ttattattgc cctgcacagg aaaatccccc tcccccggaa 780
tataacgttt gcttgggtga cttatttagt gttgcgtggt tggaagacag tgacgtacaa 840
aattcgtggt atgaaacttt gaaccagcaa tatcaccatg ttgacaagag aatctcgcat 900
gcctcccatg ccacgcaata tggaaatttg aagctgggtg aggaaggtct attcgtctat 960
atgggttcta accctgctaa tgataattac acttctttgg atggcaatgc tcttactcca 1020
tcttcaatag ttgttaatca gcgtgatgct gatttattgc acttgtggga aaagttccgt 1080
aaggctcctg aaggctctgc aaggaaagaa gtagctcaaa cacagatctt taaagcgatg 1140
tcccatcgag tgcacatcga cagcagcata aaattaattg gaaagcttct ctttggtatt 1200
gagaaatgca ctgaaattct taatgctgtc aggccagctg gtcagcctct tgttgatgac 1260
tgggcctgcc tcagatcttt ggtcggaaca tttgagacac attgtggctc gctgtcggaa 1320
tatggaatga gacatactcg gaccattgca aatatctgca atgctggaat ctctgaggaa 1380
cagatggcgg aggcagcctc gcaggcttgt gctagtattc ctgaagaaaa gaagaacgat 1440
caggtgttcc tgaaacagtt gcagctcaaa ggacttccag tatgcggtga gacttgtgtt 1500
gggggaactt gcaacactcc aggctgcact tgctcctggc ctgtttgcac acgcaatggc 1560
cttcctagtt tggccgcata a 1581
<210> 80
<211> 526
<212> PRT
<213> 人工的
<220>
<223> pHEX270
<400> 80
Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser
1 5 10 15
Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu
20 25 30
Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp
35 40 45
His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly
50 55 60
Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala
65 70 75 80
Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val
85 90 95
Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly
100 105 110
Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro
115 120 125
Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala
130 135 140
Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val
145 150 155 160
Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly
165 170 175
Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp
180 185 190
Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys
195 200 205
Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu
210 215 220
Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn
225 230 235 240
Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro
245 250 255
Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala
260 265 270
Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn
275 280 285
Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala
290 295 300
Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr
305 310 315 320
Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn
325 330 335
Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu
340 345 350
Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg
355 360 365
Lys Glu Val Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val
370 375 380
His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile
385 390 395 400
Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro
405 410 415
Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu
420 425 430
Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr
435 440 445
Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu
450 455 460
Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro Glu Glu Lys Lys Asn Asp
465 470 475 480
Gln Val Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly
485 490 495
Glu Thr Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser
500 505 510
Trp Pro Val Cys Thr Arg Asn Gly Leu Pro Ser Leu Ala Ala
515 520 525
<210> 81
<211> 1746
<212> DNA
<213> 人工的
<220>
<223> pHEX232
<400> 81
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 120
atgctacaaa gaaagatatt ggatggagtg gaagctactt tggtcactga tgtcgccgag 180
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 240
ttcctgaaac agttgcagct caaaggactt ccagtatgcg gtgagacttg tgttggggga 300
acttgcaaca ctccaggctg cacttgctcc tggcctgttt gcacacgcaa tggccttcct 360
agtttggccg cagaagaaaa gaagaacgat gctcgtgatg gcgactatct acatctgcca 420
tcggaagttt cccgattttt ccggccacag gagaccaacg acgaccacgg cgaagactcg 480
gtcggaacta gatgggctgt cctgatcgct gggtcgaaag gttatgcaaa ctaccggcat 540
caggctggtg tttgtcatgc atatcaaata ttgaaaagag gaggtcttaa agatgaaaac 600
attgtggtat tcatgtatga cgacattgcc tacaatgaat cgaaccctag gcctggagtt 660
atcatcaaca gcccacacgg cagtgatgtt tatgccggag tcccaaagga ttatacaggg 720
gaagaggtta atgctaagaa ctttttggca gctattcttg gcaacaagtc tgctattacg 780
gggggtagcg gcaaggtggt tgatagtggt ccaaatgatc acatcttcat ctactataca 840
gatcacggtg ccgctggggt aattgggatg ccttcaaaac cttaccttta tgcggatgaa 900
ttaaatgatg ctttgaagaa gaagcatgct tctgggacat ataagagctt ggtgttttac 960
ctggaagctt gtgagtcggg tagcatgttt gagggaatac tccctgagga tcttaatatc 1020
tacgcgctaa catctacaaa cacaacagaa agcagttggt gttattattg ccctgcacag 1080
gaaaatcccc ctcccccgga atataacgtt tgcttgggtg acttatttag tgttgcgtgg 1140
ttggaagaca gtgacgtaca aaattcgtgg tatgaaactt tgaaccagca atatcaccat 1200
gttgacaaga gaatctcgca tgcctcccat gccacgcaat atggaaattt gaagctgggt 1260
gaggaaggtc tattcgtcta tatgggttct aaccctgcta atgataatta cacttctttg 1320
gatggcaatg ctcttactcc atcttcaata gttgttaatc agcgtgatgc tgatttattg 1380
cacttgtggg aaaagttccg taaggctcct gaaggctctg caaggaaaga agtagctcaa 1440
acacagatct ttaaagcgat gtcccatcga gtgcacatcg acagcagcat aaaattaatt 1500
ggaaagcttc tctttggtat tgagaaatgc actgaaattc ttaatgctgt caggccagct 1560
ggtcagcctc ttgttgatga ctgggcctgc ctcagatctt tggtcggaac atttgagaca 1620
cattgtggct cgctgtcgga atatggaatg agacatactc ggaccattgc aaatatctgc 1680
aatgctggaa tctctgagga acagatggcg gaggcagcct cgcaggcttg tgctagtatt 1740
ccttaa 1746
<210> 82
<211> 581
<212> PRT
<213> 人工的
<220>
<223> pHEX232
<400> 82
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr
85 90 95
Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Trp Pro
100 105 110
Val Cys Thr Arg Asn Gly Leu Pro Ser Leu Ala Ala Glu Glu Lys Lys
115 120 125
Asn Asp Ala Arg Asp Gly Asp Tyr Leu His Leu Pro Ser Glu Val Ser
130 135 140
Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp His Gly Glu Asp Ser
145 150 155 160
Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Lys Gly Tyr Ala
165 170 175
Asn Tyr Arg His Gln Ala Gly Val Cys His Ala Tyr Gln Ile Leu Lys
180 185 190
Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val Phe Met Tyr Asp Asp
195 200 205
Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly Val Ile Ile Asn Ser
210 215 220
Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly
225 230 235 240
Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala Ile Leu Gly Asn Lys
245 250 255
Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn
260 265 270
Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly Ala Ala Gly Val Ile
275 280 285
Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp Glu Leu Asn Asp Ala
290 295 300
Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe Tyr
305 310 315 320
Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu Gly Ile Leu Pro Glu
325 330 335
Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn Thr Thr Glu Ser Ser
340 345 350
Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro Pro Pro Pro Glu Tyr
355 360 365
Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala Trp Leu Glu Asp Ser
370 375 380
Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn Gln Gln Tyr His His
385 390 395 400
Val Asp Lys Arg Ile Ser His Ala Ser His Ala Thr Gln Tyr Gly Asn
405 410 415
Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr Met Gly Ser Asn Pro
420 425 430
Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn Ala Leu Thr Pro Ser
435 440 445
Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu Leu His Leu Trp Glu
450 455 460
Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg Lys Glu Val Ala Gln
465 470 475 480
Thr Gln Ile Phe Lys Ala Met Ser His Arg Val His Ile Asp Ser Ser
485 490 495
Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile Glu Lys Cys Thr Glu
500 505 510
Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp
515 520 525
Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu Thr His Cys Gly Ser
530 535 540
Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr Ile Ala Asn Ile Cys
545 550 555 560
Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu Ala Ala Ser Gln Ala
565 570 575
Cys Ala Ser Ile Pro
580
<210> 83
<211> 1575
<212> DNA
<213> 人工的
<220>
<223> pHEX286
<400> 83
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
gatcaggtgt tcctgaaaca gttgcagctc aaaggacttc cagtatgcgg tgagacttgt 120
gttgggggaa cttgcaacac tccaggctgc acttgctcct ggcctgtttg cacacgcaat 180
ggccttccta gtttggccgc agaagaaaag aagaacgatg ctcgtgatgg cgactatcta 240
catctgccat cggaagtttc ccgatttttc cggccacagg agaccaacga cgaccacggc 300
gaagactcgg tcggaactag atgggctgtc ctgatcgctg ggtcgaaagg ttatgcaaac 360
taccggcatc aggctggtgt ttgtcatgca tatcaaatat tgaaaagagg aggtcttaaa 420
gatgaaaaca ttgtggtatt catgtatgac gacattgcct acaatgaatc gaaccctagg 480
cctggagtta tcatcaacag cccacacggc agtgatgttt atgccggagt cccaaaggat 540
tatacagggg aagaggttaa tgctaagaac tttttggcag ctattcttgg caacaagtct 600
gctattacgg ggggtagcgg caaggtggtt gatagtggtc caaatgatca catcttcatc 660
tactatacag atcacggtgc cgctggggta attgggatgc cttcaaaacc ttacctttat 720
gcggatgaat taaatgatgc tttgaagaag aagcatgctt ctgggacata taagagcttg 780
gtgttttacc tggaagcttg tgagtcgggt agcatgtttg agggaatact ccctgaggat 840
cttaatatct acgcgctaac atctacaaac acaacagaaa gcagttggtg ttattattgc 900
cctgcacagg aaaatccccc tcccccggaa tataacgttt gcttgggtga cttatttagt 960
gttgcgtggt tggaagacag tgacgtacaa aattcgtggt atgaaacttt gaaccagcaa 1020
tatcaccatg ttgacaagag aatctcgcat gcctcccatg ccacgcaata tggaaatttg 1080
aagctgggtg aggaaggtct attcgtctat atgggttcta accctgctaa tgataattac 1140
acttctttgg atggcaatgc tcttactcca tcttcaatag ttgttaatca gcgtgatgct 1200
gatttattgc acttgtggga aaagttccgt aaggctcctg aaggctctgc aaggaaagaa 1260
gtagctcaaa cacagatctt taaagcgatg tcccatcgag tgcacatcga cagcagcata 1320
aaattaattg gaaagcttct ctttggtatt gagaaatgca ctgaaattct taatgctgtc 1380
aggccagctg gtcagcctct tgttgatgac tgggcctgcc tcagatcttt ggtcggaaca 1440
tttgagacac attgtggctc gctgtcggaa tatggaatga gacatactcg gaccattgca 1500
aatatctgca atgctggaat ctctgaggaa cagatggcgg aggcagcctc gcaggcttgt 1560
gctagtattc cttga 1575
<210> 84
<211> 524
<212> PRT
<213> 人工的
<220>
<223> pHEX286
<400> 84
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Asp Gln Val Phe Leu Lys Gln Leu Gln Leu Lys Gly
20 25 30
Leu Pro Val Cys Gly Glu Thr Cys Val Gly Gly Thr Cys Asn Thr Pro
35 40 45
Gly Cys Thr Cys Ser Trp Pro Val Cys Thr Arg Asn Gly Leu Pro Ser
50 55 60
Leu Ala Ala Glu Glu Lys Lys Asn Asp Ala Arg Asp Gly Asp Tyr Leu
65 70 75 80
His Leu Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn
85 90 95
Asp Asp His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile
100 105 110
Ala Gly Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys
115 120 125
His Ala Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile
130 135 140
Val Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg
145 150 155 160
Pro Gly Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly
165 170 175
Val Pro Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu
180 185 190
Ala Ala Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys
195 200 205
Val Val Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp
210 215 220
His Gly Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr
225 230 235 240
Ala Asp Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr
245 250 255
Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met
260 265 270
Phe Glu Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser
275 280 285
Thr Asn Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu
290 295 300
Asn Pro Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser
305 310 315 320
Val Ala Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr
325 330 335
Leu Asn Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser
340 345 350
His Ala Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe
355 360 365
Val Tyr Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp
370 375 380
Gly Asn Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala
385 390 395 400
Asp Leu Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser
405 410 415
Ala Arg Lys Glu Val Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His
420 425 430
Arg Val His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe
435 440 445
Gly Ile Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly
450 455 460
Gln Pro Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr
465 470 475 480
Phe Glu Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr
485 490 495
Arg Thr Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met
500 505 510
Ala Glu Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro
515 520
<210> 85
<211> 1614
<212> DNA
<213> 人工的
<220>
<223> pHEX269
<400> 85
atggttcggt atctcgccgg agcagtccta ctcctagttg tactttcagt tgccgccgcc 60
gtatccggag ctcgtgatgg cgactatcta catctgccat cggaagtttc ccgatttttc 120
cggccacagg agaccaacga cgaccacggc gaagactcgg tcggaactag atgggctgtc 180
ctgatcgctg ggtcgaaagg ttatgcaaac taccggcatc aggctggtgt ttgtcatgca 240
tatcaaatat tgaaaagagg aggtcttaaa gatgaaaaca ttgtggtatt catgtatgac 300
gacattgcct acaatgaatc gaaccctagg cctggagtta tcatcaacag cccacacggc 360
agtgatgttt atgccggagt cccaaaggat tatacagggg aagaggttaa tgctaagaac 420
tttttggcag ctattcttgg caacaagtct gctattacgg ggggtagcgg caaggtggtt 480
gatagtggtc caaatgatca catcttcatc tactatacag atcacggtgc cgctggggta 540
attgggatgc cttcaaaacc ttacctttat gcggatgaat taaatgatgc tttgaagaag 600
aagcatgctt ctgggacata taagagcttg gtgttttacc tggaagcttg tgagtcgggt 660
agcatgtttg agggaatact ccctgaggat cttaatatct acgcgctaac atctacaaac 720
acaacagaaa gcagttggtg ttattattgc cctgcacagg aaaatccccc tcccccggaa 780
tataacgttt gcttgggtga cttatttagt gttgcgtggt tggaagacag tgacgtacaa 840
aattcgtggt atgaaacttt gaaccagcaa tatcaccatg ttgacaagag aatctcgcat 900
gcctcccatg ccacgcaata tggaaatttg aagctgggtg aggaaggtct attcgtctat 960
atgggttcta accctgctaa tgataattac acttctttgg atggcaatgc tcttactcca 1020
tcttcaatag ttgttaatca gcgtgatgct gatttattgc acttgtggga aaagttccgt 1080
aaggctcctg aaggctctgc aaggaaagaa gtagctcaaa cacagatctt taaagcgatg 1140
tcccatcgag tgcacatcga cagcagcata aaattaattg gaaagcttct ctttggtatt 1200
gagaaatgca ctgaaattct taatgctgtc aggccagctg gtcagcctct tgttgatgac 1260
tgggcctgcc tcagatcttt ggtcggaaca tttgagacac attgtggctc gctgtcggaa 1320
tatggaatga gacatactcg gaccattgca aatatctgca atgctggaat ctctgaggaa 1380
cagatggcgg aggcagcctc gcaggcttgt gctagtattc ctgaagaaaa gaagaacatg 1440
aaggctgaag cgaaaacttc tgaaaccgcc gatcaggtgt tcctgaaaca gttgcagctc 1500
aaaggacttc cagtatgcgg tgagacttgt gttgggggaa cttgcaacac tccaggctgc 1560
acttgctcct ggcctgtttg cacacgcaat ggccttccta gtttggccgc ataa 1614
<210> 86
<211> 537
<212> PRT
<213> 人工的
<220>
<223> pHEX269
<400> 86
Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser
1 5 10 15
Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu
20 25 30
Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp
35 40 45
His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly
50 55 60
Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala
65 70 75 80
Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val
85 90 95
Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly
100 105 110
Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro
115 120 125
Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala
130 135 140
Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val
145 150 155 160
Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly
165 170 175
Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp
180 185 190
Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys
195 200 205
Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu
210 215 220
Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn
225 230 235 240
Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro
245 250 255
Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala
260 265 270
Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn
275 280 285
Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala
290 295 300
Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr
305 310 315 320
Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn
325 330 335
Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu
340 345 350
Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg
355 360 365
Lys Glu Val Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val
370 375 380
His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile
385 390 395 400
Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro
405 410 415
Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu
420 425 430
Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr
435 440 445
Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu
450 455 460
Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro Glu Glu Lys Lys Asn Met
465 470 475 480
Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val Phe Leu Lys
485 490 495
Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr Cys Val Gly
500 505 510
Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Ser Trp Pro Val Cys Thr
515 520 525
Arg Asn Gly Leu Pro Ser Leu Ala Ala
530 535
<210> 87
<211> 222
<212> DNA
<213> 人工的
<220>
<223> Cter M 截短 1
<400> 87
atggcttacg ttagacttac ttctcttgcc gttctcttct tccttgctgc ttccgttatg 60
aagacagaag gaggacttcc tacatgcgga gaaacttgta ccctggggac atgttatgtg 120
ccagattgtt catgttcatg gccaatttgc atgaaaaatc atatcattgc agctaatgca 180
aaaacagtgg acttaaagat gcctttggaa agtaccaact aa 222
<210> 88
<211> 73
<212> PRT
<213> 人工的
<220>
<223> Cter M 截短 1
<400> 88
Met Ala Tyr Val Arg Leu Thr Ser Leu Ala Val Leu Phe Phe Leu Ala
1 5 10 15
Ala Ser Val Met Lys Thr Glu Gly Gly Leu Pro Thr Cys Gly Glu Thr
20 25 30
Cys Thr Leu Gly Thr Cys Tyr Val Pro Asp Cys Ser Cys Ser Trp Pro
35 40 45
Ile Cys Met Lys Asn His Ile Ile Ala Ala Asn Ala Lys Thr Val Asp
50 55 60
Leu Lys Met Pro Leu Glu Ser Thr Asn
65 70
<210> 89
<211> 192
<212> DNA
<213> 人工的
<220>
<223> Cter M 截短 2
<400> 89
atggcttacg ttagacttac ttctcttgcc gttctcttct tccttgctgc ttccgttatg 60
aagacagaag gaggacttcc tacatgcgga gaaacttgta ccctggggac atgttatgtg 120
ccagattgtt catgttcatg gccaatttgc atgaaaaatc atatcattgc agctaatgca 180
aaaacagtgt aa 192
<210> 90
<211> 63
<212> PRT
<213> 人工的
<220>
<223> Cter M截短 2
<400> 90
Met Ala Tyr Val Arg Leu Thr Ser Leu Ala Val Leu Phe Phe Leu Ala
1 5 10 15
Ala Ser Val Met Lys Thr Glu Gly Gly Leu Pro Thr Cys Gly Glu Thr
20 25 30
Cys Thr Leu Gly Thr Cys Tyr Val Pro Asp Cys Ser Cys Ser Trp Pro
35 40 45
Ile Cys Met Lys Asn His Ile Ile Ala Ala Asn Ala Lys Thr Val
50 55 60
<210> 91
<211> 162
<212> DNA
<213> 人工的
<220>
<223> Cter M 截短 3
<400> 91
atggcttacg ttagacttac ttctcttgcc gttctcttct tccttgctgc ttccgttatg 60
aagacagaag gaggacttcc tacatgcgga gaaacttgta ccctggggac atgttatgtg 120
ccagattgtt catgttcatg gccaatttgc atgaaaaatt aa 162
<210> 92
<211> 53
<212> PRT
<213> 人工的
<220>
<223> Cter M 截短 3
<400> 92
Met Ala Tyr Val Arg Leu Thr Ser Leu Ala Val Leu Phe Phe Leu Ala
1 5 10 15
Ala Ser Val Met Lys Thr Glu Gly Gly Leu Pro Thr Cys Gly Glu Thr
20 25 30
Cys Thr Leu Gly Thr Cys Tyr Val Pro Asp Cys Ser Cys Ser Trp Pro
35 40 45
Ile Cys Met Lys Asn
50
<210> 93
<211> 384
<212> DNA
<213> 人工的
<220>
<223> Oak1-MOG3D
<400> 93
atggctaagt tcaccgtctg tctcctcctg tgcttgcttc ttgcagcatt tgttggggcg 60
tttggatctg agctttctga ctcccacaag accaccttgg tcaatgaaat cgctgagaag 120
atgctacaaa gaaagatatt ggatggggtg gaagctactt tggtcactga tgtcgccgag 180
aagatgttcc taagaaagat gaaggctgaa gcgaaaactt ctgaaaccgc cgatcaggtg 240
ttcctgaaac agttgcagct caaaggactt ccagtatgcg gtgagacttg tgttggggga 300
acttgcaaca ctccaggctg cacttgcaga tctccatttt ctagagtttg cacacgcgat 360
ggccttccta gtttggccgc ataa 384
<210> 94
<211> 127
<212> PRT
<213> 人工的
<220>
<223> Oak1-MOG3D
<400> 94
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Leu Pro Val Cys Gly Glu Thr
85 90 95
Cys Val Gly Gly Thr Cys Asn Thr Pro Gly Cys Thr Cys Arg Ser Pro
100 105 110
Phe Ser Arg Val Cys Thr Arg Asp Gly Leu Pro Ser Leu Ala Ala
115 120 125
<210> 95
<211> 330
<212> DNA
<213> 人工的
<220>
<223> Oak1-SFT1-N
<400> 95
atggctaagt ttactgtgtg tcttttattg tgtttattat tggctgcttt tgttggtgct 60
tttggttcag agttatcaga ttctcacaag actacactcg ttaatgagat tgctgagaag 120
atgctccaaa gaaaaatctt agatggagtg gaagctaccc ttgttactga tgtggcagag 180
aagatgtttt tgaggaagat gaaagctgaa gcaaaaacat ctgagaccgc agatcaggtt 240
ttcttgaagc aacttcagtt gaaaggtaga tgcaccaagt ctattcctcc tatttgtttc 300
cctaatggat taccttcttt agcagcataa 330
<210> 96
<211> 109
<212> PRT
<213> 人工的
<220>
<223> Oak1-SFT1-N
<400> 96
Met Ala Lys Phe Thr Val Cys Leu Leu Leu Cys Leu Leu Leu Ala Ala
1 5 10 15
Phe Val Gly Ala Phe Gly Ser Glu Leu Ser Asp Ser His Lys Thr Thr
20 25 30
Leu Val Asn Glu Ile Ala Glu Lys Met Leu Gln Arg Lys Ile Leu Asp
35 40 45
Gly Val Glu Ala Thr Leu Val Thr Asp Val Ala Glu Lys Met Phe Leu
50 55 60
Arg Lys Met Lys Ala Glu Ala Lys Thr Ser Glu Thr Ala Asp Gln Val
65 70 75 80
Phe Leu Lys Gln Leu Gln Leu Lys Gly Arg Cys Thr Lys Ser Ile Pro
85 90 95
Pro Ile Cys Phe Pro Asn Gly Leu Pro Ser Leu Ala Ala
100 105
<210> 97
<211> 11
<212> PRT
<213> 人工的
<220>
<223> Kalata B1 alpha-NTR
<400> 97
Asp Gln Val Phe Leu Lys Gln Leu Gln Leu Lys
1 5 10

Claims (45)

1.一种用于在植物或植物种子或者其后代或后代种子中产生环状肽的方法,所述方法包括在足以产生环状肽的条件下共表达重组核酸一段时间,所述重组核酸编码具有肽环化活性的天冬酰胺酰内肽酶(AEP)液泡加工酶和编码环状肽的线性多肽前体。
2.权利要求1的方法,其中将编码所述多肽前体的重组核酸引入包含稳定地引入的编码所述AEP的重组核酸的植物细胞中。
3.权利要求1的方法,其中将编码所述AEP的重组核酸引入包含稳定地引入的编码所述前体多肽的重组核酸的植物细胞中。
4.权利要求1的方法,其中编码AEP和多肽前体中的每一种的重组核酸在两个分别的核酸构建体中表达。
5.权利要求1的方法,其中编码所述AEP和多肽前体中的每一种的重组核酸在单个核酸构建体中表达。
6.权利要求4的方法,其中所述单个构建体是由包含区段的多核苷酸组成的多基因表达载体(MGEV),每个区段编码功能性蛋白质,每个区段通过编码接头肽的接头区段以线性序列连接至下一个区段,所述区段全部位于可操作地连接至单个启动子的同一阅读框架中,其中至少一个区段编码所述AEP并且至少一个另外的区段编码所述多肽前体。
7.权利要求4或7的方法,其中所述核酸构建体是病毒表达载体。
8.权利要求1至7中任一项的方法,其中所述重组核酸的表达受组织特异性启动子调节。
9.权利要求8的方法,其中所述组织特异性启动子对于选自叶、茎、花、种子和根的组织是特异的。
10.权利要求9的方法,其中所述组织特异性启动子是叶特异性启动子。
11.权利要求9的方法,其中所述组织特异性启动子是种子特异性启动子。
12.权利要求9的方法,其中所述组织特异性启动子是根特异性启动子。
13.权利要求1至12中任一项的方法,其中所述AEP来源于耳草属(Oldenlandia)并且包含在最佳比对后与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6和/或SEQ ID NO:8具有至少80%相似性的氨基酸序列,所述氨基酸序列保留AEP和环化活性。
14.权利要求13的方法,其中所述AEP选自SEQ ID NO:2、4、6和8。
15.权利要求1的方法,其中从所述植物或植物种子中提取所述环状肽。
16.权利要求1的方法,其中所述环状肽呈现植物提取物或植物材料的分离碎片的形式。
17.权利要求15或16的方法,其中所述环状肽表现出抗病原性、治疗性或疼痛缓解性活性。
18.权利要求17的方法,其中所述治疗性活性包括癌症、肥胖症、心血管疾病、传染病和免疫疾病的治疗。
19.权利要求15或16或17或18的方法,其中所述环状肽包含融合或嵌入在环肽主链框架中的功能性部分。
20.权利要求1的方法,其中产生所述环状肽以保护植物免受病原体感染或侵染。
21.权利要求20的方法,其中所述病原体是真菌、细菌、线虫、蠕虫、血吸虫、病毒或原生动物生物体。
22.权利要求1的方法,其中所述植物选自本塞姆氏烟草(N.benthamiana)、烟草、卡罗拉、马铃薯、布什豆、玉米、大豆、小麦、苜蓿、大麦、蓖麻子、三叶草、棉花、亚麻、燕麦、油菜、水稻、黑麦、黑麦草、红花、高粱、甜菜、向日葵、番茄、莴苣、芹菜、西兰花、花椰菜、葫芦、洋葱、观赏性开花植物或拟南芥(Arabidopsis)。
23.权利要求1的方法,其中所述植物选自本塞姆氏烟草、烟草、卡罗拉、马铃薯和布什豆。
24.一种经遗传修饰的植物或其经遗传修饰的后代或者所述植物或其后代的种子,其具有包含编码具有肽环化活性的AEP和编码环状肽的线性多肽前体的重组核酸的细胞,其中所述细胞产生所述环状肽。
25.权利要求24的植物或种子,其中编码AEP和多肽前体中的每一种的重组核酸在两个分别的核酸构建体中表达。
26.一种经遗传修饰的植物或其经遗传修饰的后代或者所述植物或其后代的种子,其具有包含编码AEP或前体多肽中的一种或另一种的稳定表达的核酸的细胞,其用于接受表达所述AEP或前体多肽中的另一种的核酸。
27.权利要求24的植物或种子,其中编码AEP和多肽前体中的每一种的重组核酸在单个核酸构建体中表达。
28.权利要求26的植物或种子,其中所述单个构建体是由包含区段的多核苷酸组成的多基因表达载体(MGEV),每个区段编码功能性蛋白质,每个区段通过编码接头肽的接头区段以线性序列连接至下一个区段,所述区段全部位于可操作地连接至单个启动子的同一阅读框架中,其中至少一个区段编码AEP并且至少一个另外的区段编码所述多肽前体。
29.权利要求24至28中任一项的植物或种子,其中所述核酸构建体是病毒表达载体。
30.权利要求24至29中任一项的植物或种子,其中所述核酸的表达是通过组织特异性启动子。
31.权利要求30的植物,其中所述组织特异性启动子对于选自叶、茎、花和根的组织是特异的。
32.权利要求31的植物,其中所述组织特异性启动子是叶特异性启动子。
33.权利要求31的植物,其中所述组织特异性启动子是根特异性启动子。
34.权利要求31的植物或种子,其中所述组织特异性启动子是种子特异性启动子。
35.权利要求24至34中任一项的植物或种子,其中所述AEP来源于耳草属(Oldenlandia)并且包含在最佳比对后与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6和/或SEQ ID NO:8具有至少80%相似性的氨基酸序列,所述氨基酸序列保留AEP和环化活性。
36.权利要求35的植物或种子,其中所述AEP选自SEQ ID NO:2、4、6和8。
37.权利要求35或36的植物或种子,其中所述肽是从植物中提取的,或包含在植物提取物或分离的植物或种子材料中。
38.权利要求37的植物或种子,其中所述肽表现出抗病原性、治疗性或疼痛缓解性活性。
39.权利要求38的植物或种子,其中所述治疗性活性包括癌症、肥胖症、心血管疾病、传染病和免疫疾病的治疗。
40.权利要求37或38或39的植物或种子,其中所述肽包含融合或嵌入在环肽主链框架中的功能性部分。
41.权利要求24的植物或种子,其中所述环状肽保护所述植物或种子免于病原体感染或侵染。
42.权利要求39或41的植物或种子,其中所述病原体是真菌、细菌、线虫、蠕虫、血吸虫、软体动物、病毒或原生动物生物体。
43.权利要求20至42中任一项的植物或种子或后代,其中所述植物选自烟草、本塞姆氏烟草、卡罗拉、马铃薯、布什豆、玉米、大豆、小麦、苜蓿、大麦、蓖麻子、三叶草、棉花、亚麻、燕麦、油菜、水稻、黑麦、黑麦草、红花、高粱、甜菜、向日葵、番茄、莴苣、芹菜、西兰花、花椰菜、葫芦、鹰嘴豆、甘蔗、香蕉、洋葱、观赏性植物和拟南芥。
44.权利要求43的植物或种子或后代,其中所述植物选自烟草、本塞姆氏烟草、卡罗拉、马铃薯和布什豆。
45.权利要求24至44中任一项的植物的种子或其它繁殖材料。
CN201680067126.8A 2015-09-30 2016-09-29 一种方法 Pending CN108289428A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
AU2015903984A AU2015903984A0 (en) 2015-09-30 A method
AU2015903984 2015-09-30
AU2015904036 2015-10-05
AU2015904036A AU2015904036A0 (en) 2015-10-05 A method
PCT/AU2016/050912 WO2017054044A1 (en) 2015-09-30 2016-09-29 A method

Publications (1)

Publication Number Publication Date
CN108289428A true CN108289428A (zh) 2018-07-17

Family

ID=58422506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680067126.8A Pending CN108289428A (zh) 2015-09-30 2016-09-29 一种方法

Country Status (3)

Country Link
CN (1) CN108289428A (zh)
AU (1) AU2016333152A1 (zh)
WO (1) WO2017054044A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114854782A (zh) * 2022-05-12 2022-08-05 华南理工大学 一种高效表达具有高活性的重组多肽连接酶原的方法
CN116693621A (zh) * 2023-03-02 2023-09-05 东北农业大学 抑制革兰氏阴性菌的窄谱抗菌肽pc及其制备方法和应用
CN117169393A (zh) * 2023-11-03 2023-12-05 杭州湃肽生化科技有限公司 一种植物组织中环肽的检测方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG10201913521TA (en) 2016-09-23 2020-03-30 Univ Nanyang Tech Methods for enzymatic peptide ligation
US20200347396A1 (en) * 2018-01-21 2020-11-05 Whitehead Institute For Biomedical Research Biosynthetic Approach For Heterologous Production And Diversification Of Bioactive Lyciumin Cyclic Peptides
CN111117977B (zh) * 2020-01-06 2021-09-10 广州英赞生物科技有限公司 一种重组多肽连接酶原及其制备、激活方法与应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013093045A2 (en) * 2011-12-22 2013-06-27 Medizinische Universität Wien Cyclotides as immunosuppressive agents
WO2013162760A1 (en) * 2012-04-25 2013-10-31 University Of Southern California Novel cyclotides with anticancer activity
WO2014046731A1 (en) * 2012-09-19 2014-03-27 University Of Southern California Preparation of cyclotides
WO2015163818A1 (en) * 2014-04-24 2015-10-29 Nanyang Technological University Asx-specific protein ligase

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013093045A2 (en) * 2011-12-22 2013-06-27 Medizinische Universität Wien Cyclotides as immunosuppressive agents
WO2013162760A1 (en) * 2012-04-25 2013-10-31 University Of Southern California Novel cyclotides with anticancer activity
WO2014046731A1 (en) * 2012-09-19 2014-03-27 University Of Southern California Preparation of cyclotides
WO2015163818A1 (en) * 2014-04-24 2015-10-29 Nanyang Technological University Asx-specific protein ligase

Non-Patent Citations (12)

* Cited by examiner, † Cited by third party
Title
BERNATH-LEVIN, K. ET AL.: "Peptide macrocyclization by a bifunctional endoprotease,,", 《CHEMISTRY & BIOLOGY》 *
CONLAN, B.F. ET AL.: ""Circular micro-proteins and mechanisms of cyclization", 《CURRENT PHARMACEUTICAL DESIGN》 *
FRANCISCO JAVIER RENDÓN-GANDARILLA ET AL.: "The TvLEGU-1, a Legumain-Like Cysteine Proteinase, Plays a Key Role in Trichomonas vaginalis Cytoadherence", 《BIOMED RESEARCH INTERNATIONAL》 *
GILLON, A.D. ET AL.: "Biosynthesis of circular proteins in plants", 《THE PLANT JOURNAL》 *
HARRIS K S , ET AL.: "Efficient backbone cyclization of linear peptides by a recombinant asparaginyl endopeptidase", 《NATURE COMMUNICATIONS》 *
LEE J , ET AL.: "Synthesis and evaluation of aza-peptidyl inhibitors of the lysosomal asparaginyl endopeptidase, legumain", 《BIOORGANIC & MEDICINAL CHEMISTRY LETTERS,》 *
MYLNE, J.S. ET AL.: "Cyclic peptides arising by evolutionary parallelism via asparaginyl-endopeptidase-mediated biosynthesis", 《THE PLANT CELL》 *
NGUYEN, G.K.T. ET AL.: "Butelase 1 is an Asx-specific ligase enabling peptide macrocyclization and synthesis", 《NATURE CHEMICAL BIOLOGY》 *
PORNTIP P: "Cathepsin F Cysteine Protease of the Human Liver Fluke, Opisthorchis viverrini", 《PLOS NEGL TROP DIS》 *
QIN Q . ET AL.: "Identification of candidates for cyclotide biosynthesis and cyclisation by expressed sequence tag analysis of Oldenlandia affinis", 《BMC GENOMICS》 *
SASKA, I. ET AL.: "asparaginyl endopeptidase mediates in vivo protein backbone cyclization", 《THE JOURNAL OF BIOLOGICAL CHEMISTRY》 *
陈航: "向日葵胰蛋白酶抑制剂SFTI的合成及酶抑制动力学研究 ", 《海峡药学》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114854782A (zh) * 2022-05-12 2022-08-05 华南理工大学 一种高效表达具有高活性的重组多肽连接酶原的方法
CN114854782B (zh) * 2022-05-12 2023-06-20 华南理工大学 一种高效表达具有高活性的重组多肽连接酶原的方法
CN116693621A (zh) * 2023-03-02 2023-09-05 东北农业大学 抑制革兰氏阴性菌的窄谱抗菌肽pc及其制备方法和应用
CN116693621B (zh) * 2023-03-02 2023-11-14 东北农业大学 抑制革兰氏阴性菌的窄谱抗菌肽pc及其制备方法和应用
CN117169393A (zh) * 2023-11-03 2023-12-05 杭州湃肽生化科技有限公司 一种植物组织中环肽的检测方法
CN117169393B (zh) * 2023-11-03 2024-03-19 杭州湃肽生化科技有限公司 一种植物组织中环肽的检测方法

Also Published As

Publication number Publication date
AU2016333152A1 (en) 2018-04-19
WO2017054044A1 (en) 2017-04-06

Similar Documents

Publication Publication Date Title
CN108289428A (zh) 一种方法
US8802825B2 (en) Production of peptides and proteins by accumulation in plant endoplasmic reticulum-derived protein bodies
JP6037395B2 (ja) 植物におけるタンパク質発現
JP5519192B2 (ja) 種子のタンパク質含量を増産させる遺伝子及びその利用方法
AU2018216169A1 (en) Expression of nitrogenase polypeptides in plant cells
CA2745620C (en) Transformed soybean plant which accumulates vaccine, and use thereof
CN108070578A (zh) 一种与植物耐逆性相关蛋白GmHAD1及其编码基因与应用
JP2002532114A (ja) トランスジェニック植物およびその作出法
CN109929019A (zh) 一种与植物耐盐碱相关蛋白GsERF7及其编码基因与应用
JP2019524137A (ja) 内生菌における代謝産物の生産
US20040106198A1 (en) Inhibition of peptide cleavage in plants
EP1169463B1 (en) Method for conveying bnyvv resistance to sugar beet plants
Harris et al. In vitro and in planta cyclization of target peptides using an asparaginyl endopeptidase from Oldenlandia affinis
US20040117874A1 (en) Methods for accumulating translocated proteins
CN110305893A (zh) 棉酚生物合成途径因cyp71be79及其应用
CN113861279B (zh) 大豆转录因子GmbHLH664及其编码基因在提高种子蛋白质含量中的应用
CN109295024A (zh) 降低OsSAMS1蛋白及其编码基因表达在提高植物对水稻矮缩病毒抗性中的应用
KR20160025829A (ko) 특정 아미노산 함량을 증가시키는 산왕거미 유래의 AvMaSp 유전자 및 이의 용도
JPH0779778A (ja) エンド型キシログルカン転移酵素遺伝子
JPH1198994A (ja) 植物の制御方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180717

WD01 Invention patent application deemed withdrawn after publication