CN1430674A - 在植物中生产丝状蛋白 - Google Patents

在植物中生产丝状蛋白 Download PDF

Info

Publication number
CN1430674A
CN1430674A CN01810113.5A CN01810113A CN1430674A CN 1430674 A CN1430674 A CN 1430674A CN 01810113 A CN01810113 A CN 01810113A CN 1430674 A CN1430674 A CN 1430674A
Authority
CN
China
Prior art keywords
gly
ala
gln
leu
silk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN01810113.5A
Other languages
English (en)
Inventor
杨建军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EIDP Inc
Original Assignee
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI Du Pont de Nemours and Co filed Critical EI Du Pont de Nemours and Co
Publication of CN1430674A publication Critical patent/CN1430674A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43513Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
    • C07K14/43518Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • C07K14/43586Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from silkworms

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Insects & Arthropods (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Toxicology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明提供在绿色植物中生产丝和丝状蛋白(SLP)的方法。在绿色植物的种子和叶组织中都获得SLP的表达。

Description

在植物中生产丝状蛋白
                      发明领域
本发明涉及分子生物学和植物遗传学领域。更具体地说,本发明描述产生丝状蛋白植物表达系统的技术。
                      发明背景
对重量轻、有柔韧性并且不牺牲强度和耐用性的材料和织物的需求不断增加,这种需求需要对于如弹性、丹尼尔(denier)、抗拉强度和模数等特性有更高耐受性(tolerance)的新型纤维。为寻找更好的纤维,研究了天然产生的纤维,其中一些纤维具有良好品质。一种这样的纤维丝,即一组外部纺成的纤维状蛋白质分泌物。
超过30,000种蜘蛛以及许多其它昆虫产生丝,尤其是鳞翅目(Lepidoptera)(Foelix,R.F.(1992) Biology of Spiders,Cambridge,MAHarvard University Press)。这些丝中很少进行了仔细研究。家蚕的茧丝和球状织网的蜘蛛棒络新妇(Nephila clavipes)的拖丝已经得到很好的特征鉴定。虽然茧丝和拖丝的结构蛋白在一级氨基酸序列上差别很大,但它们在许多方面非常相似。它们富含非常大量的甘氨酸和丙氨酸。丝心蛋白是茧丝的结构蛋白,包含42.9%甘氨酸和30%丙氨酸。蛛丝蛋白1是拖丝的主要成分,包含37.1%甘氨酸和21.1%丙氨酸。它们也是高度重复的蛋白。丝心蛋白重链和蛛丝蛋白1聚丙氨酸链内的保守晶体域在整个分子上重复许多次。在丝心蛋白重链中,每1到2千碱基内就是由更大的非重复性无定形域包围的所述晶体域,而在蛛丝蛋白1中,这些晶体域由更短的串联重复的GXG无定形域包围。由于它们包含高拷贝数晶体域,它们也对剪切敏感。在丝纺成过程中,所述晶体重复能够形成反平行β折叠,这样强硬的晶体增强无定形柔性链,使得丝蛋白形成半晶体纤维(Kaplan等,(1997)Protein-Based Materials,McGrath,K.,和Kaplan,D.编辑,Birkhauser,Boston,第104-131页)。
传统的蚕产丝,涉及种植桑叶、饲养蚕、收获茧和处理丝纤维。这种生产劳动密集、消耗时间,因此极其昂贵。蚕丝的天然缺陷(如易起皱和纤维直径不一)进一步限制其应用。相似地,由于从每只蜘蛛仅能得到小量的拖丝,因此用蜘蛛生产大量拖丝是不可能的。此外,任何一种蜘蛛同时产生多种形式的蜘蛛丝。因为不同蜘蛛丝蛋白有不同特性并且不易分离,所以所获得的丝混合物比单一分离的丝应用性更低。因此,从天然来源生产工业化规模数量的蜘蛛丝是不实际的,需要其它替代生产方式。
为以工业化有效数量表达所需蛋白产物的目的,人们可以通过使用分子重组技术,将外源基因或人工合成DNA片段引入不同宿主生物。这样的方法通常涉及连接合适的DNA片段到载体分子,然后通过转化将其引入受体生物。使用所述载体上的选择标记选择转化子,或通过遗传筛选或生物化学筛选鉴定所克隆的片段。
虽然在宿主细胞中表达外源基因的技术是本领域内众所周知并且广泛实践的,但合成包含大量重复单位的形成纤维的外源多肽存在独特的问题。由于所述重复序列的存在,编码这种类型蛋白的基因往往存在遗传不稳定性,导致产生截短的产物,而不是产生全长蛋白。
尽管有上面提到的困难,但表达纤维形成蛋白是本领域内众所周知的。Ferrari等(U.S.5,770,697)公开通过合成的结构基因生产具有重复寡聚体单位的多肽的方法和组合物,所述重复寡聚单位例如在丝状蛋白(SLP)和弹性蛋白样蛋白中存在的重复寡聚单位。Ferrari的DNA序列编码的肽包含至少3种不同氨基酸以及总共4-30个氨基酸的寡肽重复单位,在所述肽中有至少2种重复单位,在每个重复单位中有至少2个相同的氨基酸。
家蚕(B.mori)丝蛋白的克隆和表达也是已知的。Ohshima等(Proc.Natl.Acad.Sci.USA,74,5363(1977))报道将家蚕完整的丝心蛋白基因以及侧翼序列克隆进大肠杆菌(E.coli)。Petty-Saphon等(EP 320702)公开从多种宿主重组生产丝心蛋白和丝胶蛋白,所述宿主例如大肠杆菌、啤酒酵母(Sacchromyces cerevisiae)、假单胞菌(Pseudomonassp.)、红假单胞菌(Rhodopseudomonas sp.)、芽孢杆菌(Bacillus sp.)和链霉菌(Strepomyces sp.)。
在克隆和表达蜘蛛丝蛋白的工作上已经取得进步。Xu等(Proc.Natl.Acad.Sci.USA,87,7120(1990))报道:根据部分cDNA克隆确定蜘蛛棒络新妇拖丝样蛋白蛛丝蛋白1的部分重复序列的序列。
Lewis等(EP 452925)公开从转化的大肠杆菌表达蜘蛛棒络新妇的蜘蛛丝蛋白(蛛丝蛋白1和2),其中包括蛋白片段和变体。
Lombardi等(U.S.5,245,012)教导生产包含无定形域或亚单位、晶体域或亚单位的重组蜘蛛丝蛋白,其中所述域或亚单位指包含重复氨基酸序列的蛋白部分,所述蛋白部分提供独特的机械结构特性。
对茧丝和拖丝cDNA测序的最近发展已经允许合成人工编码基因,该基因编码与天然蛋白具有序列和结构相似性的丝状蛋白(SLP)。这些人工基因模拟家蚕天然茧丝和蜘蛛棒络新妇拖丝的序列排列,已经将它们引入微生物例如大肠杆菌、巴斯德毕赤酵母(Pichia pastoris)和啤酒酵母。已经通过发酵在这些微生物中生产SLP[Cappello,J.,Crissman,J.W.(1990)Polymer Preprints 31:193-194;Cappello等,(1990)Biotechnol.Prog.6:198-202;Fahnestock和Irwin,Appl.Microbiol.Biotechnol.(1997),47(1),23-32;Prince等,(1995)Biochemistry 34:10879-10885;Fahnestock和Bedzyk,1997,Appl.Microbiol.Biotechnol.(1997),47(1),33-39以及共同拥有的WO9429450]。
植物正在成为外源基因表达的优选宿主。已经在转基因植物中产生许多重组蛋白(Franken等,Curr.Opin.Biotechnol.8:411-416,(1997);Whitelam等,Biotechnol.Genet.Eng.Rev.11:1-29,(1993))。植物遗传工程综合了现代分子重组技术和农业作物生产。虽然已经在微生物系统中表达多种丝状蛋白和纤维形成蛋白,但还没有在植物中发展出相似的表达系统。Zhang等教导在转基因烟草植物中表达基于弹性蛋白的蛋白多聚体(Zhang等,Plant Cell Rep.(1996),16(3-4),174-179)。虽然这代表在植物中表达重复序列,但弹性蛋白多肽与丝状肽有很小相似性,因此根据该工作不能预期在植物中表达SLP的可行性。
目前,没有报道在植物中生产重组丝或SLP的实例。一种可能的解释是丝和SLP以及天然植物蛋白之间存在惊人的组成差异和结构差异。例如,SLP蛋白富含大量甘氨酸和丙氨酸,高度重复,在结构上是半晶体。这是在大多数植物蛋白中不存在的特性。因此,在植物细胞中引入和表达SLP基因可能有许多困难。例如,SLP基因的重复序列可能是植物细胞中DNA缺失和重排的目标。或者,翻译富含甘氨酸和丙氨酸的SLP可能在成熟前就耗尽植物细胞内的甘氨酸和丙氨酸以及tRNA库。最后,植物体内的基本生理机制可能识别并降解积累的半晶体SLP。
上面引用的表达丝和SLP的方法可用于微生物系统生产,然而没有教导在植物中生产丝或SLP。使用植物平台生产丝和丝状蛋白比微生物系统有几个好处。例如,作为可更新的资源,植物平台的能量和物质消耗比微生物方法更少。相似地,植物平台用于蛋白生产时,比微生物系统有效生物量更多。最后,丝是天然蛋白,这提示生产高水平丝对于宿主是无毒的。
需要解决的问题是提供以工业化有效数量、更低费用生产合成丝或SLP的方法。发明人提供使用植物表达系统表达和生产丝或SLP的方法,解决了所述问题。
                       发明简述
本发明提供在绿色植物中生产丝状蛋白的方法,所述方法包括:
a)提供包含SLP表达盒的绿色植物,所述表达盒包括下列结果:
                       P-SLP-T
其中:
P是一种适于驱动丝状蛋白基因表达的启动子;
SLP是一种编码成熟丝状蛋白的转基因;
T是一种5′终止子;
其中P、SLP和T相互之间有效连接,以便所述表达盒的表达导致所述丝状蛋白的翻译;
b)在表达所述转基因以及产生所述丝状蛋白的条件下,培养所述绿色植物;然后
c)可选地回收所述丝状蛋白。
此外,本发明提供包含表达丝状蛋白的表达盒的植物,所述丝状蛋白来自家蚕和蜘蛛棒络新妇产生的丝。具体地说,本发明的丝和丝状蛋白可以是天然的或者是变体,并具有通式:
[(A)n-(E)q-(S)q-(X)p-(E)q-(S)q]i
其中:
A或E是约10到25氨基酸的不同非晶体软区段,具有至少55%Gly;
S是约6到12氨基酸的半晶体区段,包含至少33%Ala和50%Gly;
X是约6-12氨基酸的晶体硬区段,包含至少33%Ala和50%Gly;和
其中
n=2,4,8,16,32,64或128;
q=0,1,2,4,8,16,32,64或128;
p=2,4,8,16,32,64或128;
i=1-128;而
其中p≥n或q。
                       附图简述
                    序列描述和保藏
图1是pGY001的质粒图,该质粒携带GYS接头。
图2A是pGY101的质粒图,该质粒携带DP-1B.8P基因。
图2B是pGY102的质粒图,该质粒携带DP-1B.16P基因。
图3A是pML63的质粒图,该质粒携带驱动GUS报道基因的35S/Cab221启动子。
图3B是pCW109的质粒图,该质粒携带β-conglycinin启动子。
图4A是pGY201的质粒图,该质粒携带处于35S/Cab221启动子控制之下的DP-1B.8P基因。
图4B是pGY202的质粒图,该质粒携带处于35S/Cab221启动子控制之下的DP-1B.16P基因。
图5A是pGY211的质粒图,该质粒携带处于β-conglycinin启动子控制之下的DP-1B.8P基因。
图5B是pGY213的质粒图,该质粒携带处于β-conglycinin启动子控制之下的DP-1B.8P基因,该质粒的限制位点数量减少。
图6是二元载体pZBL1的质粒图,该质粒携带一个T-DNA区以,该区具有一个NOS启动子驱动的NPTII基因。
图7A是pGY401的质粒图,其中所述T-DNA区包括一个与NOS驱动的NPTII连接的表达盒,该表达盒包含处于35S/Cab221启动子控制下的DP-1B.8P。
图7B是pGY402的质粒图,该质粒在所述T-DNA区内带有一个表达盒,所述表达盒包含处于35S/Cab221启动子控制下的DP-1B.16.P。
图8A是pGY411的质粒图,其中所述T-DNA区包括处于β-conglycinin启动子控制下的DP-1B8.P基因。
图8B是pGY412的质粒图,该质粒携带处于所述T-DNA区内的处于β-conglycinin启动子控制下的DP-1B16.P基因。
图9A是免疫印迹,显示DP-1B蛋白在T1转基因拟南芥的叶和种子中的积累。
图9B是免疫印迹,显示所述DP-1B蛋白的完整C末端。
图9C为DNA琼脂糖凝胶,显示拟南芥染色体上的转基因。
图10A是免疫印迹,显示DP-1B蛋白在T2转基因拟南芥的叶和种子中的积累。
图10B是DNA琼脂糖凝胶,显示T2拟南芥染色体中的转基因。
图11A是pZBL102的质粒图,该质粒携带处于35S启动子控制下的HPT基因。
图11B是pGY220的质粒图,该质粒携带处于β-conglycinin启动子控制下的DP-1B.16P。
图12A是pLS3的质粒图,该质粒携带β-conglycinin启动子-DP-1B.8P构建物,用于转化大豆胚。
图12B是pLS4的质粒图,该质粒携带β-conglycinin启动子-DP-1B.16P构建物,用于转化大豆胚。
图13A是免疫印迹,显示DP-1B蛋白在转基因大豆体细胞胚中的积累。
图13B是免疫印迹,显示DP-1B蛋白的完整C末端。
图13C是DNA琼脂糖凝胶,显示大豆体细胞胚染色体内的转基因。
图14A是在实施例8中使用的来自拟南芥植株玫瑰花结纯化组份中的总蛋分布考马斯亮蓝染色。
图14B是来自图14A的纯化组份中DP-1B蛋白的免疫印迹检测。
申请人按照国际承认用于专利程序的微生物保存布达佩斯条约的条款进行了下列生物学保藏:
保藏识别参考码          国际保藏号              保藏日期
   pGY401             ATCC PTA-1912          2000年5月24日
    pLS3              ATCC PTA-1911          2000年5月24日
申请人已经提供29个符合下列要求的序列:37 C.F.R.1.821-1.825(“包含核苷酸序列和/或氨基酸序列公开物的专利申请要求-序列规则”)、世界知识产权组织(WIPO)标准ST.25(1998)以及EPO和PCT的序列表要求(管理规定的规则5.2和49.5(a-bis)、第208节和AnnexC)。用于核苷酸序列和氨基酸序列的标志和格式符合37 C.F.R.§1.822中的规则。
          序列描述 SEQ ID NO:核酸 SEQ ID NO:氨基酸
 蛛丝蛋白1     1
 SLP重复单位     2
 SLP重复单位     3
 肽SLP     4
 SLP重复单位     5
 SLP重复单位     6
 SLP重复单位     7
 蜘蛛丝变体     8
 蜘蛛丝变体重复单位     9
 DP-1A     10
 DP-1B     11
 蜘蛛丝重复单位     12
 DP-1B 809氨基酸重复序列     13
 DP-1B 1617氨基酸重复序列     14
 引物     15
 引物     16
 肽接头     17
 编码肽接头的有义DNA链     18
 编码肽接头的反义DNA链     19
 接头肽     20
 编码DP-1B 8聚体的基因     21
 DP-1B 8聚体     22
 编码DP-1B 16聚体的基因     23
 DP-1B 16聚体     24
 蜘蛛丝重复单位     25
 引物     26
 引物     27
 引物     28
 引物     29
                        发明详述
本发明提供在绿色植物中生产丝和丝状蛋白的方法。对于迄今不能天然或微生物生产的丝,所述方法可以低成本有效生产丝。本发明的丝和丝状蛋白具有适用于织物的特性,或者可以用于构建材料。例如,蜘蛛拖丝的抗张强度超过200ksi,弹性约35%,这使得其比KEVLAR纤维或钢更难断裂。当蜘蛛丝织成纤维时,可以应用于服装业的大量生产,以及应用于某些高强度用途如绳、手术缝合线、某些电子元件的柔性栓系、甚至用于植入的生物材料(如人造韧带或主动脉带)。此外,这些纤维可以与各种塑料和/或树脂混合,制备纤维增强型塑料和/或树脂产品。
在本发明公开中,使用多种术语和缩写。提供下面定义。
“可读框”缩写为ORF。
“聚合酶链反应”缩写为PCR。
术语“丝状蛋白”缩写为SLP,指天然丝蛋白以及符合下面三个标准的合成类似物:(1)所述分子的氨基酸组成主要是甘氨酸和/或丙氨酸;(2)共有晶体域在整个分子上重复排列;(3)所述分子对剪切敏感,可以织成半晶体纤维。SLP也包括天然丝蛋白的修饰变体以及上面定义的合成类似物。
术语“肽”、“多肽”和“蛋白”可互换使用。
术语“蜘蛛丝变体蛋白”指人类设计的蛋白,所述蛋白的氨基酸序列基于在已知天然蜘蛛丝中发现的重复序列基序和其变体。
术语“DP-1B”指由SEQ ID NO:1所陈述的蜘蛛棒络新妇天然蛋白1(蛛丝蛋白1)的氨基酸序列衍生的任何蜘蛛丝变体。
本文所用“分离的核酸片段”是单链或双链的RNA或DNA聚合物,该聚合物可选地包含合成的非天然或改变的核苷酸碱基。DNA聚合物形式的分离的核酸片段可以包含cDNA、基因组DNA或合成DNA的一个或多个区段。
“基因”指表达特定蛋白的核酸片段,包括在编码序列之前(5′非编码序列)和之后(3′非编码序列)的调节序列。“天然基因”指在自然界中存在的携带其自身调节序列的基因。“嵌合基因”指任何非天然基因,其中包括在自然界中不在一起发现的调节序列和编码序列。因此,嵌合基因可以包含来自不同来源的调节序列和编码序列,或者包含来自同一来源、但以非天然方式排列的调节序列和编码序列。“内源基因”指在生物基因组内天然位置的天然基因。“外源”基因或“转基因”指通常不在宿主生物中存在、而是通过基因转移引入宿主生物的基因。外源基因包括插入非天然宿主生物的天然基因,或者是嵌合基因。“转基因”是通过转化程序引入基因组的基因。
可以使用本领域内技术人员众所周知的程序,从化学合成的寡核苷酸构建块装配“合成基因”。连接这些构建块,退火形成基因区段,然后酶促装配以构建整个基因。“化学合成”当指DNA序列时,意思是所述成分核苷酸在体外装配。使用已经建立完善的程序可以完成DNA的人工化学合成,或者可以使用多种商业化机器中的一种进行自动化学合成。因此,可以根据最佳化核苷酸序列以反映宿主细胞密码子偏倚的要求,定制所述基因以最佳化基因表达。技术人员理解:假如密码子的使用倾向于宿主偏爱的那些密码子,那么可能更成功表达基因。可以根据来自所述宿主细胞的可获得序列信息的基因的调查,确定优选的密码子。
“编码序列”指编码特定氨基酸序列的DNA序列。“合适的调节序列”指位于编码序列上游(5′非编码序列)、内部或下游(3′非编码序列)而且影响相关编码序列的转录、RNA加工或稳定性、或翻译的核苷酸序列。调节序列可以包括启动子、翻译前导序列、内含子和聚腺苷酸化识别序列。
“启动子”指能够控制编码序列或功能RNA表达的DNA序列。一般地说,编码序列位于启动子序列的3′。启动子可以全部来自天然基因,或由来自不同天然启动子的不同元件组成,或甚至包括合成DNA区段。本领域内技术人员理解:不同启动子在不同组织或细胞类型、不同发育阶段、不同环境条件下而指导基因表达。引起基因在大多数时间、大多数细胞类型中表达的启动子一般称为“组成型启动子”。人们还认识到:由于在大多数情况下没有完全定义调节序列的准确边界,因此不同长度的DNA片段可能具有相同的启动子活性。
“调节型启动子”指并非组成型地指导基因表达、而是以时间和/或空间调节方式指导基因表达的启动子,其中包括组织特异性启动子和诱导型启动子。其中包括天然序列、合成序列以及合成序列和天然序列组合的序列。不同启动子可以在不同组织或细胞类型、在不同发育阶段、或响应不同环境条件而指导基因表达。目前不断发现可用于植物细胞的不同类型的新型启动子;在Okamuro等,Biochemistry of Plants 15:1-82,1989的汇编论文中可以找到许多例子。由于在大多数情况下没有完全定义调节序列的准确边界,因此不同长度的DNA片段可能具有相同的启动子活性。
“组织特异性启动子”指不在所有植物细胞中表达、仅在特定器官(如叶或种子)的一种或多种细胞类型、特定组织(如胚或子叶)或特定细胞类型(如叶实质细胞或种子贮藏细胞)中表达的调节型启动子。其中也包括时间性调节的启动子,例如在胚胎发生的早期或晚期、果实成熟过程中在发育的种子或果实内、在完全分化的叶内、或在衰老起始时受到调节。
术语“互补”用于描述能够相互杂交的核苷酸碱基之间的关系。例如,就DNA来说,腺嘌呤与胸腺嘧啶互补,而胞嘧啶与鸟嘌呤互补。
“3′非编码序列”指位于编码序列下游的DNA序列,包括聚腺苷酸化识别序列和其它编码能够影响mRNA加工或基因表达的调节信号的序列。所述聚腺苷酸化信号的一般特征是影响在mRNA前体3′末端添加聚腺苷酸序列段。
术语“有效连接”指在单核酸片段上连接核酸序列,以便其中一个序列影响另一个序列的功能。例如,当一个启动子能够影响一个编码序列的表达时,该启动子就与所述编码序列有效连接(即所述编码序列处于所述启动子的转录控制之下)。编码序列可以按有义或反义取向有效连接调节序列。
本文所用术语“表达”指转录和稳定积累由本发明核酸片段衍生的有义RNA(mRNA)或反义RNA。表达也指翻译mRNA成为多肽。
“成熟”蛋白指经过翻译后加工的多肽;即其中已经除去初级翻译产物中存在的任何前肽或原肽。
“转化”指将核酸片段转移进宿主生物的基因组,获得在遗传上稳定的遗传。包含转化核酸片段的宿主生物称为“转基因”生物或“重组”生物或“转化”生物。
术语“质粒”、“载体”和“盒”指额外的染色体元件,所述元件通常携带不参与细胞中心代谢的基因,并且通常为环状双链DNA分子。这样的元件可以是来自任何来源的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,它们是线性或环状单链或双链DNA或RNA,其中多个核苷酸序列已经连接或重组进独特构建物,所述构建物能够将启动子片段和编码特定基因产物的DNA序列以及合适的3′非翻译序列引入细胞。“转化盒”指特定载体,所述载体包含外源基因,并且具有除所述外源基因外便利转化特定宿主细胞的元件。“表达盒”指特定载体,所述载体包含外源基因,并且具有除所述外源基因外允许所述基因在外源宿主中表达增强的元件。
本文用下面缩写定义特定氨基酸:
氨基酸          三字母缩写           单字母缩写丙氨酸                 Ala                   A精氨酸                 Arg                   R天冬酰胺               Asn                   N天冬氨酸               Asp                   D天冬酰胺或天冬氨酸     Asx                   B半胱氨酸               Cys                   C谷氨酰胺               Gln                   Q谷氨酸                 Glu                   E谷氨酰胺或谷氨酸       Glx                   Z甘氨酸                 Gly                   G组氨酸                 His                   H亮氨酸                 Leu                   L赖氨酸                 Lys                   K甲硫氨酸               Met                   M苯丙氨酸               Phe                   F脯氨酸                 Pro                   P丝氨酸                 Ser                   S苏氨酸                 Thr                   T色氨酸                 Trp                   W酪氨酸                 Tyr                   Y缬氨酸                 Val                   V
本文使用的标准重组DNA和分子克隆技术是本领域内众所周知的,在下列文献中有描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:A Laboratory Manual,第二版,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY(1989)(下文称为“Maniatis”);和Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.,Experiments with Gene Fusions,Cold Spring Harbor Laboratory ColdPress Spring Harbor,NY(1984);和Ausubel,F.M.等, Current Protocols in Molecular Biology,Greene Publishing Assoc.and Wiley-Interscience出版(1987)。表达盒
本发明提供在植物中生产丝状蛋白的方法。如下进行所述方法:提供具有一种DNA构建物的植物表达盒,所述DNA构建物包含一个启动子、一个编码丝状蛋白的转基因以及一个5′终止子密码区。所述转基因的表达可以是组成型或调节型表达。
用于在植物宿主中驱动外源基因表达的启动子是常见并且本领域内众所周知的。使所述SLP转基因组成型表达或以调节方式表达是有用的。组成型植物启动子是众所周知的。一些合适的启动子包括但不限于胭脂氨酸合酶启动子、章鱼氨酸合酶启动子、CaMV 35S启动子、核酮糖-1,5-二磷酸羧化酶启动子、基于Adhl的pEmu、Actl、SAM合酶启动子和Ubi启动子以及叶绿素a/b结合蛋白的启动子。
或者,可以使所述SLP转基因以可调方式表达。通过将丝状蛋白的编码序列置于组织特异性、发育特异性或诱导型启动子的控制之下,可能实现所述SLP的可调表达。
已经报道了植物中的几种组织特异性可调基因和/或启动子。这些包括编码种子贮藏蛋白(例如napin、cruciferin、β-conglycinin、大豆球蛋白和菜豆蛋白)、玉米醇溶蛋白或油体蛋白(如油质蛋白)的基因,或涉及脂肪酸生物合成(包括酰基载体蛋白、硬脂酰ACP去饱和酶和脂肪酸去饱和酶(fad 2-1))的基因,以及其它在胚发育过程中表达的基因(如Bce4,见例如EP255378和Kridl等,Seed Science Research(1991)1:209-219)。对于种子特异性表达尤其有用的是豌豆球蛋白启动子[Czako等,Mol.Gen.Genet.(1992),235(1),33-40]。对于在成熟叶中表达有用的其它启动子是那些在衰老起始时开启的启动子,例如来自拟南芥的SAG启动子[Gan等,通过自主调节产生细胞分裂素抑制叶衰老,Science(Washington,DC)(1995),270(5244),1986-8]。
U.S.4,943,674中讨论一组果实特异性启动子,该组启动子在从开花到果实发育的过程中表达,至少直到成熟开始时仍在表达,所述公开内容特此通过引用结合到本文中。已经分离了优选在棉花纤维中表达的cDNA克隆[John等,棉花(Gossypium hirsutum L.)纤维中的基因表达:克隆mRNA,Proc.Natl.Acad.Sci.U.S.A.(1992),89(13),5769-73]。已经分离并特征鉴定来自番茄的cDNA克隆,所述克隆在果实发育的过程中呈现差异化表达[Mansson等,Mol.Gen.Genet.(1985)200:356-361;Slater等,Plant Mol.Biol.(1985)5:137-147]。多聚半乳糖醛酸酶基因的启动子在果实成熟时有活性。所述多聚半乳糖醛酸酶基因在美国专利第4,535,060号(1985年8月13日发布)、美国专利第4,769,061号(1988年9月6日发布)、美国专利第4,801,590号(1989年1月31日发布)和美国专利第5,107,065号(1992年4月21日发布)中描述,所述公开内容特此通过引用结合到本文中。
编码psbA(光合系统II的成分之一)的成熟质体mRNA在果实发育晚期达到最高水平,与此不同,编码光合系统I和II其它成分的质体MRNA在成熟开始后在色质体中降低到无法检测的水平[Piechulla等,Plant Mol.Biol.(1986)7:367-376]。最近,已经分离和特征鉴定了明显涉及番茄花粉[McCormick等,Tomato Biotechnology(1987)Alan R.Liss,Inc.,New York]和雌蕊(Gasser等,Plant Cell(1989),1:15-24)相互作用的基因的cDNA克隆。
组织特异性启动子的其它例子包括那些在叶损伤(例如咀嚼昆虫造成的损伤)后指导在叶细胞中表达的启动子、指导在块茎中表达的启动子(如patatin基因启动子)以及指导在纤维细胞中表达的启动子(受到发育调节的纤维细胞蛋白的一个例子是E6[John等,棉花(Gossypium hirsutum L.)纤维中的基因表达:克隆mRNA,Proc.Natl.Acad.Sci.U.S.A.(1992),89(13),5769-73])。所述E6基因在纤维中活性最高,但在叶、胚珠和花中存在低水平转录物。
由于终止区看起来在相当程度上可以互换,因此所述表达盒中使用的终止区主要根据方便选择。所使用的终止区可以与转录起始区同源,或者与目标DNA序列同源,或者可以从另一来源获得。所述终止区可以是天然的,或者是完全合成或部分合成。方便的终止区可以从根癌农杆菌(A.tumefaciens)的Ti质粒获得,例如章鱼氨酸合酶和胭脂氨酸合酶终止区,或者来自编码β-菜豆蛋白的基因pIN(化学诱导型lant基因)(Hershey等,分离和特征鉴定玉米中编码受到取代的苯磺酰胺诱导的RNA的cDNA克隆.Plant Mol.Biol.(1991),17(4),679-90;美国专利第5,364,780号)。
编码所述丝或SLP蛋白的转基因可以是天然的或者是合成的。本发明的转基因一般来自产丝生物,例如鳞翅目的昆虫,其中包括家蚕和蜘蛛棒络新妇。编码本发明多肽的基因一般至少约900核苷酸长、通常至少1200核苷酸长、最好至少1500核苷酸长。本发明的基因通常包含串联的编码同一氨基酸序列的DNA单体,其中仅存在一种重复单位以形成同聚物,其中编码不同氨基酸重复单位的两个或多个单体中的全部或部分相互连接,形成编码嵌段共聚物或随机共聚物的新单体。各个氨基酸重复单位将具有3到20个氨基酸(9到60个核苷酸),一般具有3到15个氨基酸(9到45个核苷酸)、通常3到12个氨基酸(9到36个核苷酸)、更一般是3到9个氨基酸(9到27个核苷酸),通常相同的氨基酸在同一单位内出现至少两次,它们之间一般由至少一个氨基酸分开。在一些情况下,最小氨基酸数目是4。在单体内,根据获得同一氨基酸序列的密码子简并性,编码同一氨基酸重复单位的dsDNA涉及两个或多个核苷酸序列。
本发明的基因包括多个区,所述区包含重复单位的重复,通常是至少2单位的区段,直到重复单位的整个区。重复单位的区段可以散布在各个其它重复单位或间插序列间,或者散布在其它重复单位或间插序列的区段间。所述重复单位可以具有相同序列,或者使用2种或多种不同序列编码所述重复单位,其中使用特定氨基酸的密码子简并性以使序列多样化。
通过提供如上文所述的约5到25个重复单位、更一般是约6到15个重复单位的寡聚物或多聚物,产生丝状蛋白(SLP)基因。通过赋予不同粘端,可以连接所述寡聚物,提供多聚物,所述多聚物具有2个或多个所述寡聚物单位,一般不多于约50个寡聚物单位、更一般是不多于约30个寡聚物单位,通常不多于约25个寡聚物单位。丝和SLP多肽
本发明提供从植物平台表达的各种丝和丝状蛋白。尤其有意义的是包含重复单位SGAGAG(SEQ ID NO:2)和GAGAGS(SEQ ID NO:3)的多肽。该重复单位出现在天然丝心蛋白中,该蛋白表示为GAGAG(SGAGAG)8SGAAGY(SEQ ID NO:4)。本发明尤其适合的是具有下面通式的丝状蛋白:
[(A)n-(E)q-(S)q-(X)p-(E)q-(S)q]i
其中:
A或E是约10到25氨基酸的不同非晶体软区段,具有至少55%Gly;
S是约6到12氨基酸的半晶体区段,包含至少33%Ala和50%Gly;
X是约6-12氨基酸的晶体硬区段,包含至少33%Ala和50%Gly;
其中
n=2,4,8,16,32,64或128;
q=0,1,2,4,8,16,32,64或128;
p=2,4,8,16,32,64或128;
i=1-128;而
其中p≥n或q。
非晶体区段、半晶体区段或硬区段的优选组合包括但不限于[(A)4-(X)8]8、[(A)4-(X)8-(S)]8、[(A)4-(X)8-(E)]8、[(A)8-(X)8]8、[(A)4-(S)-(X)8]8、[(A)4-(S)2-(X)8]8、[(A)4-(E)-(X)8-(E)]8、[(A)4-(E)-(X)8]8、[(A)4-(S)-(X)8-(E)]8和[(A)4-(S)2-(X)8-(E)]8。更优选的组合是其中非晶体区段、半晶体区段或硬区段定义如下的组合:A=SGGAGGAGG(SEQ IDNO:5)、E=GPGQQGPGGY(SEQ ID NO:6)、S=GAGAGY(SEQ ID NO:7)和X=SGAGAG(SEQ ID NO:2)。
在优选实施方案中,所述丝或SLP可以来自蜘蛛丝。有多种适于在植物中表达的蜘蛛丝。其中许多来自球状织网蜘蛛,例如Nephila属的蜘蛛。来自这些蜘蛛的丝可以分为主要壶腹腺、次要壶腹腺和鞭形腺丝,每种丝都具有不同的物理特性。合适蜘蛛丝的综述见例如Hayashi等,Int.J.Biol.Macromol.(1999),24(2,3),271-275。主要壶腹腺的丝是特征鉴定最完全的丝,常被称为蜘蛛拖丝。天然蜘蛛拖丝由两种不同的蛋白组成,这两种蛋白都由蜘蛛的主要壶腹腺织出。Xu等,Proc.Natl.Acad.Sci.U.S.A.,87,7120,(1990)以及Hinman和Lewis,J.Biol.Chem.267,19320(1992)已经公开这两种拖丝蛋白的氨基酸序列,这两种蛋白在下文称为拖丝蛋白1(DP-1)和拖丝蛋白2(DP-2)。在本发明的范围内,拖丝蛋白1(DP-1)和拖丝蛋白2(DP-2)是蜘蛛丝变体设计的主要来源。
蜘蛛丝变体蛋白的设计基于来自蜘蛛棒络新妇天然蜘蛛丝拖丝蛋白的纤维形成区的共有氨基酸序列。DP-1的一个片段的氨基酸序列重复并且富含甘氨酸和丙氨酸,但在其它方面不同于任何以前已知的氨基酸序列。因此,单重复的“共有”序列是:
A GQG GYG GLG XQG A GRG GLG GQG A GAAAAAAAGG(SEQ ID NO:8)
其中X可以是S、G或N。
各个重复按照某个模式不同于所述共有序列,该模式可以归纳如下:(1)聚丙氨酸序列的长度从0残基到7残基变化;(2)当缺失整个聚丙氨酸序列时,同时缺失包括AGRGGLGGQGAGAnGG(SEQID NO:9)的周围序列。(3)除所述聚丙氨酸序列外,缺失通常包括整数性多个三连续残基。(4)同一重复内缺失GYG通常伴随着缺失GRG。(5)其中缺失整个聚丙氨酸序列的重复之前通常是包含六个丙氨酸残基的重复。
设计DP-1的合成类似物,使其模拟天然蛋白的重复共有序列以及各个重复间的变化模式。设计两种DP-1类似物,命名为DP-1A和DP-1B。DP-1A包括串联重复的SEQ ID NO 10中列出的101氨基酸序列。所述101氨基酸“单体”包含四个按照上面模式(1)-(5)不同的重复。该101个氨基酸长的肽单体在一系列类似物蛋白中重复1到16次。通过重新排列DP-1A单体内的四种重复,设计DP-1B。该单体序列示于SEQ ID NO:11,具有上面(1)-(5)的所有规则。此外,它呈现DP-1A所不具有的天然序列的规律,即,同时缺失GYG和GRG的重复通常前面是缺失整个聚丙氨酸序列的重复,其中还包括一个间插重复。DP-1B的序列在更长延伸的区段上比DP-1A更加与天然序列匹配。
因此,本发明的目标之一是提供蜘蛛拖丝变体蛋白,其中所述全长变体蛋白用下面通式定义:
[ACGQGGYGGLGXQGAGRGGLGGQGAGAnGG]z(SEQ ID NO:12)
其中X=S、G或N;n=0-7,z=1-75,其中z值决定所述变体蛋白中的重复数,该通式包括选自以下的改变:
(a)当n=0时,缺失包含AGRGGLGGQGAGAnGG(SEQ ID NO:9)的序列;
(b)由n的值限定的除聚丙氨酸序列外的缺失将包含整数性多个三连续残基;
(c)在任何重复内缺失GYG都在同一重复内缺失GRG;和
(d)缺失n=0的第一个重复时,第一个重复之前有n=6的第二个重复;和
所述全长蛋白由一种基因或多种基因编码,所述基因对于蜘蛛棒络新妇基因组不是内源的。
本发明的丝变体和SLP具有一般与天然蛋白相关的物理性质。例如,预期所述丝和SLP的韧性(g/丹尼尔)为约2.8到约5.2,抗张强度(psi)为约45,000到约83,000,伸长率(%)为约13到约31。植物宿主
事实上任何能够支持丝或SLP基因表达的植物均适于用作本发明的宿主。合适的植物可以是单子叶植物或双子叶植物,最好属于耐寒的品种并且允许每年多次收获。合适的绿色植物包括但不限于大豆、油菜籽、向日葵、棉花、玉米、烟草、苜蓿、小麦、大麦、燕麦、高梁、水稻、拟南芥、甜菜、甘蔗、canola、小米、菜豆、豌豆、黑麦、亚麻、草和香蕉。
将构建物引入植物细胞宿主的各种技术是现成的并且是本领域内技术人员已知的。这些技术包括用DNA转化(使用根癌农杆菌(A.tumefaciens)或毛根农杆菌(A.rhizogenes)作为转化媒介)、电穿孔、粒子加速等。[见例如EP 295959和EP 138341]。尤其优选使用农杆菌(Agrobacterium spp.)的Ti质粒和Ri质粒的二元型载体。Ti衍生的载体转化多种高等植物,其中包括单子叶植物和双子叶植物,例如大豆、棉花、油菜、烟草和水稻[Pacciotti等(1985)Bio/Technology 3:241;Byrne等(1987)Plant Cell,Tissue and Organ Culture 8:3;Sukhapinda等(1987)Plant Mol.Biol.8:209-216;Lorz等(1985)Mol.Gen.Genet.199:178;Potrykus(1985)Mol.Gen.Genet.199:183;Park等,J.Plant Biol.(1995),38(4),365-71;Hiei等,Plant J.(1994),6:271-282]。使用T-DNA转化植物细胞已经得到广泛研究和充分描述[EP 120516;Hoekema,The Binary Plant Vector System,Offsetdrukkerij Kanters B.V.;Alblasserdam(1985),第V章,Knauf等,Genetics Analysis of Host RangeExpression by Agrobacterium, Molecular Genetics of the Bacteria-Plant Interaction,Puhler,A.编辑,Springer-Verlag,New York,1983,第245页;和An等,EMBO J.(1985)4:277-284]。为将本发明的嵌合基因引入植物,可以如实施例中所述将所述基因插入二元载体。
其它转化方法是本领域内技术人员可以获得的,例如直接摄入外源DNA构建物[见EP 295959]、电穿孔技术[见Fromm等(1986)Nature(London)319:791]或用所述核酸构建物包被的金属粒子高速弹道轰击[见Kline等(1987)Nature(London)327:70,和见美国专利第4,945,050号]。转化细胞后,本领域内技术人员再生所述细胞。尤其实用的是最近描述的将外源基因转化入重要商业作物内的方法,所述重要商业作物如油菜籽[见De Block等(1989)Plant Physiol.91:694-701]、向日葵[Everett等(1987)Bio/Technology 5:1201]、大豆[McCabe等(1988)Bio/Technology 6:923;Hinchee等(1988)Bio/Technology 6:915;Chee等(1989)Plant Physiol.91:1212-1218;Christou等(1989)Proc.Natl.Acad.Sci USA 86:7500-7504;EP301749]、水稻[Hiei等,Plant J.(1994),6:271-282]和玉米[Gordon-Kamm等(1990)Plant Cell 2:603-618;Fromm等(1990)Biotechnology 8:833-839]。
然后将转基因植物细胞置于合适的选择培养基中,选择转基因细胞,然后将其培养为愈伤组织。通过在生根培养基中培养,从愈伤组织培养出苗,然后从所述苗生出小植株。各种构建物一般连接一种标记,以在植物细胞中进行选择。方便的是,所述标记对杀生物剂有抗性(尤其是抗生素如卡那霉素、G418、博来霉素、潮霉素、氯霉素、除草剂等等)。所使用的特定标记允许选择转化细胞,将所述转化细胞与缺乏所述引入DNA的细胞区分开。从对于所述宿主是天然(内源)或外源(外源)的序列制备包括本发明转录盒的DNA构建物的成分。“外源”指该序列在所述构建物所引入的野生型宿主中不存在。异源构建物将包含至少一个对于所述转录起始区衍生的基因不是天然的区。
为确认所述转基因在转基因细胞和植株中存在,可以使用本领域内技术人员已知的方法,进行聚合酶链反应(PCR)扩增或DNA印迹分析。根据所述转基因表达产物的性质,可以采用多种方法中的任何一种检测所述产物,其中包括蛋白质印迹分析和酶测定。一种在不同植物组织中定量蛋白表达和检测复制的尤其有用的方法是使用报道基因,例如GUS。一旦获得转基因植株后,就可以培养所述植株,生产具有所需表型的植物组织或部分。可以收获所述植物组织或植物部分,和/或收集种子。所述种子可以用作培养其它植株的来源,所述植株包含具有所需特征的组织或部分。回收方法
可以通过多种方法从所述植物组织提取和纯化本发明的SLP。本发明优选的方法是涉及如下步骤的方法:通过降低pH和加热,从匀浆的植物组织取出天然植物蛋白,然后通过硫酸铵分级分离。简要地说,通过匀浆植物组织(如种子和叶),从所述转基因植株提取总可溶性蛋白。在pH4.7处理,然后在60℃下处理,通过沉淀取出天然植物蛋白。获得的上清用硫酸铵以40%饱和度分级分离。所获得的蛋白将约95%的纯度。通过常规凝胶或亲和层析可以获得进一步的纯化。
最佳实施方案的描述
在本发明中,利用植物作为生产SLP的生产平台。基于拖丝的SLP尤其有意义,因为(1)拖丝的结构特征代表SLP的一般结构特征,因此其表达应该反映其它相似SLP基因在植物中的情况,和(2)拖丝的纤维具有许多非常符合下一代纤维标准的优良性质。
本发明在两个植物系统中得到证实,所述两个植物系统是拟南芥和大豆胚组织培养物。将编码8聚体或16聚体DP-1B蜘蛛拖丝变体的基因工程化进表达盒,置于35S组成型启动子或β-Conglycine种子特异性启动子的控制下,并且具有NOS终止子区。将所述盒转化进农杆菌,然后用所述农杆菌感染拟南芥。通过免疫学方法确认8聚体和18聚体蜘蛛丝的存在。蛋白测定指出:所述8聚体在叶组织中的平均表达水平是总可溶性蛋白的0.34%(约0.07%干重),所述16聚体在叶组织中的平均表达水平是总可溶性蛋白的0.03%(约0.006%干重)。相似地,所述8聚体在种子中以1.2%总蛋白(约0.24%干重)的平均水平表达,而所述16聚体在种子中以0.78%总蛋白(约0.16%干重)的平均水平表达。
使用同样的8聚体和16聚体构建物转化大豆胚组织培养物。在大豆中表达SLP是极其引人注目的,因为大豆是一种全球性的主要作物,并且其本身是高效低耗的蛋白合成机器。因为大豆体细胞胚中的基因表达等同于在大豆种子中的表达,所以SLP基因在所述胚中的表达证明在转基因大豆种子中生产SLP的可行性。通过粒子轰击完成转化。8聚体SLP在大豆胚系统中的平均表达水平是总可溶性蛋白的1.0%(约0.4%干重)。
从转基因植物以工业化规模生产SLP需要主要基于简单方法的纯化方案,所述简单方案如沉淀、过滤和离心。由于DP-1B蛋白的特殊结构和氨基酸组成,DP-1B蛋白在水溶液中非常稳定;因此,有可能利用上面讨论的简单方法从其它植物蛋白中纯化它们。为达到该目标,使用表达高水平DP-1B.8P蛋白的pGY401转基因拟南芥植株发展纯化方案。为获得大量的起始材料,根据直接土壤生长选择纯合型转基因植株。萌发并培养T4纯合种子。收获所述植株,分级分离总蛋白。检查每种组份内DP-1B蛋白的存在。在(NH4)2SO4沉淀组份中发现大部分DP-1B蛋白。该简单方法能够除去约95%的植物蛋白,同时浓缩DP-1B蛋白。
                         实施例
下面实施例进一步定义本发明。应该理解这些实施例虽然指出本发明的最佳实施方案,但仅为举例说明的目的给出。从上面的讨论和这些实施例,本领域内技术人员能够确定本发明的基本特征,并且在不偏离本发明精神和范围的情况下作出本发明的各种改变和修改,以使其适应各种应用和条件。一般方法
实施例中使用的标准重组DNA和分子克隆技术是本领域内众所周知的,在下列文献中有描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:A Laboratory Manual;Co1d Spring HarborLaboratory Press:Cold Spring Harbor,(1989)(Maniatis)和T.J.Silhavy,M.L.Bennan和L.W.Enquist, Experiments with Gene Fusions,ColdSpring Harbor Laboratory,Cold Spring Harbor,NY(1984)和Ausubel,F.M.等, Current Protocols in Molecular Biology,Greene PublishingAssoc.and Wiley-Interscience出版(1987)。
适于维持和培养细菌培养物的材料和方法是本领域内众所周知的。适用于下面实施例的技术可以在下列文献中找到: Manual of Methods for General Bacteriology(Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg和G.Briggs Phillips编辑),美国微生物学会,Washington,DC(1994))或Thomas D.Brock, Biotechnology:A Textbook of Industrial Microbiology,第二版,Sinauer Associates,Inc.,Sunderland,MA(1989)。除特别指出外,用于培养和维持细菌细胞的所有试剂、限制酶和材料都从下列来源获得:Aldrich Chemicals(Milwaukee,WI)、DIFCO Laboratories(Detroit,MI)、GIBCO/BRL(Gaithersburg,MD)或Sigma ChemicalCompany(St.Louis,MO)。
适于转化和培养植物的材料和方法是本领域内众所周知的。适用于下面实施例的技术可以在下面文献中找到: Plant Molecular Biology,A Laboratory Manual(Melody S.Clark编辑,Springer-Verlag,Berlin,Heidelberg,1997)、 Methods in Plant Molecular Biology,A Laboratory Course Manual(Pal Maliga,Daniel F.Flessing,Anthony R.Cashmore,Wilhelm Cruissem,Joseph E.Varner编辑,Cold SpringHarbor Laboratory Press,1995)和 Metheds in Molecular Biology,第82 卷,拟南芥方法学(Jose M.Martinez-Zapater,Julio Salinas编辑,Humana Press,Totowa,NJ 1998)。除特别指出外,用于培养和维持转基因植物的所有试剂、限制酶和材料都从下列来源获得:AldrichChemicals(Milwaukee,WI)、DIFCO Laboratories(Detroit,MI)、GIBCO/BRL(Gaithersburg,MD)或Sigma Chemical Company(St.Louis,MO)。
缩写的意义如下:“h”表示小时,“min”表示分钟,“sec”表示秒,“d”表示天,“mL”表示毫升,“L”表示升。
                        实施例1
构建在拟南芥中表达的质粒,该质粒包含编码蜘蛛棒络新妇蛛
                丝蛋白1类似物的合成基因
从DuPont Company(Wilmington,DE 19898)(WO9429450)获得8聚体和16聚体DP-1B.33的合成基因。这些基因分别编码含809个氨基酸的蛋白序列(SEQ ID NO:13)和含1617个氨基酸的蛋白序列(SEQ ID NO:14),所述蛋白序列分别代表蜘蛛棒络新妇蛛丝蛋白1的主要结构元件和重复模式。获得携带那些合成基因的质粒pFP717和pFP723(在WO9429450中有充分描述),以进行这些实验。
为了在所述合成基因的N末端加入起始密码子、并在C末端终止密码子之前加入6组氨酸编码序列,制造接头GYS。通过标准方法合成寡核苷酸序列GYS[+](5′GAT CTC CAT GGC TAG ATC TAGAGG ATC CCA TCA CCA TCA CCA TCA CTA AG 3′)(SEQ ID NO:15)和GYS[-](5′AAT TCT TAG TGA TGG TGA TGG TGA TGG GATCCT CTA GAT CTA GCC ATG GA 3′)(SEQ ID NO:16)。所述寡核苷酸用TE(10m tris,1m EDTA,pH8.0)稀释到1μg/μL,然后在试管内等体积混合。所述混合物煮沸5分钟,然后缓慢冷却到室温。下文显示在该过程中形成的接头GYS。所述接头具有分别与BamH I和EcoR I消化位点互补的粘性末端,并且编码包括一个起始密码子、ARSRGS(SEQ ID NO:17)6-组氨酸标记和一个终止密码子的小肽。它还引入一些限制性位点如Nco I、Bag II、Xba I和BamH I。用T4连接酶(Life Technologies,Gaithersburg,MD)将所述接头克隆进pBluescript-SK(+)(Stratagene,La Jolla,CA)的限制性位点BamH I和EcoR I之间。获得的质粒称为pGY001(图1),该质粒在XLl-蓝大肠杆菌细胞(Stratagene,La Jolla,CA)中扩增,然后用QIAprep离心微量制备试剂盒(Qiagen,Valencia,CA)进行制备。通过标准测序确认所述接头的序列。
Figure A0181011300331
2μg质粒Pfp 717和Pfp 723用Bgl II和BamH I在37℃下限制性消化2小时。在0.8%琼脂糖凝胶上分离8聚体和16聚体DP-1B.33基因,然后用QIAquick凝胶提取试剂盒(Qiagen,Valencia,CA)纯化。在50μL反应物中用同样的酶消化2μg pGY001。为制备脱磷酸化的pGY001,在所述反应物中加入10μL脱磷酸化缓冲液和2μL CIAP(Life Technologies,Gaithersburg,MD),然后加水到100μL终体积。所述反应混合物置于37℃下30分钟,然后加入2μL CIAP,继续温育30分钟。使用QIAquick PCR纯化试剂盒(Qiagen,Valencia,CA)纯化所述DNA。然后用T4连接酶将来自pFP717和pFP723的8聚体和16聚体DP-1B.33克隆进pGY001的Bgl II和BamH I位点之间,分别获得pGY101和pGY102(图2A和图2B)。在XL1-蓝大肠杆菌中扩增质粒(pGY101、pGY102),然后使用QIAprep离心微量制备试剂盒纯化。这两种质粒包含8聚体(pGY101中)和16聚体(pGY102中)DP-1B.33的编码序列以及一个N端起始密码子、一个C端6组氨酸编码序列和添加的一个随后的终止密码子。因此所述质粒包含两个完整的合成基因,针对植物的DP-1B 8聚体(SEQ ID NO:21)编码有818个氨基酸残基的多肽(SEQ ID NO:22),针对植物的DP-1B 16聚体(SEQ ID NO:23)编码有1626个氨基酸残基的多肽(SEQ ID NO:24)。通过DNA测序确认插入的准确性。
                           实施例2
                         构建表达盒
为构建具有合适5′启动子和3′终止子(聚腺苷酸化序列)的盒以用于DP-1B基因的组成型表达以及种子特异性表达,质粒pML63和pCW109由DuPont Agricultural Products(Wilmington DE,19898)提供。U.S.5,955,650和WO94/11516中充分描述了pCW109。载体pML63包含有效连接CaMV35S启动子和3′NOS序列的uidA基因(编码GUS酶)。pML63由pMH40修饰得到,产生最小3′NOS终止子片段。WO98/16650中描述了pMH40,所述公开物通过引用结合到本文中。使用本领域内技术人员熟悉的标准技术,用包含Depicker等(1982,J.Appl.Genet.1:561-574)所公开序列核苷酸1277到1556的新型3′NOS终止子序列取代pMH40内包含的770碱基对终止子序列。
如图3A中所示,pML63包括一个GUS表达盒,它具有一个5′CaMV 35S/Cab22L启动子和一个3′NOS终止子(35S/Cab22LPro∷GUS∷NOS Ter)。为用DP-1B.8P取代GUS,用限制酶Nco I和EcoR I消化pML63和pGY101。通过前文描述的方法,将来自pGY101的包含DP-1B.8P的DNA片段克隆进pML63。所获得的质粒称为pGY201,包含表达盒35S/Cab22L Pro∷DP-1B.8P∷NOS Ter。用DP-1B.16P取代pML63中的GUS,其中使用pGY102而不是pGY101。所述包含表达盒35S/Cab22L Pro∷DP-1B.16P∷NOS Ter的质粒称为pGY202。图4A和图4B显示pGY201和pGY202的详细结构。
pCW109的序列指出:它包含一个空表达盒,其具有一个5′β-conglycinin启动子和一个3′菜豆蛋白终止子(图3B)。为将DP-1B.8P插入β-conglycinin启动子直接下游的多接头区,用限制酶Nco I和KpnI消化pCW109和pGY101,然后将来自pGY101的包含DP-1B.8P的DNA片段克隆进pCW109的两个酶限制位点之间。所述新质粒称为pGY211,包含一个由β-conglycinin Pro∷DP-1B.8P∷菜豆蛋白Ter组成的表达盒(图5A)。为限制所述多接头内可利用的限制位点,1μgpGY211在30μL反应混合物中用限制酶EcoR I和Xho I在37℃下消化2小时。然后在所述反应混合物中加入2μL 2.5mM dNTP、17μL水和1μL克列诺片段,在室温下温育10分钟,产生平端。用QIAquickPCR纯化试剂盒纯化所述反应物。通过十分之一所述反应物的自连接,获得新的质粒。为使在所述表达盒侧翼的区内有更多可利用的限制位点,将来自所述质粒的包含所述完整表达盒的HindIII片段以正取向克隆进pBluescript SK(+)的HindIII位点。该质粒称为pGY213(图5B),通过限制消化模式确认其取向。
                      实施例3
                构建基于二元载体的质粒
二元载体pZBL1由DuPont Agriculture Products(Wilmington,DE19898)提供,该载体在U.S.5,968,793中完全描述,可以从美国典型培养物保藏中心获得(ATCC 209128)。所述载体在所述T-DNA外包含一个用于细菌选择的卡那霉素抗性基因,在所述T-DNA内右边界序列(RB)和左边界序列(LB)之间有一个NPT II基因表达盒(NOSPro∷NPT II∷OCS Ter),用于植物细胞的卡那霉素抗性选择(图6)。除专门指出外,本实施例内描述的所有质粒都在XL1-蓝大肠杆菌细胞内产生。
为构建基于二元载体的质粒以用于DP-1B蛋白的组成型表达,用限制酶Xba I和SalI消化质粒pGY201和pGY202。分离包含DP-1B.8P和DP-1B.16P表达盒的DNA片段,分别插入双元载体pZBL1的所述NPT II表达盒上游多接头区的限制位点Xba I和SalI之间。所述插入得到质粒pGY401和pGY402,其中质粒pGY401携带表达盒35S/Cab22L Pro∷DP-1B.8P∷NOS Ter,质粒pGY402携带表达盒35S/Cab22L Pro∷DP-1B.16P∷NOS Ter。图7A和图7B详细描述这两种序列的结构。通过消化单一限制位点确认它们的序列。
使用上文所述的类似方法,构建质粒pGY411,用于种子特异性表达DP-1B.8P蛋白。通过限制酶EcoR I和Sal I消化pGY213,获得包含DP-1B.8P表达盒的DNA片段,然后插入pZBL1的这两个位点之间。为制造用于种子特异性表达DP-1B.16P的构建物,用DP-1B.16P编码区(pGY102中从限制位点Kpn I到限制位点Bgl II的DNA序列)取代DP-1B.8P编码区(pGY411中同样限制位点间的DNA片段),构建pGY412。在STB II大肠杆菌细胞中扩增这两种质粒的DNA以避免DNA重排,并通过单一限制位点消化确认所述构建物。如图8A和图8B所示,pGY411和pGY412包括分别由β-conglycininPro∷DP-1B.8P∷菜豆蛋白Ter和β-conglycinin Pro∷DP-1B.16P∷菜豆蛋白Ter组成的种子特异性表达盒。所述质粒在表1中综述。
                      实施例4
               农杆菌介导的拟南芥转化 农杆菌转化
为制备感受态农杆菌细胞,在1L YEP培养基中培养C58C1(pMP90)农杆菌株集落(Koncz等,Mol.Gen Genet.,(1986)204(3),383-396)直到OD600达到1.0,其中所述1L YEP培养基中包括10g细菌蛋白胨、10g酵母提取物和5g NaCl。所述培养物在冰上冷却,然后离心收集细胞。将所述感受态细胞重悬浮于冰冷的20mM CaCl2溶液中,然后以0.1mL等份保存在-80℃。
使用冻融法将pGY401、pGY402、pGY411和pGY412引入农杆菌。首先,将1μg来自每种构建物的质粒DNA加入冻存等分的农杆菌细胞。所述混合物在37℃解冻5分钟,加入1mL YEP培养基,然后在28℃温和振荡2小时。离心收集细胞,在含25mg/L庆大霉素和50mg/L卡那霉素的YEP琼脂平板上于28℃培养2到3天。通过常规方法微量制备和限制酶消化质粒DNA,确认农杆菌转化子,其中在制备DNA前在细胞悬液内应用溶菌酶(Sigma,St.Louis,MO)以增强细胞裂解。同时将空二元载体pZBL1引入农杆菌作为对照。拟南芥转化
在盛有Metro Mix土壤(Scotts-Sierra,Maryville,OH)的3″方形罐中,培养拟南芥直到抽苔,培养密度为每罐5株,控温22℃,光照为16小时光/8小时暗。转化前4天对植株进行去头处理。在含25mg/L庆大霉素和50mg/L卡那霉素的LB培养基(1%细菌蛋白胨,0.5%细菌-酵母提取物,1%NaCl,pH7.0)中,于28℃下培养携带pZBL1(对照)、pGY401、pGY402、pGY411或pGY412质粒的农杆菌,直到培养物的OD600值达到1.2。离心收集细胞,重悬浮于浸润培养基(1/2xMS盐,1xB5维生素,5%蔗糖,0.5%g/L MES,pH5.7,0.044μM苄氨基嘌呤),使OD600为约0.8。
应用真空浸润方法,使用携带上述五个基于二元载体的质粒的农杆菌菌株转染拟南芥植株。简要地说,在500mL Magenta盒内盛满农杆菌的浸润培养基悬浮液,然后在上面盖上倒置的有5株拟南芥植株的3″方形罐,使整株植株都浸没在所述悬浮液中。将该组装物放进28 1型IsoTemp真空烤箱(Fisher Scientific,Pittsburgh,PA),在30mmHg真空下浸润5分钟。每种农杆菌菌株至少浸润3罐植株。然后将感染植株侧放在Saran封口的浅箱内,室温下温育过夜。在正常条件下(22℃,16小时光/8小时暗)培养转染的拟南芥植株直到成熟。来自转化植株的种子定义为T1种子。从每罐的植株收集T1种子,干燥一周,然后室温保存。
                         实施例5
                 在拟南芥中表达DP-1B蛋白 选择拟南芥转化子
为选择转化子,1,000粒T1种子在1mL 50%Clorox(三氯乙醛是约10%的漂白剂)和0.02%Triton X-100溶液中灭菌7分钟,然后在无菌蒸馏水中清洗5次。种子重悬浮于2mL 0.1%琼脂糖中,然后铺展在含初级选择培养基(1xMS盐,1xB5维生素,1%蔗糖,0.5mg/mL MES,pH5.7,30μg/mL卡那霉素,100μg/mL羧苄青霉素,10μg/mL benomyl和0.8%phytagar)的90×20mm平板上。种子在4℃下冷处理3天后,在22℃连续光照下萌发一周。由于NTP II基因的表达,所有转化种子(通常占所收集种子的1%)都萌发并生长成绿色幼苗。然而,非转化种子或者不萌发,或者幼苗迅速变白。选择健康的转化子幼苗(T1植株),在包含二级选择培养基的90×20mm平板上培养,所述二级选择培养基含有与初级选择培养基相同的成分,只是含有15%phytagar。培养转化子一周以增强根发育。最后,将幼苗转移到单独的盛有Metro Mix土壤的1″方形罐中,在22℃和16小时光/8小时暗周期下培养到成熟。从每株植株收集T1植株产生的T2种子,分开保存。
所有pZBL1、pGY401、pGY402、pGY411和pGY412的T1种子集合都经过上文所述的转化子选择。该过程获得22株pZBL1转基因植株,44株pGY401转基因植株,69株pGY402转基因植株,21株pGY411转基因植株,29株pGY412转基因植株。检查DP-1B蛋白表达
如上所述,选择携带pGY401和pGY402构建物的T1转基因植株,在土壤中培养直到抽苔。来自每株植株一半健康的叶(约20mg叶组织)在1.5mL冰冻的Eppendorf管中与50μL蛋白提取缓冲液(50mM Tris-HCl,pH8.0,12.5mM MgCl2,0.1mM EDTA,2mM DTT,5%甘油)一起研磨。离心所述混合物,收集上清作为叶蛋白提取物,检查其中组成型表达的DP-1B蛋白。由携带pGY411和pGY412构建物的T2种子制备种子蛋白提取物,所述T2种子是如上文所述从选定的T1转基因植株上收集。来自每株转基因植株的100到200粒种子在400μl蛋白提取缓冲液中提取。使用种子蛋白提取物检查DP-1B蛋白的种子特异性表达。使用Bio-Rad蛋白测定试剂(Bio-Rad,Hercules,CA)测定这些提取物中的总蛋白浓度。
使用Current Protocols in Molecular Biology(F.M.Ausubel等编辑,Wiley Interscience)中描述的蛋白免疫印迹测定来检测DP-1B蛋白的表达。使用Bio-Rad mini-gel电泳仪,在微型聚丙烯酰胺凝胶(5%浓缩胶和10%分离胶)中分离叶蛋白提取物或种子蛋白提取物中的蛋白。使用Pharmacia-LKB 2117 multiphor II(Amersham PharmaciaBiotech,Piscataway,NJ),按照生产商推荐的半干燥转移方法以0.8mA/em2 1小时,将凝胶中的蛋白转移到0.2μM硝酸纤维素膜(Schleicher &Schuell,Keene,NH)。一升半干燥蛋白质印迹转移缓冲液包括2.93g甘氨酸,5.81g Tris,0.375g SDS和200mL甲醇。所述硝酸纤维素膜用5%无脂奶TTBS(0.1%Tween-20,2.42g Tris,29.2gNaCl,pH7.5)封闭,在第一抗体-TTBS溶液中温育3小时,然后在含抗兔IgG HRP-缀合物(Promega,Madison,WI)的TTBS中温育1小时。用化学发光底物溶液检测膜上的蛋白-抗体相互作用,所述化学发光底物溶液由包含0.2mM对羟苯基丙烯酸、2.5mM 3-氨基邻苯二甲酰肼和0.01%H2O2的100mM Tris-HCl缓冲液(pH8.5)组成。在X-射线胶片上暴光,显示结果。
为检查DP-1B蛋白的表达,对来自pGY401和pGY402转基因拟南芥的10μL叶蛋白提取物和来自pGY411和pGY412转基因拟南芥的10μL种子蛋白提取物进行蛋白质免疫印迹测定。使用来自pZBL1转基因拟南芥的10μL叶蛋白提取物和种子蛋白提取物作为对照。第一抗体DP-1B Ab从DuPont获得,该抗体的制备在WO9429450中完整描述。这些抗体识别DP-1B分子内的高度保守序列CGAGQGGYGGLGSGGAGRG(SEQ ID NO:25),以1∶1,000稀释度使用。图9A举例说明所述蛋白质免疫印迹测定的结果,指出64kDDP-1B.8P和127kD DP-1B.16P蛋白分别在pGY401和pGY402转基因拟南芥的叶组织中产生和积累,并且这两种蛋白也分别在pGY401和pGY402转基因拟南芥的种子中产生和积累。在pGY402植株的叶中和一些pGY412植株的种子中DP-1B.16P蛋白小片段积累的比例更高,这指出在拟南芥中8聚体DP-1B蛋白的产生优于16聚体DP-1B蛋白的产生。使用该测定,检查163株卡那霉素抗性表型转基因拟南芥(44株pGY401,69株pGY402,21株pGY411,29株pGY412)中的DP-1B表达。只有25株pGY401植株(57%)、4株pGY402植株(6%)、4株pGY411植株(19%)和7株pGY412植株(24%)产生和积累具有预期分子量的DP-1B蛋白产物。
                                  表1
                          质粒构建物概要构建物   受体       供体      插入               用途PGY001   pBS-SK(+)  -         接头GYS            接头pGY101   pGY001     pFP717    8xDP-1B.33         DP-1B.8PpGY102   pGY001     pFP723    16xDP-1B.33        DP-1B.16PpGY201   pML63      pGY101    DP-1B.8P           35S/Cab22L Pro∷DP-
                                             1B.8P∷NOS TerpGY201   pML63      pGY102    DP-1B.16P          35S/Cab22L Pro∷DP-
                                             1B.16P∷NOS TerpGY211   pCW109     pGY101    DP-1B.8P           β-conglycinin Pro∷DP-1B.8P∷
                                             菜豆蛋白TerpGY213   pBS-SK(+)  pGY211    DP-1B.8P           β-conglycinin Pro∷DP-1B.8P∷
                                             菜豆蛋白TerpGY401   pZBL1      pGY201    35S Pro∷DP-       在拟南芥中组成型表达DP-
                          1B.8P∷NOS Ter     1B.8PpGY402   pZB L1     pGY202    35S Pro∷DP-       在拟南芥中组成型表达DP-
                          1B.16P∷NOS        1B.16P
                          TerpGY411   pZBL1      pGY213    Cong Pro∷DP-      在拟南芥中种子特异性表达
                          1B.8P∷Pha Ter     DP-1B.8PpGY412   pGY411     pGY102    Cong Pro∷DP-      在拟南芥中种子特异性表达
                          1B.16P∷Pha Ter    DP-1B.8PpLS3     pZBL102    pGY213    Cong Pro∷DP-      在大豆体细胞胚中表达DP-
                          1B.8P∷Pha Ter     1B.8PpGY220   pGY213     pGY412    Cong Pro∷DP-      β-conglycinin Pro∷DP-
                          1B.16P∷Pha Ter    1B.16P∷菜豆蛋白TerpLS4     pZBL102    pGY220    Cong Pro∷DP-      在大豆体细胞胚中表达DP-
                          1B.16P∷Pha Ter    1B 16P
其余根据抗生素抗性表型选择得到的转基因拟南芥属于以下三个类别:
(1)植株在所述测定中没有可见的DP-1B蛋白积累;
(2)植株表达DP-1B蛋白,但不育或在成熟前死亡;
(3)植株积累错误分子量或/和多显性产物的DP-1B蛋白。只有少数转基因植株成功产生DP-1B蛋白的事实反映在植物中表达SLP的难度,这可能是由于蜘蛛丝高重复性和高度富含甘氨酸/丙氨酸的性质。
在所述蛋白免疫印迹测定中还使用抗His(C-term)-HRP(Invitrogen,Carlsbad,CA)作为第一抗体。由于在所有构建物中将6x组氨酸标记建立到DP-1B蛋白的C末端,因此抗His标记缀合物使我们能够方便地确定DP-1B蛋白的质量并估计其产量。当使用该抗体进行免疫印迹时,则第二抗体并不是必要的,可以通过化学发光试剂直接检测蛋白-抗体相互作用。
为确定在转基因拟南芥所产生DP-1B蛋白的质量,从表现预期DP-1B蛋白表达的40株植株获得的叶或种子蛋白提取物进行免疫印迹测定。以1∶4,000稀释度使用抗His(C-term)-HRP作为第一抗体。图9B显示该测定的结果。结果指出:那些植株中表达的DP-1B蛋白不仅具有正确的分子量,而且有完整的C末端(因为抗His(C-term)-HRP识别它们C末端的His标记)。DP-1B.16P蛋白更短片段序列梯(ladder)在一些蛋白提取物(如图9A的402(92)、402(94)和412(41))中被DP-1B Ab识别,但不被His标记Ab识别,这提示在DP-1B.16P的翻译过程中可能发生某些成熟前终止。当抗His(C-term)-HRP与种子蛋白相互作用时,它也识别少数更小的蛋白分子,如图9B右图所示。由于这些蛋白也可以与对照区分开来,因此假定它们是种子蛋白,而不是转基因产物。
在一个使用抗His(C-term)-HRP的相似免疫印迹测定中,使用在C末端带有6xHis标记的14kD重组蛋白作为标准蛋白,所述重组蛋白在大肠杆菌中产生,通过亲和柱纯化。通过比较所述标准蛋白的信号和来自所述转基因植株的蛋白提取物的信号,估计DP-1B蛋白在大多数这40株植株中的产率。DP-1B.8P蛋白在pGY401转基因植株叶中的产率在总可溶性叶蛋白的0.01%到1.65%之间(约0.002%到0.33%干重),这代表0.34%总可溶性叶蛋白(约0.07%干重)的平均产率。DP-1B.16P蛋白在pGY402转基因植株叶中的产率在总可溶性叶蛋白的0.01%到0.06%之间(约0.002%到0.01%干重),这代表0.03%总可溶性叶蛋白(约0.006%干重)的平均产率。DP-1B.8P蛋白在pGY411转基因植株种子中的产率在总可溶性种子蛋白的1%到1.4%之间(约0.2%到0.28%干重),这代表1.2%总可溶性种子蛋白(约0.24%干重)的平均产率。DP-1B.16P蛋白在pGY412转基因植株种子中的产率在总可溶性种子蛋白0.5%到1%之间(约0.1%到0.2%干重),这代表0.78%总可溶种子蛋白(约0.16%干重)的平均产率。表2显示所述表达结果的概要。
                          表2
           DP-1B在转基因拟南芥植株中的产率
                            产率范围(%)      平均产率(%)转基因    产物    检查的  占总可溶    干重%    占总可溶  干重%
               组织    蛋白%                蛋白%pGY401  DP-1B.8P   叶    0.01-1.65  0.002-0.33    0.34     0.07pGY402  DP-1B.16P  叶    0.01-0.06  0.002-0.01    0.03     0.006pGY411  DP-1B.8P   种子  1-1.4      0.2-0.28      1.2      0.24pGY412  DP-1B.16P  种子  0.5-1      0.1-0.2       0.78     0.16
在扩展筛选pGY401转基因拟南芥后,鉴定一株植株积累65kDDP-1B.8P蛋白多达总可溶性叶蛋白的9.2%(约1.8%干重),该结果未在表2显示。这些结果指出:一般地说,种子特异性表达(pGY411和pGY412)导致种子中DP-1B.8P蛋白和DP-1B.16P蛋白的水平比叶中组成型表达(pGY401和pGY402)的水平更高。确认T-DNA插入拟南芥基因组
在转化拟南芥的过程中,将包括NPT II表达盒和DP-1B.8P或DP-1B.16P表达盒的整个T-DNA序列插入植物基因组。为进一步将那40株转基因拟南芥中的DP-1B蛋白表达与所述转基因联系起来,使用聚合酶链反应(PCR)检测来自那些植株基因组DNA的T-DNA内的DNA片段。为此目的,从每株转基因拟南芥收集2片叶(约100mg)。使用DNeasy Plant Mini试剂盒,按照试剂盒生产商(Qiagen,Valencia,CA)提供的方法分离DNA,获得50μL DNA溶液。通过在Beckman DU640分光光度计(Bechman Instruments,Fullerton,CA)上测量每种制备物的OD260值和OD280值,估计制备物内的DNA浓度和纯度。由于DP-1B编码区高度重复,难以直接扩增,因此通过标准方法合成引物NPTI II-F2(5′GCT,CGA,CGT,TGT,CAC,TGA,AG 3′)(SEQ ID NO:26)和NPT II-R2(5′TCG,TCC,AGA,TCA,TCC,TGA,TC 3′)(SEQ ID NO:27),用所述引物扩增NPT II基因的240bp区段。25μL PCR反应物内包括1μL DNA,2.5μL 10xPCR反应缓冲液(LifeTechnologies,Gaithersburg,MD),25mM每种dNTP,2mM MgCl2,10皮摩尔NPT II-F2的引物,10皮摩尔NPT II-R2的引物和1.25单位Taq DNA聚合酶(Life Technologies,Gaithersburg,MD)。反应在GeneAmp PCR系统960(Perkin-Elmer,Norwalk,CT)内进行30个循环,每循环94℃45秒钟,58℃45秒钟,72℃45秒钟,然后在包含溴化乙锭的琼脂糖电泳凝胶上进行分离。在UV光下显示结果。凝胶分析指出:所述T-DNA已经如所预期地整合入所有40株转基因拟南芥的基因组DNA中。图9C显示所述结果。因为对照的DNA样品是从携带NPT II基因而不携带DP-1B基因的pZBL1转基因植株中制备,所以通过PCR从所述样品扩增获得240bp NPT II片段。因此,在该测定中用来自野生型(WT)拟南芥的DNA样品作为阴性对照。证明转基因的遗传力
为测试转基因遗传力,选择包含pGY401、pGY402、pGY411和pGY412构建物的各两株转基因拟南芥植株。T2种子冷处理3天,然后在初级选择培养基萌发10天。将30株预期包含所述转基因的卡那霉素抗性健康T2幼苗转移到Metro Mix土壤,并在上文所述条件下培养。从pGY401和pGY402转化子抽苔植株的叶以及pGY411和pGY412转化子成熟植株的种子制备蛋白提取物。使用针对DP-1B蛋白高度保守肽序列的多克隆抗体(DP-1B Ab)进行的免疫印迹测定证明:DP-1B.8P蛋白和DP-1B.16P蛋白在所述转基因植株的T2后代中以组织特异性的方式产生和积累(图10A)。DP-1B.16P蛋白的更小肽片段也在402(92)、402(94)和412(41)的T2植株中以类似于T1亲本中观察到的模式积累。
还从这些T2后代的叶分离DNA。根据上文所述方法,对每个DNA样品进行240bp NPT II片段的PCR扩增。因为pZBL1转基因植株的对照DNA包含NPT II序列,所以使用来自野生型(WT)拟南芥的DNA样品作为阴性对照。所述PCR反应物随后在含溴化乙锭的琼脂糖凝胶上电泳。所述凝胶在UV光下观察(图10B),结果指出所有这些T2后代的基因组都仍然携带所述转基因。
在检查转基因表达的同时,分析这些T2植株的萌发和发育。所述T2植株与对照植株(pZBL1)在生长期间的比较显示:尽管T2植株表达转基因,但它们不存在表型异常。
总而言之,这些结果显示:使用构建物pGY401、pGY402、pGY411和pGY412引入拟南芥基因组的DP-1B基因在有性生殖中可遗传并且稳定。
                         实施例6
构建用于在大豆体细胞胚中表达的质粒,所述质粒包含编码蜘
         蛛棒络新妇蛛丝蛋白1类似物的合成基因
质粒pZBL102由DuPont Agricultural Products(Wilmington,DE19898)提供。该质粒用于制造在大豆体细胞胚中表达DP-1B蛋白的构建物。该基于pSP72(Promega,Madison,WI)的质粒包含由T7启动子指导的潮霉素B磷酸转移酶(HPT)基因(T7 Pro∷HPT∷T7 Ter)(编码细菌中潮霉素B抗性)以及表达盒35S Pro∷HPT∷NOS Ter(编码植物细胞中潮霉素B抗性),如图11A所示。由于所述DP-1B编码序列的高度重复特性,本实施例中的所有质粒都在STB II大肠杆菌细胞中产生。
为制造在大豆体细胞胚中表达DP-1B.8P蛋白的构建物,用NotI和Sal I消化质粒pZBL102。在琼脂糖凝胶上将所述线性化的载体与短Not I/Sal I片段分离,然后用QIAquick凝胶提取试剂盒纯化。使用同样方法,用Not I和Sal I消化质粒pGY213,分离包括种子特异性表达盒的4357碱基对DNA片段,所述种子特异性表达盒包括β-conglycinin Pro∷DP-1B.8P∷菜豆蛋白Pro。该DNA片段连接进所述线性化pZBL102的Not I和Sal I位点之间,其取向与35SPro∷HPT∷NOS Ter表达盒的取向相同。所述新构建物命名为pLS3。其结构显示于图12A。
构建用于在大豆体细胞胚中表达DP-1B.16P蛋白的质粒需要修饰的质粒pGY412。为此目的,用仅包括一个Sma I位点的短序列取代pGY412在Kpn I(1282)位点和EcoR I(1330)位点之间的DNA片段。然后用Sal I和Nco I消化该修饰的pGY412,分离包含所述DP-1B.16P编码区和菜豆蛋白终止子序列的DNA片段,将该片段连接进pGY213的Sal I和Nco I位点之间。因此,该片段取代所述DP-1B.8P编码区,产生质粒pGY220。图11B显示质粒pGY220的结构,该质粒包含一个由β-conglycinin Pro∷DP-1B.16P∷菜豆蛋白Ter组成的种子特异性表达盒。
用Not I和Sal I以相似方式消化质粒pGY220。分离包含一个种子特异性表达盒的6774碱基对DNA片段,所述种子特异性表达盒由β-conglycinin Pro∷DP-1B.16P∷菜豆蛋白Ter组成,将所述DNA片段连接进线性化pZBL102的Not I和Sal I位点之间。所述新质粒pLS4与pLS3基本相同,只是其包含DP-1B.16P编码区,而不是DP-1B.8P编码区。其结构显示于图12B。
                         实施例7
在通过粒子枪轰击转化的大豆体细胞胚大豆体细胞胚细胞中转
                    化和表达DP-1B基因
在转化大豆体细胞胚细胞时使用质粒pLS3和pLS4,以分别表达8聚体DP-1B蛋白和16聚体DP-1B蛋白。在转化前,在STB II大肠杆菌细胞中以大规模扩增和纯化这两种质粒。携带pLS3或pLS4的STB II细胞在500mL LB-潮霉素液体培养基(10g/L细菌蛋白胨,5g/L酵母提取物,5g/L NaCl,150mg/L潮霉素B)中于37℃培养过夜,然后离心收集。所述细胞重悬浮于6mL溶液I(25mM Tris pH7.5,10mM EDTA,15%蔗糖,2mg/mL溶菌酶),加入12mL溶液II(0.2M NaOH,1%SDS)裂解,然后加入7.5mL 3M NaAc,pH4.6中和。离心收集所述裂解物的上清,用50μg RNase A在37℃处理30分钟,用苯酚/氯仿萃取,然后用乙醇沉淀。所述DNA沉淀重悬浮于1mL H2O,然后与1mL 1.6M NaCl和2mL 13%PEG-800混合,再次沉淀。纯DNA用70%乙醇洗涤,然后重悬浮于H2O达到1μg/μL的终浓度。
应用粒子枪轰击(U.S.5,955,650),用质粒pLS3和pLS4转化大豆体细胞胚细胞Asgro 2872/821的两周悬浮培养物。在DuPontBiolistic PDS1000/HE仪器(氦气改进型)上进行轰击,膜破裂压力1100psi,室真空27-28in.Hg。每种构建物转化十个细胞平板,二次轰击。轰击后,细胞在SB172(4.6g/L Duchefa MS盐,1mL/L 1,000xB5维生素,10mg/L 2,4-D,60g/L蔗糖,667mg/L天冬酰胺,pH5.7)中温育11天,随后2个月在含50mg/L潮霉素B的SB172内选择转化子集落。选择六十个pLS3转化子集落和三十个pLS4转化子集落,按下面的三步方案顺序培养它们,使胚组织进一步成熟:(1)在SB166(34.6g/L Gibco/BRL MS盐,1mL/L 1,000xB5维生素,60g/L麦芽糖,750mg/L MgCl2六水合物,5g/L活性碳,2g/L脱乙酰吉兰糖胶,pH5.7)上培养1周;(2)在SB103(与SB166相同,只是不含活性碳)上培养3周;(3)在SB148(与SB103相同,只是用7g/L琼脂糖取代2g/L脱乙酰吉兰糖胶)上培养2周。在实验过程中,液体培养基和固体培养基内的组织培养物都在下述控制条件下维持:26℃,16:8小时日/夜光周期,光强度30-35μE/m2s。检查大豆体细胞胚中的DP-1B蛋白表达
用pLS3和pLS4转化成熟大豆体细胞胚块。每个块代表独立转化事件,显示潮霉素B抗性表型。因为据信整个轰击的质粒在大多数转化事件中会整合进胚细胞的染色体,所以在那些染色体中应该出现pLS3和pLS4的种子特异性DP-1B表达盒,并因此表达DP-1B蛋白。
为检查所述转基因大豆体细胞胚中的DP-1B蛋白表达,将约200mg pLS3和pLS4转基因胚组织置于生物粉碎机(FastPrep FP120,BIO101,Vista,CA)内在200μL蛋白提取缓冲液中研磨,从中制备蛋白提取物。离心收集上清,使用Bio-Rad蛋白测定试剂测定蛋白浓度。使用野生型大豆胚组织作为实验对照。根据在拟南芥转化部分描述的方法,这些蛋白提取物在蛋白免疫印迹测定中用于测定所述转基因大豆胚组织中DP-1B蛋白表达的质量和数量。
对于所述免疫印迹测定,通过SDS-PAGE从10μL胚蛋白提取物分离可溶性蛋白,转移到硝酸纤维素膜,然后用DP-1B Ab检测。由于所述抗体和所述胚蛋白之间的交叉反应,所述抗体从转化子和对照的蛋白提取物检测到许多非DP-1B蛋白。然而,结果仍然清晰地指出:65kD DP-1B.8P蛋白已经在七个pLS3胚转化子中积累到相当高的水平。在30个pLS4转化子的任何一个中没有积累可检测的127kD DP-1B.16P蛋白。此外,少数DP-1B.8P转基因大豆体细胞胚也积累受到DP-1B Ab识别的更小蛋白,这提示在转基因表达过程中可能有DNA重组或其它分子修饰。如以前所述,通过免疫印迹测定,用抗His(C-term)-HRP Ab探测,检查那七个pLS3胚转化子中DP-1B.8P的表达水平。结果在表3中总结。
                            表3
               转基因大豆胚中的DP-1B产率
                           产率范围(%)          平均产率(%)转基因    产物    检查的组  占总可溶      干重%    占总可溶  干重%
                 织     性蛋白%                性蛋白%pLS3    DP-1B.8P     胚     0.54-1.64   0.22-0.66    1.0       0.4pLS4    DP-1B.16P    胚        无           无       无        无
如表3所示,DP-1B.8P的表达水平占总可溶性大豆胚蛋白的0.54%到1.64%(约0.22%到0.66%干重),平均产率占总可溶性大豆胚蛋白的1%(约0.4%干重)。(作者注:假设40%干重是蛋白质,并且胚组织中所有蛋白可溶。)
为克服抗体-天然蛋白交叉反应,在免疫印迹测定前用Ni-NTA离心试剂盒(Qiagen,Valencia,CA)部分纯化转基因和野生型(对照)大豆体细胞胚组织的蛋白提取物。简要地说,从200mg胚组织获得的蛋白提取物加入400μL裂解缓冲液稀释,然后加载到预先平衡的Ni-NTA离心柱。所述柱在700xg离心2分钟,使提取物中的DP-1B蛋白结合到柱上,用600μL洗涤缓冲液洗涤两次,最后用200μL洗脱缓冲液洗脱。20μL部分纯化的蛋白提取物在SDS-PAGE上电泳,然后通过免疫印迹检查。用DP-1B Ab探测的测定证实:65kD DP-1B.8P蛋白在那7个选定的大豆体细胞胚pLS3转化子内积累。还证实:127kD DP-1B.16P蛋白在pLS4转基因胚中没有积累到可检测的水平。结果显示于图13A。用抗-His(C-term)-HRP探测的免疫印迹测定进一步证明:所有积累的DP-1B.8P都由全长的分子组成,这是因为所述抗体识别它们的N-末端6xHis标记(图13B)。此外,所述抗His(C-term)-HRP还识别所述胚蛋白提取物中少数更小的蛋白分子,如图13B右图所示。由于从野生型胚的蛋白提取物也检测到这些蛋白,因此它们一定是天然胚蛋白,而不是转基因的产物。确认转基因插入大豆体细胞胚的基因组
预期大多数在潮霉素B选择中存活的大豆体细胞胚集落是转基因胚,尽管其中的许多集落并不积累DP-1B蛋白。为进一步证明DP-1B.8P和DP-1B.16P转基因确实整合进胚染色体,使用DNeasyPlant Mini试剂盒(Qiagen,Valencia,CA)从那些胚组织和对照野生型胚制备DNA样品。根据生产厂家的指导,制备物使用100μL DNA溶液中的100mg胚组织。通过在Beckman DU640分光光度计上测量每种制备物的OD260值和OD280值,估计制备物内的DNA浓度和纯度。所述DNA样品如前所述进行PCR反应。使用引物5′conglycinin-F(5′CCC,GTC,AAA,CTG,CAT,GCC,AC 3′)(SEQ IDNO:28)和引物5′conglycinin-R(5′TAG,CCA,TGG,TTA,GTA,TAT,CTT 3′)(SEQ ID NO:29)扩增β-conglycinin启动子的160bp片段。在含溴化乙锭的琼脂糖凝胶上分离所述反应物,在UV光下显示结果。结果显示于图13C。图13C指出预期的DNA产物,并确认了DP-1B转基因的整合。
                          实施例8
                  从拟南芥纯化DP-1B蛋白 纯合植株选择和大规模培养
为获得大量起始材料,根据直接土壤生长选择纯合转基因植株。T1种子定义为从转化的花收集的种子。T1植株是从T1种子萌发的植株。T2种子从T1植株收集。当T2种子萌发时,所获得的植株称为T2植株。首先,如实施例5所述,从在叶组织中表达DP-1B.8P蛋白达到总可溶性蛋白9.2%的pGY401转基因拟南芥收集T2种子。由于拟南芥是自花受粉,因此杂合后代和纯合后代分别占T2种子收集物的50%和25%。使用前文所述方法,这些T2种子在初级选择培养基上萌发成为T2植株,其中十二株种植在Metro Mix土壤中培养直到成熟。从12株植株的每一株收获T3种子,分别在初级选择培养基上萌发。只有纯合T3种子才能在选择培养基上萌发成为T3植株而不显示分离。因此,从那些纯合T3植株收集T4种子,以便将来使用。
为进行大规模种植,在20×10英寸浅箱内Metro Mix土壤的顶层使上面制备的T4纯合种子萌发并生长,密度为每浅箱约1,000粒种子。为保证更大的莲座叶丛(rosette),植株种植在22℃控温温室内,自然光照10小时以内。抽苔前收获所述植株,用液氮处理,保存在-80℃。如上文所述,分别通过免疫印迹和PCR测定确认转基因植株中的DP-1B.8P转基因插入和蛋白合成。纯化DP-1B.8P蛋白
研制了DP-1B蛋白纯化方法。该方法利用SLP的特殊沉淀性质,将DP-1B蛋白与植物天然蛋白分离开,如下文所述:
(1)使用厨用搅拌机在5x体积冰冷蛋白提取缓冲液(50mM
   Tris.HCl pH8.0,12.5mM MgCl2,0.1mM EDTA,2mM DTT,
   5%甘油)内匀浆植物莲座叶丛。匀浆通过6层干酪包布过
   滤,然后在10,000xg于4℃离心10分钟。保存上清液为
   蛋白提取物。
(2)边搅拌蛋白提取物,边缓慢加入浓HCl,直到pH4.7。所
   述提取物在4℃保存30分钟,然后在10,000xg于4℃离心
   30分钟,去除蛋白沉淀。缓慢加入10N NaOH,将上清液
   的pH值调回8.0。所得溶液保存为pH4.7上清。
(3)所述pH4.7上清在60℃水浴热处理60分钟,然后在10,000
   xg于4℃离心30分钟,去除蛋白沉淀。上清通过一层20μm
   尼龙筛孔过滤并保存。所述上清称为“60℃上清”。
(4)在冰水浴内,边搅拌60℃上清,边缓慢加入(NH4)2SO4直到
   40%饱和度。该溶液在4℃保存过夜,然后在10,000xg于
   4℃离心30分钟。所述上清称为“(NH4)2SO4上清”并保存。
   重悬浮蛋白沉淀并对蛋白提取缓冲液透析,获得十五分之
   一原始体积的DP-1B.8P蛋白溶液。
为检查纯化过程中的总蛋白谱,对每个步骤的蛋白样品进行SDS-PAGE,样品包括20μL蛋白提取物(图14A,泳道1)、20μL pH4.7上清(图14A,泳道2)、20μL 60℃上清(图14A,泳道3)、10μL(NH4)2SO4沉淀重悬浮物(图14A,泳道4)和20μL(NH4)2SO4上清。凝胶用考马斯亮蓝染色溶液(0.25%考马斯亮蓝R-250,20%甲醇)染色过夜,然后在含7%乙酸和5%甲醇的溶液中脱色(图14A)。由于DP-1B蛋白独特的氨基酸组成,DP-1B蛋白不能通过考马斯亮蓝染色或其它常规染色方法进行观察。但图14A确实显示:该方法中的每一步都从所述提取物去除显著量的植物天然蛋白。在(NH4)2SO4沉淀组分中(图14A,泳道4),清除超过95%的植物天然蛋白。
为监测DP-1B蛋白纯化,进行同样的SDS-PAGE。按照上文描述的方法,将凝胶转移到硝酸纤维素膜,然后进行免疫印迹测定。使用DP-1B抗体作为第一抗体,抗兔IgG HRP作为第二抗体。图14B中的结果显示:在纯化过程中,64kD DP-1B.8P蛋白存在于所有检查组分,只是不存在于(NH4)2SO4上清。它在40%(NH4)2SO4蛋白沉淀的重悬浮物(图14B,泳道4)中异常富集。我们还检查pH6.7及60℃蛋白沉淀组分,没有检测到DP-1B.8P蛋白(数据未显示)。因此,DP-1B蛋白浓缩在(NH4)2SO4沉淀组分中。
总而言之,我们已经研制出简单的DP-1B纯化方法,该方法去除超过95%植物天然蛋白,同时浓缩DP-1B蛋白。由于在DP-1B蛋白的C末端附有6x组氨酸标记,因此使用Ni柱层析有可能进一步纯化所述蛋白到更高纯度。
                             序列表<110>E.I.du Pont de Nemours and Company<120>在植物中生产丝状蛋白<130>BC1014 PCT<140><141><150>60/206968<151>2000-05-25<160>29<170>Microsoft Office 97<210>1<211>651<212>PRT<213>蜘蛛棒络新妇(Nephila clavipes)<400>1Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly1               5                  10                  15Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala Gly Gln Gly Gly Tyr Gly
         20                  25                  30Gly Leu Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala
     35                  40                  45Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser
 50                  55                  60Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala65                   70                  75                  80Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
             85                  90                  95Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala
        100                 105                 110Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Asn
    115                 120                 125Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Ala Ala Ala Ala Ala Gly
130                 135                 140Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly145                 150                 155                 160Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
            165                 170                 175Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala
        180                 185                 190Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly
    195                 200                 205Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly
210                 215                 220Gly Ala Gly Gln Gly Gly Leu Gly Gly Gln Gly Ala Gly Gln Gly Ala225                 230                 235                 240Gly Ala Ser Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
            245                 250                 255Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Glu Gly Ala Gly Ala
        260                 265                 270Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
    275                 280                 285Gly Gly Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln
290                 295                 300Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala305                 310                 315                 320Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Gly Gln Gly Ala Gly Gln
            325                 330                 335Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly
        340                 345                 350Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly
    355                 360                 365Gln Gly Ala Gly Ala Val Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
370                 375                 380Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln385                 390                 395                 400Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Arg Gly
            405                 4l0                 415Tyr Gly Gly Leu Gly Asn Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly
        420                 425                 430Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
    435                 440                 445Gly Gly Tyr Gly Gly Leu Gly Asn Gln Gly Ala Gly Arg Gly Gly Gln
450                 455                 460Gly Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly465                 470                 475                 480Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala
            485                 490                 495Ala Ala Ala Ala Val Gly Ala Gly Gln Glu Gly Ile Arg Gly Gln Gly
        500                 505                 510Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ser Gly Arg
    5l5                 520                 525Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly
530                 535                 540Gly Ala Gly Gln Gly Gly Leu Gly Gly Gln Gly Ala Gly Gln Gly Ala545                 550                 555                 560Gly Ala Ala Ala Ala Ala Ala Gly Gly Val Arg Gln Gly Gly Tyr Gly
            565                 570                 575Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala
        580                 585                 590Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
    595                 600                 605Gly Gly Gln Gly Val Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly
6l0                 615                 620Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Val Gly625                 630                 635                 640Ser Gly Ala Ser Ala Ala Ser Ala Ala Ala Ala
            645                 650<210>2<211>6<212>PRT<213>人工序列<220><223>人工序列描述:SLP重复序列<400>2Ser Gly Ala Gly Ala Gly1               5<210>3<211>6<212>PRT<213>人工序列<220><223>人工序列描述:SLP重复序列<400>3Gly Ala Gly Ala Gly Ser1               5<210>4<211>59<212>PRT<213>人工序列<220><223>人工序列描述:SLP重复序列<400> 4Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala1               5                  10                  15Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala
         20                  25                  30Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser
     35                  40                  45Gly Ala Gly Ala Gly Ser Gly Ala Ala Gly Tyr
 50                  55<210>5<211>9<212>PRT<213>人工序列<220><223>人工序列描述:SLP重复序列<400>5Ser Gly Gly Ala Gly Gly Ala Gly Gly1               5<210>6<211>10<212>PRT<213>人工序列<220><223>人工序列描述:SLP重复序列<400>6Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr1               5                  10<210>7<211>6<212>PRT<213>人工序列<220><223>人工序列描述:SLP重复序列<400>7Gly Ala Gly Ala Gly Tyr1               5<210>8<211>34<212>PRT<213>人工序列<220><223>人工序列描述:SLP重复序列<220><221>不确定<222>(11)<223>X=S,G或N<400>8Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Xaa Gln Gly Ala Gly Arg1               5                  10                  15Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala
         20                  25                  30Gly Gly<210>9<211>15<212>PRT<213>人工序列<220><223>人工序列描述:SLP重复序列<400>9Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Gly Gly1               5                  10                  15<210>10<211>101<212>PRT<213>人工序列<220><223>人工序列描述:DP-1A单体<400>10Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala1               5                  10                  15Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala
         20                  25                  30Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala
     35                  40                  45Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly
 50                  55                  60Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly65                   70                  75                  80Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly
             85                  90                  95Gly Leu Gly Ser Gln
        100<210>11<211>101<212>PRT<213>人工序列<220><223>人工序列描述:DP-1B单体<400>11Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly1               5                  10                  15Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
         20                  25                  30Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln
     35                  40                  45Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly
 50                  55                  60Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala65                   70                  75                  80Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
             85                  90                  95Gly Leu Gly Ser Gln
        100<210>12<211>29<212>PRT<213>人工序列<220><223>人工序列描述:DP-1B 8聚体<220><221>不确定<222>(12)<223>X=S,G或N<400>12Ala Cys Gly Gln Gly Gly Tyr Gly Gly Leu Gly Xaa Gln Gly Ala Gly1               5                  10                  15Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Gly Gly
         20                  25<210>13<211>809<212>PRT<213>人工序列<220><223>人工序列描述:DP-lB 16聚体<400>13Arg Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln1               5                  10                  15Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala
         20                  25                  30Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly
     35                  40                  45Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly
 50                  55                  60Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly65                  70                  75                  80Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly
             85                  90                  95Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly
        100                 105                 110Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly
    115                 120                 125Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly
130                 135                 140Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala145                 150                 155                 160Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
            165                 170                 175Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly
        180                 185                 190Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly
    195                 200                 205Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly
210                 215                 220Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly225                 230                 235                 240Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly
            245                 250                 255Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly
        260                 265                 270Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala
    275                 280                 285Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly
290                 295                 300Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly305                 310                 315                 320Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala
            325                 330                 335Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala
        340                 345                 350Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
    355                 360                 365Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln
370                 375                 380Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly385                 390                 395                 400Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly
            405                 410                 415Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala
        420                 425                 430Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu
    435                  440                  445Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
450                 455                 460Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala465                 470                 475                 480Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly
            485                 490                 495Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln
        500                 505                 510Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu
    515                 520                 525Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala
530                 535                 540Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala545                 550                 555                 560Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
            565                 570                 575Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala
        580                 585                 590Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser
    595                 600                 605Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala
610                 6l5                 620Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala625                 630                 635                 640Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly
            645                 650                 655Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly
        660                 665                 670Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly
    675                 680                 685Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr
690                 695                 700Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu705                 710                 715                 720Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly
            725                 730                 735Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly
        740                 745                 750Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly
    755                 760                 765Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly
770                 775                 780Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala785                 790                 795                 800Gly Gln Gly Gly Tyr Gly Gly Leu Gly
            805<210>14<211>1617<212>PRT<213>人工序列<220><223>人工序列描述:引物<400>14Arg Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln1               5                  10                  15Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala
         20                  25                  30Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly
     35                  40                  45Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly
 50                  55                  60Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly65                   70                  75                  80Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly
             85                  90                  95Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly
        100                 105                 110Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly
    115                 120                 125Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly
130                 135                 140Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala145                 150                 155                 160Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
            165                 170                 175Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly
        180                 185                 190Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly
    195                 200                 205Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly
210                 215                 220Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly225                 230                 235                 240Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly
            245                 250                 255Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly
        260                 265                 270Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala
    275                 280                 285Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly
290                 295                 300Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly305                 310                 315                 320Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala
            325                 330                 335Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala
        340                 345                 350Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
    355                 360                 365Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln
370                 375                 380Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly385                 390                 395                 400Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly
            405                 410                 415Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala
        420                 425                 430Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu
    435                 440                 445Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
450                 455                 460Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala465                 470                 475                 480Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly
            485                 490                 495Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln
        500                 505                 5l0Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu
    515                 520                 525Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala
530                 535                 540Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala545                 550                 555                 560Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
            565                 570                 575Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala
        580                 585                 590Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser
    595                 600                 605Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala
610                 615                 620Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala625                 630                 635                 640Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly
            645                 650                 655Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly
        660                 665                 670Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly
    675                 680                 685Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr
690                 695                 700Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu705                 710                 715                 720Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly
            725                 730                 735Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly
        740                 745                 750Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly
    755                 760                 765Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly
770                 775                 780Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala785                 790                 795                 800Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly
            805                 810                 815Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly
        820                 825                 830Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly
    835                 840                 845Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala
850                 855                 860Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly865                 870                 875                 880Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala
            885                 890                 895Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln
        900                 905                 910Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly
    915                 920                 925Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
930                 935                 940Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln945                 950                 955                 960Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly
            965                 970                 975Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala
        980                 985                 990Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
    995                1000                1005Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly1010                1015                1020Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala1025               1030                1035                1040Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser
           1045                1050                1055Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly
       1060                1065                1070Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg
   1075                1080                1085Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly1090                1095                1100Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly1105               1110                1115                1120Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly
           1125                1130                1135Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
       1140                1145                1150Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala
   1155                1160                1165Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser1170                1175                1180Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala1185               1190                1195                1200Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
           1205                1210                1215Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg
       1220                1225                1230Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala
   1235                1240                1245Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly1250                1255                1260Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr1265               1270                1275                1280Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly
           1285                1290                1295Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly
       1300                1305                1310Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser
   1315                1320                1325Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala1330                1335                1340Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln1345               1350                1355                1360Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala
           1365                1370                1375Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly
       1380                1385                1390Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
   1395                1400                1405Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr1410                1415                1420Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln1425               1430                1435                1440Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly
           1445                1450                1455Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala
       1460                1465                1470Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln
   1475                1480                1485Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala1490                1495                1500Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala1505               1510                1515                1520Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly
           1525                1530                1535Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly
       1540                1545                1550Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala
   1555                1560                1565Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly1570                1575                1580Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala1585               1590                1595                1600Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
           1605                1610                1615Gly<210>15<211>50<212>DNA<213>人工序列<220><223>人工序列描述:引物<400>15gatctccatg gctagatcta gaggatccca tcaccatcac catcactaag          50<210>16<211>50<212>DNA<213>人工序列<220><223>人工序列描述:引物<400>16aattcttagt gatggtgatg gtgatgggat cctctagatc tagccatgga          50<210>17<211>6<212>PRT<213>人工序列<220><223>人工序列描述:SPL重复<400>17Ala Arg Ser Arg Gly Ser1               5<210>18<211>50<212>DNA<213>人工序列<220><223>人工序列描述:接头序列<400>18gatctccatg gctagatcta gaggatccca tcaccatcac catcactaag          50<210>19<211>50<212>DNA<213>人工序列<220><223>人工序列描述:接头序列<400>19aggtaccgat ctagatctcc tagggtagtg gtagtggtag tgattcttaa          50<210>20<211>13<212>PRT<213>人工序列<220><223>人工序列描述:接头肽<400>20Met Ala Arg Ser Arg Gly Ser His His His His His His1               5                  10<210>21<211>2457<212>DNA<213>人工序列<220><223>人工序列描述:带有His标记的DP-lB 8聚体编码区<400>21atggctagat ctcaaggagc cggtcaaggt ggttacggag gtctgggatc tcaaggtgct   60ggacgtggtg gtcttggtgg tcagggtgcc ggtgccgccg ctgccgccgc cgctggtggt  120gctggacaag gtggtttggg atctcaggga gctggtcaag gtgccggtgc tgctgccgct  180gctgccggag gtgccggtca gggtggatac ggtggacttg gatctcaggg tgctggtaga  240ggtggacaag gtgccggagc tgccgctgcc gctgccggtg gtgctggtca aggaggttac  300ggtggtcttg gatctcaagg agccggtcaa ggtggttacg gaggtctggg atctcaaggt  360gctggacgtg gtggtcttgg tggtcagggt gccggtgccg ccgctgccgc cgccgctggt  420ggtgctggac aaggtggttt gggatctcag ggagctggtc aaggtgccgg tgctgctgcc  480gctgctgccg gaggtgccgg tcagggtgga tacggtggac ttggatctca gggtgctggt  540agaggtggac aaggtgccgg agctgccgct gccgctgccg gtggtgctgg tcaaggaggt  600tacggtggtc ttggatctca aggagccggt caaggtggtt acggaggtct gggatctcaa  660ggtgctggac gtggtggtct tggtggtcag ggtgccggtg ccgccgctgc cgccgccgct  720ggtggtgctg gacaaggtgg tttgggatct cagggagctg gtcaaggtgc cggtgctgct  780gccgctgctg ccggaggtgc cggtcagggt ggatacggtg gacttggatc tcagggtgct  840ggtagaggtg gacaaggtgc cggagctgcc gctgccgctg ccggtggtgc tggtcaagga  900ggttacggtg gtcttggatc tcaaggagcc ggtcaaggtg gttacggagg tctgggatct  960caaggtgctg gacgtggtgg tcttggtggt cagggtgccg gtgccgccgc tgccgccgcc 1020gctggtggtg ctggacaagg tggtttggga tctcagggag ctggtcaagg tgccggtgct 1080gctgccgctg ctgccggagg tgccggtcag ggtggatacg gtggacttgg atctcagggt 1140gctggtagag gtggacaagg tgccggagct gccgctgccg ctgccggtgg tgctggtcaa 1200ggaggttacg gtggtcttgg atctcaagga gccggtcaag gtggttacgg aggtctggga 1260tctcaaggtg ctggacgtgg tggtcttggt ggtcagggtg ccggtgccgc cgctgccgcc 1320gccgctggtg gtgctggaca aggtggtttg ggatctcagg gagctggtca aggtgccggt 1380gctgctgccg ctgctgccgg aggtgccggt cagggtggat acggtggact tggatctcag 1440ggtgctggta gaggtggaca aggtgccgga gctgccgctg ccgctgccgg tggtgctggt 1500caaggaggtt acggtggtct tggatctcaa ggagccggtc aaggtggtta cggaggtctg 1560ggatctcaag gtgctggacg tggtggtctt ggtggtcagg gtgccggtgc cgccgctgcc 1620gccgccgctg gtggtgctgg acaaggtggt ttgggatctc agggagctgg tcaaggtgcc 1680ggtgctgctg ccgctgctgc cggaggtgcc ggtcagggtg gatacggtgg acttggatct 1740cagggtgctg gtagaggtgg acaaggtgcc ggagctgccg ctgccgctgc cggtggtgct 1800ggtcaaggag gttacggtgg tcttggatct caaggagccg gtcaaggtgg ttacggaggt 1860ctgggatctc aaggtgctgg acgtggtggt cttggtggtc agggtgccgg tgccgccgct 1920gccgccgccg ctggtggtgc tggacaaggt ggtttgggat ctcagggagc tggtcaaggt 1980gccggtgctg ctgccgctgc tgccggaggt gccggtcagg gtggatacgg tggacttgga 2040tctcagggtg ctggtagagg tggacaaggt gccggagctg ccgctgccgc tgccggtggt 2100gctggtcaag gaggttacgg tggtcttgga tctcaaggag ccggtcaagg tggttacgga 2160ggtctgggat ctcaaggtgc tggacgtggt ggtcttggtg gtcagggtgc cggtgccgcc 2220gctgccgccg ccgctggtgg tgctggacaa ggtggtttgg gatctcaggg agctggtcaa 2280ggtgccggtg ctgctgccgc tgctgccgga ggtgccggtc agggtggata cggtggactt 2340ggatctcagg gtgctggtag aggtggacaa ggtgccggag ctgccgctgc cgctgccggt 2400ggtgctggtc aaggaggtta cggtggtctt ggatcccatc accatcacca tcactaa    2457<210>22<211>818<212>PRT<213>人工序列<220><223>人工序列描述:带有His标记的DP-1B 8聚体<400>22Met Ala Arg Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly1               5                  10                  15Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala
         20                  25                  30Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser
     35                  40                  45Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly
 50                  55                  60Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg65                   70                  75                  80Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly
             85                  90                  95Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly
        100                 105                 110Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly
    115                 120                 125Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
130                 135                 140Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala145                 150                 155                 160Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser
            165                 170                 175Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala
        180                 185                 190Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
    195                 200                 205Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg
2l0                 2l5                 220Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala225                 230                 235                 240Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly
            245                 250                 255Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr
        260                 265                 270Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly
    275                 280                 285Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly
290                 295                 300Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser305                 310                 315                 320Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala
            325                 330                 335Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln
        340                 345                 350Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala
    355                 360                 365Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly
370                 375                 380Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln385                 390                 395                 400Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr
            405                 410                 415Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln
        420                 425                 430Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly
    435                 440                 445Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala
450                 455                 460Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln465                 470                 475                 480Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
            485                 490                 495Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala
        500                 505                 510Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly
    515                 520                 525Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly
530                 535                 540Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala545                 550                 555                 560Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
            565                 570                 575Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala
        580                 585                 590Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
    595                 600                 605Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln
610                 615                 620Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala625                 630                 635                 640Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly
            645                 650                 655Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly
        660                 665                 670Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly
    675                 680                 685Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly
690                 695                 700Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly705                 710                 715                 720Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly
            725                 730                 735Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly
        740                 745                 750Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala
    755                 760                 765Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
770                 775                 780Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly785                 790                 795                 800Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser His His His His
            805                 810                 815His His<210>23<211>4881<212>DNA<213>人工序列<220><223>人工序列描述:带有His标记的DP-1B 16聚体编码区<400>23atggctagat ctcaaggagc cggtcaaggt ggttacggag gtctgggatc tcaaggtgct   60ggacgtggtg gtcttggtgg tcagggtgcc ggtgccgccg ctgccgccgc cgctggtggt  120gctggacaag gtggtttggg atctcaggga gctggtcaag gtgccggtgc tgctgccgct  180gctgccggag gtgccggtca gggtggatac ggtggacttg gatctcaggg tgctggtaga  240ggtggacaag gtgccggagc tgccgctgcc gctgccggtg gtgctggtca aggaggttac  300ggtggtcttg gatctcaagg agccggtcaa ggtggttacg gaggtctggg atctcaaggt  360gctggacgtg gtggtcttgg tggtcagggt gccggtgccg ccgctgccgc cgccgctggt  420ggtgctggac aaggtggttt gggatctcag ggagctggtc aaggtgccgg tgctgctgcc  480gctgctgccg gaggtgccgg tcagggtgga tacggtggac ttggatctca gggtgctggt  540agaggtggac aaggtgccgg agctgccgct gccgctgccg gtggtgctgg tcaaggaggt  600tacggtggtc ttggatctca aggagccggt caaggtggtt acggaggtct gggatctcaa  660ggtgctggac gtggtggtct tggtggtcag ggtgccggtg ccgccgctgc cgccgccgct  720ggtggtgctg gacaaggtgg tttgggatct cagggagctg gtcaaggtgc cggtgctgct  780gccgctgctg ccggaggtgc cggtcagggt ggatacggtg gacttggatc tcagggtgct  840ggtagaggtg gacaaggtgc cggagctgcc gctgccgctg ccggtggtgc tggtcaagga  900ggttacggtg gtcttggatc tcaaggagcc ggtcaaggtg gttacggagg tctgggatct  960caaggtgctg gacgtggtgg tcttggtggt cagggtgccg gtgccgccgc tgccgccgcc 1020gctggtggtg ctggacaagg tggtttggga tctcagggag ctggtcaagg tgccggtgct 1080gctgccgctg ctgccggagg tgccggtcag ggtggatacg gtggacttgg atctcagggt 1140gctggtagag gtggacaagg tgccggagct gccgctgccg ctgccggtgg tgctggtcaa 1200ggaggttacg gtggtcttgg atctcaagga gccggtcaag gtggttacgg aggtctggga 1260tctcaaggtg ctggacgtgg tggtcttggt ggtcagggtg ccggtgccgc cgctgccgcc 1320gccgctggtg gtgctggaca aggtggtttg ggatctcagg gagctggtca aggtgccggt 1380gctgctgccg ctgctgccgg aggtgccggt cagggtggat acggtggact tggatctcag 1440ggtgctggta gaggtggaca aggtgccgga gctgccgctg ccgctgccgg tggtgctggt 1500caaggaggtt acggtggtct tggatctcaa ggagccggtc aaggtggtta cggaggtctg 1560ggatctcaag gtgctggacg tggtggtctt ggtggtcagg gtgccggtgc cgccgctgcc 1620gccgccgctg gtggtgctgg acaaggtggt ttgggatctc agggagctgg tcaaggtgcc 1680ggtgctgctg ccgctgctgc cggaggtgcc ggtcagggtg gatacggtgg acttggatct 1740cagggtgctg gtagaggtgg acaaggtgcc ggagctgccg ctgccgctgc cggtggtgct 1800ggtcaaggag gttacggtgg tcttggatct caaggagccg gtcaaggtgg ttacggaggt 1860ctgggatctc aaggtgctgg acgtggtggt cttggtggtc agggtgccgg tgccgccgct 1920gccgccgccg ctggtggtgc tggacaaggt ggtttgggat ctcagggagc tggtcaaggt 1980gccggtgctg ctgccgctgc tgccggaggt gccggtcagg gtggatacgg tggacttgga 2040tctcagggtg ctggtagagg tggacaaggt gccggagctg ccgctgccgc tgccggtggt 2100gctggtcaag gaggttacgg tggtcttgga tctcaaggag ccggtcaagg tggttacgga 2160ggtctgggat ctcaaggtgc tggacgtggt ggtcttggtg gtcagggtgc cggtgccgcc 2220gctgccgccg ccgctggtgg tgctggacaa ggtggtttgg gatctcaggg agctggtcaa 2280ggtgccggtg ctgctgccgc tgctgccgga ggtgccggtc agggtggata cggtggactt 2340ggatctcagg gtgctggtag aggtggacaa ggtgccggag ctgccgctgc cgctgccggt 2400ggtgctggtc aaggaggtta cggtggtctt ggatctcaag gagccggtca aggtggttac 2460ggaggtctgg gatctcaagg tgctggacgt ggtggtcttg gtggtcaggg tgccggtgcc 2520gccgctgccg ccgccgctgg tggtgctgga caaggtggtt tgggatctca gggagctggt 2580caaggtgccg gtgctgctgc cgctgctgcc ggaggtgccg gtcagggtgg atacggtgga 2640cttggatctc agggtgctgg tagaggtgga caaggtgccg gagctgccgc tgccgctgcc 2700ggtggtgctg gtcaaggagg ttacggtggt cttggatctc aaggagccgg tcaaggtggt 2760tacggaggtc tgggatctca aggtgctgga cgtggtggtc ttggtggtca gggtgccggt 2820gccgccgctg ccgccgccgc tggtggtgct ggacaaggtg gtttgggatc tcagggagct 2880ggtcaaggtg ccggtgctgc tgccgctgct gccggaggtg ccggtcaggg tggatacggt 2940ggacttggat ctcagggtgc tggtagaggt ggacaaggtg ccggagctgc cgctgccgct 3000gccggtggtg ctggtcaagg aggttacggt ggtcttggat ctcaaggagc cggtcaaggt 3060ggttacggag gtctgggatc tcaaggtgct ggacgtggtg gtcttggtgg tcagggtgcc 3120ggtgccgccg ctgccgccgc cgctggtggt gctggacaag gtggtttggg atctcaggga 3180gctggtcaag gtgccggtgc tgctgccgct gctgccggag gtgccggtca gggtggatac 3240ggtggacttg gatctcaggg tgctggtaga ggtggacaag gtgccggagc tgccgctgcc 3300gctgccggtg gtgctggtca aggaggttac ggtggtcttg gatctcaagg agccggtcaa 3360ggtggttacg gaggtctggg atctcaaggt gctggacgtg gtggtcttgg tggtcagggt 3420gccggtgccg ccgctgccgc cgccgctggt ggtgctggac aaggtggttt gggatctcag 3480ggagctggtc aaggtgccgg tgctgctgcc gctgctgccg gaggtgccgg tcagggtgga 3540tacggtggac ttggatctca gggtgctggt agaggtggac aaggtgccgg agctgccgct 3600gccgctgccg gtggtgctgg tcaaggaggt tacggtggtc ttggatctca aggagccggt 3660caaggtggtt acggaggtct gggatctcaa ggtgctggac gtggtggtct tggtggtcag 3720ggtgccggtg ccgccgctgc cgccgccgct ggtggtgctg gacaaggtgg tttgggatct 3780cagggagctg gtcaaggtgc cggtgctgct gccgctgctg ccggaggtgc cggtcagggt 3840ggatacggtg gacttggatc tcagggtgct ggtagaggtg gacaaggtgc cggagctgcc 3900gctgccgctg ccggtggtgc tggtcaagga ggttacggtg gtcttggatc tcaaggagcc 3960ggtcaaggtg gttacggagg tctgggatct caaggtgctg gacgtggtgg tcttggtggt 4020cagggtgccg gtgccgccgc tgccgccgcc gctggtggtg ctggacaagg tggtttggga 4080tctcagggag ctggtcaagg tgccggtgct gctgccgctg ctgccggagg tgccggtcag 4140ggtggatacg gtggacttgg atctcagggt gctggtagag gtggacaagg tgccggagct 4200gccgctgccg ctgccggtgg tgctggtcaa ggaggttacg gtggtcttgg atctcaagga 4260gccggtcaag gtggttacgg aggtctggga tctcaaggtg ctggacgtgg tggtcttggt 4320ggtcagggtg ccggtgccgc cgctgccgcc gccgctggtg gtgctggaca aggtggtttg 4380ggatctcagg gagctggtca aggtgccggt gctgctgccg ctgctgccgg aggtgccggt 4440cagggtggat acggtggact tggatctcag ggtgctggta gaggtggaca aggtgccgga 4500gctgccgctg ccgctgccgg tggtgctggt caaggaggtt acggtggtct tggatctcaa 4560ggagccggtc aaggtggtta cggaggtctg ggatctcaag gtgctggacg tggtggtctt 4620ggtggtcagg gtgccggtgc cgccgctgcc gccgccgctg gtggtgctgg acaaggtggt 4680ttgggatctc agggagctgg tcaaggtgcc ggtgctgctg ccgctgctgc cggaggtgcc 4740ggtcagggtg gatacggtgg acttggatct cagggtgctg gtagaggtgg acaaggtgcc 4800ggagctgccg ctgccgctgc cggtggtgct ggtcaaggag gttacggtgg tcttggatcc 4860catcaccatc accatcacta a                                           4881<210>24<211>1626<212>PRT<213>人工序列<220><223>人工序列描述:带有His标记的DP-1B 16聚体<400>24Met Ala Arg Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly1               5                  10                  15Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala
         20                  25                  30Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser
     35                  40                  45Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly
 50                  55                  60Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg65                  70                  75                  80Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly
             85                  90                  95Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly
        100                 105                 110Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly
    115                 120                 125Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
130                 135                 140Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala145                 150                 155                 160Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser
            165                 170                 175Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala
        180                 185                 190Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
    195                 200                 205Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg
210                 215                 220Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala225                 230                 235                 240Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly
            245                 250                 255Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr
        260                 265                 270Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly
    275                 280                 285Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly
290                 295                 300Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser305                 310                 315                 320Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala
            325                 330                 335Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln
        340                 345                 350Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala
    355                 360                 365Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly
370                 375                 380Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln385                 390                 395                 400Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr
            405                 410                 415Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln
        420                 425                 430Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly
    435                 440                 445Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala
450                 455                 460Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln465                 470                 475                 480Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
            485                 490                 495Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala
        500                 505                 510Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly
    515                 520                 525Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly
530                 535                 540Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala545                 550                 555                 560Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
            565                 570                 575Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala
        580                 585                 590Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
    595                 600                 605Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln
610                 615                 620Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala625                 630                 635                 640Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly
            645                 650                 655Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly
        660                 665                 670Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly
    675                 680                 685Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly
690                 695                 700Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly705                 710                 715                 720Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly
            725                 730                 735Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly
        740                 745                 750Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala
    755                 760                 765Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
770                 775                 780Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly785                 790                 795                 800Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly
            805                 810                 815Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly
        820                 825                 830Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly
    835                 840                 845Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly
850                 855                 860Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly865                 870                 875                 880Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala
            885                 890                 895Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly
        900                 905                 910Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
    915                 920                 925Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala
930                 935                 940Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala945                 950                 955                 960Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
            965                 970                 975Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln
        980                 985                 990Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly
    995                1000                1005Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly1010                1015                1020Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala1025               1030                1035                1040Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu
           1045                1050                1055Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
       1060                1065                1070Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala
   1075                1080                1085Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly1090                1095                1100Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln1105               1110                1115                1120Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu
           1125                1130                1135Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala
       1140                1145                1150Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala
   1155                1160                1165Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu1170                1175                1180Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala1185               1190                1195                1200Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser
           1205                1210                1215Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala
       1220                1225                1230Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala
   1235                1240                1245Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly1250                1255                1260Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly1265               1270                1275                1280Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly
           1285                1290                1295Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr
       1300                1305                1310Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
   1315                1320                1325Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly1330                1335                1340Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly1345               1350                1355                1360Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly
           1365                1370                1375Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly
       1380                1385                1390Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala
   1395                1400                1405Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly1410                1415                1420Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Leu Gly1425               1430                1435                1440Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly
           1445                1450                1455Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala
       1460                1465                1470Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly
   1475                1480                1485Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala1490                1495                1500Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln1505               1510                1515                1520Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly
           1525                1530                1535Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
       1540                1545                1550Ala Gly Gly Ala Gly Gln Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln
   1555                1560                1565Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly1570                1575                1580Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Arg Gly Gly Gln Gly Ala1585               1590                1595                1600Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
           1605                1610                1615Gly Leu Gly Ser His His His His His His
       1620                1625<210>25<211>19<212>PRT<213>人工序列<220><223>人工序列描述:DP-1B免疫原性区<400>25Cys Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gly Gly Ala1               5                  10                  15Gly Arg Gly<210>26<211>20<212>DNA<213>人工序列<220><223>人工序列描述:引物<400>26gctcgacgtt gtcactgaag                                             20<210>27<211>20<212>DNA<213>人工序列<220><223>人工序列描述:引物<400>27tcgtccagat catcctgatc                                             20<210>28<211>20<212>DNA<213>人工序列<220><223>人工序列描述:引物<400>28cccgtcaaac tgcatgccac                                             20<210>29<211>21<212>DNA<213>人工序列<220><223>人工序列描述:引物<400>29tagccatggt tagtatatct t                                           21

Claims (21)

1.一种在绿色植物中生产丝状蛋白的方法,该方法包括:
a)提供包含SLP表达盒的绿色植物,所述SLP表达盒具有下面的结构:
                       P-SLP-T
其中:P是一种适合驱动丝状蛋白基因表达的启动子;
SLP是一种编码成熟丝状蛋白的转基因;T是一种5′终止子;
其中P、SLP和T相互之间有效连接,以便所述表达盒的表达使得翻译所述丝状蛋白;
b)在表达所述转基因以及产生所述丝状蛋白的条件下,培养所述绿色植物;
c)任选回收所述丝状蛋白。
2.依照权利要求1的方法,其中所述启动子选自植物组成型启动子和植物组织特异性启动子。
3.依照权利要求2的方法,其中所述组成型启动子选自CaMV35S启动子、胭脂氨酸合酶启动子、章鱼氨酸合酶启动子、核酮糖-1,5-二磷酸羧化酶启动子、Adhl型pEmu、Actl、SAM合酶启动子和Ubi启动子以及叶绿素a/b结合蛋白启动子。
4.依照权利要求2的方法,其中所述组织特异性启动子是从编码下列蛋白的基因分离得到的启动子:napin、cruciferin、β-conglycinin、菜豆蛋白、玉米醇溶蛋白、油质蛋白、酰基载体蛋白、硬脂酰ACP去饱和酶、脂肪酸去饱和酶、大豆球蛋白、Bce4、豌豆球蛋白和patatin。
5.依照权利要求1的方法,其中所述转基因表达一种丝状蛋白,所述丝状蛋白从家蚕(Bombyx mori)或蜘蛛棒络新妇(Nephila clavipes)产生的丝获得。
6.依照权利要求1的方法,其中所述丝状蛋白具有以下通式:
[(A)n-(E)q-(S)q-(X)p-(E)q-(S)q]i
其中:
A或E是约10-25个氨基酸的不同非晶体软区段,包含至少55%Gly;
S是约6-12个氨基酸的半晶体区段,包含至少33%Ala和50%Gly;
X是约6-12个氨基酸的晶体硬区段,包含至少33%Ala和50%Gly;
其中
n=2,4,8,16,32,64或128;
q=0,1,2,4,8,16,32,64或128;
p=2,4,8,16,32,64或128;
i=1-128;而
其中p≥n或q。
7.权利要求6的丝状蛋白,所述丝状蛋白具有选自以下的组成结构式:[(A)4-(X)8]8、[(A)4-(X)8-(S)]8、[(A)4-(X)8-(E)]8、[(A)8-(X)8]8、[(A)4-(S)-(X)8]8、[(A)4-(S)2-(X)8]8、[(A)4-(E)-(X)8-(E)]8、[(A)4-(E)-(X)8]8、[(A)4-(S)-(X)8-(E)]8和[(A)4-(S)2-(X)8-(E)]8
8.权利要求6的丝状蛋白,其中:
A=SGGAGGAGG;
E=GPGQQGPGGY;
S=GAGAGY;
X=SGAGAG。
9.权利要求6的全长丝状蛋白,其中所述蛋白是具有下面通式的蜘蛛丝变体:
[ACGQGGYGGLGXQGAGRGGLGGQGAGAnGG]z
其中X=S、G或N;n=0-7,z=1-75,其中z值决定所述变体蛋白中重复数,其中所述通式包括选自以下的变化:
(a)当n=0时,缺失包含AGRGGLGGQGAGAnGG的序列;
(b)n值限定的非聚丙氨酸序列缺失包含整数性多个三连续残基;
(c)在任何重复内缺失GYG都在同一重复内缺失GRG;
(d)缺失n=0的第一个重复时,第一个重复之前有n=6的第二个重复;
其中所述全长蛋白由一种基因或多种基因编码,所述基因对于蜘蛛棒络新妇基因组不是内源基因。
10.依照权利要求1的方法,其中所述丝状蛋白以约0.1%到约9.2%的水平表达。
11.依照权利要求1的方法,其中所述丝状蛋白在叶组织和种子组织中表达。
12.依照权利要求1的方法,其中所述绿色植物是单子叶植物。
13.依照权利要求12的方法,其中所述绿色植物选自玉米、小麦、大麦、燕麦、高梁、水稻、黑麦、草和香蕉(banna)。
14.依照权利要求1的方法,其中所述绿色植物是双子叶植物。
15.依照权利要求12的方法,其中所述绿色植物选自大豆、油菜籽、向日葵、棉花、烟草、苜蓿、拟南芥(Arabidopsis)、甜菜、甘蔗、canola、小米、菜豆、豌豆、亚麻和牧草。
16.一种表达丝状蛋白的绿色植物,所述丝状蛋白具有以下通式结构:
[(A)n-(E)q-(S)q-(X)p-(E)q-(S)q]i
其中:
A或E是约10-25个氨基酸的不同非晶体软区段,包含至少55%Gly;
S是约6-12个氨基酸的半晶体区段,包含至少33%Ala和50%Gly;
X是约6-12个氨基酸的晶体硬区段,包含至少33%Ala和50%Gly;
其中
n=2,4,8,16,32,64,128;
q=0,1,2,4,8,16,32,64,128;
p=2,4,8,16,32,64,128;
i=1-128;而
其中p≥n或q。
17.权利要求16的绿色植物,其中所述丝状蛋白具有选自以下的通式结构:[(A)4-(X)8]8、[(A)4-(X)8-(S)]8、[(A)4-(X)8-(E)]8、[(A)8-(X)8]8、[(A)4-(S)-(X)8]8、[(A)4-(S)2-(X)8]8、[(A)4-(E)-(X)8-(E)]8、[(A)4-(E)-(X)8]8、[(A)4-(S)-(X)8-(E)]8和[(A)4-(S)2-(X)8-(E)]8
18.权利要求17的绿色植物,其中:
A=SGGAGGAGG;
E=GPGQQGPGGY;
S=GAGAGY;
X=SGAGAG。
19.权利要求18的绿色植物,其中所述丝状蛋白是具有以下通式的蜘蛛丝变体:
[ACGQGGYGGLGXQGAGRGGLGGQGAGAnGG]z
其中X=S、G或N;n=0-7,z=1-75,其中z值决定所述变体蛋白中的重复数,其中所述通式包括选自以下的变化:
(a)当n=0时,缺失包含AGRGGLGGQGAGAnGG的序列;
(b)n值限定的非聚丙氨酸序列缺失包含整数性多个三连续残基;
(c)在任何重复内缺失GYG都在同一重复内缺失GRG;
(d)缺失n=0的第一个重复时,第一个重复之前有n=6的第二个重复;
其中所述全长蛋白由一种基因或多种基因编码,所述基因对于蜘蛛棒络新妇基因组不是内源基因。
20.权利要求16的绿色植物,所述绿色植物选自单子叶植物和双子叶植物。
21.权利要求16的绿色植物,所述绿色植物选自大豆、油菜籽、向日葵、棉花、玉米、烟草、苜蓿、小麦、大麦、燕麦、高梁、水稻、拟南芥、甜菜、甘蔗、canola、小米、菜豆、豌豆、黑麦、亚麻、草和香蕉。
CN01810113.5A 2000-05-25 2001-05-24 在植物中生产丝状蛋白 Pending CN1430674A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US20696800P 2000-05-25 2000-05-25
US60/206,968 2000-05-25

Publications (1)

Publication Number Publication Date
CN1430674A true CN1430674A (zh) 2003-07-16

Family

ID=22768693

Family Applications (1)

Application Number Title Priority Date Filing Date
CN01810113.5A Pending CN1430674A (zh) 2000-05-25 2001-05-24 在植物中生产丝状蛋白

Country Status (6)

Country Link
US (2) US6608242B1 (zh)
EP (1) EP1285076A2 (zh)
JP (1) JP2004511429A (zh)
CN (1) CN1430674A (zh)
BR (1) BR0111341A (zh)
WO (1) WO2001090389A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107406482A (zh) * 2015-12-21 2017-11-28 保脑稳有限公司 记忆力、学习力、认知力提高用组合物
US11369659B2 (en) 2015-12-21 2022-06-28 Brainon Inc. Method of enhancing a brain or cognitive function

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6358101A (ja) * 1986-08-29 1988-03-12 Hitachi Ltd 位置検出装置
WO2001094393A2 (de) * 2000-06-09 2001-12-13 IPK Institut für Pflanzengenetik und Kulturpflanzenforschung Synthetische spinnenseidenproteine und deren expression in transgenen pflanzen
US7288391B2 (en) * 2001-06-06 2007-10-30 University Of Wyoming Expression of spider silk proteins in higher plants
GB0218977D0 (en) * 2002-08-15 2002-09-25 Univ York Polypeptide
US20040132978A1 (en) * 2002-11-12 2004-07-08 Fahnestock Stephen R. Method for purifying and recovering silk proteins in soluble form and uses thereof
US7060260B2 (en) * 2003-02-20 2006-06-13 E.I. Du Pont De Nemours And Company Water-soluble silk proteins in compositions for skin care, hair care or hair coloring
CN1910196A (zh) * 2004-01-13 2007-02-07 东丽株式会社 含有蜘蛛丝蛋白质的丝线以及产生该丝线的蚕
AR047658A1 (es) 2004-02-03 2006-02-01 Cargill Inc Concentrado de proteinas y corriente acuosa con carbohidratos hidrosolubles
US20050261479A1 (en) * 2004-04-29 2005-11-24 Christian Hoffmann Method for purifying and recovering silk proteins using magnetic affinity separation
ATE374018T1 (de) 2005-08-01 2007-10-15 Univ Muenchen Tech Prozess zur herstellung von nano- und mikrokapseln aus spinnenseidenprotein
NZ567202A (en) 2005-10-05 2012-02-24 Commw Scient Ind Res Org Silk proteins from Hyhemonptera species containing heptad repeats that form coiled coil tertiary structures
RU2444527C2 (ru) 2005-12-30 2012-03-10 Спибер Текнолоджиз Аб Рекомбинантный спидроиновый белок главной ампулярной железы, способный к полимеризации, рекомбинантный слитый белок, способный к управляемой полимеризации, полимер спидроинового белка главной ампулярной железы, композиция для управляемой полимеризации, рекомбинантная молекула нуклеиновой кислоты (варианты), способ получения растворимого слитого белка, способ получения полимера спидроинового белка главной ампулярной железы и способ культивирования эукариотических клеток
KR100864380B1 (ko) 2006-10-17 2008-10-21 주식회사 브레인가드 두뇌기능 향상과 뇌신경계 질환 예방 또는 치료용 펩타이드
BRPI0701826B1 (pt) 2007-03-16 2021-02-17 Embrapa - Empresa Brasileira De Pesquisa Agropecuária proteínas da teia de aranha nephilengys cruentata, avicularia juruensis e parawixia bistriata isoladas da biodiversidade brasileira
WO2009097540A1 (en) 2008-02-01 2009-08-06 Entogenetics, Inc. Methods, compositions, and systems for production of recombinant spider silk polypeptides
SG178870A1 (en) 2009-08-26 2012-04-27 Commw Scient Ind Res Org Processes for producing silk dope
KR101317420B1 (ko) * 2010-03-11 2013-10-10 한국과학기술원 고분자량의 재조합 실크 또는 실크 유사 단백질 및 이를 이용하여 제조된 마이크로 또는 나노 크기의 거미줄 또는 거미줄 유사 섬유
US8993844B1 (en) 2010-05-27 2015-03-31 University Of Wyoming Production of spider silk protein in corn
JP5691052B2 (ja) 2010-09-10 2015-04-01 岡本株式会社 組換え生物及び組換え生物により作られるタンパク質
SG11201502932TA (en) 2012-10-17 2015-05-28 Univ Nanyang Tech Compounds and methods for the production of suckerin and uses thereof
CN109311954A (zh) * 2016-04-28 2019-02-05 丝芭博株式会社 改造丝心蛋白
JP2020097524A (ja) * 2017-03-07 2020-06-25 Spiber株式会社 精製されたタンパク質を製造する方法
AU2020288624A1 (en) 2019-06-04 2022-02-03 Cocoon Biotech Inc. Silk-based products, formulations, and methods of use

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5770697A (en) 1986-11-04 1998-06-23 Protein Polymer Technologies, Inc. Peptides comprising repetitive units of amino acids and DNA sequences encoding the same
DE3742179A1 (de) 1987-12-12 1989-06-22 Bayer Ag Matte flaechengebilde
US5245012A (en) 1990-04-19 1993-09-14 The United States Of America As Represented By The Secretary Of The Army Method to achieve solubilization of spider silk proteins
WO1991016351A1 (en) 1990-04-19 1991-10-31 The United States Of America, Secretary Of The Army, The Pentagon Recombinant spider silk proteins through genetic engineering
US5989894A (en) * 1990-04-20 1999-11-23 University Of Wyoming Isolated DNA coding for spider silk protein, a replicable vector and a transformed cell containing the DNA
EP0452925B1 (en) 1990-04-20 2000-02-09 The University Of Wyoming Isolated DNA coding for spider silk protein, a replicable vector and a transformed cell containing the isolated DNA, and products thereof
EP0668919B1 (en) 1992-11-17 2003-06-04 E.I. Du Pont De Nemours And Company Genes for microsomal delta-12 fatty acid desaturases and related enzymes from plants
US6268169B1 (en) 1993-06-15 2001-07-31 E. I. Du Pont De Nemours And Company Recombinantly produced spider silk
WO1997008315A1 (en) 1995-08-22 1997-03-06 Basel Richard M Cloning methods for high strength spider silk proteins
CA2263891A1 (en) 1996-10-17 1998-04-23 E.I. Du Pont De Nemours And Company Enhanced transgene expression in a population of monocot cells employing scaffold attachment regions
FR2774588B1 (fr) * 1998-02-11 2000-05-05 Oreal Composition cosmetique ou dermatologique contenant au moins une proteine de soie d'arachnides naturelle, recombinante ou un analogue
US7157615B2 (en) * 1998-03-17 2007-01-02 Nexia Biotechnologies, Inc. Production of biofilaments in transgenic animals
WO2001094393A2 (de) 2000-06-09 2001-12-13 IPK Institut für Pflanzengenetik und Kulturpflanzenforschung Synthetische spinnenseidenproteine und deren expression in transgenen pflanzen

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107406482A (zh) * 2015-12-21 2017-11-28 保脑稳有限公司 记忆力、学习力、认知力提高用组合物
CN110279845A (zh) * 2015-12-21 2019-09-27 保脑稳有限公司 记忆力、学习力、认知力提高用组合物
CN110279845B (zh) * 2015-12-21 2021-08-20 保脑稳有限公司 记忆力、学习力、认知力提高用组合物
US11369659B2 (en) 2015-12-21 2022-06-28 Brainon Inc. Method of enhancing a brain or cognitive function

Also Published As

Publication number Publication date
WO2001090389A2 (en) 2001-11-29
US6965060B2 (en) 2005-11-15
US20030192077A1 (en) 2003-10-09
EP1285076A2 (en) 2003-02-26
WO2001090389A3 (en) 2002-06-06
BR0111341A (pt) 2003-06-17
US6608242B1 (en) 2003-08-19
JP2004511429A (ja) 2004-04-15

Similar Documents

Publication Publication Date Title
CN1430674A (zh) 在植物中生产丝状蛋白
CN1170940C (zh) 生长得到改造的植物以及获得此种植物的方法
CN1216583A (zh) 编码类黄酮途径酶的基因序列及其用途
CN1390089A (zh) 增强了蔗糖磷酸酯合成酶表达的转基因产纤维植物
CN1350587A (zh) 植物的获得性抗性基因
CN1334874A (zh) Cry3B杀虫蛋白在植物中的提高表达
CN1930293A (zh) 具有降低的饱和脂肪酸水平的转基因植物及其制备方法
CN1639342A (zh) 通过在植物内质网衍生蛋白质体中的累积而生产肽和蛋白质
CN1753992A (zh) 种子中蛋白质含量降低的植物及其制备方法和利用方法
CN1675366A (zh) 经由体细胞胚胎发生的质体遗传工程
CN1073117C (zh) 抗菌肽及其生产方法和应用
CN101080492A (zh) 用于调节植物中油质蛋白表达的方法
CN1810977A (zh) 增强植物和真菌中的2-乙酰基-1-吡咯的合成的核酸
CN1594571A (zh) 百草枯抗性基因及维管束和毛状体特异性启动子
CN1793172A (zh) 无诱导表达基因工程菌株及构建方法和应用
CN1625562A (zh) CRY1EA和CRY1CA的嵌合型δ-内毒素蛋白
CN1233290A (zh) 抗真菌蛋白及其编码dna和掺入此dna的宿主
CN1313387A (zh) 在转基因植物中表达多种蛋白的方法
CN1431309A (zh) 编码植物转录因子的基因
CN1646005A (zh) 具有改进形态发生的植物及其制备方法
CN1195063C (zh) 蛋白酶抑制剂融合蛋白
CN1240837C (zh) 植物纤维的修饰
CN1202254C (zh) 水稻抗白叶枯病基因Xa26(t)
CN1294267C (zh) 携带新黄素裂解酶基因的转基因植物
CN1426465A (zh) 能从较大的核苷酸序列中以闭合环状形式释放,并且允许位点特异性地表达和/或发育调控性地表达所选遗传序列的构建体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication