CN106661573B - 多核苷酸文库的重组酶介导的整合 - Google Patents

多核苷酸文库的重组酶介导的整合 Download PDF

Info

Publication number
CN106661573B
CN106661573B CN201580044304.0A CN201580044304A CN106661573B CN 106661573 B CN106661573 B CN 106661573B CN 201580044304 A CN201580044304 A CN 201580044304A CN 106661573 B CN106661573 B CN 106661573B
Authority
CN
China
Prior art keywords
fusarium
ceriporiopsis
recombinase
host cell
aspergillus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580044304.0A
Other languages
English (en)
Other versions
CN106661573A (zh
Inventor
松井知子
宇田川裕晃
岸下诚一郎
D·A·斯克伦德
金绮明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes AS
Original Assignee
Novozymes AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes AS filed Critical Novozymes AS
Publication of CN106661573A publication Critical patent/CN106661573A/zh
Application granted granted Critical
Publication of CN106661573B publication Critical patent/CN106661573B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了用于使用位点特异性重组酶将感兴趣的多核苷酸文库整合到丝状真菌宿主细胞的染色体中的方法,包括宿主细胞和多核苷酸构建体的多核苷酸文库表达系统,连同包含多核苷酸文库的所得丝状真菌宿主细胞及其培养物以生产多肽。

Description

多核苷酸文库的重组酶介导的整合
参照序列表
本申请包括计算机可读形式的序列表,将其通过引用结合在此。
发明领域
本发明涉及用于使用位点特异性重组酶将感兴趣的多核苷酸文库整合到丝状真菌宿主细胞的染色体中的方法,包括宿主细胞和多核苷酸构建体的多核苷酸文库表达系统,连同包含多核苷酸文库的所得丝状真菌宿主细胞及其培养物以生产多肽。
发明背景
已经发现大量的天然存在的有机体产生有用的多肽产物,例如酶,希望酶的大规模生产用于研究和商业目的。
已经描述了宿主细胞的构建,其中,一个高表达染色体基因被替换为位点特异性重组酶的识别序列,以通过使用重组酶识别所述序列(EP 1 405 908 A1;ProBioGen AG)允许将单一产物编码多核苷酸后续插入该位点。
已经披露通过利用自由可逆的位点特异性重组系统在基因组的已知位置插入DNA。这些可逆系统包括以下项:来自细菌噬菌体P1的Cre-lox系统;酿酒酵母的FLP-FRT系统;鲁氏结合酵母(Zygosaccharonzyces rouxii)的R-RS系统;来自细菌噬菌体Mu的改良的Gin-gix系统;来自枯草芽孢杆菌质粒的β-重组酶-six系统和来自细菌转座子Tn1000的Δ-γ-res系统。Cre、FLP、R、Gin、β-重组酶和γ-Δ是重组酶,并且lox、FRT、RS、gix、six和res是各自的重组位点(赛杜斯路(Sadowslu)1993年,美国实验生物学会联合会会志(FASEBJ.)7:750-67;奥(Ow)和梅德贝里(Medberry)1995年,植物科学评论(Crit.Rev.PlantSci.)14:239-261作了综述)。
以上位点特异性重组系统的共同之处在于单一多肽重组酶催化相同或几乎相同的序列的两个识别位点之间的重组的属性。
当克隆和筛选编码真菌宿主细胞中的感兴趣的多肽的多核苷酸时,尤其是当筛选编码真菌宿主细胞分泌的感兴趣的多肽的变体的多核苷酸文库以改进特性时,希望真菌宿主细胞以可比较的水平表达多核苷酸,这样使得它们的特性可以被直接测定,而不必首先进行归一化步骤。这个问题通过使用包括真菌复制起始序列(例如,熟知的AMA1序列)的克隆和表达载体已被解决,例如,在EP 1124949中。
发明概述
我们在此提供快速并且位点特异性将编码感兴趣的多肽的多核苷酸文库插入丝状真菌宿主的染色体中的有效方式,由于所插入的基因在每个转化和选择的宿主细胞的精确相同的基因组位置的仅一个单独的拷贝中的存在,从而实现转化体中高度一致的表达水平。
所得选择转化的细胞甚至可以直接用于以对应于初步筛选的那些的改进的高级表达水平生产编码选择的多肽。
因此,在第一方面,本发明涉及用于使用位点特异性重组酶将感兴趣的多核苷酸文库整合到丝状真菌宿主细胞的染色体中的方法,所述方法包括以下步骤:
a)提供丝状真菌宿主细胞,它按以下顺序在其染色体中包含:
i)该重组酶的第一识别序列或在整合位点的5’或3’的区域;
ii)第一选择标记;
iii)该重组酶的第二识别序列;以及任选地
iv)非功能部分第二选择标记;
b)用核酸构建体转化所述宿主细胞,该核酸构建体按以下顺序包含:
i)该重组酶的第一识别序列或在整合位点的5’或3’的区域;
ii)感兴趣的多核苷酸文库;
iii)第二选择标记或非功能部分第二选择标记,如果步骤(a)(iv)的相应但任选的非功能第二选择标记被包括在宿主细胞染色体中的话;和
iv)该重组酶的第二识别序列;
c)在所述宿主细胞中表达编码该位点特异性重组酶的基因;和
d)选择转化的宿主细胞,该宿主细胞表达该第二选择标记,而不是该第一选择标记,
其中这一感兴趣的多核苷酸文库是通过该重组酶位点特异性地以正确的方向整合到该宿主细胞的染色体中,由此,从该染色体切离该第一可选择标记,并且由此任何非功能部分第二可选择标记被重组,以形成该染色体中的功能第二选择标记。
在第二方面,本发明涉及多核苷酸文库表达系统,包括:
a)丝状真菌宿主细胞,它按以下顺序在其染色体中包含:
i)位点特异性重组酶的第一识别序列或在整合位点的5’或3’的区域;
ii)第一选择标记;
iii)该重组酶的第二识别序列;以及任选地
iv)非功能部分第二选择标记;和
b)核酸构建体,该核酸构建体按顺序在以下元件中包含:
i)该重组酶的第一识别序列或在整合位点的5’或3’的区域;
ii)感兴趣的多核苷酸文库;
iii)第二选择标记或非功能部分第二选择标记,如果步骤(a)(iv)的任选的非功能第二选择标记被包括在宿主细胞染色体中的话;和
iv)该重组酶的第二识别序列,和
c)编码位点特异性重组酶的基因包括在丝状真菌宿主细胞中;优选地在染色体中,在第二核酸构建体中,或在步骤(b)中列出的元件之外的核酸构建体中;
其中,当用这一个或多个核酸构建体转化宿主细胞时,感兴趣的多核苷酸文库是通过重组酶位点特异性地以正确的方向整合到宿主细胞的染色体中,由此,从染色体切离第一可选择标记,并由此第二选择标记也被整合并且表达或任何非功能部分第二可选择标记被重组,以形成表达的染色体中的功能第二选择标记。
在第三方面,本发明涉及所得丝状真菌宿主细胞,它按以下顺序在其染色体中包含:
i)位点特异性重组酶的第一识别序列或在整合位点的5’或3’的区域;
ii)感兴趣的多核苷酸文库;和
iii)选择标记和该重组酶的第二识别序列;抑或
iv)第一部分选择标记,该重组酶的第二识别序列和第二部分选择标记,
其中该宿主细胞表达该多核苷酸文库和选择标记。
在最后方面,本发明涉及产生感兴趣的多肽的方法,该方法包括以下步骤:
a)在有利于产生由多核苷酸文库编码的多肽的条件下,培养第三方面的丝状真菌宿主细胞,并且;任选地
b)回收该多肽。
附图简要说明
图1示出载体p002的示意图。
图2示出载体pFRT-GIAMG的示意图。
图3示出载体p007的示意图。
图4示出载体pFRT-BsAMG的示意图。
图5示出载体pDAu571的示意图。
图6示出载体pDAu703的示意图。
图7示出以下项的示意图:
-顶端部分:在米曲霉宿主菌株DAu716中的染色体的amy2区域,其中两个FRT-位点已被插入;
-中间部分:线性化的载体pDAu724;和
-底部部分:通过各自的FRT-位点之间的双同源重组的pDAu724的FLP介导的整合后,米曲霉宿主菌株DAu716中的染色体的amy2区域。
图8示出载体pDLHD0075的示意图。
图9示出质粒pJfyS156的限制性图谱。
图10示出pQM43的限制性图谱。
图11示出pQM45的限制性图谱。
定义
胞嘧啶脱氨酶:胞嘧啶脱氨酶(EC 3.5.4.1)催化胞嘧啶和5-氟胞嘧啶(5FC)的脱氨以分别形成尿嘧啶和有毒5-氟尿嘧啶(5FU)。当包含胞嘧啶脱氨酶的遗传修饰过的细胞与5FC组合时,它被转化为有毒5FU,因此胞嘧啶脱氨酶编码基因潜在地是有效的阴性选择标记。也已示出,嘧啶从头(de novo)合成途径中的抑制剂可以用于创造如下条件,在该条件下细胞依赖于通过胞嘧啶脱氨酶进行的嘧啶补充物到尿嘧啶的转化。因此,只有表达胞嘧啶脱氨酶基因的细胞可以在阳性选择介质中被解救,该阳性选择介质包括嘧啶从头合成抑制剂连同肌苷和胞嘧啶(参见魏(Wei)和休伯(Huber),1996,生物化学杂志(J BiolChem)271(7):3812的图1)。抑制剂优选N-(磷酸乙酰)-L-天冬氨酸(PALA),它抑制天冬氨酸氨基甲酰转移酶。如果需要的话,胞嘧啶脱氨酶的活性可以通过基因测定进行定量(弗雷德里科(Frederico)L.A.等人,1990,生物化学(Biochemistry)29:2532-2537)。
等位基因变体:术语“等位基因变体”意指占用同一染色体基因座的一种基因的两个或更多个替代形式中的任一者。等位基因变异由突变天然产生,并且可以导致群体内多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
催化结构域:术语“催化结构域”意思指酶的包含该酶的催化机器的区域。
cDNA:术语“cDNA”意指可以通过从得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工,包括剪接。
编码序列:术语“编码序列”意指直接指定一个多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框架决定,该开放阅读框架从起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指对于表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码多肽的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰、以及分泌。
表达载体:术语“表达载体”意直链性或环状DNA分子,该分子包含编码多肽的多核苷酸并且该多核苷酸可操作地与提供用于其表达的控制序列连接。
片段:术语“片段”是指从成熟多肽或结构域的氨基和/或羧基末端缺失一个或多个(例如,若干个)氨基酸的一种多肽或一个催化或结合结构域;其中该片段已经保留其催化或结合活性。
宿主细胞:术语“宿主细胞”意指易于用包括本发明的一种多核苷酸的一种核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。
改进的特性:术语“改进的特性”意指与变体相关的与亲本相比得到改进的特征。在本发明中,改进的特性是相对于亲本,变体的增加的表达产量。
增加的表达产量:术语“增加的表达产量”意指相对于在相同的培养条件下,培养每升表达亲本基因的相同的宿主细胞产生的分泌的活性酶的量(g),来自培养每升表达变体基因的宿主细胞的培养基的分泌的酶的更高量(g)。在一方面,与亲本酶相比,变体具有至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加的表达产量。
分离的:术语“分离的”意指处于非天然存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然发生的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所有天然发生的成分中去除;(3)相对于天然发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分,增加物质的量而修饰的任何物质(例如宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及比与编码该物质的基因天然相关联的启动子更强的启动子的使用)而修饰的任何物质。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。本领域已知,宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)的混合物。本领域还已知,不同的宿主细胞不同地加工多肽,并且因此一个表达多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可以产生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有催化或结合活性的成熟多肽的多核苷酸。
核酸构建体:术语“核酸构建体”意指单链-或双-链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成包含核酸的区段,或是合成的,该核酸分子包括一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指如下的构造,其中,控制序列相对于多核苷酸的编码序列安置在适当位置,从而使得该控制序列指导该编码序列的表达。
序列一致性:用参数“序列一致性”来描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件(The European Molecular Biology Open Software Suite),赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更新版本)的尼德尔(Needle)程序中所实施的尼德尔曼-翁施(Needleman-Wunsch)算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来确定两个氨基酸序列之间的序列一致性。所使用的参数是空位开放罚分10、空位延伸罚分0.5,和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的:
(一致的残基X 100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,同上)(优选5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼和翁施,1970,同上)来确定两个脱氧核糖核苷酸序列之间的序列一致性。所使用的参数是空位开放罚分10,空位延伸罚分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的:
(一致的脱氧核糖核苷酸X 100)/(比对长度-比对中的空位总数)
子序列:术语“子序列”是指具有从成熟多肽编码序列的5’和/或3’端缺失的一个或多个(例如,若干个)核苷酸的多核苷酸;其中该子序列编码具有催化或结合活性的片段。
变体:术语“变体”意指在一个或多个(例如,若干个)位置处包括改变(即,取代、插入和/或缺失)的具有催化或结合活性的一个多肽。取代意指用一个不同氨基酸置换占用一个位置的氨基酸;缺失意指去除占据一个位置的氨基酸;并且插入意指在邻接并且紧随占据位置的氨基酸之后添加氨基酸。保守取代的实例是在下组的范围内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及蛋氨酸)。通常不改变比活性的氨基酸置换是本领域已知的并且例如由H.诺伊拉特(H.Neurath)和R.L.希尔(R.L.Hill),1979,在蛋白质(The Proteins),学术出版社(Academic Press),纽约(New York)中进行描述。常见取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、以及Asp/Gly。可替代地,氨基酸变化是这样一种性质,使得多肽的理化性质被改变。例如,氨基酸改变可以改进多肽的热稳定性、改变底物特异性、改变最适pH等。可以根据本领域已知的方法,如定点诱变或丙氨酸扫描诱变鉴定多肽中的必需氨基酸(康宁汉(Cunningham)和韦尔斯(Wells),1989,科学(Science)244:1081-1085)。在后一项技术中,在该分子中的每个残基处引入单个丙氨酸突变,并且对所得突变体分子的活性进行测试以鉴定对于该分子的活性至关重要的氨基酸残基。还参见希尔顿(Hilton)等人,1996,生物化学杂志(J.Biol.Chem.)271:4699-4708。也可结合假定接触位点氨基酸的突变,如通过以下技术例如核磁共振、结晶学、电子衍射、或光亲和标记进行确定的对结构进行物理学分析,从而确定酶的活性位点或其他生物学相互作用。参见,例如德·沃斯(de Vos)等人,1992,科学(Science)255:306-312;史密斯(Smith)等人,1992,分子生物学杂志(J.Mol.Biol.)224:899-904;沃达维尔(Wlodaver)等人,1992,欧洲生物化学学会联盟通讯(FEBS Lett.)309:59-64。还可以从与相关多肽的比对推断鉴定必需氨基酸。可以做出单个或多个氨基酸取代、缺失和/或插入并且使用诱变、重组和/或改组的已知方法进行测试,随后进行相关筛选程序,如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer),1988,科学(Science)241:53-57;博维(Bowie)和萨奥尔,1989,美国科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO95/22625所披露的那些。可以使用的其他方法包括易错PCR、噬菌体展示(例如,罗曼(Lowman)等人,1991,生物化学(Biochemistry)30:10832-10837;美国专利号5,223,409;WO92/06204)和区域定向诱变(德比舍尔(Derbyshire)等人,1986,基因(Gene)46:145;内尔(Ner)等人,1988,DNA 7:127)。
诱变/改组方法可以与高通量自动化筛选方法组合以检测由宿主细胞表达的克隆的诱变多肽的活性(奈斯(Ness)等人,1999,自然生物技术(Nature Biotechnology)17:893-896)。编码活性多肽的诱变的DNA分子可以回收自宿主细胞,并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。
发明详述
本发明涉及用于使用位点特异性重组酶将感兴趣的多核苷酸文库整合到丝状真菌宿主细胞的染色体中的方法,包括宿主细胞和多核苷酸构建体的多核苷酸文库表达系统,连同包含多核苷酸文库的所得丝状真菌宿主细胞及其培养物以生产多肽。
在本发明的一个优选实施例中,多核苷酸文库是包含编码感兴趣的多肽的变体的多核苷酸的基因文库;优选地,这一感兴趣的多肽是一种酶;更优选地,这一感兴趣的多肽是一种水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶,例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、或β-木糖苷酶。
在另一个优选实施例中,多核苷酸文库包含控制序列的文库,例如,启动子,前导肽区,分泌信号或终止子的文库。
优选的是,本发明的丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞;优选地,该宿主细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporiumlucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporiumzonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotuseryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
在本发明的一个优选实施例中,位点特异性重组酶是酿酒酵母2μm翻转酶FLP,噬菌体TP901-1整合酶,细菌噬菌体P1CRE整合酶,细菌XerC重组酶,细菌XerD重组酶,λ噬菌体整合酶或HP1整合酶;优选地,该位点特异性重组酶是酿酒酵母2μm翻转酶FLP。
两个独立的策略可以应用于确保在宿主细胞的染色体中的染色体整合发生在正确的方向。如果使用相同的第一和第二识别序列,则该整合有可能在两个方向发生,但是第二选择标记可以被定制,这样使得仅正确整合的片段导致第二选择标记的表达。另一方面,使用不同的第一和第二识别序列也是一个选项,例如FRT-F和FRT-F3,为了确保该片段被整合在一个特定的方向。本发明的一个方面涉及使用体内同源重组,该体内同源重组在转化到宿主细胞的核酸构建体的区域,以及在与位点特异性重组酶识别序列组合的染色体中预期整合位点的5’或3’区域之间,以确保感兴趣的多核苷酸文库是经由与受重组酶影响的位点特异性重组组合的体内同源重组,以特定方向整合到染色体中。
因此,优选的是,重组酶的第一和第二识别序列是相同的或不同的;优选地,该重组酶的第一和第二识别序列是不同的,以影响在宿主细胞染色体中这一感兴趣的多核苷酸文库的定向整合。优选地,重组酶的第一和第二识别序列是酿酒酵母2μm翻转酶FLP的不同的识别序列,以影响在宿主细胞染色体中感兴趣的多核苷酸文库的定向整合;优选地,该重组酶的第一和第二识别序列分别是FRT-F(SEQ ID NO:27)和FRT-F3(SEQ ID NO:28),或反之亦然。
另一方面,还优选地是,一个非功能部分第二选择标记被包括在步骤(a)中第一方面的宿主细胞中,并且另一个非功能部分第二选择标记被包括在步骤(b)中第一方面的核酸构建体中,其中当感兴趣的多核苷酸文库经由其识别序列通过重组酶位点特异性地以正确的方向整合到宿主细胞的染色体中时,部分第二选择标记被重组以形成功能第二选择标记;优选地,一个非功能部分第二选择标记包含编码选择标记的多核苷酸的启动子和任选地一个或多个完整5’外显子,并且另一个非功能部分第二选择标记包含选择标记的剩余编码序列。
在本发明的第二方面的优选实施例中,一个非功能部分第二选择标记被包括在宿主细胞中并且另一非功能部分第二选择标记被包括在核酸构建体中,其中当感兴趣的多核苷酸文库经由其识别序列通过重组酶位点特异性地以正确的方向整合到宿主细胞的染色体中时,部分第二选择标记被重组以形成功能第二选择标记;优选地,一个非功能部分第二选择标记包含编码选择标记的多核苷酸的启动子和任选地一个或多个完整5’外显子,并且其中另一个非功能部分第二选择标记包含选择标记的剩余编码序列。
在第二方面的优选实施例中,丝状真菌宿主细胞被转化。
在第三方面的优选实施例中,重组酶的第一和第二识别序列是相同的或不同的;优选地,该重组酶的第一和第二识别序列是不同的。
在第三方面的另一个优选实施例中,重组酶的第一和第二识序列是酿酒酵母的2μm翻转酶FLP的不同的识别序列;优选地,该重组酶的第一和第二识别序列分别是FRT-F(SEQID NO:27)和FRT-F3(SEQ ID NO:28),或反之亦然。
在另一个优选实施例中,在整合位点的5’或3’的区域,即,整合位点的侧翼5’或3’,与第二识别序列一起使用,以影响在整合位点的感兴趣的多核苷酸文库的定向整合。
在第三方面的一个最后优选实施例中,重组酶的第二识别序列位于将第一部分选择标记与第二部分选择标记分开的内含子中,如在图7中所概述。
具有酶活性的多肽的来源
本发明的具有酶活性的多肽可以从任何属的微生物中获得。出于本发明的目的,如在此结合给定的来源使用的术语“从…中获得”应意指由多核苷酸编码的多肽是由该来源或者由其中已经插入来自该来源的多核苷酸的菌株产生的。在一方面,从给定来源中获得的多肽被分泌到细胞外。
该多肽可以是细菌多肽。例如,该多肽可以是革兰氏阳性细菌多肽,如具有[酶]活性的芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、土芽孢杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)或链霉菌属(Streptomyces)多肽;或革兰氏阴性细菌多肽,如弯曲杆菌属(Campylobacter)、大肠杆菌(E.coli)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)或脲原体属(Ureaplasma)多肽。
在一方面,该多肽是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚硬芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。
在另一方面,该多肽是似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)、或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。
在另一方面,该多肽是不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)、或浅青紫链霉菌(Streptomyces lividans)多肽。
该多肽可以是一种真菌多肽。例如,该多肽可以是酵母多肽,如假丝酵母属、克鲁弗酵母属、毕赤酵母属、酵母属、裂殖酵母、或耶氏酵母属多肽;或丝状真菌多肽,例如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、乳白蚁属(Coptotermes)、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、线黑粉酵母属(Filibasidium)、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、香菇属(Lentinula)、小腔球菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、黑果菌属(Melanocarpus)、亚灰树花菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、链孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、假披发虫属(Pseudotrichonympha)、根毛霉菌属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳霉属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)多肽。
在另一方面,该多肽是卡氏酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酶母(Saccharomyces norbensis)、或卵形酵母(Saccharomyces oviformis)多肽。
在另一方面,该多肽是解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillusfoetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、毡金孢子菌(Chrysosporium pannicola)、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌(Chrysosporium tropicum)、带纹金孢子菌(Chrysosporium zonatum)、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、黄色镰孢菌(Fusariumculmorum)、禾谷镰孢菌(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢菌(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢菌(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟枝孢镰孢菌(Fusarium sporotrichioides)、硫色镰孢菌(Fusarium sulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰孢菌(Fusarium trichothecioides)、镶片镰孢菌(Fusariumvenenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、白囊耙齿菌(Irpex lacteus)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、绳状青霉菌(Penicillium funiculosum)、产紫青霉(Penicillium purpurogenum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、无色梭孢壳(Thielavia achromatica)、成层梭孢壳菌(Thielavia albomyces)、白毛梭孢壳(Thielavia albopilosa)、澳洲梭孢壳(Thielaviaaustraleinsis)、粪梭孢壳(Thielavia fimeti)、小孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、秘鲁梭孢壳(Thielavia peruviana)、毛梭孢壳(Thielavia setosa)、瘤孢梭孢壳(Thielavia spededonium)、耐热梭孢壳(Thielaviasubthermophila)、土生梭孢壳(Thielavia terrestris)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)多肽。
将理解的是,对于以上提到的物种而言,本发明涵盖完全状态和不完全状态(perfect and imperfect states)二者、以及其他分类学等效物,例如无性型,而不管它们已知的物种名称是什么。本领域普通技术人员将容易地识别适当等效物的身份。
这些物种的菌株可以容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(CentraalbureauVoor Schimmelcultures,CBS)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(NRRL)。
可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等等)获得的DNA样品鉴定和获得该多肽。用于从自然生活环境中直接分离微生物和DNA的技术是本领域熟知的。然后可以通过类似地筛选另一微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码该多肽的多核苷酸。一旦已经用探针检测到编码多肽的多核苷酸,则可以通过利用本领域普通技术人员所知的技术分离或克隆多核苷酸(参见,例如萨姆布鲁克(Sambrook)等人,1989,上文)。
核酸构建体
本发明还涉及包含与一个或多个控制序列可操作地连接的本发明多核苷酸的核酸构建体,其中所述控制序列指导编码序列在适合的宿主细胞中在与所述控制序列相容的条件下的表达。
可以用许多方式操作所述多核苷酸以便于多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操纵可以是令人希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
该控制序列可以是启动子,即,被宿主细胞识别以对编码本发明的多肽的多核苷酸进行表达的多核苷酸。启动子包含介导多肽表达的转录控制序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变、截短和杂合启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因中获得。
在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的适合启动子的实例是获得自以下各项的基因的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶–样蛋白酶(WO 96/00787)、镶片镰孢菌淀粉葡糖苷酶(WO 00/56900)、镶片镰孢菌Daria(达莉亚)(WO 00/56900)、镶片镰孢菌Quinn(奎恩)(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延伸因子,连同NA2-tpi启动子(来自编码中性α-淀粉酶的曲霉属基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的曲霉属基因的未翻译的前导子替换未翻译的前导子;非限制性实例包括来自编码中性α-淀粉酶的黑曲霉基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的构巢曲霉或米曲霉基因的未翻译的前导子替换未翻译的前导子);及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。
控制序列还可以是由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接到编码该多肽的多核苷酸的3’-末端。在该宿主细胞中起作用的任何终止子都可以用于本发明中。
用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
该控制序列还可以是在启动子下游并且在基因编码序列上游的mRNA稳定子区域,它增加该基因的表达。
该控制序列还可以是前导子,一种对宿主细胞翻译很重要的非翻译mRNA区域。该前导子可操作地连接到编码该多肽的多核苷酸的5’-末端。可以使用在宿主细胞中起作用的任何前导子。
用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
控制序列还可以是聚腺苷酸化序列,可操作地连接至该多核苷酸的3’-末端并且当转录时由宿主细胞识别为将聚腺苷酸残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下各项的基因中获得的:构巢曲霉邻氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖镰孢胰蛋白酶样蛋白酶。
控制序列也可以是编码信号肽的信号肽编码区,其中所述信号肽与多肽的N-末端连接并且指导多肽进入细胞的分泌途径。多核苷酸的编码序列的5’-末端可以内在地包含在翻译阅读框中与编码多肽的编码序列的区段天然连接的信号肽编码序列。可替代地,编码序列的5’-末端可以包含相对于编码序列为外来的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可能需要外来信号肽编码序列。可替代地,外来信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
用于丝状真菌宿主细胞的有效信号肽编码序列是从黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶的基因获得的信号肽编码序列。
控制序列也可以是编码位于多肽N-末端处的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉角质酶和酿酒酵母α-因子的基因获得前肽或前肽原编码序列。
在信号肽和前肽序列两者都在的情况下,将前肽序列紧邻多肽的N-末端定位并且将信号肽序列紧邻前肽序列的N-末端定位。
也可能令人希望的是添加调节序列,所述调节序列调节相对于宿主细胞的生长的多肽的表达。调节序列的实例是使得基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸将与调控序列可操作地连接。
多核苷酸构建体
本发明还涉及包括本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组多核苷酸构建体或表达载体。不同的核苷酸和控制序列可以连接在一起以产生一个重组表达载体,这一重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该变体的多核苷酸。可替代地,该多核苷酸可以通过将该多核苷酸或包括该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该供表达的适当控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA程序,并且能够引起多核苷酸的表达。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是一种线性的或闭合的环状质粒。
载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体或人工染色体。该载体可包含任何用以保证自我复制的要素。可替代地,该载体可以是这样载体,当它被引入该宿主细胞中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含待引入到宿主细胞的基因组中的总DNA)或转座子。
该载体优选包含一个或多个允许方便地选择转化细胞、转染细胞、转导细胞等细胞的选择性标记。选择性标记是这样一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。
用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶),连同其等效物。优选地用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。在木霉属细胞中优选使用的是adeA、adeB、amdS、hph以及pyrG基因。
选择性标记可以是如在WO 2010/039889中描述的双选择性标记系统。在一方面中,双选择性标记是hph-tk双选择性标记系统。
载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到该宿主细胞基因组中,该载体可以依靠编码该多肽的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置的另外的多核苷酸。为了增加在精确位置整合的可能性,这些整合元件应包含足够数量的核酸,例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外,这些整合元件可以是非编码多核苷酸或编码多核苷酸。另一个方面,该载体可以通过非同源重组整合到宿主细胞的基因组中。
对于自主复制,载体可以进一步包含使该载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点(origin of replication)”或“质粒复制子(plasmid replicator)”意指使得质粒或载体可在体内复制的多核苷酸。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡伦(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可以根据披露于WO 00/24883中的方法完成。
可以将本发明的多核苷酸的多于一个拷贝插入宿主细胞中以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包含与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。
用于连接以上所描述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,萨姆布鲁克(Sambrook)等人,1989,同上)。
宿主细胞
本发明还涉及重组宿主细胞,这些宿主细胞包含可操作地连接到一个或多个控制序列的本发明的多核苷酸,这些控制序列指导本发明的多肽的产生。将包含多核苷酸的构建体或载体引入宿主细胞中,从而该构建体或载体被维持为染色体整合体。
术语“宿主细胞”涵盖由于复制期间发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上取决于编码该多肽的基因及其来源。
宿主细胞可以是真菌细胞。如在此所用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如霍克斯沃思(Hawksworth)等人定义,引自:安斯沃斯(Ainsworth)和比斯比(Bisby)的真菌大词典(Dictionary of The Fungi),第8版,1995,国际CAB,大学出版社(University Press),剑桥(Cambridge),英国)。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)亚类的所有丝状形式(如霍克斯沃思等人,1995,上文定义)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸,而碳分解代谢是专性需氧的。
丝状真菌宿主细胞可以是枝顶孢霉属细胞、曲霉属细胞、金担子菌属细胞、烟管菌属(Bjerkandera)细胞、拟蜡菌属细胞、金孢属细胞、鬼伞属细胞、革盖菌属(Coriolus)细胞、隐球菌属细胞、绒黑粉类酵母细胞、镰刀菌属细胞、腐质霉属细胞、巨座壳属细胞、毛霉属细胞、毁丝霉属细胞、新美鞭菌属细胞、脉孢菌属细胞、拟青霉属细胞、青霉属细胞、平革菌属细胞、射脉菌属(Phlebia)细胞、梨囊鞭菌属细胞、侧耳属细胞、裂褶菌属细胞、蓝状菌属细胞、嗜热子囊菌细胞、梭孢壳属细胞、弯颈霉属细胞、栓菌属(Trametes)细胞或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
可以通过涉及原生质体形成、原生质体转化、以及以本身已知的方式进行细胞壁再生的过程来转化真菌细胞。用于转化曲霉属和木霉属宿主细胞的适合程序在EP 238023和约尔顿(Yelton)等人,1984,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及科里蒂森(Christensen)等人,1988,生物/技术(Bio/Technology)6:1419-1422中描述。用于转化镰刀菌属物种的适合方法在马拉迪耶(Malardier)等人,1989,基因(Gene)78:147-156和WO 96/00787中描述。
生产方法
本发明还涉及产生感兴趣的多肽的方法,包括以下步骤:a)在有益于产生多核苷酸文库编码的多肽的条件下培养第三方面的丝状真菌宿主细胞,并且;任选地,b)回收该多肽。
这些宿主细胞是在适合于使用本领域中已知的方法产生该多肽的一种营养培养基中培养的。例如,可以通过在适合的培养基中和在允许表达和/或分离该多肽的条件下,进行摇瓶培养,或者在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续、分批、分批补料、或固态发酵)来培养细胞。该培养是使用本领域中已知的程序,在一种适合营养培养基中发生,该培养基包括碳和氮来源及无机盐。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果多肽分泌到该营养培养基中,那么可直接从培养基中回收多肽。如果多肽不被分泌,那么其可从细胞裂解液中进行回收。
可以使用特异性针对这些多肽的本领域已知的方法来检测该多肽。这些检测方法包括但不限于,特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定该多肽的活性。
可以使用本领域已知的方法来回收多肽。例如,该多肽可以通过常规程序,包括但不限于,收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从该营养培养基回收。在一方面,回收包含该多肽的发酵液。
可以通过本领域已知的多种方法纯化多肽,所述方法包括但不限于色谱(例如,离子交换色谱法、亲和色谱法、疏水色谱法、聚焦色谱法和大小排阻色谱法)、电泳方法(例如,制备性等电聚焦)、差异性溶解(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,蛋白质纯化(Protein Purification),编者詹森(Janson)和赖登(Ryden),VCH出版公司,纽约,1989),以便获得基本上纯的多肽。
在替代性方面,不回收多肽,而是使用表达该多肽的本发明宿主细胞作为多肽的来源。
通过以下实例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实例
分子克隆技术描述于萨姆布鲁克(Sambrook),J.,弗里奇(Fritsch),E.F.,马尼亚蒂斯(Maniatis),T.30(1989)分子克隆实验手册(Molecular cloning:a laboratorymanual)(第2版)冷泉港实验室(Cold Spring Harbor Laboratory),冷泉港(Cold SpringHarbor),纽约。
用于DNA操作的酶(例如限制性内切核酸酶,连接酶等)从新英格兰生物学实验室有限公司(New England Biolabs,Inc.)获得,并可根据制造商的说明书使用。
培养基和试剂
除非另外说明,使用以下培养基质和试剂;用于缓冲液和底物的化学品是分析等级的商品:
-Cove:342.3g/L蔗糖、20ml/L COVE盐溶液、10mM乙酰胺、30g/L诺布尔(noble)琼脂。
-Cove顶层琼脂:342.3g/L蔗糖、20ml/L COVE盐溶液、10mM乙酰胺、10g/L低熔点琼脂糖。
-Cove-N平板由以下构成:30g蔗糖、20ml Cove盐溶液、3g NaNO3和30g诺布尔琼脂,并且水补足至1升。
-COVE盐溶液由以下构成:26g KCl、26g MgSO4·7H2O、76g KH2PO4和50ml Cove痕量金属,并且水补足至1升。
-用于COVE的痕量金属溶液由以下构成:0.04g NaB4O7 10H2O、0.4g的CuSO4 5H2O、1.2g的FeSO4 7H2O、1.0g MnSO4H2O、0.8g中性淀粉酶II MoO22H2O和10.0g ZnSO4 7H2O,并且水补足至1升。
-1/4YPM由以下构成:2.5g酵母提取物、5g蛋白胨和5g麦芽糖(pH4.5),并且水补足至1升。
-STC缓冲液由以下构成:0.8M山梨糖醇、25mM Tris(pH 8)、和25mM CaCl2,并且水补足至1升。
-STPC缓冲液由以下构成:在STC缓冲液中的40%PEG4000。
-MLC由以下构成:40g葡萄糖、50g大豆粉、4g/柠檬酸(pH5.0),并且水补足至1升。
-纤维素酶诱导培养基(CIM)由以下构成:20g的纤维素、10g的玉米浆固体、1.45g的(NH4)2SO4、2.08g的KH2PO4、0.28g的CaCl2、0.42g的MgSO4·7H2O、0.42ml的木霉痕量金属溶液、1-2滴消泡剂、并且去离子水补足至1升;pH调节至6.0。
-COVE平板由以下各项构成:342.3g的蔗糖、20ml的COVE盐溶液、10ml的1M乙酰胺、10ml的1.5M CsCl、25g的诺布尔琼脂(Difco)、并且去离子水补足至1升。
-COVE盐溶液由以下构成:26g的KCl、26g的MgSO4·7H2O、76g的KH2PO4、50ml的COVE痕量金属溶液、并且去离子水补足至1升。
-COVE痕量金属溶液由以下构成:0.04g的NaB4O7·10H2O、0.4g的CuSO4·5H2O、1.2g的FeSO4·7H2O、0.7g的MnSO4·H2O、0.8g的Na2MoO2·2H2O、10g的ZnSO4·7H2O、并且去离子水补足至1升。
-LB+Amp培养基由以下各项构成:10g的胰蛋白胨、5g的酵母提取物、5g的NaCl、并且去离子水补足至1升。在高压灭菌之后,添加在水中的1ml的100mg/ml的氨苄青霉素溶液。
-PDA平板由以下各项构成:39g的马铃薯右旋糖琼脂(Difco),并且去离子水补足至1升。
-PEG缓冲液由以下构成:500g的聚乙二醇4000(PEG 4000)、10mM CaCl2、10mMTris-HCl pH 7.5,并且去离子水补足至1升;过滤除菌。
-SOC培养基由以下构成:0.5g的NaCl、5g的酵母提取物、20g的胰蛋白胨、10ml的250mM KCl、并且去离子水补足至1升。
-STC由以下构成:1M山梨醇、10mM CaCl2、以及10mM Tris-HCl,pH 7.5,过滤除菌。
-TAE缓冲液由以下各项构成:4.84g的Tris碱、1.14ml的冰醋酸、2ml的0.5M EDTA(pH 8)、并且去离子水补足至1升。
-木霉基本培养基(TrMM)平板(用于亚培养)由以下构成:30g蔗糖、20ml COVE盐溶液、0.6g的CaCl2.2H2O、6g的(NH4)2SO4、25g的诺布尔琼脂、并且去离子水补足至1升。
-木霉痕量金属溶液由以下构成:216g的FeCl3·6H2O、58g的ZnSO4·7H2O、27g的MnSO4·H2O、10g的CuSO4·5H2O、2.4g的H3BO3、336g的柠檬酸、并且去离子水补足至1升。
-YP培养基由以下各项构成:10g的酵母提取物、20g的细菌蛋白胨、并且去离子水补足至1升。
-2XYT加氨比西林平板由以下各项构成:16g的胰蛋白胨、10g的酵母提取物、5g的氯化钠、15g的细菌用琼脂(Bacto agar)并且去离子水补足至1升。在高压蒸汽处理的培养基回火到55℃后,添加1ml的100mg/ml的氨比西林。
采购的材料和菌株
使用大肠杆菌DH5-α(东洋公司(Toyobo))用于质粒构建和扩增。使用凯杰质粒试剂盒(Qiagen Plasmid Kit)(凯杰公司)来回收扩增的质粒。使用DNA连接试剂盒(宝生物公司(TAKARA))或T4DNA连接酶(宝灵曼公司(BOEHRINGER MANNHEIM))来进行连接。QIAQUICKTM凝胶提取试剂盒(凯杰公司)被用于纯化PCR片段并从琼脂糖凝胶中提取DNA片段。
Figure BDA0001227517190000221
克隆试剂盒和大肠杆菌细胞(Fusion-Blue)被用于构建pDAu571表达载体连同pDAu703。PCR扩增使用
Figure BDA0001227517190000222
高保真DNA聚合酶进行。
表达宿主菌株黑曲霉NN059095通过诺维信分离并且是从土壤中分离的黑曲霉NN049184的衍生物。NN059095经遗传修饰以破坏淀粉葡糖苷酶活性的表达。
里氏木霉菌株981-O-8(D4)是里氏木霉RutC30(ATCC 56765;蒙特尼考特(Montenecourt)和伊夫利(Eveleigh),1979,化学进展丛书(Adv.Chem.Ser.)181:289-301的一种诱变菌株。
里氏木霉菌株AgJg115-104-7B1(WO 2011/075677)是里氏木霉菌株981-O-8(D4)的ku70-衍生物。
曲霉的转化
曲霉属物种的转化可使用用于酵母转化的一般熟知的方法实现。将黑曲霉宿主菌株接种至100ml的补充有10mM尿苷的YPG培养基上,并且在32℃下在80rpm下孵育16hr。将球粒进行收集并且用0.6M KCl洗涤,并且将其再悬浮于包含商业葡聚糖酶产品(GLUCANEXTM,诺维信公司(Novozymes A/S),鲍斯韦(Bagsvaerd),丹麦)的20ml 0.6M KCl(终浓度为20mg/ml)中。将悬浮液在32℃下伴随振荡(80rpm)孵育直到形成原生质体,并且然后用STC缓冲液洗涤两次。将这些原生质体用血细胞计数器计数,并且在STC:STPC:DMSO的8:2:0.1溶液中再悬浮并且调整至2.5x 107个原生质体/ml的终浓度。
将大约4pg的质粒DNA添加至100pl的原生质体悬浮液中,轻轻混合,并且冰上孵育30分钟。添加1ml的SPTC,并且将原生质体悬浮液在37℃下孵育20分钟。在添加10ml的50℃Cove顶层琼脂糖之后,将反应液倾例于Cove琼脂平板上,并且将平板于32℃下孵育5天。
PCR扩增
5x PCR缓冲液(包含MgCl2)20μl
2.5mM dNTP混合物10μl
正向引物(100pM)1μl
反向引物(100pM)1μl
扩展高保真聚合酶(罗氏公司(Roche))1μl
模板DNA(50-100ng/pl)1μl
蒸馏水补足至100μl
PCR条件:
1.94℃,2min
2.94℃,0.5min
3.55℃,0.5min
4.72℃,1-2min
2-4.30个循环
5.72℃,10min
用于酶产生的MTP培养:
将曲霉文库的孢子接种于96深孔板的0.5-1ml的1/4YPM培养基中,并在600rpm,30℃下培养2-3天。
Southern杂交
将所选择的转化体的菌丝体从在100ml YPG培养基中的过夜培养物中收获,用蒸馏水冲洗,干燥并且冷冻在-80℃下。将研磨的菌丝体用蛋白酶K和RNA酶A在65℃下孵育1小时。将基因组DNA通过苯酚/CHCl3萃取两次进行回收,随后进行EtOH沉淀并且在蒸馏水中再悬浮。
遵循制造商的说明书,使用PCR DIG探针合成试剂盒(罗氏应用科学公司(RocheApplied Science),印第安纳州,印第安纳波利斯(Indianapolis,IN))合成非放射性探针。根据制造商的说明书,使用QIAQUICKTM凝胶提取试剂盒(凯杰公司,巴伦西亚,加利福尼亚州)将DIG标记的探针进行凝胶纯化。
将5微克的基因组DNA用适当的限制性内切酶完全消化16小时(40μl总体积、4U酶/μl DNA)并且在0.8%琼脂糖凝胶上运行。将该DNA在凝胶中通过用0.2M HCl处理进行片段化、变性(0.5M NaOH,1.5M NaCl)并且进行中和(1M Tris,pH 7.5;1.5M NaCl)用于随后在20X SSC中转移到海邦(Hybond)N+膜(安玛西亚公司(Amersham))上。将该DNA进行UV交联到该膜上并且在42℃下在20ml DIG Easy Hyb(罗氏诊断产品有限公司(Roche DiagnosticsCorporation),曼海姆,德国)中预杂交1小时。
将变性的探针直接添加至DIG Easy Hyb缓冲液中并且在42℃下进行过夜杂交。在杂交后洗涤(在2X SSC中、室温、5分钟洗涤两次;并且在0.1X SSC中、68℃洗涤两次,各15min),根据制造商的方案,使用DIG检测系统和CPD-Star(罗氏公司)进行化学发光检测。DIG-标记的DNA分子量标记II(罗氏公司)被用于标准标记。
实例1.用于采用无启动子的选择标记将酶编码基因文库插入到基因组中的黑曲霉宿主/载体系统
分两个步骤构建包含插入其基因组中的酶编码多核苷酸文库的黑曲霉,通过先整合由p002表示的质粒(SEQ ID NO:1中提供的完整DNA序列,并在图1中示出其示意图),该质粒包括(按以下顺序):
a)黑曲霉酸性α-淀粉酶编码基因的5’基因组侧翼区;
b)可操作地与FLP编码重组酶编码基因和米曲霉硝酸还原酶基因终止子连接的构巢曲霉木聚糖酶基因启动子;
c)曲霉中性淀粉酶基因启动子,
d)第一重组酶识别序列:
5’ttgaagttcctattccgagttcctattctctagaaagtataggaacttc(SEQ ID NO:2),
e)可操作地与一个潮霉素B抗性标记基因和amdS终止子连接的amdS启动子;
f)第二重组酶识别序列
5’ttgaagttcctattccgagttcctattcttcaaatagtataggaacttca(SEQ ID NO:3),
g)不具有启动子但具有终止子的乙酰胺酶(amdS)编码基因;以及最后地
h)黑曲霉酸性α-淀粉酶编码基因的3’基因组侧翼区。
P002质粒转化到黑曲霉菌株1007-8(WO 121600093中披露)中,随后是潮霉素B选择。获得的转化体通过Southern印迹分析证实具有正确地整合的预期的基因组序列。选择阳性转化体,并且原生质体从菌株制成。
在第二步骤中,表达载体pFRT-GlAMG是基于pUC19载体构建的;pFRT-GIAMG的完整DNA序列在SEQ ID NO:4中提供并且示意图在图2示出。载体包括(按以下顺序):
a)重组酶识别序列,
b)来自密粘褶菌的葡糖淀粉酶基因(SEQ ID NO:5中的DNA;SEQ ID NO:6中的氨基酸序列)可操作地与黑曲霉葡糖淀粉酶终止子连接;
c)米曲霉翻译延伸因子1(TEF1)启动子,以在整合后,驱动在宿主细胞的基因组中的基因组无启动子选择标记的表达,由此也确保正确定向的整合;和
d)重组酶识别序列。
1μg的质粒转化到原生质体中,以在Cove基础平板上产生200-300菌落(科夫D.J.(Cove D.J.)1966.生物化学与生物物理学学报(Biochem.Biophys.cta)113:51-56),这些平板补充有1.0M的蔗糖作为碳源和1%木糖。菌落接种到包含0.1%支链淀粉的czapec-DOX平板通过碘染色(0.15%I2/1.5%KI)来确认葡糖淀粉酶活性。选择一个阳性转化体并且表示为黑曲霉1007-002-44-11。
实例2.采用无启动子部分选择标记的黑曲霉宿主/载体系统
质粒p007(图3;SEQ ID NO:7),如下构建:用SpeI-FRTF3-amdS和amdS-F-探针的一个引物对,并以质粒p002作为模板以扩增amdS(4.0kbp)的SpeI位点识别序列C末端的DNA区来产生第一PCR片段。扩增的PCR产物然后通过SpeI和PacI消化。
引物SpeI-FRTF3-amdS(81mer;SEQ ID NO:8):
5’tggcgtagactagttgaagttcctattccgagtcctattcttcaaatagtataggaacttcatcagggagatgtaacaac
引物amdS-F-探针(22mer;SEQ ID NO:9):
5’ctatggagtcaccacatttccc
包括重组酶识别序列和与酶编码基因可操作地连接的中性淀粉酶启动子的DNA片段(1.0kbp),是通过用PacI和BgIII的质粒p002的双重消化制备的。
包含可操作地与潮霉素抗性编码基因和amdS终止子连接的amdS启动子的DNA片段(3.0kbp)是通过用BgIII和SpeI的p002的双重消化制备的。
这三个DNA片段连接在一起,并转化到大肠杆菌DH5α中。所得质粒命名为p007。
p007质粒包含可操作地与FLP重组酶基因连接的启动子和终止子、另外的NA2启动子、具有FRTs之间的启动子和终止子的潮霉素基因,和缺乏N-末端序列及其第一个内含子的一半的部分amdS选择标记基因,所有两侧是两个酸性α-淀粉酶侧翼基因组区域。
质粒p007转化到黑曲霉菌株1007-8(WO 121600093中披露)中,随后是潮霉素B选择。获得的转化体通过Southern印迹分析证实具有正确的整合的序列。
表达载体,pFRT-BsAMG(图4;SEQ ID NO:10),是基于pUC19载体构建的,它包括(按以下顺序):
a)重组酶识别序列,
b)来自Byssocorticium的葡糖淀粉酶基因(SEQ ID NO:11中示出的DNA序列,SEQID NO:12中编码的氨基酸序列)或一个突变的葡糖淀粉酶编码基因,连同黑曲霉葡糖淀粉酶终止子,
c)米曲霉TEF1启动子(旨在驱动在受体宿主细胞的基因组中的选择标记的表达)可操作地与部分N-末端乙酰胺酶amdS基因连接;和
d)重组酶识别序列。
该载体是通过将SEQ ID NO:13中示出的部分乙酰胺酶基因插入到TEF1启动子(Ptef1)和第二识别序列之间,并且将来自粘褶菌属的葡糖淀粉酶基因交换为Byssocorticium葡糖淀粉酶基因。
在作为模板的pFRT-BsAMG上使用M13M4和M13RV引物进行PCR,并且扩增包含第一重组酶识别序列的4kb的片段、来自Byssocorticium的葡糖淀粉酶基因(或突变的葡糖淀粉酶基因)、黑曲霉葡糖淀粉酶终止子、TEF1启动子、部分N末端乙酰胺酶基因和第二重组酶识别序列。
引物M13RV(SEQ ID NO:14):caggaaacagctatgac
引物M13M4(SEQ ID NO:15):gttttcccagtcacgac
pFRT-BsAMG和PCR片段均被转化并在Cove基础平板上和1%木糖培养。菌落接种到包含0.1%支链淀粉的czapec-dox平板通过碘染色(0.15%I2/1.5%KI)来确认葡糖淀粉酶活性。
实例3.黑曲霉中的单拷贝定点基因插入
使用In-Fusion克隆的质粒文库构建(Clontech公司)
40ng的pFRT-GlAMG表达载体被限制性内切酶XhoI和BsiW1消化,以切除存在的AMG编码基因。用2个引物对进行两个PCR,正向简并引物和与表达载体具有多于15bp的重叠的引物,和M13 M4和与简并引物具有15bp重叠的反向引物,使用pFRT-GIAMG载体作为模板:
融合载体R中的引物(SEQ ID NO:16):tatgcgttatcgtacgcac
引物M13 M4(SEQ ID NO:17):gttttcccagtcacgac
用于BsAMG文库的引物对如下所示:
引物M49X F(27mer;SEQ ID NO:18):gtcaacccggactacnnktacacatgg
引物M49X R(18mer;SEQ ID NO:19):gtagtccgggttgacttg
消化的载体和PCR片段与In-Fusion混合物混合,转化到大肠杆菌DH5α中。合并获得的大肠杆菌转化体并提取质粒用于文库构建。
PCR文库构建
用两个引物对,简并引物,和SOE-MR R和SOE-M4F,和简并引物的配对反向引物,使用pFRT表达载体作为模板进行第一PCR。
用引物对,SOE-F和SOE-R,以及来自第一PCR的PCR片段进行第二SOE PCR。回收所得4kb片段作为PCR片段文库用于曲霉文库构建。
引物SOE-M4F(SEQ ID NO:20):5’gtactatctggcattggtacgttttcccagtcacgac
引物SOE-MR R(SEQ ID NO:21):5’tggttatgatttcggcgatgcaggaaacagctatgac
引物SOE-F(SEQ ID NO:22):5’gtactatctggcattggtac
引物SOE-R(SEQ ID NO:23):5’tggttatgatttcggcgatg
1μg的每种质粒或PCR片段文库转化到黑曲霉1007-002-44-11宿主菌株中。转化体在包含COVE-N甘氨酸琼脂(100μl/孔)的96孔MTP中分离,并在32℃下培养1周以具备足够的孢子形成。添加100μl/孔的0.01%吐温20至每个孔中,并且孢子悬浮液接种在包含YPG 96孔MTP中,并在30℃下伴随振荡培养3天。然后筛选文库。
来自曲霉克隆的DNA分离
通过如下描述的直接菌落PCR扩增方法或通过使用引物对“插入解救F”和“R”在分离染色体DNA上的PCR扩增曲霉菌株的插入DNA。
引物插入解救F(SEQ ID NO:24):5’aatctcagaacaccaatatc
引物插入解救F(SEQ ID NO:25):5’aacactatgcgttatcgtac
菌落PCR如下进行:添加Conidias至1,5ml管,添加500μl的TE-缓冲液并简单混合。该管内容物在水中稀释10-20倍,并且将1μl的稀释的混合物用作模板用于PCR。扩增的DNA通过琼脂糖凝胶电泳和QIAquick凝胶提取试剂盒(凯杰公司)纯化,并且然后测序来检查构建的文库的质量。该文库是正确的。
实例4米曲霉宿主/载体系统
米曲霉菌株JaL1394(在WO 2012/160093中披露)在此实例中被用作宿主菌株。我们已经构建了由pDAu571表示的整合表达载体(图5;SEQ ID NO:26),用于使用FLP/FRT系统,位点特异性重组到米曲霉JaL1394的染色体中。
载体pDAu571是由三部分构成(部分-I,部分-II,部分-III;图5):
部分-I是由两个短FRT(翻转酶识别目标)位点限定。在FRT位点之间发现以下元件:
●具有可以使用独特的限制性酶切位点BamHI,XhoI,替换为任何基因或感兴趣的多核苷酸文库(GOI)的“填充序列”的表达盒。
●构巢曲霉的pyrG选择标记,用来因为它们在没有补充尿苷的基本培养基上生长的能力选择转化的宿主细胞;pyrG标记可操作地与其天然启动子和黑曲霉葡糖淀粉酶基因(Tamg)(SEQ ID NO:26的位置4057-5918)的终止子连接。
质粒的这一部分经由宿主和载体中的各自FRT位点之间的FLP辅助的重组被整合到宿主有机体的染色体中。当评估基因文库时,有利地确保载体的部分-I以相同的方向被整合到所有转化体中。这减少了来自侧翼区(例如,来自通读)基因表达的任何变化。在染色体中FRT-F和FRT-F3位点的序列和确保染色体中整合部分的正确的方向的载体之间存在小差异。宿主染色体和载体中的FRT-F3位点将通过FLP翻转酶彼此重组,并且FRT-F位点也将如此。
FRT-F(SEQ ID NO:26的位置1-49):
5’-ttgaagttcctattccgagttcctattctctagaaagtataggaacttc(SEQ ID NO:27)
FRT-F3(SEQ ID NO:26的位置5925-5974):
5’-ttgaagttcctattccgagttcctattcttcaaatagtataggaacttca(SEQ ID NO:28)
表达盒包含人工NA2TPI启动子,该启动子构建自融合至构巢曲霉磷酸丙糖异构酶的非翻译前导序列的黑曲霉中性淀粉酶II启动子(SEQ ID NO:26的位置73-814)。
此外,表达盒包含所谓的“填充序列”,它在这种情况下是编码来自大豆的脂氧合酶I的基因(SEQ ID NO:22的位置824-3343)。如已经提到的,载体中填充序列可以使用两个独特限制酶位点BamHI,XhoI被替换为感兴趣的任何其他基因。
最后,表达盒包含黑曲霉葡糖淀粉酶基因的终止子(SEQ ID NO:26的位置3358-4048)。
pDau571载体的部分-II是翻转酶编码基因(sFLP)的合成版本(SEQ ID NO:26的位置4875-6143(反向链))。翻转酶基因表达通过米曲霉翻译延伸因子1α启动子(pTEF1)(SEQID NO:26的位置7759-8447(反向链))连同米曲霉硝酸还原酶终止子(TniaD))(SEQ ID NO:26的位置5991-6478(反向链))来控制。
对于在大肠杆菌中质粒的增殖,pDau571载体的部分-III是必需的,并且包括大肠杆菌β-内酰胺酶(ampR)可选择标记和源自熟知的pUC质粒的大肠杆菌复制起点(SEQ IDNO:26的位置8448-11101)。
质粒pDAu571(其中填充序列由所感兴趣的多核苷酸文库替换)被转化到菌株Jal1394的原生质体中,如下:
100μl原生质体与10μl小量制备质粒DNA(未消化或线性化)或跨越pDAu571的部分-I和部分-II的PCR产物和300μl 60%的PEG在室温下孵育20min;然后添加5ml Topagar(+10mM NaNO3),并将整个转化混合物平铺在蔗糖/10mM NaNO3平板上。37℃下孵育平板,直到可以发现孢子。为了纯化单一转化体,菌落再次复制到新蔗糖/10mM NaNO3平板上,并在37℃下孵育,直到孢子发育。
获得的转化体可以通过使用位于表达盒侧翼两侧的amy2基因座内的诊断引物的PCR来验证表达盒的amy2基因座的正确整合,该表达盒包括FRT位点和位于表达盒内的基因特异性引物。
实例5.分裂标记米曲霉的宿主/载体系统的构建
先前实例提供了用于进入适合的丝状真菌宿主细胞的翻转酶介导的位点特异性重组和整合的表达载体。通过使用不同的重组酶识别序列确保整合表达盒的染色体中的正确的方向。
确保正确的方向的另一方式是采用分裂选择标记,其中标记的一个非功能部分存在于宿主染色体中,并且标记的另一非功能部分是在进来的载体上。然后只有正确定向的整合生成功能第二选择标记。该分裂标记原理在此实例中说明;在此第二选择标记被定向在一个方向上,但它刚好也可以已经按其他方式被定向。
曲霉原生质体转化和重组细胞的选择所必需的培养基和溶液:
痕量金属
Figure BDA0001227517190000291
盐溶液
Figure BDA0001227517190000292
COVE培养基
20ml盐溶液
20g琼脂
218g山梨醇
H2O补足1l
高压灭菌并且然后添加:
50ml 20%葡萄糖
10ml1M尿素。
Cove-N-甘氨酸斜面
Figure BDA0001227517190000293
蔗糖培养基
20ml盐溶液。
342g蔗糖。
H2O补足1l
高压灭菌并且然后添加:
10mM硝酸钠
ST 0.6M山梨醇
100mM Tris/HCl pH 7.0
STC 1.2M山梨醇
10mM CaCl2
10mM Tris/HCl pH7.5。
PEG 60%(W/V)PEG 4000(BDH)(6g PEG+~5ml无菌水,置于60℃-65℃)
10mM CaCl2(50μl的2M CaCl2)
10mM Tris/HCl pH 7.5。(100μl的1M的Tris)
蔗糖琼脂平板
10g琼脂
10ml盐溶液
1M蔗糖补足至500ml
高压灭菌器灭菌
乙酰胺平板
10ml盐溶液
10g琼脂
1M蔗糖补足至500ml1
高压灭菌。
冷却至大约65℃,添加10mM乙酰胺和15mM CsCl。
对于500毫升,Triton X-100 50μl(仅在复制平板中)
在米曲霉DAu716的amy2基因座的FRT位点的引入
质粒pJAl1258(在WO 12160097A1中描述)被改良生成由pDAu703表示的质粒。质粒pDAu703按顺序包含以下元件(图6;SEQ ID NO:29):
●amy2-3’侧翼区(490bp);SEQ ID NO:29的位置449-938;
●pyrG启动子可操作地与包含pyrG CDS的5’端(第一外显子及其第一内含子的5’端)的部分的pyrG基因连接;
●FRT-F3位点(50bp);SEQ ID NO:29的位置1452-1501;
●黑曲霉AMG终止子(Tamg)可操作地与amdS编码基因,SEQ ID NO:29的位置1511-2200连接;
●构巢曲霉乙酰胺酶基因(amdS),SEQ ID NO:29的位置2232-4131;
●强磷酸丙糖异构酶启动子(Ptpi)可操作地与Amds编码基因连接;这允许在乙酰胺和ClCs上生长,即使按照预期基因组中仅存在AmdS选择盒的一个拷贝,如果质粒pDAU703被整合到位于FRT位点的amy2基因座的一个拷贝中。SEQ ID NO:29的位置4140-4894;
●FRT-F位点(49bp);SEQ ID NO:29的位置4903-4951;
●amy2-5’侧翼区(1114bp);SEQ ID NO:29的位置4964-6077;
●质粒的其余部分是由对于维持质粒作为细菌宿主细胞大肠杆菌中的复制质粒所必需的一部分DNA(大肠杆菌复制起点和氨苄青霉素抗性盒)构成。
质粒DNA pDAu703用NotI限制性内切酶消化,以从质粒的现在不相干大肠杆菌部分分离包含整合盒的DNA。
将线性化质粒pDAu703使用描述的标准程序(例如在WO 98/01470中)转化进入米曲霉菌株Jal1338的原生质体(在WO 12160097 A1中披露),但是因为该菌株是的pyrG负型,需要补充10mM尿苷至培养基,因此其在没有尿苷下不能生长。在AmdS选择平板上选择转化体
所得重组宿主菌株已经具有两个FRT位点连同分裂pyrG标记(第一外显子和天然内含子的一部分)的5’端,该标记通过同源重组在amy2基因座与其自己的整合的启动子可操作地连接,如在图7中的顶部小图中所示。在amy2基因座上的正确整合通过Southern印迹分析使用退火到amy2的3’端的探针检查(图7)。FRT盒的整合分别在EcoRI和XhoI消化物中的5114bp和2637bp处产生杂交信号(未示出)。该模式与Jal1338宿主不同,其中该amy2基因座不被破坏。选择正确的菌株并用米曲霉DAu716表示(图7,上图)。
用携带脂肪酶编码基因的pDAU724载体的DAu716的转化
这个实例展示了FRT/FLP重组和分裂pyrG标记可以如何被用于有效地使表达盒的单拷贝插入以高频存在于米曲霉中。我们使用来自绵毛嗜热丝孢菌的脂肪酶基因(例如在WO 2008008950中披露)作为报告基因来测量在转化的宿主中产生的脂肪酶的水平。
像在先前实例中,构建表达载体,这样使得其一部分可以使用翻转酶作为位点特异性重组介质,在FRT-位点被整合到宿主细胞的染色体中。要被整合到基因组中的质粒的一部分携带可操作地与NA2/TPi启动子和黑曲霉AMG基因的终止子连接的脂肪酶基因。为了能够选择经由FRT位点已经成功整合表达盒的重组细胞,pyrG选择标记的剩余部分也被包括在FRT位点之间。启动子和第一外显子存在于DAu716宿主中并且pyrG标记的剩余部分存在于进来的质粒上。当位点特异性重组时,pyrG标记将被重构为完整基因(其中其第一内含子内的FRT序列,将当然,从mRNA拼接出)并且重组细胞将能够表达PyrG和生长在NaNO3作为单一氮源的平板上。
质粒pDAU724(图7,中间;SEQ ID NO:30)由以下组成:
要被整合到曲霉属宿主细胞的基因组DNA中的的部分-I,并且它由具有有表达盒的两个FRT位点和分裂pyrG标记的一部分组成;
将不被整合到宿主细胞的基因组中的部分-II,并且它包含FLP酶表达盒连同大肠杆菌选择标记和复制起点。
菌株DAu716生长在Cove-N-甘氨酸介质的斜面上直至可以看见孢子。
将10-20毫升的蔗糖培养基或YPD培养基添加至该斜面,并且通过漩涡振荡斜面悬浮孢子。孢子悬浮液转移到包含100ml蔗糖培养基和10mM硝酸钠(或其它氮源)的聚碳酸酯摇瓶(500毫升)中。在30℃下孵育烧瓶24hr(200rpm)。
通过神奇滤布(miracloth)过滤收集菌丝体,并且使用200ml 0.6M MgSO4洗涤。从菌丝体吸出剩余液体,例如使用塑料移液器。
1-2g的菌丝体被转移到小的(100ml)聚碳酸酯烧瓶中,瓶中包含:
75-150mg Glucanex
10ml 1.2M MgSO4
100ul 1M NaH2PO4pH 5.8
并且悬浮菌丝体,添加1ml的12mg/ml的BSA(无菌过滤的)
在37℃孵育悬浮液1/2-2hr,并且经常通过显微术监测原生质体形成。
将原生质体悬浮液通过神奇滤布(miracloth)过滤到25毫升离心管中,并且将悬浮液用5ml ST(小心不要与下层混合)覆盖。将所得原生质体,通过离心(2500rpm/1350g,15min,缓慢加速)分带。回收原生质体的界面带,并且转移到新鲜的管中。
用两体积的STC稀释原生质体,随后离心(2500rpm/1350g,5min)。然后用5ml STC洗涤原生质体两次(使用再悬浮和离心),并且然后在STC中再悬浮至大约5x107个原生质体/ml的浓度。
对于每次转化,将正在转化的DNA添加至例如14ml管的底部,并且添加100μl的原生质体。添加300μl的PEG,并且将该管用手轻轻混合。孵育20分钟(室温)后,在50℃的温度下添加6ml顶层琼脂,并立即将该悬浮液倒在具有10mM的NaNO3的选择性蔗糖琼脂平板上。
将平板在37℃孵育,直至转化体清晰可见并且开始形成孢子。20个转化体复制到具有Triton的新选择平板上,以分离菌落,可以通过发酵,Southern印迹分析或酶活性测定进一步分析这些菌落。
确认染色体中存在的amdS标记已经通过在包含CsCl(内源乙酰胺酶的抑制剂)和作为唯一氮源的乙酰胺的平板上将转化体划线,在转化体中被引进的脂肪酶基因替换。正确的转化体不应该能够在这些平板上生长。我们测试了20个重组细胞,这些重组细胞是pDAu724的转化成DAu716后获得的,并与亲本宿主菌株DAu716相比,仅观察到轻微的生长表型,其中AmdS选择标记仍然存在。
证实所有20个转化体均包含正确插入在FRT位点的脂肪酶表达盒的一个插入的拷贝。
将20个转化体接种至3ml YPD在
Figure BDA0001227517190000331
10ml 24深孔板(沃特曼(Whatman)公司)中,用Airpore胶带(Quiagen公司)密封,并且在200rpm的搅拌下30摄氏度孵育4天。收集上清液用于进一步分析(脂肪酶测定和SDS-PAGE),并收集菌丝体用于基因组提取和Southern分析。
20个转化体在脂肪酶测定中示出可比较脂肪酶活性,连同在SDS-PAGE凝胶上示出可比较脂肪酶蛋白水平。此外,Southern印迹证实,所有20个转化体仅具有正确地整合到染色体中的预期单一脂肪酶基因拷贝。
实例6:野生型红豆(Vigna angularis)木葡聚糖内糖基转移酶16(VaXET16)的克隆,用于在米曲霉筛选菌株中表达
在此密码子优化野生型红豆(Vigna angularis)木葡聚糖内糖基转移酶16(VaXET16)cDNA通过酵母重组克隆克隆到米曲霉Flp/FRT穿梭载体pDAu571(图5)中,生成载体pDLHD0075(图8)。
表达载体pDLHD0075被构建为包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)可选择标记、URA3酵母可选择标记、酵母2微米复制起点、NA2-tpi启动子、密码子优化飞VaXET16开放阅读框(cDNA序列为SEQ ID NO:31并且氨基酸序列为SEQ ID NO:32)、黑曲霉葡糖淀粉酶终止子、构巢曲霉pyrG选择标记、米曲霉TEF1启动子和米曲霉NIAD终止子之间的酿酒酵母2μm翻转酶ORF、和酿酒酵母2μm翻转酶识别目标FRT-F和FRT-F3。
质粒pDLHD0075通过使用酵母重组克隆合并四个DNA片段生成:片段1包含翻转酶表达盒,FRT-F3,和来自pDAU571的AMG终止子,以及与片段4和2同源的侧翼序列。片段2包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)选择标记、URA3酵母选择标记、来自pDLHD0044的酵母2微米复制原点、和与片段1和3同源的侧翼序列。片段3包含所述NA2-tpi启动子、来自pDLHD0044的VaXET16密码子优化基因、和与片段2和4同源的侧翼序列。片段4包含黑曲霉淀粉葡萄糖苷酶终止子序列(AMG终止子)和作为来自pDAU571的可选择标记的构巢曲霉乳清苷-5’-磷酸脱羧酶基因(pyrG),以及与片段3和1同源的侧翼序列。
使用以下所示的引物615726(正义)和引物615728(反义)扩增片段1。这些引物被设计成包含分别与片段4和2同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。
引物615726(正义):
accgggaggaaggctggaaaGCTTACGAGAAAAGAGTTGGACTTTGAGGG(SEQ ID NO:33)
引物615728(反义):
tgagcgaggaagcggAAGAGCGCCCAATACGCAAACCGCC(SEQ ID NO:34)
片段1在反应中通过PCR来扩增,该反应由10ng的pDAU571、0.5μl的
Figure BDA0001227517190000341
DNA聚合酶、20pmol的引物615726、20pmol的引物615728、1μl的10mM dNTP、10μl的5X
Figure BDA0001227517190000342
HF缓冲液、和35.5μl的水构成。该反应在
Figure BDA0001227517190000343
热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得3.3kb PCR产物(片段1)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR反应管中,充分混合,并且在37℃下孵育60分钟。
使用以下所示的引物615729(正义)和引物615731(反义)扩增片段2。这些引物被设计成包含分别与片段1和3同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。
引物615729(正义):
tgcgtattgggcgctcttCCGCTTCCTCGCTCACTGACTC(SEQ ID NO:35)
引物615731(反义):
tatactttctagagaataggaactcggaataggaacttcaaGGAACAACACTCAACCCTATCTCGGTC(SEQ ID NO:36)
片段2在反应中通过PCR来扩增,该反应由10ng的pDLHD0044、0.5μl的
Figure BDA0001227517190000344
DNA聚合酶、20pmol的引物615729、20pmol的引物615731、1μl的10mM dNTP、10μl的5X
Figure BDA0001227517190000345
HF缓冲液、和35.5μl的水构成。该反应在
Figure BDA0001227517190000346
热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得4.2kb PCR产物(片段2)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR反应管中,充分混合,并且在37℃下孵育60分钟。
使用以下所示的引物615730(正义)和引物615611(反义)扩增片段3。这些引物被设计成包含分别与片段2和4同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。
引物615730(正义):
tccgagttcctattctctagaaagtataggaacttcGCATTTATCAGGGTTATTGTCTCATGAGCGG(SEQ ID NO:37)
引物615611(反义):
tctagatctcgagtcaGATGTCCCTATCGCGTGTACACTCG(SEQ ID NO:38)
片段3在反应中通过PCR来扩增,该反应由10ng的pDLHD0044、0.5μl的
Figure BDA0001227517190000347
DNA聚合酶、20pmol的引物615730、20pmol的引物615611、1μl的10mM dNTP、10μl的5X
Figure BDA0001227517190000348
HF缓冲液、和35.5μl的水构成。该反应在
Figure BDA0001227517190000351
热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得1.7kb PCR产物(片段3)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR反应管中,充分混合,并且在37℃下孵育60分钟。
使用以下所示的引物615610(正义)和引物615727(反义)扩增片段4。这些引物被设计成包含分别与片段3和1同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。
引物615610(正义):
acacgcgatagggacatcTGACTCGAGATCTAGAGGGTGACTGAC(SEQ ID NO:39)
引物615727(反义):
aactcttttctcgtaagcTTTCCAGCCTTCCTCCCGGTAC(SEQ ID NO:40)
片段4在反应中通过PCR来扩增,该反应由10ng的pDAU571、0.5μl的
Figure BDA0001227517190000352
DNA聚合酶、20pmol的引物615610、20pmol的引物615727、1μl的10mM dNTP、10μl的5X
Figure BDA0001227517190000353
HF缓冲液、和35.5μl的水构成。该反应在
Figure BDA0001227517190000354
热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得1.9kb PCR产物(片段4)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR反应管中,充分混合,并且在37℃下孵育60分钟。
使用基于酵母同源性的重组克隆,使用以下程序来合并四个PCR片段。将PCR片段的每种的10μl等分试样与来自鲑鱼睾丸的100μg的单链脱氧核糖核酸(西格玛奥德里奇,圣路易斯,密苏里州,美国)、100μl的菌株YNG318的感受态酵母细胞(酿酒酵母ATCC 208973)、和600μl的PLATE缓冲液(西格玛奥德里奇,圣路易斯,密苏里州,美国)合并,并且混合。将反应在30℃下以200rpm振荡孵育30分钟。然后将该反应在42℃下在没有振荡的情况下继续15分钟。将这些细胞通过在5,000x g下离心1分钟进行沉淀,并且弃去上清液。将细胞球粒悬浮于200μl的高压蒸汽处理的水中,并且分在两个包含合成的所定义的培养基缺少尿苷的琼脂平板,并且在30℃下孵育3天。将这些酵母菌落使用1ml的高压蒸汽处理的水从平板中分离。将这些细胞通过在13,000x g下离心30秒进行沉淀,并且将100μl等分试样的玻璃珠添加到该管中。将细胞和珠混合物悬浮在250μl的P1缓冲液(凯杰公司,巴伦西亚,加利福尼亚州,美国)中,并且然后涡旋1分钟来裂解这些细胞。使用
Figure BDA0001227517190000355
旋转迷你制备型试剂盒纯化质粒DNA。根据制造商的说明书,然后将3μl等分试样的质粒DNA转化到大肠杆菌ONE
Figure BDA0001227517190000356
TOP10电转化感受态细胞中。将50μl的转化细胞散布于每ml补充有100μg氨比西林的2XYT平板上,并且在37℃下孵育过夜。将转化体各自挑入每ml补充有100μg的氨比西林的3ml的LB培养基中,并且在37℃下在250rpm的振荡下生长过夜。使用
Figure BDA0001227517190000361
旋转迷你制备型试剂盒从菌落中纯化质粒DNA。将使用3130XL遗传分析仪的DNA测序用来确认指定为质粒pDLHD0075的最终质粒中三个片段中的每个的存在(图8)。
实例7:在米曲霉筛选菌株JaL1394中按单拷贝的野生型红豆(Vigna angularis)木葡聚糖内糖基转移酶16(VaXET16)表达的确认
米曲霉JaL1394(在WO 2012/160093中披露)用包含密码子优化VaXET16基因的质粒pDLHD0075转化。
将来自米曲霉JaL1394的大约107孢子的接种于500ml摇瓶中的补充有10mM尿苷的100ml的YP+2%葡萄糖培养基中,并且在28℃和110rpm下孵育过夜。将10ml的过夜培养物在125ml无菌真空滤器中过滤,并且将菌丝用50ml的0.7M KCl-20mM CaCl2洗涤两次。将剩余液体通过真空过滤去除,留下垫在滤器上。将菌丝体再悬浮于10ml的0.7M KCl-20mM CaCl2中,并且转移到无菌125ml摇瓶中,该摇瓶包含20mg的
Figure BDA0001227517190000362
200G(诺维信瑞士股份公司(Novozymes Switzerland AG),Neumatt,瑞士)/ml和0.2mg的几丁质酶(西格玛奥德里奇,圣路易斯,密苏里州,美国)/ml(在10ml的0.7M KCl-20mM CaCl2中)。将该混合物在37℃和100rpm下孵育30-90分钟,直到从菌丝体中产生原生质体。将该原生质体混合物通过衬有
Figure BDA0001227517190000363
(Calbiochem公司,圣迭哥,加利福尼亚州,美国)的无菌漏斗进行过滤,到无菌50毫升塑料离心管中,以去除菌丝体碎片。将在
Figure BDA0001227517190000364
上的碎片彻底地用10ml的0.7M KCl-20mM CaCl2进行洗涤并且在2500rpm下,在20℃-23℃下,离心10分钟。去除该上清液,并且将原生质体球粒再悬浮于20ml的1M山梨醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)中。将该步骤重复两次,并且将最终的原生质体球粒再悬浮于1M山梨醇-10mMCaCl2-10mM Tris-HCl(pH 6.5)中,以获得2x107/ml的最终原生质体浓度。
原生质体通过添加两μg的pDLHD0075至无菌12ml塑料离心管的底部转化。将一百μl的原生质体添加至管中,随后添加在10mM CaCl2-10mM Tris-HCl(pH 6.5)中的300μl的60%PEG-4000。将该管用手轻轻混合,并且在37℃下孵育30分钟。将添加五ml的1M山梨糖醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)添加到该转化中,并且将该混合物转移到150mm基本培养基琼脂平板上。将转化板在37℃下孵育直到转化体出现。
挑出单个转化体到新基本培养基琼脂平板,并且在37℃下培养4天,直到转化体形成孢子。新鲜孢子转移到48孔深孔板,这些板包含2ml的YP+2%麦芽糊精培养基,覆盖有可透气密封件,并且在没有振荡下在28℃下生长4天。在4天生长后,将每个转化体的培养基针对木葡聚糖内糖基转移酶活性并且针对木葡聚糖内糖基转移酶表达通过如下所概述的SDS-PAGE来测定。
活性测定展示,转化体产生活性木葡聚糖内糖基转移酶。
碘比色法测定来确定木葡聚糖内糖基转移酶活性
木葡聚糖内糖基转移酶活性使用由布洛瓦(Sulova)等人,1995,分析生物化学(Analytical Biochechemistry)229:80-85中描述的碘比色测定的修改版本进行测定。对于每个反应,5μl的罗望子木葡聚糖(麦格酶公司,布雷,英国)(5mg/ml在水中)与20μl的木葡聚糖低聚物(麦格酶公司,布雷,英国)(5mg/ml在水中)、10μl的400mM柠檬酸钠pH5.5合并,并且分散到96孔板中。反应通过添加5μl的液体培养液至每个孔中启动,并且在37℃孵育板10分钟。反应通过添加200μl的由14%(w/v)Na2SO4、0.2%KI、0.1M HCl和0.5%I2构成的溶液猝灭,并且在黑暗中孵育30分钟,然后在
Figure BDA0001227517190000371
M5分光光度计(Molecular Devices公司,桑尼维尔,加利福尼亚州,美国)中在620nm测量吸光度。
使用8%-16%
Figure BDA0001227517190000372
无染色SDS-PAGE凝胶(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)进行SDS-PAGE,并且使用以下设置,将该凝胶用无染色成像仪(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)成像:5分钟活化,自动成像曝光(强带),高亮饱和像素=ON,颜色=考马斯酸性染料,和带检测、分子量分析和报告禁用。SDS-PAGE揭示了大约32kDa的野生型VaXET16带。
实例8:红豆(Vigna angularis)木葡聚糖内糖基转移酶16(VaXET16)的改进的表达变体的构建和鉴定
VaXET16基因突变体文库通过位点饱和诱变构建。VaXET16基因的突变体文库(文库的每个片段包括突变VaXET16基因+构巢曲霉乳清苷-5’-磷酸脱羧酶pyrG选择标记与FRT-F和FRT-F3翻转酶识别靶序列)与包括米曲霉TEF1启动子和米曲霉NIAD基因终止子之间的酿酒酵母2μm翻转酶ORF的pDLHD0095载体一起转化到如先前实例中所述的米曲霉JaL1394的原生质体中。37℃下在基本培养基琼脂平板上原生质体恢复4天后,挑出单个菌落至包含2ml的YP+2%麦芽糖糊精培养基的48孔深孔板中,覆盖有透气密封,并且在没有振荡下在28℃下生长4天。在液体培养基生长4天后,如在先前实例中所述测定木葡聚糖内糖基转移酶活性,并且更高活性变体被打分为表达命中。
孢子纯化单个突变体菌株,并且再次培养以产生新鲜培养液,用于使用密码子优化基因,相对于表达野生型VaXET16米曲霉JaL1394菌株进行再次测试。如在先前实例中所述,通过SDS-PAGE分析培养液,用于增加木葡聚糖内糖基转移酶蛋白产物的生产。
十一个表征的变体在来自48孔深孔板培养的4天培养液中,优于亲本基因的表达产量的相对改进在下表1中示出。相同的培养液的SDS-PAGE分析展示所有变体的优于野生型VaXET的增加强度的VaXET带,这与在活性测定中观察到的相对改进很好地相关。野生型VaXET及其变体的SDS-PAGE带为32kDa,除包含N175S突变的变体由于另外的糖基化具有大约37kDa的带。
表1.
Figure BDA0001227517190000381
实例9:米曲霉中红豆(Vigna angularis)木葡聚糖内糖基转移酶16变体(VaXET16)基因的改进的表达的发酵规模确认
发酵工艺被用来相对于野生型VaXET16,表达VaXET16变体、A40G+I53A+N175S和A40G+F183I。
摇瓶培养基由以下构成:50g的蔗糖、10g的KH2PO4、0.5g的CaCl2、2g的MgSO4·7H2O、2g的K2SO4、2g的尿素、10g的酵母提取物、2g的柠檬酸、0.5ml的痕量金属溶液、以及去离子水补足至1升。痕量金属溶液由以下构成:13.8g的FeSO4·7H2O、14.3g的ZnSO4·7H2O、8.5g的MnSO4·H2O、2.5g的CuSO4·5H2O、3g的柠檬酸、以及去离子水补足至1升。
将一百ml的摇瓶培养基添加至500ml摇瓶。用来自固体平板培养的两个塞接种摇瓶,并且在轨道摇床上以200rpm在34℃孵育24小时。将50ml的烧瓶培养液用于接种3升发酵容器。
每升分批发酵培养基(Fermentation batch medium)由以下构成:10g的酵母提取物、24g的蔗糖、5g的(NH4)2SO4、2g的KH2PO4、0.5g的CaCl2·2H2O、2g的MgSO4.7H2O、1g的柠檬酸、2g的K2SO4、0.5ml的止泡剂、和0.5ml的痕量金属溶液。每升痕量金属溶液由以下构成:13.8g的FeSO4·7H2O、14.3g的ZnSO4·7H2O、8.5g的MnSO4·H2O、2.5g的CuSO4·5H2O,和3g的柠檬酸。发酵补料培养基(fermentation feed medium)由麦芽糖构成。
将总计1.8升的发酵分批培养基添加到三升玻璃套发酵器中。发酵补料培养基以0到4.4g/l/hr的速度给予。将发酵容器维持在34℃的温度,pH控制在6.1+/-0.1的设定点。将空气以l vvm的速率添加到容器中,且且用以1100到1300rpm旋转的Rushton叶轮搅拌。在发酵运行的第3、4、5、6和7天取样,并且在3000x g离心以去除生物质。将上清液过滤灭菌,并且在5℃至10℃储存。
可以通过以下概述的荧光偏振测定并且通过SDS-PAGE分析(参见上文),相对于野生型密码子优化基因,确定VaXET16变体表达水平。
针对木葡聚糖内糖基转移活性的荧光偏振测定
根据由周(Zhou)等人,2006,生物催化与生物转化(Biocatalysis andBiotransformation)24:107-120所描述的程序,通过木葡聚糖低聚物的还原端的还原氨化,随后在100mM碳酸氢钠(pH 9.0)在室温下将XGO的氨基基团结合到荧光素异硫氰酸酯异构体I(西格玛奥德里奇(Sigma Aldrich),圣路易斯,密苏里州,美国)24小时,来产生荧光素异硫氰酸酯标记的木葡聚糖低聚物(FITC-XGO)。将结合反应产物在真空中浓缩干燥,溶解于0.5ml的去离子水,并且通过硅胶层析进行纯化,该硅胶层析用从100:0:0.04至70:30:1梯度的乙腈:水:乙酸作为流动相进行洗脱。通过蒸发该缓冲液、溶解于D2O(西格玛奥德里奇,圣路易斯,密苏里州,美国),并且使用Varian400MHz MercuryVx(安捷伦(Agilent),圣克拉拉,加利福尼亚州,美国)通过1H NMR分析来确认纯度和产物同一性。在-20℃下在黑暗中,储存干燥的FITC-XGO,并且在解冻过程中干燥。
一mg的FITC-XGO与在200μl反应中的每ml的20mM柠檬酸钠pH 5.0的1mg的罗望子木葡聚糖(麦格酶公司,布雷,英国)和18mg的VaXET16一起孵育至少30分钟。合并样品混合物并且通过添加冰冷的乙醇至80%(v/v)的终浓度进行沉淀,并且在4℃下孵育过夜。沉淀的荧光素异硫氰酸标记木葡聚糖(FITC-XG)通过使用LEGENDTM RT加离心机(赛默飞世尔科技公司(Thermo Scientific),沃尔瑟姆,马萨诸塞州,美国)在3000rpm离心,倾析乙醇进行回收,并且在室温下干燥24小时。将FITC-XG溶解在最小体积的去离子水中直到溶解并储存在-20℃。将冷冻的FITC-XG解冻并且冻干过夜。将冻干粉末溶解在500μl的去离子水中并且通过在488nm的吸光度定量。
按以下方式制备大规模批次的FITC-XG。在去离子水中制备每ml溶液7.9mg的FITC-XGO。彻底混合四十ml的10mg的罗望子木葡聚糖(麦格酶公司,布雷,英国)/ml的去离子水、452ml的7.9mg的FITC-XGO/ml的去离子水、2ml的400mM柠檬酸钠(pH 5.5)、和1.2ml的1.4mg的VaXET16/ml的20mM柠檬酸钠(pH 5.5),并且在室温下孵育过夜。在过夜孵育后,通过添加冰冷的乙醇至终体积110ml来沉淀FITC-XG,彻底混合,并且在4℃下整夜孵育。用水洗涤沉淀的FITC-XG,并且然后转移到圆底烧瓶(Erlenmeyer bulb)中。通过使用EZ-2Elite蒸发器(SP Scientific/Genevac公司,斯通里奇,纽约,美国)蒸发4小时来去除残余的水和乙醇。将干燥的样品溶解于水中,并且用去离子水将体积调整到48ml,以产生,在所希望的100kDa的平均分子量下,5mg/ml的最终FITC-XG浓度。
使用以下测定来评估木葡聚糖内糖基转移活性。如以上描述的制备200μl的反应,该反应包含1mg的罗望子木葡聚糖/ml、0.01mg/ml FITC-XGO,并且将10μl的适当稀释的XET在25℃下在不透明96孔微量滴定板中的20mM柠檬酸钠(pH 5.5)中孵育10分钟。在这个时间段,以顶级阅读方向,用490nm的激发波长、520nm的发射波长、激发路径中495截止滤波器、高精度(100次读取)、和中光电倍增管的灵敏度,使用
Figure BDA0001227517190000402
M5酶标仪(分子器件公司(Molecular Devices),森尼维耳市,加利福尼亚州,美国)连续监测荧光偏振。将荧光XGO以XET依赖性掺入非荧光XG中导致随着时间增加荧光偏振。使用偏振时间进程曲线的线性区域的斜率来确定该活性。
相对于野生型VaXET16,对于两个变体的7天培养液,优于亲本基因,产量相对改进在下表2中示出。按比野生型VaXET16 3.1X更大的量产生变体A40G+I53A+N175S,而按比野生型VaXET16 1.2X更大的量产生变体A40G+F183I。相同的培养液的SDS-PAGE分析示出两个变体的优于野生型VaXET的增加强度的VaXET带这与在活性测定中观察到的相对改进很好地相关。在第3,4,5,6,和7天所取的样品的SDS-PAGE分析示出VaXET的增加的生产,并且各变体日益增强,其中在第7天最强。
表2.
Figure BDA0001227517190000401
在此描述并且要求保护的本发明不局限于在此披露的特定方面的范围,因为这些方面旨在作为本发明若干方面的说明。预期任何等效方面都处于本发明的范围内。实际上,除在此所示和描述的那些之外,本发明的不同修改对于本领域普通技术人员而言从前述描述将变得清楚。这样的修改也旨在落入所附权利要求的范围内。在有冲突的情况下,以包括定义的本披露为准。
实例10:里氏木霉原生质体产生与转化
使用基于宾替拉(Penttila)等人,1987,基因(Gene)61:155-164的以下方案进行原生质体制备与转化。将里氏木霉菌株在25ml的补充有2%(w/v)葡萄糖和10mM尿苷的YP培养基中在27℃下、伴随着以90rpm进行的轻轻搅拌培养17小时。将菌丝体通过使用真空驱动一次性过滤系统(密理博公司(Millipore))过滤来收集,并且用去离子水洗涤两次,并且用1.2M山梨醇洗涤两次。通过在20ml的每ml包含15mg的
Figure BDA0001227517190000413
200G(诺维信公司,鲍斯韦,丹麦(Novozymes A/S,Bagsvaerd,Denmark))和每ml包含0.36单位的壳多糖酶(西格玛化学有限公司(Sigma Chemical Co.)的1.2M山梨醇中在34℃下伴随着以90rpm的进行的轻轻振荡来悬浮经洗涤的菌丝体,持续15-25分钟,从而产生原生质体。将原生质体通过在400x g下离心7分钟来收集,并用冷的1.2M山梨醇洗涤两次。将原生质体使用血球计数器来计数,并再悬浮于STC中至1x108个原生质体/ml的终浓度。
将大约1-10μg的DNA添加至100μl的原生质体溶液中并且轻轻混合。然后添加PEG缓冲液(250μl),并且混合转化反应,并且在34℃下孵育30分钟。然后添加STC(3ml)到该转化反应并且混合。然后将转化反应物散布到COVE平板上用于amdS选择。将这些平板在28℃下孵育6-11天。
对于需要潮霉素选择的转化,在STC中的反应混合物散布到补充有1M的蔗糖的PDA平板上。在28℃下孵育16小时后,将20ml的、每ml补充有35μg的潮霉素B的覆层PDA培养基添加至各平板。将这些平板在28℃下孵育4-7天。
实例11:来自里氏木霉菌株的基因组DNA提取
使这些里氏木霉菌株在补充有在250ml带挡板的摇瓶中的2%葡萄糖(w/v)的50ml的YP培养基中在28℃下伴随着以200rpm的搅拌生长2天。使用漏斗衬里的
Figure BDA0001227517190000411
(EMD化学品公司(EMD Chemicals Inc.))收集来自各培养的菌丝体,挤压干燥,并在液氮下冷冻。将冷冻的菌丝体转移到预冷的研钵和研杵。每个菌丝制剂磨成细粉,并且用液氮保持冷冻。将总共1-2克的粉末转移到50ml管中,并且使用
Figure BDA0001227517190000412
植物Maxi试剂盒(凯杰公司)从研磨菌丝粉末中提取基因组DNA。将预热至65℃的五ml的缓冲液AP1(凯杰公司)添加到50ml管中,随后添加10μl的RNA酶A 100mg/ml原液(凯杰公司),并且在65℃孵育2-3小时。添加共1.8ml AP2缓冲液(凯杰公司),并将管在冰上孵育5分钟,随后用LEGENDTMRT吊桶式离心机(赛默飞世尔科技公司(Thermo Fisher Scientific Inc.))在3000-5000X g离心5分钟。将上清液转移到置于50毫升收集管中的QIAShredderTM大核酸纯化柱(凯杰公司),并且在室温下(15℃-25℃)在3000-5000x g下甩平式转子中离心5分钟。在收集管中的流过液体被转移到新50ml管中,同时不干扰沉淀。1.5mL体积的缓冲液AP3/E(凯杰公司)添加到澄清的裂解液中,并且通过涡旋振荡立即混合。包括可能已经形成的任何沉淀的样品(最多15毫升),吸移到置于50毫升收集管中的
Figure BDA0001227517190000421
大核酸纯化柱(凯杰公司)中,并且在室温下(15℃-25℃)在3000-5000x g下甩平式转子中离心5分钟。弃去流过液体。十二ml的缓冲液AW(凯杰公司)添加至
Figure BDA0001227517190000422
大核酸纯化柱,并在3000-5000x g离心10分钟,以干燥该膜。弃去流过液体和收集管。
Figure BDA0001227517190000423
大核酸纯化柱转移到新50ml管中。通过添加预热至65℃的1-1.5ml的试剂盒提供的缓冲液AE直接洗脱DNA到
Figure BDA0001227517190000424
大核酸纯化柱膜上,在室温下(15℃-25℃)孵育5分钟,并且然后在3000-5000X g离心5分钟。基因组DNA的浓度和纯度通过在260nm和280nm测量吸光度确定。
实例12:转化体的Southern印迹分析
用选择的一种或多种限制性内切酶消化来自每个转化体的两μg的基因组DNA。这些消化提交至在TAE缓冲液中的0.7%-0.8%琼脂糖凝胶电泳,并且使用
Figure BDA0001227517190000425
(GE医疗集团生命科学部(GE Healthcare Life Sciences))印迹至
Figure BDA0001227517190000426
N+印迹膜(GE医疗集团生命科学部(GE Healthcare Life Sciences))或
Figure BDA0001227517190000427
超负荷膜(施莱歇&许尔生物科技公司(Schleicher&Schuell BioScience))持续大约1-2小时。该膜与地高辛标记基因特异性或位点特异性探针杂交,这些探针是通过使用PCR DIG探针合成试剂盒(罗氏应用科学公司)的PCR合成。
将该探头煮沸持续5分钟,在冰上冷却持续2分钟,并添加至10ml的DIG Easy Hyb中以产生该杂交溶液。杂交在DIG Easy Hyb缓冲液中在42℃下进行15-17小时。然后将该膜用2X SSC加上0.1%SDS在室温下洗涤5分钟,随后在65℃下用0.5X SSC加上0.1%SDS洗涤两次,每次15分钟。在1X封闭液(罗氏应用科学公司)洗涤至少一小时,洗涤一次后,将膜用50ml包含3.75U的抗洋地黄毒苷-AP Fab片段(罗氏应用科学公司)的封闭液孵育10分钟,随后在1X洗涤液(罗氏应用科学公司)中洗涤两次。
Figure BDA0001227517190000428
即用试剂(二钠2-氯-5-(4-甲氧基螺(1,2-二氧杂环丁烷-3,2’-(5’-氯)三环[3.3.1.13,7]癸烷}-4-基)-1-苯基磷酸酯;罗氏应用科学公司)然后被施加至膜,并且通过放射自显影方法检测探针-靶杂交体。
实例13:FLP/FRT整合质粒pJfyS148B的构建
FRT-F3位点首先使用
Figure BDA0001227517190000429
II XL定点诱变试剂盒(安捷伦科技),用以下所示的诱变插入引物被插入到质粒pSMai155(WO 05/074647)中。
正向引物:
5'-
CGAATTCTGCATTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCAGATATCCATCACACTGGCG-3'(SEQ ID NO:41)
反向引物:
5'-
GCCAGTGTGATGGATATCTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAATGCAGAATTCGC-3’(SEQ ID NO:42)
诱变PCR包含10ng的pSMai155、200μM dNTP、125ng的每个引物、1X
Figure BDA0001227517190000431
反应缓冲液(安捷伦科技)、3μl的
Figure BDA0001227517190000432
试剂(安捷伦科技)以及2.5单位的Pfu超高保真DNA聚合酶(安捷伦科技),最终体积为50μl。PCR在热循环仪中进行,程序为1个循环,在95℃下持续1分钟;18个循环,每个循环在95℃下持续50秒,在60℃下持续50秒,以及在68℃下持续40秒;以及1个循环,在68℃下持续7分钟。添加一μl的试剂盒提供的Dpn I,并且在37℃下孵育1小时。两μl的Dpn I处理后的反应添加至14ml管中45μl的试剂盒提供的XL10-Gold超活性大肠杆菌细胞(安捷伦科技),并且在冰上孵育30分钟。将该管在42℃下孵育30秒,此后添加0.5ml的SOC培养基。然后在37℃下伴随200rpm搅拌,将该管孵育1小时,此后将250μl各自涂板至2X 150mm 2XYT+氨苄西林平板上并在37℃孵育过夜。将大肠杆菌转化体接种到在14ml管中的3ml的LB+Amp培养基中,并且在37℃下孵育过夜,伴随在200rpm的搅拌。使用
Figure BDA0001227517190000433
9600(凯杰公司)分离质粒DNA。插入通过DNA测序来确认。一个转化体被鉴定为包含对应于FRT-F3位点的希望的序列插入,并且该质粒指定为pJfyS148A。
然后将FRT-F序列使用
Figure BDA0001227517190000434
优越PCR克隆试剂盒(克罗泰克实验有限公司(Clontech Laboratories,Inc.))插入到质粒pJfyS148A中。FRT-F位点首先使用以下所示的引物,通过PCR,从质粒pRika147(WO2012/120093)扩增。
正向引物:
5'-
ATATCCATCACACTGGCGGCCGCTCAACTCTCTCCTCTAGGTTGAAGTTCCTATTCCGAGTTC-3’(SEQ ID NO:43)
反向引物:
5'-
AGGATGCATGCTCGAGCATGCACTAGCTAGTTGAAGTTCCTATAC-3’
(SEQ ID NO:44)
该PCR由以下各项构成:20ng的pRika147、200μM dNTP、0.4μM引物、1X
Figure BDA0001227517190000435
反应缓冲液(赛默飞世尔科技公司)、以及2单位的
Figure BDA0001227517190000436
高保真DNA聚合酶(赛默飞世尔科技公司),最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;30个循环,每个循环在95℃下持续25秒,在50℃下持续25秒,以及在72℃下持续40秒;以及1个循环,在72℃下持续7分钟。将完成的PCR提交至在TAE缓冲液中的2%琼脂糖凝胶电泳,其中从凝胶切离0.1kb片段,并且使用
Figure BDA0001227517190000447
凝胶提取试剂盒(凯杰公司)提取琼脂糖。简言之,将3体积的试剂盒-提供的缓冲液QG添加至该凝胶切片并在50℃下溶解持续大约10分钟。通过转移到该柱并且在13,000rpm下离心持续1分钟,将溶解的凝胶切片施用于试剂盒-提供的旋转柱。将该柱用750μl的试剂盒-提供的缓冲液PE洗涤并再次离心。用10μl的试剂盒-提供的缓冲液EB洗脱DNA。
将0.1kb PCR产物使用
Figure BDA0001227517190000441
优越PCR克隆试剂盒插入到Sal I-消化的pJfyS148A中。该反应由以下各项构成:在10μl反应体积中1X
Figure BDA0001227517190000442
Figure BDA0001227517190000443
反应缓冲液、125ng的pJfyS147A、20ng的FRT-F PCR产物、和1μl的
Figure BDA0001227517190000444
酶。将该反应在50℃下孵育15分钟。然后通过添加至包含这些感受态细胞的单次使用管中并且将这些细胞在冰上孵育5分钟,添加40μl的Te至该反应,并且2μl被转化到ONE
Figure BDA0001227517190000445
TOP10大肠杆菌化学感受态细胞(英杰公司)。将该试管在42℃下培养,持续30秒之后,添加250μl的SOC培养基。然后在37℃下伴随200rpm搅拌,将该管孵育1小时,并且将250μl转移到150mm 2XYT+氨苄西林平板上并且在37℃孵育过夜。将大肠杆菌转化体接种到在14ml管中的3ml的LB+Amp培养基中,并且在37℃下孵育过夜,伴随在200rpm的搅拌。使用
Figure BDA0001227517190000446
9600(凯杰公司)分离来自大肠杆菌转化体的质粒DNA。插入通过DNA测序来确认。一个转化体被鉴定为包含没有PCR错误的插入,并且该质粒指定为pJfyS148B。
实例14:质粒pJfyS156的构建
构建质粒pJfyS156,cbh2基因启动子和翻转酶基因使用以下所示基因特异性引物进行PCR扩增,并且插入到质粒pJfyS148B中。
翻转酶
正向引物:
5'-CACCCTCTGTGTATTGCACCATGCCCCAGTTCGATATCCTCTGCA-3'(SEQ ID NO:45)
反向引物:
5'-AAACTCTAGGATGCATGCAAGTGAGGCTATTGCCTATCAGCTC-3'(SEQ ID NO:46)
cbh2基因启动子
正向引物:
5'-CATCACACTGGCGGCCGCGAATTCTAGGCTAGGTATGC-3'(SEQ ID NO:47)
反向引物:
5'-GGTGCAATACACAGAGGGTG-3'(SEQ ID NO:48)
该PCR由以下各项构成:对于翻转酶PCR,20ng的模板pRiKa147,或对于cbh2启动子PCR,150ng的里氏木霉981-O-8基因组DNA、200μM dNTPs、0.4μM引物、1X
Figure BDA0001227517190000451
反应缓冲液、和2单位的
Figure BDA0001227517190000452
高保真DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;30个循环,每个循环在95℃下持续30秒,在57℃下持续30秒,以及在72℃下持续2分钟;以及1个循环,在72℃下持续7分钟。完成的PCR被提交至在TAE缓冲液中的1%琼脂糖凝胶电泳,其中从凝胶切离1.2和0.6kb带,分别对应于酿酒酵母翻转酶基因的编码区和NIAD终止子以及cbh2基因启动子,并且使用
Figure BDA0001227517190000453
提取II试剂盒(Macherey-Nagel有限公司,美国宾夕法尼亚州伯利恒(Bethlehem,PA,USA))提取琼脂糖。将三体积的试剂盒提供的NT缓冲液添加至该凝胶切片上,并将该样品在50℃下加热10分钟。将全部溶液转移到试剂盒提供的离心柱。将该柱在13,000rpm下离心持续1分钟并且用试剂盒-提供的洗涤缓冲液NT3进行洗涤并再离心。将DNA用30μl的试剂盒-提供的洗脱NE缓冲液进行洗脱并且在13,000rpm下离心持续1分钟。
cbh2基因启动子和翻转酶编码序列使用
Figure BDA0001227517190000454
优越PCR克隆试剂盒以单一步骤被插入到Xho I位线性化pJfyS148B中。该反应物由以下构成:在10μl反应体积中1X
Figure BDA0001227517190000455
反应缓冲液、180ng的Xho I-位线性化pJfyS148B、100ng 0.6kb的cbh2启动子PCR产物、240ng的1.2kb的翻转酶PCR产物、和1μl
Figure BDA0001227517190000456
酶。该反应在37℃下孵育15分钟,并且接着在50℃下持续15分钟。根据实例14,然后添加40μl的TE至该反应,并且2μl被转化到ONE
Figure BDA0001227517190000457
TOP10大肠杆菌化学感受态细胞中。将大肠杆菌转化体接种到在14ml管中的3ml的LB+Amp培养基中,并且在37℃下孵育过夜,伴随在200rpm的搅拌。使用
Figure BDA0001227517190000458
9600分离质粒DNA。插入通过DNA测序来确认。一个转化体被鉴定为包含没有PCR错误的插入,并且该质粒指定为pJfyS155。
使用以下所示的引物,通过PCR,从pEJG107(WO 05/047499)扩增烟曲霉β-葡糖苷酶基因。
正向引物:
5'-ACCGCGGACTGCGCACCATGAGATTCGGTTGGCTCGAGG-3'(SEQ ID NO:49)
反向引物:
5'-TTCGCCACGGAGCTTACTAGTAGACACGGGGCAGAGGC-3'(SEQ ID NO:50)
该PCR由以下各项构成:20ng的pEJG107、200μM dNTP、0.4μM引物、1X
Figure BDA0001227517190000459
反应缓冲液、以及2单位的
Figure BDA00012275171900004510
高保真DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;25个循环,每个循环在95℃下持续30秒,在57℃下持续30秒,以及在72℃下持续2分钟;以及1个循环,在72℃下持续7分钟。将完成的PCR提交至在TAE缓冲液中的1%琼脂糖电泳,其中从凝胶切离3kb带并且使用
Figure BDA0001227517190000461
凝胶提取试剂盒提取琼脂糖(实例13)。
将烟曲霉β-葡糖苷酶PCR产物使用
Figure BDA0001227517190000462
优越PCR克隆试剂盒被插入到Nco I/Pac I消化的pJfyS155中。该反应由以下各项构成:在10μl反应体积中150ng的NcoI/Pac I消化pJfyS155、100ng的烟曲霉β-葡萄糖苷酶PCR产物、1X
Figure BDA0001227517190000463
优越缓冲液、和1μl的
Figure BDA0001227517190000464
酶。该反应在37℃下孵育15分钟,并且接着在50℃下持续15分钟。根据实例13,然后添加40μl的TE至该反应,并且2μl被转化到ONE
Figure BDA0001227517190000465
TOP10大肠杆菌化学感受态细胞中。使用
Figure BDA0001227517190000466
9600分离来自大肠杆菌转化体的质粒DNA。插入通过DNA测序来确认。一个转化体被鉴定为包含没有PCR错误的插入,并且该质粒指定为pJfyS156(图9)。
实例15:质粒pDM313的构建
包含hpt标记的一部分、FRT-F3位点和里氏木霉gpdA启动子的一部分的0.38kbPCR片段使用以下所示的引物从pJfyS156扩增。
正向引物:
5’-CGTGTTTCTTCCCATTCGCATGCGACCTCGTGGTCATTGAC-3’(SEQ ID NO:51)
反向引物:
5’-
GCTTTGACGTTACATTGACGTACTTATAAGCGGCCGCCAGTGTGATGGA-3’(SEQ ID NO:52)
该PCR由以下构成:50皮摩尔的各引物、100ng的pJfyS156的DNA、1X的PHUSIONTM高保真热启动DNA聚合酶缓冲液(赛默飞世尔科技公司)、1μl的10mM dNTPs的共混物,和1个单位的PHUSIONTM高保真热启动DNA聚合酶(赛默飞世尔科技公司),最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在98℃下持续2分钟;34个循环,每个循环在98℃下持续15秒,在59℃下持续30秒,以及在72℃下持续1分钟;以及1个循环,在72℃下持续10分钟。
包含里氏木霉gpdA启动子的1.0kbPCR片段使用以下所示的引物,从里氏木霉RutC30基因组DNA扩增。
正向引物:
5’-
TCCATCACACTGGCGGCCGCTTATAAGTACGTCAATGTAACGTCAAAGC-3’(SEQ ID NO:53)
反向引物:
5’-
TGCAGAGGATATCGAACTGGGGCATTTTGTATCTGCGAATTGAGCTTG-3’(SEQ ID NO:54)
该PCR由以下构成:50皮摩尔的各引物、100ng的里氏木霉RutC30基因组DNA、1X的PHUSIONTM高保真热启动DNA聚合酶缓冲液、1μl的10mM dNTPs的共混物,和1个单位的PHUSIONTM高保真热启动DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在98℃下持续2分钟;34个循环,每个循环在98℃下持续15秒,在59℃下持续30秒,以及在72℃下持续1分钟;以及1个循环,在72℃下持续10分钟。
包含酿酒酵母翻转酶基因的编码区和niaD终止子的1.8kb PCR片段使用以下所示的引物从质粒pJfyS156扩增。
正向引物:
5’-
CAAGCTCAATTCGCAGATACAAAATGCCCCAGTTCGATATCCTCTGCA-3’(SEQ ID NO:55)
反向引物:
5’-GCTGTTTAAACTCTAGGATGCATGCAAGTGAGGCTATTGCC-3’(SEQ ID NO:56)
该PCR由以下构成:50皮摩尔的各引物、100ng的pJfyS156 DNA、1X的PHUSIONTM高保真热启动DNA聚合酶缓冲液、1μl的10mM dNTPs的共混物,和1个单位的PHUSIONTM高保真热启动DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在98℃下持续2分钟;34个循环,每个循环在98℃下持续15秒,在59℃下持续30秒,以及在72℃下持续1分钟;以及1个循环,在72℃下持续10分钟。
上述三个完成的PCR通过在TAE缓冲液中的0.8%琼脂糖凝胶电泳进行分析,其中0.38kb,1.0kb,和1.8kb的片段被确认。在原始反应中的PCR片段被用作如下描述的SOE PCR的模板。
0.38kb和1.0kb PCR片段使用如下所示的引物,通过SOE PCR被连接。
正向引物:
5’-CGTGTTTCTTCCCATTCGCATGCGACCTCGTGGTCATTGAC-3’(SEQ ID NO:57)
反向引物:
5’-
TGCAGAGGATATCGAACTGGGGCATTTTGTATCTGCGAATTGAGCTTG-3’(SEQ ID NO:58)
该PCR由以下构成:50皮摩尔的各引物、0.3μl的0.38kb片段PCR、0.6μl的1.0kb片段PCR、1X的PHUSIONTM高保真热启动DNA聚合酶缓冲液、1μl的10mM dNTPs的共混物,和1个单位的PHUSIONTM高保真热启动DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在98℃下持续2分钟;34个循环,每个循环在98℃下持续15秒,60℃下持续30秒,以及在72℃下持续1.5分钟;以及1个循环,在72℃下持续10分钟。进行五个SOE PCR并且合并反应。1.36kb SOE PCR片段和包含翻转酶编码序列和niaD终止子的1.8kb PCR片段通过在TAE缓冲液中的0.8%琼脂糖凝胶电泳被分离,其中从凝胶切离1.36kb片段和1.8kb片段,并且使用的
Figure BDA0001227517190000481
提取II试剂盒提取(实例14)。
十七μg的pJfyS156DNA用SphI消化并且通过在TAE缓冲液中的0.8%琼脂糖凝胶电泳被纯化,其中从凝胶切离大约8.7kb片段,并且使用的
Figure BDA0001227517190000482
提取II试剂盒提取(实例14)。
1.36 kb SOE PCR片段和包含翻转酶编码序列和niaD终止子的1.8 kb PCR片段,使用
Figure BDA0001227517190000483
HD克隆试剂盒被插入SPH I消化的pJfyS156中。该反应由以下各项构成:在10μl反应体积中116ng的Sph I消化的pJfyS156、57ng的1.36 kb SOE PCR片段、69ng的1.8kb PCR片段、和2μl的具有酶的
Figure BDA0001227517190000484
Figure BDA0001227517190000485
缓冲液。将该反应在50℃下孵育15分钟并且然后在冰上冷却。添加TE的40μl等分试样。根据实例13,两μl的反应转化到ONE
Figure BDA0001227517190000486
TOP10大肠杆菌化学感受态细胞中。使用
Figure BDA0001227517190000487
9600,将质粒DNA从转化体中分离。通过用Nsi I的限制性内切酶消化筛选转化体,这产生2.1kb,2.6kb,和7kb片段。一个克隆的DNA测序证实构建体包含没有PCR错误的正确插入。该构建体指定为pDM313。
实例16:质粒pQM43的构建
通过FRT-F位点,构建质粒pQM43,用于将在其5’侧翼是FRT-F位点的非功能amdS片段(指定为“非功能amdS片段3”)靶向至里氏木霉cbh1基因座。在该构建体中,FRT-F位点(49bp)添加至如以下描述的大约1kb非功能amdS片段的第一内含子内。包含里氏木霉cbh15’侧翼区和FRT-F片段的大约400bp片段使用如下所示的引物1208187和1208194从里氏木霉RutC30基因组DNA扩增。使用如下所示的引物1208195和1208196,从pAllo1(WO 04/111228)扩增侧翼是FRT-F位点的非功能amdS片段3。
引物1208187:
5’-GATTGAGTTGAAACTGCCTAAGATCTCG-3’(SEQ ID NO:59)
引物1208194:
5’-
CTATACTTTCTAGAGAATAGGAACTCGGAATAGGAACTTCAAGGTGCGCAGTCCGCGGTTGAC-3’(SEQ ID NO:60)
引物1208195:
5’-
CTATTCCGAGTTCCTATTCTCTAGAAAGTATAGGAACTTCGGCGTTGTTACATCTCCCTGAG-3’(SEQID NO:61)
引物1208196:
5’-GCGTCAGGCTTTCGCCACGTCTACGCCAGGACCGAGCAAG-3’(SEQ ID NO:62)
第一PCR由以下各项构成:100ng的里氏木霉RutC30基因组DNA、1μl的10mM的dNTPs、1μM引物、1X的
Figure BDA0001227517190000491
高保真反应缓冲液(赛默飞世尔科技公司)、和1单位的
Figure BDA0001227517190000492
热启动高保真DNA聚合酶(赛默飞世尔科技公司),最终体积为50μl。第二PCR由以下各项构成:100ng的pAllo1、1μl的10mM的dNTPs、1μM的引物、1X的
Figure BDA0001227517190000493
高保真反应缓冲液,和1单位的
Figure BDA0001227517190000494
热启动高保真DNA聚合酶,最终体积为50μl。两个反应均在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;35个循环,每个循环在95℃下持续15秒,在60℃下持续30秒,以及在72℃下持续1分15秒;以及1个循环,在72℃下持续10分钟。PCR产物通过在TAE缓冲液中的0.7%琼脂糖凝胶电泳被分离,其中从凝胶切离大约400kb和1kb片段,并且使用
Figure BDA0001227517190000495
提取II试剂盒提取(实例14)。
第三PCR由以下各项构成:100ng的400bp和1kb纯化的PCR产物,1μl的10mM的dNTPs、1X的
Figure BDA0001227517190000496
高保真反应缓冲液,和1单位的
Figure BDA0001227517190000497
热启动高保真DNA聚合酶,最终体积为48μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;和5个循环,每个循环在95℃下持续15秒,在60℃下持续30秒,以及在72℃下持续2分钟。然后按1μM的终浓度添加引物1208187和1208196,并且继续30个循环,每个循环在95℃下持续15秒,在60℃下持续30秒,以及在72℃下持续2分钟;以及1个循环,在72℃下持续10分钟。如以上所述,PCR产物通过在TAE缓冲液中的0.7%琼脂糖凝胶电泳被分离,其中从凝胶切离大约1.4kb的片段,并且使用
Figure BDA0001227517190000498
提取II试剂盒提取。
将1.4kb PCR产物使用IN-FUSIONTM HD克隆试剂盒(克罗泰克实验有限公司(Clontech Laboratories,Inc.))插入到大约9.3kb BgIII/Pac I消化的pJfyS139(WO2013/028927)中。该反应由以下各项构成:在10μl反应体积中1X IN-FUSIONTM HD酶预混物(克罗泰克实验有限公司(Clontech Laboratories,Inc.))、200ng的BgIII/Pac I消化的pJfyS139、和61ng的1.4kb PCR产物。将该反应在50℃下孵育15分钟。根据实例13,孵育期后,1μl等分试样被转移到ONE
Figure BDA0001227517190000499
TOP10化学感受态细胞。使用
Figure BDA00012275171900004910
9600,将质粒DNA从转化体中分离。插入通过DNA测序来确认。一个转化体被鉴定为包含没有PCR错误的插入,并且该质粒指定为pQM43(图10)。
实例17:里氏木霉菌株AgJg115-104-7B1的原生质体产生和转化,用来缺失里氏木霉42kDa天冬氨酸蛋白酶,从而产生里氏木霉AgJg115-118-1H1
根据实例10,进行里氏木霉菌株AgJg115-104-7B1的原生质体制备和转化。
将九十六μg的转化质粒pAgJg118(WO 2011/075677)用Pme I消化,并且通过在TAE缓冲液中的1%琼脂糖凝胶电泳被纯化,其中从凝胶切离DNA带,并且使用
Figure BDA0001227517190000501
凝胶提取试剂盒(凯杰公司)提取。简言之,将3体积的试剂盒-提供的缓冲液QG添加至该凝胶切片并在50℃下溶解持续大约10分钟。将溶解的凝胶切片转移到旋转柱,并且在13,000rpm下离心持续1分钟。将该柱用750μl的试剂盒-提供的缓冲液PE洗涤并然后重复该离心。用25μl的试剂盒-提供的缓冲液EB洗脱DNA。将大约1μl的所得纯化的DNA片段添加至100μl的原生质体溶液,用于如以上描述的潮霉素选择转化。将七个转化体传代培养到新PDA平板上以产生孢子。
里氏木霉菌株AgJg115-104-7B1的转化体通过真菌孢子PCR筛选pAgJg118缺失载体在42kDa的天冬氨酸蛋白酶基因座的存在。将来自每个转化体的少量孢子悬浮于20μl的稀释缓冲液(
Figure BDA0001227517190000502
植物直接PCR试剂盒,赛默飞世尔科技公司(Thermo FisherScientific))中。将该孢子悬浮液用作PCR中的模板,来筛选天冬氨酸蛋白酶缺失。每个反应由以下各项构成:在20μl反应中0.5μl的孢子悬浮液、50pmol的引物069134(如下所示)、50pmol的引物067947(如下所示)、10μl的2X
Figure BDA0001227517190000503
植物PCR缓冲液(
Figure BDA0001227517190000504
植物直接PCR试剂盒)、以及0.4μl的
Figure BDA0001227517190000505
热启动II DNA聚合酶(
Figure BDA0001227517190000506
植物直接PCR试剂盒)。反应在热循环仪中进行,程序为1个循环,在98℃下持续5分钟;40个循环,每个循环在98℃下持续5秒,在58℃下持续5秒,以及在72℃下持续2分20秒;1个循环,在72℃下持续2分钟;以及10℃保持。引物069134位于5’侧翼区上游并且引物067947位于大肠杆菌潮霉素磷酸转移酶(hpt)基因编码区域的起始部位。如果将缺失载体整合到天冬氨酸蛋白酶基因座,该扩增的PCR片段将长2.4kb。指定为里氏木霉AgJg115-118-1的一个转化体被鉴定为具有缺失的天冬氨酸蛋白酶基因。
引物069134(正向):
5’-CGCAATCTATCGAATAGCAG-3’(SEQ ID NO:63)
引物067947(反向):
5’-CTACATCGAAGCTGAAAGCACGAGA-3’(SEQ ID NO:64)
缺失构建体pAgJg118包含大肠杆菌潮霉素磷酸转移酶(hpt)基因和侧翼是直接重复的单纯疱疹病毒胸苷激酶(tk)基因。插入直接重复以促进hpt和tk可选择的标记的固化并且产生42kDa天冬氨酸蛋白酶的完全缺失。
将来自里氏木霉AgJg115-118-1的孢子散布到木霉属基本培养基平板上,这些平板包包含1μM 5-氟-2’-脱氧尿苷(Fd U)并且在28℃下孵育。在PDA板上将九个分离株传代培养并且在28℃下孵育。以如上所述的相似的方式,然后通过真菌孢子PCR筛选这些分离株以检查是否不存在hpt和tk标记。该PCR筛选由以下各项构成:在20μl反应中0.5μl的孢子悬浮液、50pmol的引物069134、50pmol的引物1200593、10μl的2X
Figure BDA0001227517190000511
植物PCR缓冲液、以及0.4μl的
Figure BDA0001227517190000512
热启动II DNA聚合酶。反应在热循环仪中进行,程序为1个循环,在98℃下持续5分钟;40个循环,每个循环在98℃下持续5秒,在58℃下持续5秒,以及在72℃下持续1分45秒;1个循环,在72℃下持续1分钟;以及10℃保持。引物069134位于5’侧翼区的上游,并且引物067947位于3’侧翼区的下游。如果该天冬氨酸蛋白酶编码序列被缺失,并且hpt和tk标记被环出,那么扩增的PCR片段将长3.6kb。
里氏木霉AgJg115-118-1分离株的基因组DNA如实例11中所述制备,并且如实例12中所述通过Southern印迹分析来分析,以确认42kDa的天冬氨酸蛋白酶的缺失。如实例12所述,对于Southern印迹分析,用10单位的Nco I在30μl反应体积中消化2μg的每个基因组DNA,并且经受在TAE缓冲液中的0.7%琼脂糖电泳,并且转移到
Figure BDA0001227517190000513
超负荷膜。
将该膜与500bp地高辛标记的里氏木霉C 42kDa天冬氨酸蛋白酶探针杂交,其中使用如下所示的引物通过PCR,通过掺入地高辛-11-dUTP合成该探针。
引物069860(正义):
5’-CTTCTATCTTGGGATGCTTCACGATACGTGA-3’(SEQ ID NO:65)
引物069861(反义):
5’-CGCGCCCTTGAATATCGGAGAAGGT-3’(SEQ ID NO:66)
该PCR由以下各项构成:5μl的10X Taq缓冲液(纽英伦生物技术有限公司)、2.5μl的PCR DIG标记的混合物(罗氏应用科学公司)、5ng的pAgJg118、10pmol每种引物、2.5μl的10mM dNTP、5单位的Taq DNA聚合酶(纽英伦生物技术有限公司)、以及36.5μl的水。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;30个循环,每个循环在95℃下持续30秒,在56℃下持续30秒,以及在72℃下持续40秒;1个循环,在72℃下持续15分钟;以及4℃保持。如以上所述,该探针通过在TAE缓冲液中的1%琼脂糖凝胶电泳被纯化,从凝胶切离,并且使用
Figure BDA0001227517190000514
凝胶提取试剂盒提取。
Southern印迹分析对初级转化体里氏木霉AgJg115-118-1H1的鉴定为:包含该替换并且缺乏hpt/tk标记。
实例18:里氏木霉菌株QMJi057的构建,用于将侧翼是FRT-F位点的非功能amdS片段3靶向至里氏木霉cbh1基因座
用1-5μg的Pme I消化的pQM43转化里氏木霉AgJg115-118-1H1(实例17),用来在cbh1基因座插入在在其5’侧翼是FRT-F位点的非功能amdS片段3。获得二十六个转化体并且将每一个挑出并且转移到PDA平板,并且在30℃下孵育7天。转化体在2ml的CIM中培养,并且在30℃下伴随250rpm搅拌孵育3天并。来自每个培养的上清液经受使用
Figure BDA0001227517190000521
8%-16%TGX无污凝胶(伯乐实验室有限公司)和PRECISION
Figure BDA0001227517190000522
蛋白未染色标准(伯乐实验室有限公司)的SDS-PAGE。由于在cbh1基因座pQM43的成功靶向整合有效破坏了cbh1基因,目测分析SDS-PAGE凝胶的CBH1蛋白从蛋白质组的损失。里氏木霉QMJi057-5被鉴定为不产生CBHI蛋白并且被选择用于基因组DNA提取和Southern印迹分析,以确认在里氏木霉cbh1基因座的包含FRT-F位点的非功能amdS片段3的整合。根据实例11中所述的程序从转化体中分离基因组DNA。
基因组DNA用Nhe I消化,用于用地高辛标记的里氏木霉cbh1 3’探针的根据实例12的Southern印迹分析,和使用PCR DIG探针合成试剂盒(罗氏应用科学公司)和如下所示的引物,通过PCR合成该探针。
引物0610249:
5’-GAGAACACAGTGAGACCATAGC-3’(SEQ ID NO:67)
引物0610250:
5’-TCTCAACCCAATCAGCAACATG-3’(SEQ ID NO:68)
DIG探针合成PCR由以下各项构成:大约100pg的作为模板的用于制造pQM21(WO2013/028912)的包含里氏木霉cbh1 3’侧翼区的PCR片段、1μM引物、5μl的PCR DIG合成混合物(罗氏应用科学公司),具有MgCl2的1X PCR缓冲液(罗氏应用科学公司),和0.75μl的酶混合物(罗氏应用科学公司),最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;10个循环,每个循环在95℃下持续30秒,在60℃下持续30秒,以及在72℃下持续40秒;20个循环,每个循环在95℃下持续30秒,在60℃下持续30秒,以及在72℃下持续40秒,加上对于每个后续循环另外的20秒;以及1个循环,在72℃下持续7分钟。PCR产物通过在TAE缓冲液中的1%琼脂糖凝胶电泳被分离,其中从凝胶切离720bp带,并且使用
Figure BDA0001227517190000523
提取II试剂盒提取(实例14)。
转化体QMJi057-5通过Southern印迹分析确认包含在cbh1基因座的在其5’侧翼是FRT-F位点的非功能amdS片段3,这导致了由里氏木霉cbh1 3’探针识别的在大约7.1kb的杂交信号。
实例19:在菌株QMJi057-5中,在里氏木霉cbh1基因座的位点特异性整合
包含黑曲霉甘露糖苷酶的编码序列的大约3Kb DNA片段(DNA序列为SEQ ID NO:69并且氨基酸序列为SEQ ID NO:70)从黑曲霉Bo-1衍生物菌株CKle47用引物0614762和0614763扩增,并且克隆至Nco I和Pac I消化的pMJ09(US 8318458B2;大约7.2kb),生成质粒pQM27(SEQ ID NO:71)。在pQM27中的黑曲霉甘露糖苷酶表达盒随后是功能amdS标记。
包含黑曲霉甘露表达盒、非功能amdS片段4和FRT-F位点的大约6.7kbDNA片段从pQM27用引物1201956和1201606扩增。该PCR由以下各项构成:100ng的pQM27、200μM dNTP、0.4μM引物、1X
Figure BDA0001227517190000531
反应缓冲液、以及1单位的
Figure BDA0001227517190000532
高保真DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在98℃下持续2分钟;35个循环,每个循环在98℃下持续15秒,在60℃下持续30秒,以及在72℃下持续3.5分钟;以及1个循环,在72℃下持续10分钟。6.7kb PCR产物通过在TAE中的0.7%琼脂糖凝胶电泳被分离,从凝胶切离,并且使用
Figure BDA0001227517190000533
提取II试剂盒提取(实例14)。
纯化的6.7kb的PCR产物被用作模板,使用引物1201956和1201957扩增包含FRT-F位点的片段。所得包含FRT-F位点的PCR片段通过TAE中的0.7%琼脂糖凝胶电泳你分离,并且然后从凝胶切离,并且使用
Figure BDA0001227517190000534
提取II试剂盒提取(实例14)。
引物1210956:
5’-
TGATTACGAATTGTTTAAACGGATCCGAATGTAGGATTGTTATCCG-3’(SEQ ID NO:72)
引物1201606:
5’-
GAAGTTCCTATACTTTCTAGAGAATAGGAACTCGGAATAGGAACTTCAACCTTATGGGACTATCAAGCTGAC-3’(SEQ ID NO:73)
引物1210957:
5’-
GTTACATTGACGTACTTATAAGAAGTTCCTATACTTTCTAGAGAATAGGA-3’(SEQ ID NO:74)
纯化的包含FRT-F位点的PCR片段使用IN-FUSIONTMHD克隆试剂盒插入到XbaⅠ和PsiI消化的pDM313(大约5.4Kb)。该反应由以下各项构成:在15μl反应体积中1X IN-FUSIONTMHD酶预混物、323ng的Xba I/Psi I消化的pDM313,以及200ng的6.7kb包含FRT-F位点的PCR产物。将该反应在50℃下孵育15分钟。培养期后,通过添加至包含感受态细胞的管中,并且在冰上孵育细胞30分钟,2μl等分试样被转化到50μl的StellarTM大肠杆菌化学感受态细胞(克罗泰克实验有限公司(Clontech Laboratories,Inc.))中。将该试管在42℃下培养,持续45秒之后,添加450μl的SOC培养基。然后在37℃下伴随250rpm搅拌,将该管孵育1小时。50μl和150μl的体积被转移到两个150mm2XYT加氨苄青霉素平板。将这些平板在37℃下孵育过夜。使用
Figure BDA0001227517190000535
9600分离质粒DNA,并且测序。一个转化体被鉴定为包含没有PCR错误的插入,并且该质粒指定为pQM45(图11)。
质粒pQM45被用Pme I消化,并且用来测试在菌株QMJi057-5中里氏木霉cbh1基因座的位点特异性整合。根据实例10,PME I消化的pQM45被转化到里氏木霉菌株QMJi057-5的原生质体中,并且将转化反应散布在COVE平板上,并且在30℃下孵育7-10天。所有的转化生成COVE平板上可见转化体,这表明插入FRT-F位点至amdS基因的第一内含子允许功能amdS标记的重组和在目标位点的整合。
根据在实例11中所述的程序从六个转化体中分离基因组DNA。基因组DN用EcoR I消化,用于用358bp的地高辛标记的里氏木霉cbh15’探针的根据实例12的Southern印迹分析(参见下文),该探针使用PCR DIG探针合成试剂盒,通过PCR,通过地高辛-11-dUTP的掺入合成。
所有六个转化体的Southern印迹分析生成在由里氏木霉cbh15’探针识别的在大约4.2kb的杂交信号,表明在cbh1基因座的正确整合。
里氏木霉CBH15’探针序列:
5’-TAGGGTCGGCAACGGCAAAAAAGCACGTGGCTCACCGAAAAGCAAGATGTTTGCGATCTAACATCCAGGAACCTGGATACATCCATCATCACGCACGACCACTTTGATCTGCTGTAAACTCGTATTCGCCCTAAACCGAAGTGCGTGGTAAATCTACACGTGGGCCCCTTTCGGTATACTGCGTGTGTCTTCTCTAGGTGCCATTCTTTTCCCTTCCTCTAGTGTTGAATTGTTTGTGTTGGAGTCCGAGCTGTAACTACCTCTGAATCTCTGGAGAATGGTGGACTAACGACTACCGTGCACCTGCATCATGTATATAATAGTGATCCTGAGAAGGGGGGTTTGGAGCAATGTGGG-3’(SEQ IDNO:75)
实例20:质粒pQM37,pQM38和pQM39(具有在amdS内含子中的FRT-F3位点的功能amdS标记的)的构建
构建质粒pQM37,pQM38和pQM39,以测试插入FRT-F3片段至amdS基因的3个内含子中的一个后的对amdS功能的影响。如下所示的引物被设计成使用
Figure BDA0001227517190000541
IIXL定点突变试剂盒引入FRT-F3片段至质粒pAllo1中的amdS基因中的3个内含子的每一个中。引物1205503和1205504被用来构建质粒pQM37,其中FRT-F3位点被插入到amdS基因的内含子1中。引物1205505和1205506被用来构建质粒pQM38,其中FRT-F3位点被插入到amdS基因的内含子2中。引物1205507和1205508被用来构建pQM39,其中FRT-F3位点被插入到amdS基因的内含子3中。
引物1205503:
5’-
GGGAGATGTAACAACGCCTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCAACCTTATGGGACTATCAAG-3’(SEQ ID NO:76)
引物1205504:
5’-
CTTGATAGTCCCATAAGGTTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAAGGCGTTGTTACATCTCCC-3’(SEQ ID NO:77)
引物1205505:
5’-
GCCCCTAAGTCGTTAGATGTTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCACCCTTTTTGTCAGC-3’(SEQ ID NO:78)
引物1205506:
5’-
GCTGACAAAAAGGGTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAAACATCTAACGACTTAGGGGC-3’(SEQ ID NO:79)
引物1205507:
5’-
CTATACCAGGCCTCCACTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCATGTCCTCCTTTCTTGC-3’(SEQ ID NO:80)
引物1205508:
5’-
GCAAGAAAGGAGGACATGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAAGTGGAGGCCTGGTATAG-3’(SEQ ID NO:81)
这些PCR由以下各项构成:10ng的pAllo1、1μl的10mM dNTPs、1X反应缓冲液、125ng的每个引物、1μl的
Figure BDA0001227517190000551
试剂、和2.5单位的PfuUltraTM HF DNA聚合酶(安捷伦科技),最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续1分钟;和18个循环,每个循环在95℃下持续50秒,在60℃下持续50秒,以及在68℃下持续7分钟;以及1个循环,在68℃下持续7分钟。10个单位的Dpn I被添加到各反应,并且在37℃下孵育一小时。2μl的每个Dpn I处理的反应被转化到XL10-Gold高效感受态大肠杆菌细胞中。将转化反应散布在2XYT加氨苄青霉素平板上。挑出每个转化约4-6个菌落并在3ml的LB加氨苄青霉素培养基在37℃下,伴随250rpm搅拌培养15-17小时。使用
Figure BDA0001227517190000552
旋转迷你制备型试剂盒从每个菌落提取质粒DNA,并且提交用于DNA测序。包含插入到amdS基因的内含子1的FRT-F3位点的一个转化体被指定为pQM37。包含插入到amdS基因的内含子2的FRT-F3位点的一个转化体被指定为pQM38。包含插入到amdS基因的内含子3的FRT-F3位点的一个转化体被指定为pQM39。
约30-40μg的每个pAllo1,pQM37,pQM38、和pQM39用EcoR I和Pac I消化。消化的DNA使用
Figure BDA0001227517190000553
提取II试剂盒被纯化(实施例14)。根据实例10,pAllo1,pQM37,pQM38、和pQM39的纯化线性DNA片段各自转化到里氏木霉RutC30原生质体中。将转化反应物散布在COVE平板上,并且在28℃下孵育7-10天。所有的转化生成COVE平板上可见转化体,表明amdS可以被用作具有插入到三个amdS内含子中任一个的FRT-F3位点的功能选择标记。
序列表
<110> 诺维信公司(Novozymes A/S)
<120> 多核苷酸文库的重组酶介导的整合
<130> NZ 12719-WO-PCT
<160> 81
<170> PatentIn版本3.5
<210> 1
<211> 16935
<212> DNA
<213> 人工序列
<220>
<223> 质粒 p002
<220>
<221> 尚未归类的特征
<222> (11869)..(11869)
<223> n is a, c, g, or t
<400> 1
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 60
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 120
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 180
ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc tccaccgcgg 240
caacaggcag aatatcttcc gaattcaatc gactgcgcga tgcaagttgg ctagcaacgg 300
cgtacacctt gggattatgc gctgctcaac cgatggtcag ctatcaaaca aaatttggga 360
agatcgggct atactgacgg tgacattata gtacggcaag ctgagtgaca tctacggtcg 420
caagccactg cttctttggg catatgtttt ctttggcgtg ggatgcatta tcaggtagat 480
actccctttt tcttatacgc tggtttgctg gttcgtgctg acagctgttt ccctagcggt 540
attggtcgag acatggcgac tgtcatattg gggcgtgcaa tcagcggaat tgggggtgct 600
ggaacaatgg cgatgggctc tatcattatc acaggtaggc tagcagctta tcaggttgaa 660
agaactgtca ctgaacatag gcagatattg ttcctcgtcg agatgttgcc cattggcggg 720
cgtacatcaa tatcgcgatg actctgggtc gtagcgcagg aggcccaatc ggcggatggc 780
taaccgatac aatcggatgg agatggtatg ctttgcgcct ttgtgaccgc ttctctcact 840
aaattgtggc caaggtcgtt tattatccaa ggccccttag ccgctgtggc agctctgttg 900
gtgatatgga agctcaaact cgccaatcca gtcactgaga agagcatccg ccgtgtcgac 960
tttctcggaa cattcctcct ggccgtcggt attgttacaa tcaccgttat catggaccaa 1020
gcagggcagt ccttcgcatg ggcatcattg tcaacagcaa tccttgcaac tctcagtcta 1080
tcagcattcg tcgccttcgt ccttgttgaa ctctacgtag cccctgaacc gattttcgaa 1140
cttcgcatgt tgcggaagcc gaatgtgacg cccagttacc tgatcggatc gctgcagatc 1200
accgcccaag ttggaatgat gttctccgtg ccgttatatt ttcaggtgac atcgaaagcc 1260
tctgccaccg tagctggagg gcatctggtt cctgcagtga tcggaaacac gcttggcggc 1320
ttaatcgcgg gagcctttat ccgtcgcacc ggccaattca aggtcctctt gatccttgcc 1380
ggtctcgttg cgtccgtcgc ctatctactc ctcatccttc gctggaacgg tcatactgga 1440
ttctgggagt ccttgtacat tattcccggt ggtatgggta ctggtttctg ctctgcagct 1500
gcttttgtca gtatgacggc gtttttgatg ccgcaggaag tggccatggc aacaggaggt 1560
tacttcctat tattcagctt cgccatgacg gccggtgtca ctgtcactaa cagtctgctg 1620
gggacggttt tcaagcgcca gatggaacag cacctgacgg gtccaggagc caagaaggtt 1680
ggtatccccg caccttttct gcgtcactta ctaacgagta tatgaagatc atcgagcgcg 1740
cgctgtccga caccagctat atcaacggtt tgcagggtca tgtccgggat gtagtggtaa 1800
aaggatatgt gactggtctc cgctacactt actgtaagtc gtttgaatca tgcatccacc 1860
gtccacctta ttaacttggt gccagtattt tccctcattc tttcgctcct tggatcggtc 1920
ctcgcttgga ctgtacgaaa acaccaacta tgaggaacca gcacggcagc tgatagtatc 1980
cgaaagctgc aaattgcttc atcgaggctg gcattcgata gaagaaagaa ctatagacaa 2040
ctagtcttac aatatgacaa ttctctttga ttaataaatg aaaataacac ttgtgtcagc 2100
ctaatagccg agtggcgggc atctctggcg gcctcccgag cagcgtggat ctggaagtgc 2160
gttgatcatt attccccgaa aatgtagtac ccagtaagtg gtctagcggt ggctatggta 2220
ggacatctat gcctaagctg gagttctcat tgaacgtgta ccggccgatt gccctaaact 2280
ctgattgaga gccggaaacc tcatctacct gatgctcagg ggccatccaa tagcttccga 2340
tagcattaca gacagatgga ctcgtcttgg cccacgggtc tagaacagtc gccggaactg 2400
cctctatttg aaacggagct gaaccatgat acttaagcgt gccaagcggc gccgtttccc 2460
actggaacaa ggagcaatag aattctgcag agattcttca ttcaggctat tcagcaattc 2520
ggtttgtgga gcggatcggg gtccactggg tttagtctgg ggtttttctt tgcccgcatg 2580
ggctctagca catgcacagc ttgcagttgc tgctacgcta tctgggaaaa cgaatggcta 2640
ttcaggagtt tataaccaaa agagccggaa acaggctgat tgccctctca cggggagacg 2700
ttgtacttct gatccagagg ctattaaccg gacactacct ataaaggagg tagcattcct 2760
ttctgtccgg ctcccagatt ccaacaaccc aactgacagg ggatccacca tgccccagtt 2820
cgatatcctc tgcaagaccc cccccaaggt cctcgtccgc cagttcgtcg agcgcttcga 2880
gcgcccctcc ggcgagaaga tcgccctctg cgccgccgag ctcacctacc tctgctggat 2940
gatcacccat aacggcaccg ccatcaagcg cgccaccttc atgtcctaca acaccatcat 3000
ctccaactcc ctctccttcg atatcgtcaa caagtccctc cagttcaagt acaagaccca 3060
gaaggccacc atcctggagg cctccctcaa gaagctcatc cccgcctggg agttcaccat 3120
catcccctac tacggccaga agcatcagtc cgatatcacc gatatcgtct cctccctcca 3180
gctccagttc gagtcctccg aggaggccga taagggcaac tcccattcca agaagatgct 3240
caaggccctc ctctccgagg gcgagtccat ctgggagatc accgagaaga tcctcaactc 3300
cttcgagtac acctcccgct tcaccaagac caagaccctc taccagttcc tcttcctcgc 3360
caccttcatc aactgcggcc gcttctccga tatcaagaac gtcgatccca agtccttcaa 3420
gctcgtccag aacaagtacc tcggcgtcat catccagtgc ctcgtcaccg agaccaagac 3480
ctccgtctcc cgccatatct acttcttctc cgcccgcggc cgcatcgatc ccctcgtcta 3540
cctcgatgag ttcctccgca actccgagcc cgtcctcaag cgcgtcaacc gcaccggcaa 3600
ctcctcctcc aacaagcagg agtaccagct cctcaaggat aacctcgtcc gctcctacaa 3660
caaggccctc aagaagaacg ccccctactc catcttcgcc atcaagaacg gccccaagtc 3720
ccatatcggc cgccatctca tgacctcctt cctctccatg aagggcctca ccgagctcac 3780
caacgtcgtc ggcaactggt ccgataagcg cgcctccgcc gtcgcccgca ccacctacac 3840
ccatcagatc accgccatcc ccgatcatta cttcgcacta gtctcccgct actacgccta 3900
cgatcccatc tccaaggaga tgatcgccct caaggatgag accaacccca tcgaggagtg 3960
gcagcatatc gagcagctca agggctccgc cgagggctcc atccgctacc ccgcctggaa 4020
cggcatcatc tcccaggagg tcctcgatta cctctcctcc tacatcaacc gccgcatctg 4080
agtcgagatt atccaaggga atgacttaat gagtatgtaa gacatgggtc ataacggcgt 4140
tcgaaacata tacagggtta tgtttgggaa tagcacacga ataataacgt taataggtac 4200
caaagtcctt gatacattag cacggtagaa aaagaataat acaacgagct gggaatattc 4260
tttaatataa aactccaaga agagctggtg cggtggagct tgttttcgac tctcagtaat 4320
atttcctcat atccaagcgc gctaggaggt ggtcgaatac acatgtaggc gcttctctgg 4380
atgcaaaagt cgtgccggac ctgccgaaag actttgaaga tgcgttcacg ccatctaagt 4440
tgcgtagata attcacaaaa agggatgttt gtttccggaa tgtagcaaag agctgatagg 4500
caatagcctc actttcgtgg cgcacgccgc tcgttccatc catcctcgac aatggagcaa 4560
atgtcaaaat cgtaccgaaa atactttgct agcccgttaa attgccgtcg tcagccgtta 4620
aattaccgat taatcccgat aaatttccga gatctccgtt aaattgccgt tcgcagccgt 4680
taaattaccg gggacgaccg ataaatttcc gcgatgaatt catggtgttt tgatcatttt 4740
aaatttttat atggcgggtg gtgggcaact cgcttgcgcg ggcaactcgc ttaccgatta 4800
cgttagggct gatatttacg taaaaatcgt caagggatgc aagaccaaac cgttaaattt 4860
ccggagtcaa cagcatccaa gcccaagtcc ttcacggaga aaccccagcg tccacatcac 4920
gagcgaagga ccacctctag gcatcggacg caccatccaa ttagaagcag caaagcgaaa 4980
cagcccaaga aaaaggtcgg cccgtcggcc ttttctgcaa cgctgatcac gggcagcgat 5040
ccaaccaaca ccctccagag tgactagggg cggaaattta tcgggattaa tttccactca 5100
accacaaatc acagtcgtcc ccggtaattt aacggctgca gacggcaatt taacggcttc 5160
tgcgaatcgc ttggattccc cgcccctggc cgtagagctt aaagtatgtc ccttgtcgat 5220
gcgatgtatc acaacatata aatactggca agggatgcca tgcttggagc aacaatctca 5280
gaacaccaat atcaattcat ctcgagtctg aactcagaca acacaaattc ttcaaaattg 5340
aggatttagt cttgatcttg aagttcctat tccgagttcc tattctctag aaagtatagg 5400
aacttcttaa ttaacctagc cgttattact ctaccgcaag gcaacaacca gctcacccct 5460
gaggcacggg taccatgggt tgagtggtat ggggccatcc agagtcacct gtggcagcat 5520
gagactgcac tcgaagcagc catcaaccca gccaatattc tgggctttcc atccttagat 5580
cacatttgag atataaccca tttggtgaga gacacttgtg ccgttatacg tgtctagact 5640
ggaaacgcaa ccctgaaggg attcttcctt tgagagatgg aagcgtgtca tatctcttcg 5700
gttctacggc aggttttttt ctgctctttc gtagcatggc atggtcactt cagcgcttat 5760
ttacagttgc tggtattgat ttcttgtgca aattgctatc tgacacttat taggtcgagc 5820
tattcctttg ccctcggacg agtgctgggg cgtcggtttc cactatcggc gagtacttct 5880
acacagccat cggtccagac ggccgcgctt ctgcgggcga tttgtgtacg cccgacagtc 5940
ccggctccgg atcggacgat tgcgtcgcat cgaccctgcg cccaagctgc atcatcgaaa 6000
ttgccgtcaa ccaagctctg atagagttgg tcaagaccaa tgcggagcat atacgcccgg 6060
agccgcggcg atcctgcaag ctccggatgc ctccgctcga agtagcgcgt ctgctgctcc 6120
atacaagcca accacggcct ccagaagaag atgttggcga cctcgtattg ggaatccccg 6180
aacatcgcct cgctccagtc aatgaccgct gttatgcggc cattgtccgt caggacattg 6240
ttggagccga aatccgcgtg cacgaggtgc cggacttcgg ggcagtcctc ggcccaaagc 6300
atcagctcat cgagagcctg cgcgacggac gcactgacgg tgtcgtccat cacagtttgc 6360
cagtgataca catggggatc agcaatcgcg catatgaaat cacgccatgt agtgtattga 6420
ccgattcctt gcggtccgaa tgggccgaac ccgctcgtct ggctaagatc ggccgcagcg 6480
atcgcatcca tggcctccgc gaccggctgc agaacagcgg gcagttcggt ttcaggcagg 6540
tcttgcaacg tgacaccctg tgcacggcgg gagatgcaat aggtcaggct ctcgctgaat 6600
tccccaatgt caagcacttc cggaatcggg agcgcggccg atgcaaagtg ccgataaaca 6660
taacgatctt tgtagaaacc atcggcgcag ctatttaccc gcaggacata tccacgccct 6720
cctacatcga agctgaaagc acgagattct tcgccctccg agagctgcat caggtcggag 6780
acgctgtcga acttttcgat cagaaacttc tcgacagacg tcgcggtgag ttcaggcgac 6840
attgctgagg tgtaggatcg atccgtttaa actctgtgtt agcttatagt caggatgttg 6900
gctcgacgag tgtaaactgg gagttggcat gagggttatg taggcttctt tagccccgca 6960
tccccctcat tctcctcatt gatcccgggg gagcggatgg tgttgataag agactaatta 7020
tagggtttag ctggtgccta gctggtgatt ggctggcttc gccgaatttt acgggccaag 7080
ggaagctgca gaaccgcggc actggtaaac ggtaattaag ctatcagccc catgctaacg 7140
agtttaaatt acgtgtattg ctgataaaca ccaacagagc tttactgaaa gatgggagtc 7200
acggtgtggc ttccccactg cgattattgc acaagcagcg agggcgaact tgactgtcgt 7260
cgctgagcag cctgcagtca aacatacata tatatcaacc gcgaagacgt ctggccttgt 7320
agaacacgac gctccctagc aacacctgcc gtgtcagcct ctacggttgt tacttgcatt 7380
caggatgctc tccagcgggc gagctattca aaatattcaa agcaggtatc tcgtattgcc 7440
aggattcagc tgaagcaaca ggtgccaagg aaatctgcgt cggttctcat ctgggcttgc 7500
tcggtcctgg cgtagactag tgcatgcttg aagttcctat tccgagttcc tattcttcaa 7560
atagtatagg aacttcaacc atgcctcaat cctgggaaga actggccgct gataagcgcg 7620
cccgcctcgc aaaaaccatc cctgatgaat ggaaagtcca gacgctgcct gcggaagaca 7680
gcgttattga tttcccaaag aaatcgggta tcctttcaga ggccgaactg aagatcacag 7740
aggcctccgc tgcagatctt gtgtccaagc tggcggccgg agagttgacc tcggcggaag 7800
ttacgctagc attctgtaaa cgggcagtaa tcgcccagca gttagtaggg tcccctctac 7860
ctctcaggga gatgtaacaa cgccacctta tgggactatc aagctgacgc tggcttctgt 7920
gcagacaaac tgcgcccacg agttcttccc tgacgccgct ctcgcgcagg caagggaact 7980
cgatgaatac tacgcaaagc acaagagacc cgttggtcca ctccatggcc tccccatctc 8040
tctcaaagac cagcttcgag tcaaggtaca ccgttgcccc taagtcgtta gatgtccctt 8100
tttgtcagct aacatatgcc accagggcta cgaaacatca atgggctaca tctcatggct 8160
aaacaagtac gacgaagggg actcggttct gacaaccatg ctccgcaaag ccggtgccgt 8220
cttctacgtc aagacctctg tcccgcagac cctgatggtc tgcgagacag tcaacaacat 8280
catcgggcgc accgtcaacc cacgcaacaa gaactggtcg tgcggcggca gttctggtgg 8340
tgagggtgcg atcgttggga ttcgtggtgg cgtcatcggt gtaggaacgg atatcggtgg 8400
ctcgattcga gtgccggccg cgttcaactt cctgtacggt ctaaggccga gtcatgggcg 8460
gctgccgtat gcaaagatgg cgaacagcat ggagggtcag gagacggtgc acagcgttgt 8520
cgggccgatt acgcactctg ttgagggtga gtccttcgcc tcttccttct tttcctgctc 8580
tataccaggc ctccactgtc ctcctttctt gctttttata ctatatacga gaccggcagt 8640
cactgatgaa gtatgttaga cctccgcctc ttcaccaaat ccgtcctcgg tcaggagcca 8700
tggaaatacg actccaaggt catccccatg ccctggcgcc agtccgagtc ggacattatt 8760
gcctccaaga tcaagaacgg cgggctcaat atcggctact acaacttcga cggcaatgtc 8820
cttccacacc ctcctatcct gcgcggcgtg gaaaccaccg tcgccgcact cgccaaagcc 8880
ggtcacaccg tgaccccgtg gacgccatac aagcacgatt tcggccacga tctcatctcc 8940
catatctacg cggctgacgg cagcgccgac gtaatgcgcg atatcagtgc atccggcgag 9000
ccggcgattc caaatatcaa agacctactg aacccgaaca tcaaagctgt taacatgaac 9060
gagctctggg acacgcatct ccagaagtgg aattaccaga tggagtacct tgagaaatgg 9120
cgggaggctg aagaaaaggc cgggaaggaa ctggacgcca tcatcgcgcc gattacgcct 9180
accgctgcgg tacggcatga ccagttccgg tactatgggt atgcctctgt gatcaacctg 9240
ctggatttca cgagcgtggt tgttccggtt acctttgcgg ataagaacat cgataagaag 9300
aatgagagtt tcaaggcggt tagtgagctt gatgccctcg tgcaggaaga gtatgatccg 9360
gaggcgtacc atggggcacc ggttgcagtg caggttatcg gacggagact cagtgaagag 9420
aggacgttgg cgattgcaga ggaagtgggg aagttgctgg gaaatgtggt gactccatag 9480
gtaagctccg tggcgaaagc ctgacgcacc ggtagattct tggtgagccc gtatcatgac 9540
ggcggcggga gctacatggc cccgggtgat ttattttttt tgtatctact tctgaccctt 9600
ttcaaatata cggtcaactc atctttcact ggagatgcgg cctgcttggt attgcgatgt 9660
tgtcagcttg gcaaattgtg gctttcgaaa acacaaaacg attccttagt agccatgcat 9720
tttaagataa cggaatagaa gaaagaggaa attaaaaaaa aaaaaaaaac aaacatcccg 9780
ttcataaccc gtagaatcgc cgctcttcgt gtatcccagt accacggcaa aggtatttca 9840
tgatcgttca atgttgatat tgttcccgcc agtatggctc cacccccatc tccgcgaatc 9900
tcctcttctc gaacgcggta gtggcgcgcc aattggtaat gacccatagg gagacaaaca 9960
gcataatagc aacagtggaa attagtggcg caataattga gaacacagtg agaccatagc 10020
tggcggcctg gaaagcactg ttggagacca acttgtccgt tgcgaggcca acttgcattg 10080
tctagagaat gcaatcataa cagaaagtac agccagcgct gtgtcataaa gaagtccagt 10140
tgggaaacga aagactagaa tcaaactaaa agtaatccgg ccgatatggc ttcacgtgcg 10200
aagtctcgcc ttgaggggac attgtccttg caggtgattg accattgcgt tcatatggcg 10260
cgatgtttgg tagtgtgggt gtagccggtg acctcacgga aggactaaag gccacatacc 10320
cttctgagtg cctcttctct tcgtggtcgg aactctcgaa tgggtttttg acagttgcac 10380
tcgtttggtt gtggtcattt gaaggtctgc gttcggtctt ctgttcgcgc aggcgagctg 10440
actgagggat tgaaagctgc atagccatcg ttggcatgcg ttaattcgcc aaagctcagc 10500
ggcgaaacag gcctgacctc taatccatgc atctgctctg cactcgattg ttcgtggtgt 10560
ccttgcgaag aaagagaagc cttggactcg gatgactttc tggacgaggt ggtaggatca 10620
tcatgattgt aatgagactg tagcacatca tgcgaatcat tcgacacacg gtgtctgccc 10680
aagttgacgt cagcatcggt atgcatttcg gtatggtcct catggttctc agcatgtccc 10740
tccagagggg actcatttcc agcggaagga ttataagcaa cataattgtc atgtggctgc 10800
gacctttcgt gagactccga gtttgatctc actgtggact catgggcgat atgcggctca 10860
tcatgatctt cgaatggaga gaaatggttg aagtcggagg acacgggtga tttagcagca 10920
gggttgaatg caacatagcc agtctcgcgc tcttcatgtg agctatatga gtcatgtggc 10980
ctgtcatggt ccagaggctc cggatgctca tggctagatt catcgtgtgc cgaaatcgcg 11040
tcactagcaa agggcgaggt tgacacattg gctgcaggac tgaacgccac ataaccactc 11100
tcaggctctt catgtgagtt ataggagctg tgcggcatat catagtcctg aggttcacga 11160
tgctcatggc tggattcatc gtgtgccgaa atagcgtgac tagcaaaagg cgagggcgaa 11220
gcattggttg ccggactgaa cgccacatag ccgtccccat tggctgaact gactggtgac 11280
aacgtcctac ccatggcgtc ggccgggcca gcggcttggt gagagtgaag accattagaa 11340
gtagctggac tgaacgatcg cagcgggtat tcgttttctt gagctggata aggggctgcg 11400
ccatgctggc tgaaaggtga gaatgttcgg ggtgctgctc tatcaccagg gaaggcagac 11460
gctggagtca aagaacgagt gttggatcaa ttgccggact gtatgaacgg aaaggagtgc 11520
tgattgttta aatggcccgt agccttcgct aggacctcgt gattcgggga ccgttggccc 11580
atacccagga gctggtgtaa aattggaacg cgacacgggt gtttggttgc gcagaatttg 11640
cggtgccggc gaggcgtgat caatctggct gtaacctggg cctggggtgt agtttgagac 11700
aggtgtttgt gttcgtggca tttgtggcgc tggcgacgct ctgtcagtcg gcccatatcc 11760
aggcgccgaa ggtgtgggcg taaacccttg ccgtgattta attaagaatt ctcctgtagg 11820
cttgagagtt caaggaagaa acagtgcaat tatctttgcg aacccaggng ctggtgacgg 11880
aattttcata gtcaagctat cagagtaaag aagaggagca tgtcaaagta caattagaga 11940
caaatatata gtcgcgtgga gccaagagcg gattcctcag tctcgtaggt ctcttgacga 12000
ccgttgatct gcttgatctc gtctcccgaa aatgaaaata gactctgcta agctattctt 12060
ctgcttcgcc ggagcctgaa gggcgtacta gggttgcgag gtccaatgca ttaatgcatt 12120
gcagatgagc tgtatctgga agaggtaaac ccgaaacgcg ttttattctt gttgacatgg 12180
agctattaaa tcactagaag gcactctttg ctgcttggac aaatgaacgt atcttatcga 12240
gatcctgaac accatttgtc tcaactccgg agctgacatc gacaccaacg atcttatatc 12300
cagattcgtc aagctgtttg atgatttcag taacgttaag tggatcgatc cggatagcgc 12360
gggttccttc cggtattgtc tccttccgtg tttcagttag cctcccccat ctcccgggca 12420
aacgtgcgcg ccaggtcgca tatcgtcggt atggagccgg gggtggtgac gtgggtctgg 12480
accatcccgg aggtaagttg cagcagggcg tcccggcagc cggcgggcga ttggtcgtaa 12540
tccaggataa agacgtgcat ggaacggagg cgtttggcca agacgtccaa ggcccaggca 12600
aacacgttat acaggtcgcc gttgggggcc agcaactcgg ggccccgaaa cagggtaaat 12660
aacgtgtccc cgatatgggg tcgtgggccc gcgttgctct ggggctcggc accctggggc 12720
ggcacggccg tccccgaaag ctgtccccag tcctcccgcc acgacccgcc gcactgcaga 12780
taccgcaccg tattggcaag tagcccgtaa acgcggcgaa tcgcagccag catagccagg 12840
tccagccgct cgccggggcg ctggcgtttg gccaggcggt cgatgtgtct gtcctccgga 12900
agggccccaa gcacgatgtt ggtgccgggc aaggtcggcg ggatgagggc cacgaacgcc 12960
agcacggcct ggggggtcat gctgcccata aggtaccgcg cggccgggta gcacaggagg 13020
gcggcgatgg gatggcggtc gaagatgagg gtgagggccg ggggcggggc atgtgagctc 13080
ccagcctccc ccccgatatg aggagccaga acggcgtcgg tcacggcata aggcatgccc 13140
attgttatct gggcgcttgt cattaccacc gccgcgtccc cggccgatat ctcaccctgg 13200
tcgaggcggt gttgtgtggt gtagatgttc gcgattgtct cggaagcccc cagcacccgc 13260
cagtaagtca tcggctcggg tacgtagacg atatcgtcgc gcgaacccag ggccaccagc 13320
agttgcgtgg tggtggtttt ccccatcccg tggggaccgt ctatataaac ccgcagtagc 13380
gtgggcattt tctgctccgg gcggacttcc gtggcttctt gctgccggcg agggcgcaac 13440
gccgtacgtc ggttgctatg gccgcgagaa cgcgcagcct ggtcgaacgc agacgcgtgt 13500
tgatggccgg ggtacgaagc catacgcgct tctacaaggc gctggccgaa gaggtgcggg 13560
agtttcacgc caccaagatc gatctacagc tggtggggag agcaggaaaa tatggcaaca 13620
aatgttggac tgacgcaacg accttgtcaa ccccgccgac acaccgggcg gacagacggg 13680
gcaaagctgc ctaccaggga ctgagggacc tcagcaggtc gagtgcagag caccggatgg 13740
gtcgactgcc agcttgtgtt cccggtctgc gccgctggcc agctcctgag cggcctttcc 13800
ggtttcatac accgggcaaa gcaggagagg cacgatattt ggacgcccta cagatgccgg 13860
atgggccaat tagggagctt acgcgccggg tactcgctct acctacttcg gagaaggtac 13920
tatctcgtga atcttttacc agatcggaag caattggact tctgtaccta ggttaatggc 13980
atgctatttc gccgacggct atacacccct ggcttcacat tctccttcgc ttactgccgg 14040
tgattcgatg aagctccata ttctccgatg atgcaataga ttcttggtca acgaggggca 14100
caccagcctt tccacttcgg ggcggagggg cggccggtcc cggattaata atcatccact 14160
gcacctcaga gccgccagag ctgtctggcg cagtggccgt tattactcag cccttctctc 14220
tgcgtccgtc cgtctctccg catgccagaa agagtcaccg gtcactgtac agagctcaag 14280
cttcgattaa ctcgaggggg ggcccggtac ccaattcgcc ctatagtgag tcgtattaca 14340
attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta 14400
atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg 14460
atcgcccttc ccaacagttg cgcagcctga atggcgaatg gaaattgtaa gcgttaatat 14520
tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga 14580
aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc 14640
agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac 14700
cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc 14760
gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg 14820
gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag 14880
ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc 14940
gccgctacag ggcgcgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg 15000
tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 15060
gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat 15120
tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt 15180
aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag 15240
cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa 15300
agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg 15360
ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct 15420
tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac 15480
tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca 15540
caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat 15600
accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact 15660
attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc 15720
ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga 15780
taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg 15840
taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg 15900
aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca 15960
agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 16020
ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 16080
ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 16140
cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 16200
tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 16260
tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 16320
tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 16380
tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 16440
ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 16500
acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 16560
ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 16620
gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 16680
ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 16740
ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 16800
taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 16860
cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc 16920
gcgttggccg attca 16935
<210> 2
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> FLP 重组酶识别序列
<400> 2
ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttc 49
<210> 3
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> FLP 重组酶识别序列
<400> 3
ttgaagttcc tattccgagt tcctattctt caaatagtat aggaacttca 50
<210> 4
<211> 6055
<212> DNA
<213> 人工序列
<220>
<223> 载体 pFRT-GIAMG
<400> 4
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cttgaagttc ctattccgag 420
ttcctattct ctagaaagta taggaacttc ctcgagacca tgtaccgctt ccttgtctgt 480
gctctcgggc ttctggggac agtcctcgct cagtcagtcg acagttatgt cggcagcgaa 540
ggccccatag caaaggccgg cgtccttgcc aacattgggc cgaacggctc aaaggcctct 600
ggtgcagccg ccggcgtggt ggtggctagc cccagcaagt cggatcccga ctattggtac 660
acttggacgc gtgactcgtc actcgttttc aagtctctca ttgatcagta caccactggt 720
atcgacagca cgagttcgtt gaggtctctg atagacagtt tcgttattgc cgaggccaac 780
attcagcagg tctctaatcc cagcggcact cttactaccg gcggcttggg agagccaaaa 840
ttcaatgtcg atgaaactgc attcaccggt gcatggggtc gaccccagcg cgacggacct 900
gcgctccgtg cgactgcttt gatcacctac ggtaactggc tcttgtcaaa cgggaacacg 960
acctgggtta ccagtacgct gtggccgatc atccagaacg atctcaacta cgtcgttcag 1020
tactggaacc agaccacctt cgacctctgg gaagaagtga actcttcctc gttcttcacc 1080
actgcagtgc agcaccgtgc cttgcgcgaa ggcgcagcat tcgctaccaa gatcggtcag 1140
acctcctcgg tcagcagcta cacaacccaa gcggcgaatc tactttgctt tttgcagtct 1200
tactggaacc ccacttccgg atatatcacc gctaacactg gcggtggtcg gtccggcaag 1260
gacgccaaca ccctcttggc atccatccac acttacgacc ccagcgcggg ctgcgatgcc 1320
acgaccttcc agccctgctc cgacaaagcc ctctcgaatc tgaaggttta cgtcgactcc 1380
ttccgttctg tctactccat caacagcggt attgcctcta acgccgctgt cgccactggt 1440
cgctacccgg aagacagcta ccagggcggg aacccatggt acctcactac gttcgccgtc 1500
gccgagcagc tctatgacgc cctcaatgtc tgggctgctc agggctccct caatgtcacc 1560
tccatctccc tccccttctt ccagcagttc tcctctagtg tcactgccgg cacttacgct 1620
tcgagctcca ccacttacac gactctgacc tccgccatta agagcttcgc ggatggattc 1680
gtcgctatca acgcccagta cacgccgtcc aacggtggcc tcgctgagca gttcagcagg 1740
agcaacggcg ctcccgtcag cgctgttgat ttgacatgga gctatgcatc tgcattgacc 1800
gcgtttgaag cgaggaataa tactcagttc gccggctggg gcgcggtagg tttgactgtg 1860
ccgacctcgt gctccagcaa cagtggtgga ggcggaggat cgactgtcgc cgtgacgttc 1920
aacgtgaacg cccaaacggt ttggggcgaa aacatctaca tcactggctc ggttgacgct 1980
ctgagtaact ggtctcccga caacgccctc ttgctctcgt ctgccaacta cccgacctgg 2040
agcattaccg tgaatttacc cgcgagcact gccattcagt ataagtatat ccgcaagaac 2100
aacggagctg tcacctggga atccgatccc aacaacagca taactactcc agccagcggc 2160
tccgtgaccg agaatgacac ttggcgttaa ttaattaata ataaataacg gattgtgtcc 2220
gtaatcacac gtgcccgtgg tgcgtacgat aacgcatagt gtttttccct ccacttaaat 2280
cgaagggttg tgtcttggat cgcgcgggtc aaatgtatat ggttcatata catccgcagg 2340
cacgtaataa agcgaggggt tcgaatcccc ccgttacccc cggtaggggc ccagatccgg 2400
gtgactgaca cctggcggta gacaatcaat ccatttcgct atagttaaag gatggggatg 2460
agggcaattg gttatatgat catgtatgta gtgggtgtgc ataatagtag tgaaatggaa 2520
gccaagtcat gtgattgtaa tcgaccgacg gaattgagga tatccggaaa tacagacacc 2580
gtgaaagcca tggtctttcc ttcgtgtaga agaccagaca gacagtccct gatttaccct 2640
tgcacaaagc actagaaaat tagcattcca tccttctctg cttgctctgc tgatatcact 2700
gtcattcaat gcatagccat gagctcatct tagatccaag cacgtaattc catagccgag 2760
gtccacagtg gagcagcaac attccccatc attgctttcc ccaggggcct cccaacgact 2820
aaatcaagag tatatctcta ccgtccaata gatcgtcttc gcttcaaaat ctttgacaat 2880
tccaagaggg tccccatcca tcaaacccag ttcaataata gccgagatgc atggtggagt 2940
caattaggca gtattgctgg aatgtcgggg ccagttggcc cggtggtcat tggccgcctg 3000
tgatgccatc tgccactaaa tccgatcatt gatccaccgc ccacgaggcg cgtctttgct 3060
ttttgcgcgg cgtccaggtt caactctctc cactagtcta gcggggttca aatgcaaaca 3120
agtacaacac gcagcaaacg aagcagccca ccactgcgtt gatgcccagt ttgactgtcc 3180
gaaatccacc ggaaaggtgg aaacatacta tgtaacaatc agagggaaga aaaaattttt 3240
atcgacgagg caggatagtg actgatggtg gggtcatggt cgggtctccg agcgaaagag 3300
aaccaaggaa acaagatcaa cgaggttggt gtacccaaaa ggccgcagca acaagagtca 3360
tcgcccaaaa gtcaacagtc tggaagagac tccgccgtgc agattctgcg tcggtcccgc 3420
acatgcgtgg tgggggcatt acccctccat gtccaatgat aagggcggcg gtcgagggct 3480
taagcccgcc cactaattcg ccttctcgct tgcccctcca tataaggatt ccccctcctt 3540
cccctcccac aacttttttc cttctttctc tcttcgtccg catcagtacg tatatctttc 3600
ccccatacct cctttcctac tcttcttcca ttcattcaac tcttctcctt actgacatct 3660
gttttgctca gtacctctac gcgatcagcc gtagtatctg agcaagcttc tctacagaat 3720
ctttctagta tcttacaaag aactacaaag ttcgcaccat tgaagttcct attccgagtt 3780
cctattcttc aaatagtata ggaacttcag catgcaagct tggcgtaatc atggtcatag 3840
ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 3900
ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 3960
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 4020
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 4080
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 4140
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 4200
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 4260
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 4320
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 4380
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 4440
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 4500
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 4560
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 4620
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 4680
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 4740
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 4800
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 4860
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 4920
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 4980
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 5040
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 5100
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 5160
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 5220
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 5280
aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 5340
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 5400
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 5460
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 5520
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 5580
cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 5640
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 5700
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 5760
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 5820
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 5880
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 5940
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 6000
attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 6055
<210> 5
<211> 1731
<212> DNA
<213> 密粘褶菌
<400> 5
atgtaccgct tccttgtctg tgctctcggg cttctgggga cagtcctcgc tcagtcagtc 60
gacagttatg tcggcagcga aggccccata gcaaaggccg gcgtccttgc caacattggg 120
ccgaacggct caaaggcctc tggtgcagcc gccggcgtgg tggtggctag ccccagcaag 180
tcggatcccg actattggta cacttggacg cgtgactcgt cactcgtttt caagtctctc 240
attgatcagt acaccactgg tatcgacagc acgagttcgt tgaggtctct gatagacagt 300
ttcgttattg ccgaggccaa cattcagcag gtctctaatc ccagcggcac tcttactacc 360
ggcggcttgg gagagccaaa attcaatgtc gatgaaactg cattcaccgg tgcatggggt 420
cgaccccagc gcgacggacc tgcgctccgt gcgactgctt tgatcaccta cggtaactgg 480
ctcttgtcaa acgggaacac gacctgggtt accagtacgc tgtggccgat catccagaac 540
gatctcaact acgtcgttca gtactggaac cagaccacct tcgacctctg ggaagaagtg 600
aactcttcct cgttcttcac cactgcagtg cagcaccgtg ccttgcgcga aggcgcagca 660
ttcgctacca agatcggtca gacctcctcg gtcagcagct acacaaccca agcggcgaat 720
ctactttgct ttttgcagtc ttactggaac cccacttccg gatatatcac cgctaacact 780
ggcggtggtc ggtccggcaa ggacgccaac accctcttgg catccatcca cacttacgac 840
cccagcgcgg gctgcgatgc cacgaccttc cagccctgct ccgacaaagc cctctcgaat 900
ctgaaggttt acgtcgactc cttccgttct gtctactcca tcaacagcgg tattgcctct 960
aacgccgctg tcgccactgg tcgctacccg gaagacagct accagggcgg gaacccatgg 1020
tacctcacta cgttcgccgt cgccgagcag ctctatgacg ccctcaatgt ctgggctgct 1080
cagggctccc tcaatgtcac ctccatctcc ctccccttct tccagcagtt ctcctctagt 1140
gtcactgccg gcacttacgc ttcgagctcc accacttaca cgactctgac ctccgccatt 1200
aagagcttcg cggatggatt cgtcgctatc aacgcccagt acacgccgtc caacggtggc 1260
ctcgctgagc agttcagcag gagcaacggc gctcccgtca gcgctgttga tttgacatgg 1320
agctatgcat ctgcattgac cgcgtttgaa gcgaggaata atactcagtt cgccggctgg 1380
ggcgcggtag gtttgactgt gccgacctcg tgctccagca acagtggtgg aggcggagga 1440
tcgactgtcg ccgtgacgtt caacgtgaac gcccaaacgg tttggggcga aaacatctac 1500
atcactggct cggttgacgc tctgagtaac tggtctcccg acaacgccct cttgctctcg 1560
tctgccaact acccgacctg gagcattacc gtgaatttac ccgcgagcac tgccattcag 1620
tataagtata tccgcaagaa caacggagct gtcacctggg aatccgatcc caacaacagc 1680
ataactactc cagccagcgg ctccgtgacc gagaatgaca cttggcgtta a 1731
<210> 6
<211> 576
<212> PRT
<213> 密粘褶菌
<400> 6
Met Tyr Arg Phe Leu Val Cys Ala Leu Gly Leu Leu Gly Thr Val Leu
1 5 10 15
Ala Gln Ser Val Asp Ser Tyr Val Gly Ser Glu Gly Pro Ile Ala Lys
20 25 30
Ala Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly
35 40 45
Ala Ala Ala Gly Val Val Val Ala Ser Pro Ser Lys Ser Asp Pro Asp
50 55 60
Tyr Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu
65 70 75 80
Ile Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Ser
85 90 95
Leu Ile Asp Ser Phe Val Ile Ala Glu Ala Asn Ile Gln Gln Val Ser
100 105 110
Asn Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe
115 120 125
Asn Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg
130 135 140
Asp Gly Pro Ala Leu Arg Ala Thr Ala Leu Ile Thr Tyr Gly Asn Trp
145 150 155 160
Leu Leu Ser Asn Gly Asn Thr Thr Trp Val Thr Ser Thr Leu Trp Pro
165 170 175
Ile Ile Gln Asn Asp Leu Asn Tyr Val Val Gln Tyr Trp Asn Gln Thr
180 185 190
Thr Phe Asp Leu Trp Glu Glu Val Asn Ser Ser Ser Phe Phe Thr Thr
195 200 205
Ala Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Lys
210 215 220
Ile Gly Gln Thr Ser Ser Val Ser Ser Tyr Thr Thr Gln Ala Ala Asn
225 230 235 240
Leu Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ser Gly Tyr Ile
245 250 255
Thr Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu
260 265 270
Leu Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Thr
275 280 285
Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr
290 295 300
Val Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Ile Ala Ser
305 310 315 320
Asn Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly
325 330 335
Gly Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr
340 345 350
Asp Ala Leu Asn Val Trp Ala Ala Gln Gly Ser Leu Asn Val Thr Ser
355 360 365
Ile Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Ser Val Thr Ala Gly
370 375 380
Thr Tyr Ala Ser Ser Ser Thr Thr Tyr Thr Thr Leu Thr Ser Ala Ile
385 390 395 400
Lys Ser Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Gln Tyr Thr Pro
405 410 415
Ser Asn Gly Gly Leu Ala Glu Gln Phe Ser Arg Ser Asn Gly Ala Pro
420 425 430
Val Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala
435 440 445
Phe Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Val Gly
450 455 460
Leu Thr Val Pro Thr Ser Cys Ser Ser Asn Ser Gly Gly Gly Gly Gly
465 470 475 480
Ser Thr Val Ala Val Thr Phe Asn Val Asn Ala Gln Thr Val Trp Gly
485 490 495
Glu Asn Ile Tyr Ile Thr Gly Ser Val Asp Ala Leu Ser Asn Trp Ser
500 505 510
Pro Asp Asn Ala Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser
515 520 525
Ile Thr Val Asn Leu Pro Ala Ser Thr Ala Ile Gln Tyr Lys Tyr Ile
530 535 540
Arg Lys Asn Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser
545 550 555 560
Ile Thr Thr Pro Ala Ser Gly Ser Val Thr Glu Asn Asp Thr Trp Arg
565 570 575
<210> 7
<211> 16642
<212> DNA
<213> 人工序列
<220>
<223> 质粒 p007
<220>
<221> 尚未归类的特征
<222> (11576)..(11576)
<223> n is a, c, g, or t
<400> 7
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 60
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 120
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 180
ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc tccaccgcgg 240
caacaggcag aatatcttcc gaattcaatc gactgcgcga tgcaagttgg ctagcaacgg 300
cgtacacctt gggattatgc gctgctcaac cgatggtcag ctatcaaaca aaatttggga 360
agatcgggct atactgacgg tgacattata gtacggcaag ctgagtgaca tctacggtcg 420
caagccactg cttctttggg catatgtttt ctttggcgtg ggatgcatta tcaggtagat 480
actccctttt tcttatacgc tggtttgctg gttcgtgctg acagctgttt ccctagcggt 540
attggtcgag acatggcgac tgtcatattg gggcgtgcaa tcagcggaat tgggggtgct 600
ggaacaatgg cgatgggctc tatcattatc acaggtaggc tagcagctta tcaggttgaa 660
agaactgtca ctgaacatag gcagatattg ttcctcgtcg agatgttgcc cattggcggg 720
cgtacatcaa tatcgcgatg actctgggtc gtagcgcagg aggcccaatc ggcggatggc 780
taaccgatac aatcggatgg agatggtatg ctttgcgcct ttgtgaccgc ttctctcact 840
aaattgtggc caaggtcgtt tattatccaa ggccccttag ccgctgtggc agctctgttg 900
gtgatatgga agctcaaact cgccaatcca gtcactgaga agagcatccg ccgtgtcgac 960
tttctcggaa cattcctcct ggccgtcggt attgttacaa tcaccgttat catggaccaa 1020
gcagggcagt ccttcgcatg ggcatcattg tcaacagcaa tccttgcaac tctcagtcta 1080
tcagcattcg tcgccttcgt ccttgttgaa ctctacgtag cccctgaacc gattttcgaa 1140
cttcgcatgt tgcggaagcc gaatgtgacg cccagttacc tgatcggatc gctgcagatc 1200
accgcccaag ttggaatgat gttctccgtg ccgttatatt ttcaggtgac atcgaaagcc 1260
tctgccaccg tagctggagg gcatctggtt cctgcagtga tcggaaacac gcttggcggc 1320
ttaatcgcgg gagcctttat ccgtcgcacc ggccaattca aggtcctctt gatccttgcc 1380
ggtctcgttg cgtccgtcgc ctatctactc ctcatccttc gctggaacgg tcatactgga 1440
ttctgggagt ccttgtacat tattcccggt ggtatgggta ctggtttctg ctctgcagct 1500
gcttttgtca gtatgacggc gtttttgatg ccgcaggaag tggccatggc aacaggaggt 1560
tacttcctat tattcagctt cgccatgacg gccggtgtca ctgtcactaa cagtctgctg 1620
gggacggttt tcaagcgcca gatggaacag cacctgacgg gtccaggagc caagaaggtt 1680
ggtatccccg caccttttct gcgtcactta ctaacgagta tatgaagatc atcgagcgcg 1740
cgctgtccga caccagctat atcaacggtt tgcagggtca tgtccgggat gtagtggtaa 1800
aaggatatgt gactggtctc cgctacactt actgtaagtc gtttgaatca tgcatccacc 1860
gtccacctta ttaacttggt gccagtattt tccctcattc tttcgctcct tggatcggtc 1920
ctcgcttgga ctgtacgaaa acaccaacta tgaggaacca gcacggcagc tgatagtatc 1980
cgaaagctgc aaattgcttc atcgaggctg gcattcgata gaagaaagaa ctatagacaa 2040
ctagtcttac aatatgacaa ttctctttga ttaataaatg aaaataacac ttgtgtcagc 2100
ctaatagccg agtggcgggc atctctggcg gcctcccgag cagcgtggat ctggaagtgc 2160
gttgatcatt attccccgaa aatgtagtac ccagtaagtg gtctagcggt ggctatggta 2220
ggacatctat gcctaagctg gagttctcat tgaacgtgta ccggccgatt gccctaaact 2280
ctgattgaga gccggaaacc tcatctacct gatgctcagg ggccatccaa tagcttccga 2340
tagcattaca gacagatgga ctcgtcttgg cccacgggtc tagaacagtc gccggaactg 2400
cctctatttg aaacggagct gaaccatgat acttaagcgt gccaagcggc gccgtttccc 2460
actggaacaa ggagcaatag aattctgcag agattcttca ttcaggctat tcagcaattc 2520
ggtttgtgga gcggatcggg gtccactggg tttagtctgg ggtttttctt tgcccgcatg 2580
ggctctagca catgcacagc ttgcagttgc tgctacgcta tctgggaaaa cgaatggcta 2640
ttcaggagtt tataaccaaa agagccggaa acaggctgat tgccctctca cggggagacg 2700
ttgtacttct gatccagagg ctattaaccg gacactacct ataaaggagg tagcattcct 2760
ttctgtccgg ctcccagatt ccaacaaccc aactgacagg ggatccacca tgccccagtt 2820
cgatatcctc tgcaagaccc cccccaaggt cctcgtccgc cagttcgtcg agcgcttcga 2880
gcgcccctcc ggcgagaaga tcgccctctg cgccgccgag ctcacctacc tctgctggat 2940
gatcacccat aacggcaccg ccatcaagcg cgccaccttc atgtcctaca acaccatcat 3000
ctccaactcc ctctccttcg atatcgtcaa caagtccctc cagttcaagt acaagaccca 3060
gaaggccacc atcctggagg cctccctcaa gaagctcatc cccgcctggg agttcaccat 3120
catcccctac tacggccaga agcatcagtc cgatatcacc gatatcgtct cctccctcca 3180
gctccagttc gagtcctccg aggaggccga taagggcaac tcccattcca agaagatgct 3240
caaggccctc ctctccgagg gcgagtccat ctgggagatc accgagaaga tcctcaactc 3300
cttcgagtac acctcccgct tcaccaagac caagaccctc taccagttcc tcttcctcgc 3360
caccttcatc aactgcggcc gcttctccga tatcaagaac gtcgatccca agtccttcaa 3420
gctcgtccag aacaagtacc tcggcgtcat catccagtgc ctcgtcaccg agaccaagac 3480
ctccgtctcc cgccatatct acttcttctc cgcccgcggc cgcatcgatc ccctcgtcta 3540
cctcgatgag ttcctccgca actccgagcc cgtcctcaag cgcgtcaacc gcaccggcaa 3600
ctcctcctcc aacaagcagg agtaccagct cctcaaggat aacctcgtcc gctcctacaa 3660
caaggccctc aagaagaacg ccccctactc catcttcgcc atcaagaacg gccccaagtc 3720
ccatatcggc cgccatctca tgacctcctt cctctccatg aagggcctca ccgagctcac 3780
caacgtcgtc ggcaactggt ccgataagcg cgcctccgcc gtcgcccgca ccacctacac 3840
ccatcagatc accgccatcc ccgatcatta cttcgcacta gtctcccgct actacgccta 3900
cgatcccatc tccaaggaga tgatcgccct caaggatgag accaacccca tcgaggagtg 3960
gcagcatatc gagcagctca agggctccgc cgagggctcc atccgctacc ccgcctggaa 4020
cggcatcatc tcccaggagg tcctcgatta cctctcctcc tacatcaacc gccgcatctg 4080
agtcgagatt atccaaggga atgacttaat gagtatgtaa gacatgggtc ataacggcgt 4140
tcgaaacata tacagggtta tgtttgggaa tagcacacga ataataacgt taataggtac 4200
caaagtcctt gatacattag cacggtagaa aaagaataat acaacgagct gggaatattc 4260
tttaatataa aactccaaga agagctggtg cggtggagct tgttttcgac tctcagtaat 4320
atttcctcat atccaagcgc gctaggaggt ggtcgaatac acatgtaggc gcttctctgg 4380
atgcaaaagt cgtgccggac ctgccgaaag actttgaaga tgcgttcacg ccatctaagt 4440
tgcgtagata attcacaaaa agggatgttt gtttccggaa tgtagcaaag agctgatagg 4500
caatagcctc actttcgtgg cgcacgccgc tcgttccatc catcctcgac aatggagcaa 4560
atgtcaaaat cgtaccgaaa atactttgct agcccgttaa attgccgtcg tcagccgtta 4620
aattaccgat taatcccgat aaatttccga gatctccgtt aaattgccgt tcgcagccgt 4680
taaattaccg gggacgaccg ataaatttcc gcgatgaatt catggtgttt tgatcatttt 4740
aaatttttat atggcgggtg gtgggcaact cgcttgcgcg ggcaactcgc ttaccgatta 4800
cgttagggct gatatttacg taaaaatcgt caagggatgc aagaccaaac cgttaaattt 4860
ccggagtcaa cagcatccaa gcccaagtcc ttcacggaga aaccccagcg tccacatcac 4920
gagcgaagga ccacctctag gcatcggacg caccatccaa ttagaagcag caaagcgaaa 4980
cagcccaaga aaaaggtcgg cccgtcggcc ttttctgcaa cgctgatcac gggcagcgat 5040
ccaaccaaca ccctccagag tgactagggg cggaaattta tcgggattaa tttccactca 5100
accacaaatc acagtcgtcc ccggtaattt aacggctgca gacggcaatt taacggcttc 5160
tgcgaatcgc ttggattccc cgcccctggc cgtagagctt aaagtatgtc ccttgtcgat 5220
gcgatgtatc acaacatata aatactggca agggatgcca tgcttggagc aacaatctca 5280
gaacaccaat atcaattcat ctcgagtctg aactcagaca acacaaattc ttcaaaattg 5340
aggatttagt cttgatcttg aagttcctat tccgagttcc tattctctag aaagtatagg 5400
aacttcttaa ttaacctagc cgttattact ctaccgcaag gcaacaacca gctcacccct 5460
gaggcacggg taccatgggt tgagtggtat ggggccatcc agagtcacct gtggcagcat 5520
gagactgcac tcgaagcagc catcaaccca gccaatattc tgggctttcc atccttagat 5580
cacatttgag atataaccca tttggtgaga gacacttgtg ccgttatacg tgtctagact 5640
ggaaacgcaa ccctgaaggg attcttcctt tgagagatgg aagcgtgtca tatctcttcg 5700
gttctacggc aggttttttt ctgctctttc gtagcatggc atggtcactt cagcgcttat 5760
ttacagttgc tggtattgat ttcttgtgca aattgctatc tgacacttat taggtcgagc 5820
tattcctttg ccctcggacg agtgctgggg cgtcggtttc cactatcggc gagtacttct 5880
acacagccat cggtccagac ggccgcgctt ctgcgggcga tttgtgtacg cccgacagtc 5940
ccggctccgg atcggacgat tgcgtcgcat cgaccctgcg cccaagctgc atcatcgaaa 6000
ttgccgtcaa ccaagctctg atagagttgg tcaagaccaa tgcggagcat atacgcccgg 6060
agccgcggcg atcctgcaag ctccggatgc ctccgctcga agtagcgcgt ctgctgctcc 6120
atacaagcca accacggcct ccagaagaag atgttggcga cctcgtattg ggaatccccg 6180
aacatcgcct cgctccagtc aatgaccgct gttatgcggc cattgtccgt caggacattg 6240
ttggagccga aatccgcgtg cacgaggtgc cggacttcgg ggcagtcctc ggcccaaagc 6300
atcagctcat cgagagcctg cgcgacggac gcactgacgg tgtcgtccat cacagtttgc 6360
cagtgataca catggggatc agcaatcgcg catatgaaat cacgccatgt agtgtattga 6420
ccgattcctt gcggtccgaa tgggccgaac ccgctcgtct ggctaagatc ggccgcagcg 6480
atcgcatcca tggcctccgc gaccggctgc agaacagcgg gcagttcggt ttcaggcagg 6540
tcttgcaacg tgacaccctg tgcacggcgg gagatgcaat aggtcaggct ctcgctgaat 6600
tccccaatgt caagcacttc cggaatcggg agcgcggccg atgcaaagtg ccgataaaca 6660
taacgatctt tgtagaaacc atcggcgcag ctatttaccc gcaggacata tccacgccct 6720
cctacatcga agctgaaagc acgagattct tcgccctccg agagctgcat caggtcggag 6780
acgctgtcga acttttcgat cagaaacttc tcgacagacg tcgcggtgag ttcaggcgac 6840
attgctgagg tgtaggatcg atccgtttaa actctgtgtt agcttatagt caggatgttg 6900
gctcgacgag tgtaaactgg gagttggcat gagggttatg taggcttctt tagccccgca 6960
tccccctcat tctcctcatt gatcccgggg gagcggatgg tgttgataag agactaatta 7020
tagggtttag ctggtgccta gctggtgatt ggctggcttc gccgaatttt acgggccaag 7080
ggaagctgca gaaccgcggc actggtaaac ggtaattaag ctatcagccc catgctaacg 7140
agtttaaatt acgtgtattg ctgataaaca ccaacagagc tttactgaaa gatgggagtc 7200
acggtgtggc ttccccactg cgattattgc acaagcagcg agggcgaact tgactgtcgt 7260
cgctgagcag cctgcagtca aacatacata tatatcaacc gcgaagacgt ctggccttgt 7320
agaacacgac gctccctagc aacacctgcc gtgtcagcct ctacggttgt tacttgcatt 7380
caggatgctc tccagcgggc gagctattca aaatattcaa agcaggtatc tcgtattgcc 7440
aggattcagc tgaagcaaca ggtgccaagg aaatctgcgt cggttctcat ctgggcttgc 7500
tcggtcctgg cgtagactag ttgaagttcc tattccgagt tcctattctt caaatagtat 7560
aggaacttca tcagggagat gtaacaacgc caccttatgg gactatcaag ctgacgctgg 7620
cttctgtgca gacaaactgc gcccacgagt tcttccctga cgccgctctc gcgcaggcaa 7680
gggaactcga tgaatactac gcaaagcaca agagacccgt tggtccactc catggcctcc 7740
ccatctctct caaagaccag cttcgagtca aggtacaccg ttgcccctaa gtcgttagat 7800
gtcccttttt gtcagctaac atatgccacc agggctacga aacatcaatg ggctacatct 7860
catggctaaa caagtacgac gaaggggact cggttctgac aaccatgctc cgcaaagccg 7920
gtgccgtctt ctacgtcaag acctctgtcc cgcagaccct gatggtctgc gagacagtca 7980
acaacatcat cgggcgcacc gtcaacccac gcaacaagaa ctggtcgtgc ggcggcagtt 8040
ctggtggtga gggtgcgatc gttgggattc gtggtggcgt catcggtgta ggaacggata 8100
tcggtggctc gattcgagtg ccggccgcgt tcaacttcct gtacggtcta aggccgagtc 8160
atgggcggct gccgtatgca aagatggcga acagcatgga gggtcaggag acggtgcaca 8220
gcgttgtcgg gccgattacg cactctgttg agggtgagtc cttcgcctct tccttctttt 8280
cctgctctat accaggcctc cactgtcctc ctttcttgct ttttatacta tatacgagac 8340
cggcagtcac tgatgaagta tgttagacct ccgcctcttc accaaatccg tcctcggtca 8400
ggagccatgg aaatacgact ccaaggtcat ccccatgccc tggcgccagt ccgagtcgga 8460
cattattgcc tccaagatca agaacggcgg gctcaatatc ggctactaca acttcgacgg 8520
caatgtcctt ccacaccctc ctatcctgcg cggcgtggaa accaccgtcg ccgcactcgc 8580
caaagccggt cacaccgtga ccccgtggac gccatacaag cacgatttcg gccacgatct 8640
catctcccat atctacgcgg ctgacggcag cgccgacgta atgcgcgata tcagtgcatc 8700
cggcgagccg gcgattccaa atatcaaaga cctactgaac ccgaacatca aagctgttaa 8760
catgaacgag ctctgggaca cgcatctcca gaagtggaat taccagatgg agtaccttga 8820
gaaatggcgg gaggctgaag aaaaggccgg gaaggaactg gacgccatca tcgcgccgat 8880
tacgcctacc gctgcggtac ggcatgacca gttccggtac tatgggtatg cctctgtgat 8940
caacctgctg gatttcacga gcgtggttgt tccggttacc tttgcggata agaacatcga 9000
taagaagaat gagagtttca aggcggttag tgagcttgat gccctcgtgc aggaagagta 9060
tgatccggag gcgtaccatg gggcaccggt tgcagtgcag gttatcggac ggagactcag 9120
tgaagagagg acgttggcga ttgcagagga agtggggaag ttgctgggaa atgtggtgac 9180
tccataggta agctccgtgg cgaaagcctg acgcaccggt agattcttgg tgagcccgta 9240
tcatgacggc ggcgggagct acatggcccc gggtgattta ttttttttgt atctacttct 9300
gacccttttc aaatatacgg tcaactcatc tttcactgga gatgcggcct gcttggtatt 9360
gcgatgttgt cagcttggca aattgtggct ttcgaaaaca caaaacgatt ccttagtagc 9420
catgcatttt aagataacgg aatagaagaa agaggaaatt aaaaaaaaaa aaaaaacaaa 9480
catcccgttc ataacccgta gaatcgccgc tcttcgtgta tcccagtacc acggcaaagg 9540
tatttcatga tcgttcaatg ttgatattgt tcccgccagt atggctccac ccccatctcc 9600
gcgaatctcc tcttctcgaa cgcggtagtg gcgcgccaat tggtaatgac ccatagggag 9660
acaaacagca taatagcaac agtggaaatt agtggcgcaa taattgagaa cacagtgaga 9720
ccatagctgg cggcctggaa agcactgttg gagaccaact tgtccgttgc gaggccaact 9780
tgcattgtct agagaatgca atcataacag aaagtacagc cagcgctgtg tcataaagaa 9840
gtccagttgg gaaacgaaag actagaatca aactaaaagt aatccggccg atatggcttc 9900
acgtgcgaag tctcgccttg aggggacatt gtccttgcag gtgattgacc attgcgttca 9960
tatggcgcga tgtttggtag tgtgggtgta gccggtgacc tcacggaagg actaaaggcc 10020
acataccctt ctgagtgcct cttctcttcg tggtcggaac tctcgaatgg gtttttgaca 10080
gttgcactcg tttggttgtg gtcatttgaa ggtctgcgtt cggtcttctg ttcgcgcagg 10140
cgagctgact gagggattga aagctgcata gccatcgttg gcatgcgtta attcgccaaa 10200
gctcagcggc gaaacaggcc tgacctctaa tccatgcatc tgctctgcac tcgattgttc 10260
gtggtgtcct tgcgaagaaa gagaagcctt ggactcggat gactttctgg acgaggtggt 10320
aggatcatca tgattgtaat gagactgtag cacatcatgc gaatcattcg acacacggtg 10380
tctgcccaag ttgacgtcag catcggtatg catttcggta tggtcctcat ggttctcagc 10440
atgtccctcc agaggggact catttccagc ggaaggatta taagcaacat aattgtcatg 10500
tggctgcgac ctttcgtgag actccgagtt tgatctcact gtggactcat gggcgatatg 10560
cggctcatca tgatcttcga atggagagaa atggttgaag tcggaggaca cgggtgattt 10620
agcagcaggg ttgaatgcaa catagccagt ctcgcgctct tcatgtgagc tatatgagtc 10680
atgtggcctg tcatggtcca gaggctccgg atgctcatgg ctagattcat cgtgtgccga 10740
aatcgcgtca ctagcaaagg gcgaggttga cacattggct gcaggactga acgccacata 10800
accactctca ggctcttcat gtgagttata ggagctgtgc ggcatatcat agtcctgagg 10860
ttcacgatgc tcatggctgg attcatcgtg tgccgaaata gcgtgactag caaaaggcga 10920
gggcgaagca ttggttgccg gactgaacgc cacatagccg tccccattgg ctgaactgac 10980
tggtgacaac gtcctaccca tggcgtcggc cgggccagcg gcttggtgag agtgaagacc 11040
attagaagta gctggactga acgatcgcag cgggtattcg ttttcttgag ctggataagg 11100
ggctgcgcca tgctggctga aaggtgagaa tgttcggggt gctgctctat caccagggaa 11160
ggcagacgct ggagtcaaag aacgagtgtt ggatcaattg ccggactgta tgaacggaaa 11220
ggagtgctga ttgtttaaat ggcccgtagc cttcgctagg acctcgtgat tcggggaccg 11280
ttggcccata cccaggagct ggtgtaaaat tggaacgcga cacgggtgtt tggttgcgca 11340
gaatttgcgg tgccggcgag gcgtgatcaa tctggctgta acctgggcct ggggtgtagt 11400
ttgagacagg tgtttgtgtt cgtggcattt gtggcgctgg cgacgctctg tcagtcggcc 11460
catatccagg cgccgaaggt gtgggcgtaa acccttgccg tgatttaatt aagaattctc 11520
ctgtaggctt gagagttcaa ggaagaaaca gtgcaattat ctttgcgaac ccaggngctg 11580
gtgacggaat tttcatagtc aagctatcag agtaaagaag aggagcatgt caaagtacaa 11640
ttagagacaa atatatagtc gcgtggagcc aagagcggat tcctcagtct cgtaggtctc 11700
ttgacgaccg ttgatctgct tgatctcgtc tcccgaaaat gaaaatagac tctgctaagc 11760
tattcttctg cttcgccgga gcctgaaggg cgtactaggg ttgcgaggtc caatgcatta 11820
atgcattgca gatgagctgt atctggaaga ggtaaacccg aaacgcgttt tattcttgtt 11880
gacatggagc tattaaatca ctagaaggca ctctttgctg cttggacaaa tgaacgtatc 11940
ttatcgagat cctgaacacc atttgtctca actccggagc tgacatcgac accaacgatc 12000
ttatatccag attcgtcaag ctgtttgatg atttcagtaa cgttaagtgg atcgatccgg 12060
atagcgcggg ttccttccgg tattgtctcc ttccgtgttt cagttagcct cccccatctc 12120
ccgggcaaac gtgcgcgcca ggtcgcatat cgtcggtatg gagccggggg tggtgacgtg 12180
ggtctggacc atcccggagg taagttgcag cagggcgtcc cggcagccgg cgggcgattg 12240
gtcgtaatcc aggataaaga cgtgcatgga acggaggcgt ttggccaaga cgtccaaggc 12300
ccaggcaaac acgttataca ggtcgccgtt gggggccagc aactcggggc cccgaaacag 12360
ggtaaataac gtgtccccga tatggggtcg tgggcccgcg ttgctctggg gctcggcacc 12420
ctggggcggc acggccgtcc ccgaaagctg tccccagtcc tcccgccacg acccgccgca 12480
ctgcagatac cgcaccgtat tggcaagtag cccgtaaacg cggcgaatcg cagccagcat 12540
agccaggtcc agccgctcgc cggggcgctg gcgtttggcc aggcggtcga tgtgtctgtc 12600
ctccggaagg gccccaagca cgatgttggt gccgggcaag gtcggcggga tgagggccac 12660
gaacgccagc acggcctggg gggtcatgct gcccataagg taccgcgcgg ccgggtagca 12720
caggagggcg gcgatgggat ggcggtcgaa gatgagggtg agggccgggg gcggggcatg 12780
tgagctccca gcctcccccc cgatatgagg agccagaacg gcgtcggtca cggcataagg 12840
catgcccatt gttatctggg cgcttgtcat taccaccgcc gcgtccccgg ccgatatctc 12900
accctggtcg aggcggtgtt gtgtggtgta gatgttcgcg attgtctcgg aagcccccag 12960
cacccgccag taagtcatcg gctcgggtac gtagacgata tcgtcgcgcg aacccagggc 13020
caccagcagt tgcgtggtgg tggttttccc catcccgtgg ggaccgtcta tataaacccg 13080
cagtagcgtg ggcattttct gctccgggcg gacttccgtg gcttcttgct gccggcgagg 13140
gcgcaacgcc gtacgtcggt tgctatggcc gcgagaacgc gcagcctggt cgaacgcaga 13200
cgcgtgttga tggccggggt acgaagccat acgcgcttct acaaggcgct ggccgaagag 13260
gtgcgggagt ttcacgccac caagatcgat ctacagctgg tggggagagc aggaaaatat 13320
ggcaacaaat gttggactga cgcaacgacc ttgtcaaccc cgccgacaca ccgggcggac 13380
agacggggca aagctgccta ccagggactg agggacctca gcaggtcgag tgcagagcac 13440
cggatgggtc gactgccagc ttgtgttccc ggtctgcgcc gctggccagc tcctgagcgg 13500
cctttccggt ttcatacacc gggcaaagca ggagaggcac gatatttgga cgccctacag 13560
atgccggatg ggccaattag ggagcttacg cgccgggtac tcgctctacc tacttcggag 13620
aaggtactat ctcgtgaatc ttttaccaga tcggaagcaa ttggacttct gtacctaggt 13680
taatggcatg ctatttcgcc gacggctata cacccctggc ttcacattct ccttcgctta 13740
ctgccggtga ttcgatgaag ctccatattc tccgatgatg caatagattc ttggtcaacg 13800
aggggcacac cagcctttcc acttcggggc ggaggggcgg ccggtcccgg attaataatc 13860
atccactgca cctcagagcc gccagagctg tctggcgcag tggccgttat tactcagccc 13920
ttctctctgc gtccgtccgt ctctccgcat gccagaaaga gtcaccggtc actgtacaga 13980
gctcaagctt cgattaactc gagggggggc ccggtaccca attcgcccta tagtgagtcg 14040
tattacaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc 14100
caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag cgaagaggcc 14160
cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggaa attgtaagcg 14220
ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat 14280
aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg 14340
ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc 14400
gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt 14460
tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag 14520
cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg 14580
gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc 14640
ttaatgcgcc gctacagggc gcgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 14700
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 14760
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 14820
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 14880
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 14940
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 15000
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 15060
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 15120
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 15180
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 15240
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 15300
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 15360
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 15420
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 15480
ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 15540
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 15600
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 15660
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 15720
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 15780
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 15840
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 15900
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 15960
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 16020
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 16080
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 16140
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 16200
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 16260
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 16320
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 16380
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 16440
ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 16500
ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 16560
ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc 16620
tccccgcgcg ttggccgatt ca 16642
<210> 8
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 引物 SpeI-FRTF3-amdS
<400> 8
tggcgtagac tagttgaagt tcctattccg agtcctattc ttcaaatagt ataggaactt 60
catcagggag atgtaacaac 80
<210> 9
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物 amdS-F-探针
<400> 9
ctatggagtc accacatttc cc 22
<210> 10
<211> 6330
<212> DNA
<213> 人工序列
<220>
<223> 载体 pFRT-BsAMG
<400> 10
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cttgaagttc ctattccgag 420
ttcctattct ctagaaagta taggaacttc ctcgagacca tgtacttcgc tcgccttctc 480
tccggactct ctctcatcac ctctgcggtt ctcgcccaga ccgttgactc ctatgtcagc 540
actgagggcc ccatcgcgaa ggcgggcctc cttgcgaaca ttggtcccag tggttccaaa 600
tccaacggtg cccatgctgg agttgtcgtc gctagcccta gccaagtcaa cccggactac 660
atgtacacat gggtccgcga ctcttccctc gtgttcaagg tcctcgtcga ccagctcgct 720
tccggccagg acacctctgt ccgtagcctg atcgatgcat tcgtcgcagc ggagtcggcg 780
atgcagcaca cccccaaccc cagtggtgac atcaacactg gtggtcttgc tgagcccaag 840
ttcaacatcg acaccaccgc cttcactggc gcatggggcc gcccgcagcg agatggccct 900
gctctccgtt ctaccaccgt catcaactac gccaactacc tccttgctaa tggcaacacc 960
actgcttggg tggtggccaa cctctggccc atgatcaagc tcgacttgga ctacatccag 1020
aacaactgga accagtctac cttcgacctg tgggaggagc tcaactcctc gtccttcttc 1080
accaccgctg ttcagcaccg tgctctccgc gagggtatta ctctcggcgc gaagctctcg 1140
aagactgccg ataccgccaa ctatggcacc caggccggca acatcctttg cttcctccag 1200
tcatactgga accctaccgc caactacgtg acctccaaca ccggtggtgg acgctccggc 1260
aaggactcca actccgtcct tacttccatc cacactttcg accccgatgc cggatgtgat 1320
gctaccacct tccagccctg ctccgacaag gccctgtcca acctcaaggt ttacgtcgac 1380
tcgttccgct ccatctgggc catcaacgct ggcgctgctg ccaccgctcc cgtcgctgtc 1440
ggccgctacc ccgaggacac ttactacaac ggtaacccct ggtacctctc tactttcgcc 1500
gtcgccgagc agctctacga tgccatcatc gtctggaaca agcagggatc catccaggtc 1560
accagccttt cccttccctt cttccagcag ttcatctcga ccctcaagac cggcacgtac 1620
acccagagct ccacccagtt ccagaccctc gtccctgcca tcaaggcctg ggctgacggc 1680
ttcgtcgcca tcaaccagaa gtacactcct cctaacggtg gtctcggtga acagtacgac 1740
aaggtctctg gcgaccctgt cagcgctgtt gaccttacct ggtcgtatgc ttccgctctc 1800
accgtcttca acgctcgtgc cggaaactac tcccccggct ggggtgccaa gggcctgacc 1860
gtcccggcag tctgccagcc caacgctggc cctcaagtcc aggtgacgtt caaggttcag 1920
gccacgacgg tctacggcga gaacatttac ctcactggtg ctaacccagc tctgtcgaac 1980
tggtcgcccg acaccgccct cgccatgtct gctgctaact accctacctg gtctgtcaca 2040
gtcaccctcc cggcgaacag cgtcatccag tacaagtaca tcaggaagaa caacggcgcc 2100
gtcacctggg agtctgaccc caacaaccag gtcaccatcc cagcgagcgg cacctacacc 2160
gtcaacgata actggcggta attaattaat aataaataac ggattgtgtc cgtaatcaca 2220
cgtgcccgtg gtgcgtacga taacgcatag tgtttttccc tccacttaaa tcgaagggtt 2280
gtgtcttgga tcgcgcgggt caaatgtata tggttcatat acatccgcag gcacgtaata 2340
aagcgagggg ttcgaatccc cccgttaccc ccggtagggg cccagatccg ggtgactgac 2400
acctggcggt agacaatcaa tccatttcgc tatagttaaa ggatggggat gagggcaatt 2460
ggttatatga tcatgtatgt agtgggtgtg cataatagta gtgaaatgga agccaagtca 2520
tgtgattgta atcgaccgac ggaattgagg atatccggaa atacagacac cgtgaaagcc 2580
atggtctttc cttcgtgtag aagaccagac agacagtccc tgatttaccc ttgcacaaag 2640
cactagaaaa ttagcattcc atccttctct gcttgctctg ctgatatcac tgtcattcaa 2700
tgcatagcca tgagctcatc ttagatccaa gcacgtaatt ccatagccga ggtccacagt 2760
ggagcagcaa cattccccat cattgctttc cccaggggcc tcccaacgac taaatcaaga 2820
gtatatctct accgtccaat agatcgtctt cgcttcaaaa tctttgacaa ttccaagagg 2880
gtccccatcc atcaaaccca gttcaataat agccgagatg catggtggag tcaattaggc 2940
agtattgctg gaatgtcggg gccagttggc ccggtggtca ttggccgcct gtgatgccat 3000
ctgccactaa atccgatcat tgatccaccg cccacgaggc gcgtctttgc tttttgcgcg 3060
gcgtccaggt tcaactctct ccactagtct agcggggttc aaatgcaaac aagtacaaca 3120
cgcagcaaac gaagcagccc accactgcgt tgatgcccag tttgactgtc cgaaatccac 3180
cggaaaggtg gaaacatact atgtaacaat cagagggaag aaaaaatttt tatcgacgag 3240
gcaggatagt gactgatggt ggggtcatgg tcgggtctcc gagcgaaaga gaaccaagga 3300
aacaagatca acgaggttgg tgtacccaaa aggccgcagc aacaagagtc atcgcccaaa 3360
agtcaacagt ctggaagaga ctccgccgtg cagattctgc gtcggtcccg cacatgcgtg 3420
gtgggggcat tacccctcca tgtccaatga taagggcggc ggtcgagggc ttaagcccgc 3480
ccactaattc gccttctcgc ttgcccctcc atataaggat tccccctcct tcccctccca 3540
caactttttt ccttctttct ctcttcgtcc gcatcagtac gtatatcttt cccccatacc 3600
tcctttccta ctcttcttcc attcattcaa ctcttctcct tactgacatc tgttttgctc 3660
agtacctcta cgcgatcagc cgtagtatct gagcaagctt ctctacagaa tctttctagt 3720
atcttacaaa gaactacaaa gttcgcacca atgcctcaat cctgggaaga actggccgct 3780
gataagcgcg cccgcctcgc aaaaaccatc cctgatgaat ggaaagtcca gacgctgcct 3840
gcggaagaca gcgttattga tttcccaaag aaatcgggta tcctttcaga ggccgaactg 3900
aagatcacag aggcctccgc tgcagatctt gtgtccaagc tggcggccgg agagttgacc 3960
tcggcggaag ttacgctagc attctgtaaa cgggcagtaa tcgcccagca gttagtaggg 4020
tcccctctac ctcttgaagt tcctattccg agttcctatt cttcaaatag tataggaact 4080
tcacgcatgc aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 4140
cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4200
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4260
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4320
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4380
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4440
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4500
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4560
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4620
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4680
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 4740
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 4800
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 4860
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 4920
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 4980
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5040
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5100
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5160
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5220
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5280
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5340
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5400
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5460
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5520
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5580
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5640
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 5700
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 5760
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 5820
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 5880
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 5940
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6000
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6060
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6120
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6240
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 6300
aaaataggcg tatcacgagg ccctttcgtc 6330
<210> 11
<211> 1722
<212> DNA
<213> Byssocorticium
<400> 11
atgtacttcg ctcgccttct ctccggactc tctctcatca cctctgcggt tctcgcccag 60
accgttgact cctatgtcag cactgagggc cccatcgcga aggcgggcct ccttgcgaac 120
attggtccca gtggttccaa atccaacggt gcccatgctg gagttgtcgt cgctagccct 180
agccaagtca acccggacta catgtacaca tgggtccgcg actcttccct cgtgttcaag 240
gtcctcgtcg accagctcgc ttccggccag gacacctctg tccgtagcct gatcgatgca 300
ttcgtcgcag cggagtcggc gatgcagcac acccccaacc ccagtggtga catcaacact 360
ggtggtcttg ctgagcccaa gttcaacatc gacaccaccg ccttcactgg cgcatggggc 420
cgcccgcagc gagatggccc tgctctccgt tctaccaccg tcatcaacta cgccaactac 480
ctccttgcta atggcaacac cactgcttgg gtggtggcca acctctggcc catgatcaag 540
ctcgacttgg actacatcca gaacaactgg aaccagtcta ccttcgacct gtgggaggag 600
ctcaactcct cgtccttctt caccaccgct gttcagcacc gtgctctccg cgagggtatt 660
actctcggcg cgaagctctc gaagactgcc gataccgcca actatggcac ccaggccggc 720
aacatccttt gcttcctcca gtcatactgg aaccctaccg ccaactacgt gacctccaac 780
accggtggtg gacgctccgg caaggactcc aactccgtcc ttacttccat ccacactttc 840
gaccccgatg ccggatgtga tgctaccacc ttccagccct gctccgacaa ggccctgtcc 900
aacctcaagg tttacgtcga ctcgttccgc tccatctggg ccatcaacgc tggcgctgct 960
gccaccgctc ccgtcgctgt cggccgctac cccgaggaca cttactacaa cggtaacccc 1020
tggtacctct ctactttcgc cgtcgccgag cagctctacg atgccatcat cgtctggaac 1080
aagcagggat ccatccaggt caccagcctt tcccttccct tcttccagca gttcatctcg 1140
accctcaaga ccggcacgta cacccagagc tccacccagt tccagaccct cgtccctgcc 1200
atcaaggcct gggctgacgg cttcgtcgcc atcaaccaga agtacactcc tcctaacggt 1260
ggtctcggtg aacagtacga caaggtctct ggcgaccctg tcagcgctgt tgaccttacc 1320
tggtcgtatg cttccgctct caccgtcttc aacgctcgtg ccggaaacta ctcccccggc 1380
tggggtgcca agggcctgac cgtcccggca gtctgccagc ccaacgctgg ccctcaagtc 1440
caggtgacgt tcaaggttca ggccacgacg gtctacggcg agaacattta cctcactggt 1500
gctaacccag ctctgtcgaa ctggtcgccc gacaccgccc tcgccatgtc tgctgctaac 1560
taccctacct ggtctgtcac agtcaccctc ccggcgaaca gcgtcatcca gtacaagtac 1620
atcaggaaga acaacggcgc cgtcacctgg gagtctgacc ccaacaacca ggtcaccatc 1680
ccagcgagcg gcacctacac cgtcaacgat aactggcggt aa 1722
<210> 12
<211> 573
<212> PRT
<213> Byssocorticium
<400> 12
Met Tyr Phe Ala Arg Leu Leu Ser Gly Leu Ser Leu Ile Thr Ser Ala
1 5 10 15
Val Leu Ala Gln Thr Val Asp Ser Tyr Val Ser Thr Glu Gly Pro Ile
20 25 30
Ala Lys Ala Gly Leu Leu Ala Asn Ile Gly Pro Ser Gly Ser Lys Ser
35 40 45
Asn Gly Ala His Ala Gly Val Val Val Ala Ser Pro Ser Gln Val Asn
50 55 60
Pro Asp Tyr Met Tyr Thr Trp Val Arg Asp Ser Ser Leu Val Phe Lys
65 70 75 80
Val Leu Val Asp Gln Leu Ala Ser Gly Gln Asp Thr Ser Val Arg Ser
85 90 95
Leu Ile Asp Ala Phe Val Ala Ala Glu Ser Ala Met Gln His Thr Pro
100 105 110
Asn Pro Ser Gly Asp Ile Asn Thr Gly Gly Leu Ala Glu Pro Lys Phe
115 120 125
Asn Ile Asp Thr Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg
130 135 140
Asp Gly Pro Ala Leu Arg Ser Thr Thr Val Ile Asn Tyr Ala Asn Tyr
145 150 155 160
Leu Leu Ala Asn Gly Asn Thr Thr Ala Trp Val Val Ala Asn Leu Trp
165 170 175
Pro Met Ile Lys Leu Asp Leu Asp Tyr Ile Gln Asn Asn Trp Asn Gln
180 185 190
Ser Thr Phe Asp Leu Trp Glu Glu Leu Asn Ser Ser Ser Phe Phe Thr
195 200 205
Thr Ala Val Gln His Arg Ala Leu Arg Glu Gly Ile Thr Leu Gly Ala
210 215 220
Lys Leu Ser Lys Thr Ala Asp Thr Ala Asn Tyr Gly Thr Gln Ala Gly
225 230 235 240
Asn Ile Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ala Asn Tyr
245 250 255
Val Thr Ser Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ser Asn Ser
260 265 270
Val Leu Thr Ser Ile His Thr Phe Asp Pro Asp Ala Gly Cys Asp Ala
275 280 285
Thr Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val
290 295 300
Tyr Val Asp Ser Phe Arg Ser Ile Trp Ala Ile Asn Ala Gly Ala Ala
305 310 315 320
Ala Thr Ala Pro Val Ala Val Gly Arg Tyr Pro Glu Asp Thr Tyr Tyr
325 330 335
Asn Gly Asn Pro Trp Tyr Leu Ser Thr Phe Ala Val Ala Glu Gln Leu
340 345 350
Tyr Asp Ala Ile Ile Val Trp Asn Lys Gln Gly Ser Ile Gln Val Thr
355 360 365
Ser Leu Ser Leu Pro Phe Phe Gln Gln Phe Ile Ser Thr Leu Lys Thr
370 375 380
Gly Thr Tyr Thr Gln Ser Ser Thr Gln Phe Gln Thr Leu Val Pro Ala
385 390 395 400
Ile Lys Ala Trp Ala Asp Gly Phe Val Ala Ile Asn Gln Lys Tyr Thr
405 410 415
Pro Pro Asn Gly Gly Leu Gly Glu Gln Tyr Asp Lys Val Ser Gly Asp
420 425 430
Pro Val Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr
435 440 445
Val Phe Asn Ala Arg Ala Gly Asn Tyr Ser Pro Gly Trp Gly Ala Lys
450 455 460
Gly Leu Thr Val Pro Ala Val Cys Gln Pro Asn Ala Gly Pro Gln Val
465 470 475 480
Gln Val Thr Phe Lys Val Gln Ala Thr Thr Val Tyr Gly Glu Asn Ile
485 490 495
Tyr Leu Thr Gly Ala Asn Pro Ala Leu Ser Asn Trp Ser Pro Asp Thr
500 505 510
Ala Leu Ala Met Ser Ala Ala Asn Tyr Pro Thr Trp Ser Val Thr Val
515 520 525
Thr Leu Pro Ala Asn Ser Val Ile Gln Tyr Lys Tyr Ile Arg Lys Asn
530 535 540
Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Gln Val Thr Ile
545 550 555 560
Pro Ala Ser Gly Thr Tyr Thr Val Asn Asp Asn Trp Arg
565 570
<210> 13
<211> 283
<212> DNA
<213> 构巢曲霉
<400> 13
atgcctcaat cctgggaaga actggccgct gataagcgcg cccgcctcgc aaaaaccatc 60
cctgatgaat ggaaagtcca gacgctgcct gcggaagaca gcgttattga tttcccaaag 120
aaatcgggta tcctttcaga ggccgaactg aagatcacag aggcctccgc tgcagatctt 180
gtgtccaagc tggcggccgg agagttgacc tcggtggaag ttacgctagc attctgtaaa 240
cgggcagcaa tcgcccagca gttagtaggg tcccctctac ctc 283
<210> 14
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物 M13 RV
<400> 14
caggaaacag ctatgac 17
<210> 15
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物 M13 M4
<400> 15
gttttcccag tcacgac 17
<210> 16
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 在融合载体R中的引物
<400> 16
tatgcgttat cgtacgcac 19
<210> 17
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 引物 M13 M4
<400> 17
gttttcccag tcacgac 17
<210> 18
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物 M49X F
<220>
<221> 尚未归类的特征
<222> (16)..(17)
<223> n is a, c, g, or t
<400> 18
gtcaacccgg actacnnkta cacatgg 27
<210> 19
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物 M49X R
<400> 19
gtagtccggg ttgacttg 18
<210> 20
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物 SOE-M4 F
<400> 20
gtactatctg gcattggtac gttttcccag tcacgac 37
<210> 21
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物 SOE-MR R
<400> 21
tggttatgat ttcggcgatg caggaaacag ctatgac 37
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 SOE-F
<400> 22
gtactatctg gcattggtac 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 SOE-R
<400> 23
tggttatgat ttcggcgatg 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物插入物解救F
<400> 24
aatctcagaa caccaatatc 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物插入物解救R
<400> 25
aacactatgc gttatcgtac 20
<210> 26
<211> 11101
<212> DNA
<213> 人工序列
<220>
<223> 载体 pDAu571
<400> 26
ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttca gtacccgggt 60
ataagctagc ttccgttaaa ttgccgtcgt cagccgttaa attaccgatt aatcccgata 120
aatttccgag atctccgtta aattgccgtt cgcagccgtt aaattaccgg ggacgaccga 180
taaatttccg cgatgaattc atggtgtttt gatcatttta aatttttata tggcgggtgg 240
tgggcaactc gcttgcgcgg gcaactcgct taccgattac gttagggctg atatttacgt 300
aaaaatcgtc aagggatgca agaccaaacc gttaaatttc cggagtcaac agcatccaag 360
cccaagtcct tcacggagaa accccagcgt ccacatcacg agcgaaggac cacctctagg 420
catcggacgc accatccaat tagaagcagc aaagcgaaac agcccaagaa aaaggtcggc 480
ccgtcggcct tttctgcaac gctgatcacg ggcagcgatc caaccaacac cctccagagt 540
gactaggggc ggaaatttat cgggattaat ttccactcaa ccacaaatca cagtcgtccc 600
cggtaattta acggctgcag acggcaattt aacggcttct gcgaatcgct tggattcccc 660
gcccctggcc gtagagctta aagtatgtcc cttgtcgatg cgatgtatca caacatataa 720
atactggcaa gggatgccat gcttggagtt tccaactcaa tttacctcta tccacacttc 780
tcttccttcc tcaatcctct atatacacaa ctggggatcc accatgttct cggcaggcca 840
caagattaag ggtacagtcg tcctcatgcc taaaaacgag ttggaagtga accccgatgg 900
ctccgcagtc gataacctca acgcattcct cggacgttcg gtgtcgctcc agctcatctc 960
cgcgaccaaa gccgacgccc acggtaaggg aaaggtgggc aaggacacgt tcttggaagg 1020
tatcaacact tcgctcccta ccttgggagc aggagagtcc gcattcaaca ttcacttcga 1080
gtgggacggt tcgatgggca ttcccggagc gttctatatc aagaactata tgcaggtgga 1140
gttcttcttg aagtccttga ccttggaggc aatctcgaac cagggtacca tccgtttcgt 1200
gtgtaactcg tgggtctaca acaccaagct ctacaaatcc gtgcggatct tcttcgcgaa 1260
ccacacttac gtcccttcgg agacacctgc ccctttggtg tcgtaccgcg aggaggaatt 1320
gaagtccctc cgtggtaacg gtactggaga aaggaaggag tatgatagga tctacgacta 1380
cgacgtctat aacgatttgg gtaaccccga caaatcggaa aagttggcac gtcctgtgtt 1440
gggaggctcc tccaccttcc cctaccctcg acgcggccgc acgggacgcg gtcccactgt 1500
caccgatccg aacacagaga agcagggcga agtcttctac gtgcccaggg acgaaaacct 1560
cggccacttg aagtcgaagg atgcattgga gattggaacc aagtccctct cccagatcgt 1620
ccagcctgca ttcgaatcgg cgttcgattt gaaatcgacg cccatcgagt tccactcgtt 1680
ccaggacgtc catgacttgt atgaaggtgg tatcaaattg cctcgggacg tcatctccac 1740
cattatcccc ctccccgtga tcaaggaatt gtaccgcacc gacggccagc atattctcaa 1800
attcccccag ccgcacgtcg tccaggtctc gcagtccgca tggatgacag atgaggaatt 1860
cgcgagggaa atgattgcag gtgtcaaccc gtgtgtcatc cgaggcttgg aggagttccc 1920
tcctaagtcc aacctcgatc ctgccatcta tggagaccag tcctccaaga ttacagccga 1980
ttccctcgat ctcgacggtt atactatgga tgaagcactc ggttccaggc gattgttcat 2040
gctcgattat catgatatct tcatgcccta tgtgcgccag atcaaccagt tgaactcggc 2100
aaaaacatat gcaacgagga cgatcctctt cctccgagaa gacggcacac tcaagcctgt 2160
ggcaatcgag ctctcgctcc cccattccgc aggcgatctc tccgcagccg tgtcgcaggt 2220
ggtgttgcct gcaaaagaag gagtggagtc gaccatctgg ctcttggcca aagcatatgt 2280
gattgtgaac gattcctgtt atcaccagct catgtcgcat tggctcaaca ctcacgcggc 2340
aatggaaccc ttcgtgatcg ccacgcaccg gcacctctcg gtgctccacc cgatctacaa 2400
gctcctcact ccccactacc gtaacaacat gaacattaac gccttggcac ggcagtcgtt 2460
gatcaacgcg aacggcatca ttgagacaac gttcctcccc tccaagtact ccgtcgaaat 2520
gtcgtccgca gtctacaaaa actgggtctt caccgaccag gcgttgcctg ccgacttgat 2580
caaacgaggc gtcgcaatca aagatccctc cactcctcat ggcgtccgcc tcttgatcga 2640
ggactacccc tacgcagcgg acggattgga aatctgggca gccatcaaga cctgggtgca 2700
ggaatacgtc cctttgtact atgcgaggga cgatgatgtc aaaaacgact cggaactcca 2760
gcattggtgg aaggaggcag tggaaaaggg ccatggagat ctcaaggata aaccctggtg 2820
gcctaagctc cagaccttgg aggacctcgt cgaagtgtgt ttgatcatta tctggatcgc 2880
atccgcgttg catgcagccg tgaacttcgg acagtatccc tatggaggcc tcatcatgaa 2940
ccgtcccacc gcatccagga ggctcctccc cgaaaaagga acacccgaat acgaagaaat 3000
gatcaacaac cacgaaaagg catacctccg gaccatcact tccaaactcc cgaccttgat 3060
ctcgctctcc gtgatcgaga ttttgtcgac acatgcgtcg gacgaggtct atttgggtca 3120
gcgggataac ccgcactgga catccgattc caaggccctc caggcgttcc agaagttcgg 3180
caacaagctc aaggagatcg aggagaaact cgtgaggcgg aacaacgacc cttccctcca 3240
gggaaaccgg ttgggacctg tccagctccc gtatacgttg ctctacccct cctcggaaga 3300
aggcctcact ttcaggggta tccccaactc gatttccatc tgactcgaga tctagagggt 3360
gactgacacc tggcggtaga caatcaatcc atttcgctat agttaaagga tggggatgag 3420
ggcaattggt tatatgatca tgtatgtagt gggtgtgcat aatagtagtg aaatggaagc 3480
caagtcatgt gattgtaatc gaccgacgga attgaggata tccggaaata cagacaccgt 3540
gaaagccatg gtctttcctt cgtgtagaag accagacaga cagtccctga tttacccttg 3600
cacaaagcac tagaaaatta gcattccatc cttctctgct tgctctgctg atatcactgt 3660
cattcaatgc atagccatga gctcatctta gatccaagca cgtaattcca tagccgaggt 3720
ccacagtgga gcagcaacat tccccatcat tgctttcccc aggggcctcc caacgactaa 3780
atcaagagta tatctctacc gtccaataga tcgtcttcgc ttcaaaatct ttgacaattc 3840
caagagggtc cccatccatc aaacccagtt caataatagc cgagatgcat ggtggagtca 3900
attaggcagt attgctggaa tgtcggggcc agttggccgg gtggtcattg gccgcctgtg 3960
atgccatctg ccactaaatc cgatcattga tccaccgccc acgaggcgcg tctttgcttt 4020
ttgcgcggcg tccaggttca actctctctt aattaaatag cgacaagccg aacggcaccg 4080
gcaggtacaa tggttcgctg tacttgcttg cgcaagcggg tctttgggga ttgagcgcat 4140
ttggtgttgc aaaggatttg atgtaaatgt agtcgacatc ttagcacaga ggggagagtt 4200
gataaaatgt ggtctgtttg aatgatagtc gggttcgtga cctatattcg tgatagtgga 4260
gataggtctg cgcctatctt atcgggccgg agcaaaaatt ccaccgcagc ggggtgagtt 4320
ttcgttatac agccatccca cttccagctt caaattgtca gtttaatcca gcccaattca 4380
atcattggag aaccggtttt atgtcttcga agtcccacct cccctacgca attcgcgcaa 4440
ccaaccatcc caacccttta acatctaaac tcttctccat cgccgaggag aagaaaacca 4500
acgtcaccgt ctccgcagac gttactactt ccgccgagct cctcgatctt gctgaccgcc 4560
taggccccta tatcgcagtt ctgaaaaccc acatcgacat cctcaccgat ctcaccccgt 4620
cgaccctttc ctcgctccaa tccctcgcga caaagcacaa cttcctcatc tttgaggacc 4680
gcaagttcat cgacatcggc aacaccgtgc aaaagcagta ccacggtggc gctctccgca 4740
tctccgaatg ggcacacatc atcaactgcg ccatcctgcc gggcgaaggg atcgtcgagg 4800
ccctcgcaca gacaaccaag tctcctgact ttaaagacgc gaatcaacga ggtctcctga 4860
ttcttgccga gatgacgagt aagggatctc ttgcgacagg ggagtacacg gcacgctcgg 4920
ttgagtacgc gcggaagtat aaggggtttg tgatgggatt cgtgagtaca agggcgttga 4980
gtgaggtgct gcccgaacag aaagaggaga gcgaggattt tgtcgtcttt acgactgggg 5040
tgaatctgtc ggataagggg gataagctgg ggcagcagta tcagacacct gggtcggcgg 5100
ttgggcgagg tgcggacttt atcattgcgg gtaggggcat ctataaggcg gacgatccag 5160
tcgaggcggt tcagaggtac cgggaggaag gctggaaagc ttacgagaaa agagttggac 5220
tttgagggtg actgacacct ggcggtagac aatcaatcca tttcgctata gttaaaggat 5280
ggggatgagg gcaattggtt atatgatcat gtatgtagtg ggtgtgcata atagtagtga 5340
aatggaagcc aagtcatgtg attgtaatcg accgacggaa ttgaggatat ccggaaatac 5400
agacaccgtg aaagccatgg tctttccttc gtgtagaaga ccagacagac agtccctgat 5460
ttacccttgc acaaagcact agaaaattag cattccatcc ttctctgctt gctctgctga 5520
tatcactgtc attcaatgca tagccatgag ctcatcttag atccaagcac gtaattccat 5580
agccgaggtc cacagtggag cagcaacatt ccccatcatt gctttcccca ggggcctccc 5640
aacgactaaa tcaagagtat atctctaccg tccaatagat cgtcttcgct tcaaaatctt 5700
tgacaattcc aagagggtcc ccatccatca aacccagttc aataatagcc gagatgcatg 5760
gtggagtcaa ttaggcagta ttgctggaat gtcggggcca gttggccggg tggtcattgg 5820
ccgcctgtga tgccatctgc cactaaatcc gatcattgat ccaccgccca cgaggcgcgt 5880
ctttgctttt tgcgcggcgt ccaggttcaa ctctctcctc taggttgaag ttcctattcc 5940
gagttcctat tcttcaaata gtataggaac ttcaactagc tagtgcatgc gtacgatttt 6000
gacatttgct ccattgtcga ggatggatgg aacgagcggc gtgcgccacg aaagtgaggc 6060
tattgcctat cagctctttg ctacattccg gaaacaaaca tccctttttg tgaattatct 6120
acgcaactta gatggcgtga acgcatcttc aaagtctttc ggcaggtccg gcacgacttt 6180
tgcatccaga gaagcgccta catgtgtatt cgaccacctc ctagcgcgct tggatatgag 6240
gaaatattac tgagagtcga aaacaagctc caccgcacca gctcttcttg gagttttata 6300
ttaaagaata ttcccagctc gttgtattat tctttttcta ccgtgctaat gtatcaagga 6360
ctttggtacc tattaacgtt attattcgtg tgctattccc aaacataacc ctgtatatgt 6420
ttcgaacgcc gttatgaccc atgtcttaca tactcattaa gtcattccct tggataatct 6480
cgactcagat gcggcggttg atgtaggagg agaggtaatc gaggacctcc tgggagatga 6540
tgccgttcca ggcggggtag cggatggagc cctcggcgga gcccttgagc tgctcgatat 6600
gctgccactc ctcgatgggg ttggtctcat ccttgagggc gatcatctcc ttggagatgg 6660
gatcgtaggc gtagtagcgg gagactagtg cgaagtaatg atcggggatg gcggtgatct 6720
gatgggtgta ggtggtgcgg gcgacggcgg aggcgcgctt atcggaccag ttgccgacga 6780
cgttggtgag ctcggtgagg cccttcatgg agaggaagga ggtcatgaga tggcggccga 6840
tatgggactt ggggccgttc ttgatggcga agatggagta gggggcgttc ttcttgaggg 6900
ccttgttgta ggagcggacg aggttatcct tgaggagctg gtactcctgc ttgttggagg 6960
aggagttgcc ggtgcggttg acgcgcttga ggacgggctc ggagttgcgg aggaactcat 7020
cgaggtagac gaggggatcg atgcggccgc gggcggagaa gaagtagata tggcgggaga 7080
cggaggtctt ggtctcggtg acgaggcact ggatgatgac gccgaggtac ttgttctgga 7140
cgagcttgaa ggacttggga tcgacgttct tgatatcgga gaagcggccg cagttgatga 7200
aggtggcgag gaagaggaac tggtagaggg tcttggtctt ggtgaagcgg gaggtgtact 7260
cgaaggagtt gaggatcttc tcggtgatct cccagatgga ctcgccctcg gagaggaggg 7320
ccttgagcat cttcttggaa tgggagttgc ccttatcggc ctcctcggag gactcgaact 7380
ggagctggag ggaggagacg atatcggtga tatcggactg atgcttctgg ccgtagtagg 7440
ggatgatggt gaactcccag gcggggatga gcttcttgag ggaggcctcc aggatggtgg 7500
ccttctgggt cttgtacttg aactggaggg acttgttgac gatatcgaag gagagggagt 7560
tggagatgat ggtgttgtag gacatgaagg tggcgcgctt gatggcggtg ccgttatggg 7620
tgatcatcca gcagaggtag gtgagctcgg cggcgcagag ggcgatcttc tcgccggagg 7680
ggcgctcgaa gcgctcgacg aactggcgga cgaggacctt ggggggggtc ttgcagagga 7740
tatcgaactg gggcatggtg ctcagatact acggctgatc gcgtagaggt actgagcaaa 7800
acagatgtca gtaaggagaa gagttgaatg aatggaagaa gagtaggaaa ggaggtatgg 7860
gggaaagata tacgtactga tgcggacgaa gagagaaaga aggaaaaaag ttgtgggagg 7920
ggaaggaggg ggaatcctta tatggagggg caagcgagaa ggcgaattag tgggcgggct 7980
taagccctcg accgccgccc ttatcattgg acatggaggg gtaatgcccc caccacgcat 8040
gtgcgggacc gacgcagaat ctgcacggcg gagtctcttc cagactgttg acttttgggc 8100
gatgactctt gttgctgcgg ccttttgggt acaccaacct cgttgatctt gtttccttgg 8160
ttctctttcg ctcggagacc cgaccatgac cccaccatca gtcactatcc tgcctcgtcg 8220
ataaaaattt tttcttccct ctgattgtta catagtatgt ttccaccttt ccggtggatt 8280
tcggacagtc aaactgggca tcaacgcagt ggtgggctgc ttcgtttgct gcgtgttgta 8340
cttgtttgca tttgaacccc gcggtcgttc gagtccttaa ttggtccgct cccggtcaac 8400
acccaagcag ctgtggcccg gccgagtggc gcctgtctgg tccacagtaa gcttggcgta 8460
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 8520
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 8580
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8640
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8700
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8760
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 8820
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 8880
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8940
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 9000
gaccctgccg cttaccggat acctgtccgc ctttttccct tcgggaagcg tggcgctttc 9060
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 9120
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 9180
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 9240
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 9300
cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 9360
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 9420
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 9480
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 9540
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 9600
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 9660
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 9720
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 9780
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 9840
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 9900
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 9960
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 10020
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 10080
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 10140
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 10200
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 10260
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 10320
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 10380
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 10440
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 10500
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 10560
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 10620
cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 10680
ctttcgtctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga 10740
gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc 10800
agcgggtgtt ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact 10860
gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 10920
caggcgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc 10980
ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac 11040
gccagggttt tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac 11100
c 11101
<210> 27
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> FRT-F
<400> 27
ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttc 49
<210> 28
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> FRT-F3
<400> 28
ttgaagttcc tattccgagt tcctattctt caaatagtat aggaacttca 50
<210> 29
<211> 8299
<212> DNA
<213> 人工序列
<220>
<223> 质粒 pDAu703
<400> 29
taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg 60
acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca 120
agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc 180
atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 240
aaggagaaaa taccgcatca ggcgccattc gccattcagg ctgcgcaact gttgggaagg 300
gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag 360
gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag 420
tgaattggcc tccatggccg cggccgcgct ttgctaaaac tttggttgat ggaaggtatc 480
tggcgataaa ctccgacgac gtctagaagc aacaatctta tgcaaacgct cattggttct 540
tttcgaccgc aacatccatc atgaaactgg tattttgtct gtgtcagcag tctagaaccc 600
cttgccgggt attttagcat ttcatttttc tataaaaagg taccagcatg tatggatcgt 660
atcttccgta ccgtggttat taaatcccag cagaggccga taggcttaag aagtgaacat 720
ggcatggtta aggaagaagc cattactgag tatatatggc tagaataatc gctgggaaag 780
atttatgctt ccaagaggcg taggacggta taccatacag tacggtattt atgaacaatt 840
cgataatacc actccccaaa gcgggagata ggacacccgc ctcaggcacc aaccaccccc 900
tttttcaact gtcagtggtg cacgtttcca tcgagcataa gcttggtacc ctaaggatag 960
gccctaatct tatctacatg tgactgcatc gatgtgtttg gtcaaaatga ggcatgtggc 1020
tcaccccaca ggcggagaaa cgtgtggcta gtgcatgaca gtcccctcca tagattcaat 1080
ttaatttttc gcggcaattg tcgtgcagtt tgtatctaca tttcattcca tatatcaaga 1140
gttagtagtt ggacatcctg attattttgt ctaattactg aaaactcgaa gtactaacct 1200
actaataagc cagtttcaac cactaagtgc tcatttatac aatatttgca gaaccccgcg 1260
ctacccctcc atcgccaaca tgtcttccaa gtcgcaattg acctacagcg cacgcgctag 1320
caagcacccc aatgcgctcg taaagaagct cttcgaggtt gccgaggcca agaaaaccaa 1380
tgtcaccgtt tccgccgacg tgacaaccac caaagagctg ctggatttgg ctgaccgtat 1440
gcgcaccggg gttgaagttc ctattccgag ttcctattct tcaaatagta taggaacttc 1500
attaattaaa ggagagagtt gaacctggac gccgcgcaaa aagcaaagac gcgcctcgtg 1560
ggcggtggat caatgatcgg atttagtggc agatggcatc acaggcggcc aatgaccacc 1620
gggccaactg gccccgacat tccagcaata ctgcctaatt gactccacca tgcatctcgg 1680
ctattattga actgggtttg atggatgggg accctcttgg aattgtcaaa gattttgaag 1740
cgaagacgat ctattggacg gtagagatat actcttgatt tagtcgttgg gaggcccctg 1800
gggaaagcaa tgatggggaa tgttgctgct ccactgtgga cctcggctat ggaattacgt 1860
gcttggatct aagatgagct catggctatg cattgaatga cagtgatatc agcagagcaa 1920
gcagagaagg atggaatgct aattttctag tgctttgtgc aagggtaaat cagggactgt 1980
ctgtctggtc ttctacacga aggaaagacc atggctttca cggtgtctgt atttccggat 2040
atcctcaatt ccgtcggtcg attacaatca catgacttgg cttccatttc actactatta 2100
tgcacaccca ctacatacat gatcatataa ccaattgccc tcatccccat cctttaacta 2160
tagcgaaatg gattgattgt ctaccgccag gtgtcagtca ccctctagat ctcgagctcg 2220
ctagagtcga cctatggagt caccacattt cccagcaact tccccacttc ctctgcaatc 2280
gccaacgtcc tctcttcact gagtctccgt ccgataacct gcactgcaac cggtgcccca 2340
tggtacgcct ccggatcata ctcttcctgc acgagggcat caagctcact aaccgccttg 2400
aaactctcat tcttcttatc gatgttctta tccgcaaagg taaccggaac aaccacgctc 2460
gtgaaatcca gcaggttgat cacagaggca tacccatagt accggaactg gtcatgccgt 2520
accgcagcgg taggcgtaat cggcgcgatg atggcgtcca gttccttccc ggccttttct 2580
tcagcctccc gccatttctc aaggtactcc atctggtaat tccacttctg gagatgcgtg 2640
tcccagagct cgttcatgtt aacagctttg atgttcgggt tcagtaggtc tttgatattt 2700
ggaatcgccg gctcgccgga tgcactgata tcgcgcatta cgtcggcgct gccgtcagcc 2760
gcgtagatat gggagatgag atcgtggccg aaatcgtgct tgtatggcgt ccacggggtc 2820
acggtgtgac cggctttggc gagtgcggcg acggtggttt ccacgccgcg caggatagga 2880
gggtgtggaa ggacattgcc gtcgaagttg tagtagccga tattgagccc gccgttcttg 2940
atcttggagg caataatgtc cgactcggac tggcgccagg gcatggggat gaccttggag 3000
tcgtatttcc atggctcctg accgaggacg gatttggtga agaggcggag gtctaacata 3060
cttcatcagt gactgccggt ctcgtatata gtataaaaag caagaaagga ggacagtgga 3120
ggcctggtat agagcaggaa aagaaggaag aggcgaagga ctcaccctca acagagtgcg 3180
taatcggccc gacaacgctg tgcaccgtct cctgaccctc catgctgttc gccatctttg 3240
catacggcag ccgcccatga ctcggcctta gaccgtacag gaagttgaac gcggccggca 3300
ctcgaatcga gccaccgata tccgttccta caccgatgac gccaccacga atcccaacga 3360
tcgcaccctc accaccagaa ctgccgccgc acgaccagtt cttgttgcgt gggttgacgg 3420
tgcgcccgat gatgttgttg actgtctcgc agaccatcag ggtctgcggg acagaggtct 3480
tgacgtagaa gacggcaccg gctttgcgga gcatggttgt cagaaccgag tccccttcgt 3540
cgtacttgtt tagccatgag atgtagccca ttgatgtttc gtagccctgg tggcatatgt 3600
tagctgacaa aaagggacat ctaacgactt aggggcaacg gtgtaccttg actcgaagct 3660
ggtctttgag agagatgggg aggccatgga gtggaccaac gggtctcttg tgctttgcgt 3720
agtattcatc gagttccctt gcctgcgcga gagcggcgtc agggaagaac tcgtgggcgc 3780
agtttgtctg cacagaagcc agcgtcagct tgatagtccc ataaggtggc gttgttacat 3840
ctccctgaga ggtagagggg accctactaa ctgctgggcg attgctgccc gtttacagaa 3900
tgctagcgta acttccaccg aggtcaactc tccggccgcc agcttggaca caagatctgc 3960
agcggaggcc tctgtgatct tcagttcggc ctctgaaagg atcaccgatt tctttgggaa 4020
atcaataacg ctgtcttccg caggcagcgt ctggactttc cattcatcag ggatggtttt 4080
tgcgaggcgg gcgcgcttat cagcggccag ttcttcccag gattgaggca tgtgcatgca 4140
atgtgtgttt atgtggaagt aagatacgac gagtttgatt gagaaaagac agggtgattg 4200
tcaagttcag tatggaagaa agagtagaag aagatcagac gacagggaag agcgatgaca 4260
taaaaggtgg aagacggaag aaaaacgaac caaatcaatc ccactctatg gcgggggttg 4320
gactgcctga ggccggcact ggtggggctt atcgataagt tctcgtcacc ggatgcaatg 4380
cgctgtcaac tgctgacttg gccctgaaca tcctgtcctc tacagatcca tactatacaa 4440
tgatcccagt tatagtgcgg taaggtgcat atcatatctc attctcatga ctcattcgac 4500
ttttttttag agaaagtaca tacgtggaac atacactaaa cgcaacaggt cgcgacaaca 4560
ctggtataca aaacggtccc cggtgaatga cgttattagt gtctatcccc cactcacacc 4620
cgaaaagaat aatagaaact aacagaaaaa gcggcccgag gataagagga acattcaaac 4680
agaaggggaa tcataaaaac cgaaaaatgc aaggaaaaga gaactcaaat caataatttt 4740
cataatactg tcgagagtaa tacggaccag cgtctctcag ggacatgcgt cggcgcaagg 4800
catcatccaa tctctcatct aacacatcca gcattcgtgt tcgatagtct aactgcttct 4860
ctcggcgctc aagtcttgct tcccgatcat cgagttaatt aagaagttcc tatactttct 4920
agagaatagg aactcggaat aggaacttca aggtaccgag ctctatcctc aataccctat 4980
tttccacgat tccattgtca tatccaattc cgttttcttt tcttgttttc ccctcatcca 5040
atcccgtcca tcatttactc ctttttcttg tgaatgcaag tggcactaag aaatccaacc 5100
cccagacaaa ttttcctact caggaacaca aaaacctcgt ttctgctccc ttctcgtact 5160
tcattcctat cgtctcggaa tttcctcaac aaccctttcc gactttgcga cagcgtcgcg 5220
attccagact tatgtgttct cgttcctact gtcgttacca gtctatttat tccgaaacct 5280
ctgatcgctg aatttcacac acaacacccc cccgttgatg ctggtggaga atccgtagcg 5340
tcaagagttg aattcactcc atgttgtaac gaagtccacg aattgagacg attgatgatt 5400
acaaccccgc gatcgcctat cgacgattcg acgagatgcc attctcatcc tcctcatcct 5460
cctccacccc cgaggtgtct accaccccgc tcgcagatta cttctggatc gcaggtgtcg 5520
atggcgcgga aatcttagag actttccaaa gactcggcga cgaatacagg gcaaacagtg 5580
ccaccgctcc tggccccgct cttgcggaca cgatcgagga agatgcggac gcggaggagg 5640
cacacgaccc ccgtctggac tccctctctc gacccaattc catggctggg ggccgcaatt 5700
ccttccagcg gttctcaatg cgctcaggag actccagtga gtccagtggg aatggtacca 5760
gcagcaaccg gagcagtctg accatcaagg gtaatcagtc gcccagaggg tcgtcgtttc 5820
tagaagattt cgactttgac aaggccctgt tcaagtttgc aaacgagcgg gagtcgttcc 5880
tgtcggatct gagtctcagt gccggagcaa tcactcccac ctcccgtcct aggtccaggt 5940
tacgtacaca gaagattgtc tccgaggaaa gtccctccca gccatccagc ttgcttcgat 6000
caggcattgg tagtgtgcgg cgtcatatgg cattcagaga catgaatagt atgaaacggc 6060
agccgtcagt tgctcgtcgc ggccgcagct tggcgtaatc atggtcatag ctgtttcctg 6120
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 6180
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 6240
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 6300
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6360
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6420
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 6480
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6540
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6600
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6660
tgtccgcctt tttcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6720
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6780
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6840
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6900
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6960
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 7020
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 7080
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 7140
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 7200
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 7260
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 7320
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 7380
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 7440
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7500
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7560
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7620
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7680
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7740
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7800
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7860
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7920
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7980
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 8040
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 8100
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 8160
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 8220
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 8280
tgacattaac ctataaaaa 8299
<210> 30
<211> 8614
<212> DNA
<213> 人工序列
<220>
<223> 质粒 pDAU724
<400> 30
gaattcgagc tcggtacctt gaagttccta ttccgagttc ctattctcta gaaagtatag 60
gaacttcagt acccgggtat aagctagctt ccgttaaatt gccgtcgtca gccgttaaat 120
taccgattaa tcccgataaa tttccgagat ctccgttaaa ttgccgttcg cagccgttaa 180
attaccgggg acgaccgata aatttccgcg atgaattcat ggtgttttga tcattttaaa 240
tttttatatg gcgggtggtg ggcaactcgc ttgcgcgggc aactcgctta ccgattacgt 300
tagggctgat atttacgtaa aaatcgtcaa gggatgcaag accaaaccgt taaatttccg 360
gagtcaacag catccaagcc caagtccttc acggagaaac cccagcgtcc acatcacgag 420
cgaaggacca cctctaggca tcggacgcac catccaatta gaagcagcaa agcgaaacag 480
cccaagaaaa aggtcggccc gtcggccttt tctgcaacgc tgatcacggg cagcgatcca 540
accaacaccc tccagagtga ctaggggcgg aaatttatcg ggattaattt ccactcaacc 600
acaaatcaca gtcgtccccg gtaatttaac ggctgcagac ggcaatttaa cggcttctgc 660
gaatcgcttg gattccccgc ccctggccgt agagcttaaa gtatgtccct tgtcgatgcg 720
atgtatcaca acatataaat actggcaagg gatgccatgc ttggagtttc caactcaatt 780
tacctctatc cacacttctc ttccttcctc aatcctctat atacacaact ggggatccac 840
catgaggagc tcccttgtgc tgttctttgt ctctgcgtgg acggccttgg ccagtcctat 900
tcgtcgagag gtctcgcagg atctgtttaa ccagttcaat ctctttgcac agtattctgc 960
agccgcatac tgcggaaaaa acaatgatgc cccagctggt acaaacatta cgtgcacggg 1020
aaatgcctgc cccgaggtag agaaggcgga tgcaacgttt ctctactcgt ttgaagactc 1080
tggagtgggc gatgtcaccg gcttccttgc tctcgacaac acgaacaaat tgatcgtcct 1140
ctctttccgt ggctctcgtt ccatagagaa ctggatcggg aatcttaact tcgacttgaa 1200
agaaataaat gacatttgct ccggctgcag gggacatgac ggcttcactt cgtcctggag 1260
gtctgtagcc gatacgttaa ggcagaaggt ggaggatgct gtgagggagc atcccgacta 1320
tcgcgtggtg tttaccggac atagcttggg tggtgcattg gcaactgttg ccggagcaga 1380
cctgcgtgga aatgggtatg atatcgacgt gttttcatat ggcgcccccc gagtcggaaa 1440
cagggctttt gcagaattcc tgaccgtaca gaccggcgga acactctacc gcattaccca 1500
caccaatgat attgtcccta gactcccgcc gcgcgaattc ggttacagcc attctagccc 1560
agagtactgg atcaaatctg gaacccttgt ccccgtcacc cgaaacgata tcgtgaagat 1620
agaaggcatc gatgccaccg gcggcaataa ccagcctaac attccggata tccctgcgca 1680
cctatggtac ttcgggttaa ttgggacatg tctttagtgg ccggcgcggc tgggtcgact 1740
ctagcgagct cgagatctag agggtgactg acacctggcg gtagacaatc aatccatttc 1800
gctatagtta aaggatgggg atgagggcaa ttggttatat gatcatgtat gtagtgggtg 1860
tgcataatag tagtgaaatg gaagccaagt catgtgattg taatcgaccg acggaattga 1920
ggatatccgg aaatacagac accgtgaaag ccatggtctt tccttcgtgt agaagaccag 1980
acagacagtc cctgatttac ccttgcacaa agcactagaa aattagcatt ccatccttct 2040
ctgcttgctc tgctgatatc actgtcattc aatgcatagc catgagctca tcttagatcc 2100
aagcacgtaa ttccatagcc gaggtccaca gtggagcagc aacattcccc atcattgctt 2160
tccccagggg cctcccaacg actaaatcaa gagtatatct ctaccgtcca atagatcgtc 2220
ttcgcttcaa aatctttgac aattccaaga gggtccccat ccatcaaacc cagttcaata 2280
atagccgaga tgcatggtgg agtcaattag gcagtattgc tggaatgtcg gggccagttg 2340
gccgggtggt cattggccgc ctgtgatgcc atctgccact aaatccgatc attgatccac 2400
cgcccacgag gcgcgtcttt gctttttgcg cggcgtccag gttcaactct ctcttaatta 2460
atgtacatta gtgatacccc actctaagaa aatagaccaa tctccagctg caccttcaga 2520
cactccggta caaattctcg tctatgttgg agattgttgt gactttgaaa catgaccctt 2580
gaccctgatt ttgaatttgt ccatatatcg aggcaggtgt cttattcgta cggagagggt 2640
atctgtcgta gacacatagt agtagtcatt tcgagtgctg aatttataaa tcgcatcata 2700
cttgcgacat actgccataa aaggagtacg tatccaccac tacttattgc gcaccaacac 2760
gcttcaggta tgcatcccat ccctccttct ggtactgctt cgccgcctcc acgggatcag 2820
gagcagcata aattccacgg ccagcaataa taaagtcggc accgcgtcca acagccgact 2880
caggagtttg gtactgctgt cccagcttgt cacccttcga ggagaggttg acacctgtcg 2940
tgaagacgac aaaatcttcc tcctccgaag gcgagctaac ttcagactga acctcgccaa 3000
ggtgacgtgt cgagacgaat cccatcacaa acttcttata cttccgagca tagtcaacag 3060
aagaagtagt atattgaccg gtagccaaag atcccttgga ggtcatctcc gcaaggatca 3120
aaaggcccct ctcggagccg taggggaagt cctcggccga agcagtctgg gccagagcct 3180
cgacgatacc ctcaccgggc agaatactgc agttgatgat gtgggcccac tcagagatac 3240
gcagagtgcc gccatggtac tgcttttgga ctgtgtttcc gatatcgatg aacttgcgat 3300
cttcgaagat gaggaaattg tgcttctctg caagggcctt cagaccggtg atggtttctt 3360
cgctgaaatc ggagaggata tcgatgtgag ttttgatcac ggcaatgtac ggaccgagtc 3420
ctgttatata atccaccatt aaccattact agatcacatg taagtggcat tgaagttcct 3480
atactatttg aagaatagga actcggaata ggaacttcaa cgtacgattt tgacatttgc 3540
tccattgtcg aggatggatg gaacgagcgg cgtgcgccac gaaagtgagg ctattgccta 3600
tcagctcttt gctacattcc ggaaacaaac atcccttttt gtgaattatc tacgcaactt 3660
agatggcgtg aacgcatctt caaagtcttt cggcaggtcc ggcacgactt ttgcatccag 3720
agaagcgcct acatgtgtat tcgaccacct cctagcgcgc ttggatatga ggaaatatta 3780
ctgagagtcg aaaacaagct ccaccgcacc agctcttctt ggagttttat attaaagaat 3840
attcccagct cgttgtatta ttctttttct accgtgctaa tgtatcaagg actttggtac 3900
ctattaacgt tattattcgt gtgctattcc caaacataac cctgtatatg tttcgaacgc 3960
cgttatgacc catgtcttac atactcatta agtcattccc ttggataatc tcgactcaga 4020
tgcggcggtt gatgtaggag gagaggtaat cgaggacctc ctgggagatg atgccgttcc 4080
aggcggggta gcggatggag ccctcggcgg agcccttgag ctgctcgata tgctgccact 4140
cctcgatggg gttggtctca tccttgaggg cgatcatctc cttggagatg ggatcgtagg 4200
cgtagtagcg ggagactagt gcgaagtaat gatcggggat ggcggtgatc tgatgggtgt 4260
aggtggtgcg ggcgacggcg gaggcgcgct tatcggacca gttgccgacg acgttggtga 4320
gctcggtgag gcccttcatg gagaggaagg aggtcatgag atggcggccg atatgggact 4380
tggggccgtt cttgatggcg aagatggagt agggggcgtt cttcttgagg gccttgttgt 4440
aggagcggac gaggttatcc ttgaggagct ggtactcctg cttgttggag gaggagttgc 4500
cggtgcggtt gacgcgcttg aggacgggct cggagttgcg gaggaactca tcgaggtaga 4560
cgaggggatc gatgcggccg cgggcggaga agaagtagat atggcgggag acggaggtct 4620
tggtctcggt gacgaggcac tggatgatga cgccgaggta cttgttctgg acgagcttga 4680
aggacttggg atcgacgttc ttgatatcgg agaagcggcc gcagttgatg aaggtggcga 4740
ggaagaggaa ctggtagagg gtcttggtct tggtgaagcg ggaggtgtac tcgaaggagt 4800
tgaggatctt ctcggtgatc tcccagatgg actcgccctc ggagaggagg gccttgagca 4860
tcttcttgga atgggagttg cccttatcgg cctcctcgga ggactcgaac tggagctgga 4920
gggaggagac gatatcggtg atatcggact gatgcttctg gccgtagtag gggatgatgg 4980
tgaactccca ggcggggatg agcttcttga gggaggcctc caggatggtg gccttctggg 5040
tcttgtactt gaactggagg gacttgttga cgatatcgaa ggagagggag ttggagatga 5100
tggtgttgta ggacatgaag gtggcgcgct tgatggcggt gccgttatgg gtgatcatcc 5160
agcagaggta ggtgagctcg gcggcgcaga gggcgatctt ctcgccggag gggcgctcga 5220
agcgctcgac gaactggcgg acgaggacct tggggggggt cttgcagagg atatcgaact 5280
ggggcatggt gctcagatac tacggctgat cgcgtagagg tactgagcaa aacagatgtc 5340
agtaaggaga agagttgaat gaatggaaga agagtaggaa aggaggtatg ggggaaagat 5400
atacgtactg atgcggacga agagagaaag aaggaaaaaa gttgtgggag gggaaggagg 5460
gggaatcctt atatggaggg gcaagcgaga aggcgaatta gtgggcgggc ttaagccctc 5520
gaccgccgcc cttatcattg gacatggagg ggtaatgccc ccaccacgca tgtgcgggac 5580
cgacgcagaa tctgcacggc ggagtctctt ccagactgtt gacttttggg cgatgactct 5640
tgttgctgcg gccttttggg tacaccaacc tcgttgatct tgtttccttg gttctctttc 5700
gctcggagac ccgaccatga ccccaccatc agtcactatc ctgcctcgtc gataaaaatt 5760
ttttcttccc tctgattgtt acatagtatg tttccacctt tccggtggat ttcggacagt 5820
caaactgggc atcaacgcag tggtgggctg cttcgtttgc tgcgtgttgt acttgtttgc 5880
atttgaaccc cgcggtcgtt cgagtcctta attggtccgc tcccggtcaa cacccaagca 5940
gctgtggccc ggccgagtgg cgcctgtctg gtccacagta agcttggcgt aatcatggtc 6000
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6060
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6120
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 6180
ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 6240
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 6300
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 6360
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 6420
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 6480
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 6540
gcttaccgga tacctgtccg cctttttccc ttcgggaagc gtggcgcttt ctcatagctc 6600
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 6660
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 6720
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 6780
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 6840
aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 6900
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 6960
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 7020
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 7080
cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 7140
gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 7200
tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 7260
gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 7320
agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 7380
tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 7440
agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 7500
gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 7560
catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 7620
ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 7680
atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 7740
tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 7800
cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 7860
cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 7920
atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 7980
aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 8040
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 8100
aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 8160
aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 8220
cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac 8280
agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt 8340
tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac tgagagtgca 8400
ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggcgcca 8460
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 8520
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 8580
ttcccagtca cgacgttgta aaacgacggc cagt 8614
<210> 31
<211> 876
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的 VaXET16 开放阅读框
<400> 31
atgggctcgt ccctctggac ttgtttgatc ctcctctcct tggcatcggc atccttcgca 60
gcgaaccctc gaactccgat cgatgtgcct ttcggacgga actacgtgcc gacatgggca 120
ttcgaccaca ttaagtattt gaacggaggc tcggagatcc agttgcatct cgacaagtac 180
accggcactg gtttccagtc gaagggctcc tacttgttcg gacatttctc catgtacatc 240
aaattggtgc ctggtgactc ggcaggaact gtcaccgcat tctacctctc gtcgacaaac 300
gcagagcatg acgaaatcga cttcgagttc ctcggcaaca ggacaggaca gccgtacatc 360
ctccagacca acgtcttcac aggaggcaaa ggtgatcggg aacagcggat ctacttgtgg 420
ttcgatccca caacccagta ccataggtac tcggtgctct ggaacatgta tcagatcgtc 480
ttctacgtcg acgattatcc gatccgagtg ttcaagaact ccaacgactt gggcgtcaaa 540
ttccccttca accagcccat gaagatttac aactcgttgt ggaacgccga cgattgggca 600
accaggggtg gtctcgagaa gacagattgg tcgaaagcac ctttcatcgc gtcgtacaag 660
ggtttccaca tcgacggatg tgaagcctcc gtgaacgcca agttctgtga cacccagggc 720
aaacgatggt gggatcagcc ggaattccgg gatttggatg cagcccagtg gcagaagctc 780
gcgtgggtca ggaacaagta caccatctat aactactgta ccgatcggaa acgatattcg 840
caggtgcctc ccgagtgtac acgcgatagg gacatc 876
<210> 32
<211> 292
<212> PRT
<213> 豇豆属
<400> 32
Met Gly Ser Ser Leu Trp Thr Cys Leu Ile Leu Leu Ser Leu Ala Ser
1 5 10 15
Ala Ser Phe Ala Ala Asn Pro Arg Thr Pro Ile Asp Val Pro Phe Gly
20 25 30
Arg Asn Tyr Val Pro Thr Trp Ala Phe Asp His Ile Lys Tyr Leu Asn
35 40 45
Gly Gly Ser Glu Ile Gln Leu His Leu Asp Lys Tyr Thr Gly Thr Gly
50 55 60
Phe Gln Ser Lys Gly Ser Tyr Leu Phe Gly His Phe Ser Met Tyr Ile
65 70 75 80
Lys Leu Val Pro Gly Asp Ser Ala Gly Thr Val Thr Ala Phe Tyr Leu
85 90 95
Ser Ser Thr Asn Ala Glu His Asp Glu Ile Asp Phe Glu Phe Leu Gly
100 105 110
Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val Phe Thr Gly
115 120 125
Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe Asp Pro Thr
130 135 140
Thr Gln Tyr His Arg Tyr Ser Val Leu Trp Asn Met Tyr Gln Ile Val
145 150 155 160
Phe Tyr Val Asp Asp Tyr Pro Ile Arg Val Phe Lys Asn Ser Asn Asp
165 170 175
Leu Gly Val Lys Phe Pro Phe Asn Gln Pro Met Lys Ile Tyr Asn Ser
180 185 190
Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Leu Glu Lys Thr
195 200 205
Asp Trp Ser Lys Ala Pro Phe Ile Ala Ser Tyr Lys Gly Phe His Ile
210 215 220
Asp Gly Cys Glu Ala Ser Val Asn Ala Lys Phe Cys Asp Thr Gln Gly
225 230 235 240
Lys Arg Trp Trp Asp Gln Pro Glu Phe Arg Asp Leu Asp Ala Ala Gln
245 250 255
Trp Gln Lys Leu Ala Trp Val Arg Asn Lys Tyr Thr Ile Tyr Asn Tyr
260 265 270
Cys Thr Asp Arg Lys Arg Tyr Ser Gln Val Pro Pro Glu Cys Thr Arg
275 280 285
Asp Arg Asp Ile
290
<210> 33
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物 615726 (正义)
<400> 33
accgggagga aggctggaaa gcttacgaga aaagagttgg actttgaggg 50
<210> 34
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物 615728 (反义)
<400> 34
tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 40
<210> 35
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物 615729 (正义)
<400> 35
tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 40
<210> 36
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 引物 615731 (反义)
<400> 36
tatactttct agagaatagg aactcggaat aggaacttca aggaacaaca ctcaacccta 60
tctcggtc 68
<210> 37
<211> 67
<212> DNA
<213> 人工序列
<220>
<223> 引物 615730 (正义)
<400> 37
tccgagttcc tattctctag aaagtatagg aacttcgcat ttatcagggt tattgtctca 60
tgagcgg 67
<210> 38
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物 615611 (反义)
<400> 38
tctagatctc gagtcagatg tccctatcgc gtgtacactc g 41
<210> 39
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物 615610 (正义)
<400> 39
acacgcgata gggacatctg actcgagatc tagagggtga ctgac 45
<210> 40
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物 615727 (反义)
<400> 40
aactcttttc tcgtaagctt tccagccttc ctcccggtac 40
<210> 41
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 41
cgaattctgc attgaagttc ctattccgag ttcctattct tcaaatagta taggaacttc 60
agatatccat cacactggcg 80
<210> 42
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 42
gccagtgtga tggatatctg aagttcctat actatttgaa gaataggaac tcggaatagg 60
aacttcaatg cagaattcgc 80
<210> 43
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 43
atatccatca cactggcggc cgctcaactc tctcctctag gttgaagttc ctattccgag 60
ttc 63
<210> 44
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 44
aggatgcatg ctcgagcatg cactagctag ttgaagttcc tatac 45
<210> 45
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 45
caccctctgt gtattgcacc atgccccagt tcgatatcct ctgca 45
<210> 46
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 46
aaactctagg atgcatgcaa gtgaggctat tgcctatcag ctc 43
<210> 47
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 47
catcacactg gcggccgcga attctaggct aggtatgc 38
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 48
ggtgcaatac acagagggtg 20
<210> 49
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 49
accgcggact gcgcaccatg agattcggtt ggctcgagg 39
<210> 50
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 50
ttcgccacgg agcttactag tagacacggg gcagaggc 38
<210> 51
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 51
cgtgtttctt cccattcgca tgcgacctcg tggtcattga c 41
<210> 52
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 52
gctttgacgt tacattgacg tacttataag cggccgccag tgtgatgga 49
<210> 53
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 53
tccatcacac tggcggccgc ttataagtac gtcaatgtaa cgtcaaagc 49
<210> 54
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 54
tgcagaggat atcgaactgg ggcattttgt atctgcgaat tgagcttg 48
<210> 55
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 55
caagctcaat tcgcagatac aaaatgcccc agttcgatat cctctgca 48
<210> 56
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 56
gctgtttaaa ctctaggatg catgcaagtg aggctattgc c 41
<210> 57
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 57
cgtgtttctt cccattcgca tgcgacctcg tggtcattga c 41
<210> 58
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 58
tgcagaggat atcgaactgg ggcattttgt atctgcgaat tgagcttg 48
<210> 59
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物 1208187
<400> 59
gattgagttg aaactgccta agatctcg 28
<210> 60
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 引物 1208194
<400> 60
ctatactttc tagagaatag gaactcggaa taggaacttc aaggtgcgca gtccgcggtt 60
gac 63
<210> 61
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 引物 1208195
<400> 61
ctattccgag ttcctattct ctagaaagta taggaacttc ggcgttgtta catctccctg 60
ag 62
<210> 62
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物 1208196
<400> 62
gcgtcaggct ttcgccacgt ctacgccagg accgagcaag 40
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 069134
<400> 63
cgcaatctat cgaatagcag 20
<210> 64
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物 067947
<400> 64
ctacatcgaa gctgaaagca cgaga 25
<210> 65
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物 069860
<400> 65
cttctatctt gggatgcttc acgatacgtg a 31
<210> 66
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物 069861
<400> 66
cgcgcccttg aatatcggag aaggt 25
<210> 67
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物 0610249
<400> 67
gagaacacag tgagaccata gc 22
<210> 68
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物 0610250
<400> 68
tctcaaccca atcagcaaca tg 22
<210> 69
<211> 3021
<212> DNA
<213> 黑曲霉
<400> 69
atgcgccaca gcatcggatt ggcagcggcc ctactggcac caaccctacc tgtagcgttg 60
ggtcaatata ttcgagactt aagcaccgag aaatggactc tcagtagtcg agccttgaat 120
cggacagtac ctgctcaatt tccatcgcag gttcacttag atctactaag ggccggagtg 180
attggtgagt actatttgga agtcaagtcc tgtgagtata caaccgctaa cagcctcaat 240
agatgatccg taagtgactt catctgccat ggatgagaat tgaatcgcac taaatattgc 300
tggagatacc atggtttgaa cgatttcaat cttcgctgga tcgctgctgc caactggact 360
tataccagtc aacccatcaa aggcctgtga gtcgctgtga agtttgtgca atgtcgttcg 420
acaatactaa gaaccaatag cctggacaat tacgactcaa cttggctcgt gtttgacgga 480
ctggacactt tcgcaacaat ctcattctgt gggcagcaaa tcgcatccac ggacaatcag 540
tttcgccagt atgcgttcga tgtatccacc gcactagggt cctgcaaagg agatcctgtt 600
ctgagcatca actttggaag cgcaccgaat attgttgatg ctatcgcaca ggactctaat 660
tcgcaaagta agtttcagag gtgggggact gccgaagttg ttacatgcta attgtatata 720
gaatggcccg atgacgtcca actcacctac gagtacccaa atcggtggtt tatgcgcaaa 780
gaacaatcgg acttcggatg ggattggggt ccagcatttg cccctgcagg tccatggaag 840
cctgcatata ttgttcagct agacaagaaa gaaagtgtct atgtcctgaa cacggatttg 900
gatatatacc gaaagggcca aattaactac cttccgccag accagagcca accttgggtc 960
gtcaacgcta gcattgacat tttgggtcca ctacctacca aaccaaccat gtcgattgaa 1020
gtgcgcgata ctcattctgg cacgattctt acttcgcgga ctctgaacaa tgtcagtgtg 1080
gctggtaatg ccataactgg tgtcaccgtt ctcgacgggc tgaccccgaa actgtggtgg 1140
ccgcaaggcc tcggtgatca gaacctctac aatgtttcta tcactgtcca aagtagagga 1200
aaccagaccg tggccagtgt gaacaaacgg acgggcttcc gcaccatttt tctcaaccag 1260
cgcaacatta ctgaagcaca gcgtgcgcaa ggaatcgccc ctggagcaaa ctggcacttt 1320
gaagtcaacg gtcatgagtt ctacgcaaaa ggatcgaacc ttatcccacc agacagtttc 1380
tggacccgtg ttacagaaga gaagatgtca cggctattcg atgcagtggt cgttggaaac 1440
cagaatatgc tccgtgtctg gtcctccggc gcgtacctgc atgactacat ctatgatctg 1500
gccgatgaaa agggcattct cttatggagc gagttcgagt tcagtgacgc tttatatccc 1560
tccgacgacg ctttcctcga gaacgttgct gctgagatag tatacaatgt tcgacgagtg 1620
aaccaccatc cctccttggc tctatgggct ggcggaaatg aaatcgaatc cttgatgctc 1680
ccacgtgtca aagatgcagc cccatcttca tattcctact atgtgggcga gtatgagaag 1740
atgtacatta gcctcttctt gcctctggtc tacgagaaca cgcgttccat ctcatactcc 1800
cccagcagca caaccgaagg ctacctgtac attgaccttt ctgcccctgt cccaatggct 1860
gaacgttacg acaacactac ctccggctca tactacggcg atacagacca ctacgactac 1920
gacactagcg tggcgtttga ctacggttcc tatccggtag gccgctttgc caacgaattc 1980
ggcttccaca gcatgcccag cctccagaca tggcaacaag ctgtcgacac tgaggatctt 2040
tacttcaaca gcagcgtcgt catgctgcgc aaccaccacg atcccgcagg tggtctcatg 2100
acggacaact acgcgaactc ggccactggc atgggcgaaa tgaccatggg cgtggtaagc 2160
tactatccga taccgagtaa atccgaccac atctccaact tcagcgcctg gtgccatgcc 2220
acccagctct ttcaggcaga catgtacaaa agtcagatcc agttctaccg tcgtggaagt 2280
ggcatgcccg agcgccagct tggctccttg tattggcagc tcgaagatat ctggcaagcg 2340
ccatcatggg caggcattga gtacggtggt agatggaagg tccttcacca cgttatgaga 2400
gatatctatc agcctgttat tgtttcacct ttttggaact atactaccgg ctcgttggat 2460
gtctatgtta cttccgatct gtggagccct gcagcaggta ctgtcgactt gacctggttg 2520
gacctgtccg gccgccctat tgcgggtaac gcgggcacgc caaaatctgt tccctttacc 2580
gtgggaggtc tcaacagcac tcgcatctat gggacgaatg tttcttctct gggcttgccg 2640
gatactaaag atgctgttct gatcctctcg ctctcggctc acggccgtct tccgaactca 2700
gaccggacca ccaacttgac tcatgagaat tacgctacgc tttcttggcc caaggatttg 2760
aagattgttg acccgggact taagatagga cacagctcaa agaagacaac cgttacggtg 2820
gaagctacat ccggtgtttc attgtacacc tggctcgact acccagaggg tgtggtggga 2880
tactttgaag agaatgcctt cgtcttagca ccaggcgaga agaaagagat tagttttact 2940
gttctagagg acactactga cggggcttgg gtccgtaaca tcaccgtcca gagtctctgg 3000
gaccaaaagg ttcgcggttg a 3021
<210> 70
<211> 931
<212> PRT
<213> 黑曲霉
<400> 70
Met Arg His Ser Ile Gly Leu Ala Ala Ala Leu Leu Ala Pro Thr Leu
1 5 10 15
Pro Val Ala Leu Gly Gln Tyr Ile Arg Asp Leu Ser Thr Glu Lys Trp
20 25 30
Thr Leu Ser Ser Arg Ala Leu Asn Arg Thr Val Pro Ala Gln Phe Pro
35 40 45
Ser Gln Val His Leu Asp Leu Leu Arg Ala Gly Val Ile Gly Glu Tyr
50 55 60
His Gly Leu Asn Asp Phe Asn Leu Arg Trp Ile Ala Ala Ala Asn Trp
65 70 75 80
Thr Tyr Thr Ser Gln Pro Ile Lys Gly Leu Leu Asp Asn Tyr Asp Ser
85 90 95
Thr Trp Leu Val Phe Asp Gly Leu Asp Thr Phe Ala Thr Ile Ser Phe
100 105 110
Cys Gly Gln Gln Ile Ala Ser Thr Asp Asn Gln Phe Arg Gln Tyr Ala
115 120 125
Phe Asp Val Ser Thr Ala Leu Gly Ser Cys Lys Gly Asp Pro Val Leu
130 135 140
Ser Ile Asn Phe Gly Ser Ala Pro Asn Ile Val Asp Ala Ile Ala Gln
145 150 155 160
Asp Ser Asn Ser Gln Lys Trp Pro Asp Asp Val Gln Leu Thr Tyr Glu
165 170 175
Tyr Pro Asn Arg Trp Phe Met Arg Lys Glu Gln Ser Asp Phe Gly Trp
180 185 190
Asp Trp Gly Pro Ala Phe Ala Pro Ala Gly Pro Trp Lys Pro Ala Tyr
195 200 205
Ile Val Gln Leu Asp Lys Lys Glu Ser Val Tyr Val Leu Asn Thr Asp
210 215 220
Leu Asp Ile Tyr Arg Lys Gly Gln Ile Asn Tyr Leu Pro Pro Asp Gln
225 230 235 240
Ser Gln Pro Trp Val Val Asn Ala Ser Ile Asp Ile Leu Gly Pro Leu
245 250 255
Pro Thr Lys Pro Thr Met Ser Ile Glu Val Arg Asp Thr His Ser Gly
260 265 270
Thr Ile Leu Thr Ser Arg Thr Leu Asn Asn Val Ser Val Ala Gly Asn
275 280 285
Ala Ile Thr Gly Val Thr Val Leu Asp Gly Leu Thr Pro Lys Leu Trp
290 295 300
Trp Pro Gln Gly Leu Gly Asp Gln Asn Leu Tyr Asn Val Ser Ile Thr
305 310 315 320
Val Gln Ser Arg Gly Asn Gln Thr Val Ala Ser Val Asn Lys Arg Thr
325 330 335
Gly Phe Arg Thr Ile Phe Leu Asn Gln Arg Asn Ile Thr Glu Ala Gln
340 345 350
Arg Ala Gln Gly Ile Ala Pro Gly Ala Asn Trp His Phe Glu Val Asn
355 360 365
Gly His Glu Phe Tyr Ala Lys Gly Ser Asn Leu Ile Pro Pro Asp Ser
370 375 380
Phe Trp Thr Arg Val Thr Glu Glu Lys Met Ser Arg Leu Phe Asp Ala
385 390 395 400
Val Val Val Gly Asn Gln Asn Met Leu Arg Val Trp Ser Ser Gly Ala
405 410 415
Tyr Leu His Asp Tyr Ile Tyr Asp Leu Ala Asp Glu Lys Gly Ile Leu
420 425 430
Leu Trp Ser Glu Phe Glu Phe Ser Asp Ala Leu Tyr Pro Ser Asp Asp
435 440 445
Ala Phe Leu Glu Asn Val Ala Ala Glu Ile Val Tyr Asn Val Arg Arg
450 455 460
Val Asn His His Pro Ser Leu Ala Leu Trp Ala Gly Gly Asn Glu Ile
465 470 475 480
Glu Ser Leu Met Leu Pro Arg Val Lys Asp Ala Ala Pro Ser Ser Tyr
485 490 495
Ser Tyr Tyr Val Gly Glu Tyr Glu Lys Met Tyr Ile Ser Leu Phe Leu
500 505 510
Pro Leu Val Tyr Glu Asn Thr Arg Ser Ile Ser Tyr Ser Pro Ser Ser
515 520 525
Thr Thr Glu Gly Tyr Leu Tyr Ile Asp Leu Ser Ala Pro Val Pro Met
530 535 540
Ala Glu Arg Tyr Asp Asn Thr Thr Ser Gly Ser Tyr Tyr Gly Asp Thr
545 550 555 560
Asp His Tyr Asp Tyr Asp Thr Ser Val Ala Phe Asp Tyr Gly Ser Tyr
565 570 575
Pro Val Gly Arg Phe Ala Asn Glu Phe Gly Phe His Ser Met Pro Ser
580 585 590
Leu Gln Thr Trp Gln Gln Ala Val Asp Thr Glu Asp Leu Tyr Phe Asn
595 600 605
Ser Ser Val Val Met Leu Arg Asn His His Asp Pro Ala Gly Gly Leu
610 615 620
Met Thr Asp Asn Tyr Ala Asn Ser Ala Thr Gly Met Gly Glu Met Thr
625 630 635 640
Met Gly Val Val Ser Tyr Tyr Pro Ile Pro Ser Lys Ser Asp His Ile
645 650 655
Ser Asn Phe Ser Ala Trp Cys His Ala Thr Gln Leu Phe Gln Ala Asp
660 665 670
Met Tyr Lys Ser Gln Ile Gln Phe Tyr Arg Arg Gly Ser Gly Met Pro
675 680 685
Glu Arg Gln Leu Gly Ser Leu Tyr Trp Gln Leu Glu Asp Ile Trp Gln
690 695 700
Ala Pro Ser Trp Ala Gly Ile Glu Tyr Gly Gly Arg Trp Lys Val Leu
705 710 715 720
His His Val Met Arg Asp Ile Tyr Gln Pro Val Ile Val Ser Pro Phe
725 730 735
Trp Asn Tyr Thr Thr Gly Ser Leu Asp Val Tyr Val Thr Ser Asp Leu
740 745 750
Trp Ser Pro Ala Ala Gly Thr Val Asp Leu Thr Trp Leu Asp Leu Ser
755 760 765
Gly Arg Pro Ile Ala Gly Asn Ala Gly Thr Pro Lys Ser Val Pro Phe
770 775 780
Thr Val Gly Gly Leu Asn Ser Thr Arg Ile Tyr Gly Thr Asn Val Ser
785 790 795 800
Ser Leu Gly Leu Pro Asp Thr Lys Asp Ala Val Leu Ile Leu Ser Leu
805 810 815
Ser Ala His Gly Arg Leu Pro Asn Ser Asp Arg Thr Thr Asn Leu Thr
820 825 830
His Glu Asn Tyr Ala Thr Leu Ser Trp Pro Lys Asp Leu Lys Ile Val
835 840 845
Asp Pro Gly Leu Lys Ile Gly His Ser Ser Lys Lys Thr Thr Val Thr
850 855 860
Val Glu Ala Thr Ser Gly Val Ser Leu Tyr Thr Trp Leu Asp Tyr Pro
865 870 875 880
Glu Gly Val Val Gly Tyr Phe Glu Glu Asn Ala Phe Val Leu Ala Pro
885 890 895
Gly Glu Lys Lys Glu Ile Ser Phe Thr Val Leu Glu Asp Thr Thr Asp
900 905 910
Gly Ala Trp Val Arg Asn Ile Thr Val Gln Ser Leu Trp Asp Gln Lys
915 920 925
Val Arg Gly
930
<210> 71
<211> 10207
<212> DNA
<213> 人工序列
<220>
<223> 质粒 pQM27
<400> 71
gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctggcacg 60
acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg agttagctca 120
ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg 180
tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgaa ttgtttaaac 240
gtcgaccgaa tgtaggattg ttatccgaac tctgctcgta gaggcatgtt gtgaatctgt 300
gtcgggcagg acacgcctcg aaggttcacg gcaagggaaa ccaccgatag cagtgtctag 360
tagcaacctg taaagccgca atgcagcatc actggaaaat acaaaccaat ggctaaaagt 420
acataagtta atgcctaaag aagtcatata ccagcggcta ataattgtac aatcaagtgg 480
ctaaacgtac cgtaatttgc caacggcttg tggggttgca gaagcaacgg caaagcccca 540
cttccccacg tttgtttctt cactcagtcc aatctcagct ggtgatcccc caattgggtc 600
gcttgtttgt tccggtgaag tgaaagaaga cagaggtaag aatgtctgac tcggagcgtt 660
ttgcatacaa ccaagggcag tgatggaaga cagtgaaatg ttgacattca aggagtattt 720
agccagggat gcttgagtgt atcgtgtaag gaggtttgtc tgccgatacg acgaatactg 780
tatagtcact tctgatgaag tggtccatat tgaaatgtaa gtcggcactg aacaggcaaa 840
agattgagtt gaaactgcct aagatctcgg gccctcgggc cttcggcctt tgggtgtaca 900
tgtttgtgct ccgggcaaat gcaaagtgtg gtaggatcga acacactgct gcctttacca 960
agcagctgag ggtatgtgat aggcaaatgt tcaggggcca ctgcatggtt tcgaatagaa 1020
agagaagctt agccaagaac aatagccgat aaagatagcc tcattaaacg gaatgagcta 1080
gtaggcaaag tcagcgaatg tgtatatata aaggttcgag gtccgtgcct ccctcatgct 1140
ctccccatct actcatcaac tcagatcctc caggagactt gtacaccatc ttttgaggca 1200
cagaaaccca atagtcaacc gcggactgcg caccatgcgc cacagcatcg gattggcagc 1260
ggccctactg gcaccaaccc tacctgtagc gttgggtcaa tatattcgag acttaagcac 1320
cgagaaatgg actctcagta gtcgagcctt gaatcggaca gtacctgctc aatttccatc 1380
gcaggttcac ttagatctac taagggccgg agtgattggt gagtactatt tggaagtcaa 1440
gtcctgtgag tatacaaccg ctaacagcct caatagatga tccgtaagtg acttcatctg 1500
ccatggatga gaattgaatc gcactaaata ttgctggaga taccatggtt tgaacgattt 1560
caatcttcgc tggatcgctg ctgccaactg gacttatacc agtcaaccca tcaaaggcct 1620
gtgagtcgct gtgaagtttg tgcaatgtcg ttcgacaata ctaagaacca atagcctgga 1680
caattacgac tcaacttggc tcgtgtttga cggactggac actttcgcaa caatctcatt 1740
ctgtgggcag caaatcgcat ccacggacaa tcagtttcgc cagtatgcgt tcgatgtatc 1800
caccgcacta gggtcctgca aaggagatcc tgttctgagc atcaactttg gaagcgcacc 1860
gaatattgtt gatgctatcg cacaggactc taattcgcaa agtaagtttc agaggtgggg 1920
gactgccgaa gttgttacat gctaattgta tatagaatgg cccgatgacg tccaactcac 1980
ctacgagtac ccaaatcggt ggtttatgcg caaagaacaa tcggacttcg gatgggattg 2040
gggtccagca tttgcccctg caggtccatg gaagcctgca tatattgttc agctagacaa 2100
gaaagaaagt gtctatgtcc tgaacacgga tttggatata taccgaaagg gccaaattaa 2160
ctaccttccg ccagaccaga gccaaccttg ggtcgtcaac gctagcattg acattttggg 2220
tccactacct accaaaccaa ccatgtcgat tgaagtgcgc gatactcatt ctggcacgat 2280
tcttacttcg cggactctga acaatgtcag tgtggctggt aatgccataa ctggtgtcac 2340
cgttctcgac gggctgaccc cgaaactgtg gtggccgcaa ggcctcggtg atcagaacct 2400
ctacaatgtt tctatcactg tccaaagtag aggaaaccag accgtggcca gtgtgaacaa 2460
acggacgggc ttccgcacca tttttctcaa ccagcgcaac attactgaag cacagcgtgc 2520
gcaaggaatc gcccctggag caaactggca ctttgaagtc aacggtcatg agttctacgc 2580
aaaaggatcg aaccttatcc caccagacag tttctggacc cgtgttacag aagagaagat 2640
gtcacggcta ttcgatgcag tggtcgttgg aaaccagaat atgctccgtg tctggtcctc 2700
cggcgcgtac ctgcatgact acatctatga tctggccgat gaaaagggca ttctcttatg 2760
gagcgagttc gagttcagtg acgctttata tccctccgac gacgctttcc tcgagaacgt 2820
tgctgctgag atagtataca atgttcgacg agtgaaccac catccctcct tggctctatg 2880
ggctggcgga aatgaaatcg aatccttgat gctcccacgt gtcaaagatg cagccccatc 2940
ttcatattcc tactatgtgg gcgagtatga gaagatgtac attagcctct tcttgcctct 3000
ggtctacgag aacacgcgtt ccatctcata ctcccccagc agcacaaccg aaggctacct 3060
gtacattgac ctttctgccc ctgtcccaat ggctgaacgt tacgacaaca ctacctccgg 3120
ctcatactac ggcgatacag accactacga ctacgacact agcgtggcgt ttgactacgg 3180
ttcctatccg gtaggccgct ttgccaacga attcggcttc cacagcatgc ccagcctcca 3240
gacatggcaa caagctgtcg acactgagga tctttacttc aacagcagcg tcgtcatgct 3300
gcgcaaccac cacgatcccg caggtggtct catgacggac aactacgcga actcggccac 3360
tggcatgggc gaaatgacca tgggcgtggt aagctactat ccgataccga gtaaatccga 3420
ccacatctcc aacttcagcg cctggtgcca tgccacccag ctctttcagg cagacatgta 3480
caaaagtcag atccagttct accgtcgtgg aagtggcatg cccgagcgcc agcttggctc 3540
cttgtattgg cagctcgaag atatctggca agcgccatca tgggcaggca ttgagtacgg 3600
tggtagatgg aaggtccttc accacgttat gagagatatc tatcagcctg ttattgtttc 3660
acctttttgg aactatacta ccggctcgtt ggatgtctat gttacttccg atctgtggag 3720
ccctgcagca ggtactgtcg acttgacctg gttggacctg tccggccgcc ctattgcggg 3780
taacgcgggc acgccaaaat ctgttccctt taccgtggga ggtctcaaca gcactcgcat 3840
ctatgggacg aatgtttctt ctctgggctt gccggatact aaagatgctg ttctgatcct 3900
ctcgctctcg gctcacggcc gtcttccgaa ctcagaccgg accaccaact tgactcatga 3960
gaattacgct acgctttctt ggcccaagga tttgaagatt gttgacccgg gacttaagat 4020
aggacacagc tcaaagaaga caaccgttac ggtggaagct acatccggtg tttcattgta 4080
cacctggctc gactacccag agggtgtggt gggatacttt gaagagaatg ccttcgtctt 4140
agcaccaggc gagaagaaag agattagttt tactgttcta gaggacacta ctgacggggc 4200
ttgggtccgt aacatcaccg tccagagtct ctgggaccaa aaggttcgcg gttgattaat 4260
taagctccgt ggcgaaagcc tgacgcaccg gtagattctt ggtgagcccg tatcatgacg 4320
gcggcgggag ctacatggcc ccgggtgatt tatttttttt gtatctactt ctgacccttt 4380
tcaaatatac ggtcaactca tctttcactg gagatgcggc ctgcttggta ttgcgatgtt 4440
gtcagcttgg caaattgtgg ctttcgaaaa cacaaaacga ttccttagta gccatgcatt 4500
ttaagataac ggaatagaag aaagaggaaa ttaaaaaaaa aaaaaaaaca aacatcccgt 4560
tcataacccg tagaatcgcc gctcttcgtg tatcccagta ccacggcaaa ggtatttcat 4620
gatcgttcaa tgttgatatt gttcccgcca gtatggctcc acccccatct ccgcgaatct 4680
cctcttctcg aacgcggtag tggcgcgcca attggtaatg acccataggg agacgaatta 4740
actagaggtg actgacacct ggcggtagac aatcaatcca tttcgctata gttaaaggat 4800
ggggatgagg gcaattggtt atatgatcat gtatgtagtg ggtgtgcata atagtagtga 4860
aatggaagcc aagtcatgtg attgtaatcg accgacggaa ttgaggatat ccggaaatac 4920
agacaccgtg aaagccatgc tctttccttc gtgtagaaga ccagacagac agtccctgat 4980
ttacccttgc acaaagcact agaaaattag cattccatcc ttctctgctt gctctgctga 5040
tatcactgtc attcaatgca tctggaaacg caaccctgaa gggattcttc ctttgagaga 5100
tggaagcgtg tcatatctct tcggttctac ggcaggtttt tttctgctct ttcgtagcat 5160
ggcatggtca cttcagcgct tatttacagt tgctggtatt gatttcttgt gcaaattgct 5220
atctgacact tattagctat ggagtcacca catttcccag caacttcccc acttcctctg 5280
caatcgccaa cgtcctctct tcactgagtc tccgtccgat aacctgcact gcaaccggtg 5340
ccccatgata cgcctccgga tcatactctt cctgcacgag ggcatcaagc tcactaaccg 5400
ccttgaaact ctcattcttc ttatcgatgt tcttatccgc aaaggtaacc ggaacaacca 5460
cgctcgtgaa atccagcagg ttgatcacag aggcataccc atagtaccgg aactggtcat 5520
gccgtaccgc agcggtaggc gtaatcggcg cgatgatggc gtccagttcc ttcccggcct 5580
tttcttcagc ctcccgccat ttctcaaggt actccatctg gtaattccac ttctggagat 5640
gcgtgtccca gagctcgttc atgttaacag ctttgatgtt cgggttcagt aggtctttga 5700
tatttggagt cgccggctcg ccggatgcac tgatatcgcg cattacgtcg gcgctgccgt 5760
cagccgcgta gatatgggag atgagatcgt ggccgaaatc gtgcttgtat ggcgtccacg 5820
gggtcacggt gtgaccggct ttggcgagtg cggcgacggt ggtttccacg ccgcgcagga 5880
taggagggtg tggaaggaca ttgccgtcga agttgtagta gccgatattg agcccgccgt 5940
tcttgatctt ggaggcaata atgtccgact cggactggcg ccagggcatg gggatgacct 6000
tggagtcgta tttccaaggc tcctgaccga ggacggattt ggtgaagagg cggaggtcta 6060
acatacttca tcagtgactg ccggtctcgt atatagtata aaaagcaaga aaggaggaca 6120
gtggaggcct ggtatagagc aggaaaagaa ggaagaggcg aaggactcac cctcaacaga 6180
gtgcgtaatc ggcccgacaa cgctgtgcac cgtctcctga ccctccatgc tgttcgccat 6240
ctttgcatac ggcagccgcc catgactcgg ccttagaccg tacaggaagt tgaacgcggc 6300
cggcactcga atcgagccac cgatatccgt tcctacaccg atgacgccac cacgaatccc 6360
aacgatcgca ccctcaccac cagaactgcc gccgcacgac cagttcttgt tgcgtgggtt 6420
gacggtgcgc ccgatgatgt tgttgactgt ctcgcagacc atcagggtct gcgggacaga 6480
ggtcttgacg tagaagacgg caccggcttt gcggagcatg gttgtcagaa ccgagtcccc 6540
ttcgtcgtac ttgtttagcc atgagatgta gcccattgat gtttcgtagc cctggtggca 6600
tatgttagct gacaaaaagg gacatctaac gacttagggg caacggtgta ccttgactcg 6660
aagctggtct ttgagagaga tggggaggcc atgaagtgga ccaacgggtc tcttgtgctt 6720
tgcgtagtat tcatcgagtt cccttgcctg cgcgagagcg gcgtcaggga agaactcgtg 6780
ggcgcagttt gtctgcacag aagccagcgt cagcttgata gtcccataag gtggcgttgt 6840
tacatctccc tgagaggtag aggggaccct actaactgct gggcgattgc tgcccgttta 6900
cagaatgcta gcgtaacttc caccgaggtc aactctccgg ccgccagctt ggacacaaga 6960
tctgcagcgg aggcctctgt gatcttcagt tcggcctctg aaaggatccc cgatttcttt 7020
gggaaatcaa taacgctgtc ttccgcaggc agcgtctgga ctttccattc atcagggatg 7080
gtttttgcga ggcgggcgcg cttatcagcg gccagttctt cccaggattg aggcattctg 7140
tgttagctta tagtcaggat gttggctcga cgagtgtaaa ctgggagttg gcatgagggt 7200
tatgtaggct tctttagccc cgcatccccc tcattctcct cattgatccc gggggagcgg 7260
atggtgttga taagagacta attatagggt ttagctggtg cctagctggt gattggctgg 7320
cttcgccgaa ttttacgggc caaggaaagc tgcagaaccg cggcactggt aaacggtaat 7380
taagctatca gccccatgct aacgagttta aattacgtgt attgctgata aacaccaaca 7440
gagctttact gaaagatggg agtcacggtg tggcttcccc actgcgatta ttgcacaagc 7500
agcgagggcg aacttgactg tcgtcgctga gcagcctgca gtcaaacata catatatatc 7560
aaccgcgaag acgtctggcc ttgtagaaca cgacgctccc tagcaacacc tgccgtgtca 7620
gcctctacgg ttgttacttg cattcaggat gctctccagc gggcgagcta ttcaaaatat 7680
tcaaagcagg tatctcgtat tgccaggatt cagctgaagc aacaggtgcc aaggaaatct 7740
gcgtcggttc tcatctgggc ttgctcggtc ctggcgtaga atgcatccta gagtttaaac 7800
agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa 7860
cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc 7920
accgatcgcc cttcccaaca gttgcgcagc ctgaacggcg aatggcgcct gatgcggtat 7980
tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc 8040
tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc 8100
tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 8160
tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg 8220
atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc 8280
acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 8340
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 8400
agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 8460
cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 8520
gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 8580
cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 8640
tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 8700
ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 8760
ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 8820
atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 8880
cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 8940
atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 9000
gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 9060
cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 9120
tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 9180
tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 9240
gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 9300
gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 9360
atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 9420
atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 9480
aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 9540
aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt gtagccgtag 9600
ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 9660
ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 9720
tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 9780
ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 9840
acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 9900
gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 9960
cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 10020
aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 10080
atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 10140
gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 10200
gaagagc 10207
<210> 72
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 引物 1210956
<400> 72
tgattacgaa ttgtttaaac ggatccgaat gtaggattgt tatccg 46
<210> 73
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 引物 1201606
<400> 73
gaagttccta tactttctag agaataggaa ctcggaatag gaacttcaac cttatgggac 60
tatcaagctg ac 72
<210> 74
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物 1210957
<400> 74
gttacattga cgtacttata agaagttcct atactttcta gagaatagga 50
<210> 75
<211> 357
<212> DNA
<213> 人工序列
<220>
<223> 里氏木霉cbh1 5' 探针序列
<400> 75
tagggtcggc aacggcaaaa aagcacgtgg ctcaccgaaa agcaagatgt ttgcgatcta 60
acatccagga acctggatac atccatcatc acgcacgacc actttgatct gctgtaaact 120
cgtattcgcc ctaaaccgaa gtgcgtggta aatctacacg tgggcccctt tcggtatact 180
gcgtgtgtct tctctaggtg ccattctttt cccttcctct agtgttgaat tgtttgtgtt 240
ggagtccgag ctgtaactac ctctgaatct ctggagaatg gtggactaac gactaccgtg 300
cacctgcatc atgtatataa tagtgatcct gagaaggggg gtttggagca atgtggg 357
<210> 76
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205503
<400> 76
gggagatgta acaacgcctt gaagttccta ttccgagttc ctattcttca aatagtatag 60
gaacttcaac cttatgggac tatcaag 87
<210> 77
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205504
<400> 77
cttgatagtc ccataaggtt gaagttccta tactatttga agaataggaa ctcggaatag 60
gaacttcaag gcgttgttac atctccc 87
<210> 78
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205505
<400> 78
gcccctaagt cgttagatgt ttgaagttcc tattccgagt tcctattctt caaatagtat 60
aggaacttca ccctttttgt cagc 84
<210> 79
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205506
<400> 79
gctgacaaaa agggtgaagt tcctatacta tttgaagaat aggaactcgg aataggaact 60
tcaaacatct aacgacttag gggc 84
<210> 80
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205507
<400> 80
ctataccagg cctccacttg aagttcctat tccgagttcc tattcttcaa atagtatagg 60
aacttcatgt cctcctttct tgc 83
<210> 81
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> 引物 1205508
<400> 81
gcaagaaagg aggacatgaa gttcctatac tatttgaaga ataggaactc ggaataggaa 60
cttcaagtgg aggcctggta tag 83

Claims (26)

1.用于使用位点特异性重组酶将感兴趣的多核苷酸文库整合到丝状真菌宿主细胞的染色体中的一种方法,从而实现高度一致的表达水平,所述方法包括以下步骤:
a)提供丝状真菌宿主细胞,它按以下顺序在其染色体中包含:
i)该重组酶的第一识别序列或在整合位点的5’或3’的区域;
ii)第一选择标记;
iii)该重组酶的第二识别序列;以及
iv)非功能部分第二选择标记;
b)用核酸构建体转化所述宿主细胞,该核酸构建体按以下顺序包含:
i)该重组酶的第一识别序列或在整合位点的5’或3’的区域;
ii)感兴趣的多核苷酸文库;
iii)非功能部分第二选择标记;和
iv)该重组酶的第二识别序列;
c)在所述宿主细胞中表达编码该位点特异性重组酶的基因;和
d)选择转化的宿主细胞,该宿主细胞表达该第二选择标记,而不是该第一选择标记,
其中这一感兴趣的多核苷酸文库是通过该重组酶位点特异性地以正确的方向整合到该宿主细胞的染色体中,由此,从该染色体切离该第一可选择标记,并且由此非功能部分第二可选择标记被重组,以形成该染色体中的功能第二选择标记。
2.如权利要求1所述的方法,其中该多核苷酸文库包括编码感兴趣的多肽的变体的多核苷酸。
3.如权利要求2所述的方法,其中所述感兴趣的多肽是一种酶。
4.如权利要求2所述的方法,其中所述感兴趣的多肽是一种水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶。
5.如权利要求2所述的方法,其中所述感兴趣的多肽是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、或β-木糖苷酶。
6.如权利要求1-5中任一项所述的方法,其中该丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
7.如权利要求6中所述的方法,其中该丝状真菌宿主细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporiuminops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporiummerdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
8.如权利要求1-7中任一项所述的方法,其中位点特异性重组酶是酿酒酵母2μm翻转酶FLP、噬菌体TP901-1整合酶、噬菌体P1 CRE整合酶、细菌XerC重组酶、细菌XerD重组酶、λ噬菌体整合酶或HP1整合酶。
9.如权利要求8中所述的方法,其中该位点特异性重组酶是酿酒酵母2μm翻转酶FLP。
10.如权利要求1-9中任一项所述的方法,其中该重组酶的第一和第二识别序列是相同或不同的,以实现在宿主细胞染色体中这一感兴趣的多核苷酸文库的定向整合。
11.如权利要求10中所述的方法,其中该重组酶的第一和第二识别序列是不同的。
12.如权利要求1-11中任一项所述的方法,其中该重组酶的第一和第二识别的序列是酿酒酵母2μm翻转酶FLP的不同识别序列,以实现宿主细胞染色体中这一感兴趣的多核苷酸库的定向整合。
13.如权利要求12所述的方法,其中该重组酶的第一和第二识别序列分别是FRT-F(SEQID NO:27)和FRT-F3(SEQ ID NO:28),或重组酶的第一和第二识别序列分别是FRT-F3(SEQID NO:28)和FRT-F(SEQ ID NO:27)。
14.多核苷酸文库表达系统,包括:
a)丝状真菌宿主细胞,它按以下顺序在其染色体中包含:
i)位点特异性重组酶的第一识别序列或在整合位点的5’或3’的区域;
ii)第一选择标记;
iii)该重组酶的第二识别序列;以及
iv)非功能部分第二选择标记;和
b)核酸构建体,该核酸构建体按顺序包含以下元件:
i)该重组酶的第一识别序列或在整合位点的5’或3’的区域;
ii)感兴趣的多核苷酸文库;
iii)非功能部分第二选择标记;和
iv)该重组酶的第二识别序列,和
c)编码位点特异性重组酶的基因包括在丝状真菌宿主细胞染色体中或在该核酸构建体中,在步骤(b)中列出的元件之外;
其中,当用该核酸构建体转化该宿主细胞时,这一感兴趣的多核苷酸文库是通过该重组酶位点特异性地以正确的方向整合到该宿主细胞的染色体中,从而实现高度一致的表达水平,由此,从该染色体切离该第一可选择标记,并由此非功能部分第二可选择标记被重组,以形成表达的该染色体中的功能第二选择标记。
15.如权利要求14所述的多核苷酸文库表达系统,其中该多核苷酸文库包括编码感兴趣的多肽的变体的多核苷酸。
16.如权利要求15所述的多核苷酸文库表达系统,其中所述感兴趣的多肽是一种酶。
17.如权利要求16所述的多核苷酸文库表达系统,其中所述感兴趣的多肽是一种水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶。
18.如权利要求16所述的多核苷酸文库表达系统,其中所述感兴趣的多肽是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、或β-木糖苷酶。
19.如权利要求14-18中任一项所述的多核苷酸文库表达系统,其中该丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
20.如权利要求19中所述的多核苷酸文库表达系统,其中该丝状真菌宿主细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkanderaadusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsiscaregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsispannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsissubrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporiuminops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporiumlucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporiumzonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotuseryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
21.如权利要求14-20中任一项所述的多核苷酸文库表达系统,其中位点特异性重组酶是酿酒酵母2μm翻转酶FLP、噬菌体TP901-1整合酶、噬菌体P1 CRE整合酶、细菌XerC重组酶、细菌XerD重组酶,λ噬菌体整合酶或HP1整合酶。
22.如权利要求21中所述的多核苷酸文库表达系统,其中该位点特异性重组酶是酿酒酵母2μm翻转酶FLP。
23.如权利要求14-22中任一项所述的多核苷酸文库表达系统,其中该重组酶的第一和第二识别序列是相同或不同的,以实现在宿主细胞染色体中这一感兴趣的多核苷酸文库的定向整合。
24.如权利要求23所述的多核苷酸文库表达系统,其中该重组酶的第一和第二识别序列是不同的。
25.如权利要求14-24中任一项所述的多核苷酸文库表达系统,其中该重组酶的第一和第二识别序列是酿酒酵母2μm翻转酶FLP的不同识别序列,以实现在宿主细胞染色体中这一感兴趣的多核苷酸文库的定向整合。
26.如权利要求25所述的多核苷酸文库表达系统,其中该重组酶的第一和第二识别序列分别是FRT-F(SEQ ID NO:27)和FRT-F3(SEQ ID NO:28),或重组酶的第一和第二识别序列分别是FRT-F3(SEQ ID NO:28)和FRT-F(SEQ ID NO:27)。
CN201580044304.0A 2014-08-20 2015-08-20 多核苷酸文库的重组酶介导的整合 Active CN106661573B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14181694.2 2014-08-20
EP14181694 2014-08-20
PCT/EP2015/069177 WO2016026938A1 (en) 2014-08-20 2015-08-20 Recombinase-mediated integration of a polynucleotide library

Publications (2)

Publication Number Publication Date
CN106661573A CN106661573A (zh) 2017-05-10
CN106661573B true CN106661573B (zh) 2021-07-27

Family

ID=51357876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580044304.0A Active CN106661573B (zh) 2014-08-20 2015-08-20 多核苷酸文库的重组酶介导的整合

Country Status (5)

Country Link
US (1) US20170260520A1 (zh)
EP (1) EP3183343B1 (zh)
CN (1) CN106661573B (zh)
DK (1) DK3183343T3 (zh)
WO (1) WO2016026938A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112014004190A2 (pt) 2011-08-24 2017-03-01 Novozymes Inc método para construir uma cepa fúngida filamentosa, cepa fúngida filamentosa, método para produzir múltiplos polipeptídeos recombinantes, e, construto em tandem
CN107794257B (zh) * 2016-08-31 2022-05-17 浙江安诺优达生物科技有限公司 一种dna大片段文库的构建方法及其应用
WO2018050666A1 (en) 2016-09-15 2018-03-22 Novozymes A/S Genomic integration of dna fragments in fungal host cells
BR112019027861A2 (pt) 2017-06-28 2020-09-15 Novozymes A/S polipeptídeo, composição, formulação de caldo integral ou composição de cultura celular, polinucleotídeo, construção de ácido nucleico ou vetor de expressão, célula hospedeira recombinante, método de produção de um polipeptídeo, e, processo de produção de um produto de fermentação.
US20210301285A1 (en) * 2018-08-02 2021-09-30 Novozymes A/S Preparation of Combinatorial Libraries of DNA Constructs
WO2020084034A1 (en) * 2018-10-26 2020-04-30 F. Hoffmann-La Roche Ag Multispecific antibody screening method using recombinase mediated cassette exchange
EP4004211A1 (en) 2019-07-25 2022-06-01 Novozymes A/S Filamentous fungal expression system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2576796B1 (en) * 2010-06-03 2017-03-29 Danisco US Inc. Filamentous fungal host strains and dna constructs, and methods of use thereof
EP2527448A1 (en) * 2011-05-23 2012-11-28 Novozymes A/S Simultaneous site-specific integrations of multiple gene-copies in filamentous fungi
EP2825650B1 (en) * 2012-03-12 2019-02-13 DSM IP Assets B.V. Recombination system

Also Published As

Publication number Publication date
EP3183343A1 (en) 2017-06-28
DK3183343T3 (da) 2020-03-23
WO2016026938A1 (en) 2016-02-25
CN106661573A (zh) 2017-05-10
US20170260520A1 (en) 2017-09-14
EP3183343B1 (en) 2020-01-01

Similar Documents

Publication Publication Date Title
CN106661573B (zh) 多核苷酸文库的重组酶介导的整合
KR101982360B1 (ko) 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도
KR102451510B1 (ko) Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
DK2785849T3 (en) Yeast strains modified to produce ethanol from acetic acid and glycerol
CN102695796B (zh) 细胞、核酸、酶和它们用于生产槐糖脂的用途以及方法
DK2663645T3 (da) Gærstammer, der er modificeret til produktion af ethanol fra glycerol
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
DK2576605T3 (en) PREPARATION OF METABOLITES
US20040003420A1 (en) Modified recombinase
CN111465689B (zh) Cas9变体和使用方法
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
CN101939434A (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
KR20130105649A (ko) 피루베이트로부터 아세토락테이트로의 전환을 촉매작용시키는 폴리펩티드를 암호화하는 폴리뉴클레오티드의 통합
CN107849583B (zh) 使用细胞分裂基因座控制细胞增殖的工具和方法
CN108779480A (zh) 生产鞘氨醇碱和鞘脂类的方法
CN116083398B (zh) 分离的Cas13蛋白及其应用
CN113302303A (zh) 经修饰的丝状真菌宿主细胞
KR20140043890A (ko) 조절된 유전자 발현 시스템 및 그의 작제물
US11814412B2 (en) Artificial proteins and compositions and methods thereof
EP1395612A2 (en) Modified recombinase
KR102341583B1 (ko) 스플릿 인테인을 접목한 가용성 향상 이중 기능성 융합 태그를 이용한 재조합 섬유아세포 성장인자 수용체의 제조방법, 정제방법, 및 이의 용도
KR20240029020A (ko) Dna 변형을 위한 crispr-트랜스포손 시스템
CN114958758B (zh) 一种乳腺癌模型猪的构建方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant