CN109971775A - 一种核酸构建物及其调控蛋白合成的方法 - Google Patents
一种核酸构建物及其调控蛋白合成的方法 Download PDFInfo
- Publication number
- CN109971775A CN109971775A CN201810797876.1A CN201810797876A CN109971775A CN 109971775 A CN109971775 A CN 109971775A CN 201810797876 A CN201810797876 A CN 201810797876A CN 109971775 A CN109971775 A CN 109971775A
- Authority
- CN
- China
- Prior art keywords
- sequence
- nucleic acid
- rna
- protein
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明提供了一种核酸构建物及其调控蛋白合成的方法,通过对编码mRNA的5'UTR和3'UTR的DNA核酸序列进行改造,分别插入特异的3'CITE和其对应的5'端序列,使转录生成的mRNA形成环状结构,促使翻译结束的核糖体到达5'UTR快速重新开始新一轮的翻译,利用两端的发夹结构增强mRNA的稳定性,与5'UTR核酸元件以及3'UTR上的poly(A)结构产生协同效应,提高蛋白质合成翻译的效率。
Description
技术领域
本发明涉及生物工程技术领域,具体地,涉及一种核酸构建物及其调控蛋白合成的方法。
背景技术
蛋白质是细胞中的重要分子,几乎参与了细胞所有功能的执行。蛋白的序列和结构不同,决定了其功能的不同。在细胞内,蛋白可以作为酶类催化各种生化反应,可以作为信号分子协调生物体的各种活动,可以支持生物形态,储存能量,运输分子,并使生物体运动。在生物医学领域,蛋白质抗体作为靶向药物,是治疗癌症等疾病的重要手段。
蛋白质翻译的四个过程包括翻译起始、翻译延伸、翻译终止和核糖体再循环,其中受调控最多和限速的步骤是翻译的起始[1]。在细菌的翻译起始过程中,30S小亚基在3种起始因子的介导下直接在起始密码子的AUG附近形成起始复合体。真核生物的翻译起始则较为复杂,需要11种起始因子,并且核糖体在起始蛋白质合成时与mRNA结合的位点与原核生物不同[2]。真核生物的具有“帽子结构”(cap structure,m7GpppN)的mRNA翻译起始主要是通过依赖“帽子结构”的扫描机制进行的[1-3]。其中“帽子结构”能够招募翻译起始因子eIF4F,进而招募下游的包括核糖体40S小亚基以及翻译起始因子eIF1、eIF3和eIF5的43S翻译起始前复合物(Pre-initiation complex,PIC),另外一个包含翻译起始因子eIF2和起始tRNA(Met-tRNAi)的三元复合物也同时被招募到mRNA上。被招募来的复合物沿着5'端到3'端的方向进行扫描,发现第一个起始密码子AUG后开始翻译过程。
除了“帽子结构”外,真核生物的大部分mRNA的3'端都有多聚腺嘌呤核苷链[poly(A)],能够被poly(A)结合蛋白(pAB1)结合。除了结合mRNA的3'端polyA,pAB1蛋白还能够结合翻译起始因子eIF4G,pAB1在eIF4G上的结合位点与能够结合mRNA的5'端“帽子结构”eIF4E在eIF4G上的结合位点不同,这样pAB1和eIF4E能够同时与eIF4G结合。在eIF4E,eIF4G和pAB1蛋白的介导下,mRNA的5'端和3'端在空间上十分靠近从而能够形成环状结构,这与电子显微照相观察到的多核糖体是环状的实验结果吻合[4]。真核生物的mRNA环化结构的功能意义目前还没有定论,其可能的解释是帮助核糖体在完成翻译后仍然与mRNA结合在一起,使核糖体从3'末端直接转移到5'末端继续扫描和重新开始翻译过程,减少了核糖体亚基以及翻译起始因子复合物的重新循环组装[2]。生物体内的mRNA翻译受到诸多内在因素(如能荷,氨基酸等)和外在因素(如营养,胁迫压力等)的调控。其中部分调控通过不同信号通路进行信号传导,实现翻译起始因子eIFs的磷酸化水平调控和相关蛋白的活性调节。以蛋白翻译合成调控中关键的信号通路雷帕霉素靶蛋白(target of rapamycin,简称TOR)途径为例,哺乳动物雷帕霉素靶蛋白1(简称mTORC1)的底物之一为翻译抑制因子(4E-BindingProtein,简称4E-BPs)小蛋白家族,是可以与eIF4G竞争性结合eIF4E的小分子蛋白。激活状态下的mTORC1蛋白可以磷酸化4E-BP1上的特定苏氨酸残基,使4E-BP1从eIF4E上解离下来,从而促进eIF4F复合物的形成[9]。通过eIF4F形成的mRNA环化涉及的因素很多,受到的来自不同途径的调控会限制蛋白合成翻译的起始速率。
酵母体内一个主要mRNA降解途径是首先对mRNA的去腺苷酸化,然后再进行脱帽反应,最后达到mRNA的5'端到3'端的降解。此外,去腺苷酸化的mRNA的3'端会暴露出来,从而被从3'端到5'端降解[10,11]。在真核生物中的很多mRNA的降解的第一步是去腺苷酸化反应。因此,带有polyA的模板在细胞提取液中的可能比较不稳定,容易被去腺苷酸化而引起降解。
体外生物合成系统是指在细菌、真菌、植物细胞或动物细胞的裂解提取物中,通过加入外源编码的核酸DNA、RNA、底物和能量源,完成特定化学分子或生物大分子(DNA、RNA或蛋白质)的体外高效合成。在体外蛋白质合成系统中,利用细胞提取液,通过添加外源mRNA或者DNA模板完成对外源重组蛋白的快速高效表达。目前以原核细胞或真核细胞作为宿主细胞制备的体外蛋白合成表达系统都已实现商业化。由于合成5'帽子的原料7-甲基鸟嘌呤核苷的价格昂贵,而且加帽反应效率较低,真核细胞蛋白合成系统中作为蛋白质翻译模板的mRNA通常设计为不含5'端“帽子结构”,此时通常需要5'非翻译区(即5'UTR)上的特定的RNA结构来起始蛋白质的翻译。
目前,常用的此类RNA结构为内部核糖体进入序列(internal ribosome entrysite,简称IRES)和一些来自于病毒的翻译增强子,如烟草花叶病毒的Omega序列(简称Ω序列)。但因缺少了5'“帽子结构”,在体外生物合成体系中用于蛋白质合成的mRNA很难形成环状结构,这就意味着核糖体在合成结束后需要从mRNA分子上解离下来,需要通过5'UTR重新招募进而起始下一轮的蛋白质翻译,带有polyA的mRNA不稳定,会被细胞裂解液中的酶进行去腺苷酸化反应,容易被降解,这严重影响了蛋白质合成的效率。
综上所述,本领域目前的体外生物合成系统的蛋白翻译合成的效率还较低,难以令人满意,因此,本领域亟需开发一种新的核酸构建物,通过所述核酸构建物的转录和翻译,调控外源蛋白的合成,提高所述外源蛋白翻译合成的效率。
发明内容
本发明的目的在于提供一种新的可在体外生物合成系统中显著提高蛋白翻译合成效率的核酸构建物。本发明所述核酸构建物通过RNA-RNA相互作用,可产生一种可直接环化的mRNA,即crRNA(circular RNA),从而显著提高体外生物合成体系中蛋白质合成的效率。
本发明第一方面提供了一种核酸构建物,所述核酸构建物具有5'-3'的式A所示的结构:
Z1-Z2-Y1-Z3-Z4-Y2-Z5 (A)
式中,
Z1为启动子元件;
Z2和Z4为环化元件,其中环化元件Z2和Z4通过RNA-RNA直接作用使对应于式A的mRNA转录产物形成一环化结构,并且所述环化元件选自下组:TED、BTE、PTE、I型结构元件、Y型结构元件、T型结构元件、其他能够形成RNA-RNA直接作用的元件、或其组合;
Y1为无或“Z6-Z7-Z8”所示的元件;
Z3为外源蛋白的编码序列;
Y2为无或Z9;
Z5为终止子元件;
Z6为无或增强子元件;
Z7为无或烟草花叶病毒的5'端前导序列(leading sequence)-Ω序列;
Z8为无或Kozak序列;
Z9为腺嘌呤脱氧核糖核酸的多聚链;
各“-”独立地为键或核苷酸连接序列。
在另一优选例中,所述RNA-RNA直接作用包括碱基配对相互作用。
在另一优选例中,所述碱基配对相互作用包括完全碱基配对或不完全碱基配对。
在另一优选例中,所述多聚链为碱基长度为10A-200A。
在另一优选例中,所述多聚链选自下组:50A、70A、90A。
在另一优选例中,所述的各核苷酸连接序列的长度为1-20nt,较佳地1-10nt。
在另一优选例中,所述T型结构元件为Kl-TSS。
在另一优选例中,所述Y型结构元件为YSS。
在另一优选例中,所述的启动子选自下组:T7启动子、T3启动子、SP6启动子、或其组合。
在另一优选例中,所述终止子元件选自下组:T7终止子、T3终止子、SP6终止子、或其组合。
在另一优选例中,所述Z6、Z8来源于酵母。
在另一优选例中,所述酵母选自下组:酿酒酵母、克鲁维酵母属酵母、或其组合。
在另一优选例中,所述克鲁维酵母属酵母选自下组:乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、多布克鲁维酵母(Kluyveromyces dobzhanskii)、或其组合。
在另一优选例中,所述增强子选自下组:IRES元件、RBS元件、非编码序列、或其组合。
在另一优选例中,所述增强子元件包括IRES元件。
在另一优选例中,所述IRES元件来源选自下组的一种或多种细胞:原核细胞、真核细胞。
在另一优选例中,所述真核细胞包括高等真核细胞。
在另一优选例中,所述IRES元件包括内源性IRES元件和外源性IRES元件。
在另一优选例中,所述IRES元件来源选自下组的一种或多种细胞:人(human)、中国仓鼠卵巢细胞(Chinese hamster ovary cell,CHO)、昆虫细胞(insect)、麦胚(Wheatgerm cells)、兔网织红细胞(Rabbit reticulocyte)。
在另一优选例中,所述IRES元件选自下组:ScBOI1、ScFLO8、ScNCE102、ScMSN1、KlFLO8、KlNCE102、KlMSN1、KlBOI1、或其组合。
在另一优选例中,所述Ω序列包括直接重复模块(ACAATTAC)m和(CAA)p模块。
在另一优选例中,所述m为1-6,较佳地,2-4。
在另一优选例中,所述p为6-12个,较佳地,8-10个。
在另一优选例中,所述(CAA)p模块为1-5个,较佳地,1-3个。
在另一优选例中,所述(CAA)p模块还包括优化的(CAA)p模块。
在另一优选例中,Z2为3'CITE,而Z4为与所述3'CITE对应的5'端序列。
在另一优选例中,所述的环化元件来自病毒。
在另一优选例中,所述病毒选自下组:PEMV、TBSV、HCRSV、STNV、或其组合。
在另一优选例中,所述的核酸构建物具有式I或式II结构,其中,式I和式II结构如下所述。
在另一优选例中,所述核酸构建物的序列如SEQ ID NO.:2-13、51-53所示。
在另一优选例中,所述核酸构建物的序列如SEQ ID NO.:3、7-9、51-53所示。
在本发明第1a方面,所述核酸构建物含有结构如式I所示的核酸序列:
Z1-Z2-Z3-Z4-Z5 (I)
式中,
Z1-Z4和Z5分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为启动子元件,优选地所述启动子元件选自下组:T7启动子、T3启动子、SP6启动子、或其组合;
Z4和Z2为环化元件,优选地所述环化元件选自下组:TED、BTE、PTE、I型结构元件、Y型结构元件、T型结构元件、其他能够形成RNA-RNA直接作用的元件、或其组合;
Z3为外源蛋白的编码序列;
Z5为终止子元件,优选地所述终止子元件选自下组:T7终止子、T3终止子、SP6终止子、或其组合。
在另一优选例中,所述外源蛋白的编码序列来自原核生物、真核生物。
在另一优选例中,所述外源蛋白的编码序列来自动物、植物、病原体。
在另一优选例中,所述外源蛋白的编码序列来自哺乳动物,较佳地灵长动物,啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述的外源蛋白的编码序列编码选自下组的外源蛋白:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变体、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、细胞因子,干扰素α2b、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述外源蛋白选自下组:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、细胞因子,干扰素α2b,白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
本发明第1b方面,提供了一种核酸构建物,所述核酸构建物含有结构如式II所示的核酸序列:
Z1-Z2-Z6-Z7-Z8-Z3-Z4-Z9-Z5 (II)
式中,
Z1-Z9分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为启动子元件,优选地,所述启动子元件选自下组:T7启动子、T3启动子、SP6启动子、或其组合;
Z4和Z2为环化元件,优选地,所述环化元件选自下组:TED、BTE、PTE、I型结构元件、Y型结构元件、T型结构元件、其他能够形成RNA-RNA直接作用的元件、或其组合;
Z6为增强子元件,优选地,所述增强子元件包括IRES元件;
Z7为烟草花叶病毒的5'端前导序列(leading sequence)-Ω序列;
Z8为Kozak序列,优选地,所述Kozak序列来源于酵母;
Z3为外源蛋白的编码序列;
Z9为腺嘌呤脱氧核糖核酸的多聚链[poly(A)],优选地,所述多聚链选自下组:50A、70A、90A、或其组合;
Z5为终止子元件,优选地,所述终止子元件选自下组:T7终止子、T3终止子、SP6终止子、或其组合。
在本发明第二方面,提供一种体外的外源蛋白合成体系,包括:
(a)本发明第一方面所述的核酸构建物;和
(b)酵母细胞提取物。
在另一优选例中,所述外源蛋白合成体系中,组分(a)的浓度为5-30ng/μL,较佳地,8-20ng/μL,更佳地,10-16ng/μL,以所述外源蛋白合成体系的总体积计。
在另一优选例中,所述外源蛋白合成体系中,组分(b)的浓度(v/v)为20%-70%,较佳地,30-60%,更佳地,40%-50%,以所述外源蛋白合成体系的总体积计。
在另一优选例中,所述酵母或酵母细胞选自下组:酿酒酵母、毕氏酵母、克鲁维酵母、或其组合;较佳地,所述的酵母细胞包括:克鲁维酵母,更佳地为乳酸克鲁维酵母。
在另一优选例中,所述的酵母细胞提取物为对酵母细胞的水性提取物。
在另一优选例中,所述酵母细胞提取物不含酵母内源性的长链核酸分子。
在另一优选例中,所述外源蛋白合成体系还包括选自下组的一种或多种组分:
(c1)镁离子;
(c2)钾离子;
(c3)缓冲剂;
(c4)能量再生系统;
(c5)聚乙二醇;
(c6)用于合成RNA的底物;
(c7)用于合成蛋白的底物;
(c8)RNA聚合酶;
(c9)任选的外源蔗糖;
(c10)任选的溶剂,所述溶剂为水或水性溶剂。
在另一优选例中,所述镁离子来源于镁离子源,所述镁离子源选自下组:醋酸镁、谷氨酸镁、或其组合。
在另一优选例中,所述钾离子来源于钾离子源,所述钾离子源选自下组:醋酸钾、谷氨酸钾、或其组合。
在另一优选例中,所述缓冲剂选自下组:4-羟乙基哌嗪乙磺酸、三羟甲基氨基甲烷、或其组合。
在另一优选例中,所述能量再生系统选自下组:磷酸肌酸/磷酸肌酸酶系统、糖酵解途径及其中间产物能量系统、或其组合。
在另一优选例中,所述的合成RNA的底物包括:核苷单磷酸、核苷三磷酸、或其组合。
在另一优选例中,所述的合成蛋白的底物包括:1-20种天然氨基酸、以及非天然氨基酸。
在另一优选例中,所述核苷三磷酸选自下组:腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸、尿嘧啶核苷三磷酸、或其组合。
在另一优选例中,所述氨基酸为选自下组:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、或其组合。
在另一优选例中,所述氨基酸包括D型氨基酸和/或L型氨基酸。
在另一优选例中,所述聚乙二醇选自下组:PEG3000、PEG8000、PEG6000、PEG3350、或其组合。
在另一优选例中,所述聚乙二醇包括分子量(Da)为200-10000的聚乙二醇,较佳地,分子量为3000-10000的聚乙二醇。在另一优选例中,所述RNA聚合酶为T7RNA聚合酶。
在另一优选例中,所述的酵母细胞提取物是用包括以下步骤的方法制备:
(i)提供酵母细胞;
(ii)对酵母细胞进行洗涤处理,获得经洗涤的酵母细胞;
(iii)对经洗涤的酵母细胞进行破细胞处理,从而获得酵母粗提物;和
(iv)对所述酵母粗提物进行固液分离,获得液体部分,即为酵母细胞提取物。
在另一优选例中,所述外源蛋白合成体系包括选自下组的成分:聚乙二醇、4-羟乙基哌嗪乙磺酸、醋酸钾、醋酸镁、核苷三磷酸、氨基酸、磷酸肌酸、二硫苏糖醇(DTT)、磷酸肌酸激酶、蔗糖、本发明第一方面所述的核酸构建物(以萤火虫荧光素酶或绿色荧光蛋白为外源蛋白)、T7RNA聚合酶、酵母细胞提取物、或其组合。
本发明第三方面提供了一种载体或载体组合,所述的载体或载体组合含有本发明第一方面所述的核酸构建物。
本发明第四方面提供了一种基因工程细胞,所述基因工程细胞的基因组的一个或多个位点整合有本发明第一方面所述的构建物,或者所述基因工程细胞中含有本发明第三方面所述的载体或载体组合。
在另一优选例中,所述基因组包括核基因组、细胞质基因组、和/或细胞器基因组。
在另一优选例中,所述细胞器包括线粒体、和/或叶绿体。
在另一优选例中,所述基因工程细胞包括原核细胞、真核细胞。
在另一优选例中,所述真核细胞包括高等真核细胞。
在另一优选例中,所述基因工程细胞选自下组:人源细胞(如Hela细胞)、中国仓鼠卵巢细胞、昆虫细胞、麦胚细胞、兔网织红细胞、酵母细胞、或其组合。
在另一优选例中,所述基因工程细胞为酵母细胞。
在另一优选例中,所述酵母细胞选自下组:酿酒酵母、克鲁维酵母属酵母、或其组合。
在另一优选例中,所述克鲁维酵母属酵母选自下组:乳酸克鲁维酵母、马克斯克鲁维酵母、多布克鲁维酵母、或其组合。
本发明第五方面提供了一种试剂盒,所述试剂盒中包含的试剂选自下组中的一种或多种:
(a)本发明第一方面所述的构建物;
(b)本发明第三方面所述的载体或载体组合;
(c)本发明第四方面所述的基因工程细胞。
在另一优选例中,所述试剂盒还包括(d)真核体外生物合成体系(如真核体外蛋白合成体系)。
在另一优选例中,所述真核体外生物合成体系选自下组:酵母体外生物合成体系、中国仓鼠卵巢细胞体外生物合成体系、昆虫细胞体外生物合成体系、Hela细胞体外生物合成体系、或其组合。
在另一优选例中,所述真核体外生物合成体系包括真核体外蛋白合成体系。
在另一优选例中,所述真核体外蛋白合成体系选自下组:酵母体外蛋白合成体系、中国仓鼠卵巢细胞体外蛋白合成体系、昆虫细胞体外蛋白合成体系、Hela细胞体外蛋白合成体系、或其组合。
在另一优选例中,所述试剂盒还包括(e)酵母体外生物合成体系(如酵母体外蛋白合成体系)。
在另一优选例中,所述酵母体外生物合成体系(如酵母体外蛋白合成体系)为克鲁维酵母体外生物合成体系(如克鲁维酵母体外蛋白合成体系)(优选乳酸克鲁维酵母体外生物合成体系)(如乳酸克鲁维酵母体外蛋白合成体系)。
本发明第六方面提供了一种如本发明第一方面或第二方面所述的构建物、本发明第三方面所述的载体或载体组合、本发明第四方面所述的基因工程细胞或本发明第五方面所述的试剂盒的用途,其特征在于,用于进行高通量的体外蛋白质合成。
本发明第七方面提供了一种体外高通量的外源蛋白合成方法,包括步骤:
(i)在真核体外生物合成体系存在下,提供本发明第一方面所述的核酸构建物;
(ii)在适合的条件下,孵育步骤(i)的真核体外生物合成体系一段时间T1,从而合成所述外源蛋白。
在另一优选例中,所述方法还包括:(iii)任选地从所述真核体外生物合成体系中,分离或检测所述外源蛋白。
在另一优选例中,所述真核体外生物合成体系为酵母体外生物合成体系(如酵母体外蛋白合成体系)。
在另一优选例中,所述酵母体外生物合成体系(如酵母体外蛋白合成体系)为克鲁维酵母体外生物合成体系(如克鲁维酵母体外蛋白合成体系)(优选乳酸克鲁维酵母体外生物合成体系)(如乳酸克鲁维酵母体外蛋白合成体系)。
在另一优选例中,所述外源蛋白合成方法包括体外高通量的外源蛋白合成方法。
在另一优选例中,所述外源蛋白的编码序列来自原核生物、真核生物。
在另一优选例中,所述外源蛋白的编码序列来自动物、植物、病原体。
在另一优选例中,所述外源蛋白的编码序列来自哺乳动物,较佳地灵长动物,啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述的外源蛋白的编码序列编码选自下组的外源蛋白:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变体、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、细胞因子,干扰素α2b、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述外源蛋白选自下组:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、细胞因子,干扰素α2b、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述步骤(ii)中,反应温度为20-37℃,较佳地,22-35℃。
在另一优选例中,所述步骤(ii)中,反应时间为1-72h,较佳地,2-23h。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了生物合成中5′-UTR序列对于蛋白质翻译起始的关键性作用。在帽子结构非依赖的翻译起始过程中,5'UTR中的Omega序列在蛋白质因子的协助下招募40S核糖体亚基的示意图。
图2显示了不同类型的3'翻译增强子元件CITE(cap-independent translationenhancers,CITE)在体外蛋白质合成体系中影响蛋白质合成效率的差异。将挑选的来自植物病毒的4种3'CITE(kl-TSS、YSS、PTE、TED)插入pD2P-1.0质粒(获自康码(上海)生物科技有限公司,其序列如SEQ ID NO.:1所示)的3'UTR,得到四种质粒模板,分别为pD2P-1.0C001、pD2P-1.0C002、pD2P-1.0C003、pD2P-1.0C004(质粒模板序列SEQ ID NO.:2-5),应用于酵母体外蛋白质合成体系中,测试其合成的荧光素酶的相对光单位值(RLU)。其中,PC为不添加3'CITE的pD2P-1.0质粒合成的荧光素酶的相对光单位值(RLU)。
图3显示了将3'CITE与5'发夹结构元件同时应用而影响体外蛋白质合成效率的差异。其中,PC为pD2P-1.0质粒应用于酵母体外蛋白质合成体系中合成的荧光素酶的相对光单位值(RLU)。将4种5'发夹结构序列添加到已经插入了3'CITE的四种模板质粒的Ω序列的前端及后端,构建出8种质粒模板pD2P-1.0C005~pD2P-1.0C0012(质粒模板序列SEQ IDNO.:6-13)。
图4显示了将3'CITE与5'发夹结构元件同时应用而影响体外蛋白质合成效率的差异。PC为pD2P-1.1质粒(获自康码(上海)生物科技有限公司,其序列如SEQ ID NO.:50所示)应用于酵母体外蛋白质合成体系中合成的增强型绿色荧光蛋白(eGFP)的相对荧光单位值(RFU)。将pD2P-1.0C006,pD2P-1.0C007和pD2P-1.0C008为克隆载体的模板,将其编码蛋白序列由萤火虫荧光素酶替换为绿色荧光蛋白后,对应得到了pD2P-1.1C001,pD2P-1.1C002和pD2P-1.1C003三个质粒(质粒模板序列SEQ ID NO.:51-53),并应用于酵母体外蛋白质合成体系中合成的增强型绿色荧光蛋白(eGFP)的相对荧光单位值(RFU)。
图5显示了本发明核酸构建物提高体外蛋白质翻译起始效率的原理示意图。除了5'UTR元件,3'CITE也能够使得在3'端招募到的真核生物细胞内翻译起始因子复合物eIF4F,使得核糖体小亚基到达RNA的5'端,并且3'CITE与其对应的5'发夹结构发生相互作用,使得mRNA发生环化。
具体实施方式
经过广泛而深入的研究,通过大量筛选和摸索,首次意外地发现了一种能够环化mRNA进而增强在体外生物合成体系中合成蛋白质效率的新方法。通过向体外生物合成体系中的mRNA的两端插入环化元件(如3'CITE和其对应的5'发夹结构)来使mRNA形成比较稳定的环状结构,不仅能够使翻译结束的核糖体到达5'UTR快速重新开始新一轮的翻译,还能够利用两端的发夹结构增强mRNA的稳定性,同时还能够与5'UTR上的招募翻译起始因子的RNA元件产生协同效应,更进一步的增加蛋白质翻译的效率。在此基础上,发明人完成了本发明。
术语
如本文所用,术语“poly(A)”和“poly(A)n”可互换使用,指腺嘌呤脱氧核糖核酸的多聚链或polyA尾,其中n为≥10的正整数。较佳地n≥30。通常n为10-200,较佳地30-90。
如本文所用,术语“本发明的核酸构建物”指具有式A、式I或式II结构的核苷酸序列。本发明的核酸构建物可以是DNA、RNA或其他核酸类似物。
如本文所用,对于术语“环化元件Z2和Z4通过RNA-RNA直接作用使得mRNA形成环化结构”,它表示:(i)当本发明的核酸构建物可以是RNA时,由于Z2和Z4为RNA形式的环化元件,因此它们通过RNA-RNA直接作用使得mRNA形成环化结构;和(ii)当本发明的核酸构建物可以是DNA时,由于Z2和Z4为DNA形式的环化元件,因此当DNA形式的核酸构建物被转录后,对应于Z2和Z4的RNA形式的环化元件通过RNA-RNA直接作用使得mRNA形成环化结构。应理解,在本发明中,Z2和Z4元件是一对元件,它们通过RNA-RNA直接作用共同使得转录产物(mRNA)形成环化结构。
理论体系的构建:
1.科学背景
与真核生物的“帽子结构”依赖的蛋白质翻译相比,在自然界中还存在着一些“帽子结构”非依赖的蛋白质翻译起始方式。细菌mRNA上的核糖体结合位点(ribosome bindingsite,RBS)在翻译起始因子的辅助下直接招募核糖体。一些病毒和某些真核细胞内的mRNA上的一些特殊的RNA结构能够招募真核细胞蛋白质翻译起始因子,进而利用真核细胞的蛋白质翻译机器,如内部核糖体进入序列(internal ribosome entry site,IRES),和烟草花叶病毒的Omega序列等。这些特殊的RNA元件一般位于mRNA的5'端,通常位于5'UTR内[6,7]。
3'UTR在mRNA稳定性和翻译调控中也发挥着重要的调控作用。很多植物的正链RNA病毒的基因组RNA的5'端不含有任何特殊的修饰,简单的为游离的磷酸残基。这类病毒基因组RNA的一个重要特征为,在RNA的3'UTR中含有帽子结构非依赖的翻译增强子元件(cap-independent translation enhancers,CITE)[8]。3'CITE在功能上可以有效替代5'“帽子结构”功能,使得核糖体由mRNA的5'端进入和扫描。
2.基本原理
3'CITE的两个重要的特征包括,能够招募真核生物细胞内翻译起始因子复合物eIF4F的亚基,以及能够通过高亲和力的RNA-RNA相互作用(kissing-loop interaction)与位于5'UTR的发夹结构(hairpin loop)相互作用,能够使招募到的翻译起始因子能够到达RNA的5'端,进而起始蛋白质的翻译过程[8]。
根据序列和二级结构的不同,目前发现的3'CITE分为以下六种类型:最早在卫星烟草坏死病毒(Satellite tobacco necrosis virus,STNV)中发现的翻译增强结构域(translation enhancer domain,TED)、大麦黄矮病毒样翻译元素(Barley yellow dwarfvirus-Like element,BTE)、稷子花叶病毒样翻译元素(Panicum mosaic virus-Likeelement,PTE)、I型结构元件、Y型结构元件和T型结构元件[8]。除了T型结构元件,一般3'CITE序列的发夹结构可以与相应位于5'UTR中的发夹结构序列直接作用使mRNA形成相对稳定的环状结构。
在体外生物合成体系中,将3'CITE和其对应的位于5'UTR的发夹结构整合到不含有“帽子结构”的RNA的两端,能够通过RNA-RNA相互作用直接将RNA环化,新形成的环状RNA(crRNA)能够使翻译结束的核糖体可以不经解离,直接重新到达RNA的5'端。稳定的环状结构还能够阻止RNA酶对RNA的降解,增加稳定性,进一步提高蛋白质合成的效率。同时,某些3'CITE能够通过结合翻译起始因子复合物eIF4F上来招募其他翻译起始因子和复合物,能够与位于5'UTR的其他RNA元件以及3'UTR上的poly(A)元件协同,增加翻译起始的效率[5]。
体外外源蛋白合成体系
在本发明中,体外外源蛋白合成体系是一种基于真核细胞的转录-翻译偶联的体系,能够以DNA模板为起始合成RNA,或者以DNA或RNA为模板完成蛋白质的体外合成。真核细胞包括酵母细胞、兔网织红细胞、麦胚细胞、昆虫细胞、人源细胞等。真核体外生物合成体系具有能够合成具有复杂结构的RNA或者蛋白质,以及蛋白质翻译后修饰等优点。
在本发明中,所述体外外源蛋白合成体系没有特别限制,一种优选的体外外源蛋白合成体系包括酵母体外生物合成体系,作为优选,为酵母体外蛋白合成体系,较佳地为克鲁维酵母表达系统,更佳地为乳酸克鲁维酵母表达系统。
酵母(yeast)兼具培养简单、高效蛋白质折叠、和翻译后修饰的优势。其中酿酒酵母(Saccharomyces cerevisiae)和毕氏酵母(Pichia pastoris)是表达复杂真核蛋白质和膜蛋白的模式生物,酵母也可作为制备体外翻译系统的原料。
克鲁维酵母(Kluyveromyces)是一种子囊孢子酵母,其中的马克斯克鲁维酵母(Kluyveromyces marxianus)和乳酸克鲁维酵母(Kluyveromyces lactis)是工业上广泛使用的酵母。与其他酵母相比,乳酸克鲁维酵母具有许多优点,如超强的分泌能力,更好的大规模发酵特性、食品安全的级别、以及同时具有蛋白翻译后修饰的能力等。
在本发明中,所述体外外源蛋白合成体系包括:
(a)本发明第一方面所述的核酸构建物;和
(b)酵母细胞提取物。
在一优选实施方式中,所述体外外源蛋白合成体系还包括选自下组的一种或多种组分:
(c1)镁离子;
(c2)钾离子;
(c3)缓冲剂;
(c4)能量再生系统;
(c5)聚乙二醇;
(c6)用于合成RNA的底物;
(c7)用于合成蛋白的底物;
(c8)RNA聚合酶;
(c9)任选的外源蔗糖;
(c10)任选的溶剂,所述溶剂为水或水性溶剂。
在本发明中,RNA聚合酶没有特别限制,可以选自一种或多种RNA聚合酶,典型的RNA聚合酶为T7RNA聚合酶。
在本发明中,所述酵母细胞提取物在体外生物合成体系中的比例不受特别限制,所述酵母细胞提取物在体外生物合成体系中所占体系为20-70%,较佳地,30-60%;更佳地,40-50%。
在本发明中,所述的酵母细胞提取物不含完整的细胞,典型的酵母细胞提取物包括用于RNA合成所需的各种类型的RNA聚合酶,和用于蛋白翻译的核糖体、tRNA、氨酰tRNA合成酶、蛋白质合成需要的起始因子和延伸因子以及终止释放因子。此外,酵母细胞提取物中还含有一些源自真核细胞的细胞质中的其他蛋白,尤其是可溶性蛋白。
在本发明中,所述的酵母细胞提取物所含蛋白含量为20-100mg/mL,较佳为50-100mg/mL。所述的测定蛋白含量方法为考马斯亮蓝测定方法。
在本发明中,所述的酵母细胞提取物的制备方法不受限制,一种优选的制备方法包括以下步骤:
(i)提供酵母细胞;
(ii)对酵母细胞进行洗涤处理,获得经洗涤的酵母细胞;
(iii)对经洗涤的酵母细胞进行破细胞处理,从而获得酵母细胞粗提物;
(iv)对所述酵母细胞粗提物进行固液分离,获得液体部分,即为酵母细胞提取物。
本发明中,所述镁离子来源于镁离子源,所述镁离子源选自下组:醋酸镁、谷氨酸镁、或其组合。所述钾离子来源于钾离子源,所述钾离子源选自下组:醋酸钾、谷氨酸钾、或其组合。所述缓冲剂选自下组:4-羟乙基哌嗪乙磺酸、三羟甲基氨基甲烷、或其组合。
本发明中,所述能量再生系统选自下组:磷酸肌酸/磷酸肌酸酶系统、糖酵解途径及其中间产物能量系统、或其组合。
本发明中,所述的合成RNA的底物包括:核苷单磷酸、核苷三磷酸、或其组合。所述的合成蛋白的底物为氨基酸混合物,包括:1-20种天然氨基酸、以及非天然氨基酸。
所述核苷三磷酸选自下组:腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸、尿嘧啶核苷三磷酸、或其组合在本发明中,各种单核苷酸的浓度没有特别限制,每种单核苷酸的浓度为0.5-5mM,较佳地为1.0-2.0mM。
所述体外外源蛋白合成体系中的氨基酸混合物可包括天然或非天然氨基酸,可包括D型或L型氨基酸。代表性的氨基酸包括但并不限于20种天然氨基酸:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸。每种氨基酸的浓度通常为0.01-0.5mM,较佳地0.02-0.2mM,如0.05mM、0.06mM、0.07mM、0.08mM。
在优选例中,所述体外外源蛋白合成体系还含有聚乙二醇或其类似物。聚乙二醇或其类似物的浓度没有特别限制,通常,聚乙二醇或其类似物的浓度(w/v)为0.1-8%,较佳地,0.5-4%,更佳地,1-2%,以所述生物合成体系的总重量计。优选PEG3000、PEG3350、PEG6000或PEG8000。应理解,本发明的体系还包括其他各种分子量的聚乙二醇,如PEG200、400、1500、2000、4000、10000等。
在优选例中,所述体外外源蛋白合成体系还含有蔗糖。蔗糖的浓度没有特别限制,通常,蔗糖的浓度为0.03-40wt%,较佳地,0.08-10wt%,更佳地,0.1-5wt%,以所述蛋白合成体系的总重量计。
一种特别优选的体外外源蛋白合成体系,含有以下组分:22mM pH为7-8的4-羟乙基哌嗪乙磺酸,30-150mM醋酸钾,1.0-5.0mM醋酸镁,1.5-4mM核苷三磷酸混合物,0.08-0.24mM的氨基酸混合物,25mM磷酸肌酸,1.7mM二硫苏糖醇,0.27mg/mL磷酸肌酸激酶,1%-4%聚乙二醇,0.5%-2%蔗糖,8-20ng/μL本发明的核酸构建物(以萤火虫荧光素酶或绿色荧光蛋白为外源蛋白),0.027-0.054mg/mL T7RNA聚合酶,50%体积的酵母细胞提取物。
Ω序列
如本文所用,术语“Ω序列”是烟草花叶病毒基因组的5'端前导序列,是该种病毒的翻译增强子。Ω的DNA序列含有68个碱基对,由1-6个(优选2-4个,更优选3个)8碱基对直接重复模块(ACAATTAC)和1-5个(优选1-3个,更优选1个)(CAA)p模块,其中,p为6-12个,较佳地,8-10个。这两个模块对于Ω序列的增强翻译功能是关键。在本发明的酵母体外蛋白质合成体系中,Ω序列能够起始“帽子结构”非依赖性的蛋白质翻译,这种功能可能是通过招募翻译起始因子eIF4G实现的。但是Ω序列起始蛋白质翻译的效率比较低,需要对其构成进行优化,并配合其他DNA元件或者蛋白质来提高蛋白质翻译的效率。
Kozak序列
通过对已知的真核生物的mRNA分子中翻译起始密码子(AUG)上下游序列进行分析,找出的共有序列被称为Kozak序列。Kozak序列被证实能够增强mRNA的翻译起始效率。不同物种的Kozak序列是不相同的,如酿酒酵母细胞(Saccharomyces cerevisiae)与哺乳动物细胞的Kozak序列就存在着显著差异。
在本发明中,所用的Kozak序列包括6-12个腺嘌呤脱氧核苷寡聚链(较佳地,8-10)、翻译起始密码子(如ATG、ATA、ATT、GTG、TTG等,优选ATG)和丝氨酸密码子(如TCT、TCC、TCA、TCG、AGT、AGC等,优选TCT),来源于克鲁维酵母(优选乳酸克鲁维酵母)。
外源编码序列(外源DNA)
如本文所用,术语“外源编码序列”与“外源DNA”可互换使用,均指外源的用于指导RNA或者蛋白质合成的DNA分子。通常,所述的DNA分子为线性的或环状的。所述的DNA分子含有编码外源RNA或者外源蛋白的序列。
在本发明中,所述的外源编码序列包括但并不限于:基因组序列、cDNA序列。所述的外源编码序列还含有启动子序列、5′非翻译序列、3′非翻译序列。
本发明中,所述外源DNA的选择没有特别限制,通常,外源DNA选自下组:小非编码RNA(small non-coding RNA,sncRNA)、长非编码RNA(long non-coding RNA,lncRNA)、转运RNA(transfer RNA,tRNA)、葡萄糖胺-6-磷酸合成酶(Glucosamine-6-phosphatesynthase,glmS)等核酶、小的核RNA(small nuclear RNA,snRNA)、剪接体(spliceosome)等RNA与蛋白质的复合物、其他各种非编码RNA、或其组合。
外源DNA还可选自下组:编码荧光素蛋白或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域的外源DNA、萤光素酶突变体的DNA、或其组合。
外源DNA还可以选自下组:编码α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶的外源DNA、或其组合。
在一优选实施方式中,所述外源DNA编码选自下组的蛋白:绿色荧光蛋白(enhanced GFP,eGFP)、黄色荧光蛋白(YFP)、大肠杆菌β-半乳糖苷酶(β-galactosidase,LacZ)、人赖氨酸-tRNA合成酶(Lysine-tRNA synthetase)、人亮氨酸-tRNA合成酶(Leucine-tRNA synthetase)、拟南芥甘油醛3-磷酸脱氢酶(Glyceraldehyde-3-phosphatedehydrogenase)、鼠过氧化氢酶(Catalase)、或其组合。
核酸构建物
本发明提供了一种核酸构建物,所述核酸构建物具有5'-3'的式A所示的结构:
Z1-Z2-Y1-Z3-Z4-Y2-Z5 (A)
式中,
Z1为启动子元件;
Z2和Z4为环化元件,其中环化元件Z2和Z4通过RNA-RNA直接作用使对应于式A的mRNA转录产物形成一环化结构,并且所述环化元件选自下组:TED、BTE、PTE、I型结构元件、Y型结构元件、T型结构元件、其他能够形成RNA-RNA直接作用的元件、或其组合;
Y1为无或“Z6-Z7-Z8”所示的元件;
Z3为外源蛋白的编码序列;
Y2为无或Z9;
Z5为终止子元件;
Z6为无或增强子元件;
Z7为无或烟草花叶病毒的5'端前导序列(leading sequence)-Ω序列;
Z8为无或Kozak序列;
Z9为腺嘌呤脱氧核糖核酸的多聚链;
各“-”独立地为键或核苷酸连接序列。
在一优选实施方式中,本发明的所述的构建物具有从5′至3′的式I结构:
Z1-Z2-Z3-Z4-Z5 (I)
式中,
Z1-Z4和Z5分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为启动子元件,优选地所述启动子元件选自下组:T7启动子、T3启动子、SP6启动子、或其组合;
Z4和Z2为环化元件,优选地所述环化元件选自下组:TED、BTE、PTE、I型结构元件、Y型结构元件、T型结构元件、其他能够形成RNA-RNA直接作用的元件、或其组合;
Z3为外源蛋白的编码序列;
Z5为终止子元件,优选地所述终止子元件选自下组:T7终止子、T3终止子、SP6终止子、或其组合。
在另一优选实施方式中,本发明的核酸构建物含有结构如式II所示的核酸序列:
Z1-Z2-Z6-Z7-Z8-Z3-Z4-Z9-Z5 (II)
式中,
Z1-Z9分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为启动子元件,优选地,所述启动子元件选自下组:T7启动子、T3启动子、SP6启动子、或其组合;
Z4和Z2为环化元件,优选地,所述环化元件选自下组:TED、BTE、PTE、I型结构元件、Y型结构元件、T型结构元件、其他能够形成RNA-RNA直接作用的元件、或其组合;
Z6为增强子元件,优选地,所述增强子元件包括IRES元件;
Z7为烟草花叶病毒的5'端前导序列(leading sequence)-Ω序列;
Z8为Kozak序列,优选地,所述Kozak序列来源于酵母;
Z3为外源蛋白的编码序列;
Z9为腺嘌呤脱氧核糖核酸的多聚链[poly(A)],优选地,所述多聚链选自下组:50A、70A、90A、或其组合;
Z5为终止子元件,优选地,所述终止子元件选自下组:T7终止子、T3终止子、SP6终止子、或其组合。
在本发明中,所述外源蛋白的编码序列的选择没有特别限制,通常,外源蛋白的编码序列选自下组:编码荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域的外源DNA、萤光素酶突变体的DNA。
外源蛋白的编码序列还可以编码选自下组的蛋白:α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶。
此外,本发明的所述核酸构建物可以是线性的,也可以是环状的。本发明的所述核酸构建物可以是单链的,也可以是双链的。本发明的所述核酸构建物可以是DNA,也可以是RNA,或DNA/RNA杂合。
在一优选实施方式中,本发明的核酸构建物的序列如SEQ ID NO.:2-13及SEQ IDNO.:51-53所示。在另一优选例中,所述的构建物还包括选自下组的元件或其组合:poly(A)元件、转运元件、基因靶向元件、筛选标记基因、增强子、抗性基因、转座酶编码基因。
多种选择性标志基因均可应用于本发明,包括但不限于:营养缺陷型标记,抗性标记,报告基因标记。选择性标志的应用对于重组细胞(重组子)的筛选起到作用,使得受体细胞能够与未转化的细胞进行显著区分。营养缺陷型标记是通过转入的标记基因与受体细胞突变基因互补,从而使受体细胞表现野生型生长。抗性标记是指将抗性基因转入受体细胞中,转入的基因使受体细胞在一定的药物浓度下表现抗药性。作为本发明的优选方式,应用抗性标记来实现重组细胞的便捷筛选。
在本发明中,在本发明的酵母体外生物合成体系(如酵母蛋白生物合成体系)中应用本发明的核酸构建物,可显著提高外源蛋白翻译的效率,其中,在一优选实施方式中,本发明的核酸构建物(如pD2P-1.0C008)合成的荧光素酶的相对光单位值是pD2P-1.0序列的2.8倍,本发明的pD2P-1.1C003合成的绿色荧光蛋白的RLU是pD2P-1.1序列的1.8倍。
载体,基因工程细胞
本发明还提供了一种载体或载体组合,所述载体含有本发明的核酸构建物。优选地,所述载体选自:细菌质粒、噬菌体、酵母质粒、或动物细胞载体、穿梭载体;所述的载体为转座子载体。用于制备重组载体的方法是本领域普通技术人员所熟知的。只要其能够在宿主体内复制和稳定,任何质粒和载体都是可以被采用的。
本领域普通技术人员可以使用熟知的方法构建含有本发明所述的启动子和/或目的基因序列的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。
本发明还提供了一种基因工程细胞,所述的基因工程细胞含有所述的核酸构建物或载体或载体组合,或所述的基因工程细胞染色体整合有所述的核酸构建物或载体。
在另一优选例中,所述的基因工程细胞还包括含有编码转座酶基因的载体或其染色体上整合有转座酶基因。
优选地,所述的基因工程细胞为真核细胞。
在另一优选例中,所述真核细胞,包括但不限于:人体细胞、中国仓鼠卵巢细胞、昆虫细胞、麦胚细胞、兔网织红细胞等高等真核生物细胞。
在另一优选例中,所述真核细胞,包括但不限于:酵母细胞,优选克鲁维酵母细胞,更优选乳酸克鲁维酵母细胞。
本发明的构建物或载体,可以用于转化适当的基因工程细胞。基因工程细胞可以是原核细胞,如大肠杆菌,链霉菌属、农杆菌:或是低等真核细胞,如酵母细胞;或是高等动物细胞,如昆虫细胞。本领域一般技术人员都清楚如何选择适当的载体和基因工程细胞。用重组DNA转化基因工程细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物时,如大肠杆菌,可以用CaCl2法处理,也可用电穿孔法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法,包括显微注射、电穿孔、脂质体包装等。转化植物也可使用农杆菌转化或基因枪转化等方法,例如叶盘法、幼胚转化法、花芽浸泡法等。
调控体外蛋白合成的方法
本发明提供了一种调控体外蛋白合成的方法,包括步骤:
(i)在真核体外生物合成体系存在下,提供本发明第一方面所述的核酸构建物;
(ii)在适合条件下,孵育步骤(i)的真核体外生物合成体系一段时间T1,从而合成所述外源蛋白。
所述的步骤(ii)所述的适合条件为:反应温度20-37℃,较佳地,22-35℃,反应时间为1h-72h,较佳地,2-23h,通过振荡、翻滚、旋转、搅拌、摇匀、翻转或其他方式持续混匀反应,或者混匀后静置反应。
在另一优选例中,所述方法还包括步骤(iii)从所述真核体外生物合成体系中分离或检测所述外源蛋白。
试剂盒
本发明提供了用于外源蛋白合成的试剂盒,包括:
(k1)第一容器,以及位于第一容器内的本发明第一方面所述的核酸构建物;
(k2)第二容器,以及位于第二容器内的酵母细胞提取物。在一优选实施方式中,所述的第一容器、第二容器是同一容器或不同容器。
一种特别优选的体外外源蛋白合成的试剂盒包含一个体外外源蛋白合成体系,该合成体系包括:酵母细胞提取物,本发明的的核酸构建物以及其他合适的试剂。所述合适的试剂包括(但并不限于):10-50mM(如22mM),pH为7.4的4-羟乙基哌嗪乙磺酸,30-150mM醋酸钾,1.0-5.0mM醋酸镁,1.5-4mM核苷三磷酸混合物,0.08-0.24mM的氨基酸混合物,25mM磷酸肌酸,1.7mM二硫苏糖醇,0.27mg/mL磷酸肌酸激酶,1%-4%聚乙二醇,0.5%-2%蔗糖,,0.027-0.054mg/mL T7RNA聚合酶。
本发明的主要优点包括:
(1)本发明首次发现,将任选的启动子、环化元件(如植物病毒的3'CITE和其对应的5'发夹结构)、任选的Ω序列、任选的Kozak序列和外源蛋白的编码序列作为核酸构建物,应用于本发明的真核体外生物合成体系(如酵母体外蛋白合成体系)中,可显著提高外源蛋白翻译的效率。
(2)本发明对mRNA的5'UTR和3'UTR插入能够相互作用的RNA元件从而使mRNA形成比较稳定的环状结构,还能够利用两端的发夹结构增强mRNA的稳定性,同时还能够与5'UTR上的招募翻译起始因子的RNA元件以及3'UTR上的poly(A)结构产生协同效应,增强真核体外生物合成体系的蛋白质翻译起始效率。含有3'CITE与5'发夹结构的质粒在酵母体外蛋白质合成体系中引起萤火虫荧光素酶(Firefly luciferase,简称Fluc,下同)发出的相对光单位值(Relative Light Units,简称RLU,下同)超过5'单独Ω序列的质粒。其中,pD2P-1.0C008在乳酸克鲁维酵母体外生物合成体系中起始合成的Fluc的RLU达到了4.44×108,是pD2P-1.0序列的2.8倍(pD2P-1.0序列的RLU为1.58×108)。pD2P-1.1C003在乳酸克鲁维酵母体外生物合成体系中起始合成的绿色荧光蛋白(简称,eGFP,下同)的相对荧光单位值(简称,RFU,下同)达到了472,是pD2P-1.1序列的1.8倍(pD2P-1.1序列的RFU为267)。
(3)与酿酒酵母相比,乳酸克鲁维酵母因其安全性和高效性可以被应用于食品和药品领域蛋白质的生产,加上体外生物合成体系的优点,如适应于高通量的蛋白质合成筛选,合成毒性蛋白质和时间短成本低等,所以乳酸克鲁维酵母细胞来源的体外生物合成体系在蛋白质合成相关领域也能够得到广泛的应用。
(4)本发明提供的核酸构建物不仅能够提高真核体外生物合成体系蛋白质翻译合成的效率,更主要的是能够增加乳酸克鲁维酵母体外生物合成体系用于不同蛋白质合成的可能性。
(5)本发明的核酸构建物不仅提高了蛋白质翻译合成的效率,而且提供了一种设计用于真核体外生物合成体系的DNA元件的新思路与新方法,能够极大的提高相关体系在科研和工业生产领域的应用。
(6)本发明首次发现,将强启动子(如T7启动子、T3启动子、SP6启动子)与本发明的核酸构建物组合,也可获得非常高的蛋白合成效率。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
如无特别说明,则本发明实施例中所用的材料和试剂均为市售产品。
实施例1植物病毒来源的3'非依赖帽子结构的翻译增强子CITE和相互作用的对应5'UTR的设计
1.1构建4个质粒:3'UTR中的非依赖帽子结构的翻译增强子(cap-independenttranslation enhancers,简称CITE)在功能上可以有效替代5'帽子结构的功能,使得核糖体由mRNA的5'端进入和扫描。不同类型的3'CITE(表1)能够不同程度上促进起始体外蛋白质合成。含有3'CITE编码序列和报告蛋白(优选Fluc)基因的质粒设计:将上述4个3'CITE编码序列插入已有的质粒pD2P-1.0质粒(获自康码(上海)生物科技有限公司,其序列如SEQID NO.:1所示)的3'UTR中,形成4个新的质粒,分别为pD2P-1.0C001、pD2P-1.0C002、pD2P-1.0C003、pD2P-1.0C004,其中有1个质粒pD2P-1.0C002起始合成的Fluc的RLU非常显著性地(p<0.01)高于模板上仅使用传统的Ω序列的原模板PC(positive control),其他3个质粒则与原PC模板没有显著性差异(p>0.05)(图2)。4种质粒模板序列如SEQ ID NO.:2-5所示。
1.2构建8个质粒:在添加了3'CITE编码序列的4个质粒模板上,进一步在5'端添加其对应的位于5'UTR的发夹结构的编码序列。在改变5'发夹结构(表1)编码序列()与原来5'Ω序列的上下游顺序后,共有8种质粒模板的设计(pD2P-1.0C005;pD2P-1.0C006、pD2P-1.0C007、pD2P-1.0C008和pD2P-1.0C009、pD2P-1.0C010、pD2P-1.0C011、pD2P-1.0C012)。8种质粒模板序列如SEQ ID NO.:6-13所示,与上述质粒的顺序一一对应。
1.3构建3个质粒:在进一步验证Fluc的实验结果的基础上,以加入环化元件并具有增益效果的pD2P-1.0C006,pD2P-1.0C007和pD2P-1.0C008为克隆载体的模板,将其编码蛋白序列由Fluc替换为eGFP后,对应得到了pD2P-1.1C001,pD2P-1.1C002和pD2P-1.1C003三个质粒,序列如SEQ ID NO.:51-53所示。
将构建质粒转化感受态细胞过夜培养,挑取6个单克隆进行扩大培养后,进行测序确认正确后,提取质粒保存。
表1.3'CITE与相应5'序列信息
实施例2:含有3'CITE编码序列和其对应的5'发夹结构编码序列的体外蛋白质合成体系质粒的构建
2.1质粒的构建:构建1.1所述4个质粒所具体使用的引物如表2所示,1.2所述8个质粒所具体使用的引物如表3所示,1.3所述3个质粒所具体使用的引物如表4所示。
具体构建过程如下:
对于待插入的3'CITE片段,以pD2P-1.0(SEQ ID NO.:1)或pD2P-1.1(SEQ ID NO.:50)为载体质粒。对于待插入的5'发夹结构片段,则分别使用已插入3'CITE的质粒为其各自对应的载体质粒。对于待插入片段和载体分别使用两对引物进行PCR扩增,并各取10μL扩增产物进行混合;向20μL扩增产物中加入1μL Dpn I,37℃孵育6h;将DpnI处理后产物4μL加入50μL DH5α感受态细胞中,冰上放置30min,42℃热激45s后,冰上放置3min,加入200μL LB液体培养基37℃振荡培养4h,涂布于含有Amp抗生素的LB固体培养基上过夜培养;挑取6个单克隆进行扩大培养后,进行测序确认正确后,提取质粒保存。
表2.3'CITE质粒的PCR扩增引物
表3.5'发夹结构质粒的PCR扩增引物
表4.eGFP质粒的PCR扩增引物
实施例3:3'CITE和相应5'UTR组件在酵母体外蛋白质合成体系中的应用
3.1实验设计:使用不含有3'CITE和/或5'发夹结构编码序列的DNA片段pD2P-1.0(Fluc为外源蛋白)或pD2P-1.1(eGFP为外源蛋白)或作为阳性对照,以不加任何DNA模板的反应组为阴性对照(Negative control,NC),每个样品均设计三组独立实验。
3.2PCR扩增:利用PCR的方法,并使用引物T7_pET21a_F:CGCGAAATTAATACGACTCACTATAGG(SEQ ID NO.:60)和T7ter_pET21a_R:TCCGGATATAGTTCCTCCTTTCAG(SEQ ID NO.:61)将所有质粒中位于T7转录起始序列和终止序列之间包含串联DNA元件与外源蛋白基因的片段进行扩增。
3.3纯化:并将扩增得到的DNA片段用乙醇沉淀的方法进行纯化和富集:向PCR产物中加入1/10体积的3M醋酸钠(pH 5.2),然后再加入2.5-3倍体积(该体积为加入醋酸钠之后的体积)的95%的乙醇,置于冰上孵育15min;室温条件下以高于14000g的速度离心30min,弃掉上清;使用70%乙醇进行清洗,然后再以同样速度离心15min,弃掉上清,并用超纯水将沉淀溶解,测定DNA浓度。
3.4孵育和检测:按照使用说明,将纯化的DNA片段加入到自制的乳酸克鲁维酵母体外蛋白质合成体系中。并将上述反应体系置于20-30℃的环境中,静置孵育约2-8h。
对于以Fluc为外源蛋白的体系,反应结束后,在96孔白色微孔板或者384孔白色微孔板中加入等体积的Fluc底物荧光素(luciferin),立即放置于Envision2120多功能酶标仪(Perkin Elmer),读数,检测Fluc活性,以RLU作为活性参考值,如图2、图3所示。
对于以绿色荧光蛋白为外源蛋白的体系,反应结束后,在96孔黑板或384孔黑板中加入10μL反应体系溶液,立即放置于Tecan 2000多功能酶标仪,读数,检测绿色荧光蛋白活性,以RFU作为活性参考值,如图4所示。
3.5实验结果:
(1)含有植物病毒来源的3'CITE与5'发夹结构的质粒的设计
将4种不同3'CITE编码序列插入pD2P-1.0质粒的3'UTR,得到四种质粒模板,将4种不同5'发夹结构编码序列插入上述四种质粒模板的Ω前端或者后端,一共形成12个用于体外蛋白质合成的质粒,质粒的设计所采用的方法见实施例1。
构建3个质粒:在进一步验证Fluc的实验结果的基础上,以加入环化元件并具有增益效果的pD2P-1.0C006,pD2P-1.0C007和pD2P-1.0C008为克隆载体的模板,将其编码蛋白序列由Fluc替换为eGFP后,对应得到了pD2P-1.1C001,pD2P-1.1C002和pD2P-1.1C003三个质粒,序列如SEQ ID NO.:51-53所示。
(2)含有植物病毒来源的3'CITE编码序列与5'发夹结构编码序列的质粒的构建
经过多次尝试,经基因测序确认,最终构建成功所有15个体外蛋白质合成体系质粒。
(3)3'CITE与5'发夹结构元件在酵母体外蛋白质合成体系中的应用
如图2和图3所示,筛选的12个含有3'CITE编码序列与5'发夹结构编码序列的质粒在酵母体外蛋白质合成体系中引起Fluc发出的RLU有4个非常显著性(p<0.01)地超过改造前pD2P-1.0序列,即pD2P-1.0C002、pD2P-1.0C006、pD2P-1.0C007和pD2P-1.0C008,其RLU分别达到了2.14×108、2.60×108、4.06×108和4.44×108,分别是pD2P-1.0序列的1.4倍、1.7倍、2.6倍、和2.8倍(pD2P-1.0序列的RLU为1.57×108)。另外有3个改造后质粒的RLU非常显著地低于pD2P-1.0序列的RLU,分别为pD2P-1.0C005、pD2P-1.0C009、pD2P-1.0C010。其余两个质粒pD2P-1.0C011和pD2P-1.0C012的RLU与改造前的pD2P-1.0没有显著性差异(p>0.05)。
因为处于检测仪器的RLU与蛋白质浓度关系的线性范围内,活性最高的pD2P-1.0C008的RLU是pD2P-1.0质粒的2.8倍,表明本例中含有3'CITE编码序列与5'发夹结构编码序列的质粒能够提高大约2.8倍的荧光素酶合成。
如图4所示,验证5'和3'端环化元件的增益效果的三个质粒在酵母体外蛋白质合成体系中引起绿色荧光蛋白(eGFP)发出的RFU有3个非常显著性(p<0.01)地超过改造前pD2P-1.1序列,pD2P-1.1C001,pD2P-1.1C002和pD2P-1.1C003的RFU分别达到了398.33,386.33和472,分别是pD2P-1.1序列的1.5倍、1.4倍和1.8倍(pD2P-1.1序列的RFU为267.33)。
因为处于检测仪器相对荧光单位值RFU与蛋白质浓度关系的线性范围内,活性最高的pD2P-1.1C003的RFU是pD2P-1.1质粒的1.8倍,表明本例中含有3'CITE编码序列与5'发夹结构编码序列的质粒能够提高大约1.8倍的绿色荧光蛋白质合成。
在本发明中,通过采用特殊设计的式A(或式I或II)所示的核酸构建物,可以高效地使得mRNA转录产物形成稳定的环状结构。
本发明的上述实验结果表明:本发明将3'CITE与5'发夹结构添加到mRNA的两端能够提高蛋白质合成效率,两者能够通过RNA-RNA相互作用直接将RNA环化,新形成的crRNA能够使翻译结束的核糖体可以不经解离,直接重新到达RNA的5'端(如图5)。
此外,稳定的环状结构还能够阻止RNA酶对RNA的降解,提高稳定性,进一步提高蛋白质合成的效率。该设计能够应用于酵母体外蛋白质合成体系中,起始蛋白质合成的效率能够超过常用的Ω序列加上90A的尾巴的模板质粒。其中pD2P-1.0C008起始蛋白质合成的量是pD2P-1.0序列的2.8倍,其中pD2P-1.1C003起始蛋白质合成的量是pD2P-1.1序列的1.8倍,提高了酵母体外蛋白质合成体系翻译蛋白质的效率,增加了乳酸克鲁维酵母体外合成体系进行蛋白质合成起始翻译元件的选择性,极大增强了乳酸克鲁维酵母体外蛋白质合成体系的可用性。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
参考文献
1.Sonenberg&Hinnebusch.,Regulation of translation initiation ineukaryotes:mechanisms and biological targets.Cell,2009.136(4):731-45.
2.Dever et al.,Mechanism and Regulation of Protein Synthesis inSaccharomyces cerevisiae.Genetics,2016.203(1):65-107.
3.M.,D.J.R.G.,Nucleic Acid.Encyclopedia of Cell Biology.Elsevier,2015.
4.Wells et al.,Circularization of mRNA by eukaryotic translationinitiation factors.Mol.Cell,1998.2:135–140.
5.Ogawa et al.,Identification of short untranslated regions thatsufficiently enhance translation in high-quality wheat germextract.Bioorganic&Medicinal Chemistry Letters,2014.24(16):3724-3727.
6.Komar,A.A.,and Hatzoglou,M.Cellular IRES-mediated translation:thewar of ITAFs in pathophysiological states.Cell cycle,2011.10:229-240.
7.Lee,K.M.,et al.Regulation Mechanisms of Viral IRES-DrivenTranslation.Trends in microbiology,2017.
8.Simon&Miller.,3'Cap-Independent translation enhancers of plantviruses.Annu Rev Microbiol,2013.67:21-42.
9.Roux&Topisirovic.,Regulation of mRNA translation by signalingpathways.Cold Spring Harb Perspect Biol,2012.4(11):843-853.
10.Muhlrad,D.,C.J.Decker,and R.Parker.1995.Turnover mechanisms of thestable yeast PGKl mRNA.Molecular&Cellular Biology 15(4):2145-2156.
11.Anderson,J.S.J.and R.P.Parker.1998.The 3'to 5'degradation of yeastmRNAs is a general mechanism for mRNA turnover that requires the SKJ2 DEVHbox protein and 3'to 5'exonucleases of the exosome complex.EMBO Journal17(5):1497-1506.
序列表
<110> 康码(上海)生物科技有限公司
<120> 一种核酸构建物及其调控蛋白合成的方法
<130> P2018-1188
<141> 2018-07-19
<160> 61
<170> SIPOSequenceListing 1.0
<210> 1
<211> 2043
<212> DNA
<213> 人工序列(artificial sequence)
<400> 1
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacaaaaa aaaaaaatgt ctgaagacgc 120
caaaaacata aagaaaggcc cggcgccatt ctatcctcta gaggatggaa ccgctggaga 180
gcaactgcat aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga 240
tgcacatatc gaggtgaaca tcacgtacgc ggaatacttc gaaatgtccg ttcggttggc 300
agaagctatg aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa 360
ctctcttcaa ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc 420
cgcgaacgac atttataatg aacgtgaatt gctcaacagt atgaacattt cgcagcctac 480
cgtagtgttt gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaaattacc 540
aataatccag aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat 600
gtacacgttc gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtaccaga 660
gtcctttgat cgtgacaaaa caattgcact gataatgaat tcctctggat ctactgggtt 720
acctaagggt gtggcccttc cgcatagaac tgcctgcgtc agattctcgc atgccagaga 780
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 840
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 900
aatgtataga tttgaagaag agctgttttt acgatccctt caggattaca aaattcaaag 960
tgcgttgcta gtaccaaccc tattttcatt cttcgccaaa agcactctga ttgacaaata 1020
cgatttatct aatttacacg aaattgcttc tgggggcgca cctctttcga aagaagtcgg 1080
ggaagcggtt gcaaaacgct tccatcttcc agggatacga caaggatatg ggctcactga 1140
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 1200
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 1260
taatcagaga ggcgaattat gtgtcagagg acctatgatt atgtccggtt atgtaaacaa 1320
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 1380
ttactgggac gaagacgaac acttcttcat agttgaccgc ttgaagtctt taattaaata 1440
caaaggatat caggtggccc ccgctgaatt ggaatcgata ttgttacaac accccaacat 1500
cttcgacgcg ggcgtggcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 1560
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 1620
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 1680
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 1740
gggcggaaag tccaaattgg tttaaataag gattaattac ttggatgcca ataaaaaaaa 1800
aaaagcgaca tagccaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaactcga gcaccaccac 1920
caccaccact gagatccggc tgctaacaaa gcccgaaagg aagctgagtt ggctgctgcc 1980
accgctgagc aataactagc ataacccctt ggggcctcta aacgggtctt gaggggtttt 2040
ttg 2043
<210> 2
<211> 2040
<212> DNA
<213> 人工序列(artificial sequence)
<400> 2
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacaaaaa aaaaaaatgt ctgaagacgc 120
caaaaacata aagaaaggcc cggcgccatt ctatcctcta gaggatggaa ccgctggaga 180
gcaactgcat aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga 240
tgcacatatc gaggtgaaca tcacgtacgc ggaatacttc gaaatgtccg ttcggttggc 300
agaagctatg aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa 360
ctctcttcaa ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc 420
cgcgaacgac atttataatg aacgtgaatt gctcaacagt atgaacattt cgcagcctac 480
cgtagtgttt gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaaattacc 540
aataatccag aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat 600
gtacacgttc gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtaccaga 660
gtcctttgat cgtgacaaaa caattgcact gataatgaat tcctctggat ctactgggtt 720
acctaagggt gtggcccttc cgcatagaac tgcctgcgtc agattctcgc atgccagaga 780
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 840
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 900
aatgtataga tttgaagaag agctgttttt acgatccctt caggattaca aaattcaaag 960
tgcgttgcta gtaccaaccc tattttcatt cttcgccaaa agcactctga ttgacaaata 1020
cgatttatct aatttacacg aaattgcttc tgggggcgca cctctttcga aagaagtcgg 1080
ggaagcggtt gcaaaacgct tccatcttcc agggatacga caaggatatg ggctcactga 1140
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 1200
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 1260
taatcagaga ggcgaattat gtgtcagagg acctatgatt atgtccggtt atgtaaacaa 1320
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 1380
ttactgggac gaagacgaac acttcttcat agttgaccgc ttgaagtctt taattaaata 1440
caaaggatat caggtggccc ccgctgaatt ggaatcgata ttgttacaac accccaacat 1500
cttcgacgcg ggcgtggcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 1560
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 1620
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 1680
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 1740
gggcggaaag tccaaattgg tttaaataag gattaattag gttgggacgc aggtgtcgga 1800
gggatcgcca gccctcagga tagtgagctc ccgcagaggg ataagctatc tccctgcgac 1860
cttggatgcc aataaaaaaa aaaaagcgac atagccaaaa aaaaaaaaaa aaaaaaaaaa 1920
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1980
aaaaaactcg agctagcata accccttggg gcctctaaac gggtcttgag gggttttttg 2040
<210> 3
<211> 2132
<212> DNA
<213> 人工序列(artificial sequence)
<400> 3
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacaaaaa aaaaaaatgt ctgaagacgc 120
caaaaacata aagaaaggcc cggcgccatt ctatcctcta gaggatggaa ccgctggaga 180
gcaactgcat aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga 240
tgcacatatc gaggtgaaca tcacgtacgc ggaatacttc gaaatgtccg ttcggttggc 300
agaagctatg aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa 360
ctctcttcaa ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc 420
cgcgaacgac atttataatg aacgtgaatt gctcaacagt atgaacattt cgcagcctac 480
cgtagtgttt gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaaattacc 540
aataatccag aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat 600
gtacacgttc gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtaccaga 660
gtcctttgat cgtgacaaaa caattgcact gataatgaat tcctctggat ctactgggtt 720
acctaagggt gtggcccttc cgcatagaac tgcctgcgtc agattctcgc atgccagaga 780
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 840
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 900
aatgtataga tttgaagaag agctgttttt acgatccctt caggattaca aaattcaaag 960
tgcgttgcta gtaccaaccc tattttcatt cttcgccaaa agcactctga ttgacaaata 1020
cgatttatct aatttacacg aaattgcttc tgggggcgca cctctttcga aagaagtcgg 1080
ggaagcggtt gcaaaacgct tccatcttcc agggatacga caaggatatg ggctcactga 1140
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 1200
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 1260
taatcagaga ggcgaattat gtgtcagagg acctatgatt atgtccggtt atgtaaacaa 1320
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 1380
ttactgggac gaagacgaac acttcttcat agttgaccgc ttgaagtctt taattaaata 1440
caaaggatat caggtggccc ccgctgaatt ggaatcgata ttgttacaac accccaacat 1500
cttcgacgcg ggcgtggcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 1560
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 1620
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 1680
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 1740
gggcggaaag tccaaattgg tttaaataag gattaattat cttgttgggt tctggatgtt 1800
aggatgacga gtcgactcgg gctccgcact aggtttggtc gcctagagga tggagatatg 1860
gaaagggtct cgtgtggtat cagtcggtcg aaagacgcgc ttccaacatg ggcctatggt 1920
cggataagtc ttagcaatac cagccagcat gacttggatg ccaataaaaa aaaaaaagcg 1980
acatagccaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2040
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaact cgagctagca taaccccttg 2100
gggcctctaa acgggtcttg aggggttttt tg 2132
<210> 4
<211> 2087
<212> DNA
<213> 人工序列(artificial sequence)
<400> 4
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacaaaaa aaaaaaatgt ctgaagacgc 120
caaaaacata aagaaaggcc cggcgccatt ctatcctcta gaggatggaa ccgctggaga 180
gcaactgcat aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga 240
tgcacatatc gaggtgaaca tcacgtacgc ggaatacttc gaaatgtccg ttcggttggc 300
agaagctatg aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa 360
ctctcttcaa ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc 420
cgcgaacgac atttataatg aacgtgaatt gctcaacagt atgaacattt cgcagcctac 480
cgtagtgttt gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaaattacc 540
aataatccag aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat 600
gtacacgttc gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtaccaga 660
gtcctttgat cgtgacaaaa caattgcact gataatgaat tcctctggat ctactgggtt 720
acctaagggt gtggcccttc cgcatagaac tgcctgcgtc agattctcgc atgccagaga 780
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 840
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 900
aatgtataga tttgaagaag agctgttttt acgatccctt caggattaca aaattcaaag 960
tgcgttgcta gtaccaaccc tattttcatt cttcgccaaa agcactctga ttgacaaata 1020
cgatttatct aatttacacg aaattgcttc tgggggcgca cctctttcga aagaagtcgg 1080
ggaagcggtt gcaaaacgct tccatcttcc agggatacga caaggatatg ggctcactga 1140
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 1200
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 1260
taatcagaga ggcgaattat gtgtcagagg acctatgatt atgtccggtt atgtaaacaa 1320
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 1380
ttactgggac gaagacgaac acttcttcat agttgaccgc ttgaagtctt taattaaata 1440
caaaggatat caggtggccc ccgctgaatt ggaatcgata ttgttacaac accccaacat 1500
cttcgacgcg ggcgtggcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 1560
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 1620
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 1680
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 1740
gggcggaaag tccaaattgg tttaaataag gattaattaa ttgtatgggc ctccgtgctg 1800
ttaggggcag tggaaacgtc ggtctagcca gccgtcccct gggtagtgtg ctccgtctaa 1860
gtacaccact actcggtttc cacaaacgat cggactccca aaatagtctt ggatgccaat 1920
aaaaaaaaaa aagcgacata gccaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1980
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaactcgagc 2040
tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttg 2087
<210> 5
<211> 2019
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacaaaaa aaaaaaatgt ctgaagacgc 120
caaaaacata aagaaaggcc cggcgccatt ctatcctcta gaggatggaa ccgctggaga 180
gcaactgcat aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga 240
tgcacatatc gaggtgaaca tcacgtacgc ggaatacttc gaaatgtccg ttcggttggc 300
agaagctatg aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa 360
ctctcttcaa ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc 420
cgcgaacgac atttataatg aacgtgaatt gctcaacagt atgaacattt cgcagcctac 480
cgtagtgttt gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaaattacc 540
aataatccag aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat 600
gtacacgttc gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtaccaga 660
gtcctttgat cgtgacaaaa caattgcact gataatgaat tcctctggat ctactgggtt 720
acctaagggt gtggcccttc cgcatagaac tgcctgcgtc agattctcgc atgccagaga 780
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 840
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 900
aatgtataga tttgaagaag agctgttttt acgatccctt caggattaca aaattcaaag 960
tgcgttgcta gtaccaaccc tattttcatt cttcgccaaa agcactctga ttgacaaata 1020
cgatttatct aatttacacg aaattgcttc tgggggcgca cctctttcga aagaagtcgg 1080
ggaagcggtt gcaaaacgct tccatcttcc agggatacga caaggatatg ggctcactga 1140
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 1200
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 1260
taatcagaga ggcgaattat gtgtcagagg acctatgatt atgtccggtt atgtaaacaa 1320
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 1380
ttactgggac gaagacgaac acttcttcat agttgaccgc ttgaagtctt taattaaata 1440
caaaggatat caggtggccc ccgctgaatt ggaatcgata ttgttacaac accccaacat 1500
cttcgacgcg ggcgtggcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 1560
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 1620
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 1680
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 1740
gggcggaaag tccaaattgg tttaaataag gattaattac gtagctaccc tcctggtgca 1800
cttcctggtg caaagcagaa ccaagggtac ggtggtacgc ttggatgcca ataaaaaaaa 1860
aaaagcgaca tagccaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaactcga gctagcataa 1980
ccccttgggg cctctaaacg ggtcttgagg ggttttttg 2019
<210> 6
<211> 2190
<212> DNA
<213> 人工序列(artificial sequence)
<400> 6
cgcgaaatta atacgactca ctatagggaa aaatcggtta aaaaaacttt tcttctgggt 60
atttatagag atcagtatga actgtgtcgc taggatcaag cggtggttca cacctgactt 120
cacccctggc gagggcgtga agtctcaaag catacctaat aacaatataa tcccataggt 180
atttttacaa caattaccaa caacaacaaa caacaaacaa cattacaatt actatttaca 240
attacaaaaa aaaaaaatgt ctgaagacgc caaaaacata aagaaaggcc cggcgccatt 300
ctatcctcta gaggatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc 360
cctggttcct ggaacaattg cttttacaga tgcacatatc gaggtgaaca tcacgtacgc 420
ggaatacttc gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac 480
aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg 540
cgcgttattt atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt 600
gctcaacagt atgaacattt cgcagcctac cgtagtgttt gtttccaaaa aggggttgca 660
aaaaattttg aacgtgcaaa aaaaattacc aataatccag aaaattatta tcatggattc 720
taaaacggat taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc 780
cggttttaat gaatacgatt ttgtaccaga gtcctttgat cgtgacaaaa caattgcact 840
gataatgaat tcctctggat ctactgggtt acctaagggt gtggcccttc cgcatagaac 900
tgcctgcgtc agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga 960
tactgcgatt ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg 1020
atatttgata tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgttttt 1080
acgatccctt caggattaca aaattcaaag tgcgttgcta gtaccaaccc tattttcatt 1140
cttcgccaaa agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc 1200
tgggggcgca cctctttcga aagaagtcgg ggaagcggtt gcaaaacgct tccatcttcc 1260
agggatacga caaggatatg ggctcactga gactacatca gctattctga ttacacccga 1320
gggggatgat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt 1380
ggatctggat accgggaaaa cgctgggcgt taatcagaga ggcgaattat gtgtcagagg 1440
acctatgatt atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa 1500
ggatggatgg ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat 1560
agttgaccgc ttgaagtctt taattaaata caaaggatat caggtggccc ccgctgaatt 1620
ggaatcgata ttgttacaac accccaacat cttcgacgcg ggcgtggcag gtcttcccga 1680
cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac 1740
ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg 1800
aggagttgtg tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa 1860
aatcagagag atcctcataa aggccaagaa gggcggaaag tccaaattgg tttaaataag 1920
gattaattag gttgggacgc aggtgtcgga gggatcgcca gccctcagga tagtgagctc 1980
ccgcagaggg ataagctatc tccctgcgac cttggatgcc aataaaaaaa aaaaagcgac 2040
atagccaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2100
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaactcg agctagcata accccttggg 2160
gcctctaaac gggtcttgag gggttttttg 2190
<210> 7
<211> 2271
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
cgcgaaatta atacgactca ctatagggaa aaatcggtta aaaaaacttt tcttctagaa 60
attctccagg atttctcgac ctagttcgtt tatctggtga cttgcgctac cgttgctttg 120
cgtagagaat ttctcaaagc atacctaata acaatataat cccataggta tttttacaac 180
aattaccaac aacaacaaac aacaaacaac attacaatta ctatttacaa ttacaaaaaa 240
aaaaaatgtc tgaagacgcc aaaaacataa agaaaggccc ggcgccattc tatcctctag 300
aggatggaac cgctggagag caactgcata aggctatgaa gagatacgcc ctggttcctg 360
gaacaattgc ttttacagat gcacatatcg aggtgaacat cacgtacgcg gaatacttcg 420
aaatgtccgt tcggttggca gaagctatga aacgatatgg gctgaataca aatcacagaa 480
tcgtcgtatg cagtgaaaac tctcttcaat tctttatgcc ggtgttgggc gcgttattta 540
tcggagttgc agttgcgccc gcgaacgaca tttataatga acgtgaattg ctcaacagta 600
tgaacatttc gcagcctacc gtagtgtttg tttccaaaaa ggggttgcaa aaaattttga 660
acgtgcaaaa aaaattacca ataatccaga aaattattat catggattct aaaacggatt 720
accagggatt tcagtcgatg tacacgttcg tcacatctca tctacctccc ggttttaatg 780
aatacgattt tgtaccagag tcctttgatc gtgacaaaac aattgcactg ataatgaatt 840
cctctggatc tactgggtta cctaagggtg tggcccttcc gcatagaact gcctgcgtca 900
gattctcgca tgccagagat cctatttttg gcaatcaaat cattccggat actgcgattt 960
taagtgttgt tccattccat cacggttttg gaatgtttac tacactcgga tatttgatat 1020
gtggatttcg agtcgtctta atgtatagat ttgaagaaga gctgttttta cgatcccttc 1080
aggattacaa aattcaaagt gcgttgctag taccaaccct attttcattc ttcgccaaaa 1140
gcactctgat tgacaaatac gatttatcta atttacacga aattgcttct gggggcgcac 1200
ctctttcgaa agaagtcggg gaagcggttg caaaacgctt ccatcttcca gggatacgac 1260
aaggatatgg gctcactgag actacatcag ctattctgat tacacccgag ggggatgata 1320
aaccgggcgc ggtcggtaaa gttgttccat tttttgaagc gaaggttgtg gatctggata 1380
ccgggaaaac gctgggcgtt aatcagagag gcgaattatg tgtcagagga cctatgatta 1440
tgtccggtta tgtaaacaat ccggaagcga ccaacgcctt gattgacaag gatggatggc 1500
tacattctgg agacatagct tactgggacg aagacgaaca cttcttcata gttgaccgct 1560
tgaagtcttt aattaaatac aaaggatatc aggtggcccc cgctgaattg gaatcgatat 1620
tgttacaaca ccccaacatc ttcgacgcgg gcgtggcagg tcttcccgac gatgacgccg 1680
gtgaacttcc cgccgccgtt gttgttttgg agcacggaaa gacgatgacg gaaaaagaga 1740
tcgtggatta cgtcgccagt caagtaacaa ccgcgaaaaa gttgcgcgga ggagttgtgt 1800
ttgtggacga agtaccgaaa ggtcttaccg gaaaactcga cgcaagaaaa atcagagaga 1860
tcctcataaa ggccaagaag ggcggaaagt ccaaattggt ttaaataagg attaattatc 1920
ttgttgggtt ctggatgtta ggatgacgag tcgactcggg ctccgcacta ggtttggtcg 1980
cctagaggat ggagatatgg aaagggtctc gtgtggtatc agtcggtcga aagacgcgct 2040
tccaacatgg gcctatggtc ggataagtct tagcaatacc agccagcatg acttggatgc 2100
caataaaaaa aaaaaagcga catagccaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaactc 2220
gagctagcat aaccccttgg ggcctctaaa cgggtcttga ggggtttttt g 2271
<210> 8
<211> 2168
<212> DNA
<213> 人工序列(artificial sequence)
<400> 8
cgcgaaatta atacgactca ctatagggaa aaatcggtta aaaaaacttt tcttctggaa 60
accgtggcaa gtttcccaaa gcatacctaa taacaatata atcccatagg tatttttaca 120
acaattacca acaacaacaa acaacaaaca acattacaat tactatttac aattacaaaa 180
aaaaaaaatg tctgaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatcctct 240
agaggatgga accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc 300
tggaacaatt gcttttacag atgcacatat cgaggtgaac atcacgtacg cggaatactt 360
cgaaatgtcc gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag 420
aatcgtcgta tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt 480
tatcggagtt gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag 540
tatgaacatt tcgcagccta ccgtagtgtt tgtttccaaa aaggggttgc aaaaaatttt 600
gaacgtgcaa aaaaaattac caataatcca gaaaattatt atcatggatt ctaaaacgga 660
ttaccaggga tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa 720
tgaatacgat tttgtaccag agtcctttga tcgtgacaaa acaattgcac tgataatgaa 780
ttcctctgga tctactgggt tacctaaggg tgtggccctt ccgcatagaa ctgcctgcgt 840
cagattctcg catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat 900
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 960
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttt tacgatccct 1020
tcaggattac aaaattcaaa gtgcgttgct agtaccaacc ctattttcat tcttcgccaa 1080
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctgggggcgc 1140
acctctttcg aaagaagtcg gggaagcggt tgcaaaacgc ttccatcttc cagggatacg 1200
acaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1260
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1320
taccgggaaa acgctgggcg ttaatcagag aggcgaatta tgtgtcagag gacctatgat 1380
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 1440
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tagttgaccg 1500
cttgaagtct ttaattaaat acaaaggata tcaggtggcc cccgctgaat tggaatcgat 1560
attgttacaa caccccaaca tcttcgacgc gggcgtggca ggtcttcccg acgatgacgc 1620
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 1680
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 1740
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 1800
gatcctcata aaggccaaga agggcggaaa gtccaaattg gtttaaataa ggattaatta 1860
attgtatggg cctccgtgct gttaggggca gtggaaacgt cggtctagcc agccgtcccc 1920
tgggtagtgt gctccgtcta agtacaccac tactcggttt ccacaaacga tcggactccc 1980
aaaatagtct tggatgccaa taaaaaaaaa aaagcgacat agccaaaaaa aaaaaaaaaa 2040
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2100
aaaaaaaaaa aaaactcgag ctagcataac cccttggggc ctctaaacgg gtcttgaggg 2160
gttttttg 2168
<210> 9
<211> 2102
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
cgcgaaatta atacgactca ctatagggaa aaatcggtta aaaaaacttt tcttctagta 60
aagacaggaa actttactca aagcatacct aataacaata taatcccata ggtattttta 120
caacaattac caacaacaac aaacaacaaa caacattaca attactattt acaattacaa 180
aaaaaaaaaa tgtctgaaga cgccaaaaac ataaagaaag gcccggcgcc attctatcct 240
ctagaggatg gaaccgctgg agagcaactg cataaggcta tgaagagata cgccctggtt 300
cctggaacaa ttgcttttac agatgcacat atcgaggtga acatcacgta cgcggaatac 360
ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa tacaaatcac 420
agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt gggcgcgtta 480
tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga attgctcaac 540
agtatgaaca tttcgcagcc taccgtagtg tttgtttcca aaaaggggtt gcaaaaaatt 600
ttgaacgtgc aaaaaaaatt accaataatc cagaaaatta ttatcatgga ttctaaaacg 660
gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc tcccggtttt 720
aatgaatacg attttgtacc agagtccttt gatcgtgaca aaacaattgc actgataatg 780
aattcctctg gatctactgg gttacctaag ggtgtggccc ttccgcatag aactgcctgc 840
gtcagattct cgcatgccag agatcctatt tttggcaatc aaatcattcc ggatactgcg 900
attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact cggatatttg 960
atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt tttacgatcc 1020
cttcaggatt acaaaattca aagtgcgttg ctagtaccaa ccctattttc attcttcgcc 1080
aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc ttctgggggc 1140
gcacctcttt cgaaagaagt cggggaagcg gttgcaaaac gcttccatct tccagggata 1200
cgacaaggat atgggctcac tgagactaca tcagctattc tgattacacc cgagggggat 1260
gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt tgtggatctg 1320
gataccggga aaacgctggg cgttaatcag agaggcgaat tatgtgtcag aggacctatg 1380
attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga caaggatgga 1440
tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt catagttgac 1500
cgcttgaagt ctttaattaa atacaaagga tatcaggtgg cccccgctga attggaatcg 1560
atattgttac aacaccccaa catcttcgac gcgggcgtgg caggtcttcc cgacgatgac 1620
gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat gacggaaaaa 1680
gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg cggaggagtt 1740
gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag aaaaatcaga 1800
gagatcctca taaaggccaa gaagggcgga aagtccaaat tggtttaaat aaggattaat 1860
tacgtagcta ccctcctggt gcacttcctg gtgcaaagca gaaccaaggg tacggtggta 1920
cgcttggatg ccaataaaaa aaaaaaagcg acatagccaa aaaaaaaaaa aaaaaaaaaa 1980
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2040
aaaaaaaact cgagctagca taaccccttg gggcctctaa acgggtcttg aggggttttt 2100
tg 2102
<210> 10
<211> 2190
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacagaaa aatcggttaa aaaaactttt 120
cttctgggta tttatagaga tcagtatgaa ctgtgtcgct aggatcaagc ggtggttcac 180
acctgacttc acccctggcg agggcgtgaa gtctcaaagc atacctaata acaatataat 240
cccataaaaa aaaaaaatgt ctgaagacgc caaaaacata aagaaaggcc cggcgccatt 300
ctatcctcta gaggatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc 360
cctggttcct ggaacaattg cttttacaga tgcacatatc gaggtgaaca tcacgtacgc 420
ggaatacttc gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac 480
aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg 540
cgcgttattt atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt 600
gctcaacagt atgaacattt cgcagcctac cgtagtgttt gtttccaaaa aggggttgca 660
aaaaattttg aacgtgcaaa aaaaattacc aataatccag aaaattatta tcatggattc 720
taaaacggat taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc 780
cggttttaat gaatacgatt ttgtaccaga gtcctttgat cgtgacaaaa caattgcact 840
gataatgaat tcctctggat ctactgggtt acctaagggt gtggcccttc cgcatagaac 900
tgcctgcgtc agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga 960
tactgcgatt ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg 1020
atatttgata tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgttttt 1080
acgatccctt caggattaca aaattcaaag tgcgttgcta gtaccaaccc tattttcatt 1140
cttcgccaaa agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc 1200
tgggggcgca cctctttcga aagaagtcgg ggaagcggtt gcaaaacgct tccatcttcc 1260
agggatacga caaggatatg ggctcactga gactacatca gctattctga ttacacccga 1320
gggggatgat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt 1380
ggatctggat accgggaaaa cgctgggcgt taatcagaga ggcgaattat gtgtcagagg 1440
acctatgatt atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa 1500
ggatggatgg ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat 1560
agttgaccgc ttgaagtctt taattaaata caaaggatat caggtggccc ccgctgaatt 1620
ggaatcgata ttgttacaac accccaacat cttcgacgcg ggcgtggcag gtcttcccga 1680
cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac 1740
ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg 1800
aggagttgtg tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa 1860
aatcagagag atcctcataa aggccaagaa gggcggaaag tccaaattgg tttaaataag 1920
gattaattag gttgggacgc aggtgtcgga gggatcgcca gccctcagga tagtgagctc 1980
ccgcagaggg ataagctatc tccctgcgac cttggatgcc aataaaaaaa aaaaagcgac 2040
atagccaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2100
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaactcg agctagcata accccttggg 2160
gcctctaaac gggtcttgag gggttttttg 2190
<210> 11
<211> 2271
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacagaaa aatcggttaa aaaaactttt 120
cttctagaaa ttctccagga tttctcgacc tagttcgttt atctggtgac ttgcgctacc 180
gttgctttgc gtagagaatt tctcaaagca tacctaataa caatataatc ccataaaaaa 240
aaaaaatgtc tgaagacgcc aaaaacataa agaaaggccc ggcgccattc tatcctctag 300
aggatggaac cgctggagag caactgcata aggctatgaa gagatacgcc ctggttcctg 360
gaacaattgc ttttacagat gcacatatcg aggtgaacat cacgtacgcg gaatacttcg 420
aaatgtccgt tcggttggca gaagctatga aacgatatgg gctgaataca aatcacagaa 480
tcgtcgtatg cagtgaaaac tctcttcaat tctttatgcc ggtgttgggc gcgttattta 540
tcggagttgc agttgcgccc gcgaacgaca tttataatga acgtgaattg ctcaacagta 600
tgaacatttc gcagcctacc gtagtgtttg tttccaaaaa ggggttgcaa aaaattttga 660
acgtgcaaaa aaaattacca ataatccaga aaattattat catggattct aaaacggatt 720
accagggatt tcagtcgatg tacacgttcg tcacatctca tctacctccc ggttttaatg 780
aatacgattt tgtaccagag tcctttgatc gtgacaaaac aattgcactg ataatgaatt 840
cctctggatc tactgggtta cctaagggtg tggcccttcc gcatagaact gcctgcgtca 900
gattctcgca tgccagagat cctatttttg gcaatcaaat cattccggat actgcgattt 960
taagtgttgt tccattccat cacggttttg gaatgtttac tacactcgga tatttgatat 1020
gtggatttcg agtcgtctta atgtatagat ttgaagaaga gctgttttta cgatcccttc 1080
aggattacaa aattcaaagt gcgttgctag taccaaccct attttcattc ttcgccaaaa 1140
gcactctgat tgacaaatac gatttatcta atttacacga aattgcttct gggggcgcac 1200
ctctttcgaa agaagtcggg gaagcggttg caaaacgctt ccatcttcca gggatacgac 1260
aaggatatgg gctcactgag actacatcag ctattctgat tacacccgag ggggatgata 1320
aaccgggcgc ggtcggtaaa gttgttccat tttttgaagc gaaggttgtg gatctggata 1380
ccgggaaaac gctgggcgtt aatcagagag gcgaattatg tgtcagagga cctatgatta 1440
tgtccggtta tgtaaacaat ccggaagcga ccaacgcctt gattgacaag gatggatggc 1500
tacattctgg agacatagct tactgggacg aagacgaaca cttcttcata gttgaccgct 1560
tgaagtcttt aattaaatac aaaggatatc aggtggcccc cgctgaattg gaatcgatat 1620
tgttacaaca ccccaacatc ttcgacgcgg gcgtggcagg tcttcccgac gatgacgccg 1680
gtgaacttcc cgccgccgtt gttgttttgg agcacggaaa gacgatgacg gaaaaagaga 1740
tcgtggatta cgtcgccagt caagtaacaa ccgcgaaaaa gttgcgcgga ggagttgtgt 1800
ttgtggacga agtaccgaaa ggtcttaccg gaaaactcga cgcaagaaaa atcagagaga 1860
tcctcataaa ggccaagaag ggcggaaagt ccaaattggt ttaaataagg attaattatc 1920
ttgttgggtt ctggatgtta ggatgacgag tcgactcggg ctccgcacta ggtttggtcg 1980
cctagaggat ggagatatgg aaagggtctc gtgtggtatc agtcggtcga aagacgcgct 2040
tccaacatgg gcctatggtc ggataagtct tagcaatacc agccagcatg acttggatgc 2100
caataaaaaa aaaaaagcga catagccaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaactc 2220
gagctagcat aaccccttgg ggcctctaaa cgggtcttga ggggtttttt g 2271
<210> 12
<211> 2168
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacagaaa aatcggttaa aaaaactttt 120
cttctggaaa ccgtggcaag tttcccaaag catacctaat aacaatataa tcccataaaa 180
aaaaaaaatg tctgaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatcctct 240
agaggatgga accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc 300
tggaacaatt gcttttacag atgcacatat cgaggtgaac atcacgtacg cggaatactt 360
cgaaatgtcc gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag 420
aatcgtcgta tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt 480
tatcggagtt gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag 540
tatgaacatt tcgcagccta ccgtagtgtt tgtttccaaa aaggggttgc aaaaaatttt 600
gaacgtgcaa aaaaaattac caataatcca gaaaattatt atcatggatt ctaaaacgga 660
ttaccaggga tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa 720
tgaatacgat tttgtaccag agtcctttga tcgtgacaaa acaattgcac tgataatgaa 780
ttcctctgga tctactgggt tacctaaggg tgtggccctt ccgcatagaa ctgcctgcgt 840
cagattctcg catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat 900
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 960
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttt tacgatccct 1020
tcaggattac aaaattcaaa gtgcgttgct agtaccaacc ctattttcat tcttcgccaa 1080
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctgggggcgc 1140
acctctttcg aaagaagtcg gggaagcggt tgcaaaacgc ttccatcttc cagggatacg 1200
acaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1260
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1320
taccgggaaa acgctgggcg ttaatcagag aggcgaatta tgtgtcagag gacctatgat 1380
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 1440
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tagttgaccg 1500
cttgaagtct ttaattaaat acaaaggata tcaggtggcc cccgctgaat tggaatcgat 1560
attgttacaa caccccaaca tcttcgacgc gggcgtggca ggtcttcccg acgatgacgc 1620
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 1680
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 1740
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 1800
gatcctcata aaggccaaga agggcggaaa gtccaaattg gtttaaataa ggattaatta 1860
attgtatggg cctccgtgct gttaggggca gtggaaacgt cggtctagcc agccgtcccc 1920
tgggtagtgt gctccgtcta agtacaccac tactcggttt ccacaaacga tcggactccc 1980
aaaatagtct tggatgccaa taaaaaaaaa aaagcgacat agccaaaaaa aaaaaaaaaa 2040
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2100
aaaaaaaaaa aaaactcgag ctagcataac cccttggggc ctctaaacgg gtcttgaggg 2160
gttttttg 2168
<210> 13
<211> 2102
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacagaaa aatcggttaa aaaaactttt 120
cttctagtaa agacaggaaa ctttactcaa agcataccta ataacaatat aatcccataa 180
aaaaaaaaaa tgtctgaaga cgccaaaaac ataaagaaag gcccggcgcc attctatcct 240
ctagaggatg gaaccgctgg agagcaactg cataaggcta tgaagagata cgccctggtt 300
cctggaacaa ttgcttttac agatgcacat atcgaggtga acatcacgta cgcggaatac 360
ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa tacaaatcac 420
agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt gggcgcgtta 480
tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga attgctcaac 540
agtatgaaca tttcgcagcc taccgtagtg tttgtttcca aaaaggggtt gcaaaaaatt 600
ttgaacgtgc aaaaaaaatt accaataatc cagaaaatta ttatcatgga ttctaaaacg 660
gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc tcccggtttt 720
aatgaatacg attttgtacc agagtccttt gatcgtgaca aaacaattgc actgataatg 780
aattcctctg gatctactgg gttacctaag ggtgtggccc ttccgcatag aactgcctgc 840
gtcagattct cgcatgccag agatcctatt tttggcaatc aaatcattcc ggatactgcg 900
attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact cggatatttg 960
atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt tttacgatcc 1020
cttcaggatt acaaaattca aagtgcgttg ctagtaccaa ccctattttc attcttcgcc 1080
aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc ttctgggggc 1140
gcacctcttt cgaaagaagt cggggaagcg gttgcaaaac gcttccatct tccagggata 1200
cgacaaggat atgggctcac tgagactaca tcagctattc tgattacacc cgagggggat 1260
gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt tgtggatctg 1320
gataccggga aaacgctggg cgttaatcag agaggcgaat tatgtgtcag aggacctatg 1380
attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga caaggatgga 1440
tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt catagttgac 1500
cgcttgaagt ctttaattaa atacaaagga tatcaggtgg cccccgctga attggaatcg 1560
atattgttac aacaccccaa catcttcgac gcgggcgtgg caggtcttcc cgacgatgac 1620
gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat gacggaaaaa 1680
gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg cggaggagtt 1740
gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag aaaaatcaga 1800
gagatcctca taaaggccaa gaagggcgga aagtccaaat tggtttaaat aaggattaat 1860
tacgtagcta ccctcctggt gcacttcctg gtgcaaagca gaaccaaggg tacggtggta 1920
cgcttggatg ccaataaaaa aaaaaaagcg acatagccaa aaaaaaaaaa aaaaaaaaaa 1980
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2040
aaaaaaaact cgagctagca taaccccttg gggcctctaa acgggtcttg aggggttttt 2100
tg 2102
<210> 14
<211> 53
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
cctgcgtccc aacctaatta atccttattt aaaccaattt ggactttccg ccc 53
<210> 15
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 15
cttggatgcc aataaaaaaa aaaaagcgac atagcc 36
<210> 16
<211> 47
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
ccaaattggt ttaaataagg attaattagg ttgggacgca ggtgtcg 47
<210> 17
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
ggctatgtcg cttttttttt tttattggca tccaaggtcg cagggagata gcttatccc 59
<210> 18
<211> 58
<212> DNA
<213> 人工序列(artificial sequence)
<400> 18
catccagaac ccaacaagat aattaatcct tatttaaacc aatttggact ttccgccc 58
<210> 19
<211> 54
<212> DNA
<213> 人工序列(artificial sequence)
<400> 19
gcaataccag ccagcatgac ttggatgcca ataaaaaaaa aaaagcgaca tagc 54
<210> 20
<211> 57
<212> DNA
<213> 人工序列(artificial sequence)
<400> 20
ccaaattggt ttaaataagg attaattatc ttgttgggtt ctggatgtta ggatgac 57
<210> 21
<211> 41
<212> DNA
<213> 人工序列(artificial sequence)
<400> 21
ggcatccaag tcatgctggc tggtattgct aagacttatc c 41
<210> 22
<211> 53
<212> DNA
<213> 人工序列(artificial sequence)
<400> 22
gaggcccata caattaatta atccttattt aaaccaattt ggactttccg ccc 53
<210> 23
<211> 55
<212> DNA
<213> 人工序列(artificial sequence)
<400> 23
gatcggactc ccaaaatagt cttggatgcc aataaaaaaa aaaaagcgac atagc 55
<210> 24
<211> 51
<212> DNA
<213> 人工序列(artificial sequence)
<400> 24
gtccaaattg gtttaaataa ggattaatta attgtatggg cctccgtgct g 51
<210> 25
<211> 37
<212> DNA
<213> 人工序列(artificial sequence)
<400> 25
ggcatccaag actattttgg gagtccgatc gtttgtg 37
<210> 26
<211> 55
<212> DNA
<213> 人工序列(artificial sequence)
<400> 26
caggagggta gctacgtaat taatccttat ttaaaccaat ttggactttc cgccc 55
<210> 27
<211> 50
<212> DNA
<213> 人工序列(artificial sequence)
<400> 27
gggtacggtg gtacgcttgg atgccaataa aaaaaaaaaa gcgacatagc 50
<210> 28
<211> 41
<212> DNA
<213> 人工序列(artificial sequence)
<400> 28
ggtttaaata aggattaatt acgtagctac cctcctggtg c 41
<210> 29
<211> 35
<212> DNA
<213> 人工序列(artificial sequence)
<400> 29
attggcatcc aagcgtacca ccgtaccctt ggttc 35
<210> 30
<211> 61
<212> DNA
<213> 人工序列(artificial sequence)
<400> 30
agaagaaaag tttttttaac cgatttttcc ctatagtgag tcgtattaat ttcgcgagat 60
c 61
<210> 31
<211> 69
<212> DNA
<213> 人工序列(artificial sequence)
<400> 31
gcatacctaa taacaatata atcccatagg tatttttaca acaattacca acaacaacaa 60
acaacaaac 69
<210> 32
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 32
ctcactatag ggaaaaatcg gttaaaaaaa cttttcttct gggtatttat agagatcag 59
<210> 33
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 33
gtaattgttg taaaaatacc tatgggatta tattgttatt aggtatgctt tgagacttc 59
<210> 34
<211> 57
<212> DNA
<213> 人工序列(artificial sequence)
<400> 34
cgactcacta tagggaaaaa tcggttaaaa aaacttttct tctagaaatt ctccagg 57
<210> 35
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 35
gtaattgttg taaaaatacc tatgggatta tattgttatt aggtatgctt tgagaaatt 59
<210> 36
<211> 51
<212> DNA
<213> 人工序列(artificial sequence)
<400> 36
cgactcacta tagggaaaaa tcggttaaaa aaacttttct tctggaaacc g 51
<210> 37
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 37
gtaattgttg taaaaatacc tatgggatta tattgttatt aggtatgctt tgggaaact 59
<210> 38
<211> 58
<212> DNA
<213> 人工序列(artificial sequence)
<400> 38
gactcactat agggaaaaat cggttaaaaa aacttttctt ctagtaaaga caggaaac 58
<210> 39
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 39
gtaattgttg taaaaatacc tatgggatta tattgttatt aggtatgctt tgagtaaag 59
<210> 40
<211> 61
<212> DNA
<213> 人工序列(artificial sequence)
<400> 40
aaagtttttt taaccgattt ttctgtaatt gtaaatagta attgtaatgt tgtttgttgt 60
t 61
<210> 41
<211> 69
<212> DNA
<213> 人工序列(artificial sequence)
<400> 41
caaagcatac ctaataacaa tataatccca taaaaaaaaa aaatgtctga agacgccaaa 60
aacataaag 69
<210> 42
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 42
cattacaatt actatttaca attacagaaa aatcggttaa aaaaactttt cttctgggt 59
<210> 43
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 43
cagacatttt ttttttttat gggattatat tgttattagg tatgctttga gacttcacg 59
<210> 44
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 44
caacattaca attactattt acaattacag aaaaatcggt taaaaaaact tttcttcta 59
<210> 45
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 45
cagacatttt ttttttttat gggattatat tgttattagg tatgctttga gaaattctc 59
<210> 46
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 46
caacattaca attactattt acaattacag aaaaatcggt taaaaaaact tttcttctg 59
<210> 47
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 47
cagacatttt ttttttttat gggattatat tgttattagg tatgctttgg gaaacttgc 59
<210> 48
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 48
caacattaca attactattt acaattacag aaaaatcggt taaaaaaact tttcttcta 59
<210> 49
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 49
gacatttttt ttttttatgg gattatattg ttattaggta tgctttgagt aaagtttcc 59
<210> 50
<211> 1128
<212> DNA
<213> 人工序列(artificial sequence)
<400> 50
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacaaaaa aaaaaaatgg tgagcaaggg 120
cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg 180
ccacaagttc agcgtgcgcg gcgagggcga gggcgatgcc accaacggca agctgaccct 240
gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct 300
gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt 360
caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atctccttca aggacgacgg 420
cacctacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga 480
gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa 540
cttcaacagc cacaacgtct atatcacggc cgacaagcag aagaacggca tcaaggcgaa 600
cttcaagatc cgccacaacg tcgaggacgg cagcgtgcag ctcgccgacc actaccagca 660
gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca 720
gtccaagctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt 780
gaccgccgcc gggatcactc tcggcatgga cgagctgtac aagtaaataa ggattaatta 840
cttggatgcc aataaaaaaa aaaaagcgac atagccaaaa aaaaaaaaaa aaaaaaaaaa 900
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 960
aaaaaactcg agcaccacca ccaccaccac tgagatccgg ctgctaacaa agcccgaaag 1020
gaagctgagt tggctgctgc caccgctgag caataactag cataacccct tggggcctct 1080
aaacgggtct tgaggggttt tttgctgaaa ggaggaacta tatccgga 1128
<210> 51
<211> 1356
<212> DNA
<213> 人工序列(artificial sequence)
<400> 51
cgcgaaatta atacgactca ctatagggaa aaatcggtta aaaaaacttt tcttctagaa 60
attctccagg atttctcgac ctagttcgtt tatctggtga cttgcgctac cgttgctttg 120
cgtagagaat ttctcaaagc atacctaata acaatataat cccataggta tttttacaac 180
aattaccaac aacaacaaac aacaaacaac attacaatta ctatttacaa ttacaaaaaa 240
aaaaaatggt gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc 300
tggacggcga cgtaaacggc cacaagttca gcgtgcgcgg cgagggcgag ggcgatgcca 360
ccaacggcaa gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc 420
ccaccctcgt gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca 480
tgaagcagca cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca 540
tctccttcaa ggacgacggc acctacaaga cccgcgccga ggtgaagttc gagggcgaca 600
ccctggtgaa ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg 660
ggcacaagct ggagtacaac ttcaacagcc acaacgtcta tatcacggcc gacaagcaga 720
agaacggcat caaggcgaac ttcaagatcc gccacaacgt cgaggacggc agcgtgcagc 780
tcgccgacca ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca 840
accactacct gagcacccag tccaagctga gcaaagaccc caacgagaag cgcgatcaca 900
tggtcctgct ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca 960
agtaaataag gattaattat cttgttgggt tctggatgtt aggatgacga gtcgactcgg 1020
gctccgcact aggtttggtc gcctagagga tggagatatg gaaagggtct cgtgtggtat 1080
cagtcggtcg aaagacgcgc ttccaacatg ggcctatggt cggataagtc ttagcaatac 1140
cagccagcat gacttggatg ccaataaaaa aaaaaaagcg acatagccaa aaaaaaaaaa 1200
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1260
aaaaaaaaaa aaaaaaaact cgagctagca taaccccttg gggcctctaa acgggtcttg 1320
aggggttttt tgctgaaagg aggaactata tccgga 1356
<210> 52
<211> 1253
<212> DNA
<213> 人工序列(artificial sequence)
<400> 52
cgcgaaatta atacgactca ctatagggaa aaatcggtta aaaaaacttt tcttctggaa 60
accgtggcaa gtttcccaaa gcatacctaa taacaatata atcccatagg tatttttaca 120
acaattacca acaacaacaa acaacaaaca acattacaat tactatttac aattacaaaa 180
aaaaaaaatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga 240
gctggacggc gacgtaaacg gccacaagtt cagcgtgcgc ggcgagggcg agggcgatgc 300
caccaacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg 360
gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca 420
catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac 480
catctccttc aaggacgacg gcacctacaa gacccgcgcc gaggtgaagt tcgagggcga 540
caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct 600
ggggcacaag ctggagtaca acttcaacag ccacaacgtc tatatcacgg ccgacaagca 660
gaagaacggc atcaaggcga acttcaagat ccgccacaac gtcgaggacg gcagcgtgca 720
gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga 780
caaccactac ctgagcaccc agtccaagct gagcaaagac cccaacgaga agcgcgatca 840
catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta 900
caagtaaata aggattaatt aattgtatgg gcctccgtgc tgttaggggc agtggaaacg 960
tcggtctagc cagccgtccc ctgggtagtg tgctccgtct aagtacacca ctactcggtt 1020
tccacaaacg atcggactcc caaaatagtc ttggatgcca ataaaaaaaa aaaagcgaca 1080
tagccaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1140
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaactcga gctagcataa ccccttgggg 1200
cctctaaacg ggtcttgagg ggttttttgc tgaaaggagg aactatatcc gga 1253
<210> 53
<211> 1187
<212> DNA
<213> 人工序列(artificial sequence)
<400> 53
cgcgaaatta atacgactca ctatagggaa aaatcggtta aaaaaacttt tcttctagta 60
aagacaggaa actttactca aagcatacct aataacaata taatcccata ggtattttta 120
caacaattac caacaacaac aaacaacaaa caacattaca attactattt acaattacaa 180
aaaaaaaaaa tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc 240
gagctggacg gcgacgtaaa cggccacaag ttcagcgtgc gcggcgaggg cgagggcgat 300
gccaccaacg gcaagctgac cctgaagttc atctgcacca ccggcaagct gcccgtgccc 360
tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg ctaccccgac 420
cacatgaagc agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc 480
accatctcct tcaaggacga cggcacctac aagacccgcg ccgaggtgaa gttcgagggc 540
gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc 600
ctggggcaca agctggagta caacttcaac agccacaacg tctatatcac ggccgacaag 660
cagaagaacg gcatcaaggc gaacttcaag atccgccaca acgtcgagga cggcagcgtg 720
cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt gctgctgccc 780
gacaaccact acctgagcac ccagtccaag ctgagcaaag accccaacga gaagcgcgat 840
cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat ggacgagctg 900
tacaagtaaa taaggattaa ttacgtagct accctcctgg tgcacttcct ggtgcaaagc 960
agaaccaagg gtacggtggt acgcttggat gccaataaaa aaaaaaaagc gacatagcca 1020
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1080
aaaaaaaaaa aaaaaaaaaa aaaaaaaaac tcgagctagc ataacccctt ggggcctcta 1140
aacgggtctt gaggggtttt ttgctgaaag gaggaactat atccgga 1187
<210> 54
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 54
tttttttttt gtaattgtaa atagtaattg taatgttgtt tgttgtttgt tgttgttgg 59
<210> 55
<211> 55
<212> DNA
<213> 人工序列(artificial sequence)
<400> 55
cggcatggac gagctgtaca agtaaataag gattaattat cttgttgggt tctgg 55
<210> 56
<211> 58
<212> DNA
<213> 人工序列(artificial sequence)
<400> 56
caacattaca attactattt acaattacaa aaaaaaaaaa tggtgagcaa gggcgagg 58
<210> 57
<211> 31
<212> DNA
<213> 人工序列(artificial sequence)
<400> 57
ccttatttac ttgtacagct cgtccatgcc g 31
<210> 58
<211> 58
<212> DNA
<213> 人工序列(artificial sequence)
<400> 58
cggcatggac gagctgtaca agtaaataag gattaattaa ttgtatgggc ctccgtgc 58
<210> 59
<211> 59
<212> DNA
<213> 人工序列(artificial sequence)
<400> 59
cggcatggac gagctgtaca agtaaataag gattaattac gtagctaccc tcctggtgc 59
<210> 60
<211> 27
<212> DNA
<213> 人工序列(artificial sequence)
<400> 60
cgcgaaatta atacgactca ctatagg 27
<210> 61
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 61
tccggatata gttcctcctt tcag 24
Claims (12)
1.一种核酸构建物,所述核酸构建物具有5'-3'的式A所示的结构:
Z1-Z2-Y1-Z3-Z4-Y2-Z5 (A)
式中,
Z1为启动子元件;
Z2和Z4为环化元件,其中环化元件Z2和Z4通过RNA-RNA直接作用使对应于式A的mRNA转录产物形成一环化结构,并且所述环化元件选自下组:TED、BTE、PTE、I型结构元件、Y型结构元件、T型结构元件、其他能够形成RNA-RNA直接作用的元件、或其组合;
Y1为无或“Z6-Z7-Z8”所示的元件;
Z3为外源蛋白的编码序列;
Y2为无或Z9;
Z5为终止子元件;
Z6为无或增强子元件;
Z7为无或烟草花叶病毒的5'端前导序列(leading sequence)-Ω序列;
Z8为无或Kozak序列;
Z9为腺嘌呤脱氧核糖核酸的多聚链;
各“-”独立地为键或核苷酸连接序列。
2.一种核酸构建物,其特征在于,所述核酸构建物含有结构如式I所示的核酸序列:
Z1-Z2-Z3-Z4-Z5 (I)
式中,
Z1-Z4分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为启动子元件,较佳地所述启动子元件选自下组:T7启动子、T3启动子、SP6启动子、或其组合;
Z4和Z2为环化元件,并且所述环化元件选自下组:TED、BTE、PTE、I型结构元件、Y型结构元件、T型结构元件、其他能够形成RNA-RNA直接作用的元件、或其组合;
Z3为外源蛋白的编码序列;
Z5为终止子元件,较佳地所述终止子元件选自下组:T7终止子、T3终止子、SP6终止子、或其组合。
3.一种核酸构建物,其特征在于,所述核酸构建物含有结构如式II所示的核酸序列:
Z1-Z2-Z6-Z7-Z8-Z3-Z4-Z9-Z5 (II)
式中,
Z1-Z9分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为启动子元件,所述启动子元件选自下组:T7启动子、T3启动子、SP6启动子、或其组合;
Z4和Z2为环化元件,所述环化元件选自下组:TED、BTE、PTE、I型结构元件、Y型结构元件、T型结构元件、其他能够形成RNA-RNA直接作用的元件、或其组合;
Z6为增强子元件,所述增强子元件包括IRES元件;
Z7为烟草花叶病毒的5'端前导序列(leading sequence)-Ω序列;
Z8为Kozak序;
Z3为外源蛋白的编码序列;
Z9为腺嘌呤脱氧核糖核酸的多聚链[poly(A)],其特征在于,所述多聚链选自下组:50A、70A、90A、或其组合;
Z5为终止子元件,所述终止子元件选自下组:T7终止子、T3终止子、SP6终止子、或其组合。
4.一种体外的外源蛋白合成体系,其特征在于,包括:
(a)权利要求1-3中任一项所述的核酸构建物;和
(b)酵母细胞提取物。
5.一种载体或载体组合,其特征在于,所述的载体或载体组合含有权利要求1-3中任一项所述的核酸构建物。
6.一种基因工程细胞,其特征在于,所述基因工程细胞的基因组的一个或多个位点整合有权利要求1-3任一项所述的核酸构建物,或者所述基因工程细胞中含有权利要求5所述的载体或载体组合。
7.一种试剂盒,其特征在于,所述试剂盒中包含的试剂选自下组中的一种或多种:
(a)权利要求1-3任一所述的构建物;
(b)权利要求5所述的载体或载体组合;
(c)权利要求6所述的基因工程细胞。
8.一种如权利要求1-3任一所述的构建物、权利要求5所述的载体或载体组合、权利要求6所述的基因工程细胞或权利要求7所述的试剂盒的用途,其特征在于,用于进行高通量的体外蛋白质合成。
9.一种体外高通量的外源蛋白的合成方法,其特征在于,包括步骤:
(i)在真核体外生物合成体系存在下,提供权利要求1-3任一所述的核酸构建物;
(ii)在适合的条件下,孵育步骤(i)的真核体外生物合成体系一段时间T1,从而合成所述外源蛋白。
10.如权利要求9所述的方法,其特征在于,所述步骤(ii)中,反应温度为20-37℃,较佳地,22-35℃。
11.如权利要求9所述的方法,其特征在于,所述步骤(ii)中,反应时间为1-72h,较佳地,2-23h。
12.如权利要求9所述的方法,其特征在于,还包括(iii)任选地从所述真核体外生物合成体系中,分离或检测所述外源蛋白。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711438680 | 2017-12-27 | ||
CN2017114386805 | 2017-12-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109971775A true CN109971775A (zh) | 2019-07-05 |
CN109971775B CN109971775B (zh) | 2021-12-28 |
Family
ID=67075997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810797876.1A Active CN109971775B (zh) | 2017-12-27 | 2018-07-19 | 一种核酸构建物及其调控蛋白合成的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109971775B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111575221A (zh) * | 2020-05-26 | 2020-08-25 | 江南大学 | 一种基于PNTs的生产灵菌红素的方法 |
WO2020186991A1 (zh) * | 2019-03-20 | 2020-09-24 | 中国科学院上海营养与健康研究所 | 利用环形rna进行蛋白翻译及其应用 |
WO2020239111A1 (zh) | 2019-05-30 | 2020-12-03 | 康码(上海)生物科技有限公司 | 体外定量共表达多种蛋白的方法及其应用 |
WO2021104435A1 (zh) | 2019-11-30 | 2021-06-03 | 康码(上海)生物科技有限公司 | 一种生物磁性微球及其制备方法和应用 |
CN112955556A (zh) * | 2019-10-10 | 2021-06-11 | 新蛋白质株式会社 | 翻译促进剂、模板核酸、翻译模板的生产方法以及蛋白质的生产方法 |
CN114807210A (zh) * | 2022-04-22 | 2022-07-29 | 北京化工大学 | 一种基于细胞质线性质粒的t7表达系统及其在酵母中表达蛋白质的方法 |
WO2023126009A1 (zh) | 2021-12-31 | 2023-07-06 | 康码(上海)生物科技有限公司 | 聚合分子、包括其的单一结构和多聚结构 |
WO2023143598A1 (zh) * | 2022-01-30 | 2023-08-03 | 中国科学院分子细胞科学卓越创新中心 | 含高均一性poly(A)尾的mRNA及其制备方法 |
WO2024051855A1 (zh) * | 2022-09-09 | 2024-03-14 | 康码(上海)生物科技有限公司 | 一种核酸构建物以及在ivtt体系中的应用 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023225360A2 (en) * | 2022-05-20 | 2023-11-23 | The University Of South Alabama | Capless and tailless therapeutic exogenous mrna and method to produce the same |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997045535A1 (en) * | 1996-05-24 | 1997-12-04 | Novartis Ag | Recombinant rna 3'-terminal phosphate cyclases and production methods thereof |
US20080171361A1 (en) * | 2007-01-11 | 2008-07-17 | The Board Of Regents For Oklahoma State University | CAP-Independent Translational Enhancer for Protein Synthesis in Wheat Germ Extract and Transgenic Cereals |
CN102753700A (zh) * | 2009-09-04 | 2012-10-24 | 先正达参股股份有限公司 | 增加植物中多肽表达的翻译增强子元件堆叠 |
WO2013118878A1 (ja) * | 2012-02-09 | 2013-08-15 | 独立行政法人理化学研究所 | 環状rna及びタンパク質の製造方法 |
WO2014144583A2 (en) * | 2013-03-15 | 2014-09-18 | Northwestern University | Methods for cell- free protein synthesis |
-
2018
- 2018-07-19 CN CN201810797876.1A patent/CN109971775B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997045535A1 (en) * | 1996-05-24 | 1997-12-04 | Novartis Ag | Recombinant rna 3'-terminal phosphate cyclases and production methods thereof |
US20080171361A1 (en) * | 2007-01-11 | 2008-07-17 | The Board Of Regents For Oklahoma State University | CAP-Independent Translational Enhancer for Protein Synthesis in Wheat Germ Extract and Transgenic Cereals |
CN102753700A (zh) * | 2009-09-04 | 2012-10-24 | 先正达参股股份有限公司 | 增加植物中多肽表达的翻译增强子元件堆叠 |
WO2013118878A1 (ja) * | 2012-02-09 | 2013-08-15 | 独立行政法人理化学研究所 | 環状rna及びタンパク質の製造方法 |
WO2014144583A2 (en) * | 2013-03-15 | 2014-09-18 | Northwestern University | Methods for cell- free protein synthesis |
Non-Patent Citations (3)
Title |
---|
ANNE E. SIMON1等: "3’ Cap-Independent Translation Enhancers of Plant Viruses", 《ANNU. REV. MICROBIOL》 * |
ATSUSHI OGAWA等: "Identification of short untranslated regions that sufficiently enhance translation in high-quality wheat germ extract", 《BIOORGANIC & MEDICINAL CHEMISTRY LETTERS》 * |
MARC R.FABIAN等: "Analysis of a 39-translation enhancer in a tombusvirus:A dynamic model for RNA–RNA interactions of mRNA termini", 《RNA》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020186991A1 (zh) * | 2019-03-20 | 2020-09-24 | 中国科学院上海营养与健康研究所 | 利用环形rna进行蛋白翻译及其应用 |
WO2020239111A1 (zh) | 2019-05-30 | 2020-12-03 | 康码(上海)生物科技有限公司 | 体外定量共表达多种蛋白的方法及其应用 |
CN112955556A (zh) * | 2019-10-10 | 2021-06-11 | 新蛋白质株式会社 | 翻译促进剂、模板核酸、翻译模板的生产方法以及蛋白质的生产方法 |
WO2021104435A1 (zh) | 2019-11-30 | 2021-06-03 | 康码(上海)生物科技有限公司 | 一种生物磁性微球及其制备方法和应用 |
CN111575221A (zh) * | 2020-05-26 | 2020-08-25 | 江南大学 | 一种基于PNTs的生产灵菌红素的方法 |
CN111575221B (zh) * | 2020-05-26 | 2021-12-28 | 江南大学 | 一种基于PNTs的生产灵菌红素的方法 |
WO2023126009A1 (zh) | 2021-12-31 | 2023-07-06 | 康码(上海)生物科技有限公司 | 聚合分子、包括其的单一结构和多聚结构 |
WO2023143598A1 (zh) * | 2022-01-30 | 2023-08-03 | 中国科学院分子细胞科学卓越创新中心 | 含高均一性poly(A)尾的mRNA及其制备方法 |
CN114807210A (zh) * | 2022-04-22 | 2022-07-29 | 北京化工大学 | 一种基于细胞质线性质粒的t7表达系统及其在酵母中表达蛋白质的方法 |
CN114807210B (zh) * | 2022-04-22 | 2024-02-02 | 北京化工大学 | 一种基于细胞质线性质粒的t7表达系统及其在酵母中表达蛋白质的方法 |
WO2024051855A1 (zh) * | 2022-09-09 | 2024-03-14 | 康码(上海)生物科技有限公司 | 一种核酸构建物以及在ivtt体系中的应用 |
Also Published As
Publication number | Publication date |
---|---|
CN109971775B (zh) | 2021-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109971775A (zh) | 一种核酸构建物及其调控蛋白合成的方法 | |
CN108642076B (zh) | 一种体外DNA-to-Protein(D2P)的合成体系、制剂、试剂盒及制备方法 | |
CN101128581B (zh) | 突变aox1启动子 | |
Serviene et al. | Screening of the yeast yTHC collection identifies essential host factors affecting tombusvirus RNA recombination | |
CN110408635B (zh) | 一种含有链霉亲和素元件的核酸构建物在蛋白质表达、纯化中的应用 | |
CN110408636A (zh) | 多重标签串联的dna序列及其在蛋白质表达纯化系统的应用 | |
CN116286564B (zh) | 一种合成p34hb的菌株及其构建方法和应用 | |
WO2019100431A1 (zh) | 一种能够增强蛋白质合成效率的串联dna元件 | |
CN109423497A (zh) | 增强蛋白质合成效率的rna元件 | |
CN109022478A (zh) | 一种用于高通量体外蛋白质合成的dna元件 | |
CN115948402A (zh) | 产5-氨基乙酰丙酸的重组希瓦氏菌及其应用 | |
CN102892884B (zh) | 马克斯克鲁维酵母转化体的制造方法 | |
CN111378706B (zh) | 通过Edc3基因敲除改变体外蛋白合成能力的方法及其应用 | |
CN111778270A (zh) | 通过整合发光报告基因反映体外无细胞蛋白表达水平的方法 | |
CN111718419B (zh) | 含有rna结合蛋白的融合蛋白及其配合使用的表达载体 | |
CN114807154A (zh) | 一种修饰的核酸及其应用 | |
WO2024051855A1 (zh) | 一种核酸构建物以及在ivtt体系中的应用 | |
CN114990086B (zh) | 酶组合物及其应用 | |
CN118325933B (zh) | 一种简单且高效的慢病毒载体文库的构建方法、慢病毒载体文库及其应用 | |
CN110551769B (zh) | 一种间苯三酚的生产方法 | |
EP1466972B1 (en) | Nucleotide sequences having activity of controlling translation efficiency and utilization thereof | |
EP4381054A1 (en) | Eukaryotic cell lysates comprising exogenous enzymes and methods for preparing the same | |
JP6813374B2 (ja) | タンパク質セット、タンパク質、遺伝子セット、遺伝子、発現ベクター、形質転換体、及びボトリオコッセンの合成方法 | |
CN114317575A (zh) | 一种提高蛋白体外合成效率的方法 | |
CN113999783A (zh) | 一种表达杂萜类化合物的重组酿酒酵母及其构建方法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |