CN103080123A - 组合物以及用于生产蛋白质的方法 - Google Patents

组合物以及用于生产蛋白质的方法 Download PDF

Info

Publication number
CN103080123A
CN103080123A CN2011800388454A CN201180038845A CN103080123A CN 103080123 A CN103080123 A CN 103080123A CN 2011800388454 A CN2011800388454 A CN 2011800388454A CN 201180038845 A CN201180038845 A CN 201180038845A CN 103080123 A CN103080123 A CN 103080123A
Authority
CN
China
Prior art keywords
mrna
sequence
polypeptide
interest
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011800388454A
Other languages
English (en)
Inventor
S.S.巴苏
K.K.丹格
K.阿扎卡南达姆
T.Z.麦克尼尔
S.郭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Original Assignee
Syngenta Participations AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG filed Critical Syngenta Participations AG
Publication of CN103080123A publication Critical patent/CN103080123A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)的每个单独mRNA序列确定一种或多种或者两种或更多种下列参数:(i)最小自由能(MFE)RNA二级结构;(ii)整体自由能(EFE);(iii)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及(iv)整体多样性(ED);c)根据步骤(b)中确定的这些参数,对该阵列中的单独mRNA序列评等级;并且d)选择来自步骤(c)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。本发明进一步提供了一种选择用于增强或减少生产感兴趣多肽的mRNA的方法。

Description

组合物以及用于生产蛋白质的方法
优先权声明
本申请根据35U.S.C.§119(e)要求于2010年6月11日提交的美国临时申请号61/353,879的权益,其全部内容通过引用结合在此。
发明领域
本发明提供了大体上关于蛋白质生产领域的方法。确切地,本发明提供了一种选择用于生产感兴趣多肽的mRNA的方法。
发明背景
许多因素影响蛋白质生产,包括基因拷贝数目、基因位点、转录以及翻译效率、转录因子以及mRNA稳定性。已经将努力集中在为了增加蛋白质生产而操纵这些因素以及其他因素的技术的开发上。因此,例如,在文献中发现众多通过改变密码子的使用来增加蛋白质表达的报道,使得这种合成基因趋近为一种用于蛋白质表达的常见的策略。尽管有报道的优点,实验的观察常常强调在异源蛋白生产效率的确定中其他因素的重要性。因此,还没有设计出用于提供在所需蛋白质生产中的可预测性水平的方法。
因此,本发明通过那些提供用于对以所希望的量生产一种感兴趣蛋白质的一种mRNA进行选择的方法来解决本领域中的上述缺点。
发明概述
本发明的一个第一方面提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)的每个单独mRNA序列确定一种或多种下列参数:(i)整体自由能(EFE);(ii)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及(iii)整体多样性(ED);c)根据在步骤(b)中确定的这些参数,对该阵列中的这些单独mRNA序列评等级;并且d)选择来自步骤(c)的分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。
本发明的另一方面提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;c)对(a)中的每个单独mRNA序列的一种或多种下列参数进行确定:(i)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。
在其他方面,本发明提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产一个阵列的单独的mRNA序列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)进行确定;c)对(a)每个单独mRNA序列确定一种或多种下列参数:(i)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。
本发明进一步提供了一种选择用于增强生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自具有MFE RNA二级结构最高值以及FMFE RNA二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中,或选自具有如在室温下测量的在从大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构以及FMFE RNA二级结构最低值的这些mRNA序列的mRNA之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
本发明的另外一方面提供了一种选择用于减少生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有MFERNA二级结构最低值以及FMFE RNA二级结构最高值的分等级阵列中的大约0.0001%至大约20%的这些序列之中,或选自具有如在室温下测量的在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构以及FMFERNA二级结构最高值的这些mRNA序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的减少生产。
本发明的其他方面提供了一种选择用于增强生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;并且c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最高值以及FMFE RNA二级结构最低值的分等级阵列中的大约0.0001%至大约20%的这些序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
在仍其他方面中,本发明提供了一种选择用于减少生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最低值以及FMFE RNA二级结构最高值的分等级阵列中的大约0.0001%至大约20%的这些序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的减少生产。
本发明进一步提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;c)根据在(b)中该确定的MFERNA二级结构,从最高的MFE RNA二级结构至最低的MFERNA二级结构,对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自下列各项:具有在从大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构的mRNAs组,具有在从大约-2kcal/mol至大约-9kcal/mol范围内的MFERNA二级结构的mRNAs组,或具有在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构的mRNAs组,其中该选择的mRNA生产该感兴趣多肽。
此外还提供了一种选择用于增强生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;并且c)选择(a)中的一种具有在从大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
在本发明的另外一方面中,提供了一种选择用于减少生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的表达水平进行确定;c)选择(a)中的一种具有在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
在本发明的某些实施方案中,提供了对一种生物细胞中的感兴趣多肽的生产进行修饰的方法,该方法包括:(a)根据本发明的这些方法选择一种对感兴趣多肽进行编码的mRNA;(b)对(a)中mRNA的核苷酸序列进行突变以生产一种突变的mRNA,与(a)中mRNA的核苷酸序列的MFE RNA二级结构相比,该突变的mRNA具有增加的或减少的MFE RNA二级结构,并且与(a)中mRNA编码的多肽序列相比,该突变的mRNA编码一种突变的多肽序列;其中该突变的多肽序列保留了由(a)的mRNA编码的多肽的功能,并且在一种生物细胞中该突变的mRNA序列与野生型mRNA序列相比其表达导致该感兴趣多肽的修饰的生产。
在本发明的另外的实施方案中,提供了对一种生物细胞中的感兴趣多肽的生产进行修饰的方法,该方法包括:(a)根据本发明的这些方法选择一种对感兴趣多肽进行编码的mRNA;(b)对在这种根据(a)选择的mRNA的核苷酸序列与所述生物的一种野生型内源核苷酸序列之间的差别进行鉴别,其中该野生型内源核苷酸序列编码了一种感兴趣多肽,该感兴趣的多肽与这种根据(a)选择的mRNA所编码的多肽相同;并且(c)对这种编码该感兴趣多肽的内源核苷酸序列进行原位突变以将(b)中所鉴别的核苷酸的每个差别合并进该内源核苷酸序列中,由此在该生物的细胞中来自该原位突变的内源核苷酸序列的该感兴趣多肽的生产被修饰。
通过阅读以下说明书并且参照形成其一部分的附图、或出于披露目的给出的本发明的实施方案的任何实例,其他的以及进一步的目的、特征以及优点将会清楚并且更易于理解。
附图简要说明
图1是一个流程图,展示了根据本发明的某些实施方案的操作。
图2是一个框图,展示了根据本发明的某些实施方案的系统。
图3显示了用载体构建体渗入的叶的样品中,在烟草瞬态系统中用AmCyan(CFP)对N-末端ssRubisco(核酮糖-1,5-二磷酸羧化酶)叶绿体转运肽的不同变体[表2]进行编码的AmCyan转录物的水平(A)以及AmCyan相对于PPO的mRNA水平(B)。
图4显示了CFP(AmCyan)变体的蛋白质生产水平(ELISA)与它们的最小自由能水平(A)以及它们的整体自由能水平(B)之间的相关性。
图5显示了AmCyan(CFP)变体的蛋白质生产水平(ELISA)与它们的最小自由能水平(A)以及它们的整体自由能水平(B)之间的相关性。CFP=AmCyan[蓝绿色荧光蛋白]表达水平;CFP*(23.3PPO)=CFP表达水平,相对于PPO(来自相同的烟草瞬态载体)表达水平的归一化。
图6显示在酵母系统中计算的mRNA折叠能量与蛋白质(ELISA)生产的相关性,相对于测量的转录水平(qRT-PCR)归一化。
图7显示了酵母系统中AmCyan(CFP)变体的蛋白质生产水平(ELISA)与它们的整体自由能水平之间的相关性。
发明详细说明
本说明书并非旨在成为实施本发明的所有的不同方法、或所有的加至本发明的特征的详细目录。例如,对于一个实施方案所展示的特征可以结合在其他实施方案中,并且对于一个特定的实施方案所展示的特征可以从那个实施方案中删除。此外,鉴于本披露内容,在此建议的不偏离本发明的多种变体以及对不同实施方案的增添对于本领域的普通技术人员将是清楚的。因此,以下说明书旨在说明本发明的一些具体的实施方案,并且不是穷尽性地限定所有的排列、组合以及其变体。
本发明诸位发明人通过对一种编码感兴趣蛋白质的mRNA二级结构的一个或多个(例如1、2、3、4、5个、等)、或者两个或更多个(例如2、3、4、5个、等)热力学变量进行确定,已经发现可以选择一种对感兴趣多肽进行编码的mRNA,该mRNA以希望的或预选的速率和/或水平和/或在特定的生产条件下生产了一种蛋白质。因此,本发明的一些实施方案提供了选择一种mRNA的方法,该mRNA用于感兴趣多肽的调整的(增强的或减弱的(例如减少的))生产。因此,在本发明的一些实施方案中,可以选择一种对感兴趣多肽进行编码的mRNA,与由编码相同的感兴趣多肽的野生型(即天然的)mRNA生产的蛋白质的量相比,该mRNA生产的蛋白质的量是增强的或增加的。在本发明的仍其他的实施方案中,可以选择一种对感兴趣多肽进行编码的mRNA,与由编码相同的感兴趣多肽的野生型mRNA生产的蛋白质的量相比,该mRNA生产的蛋白质的量是减少的或减弱的。在本发明的另外方面,可以选择对感兴趣多肽进行编码的一种第一mRNA,与由编码相同感兴趣多肽的一种第二mRNA(例如,非天然的mRNA)生产的蛋白质的量相比,该第一mRNA生产的蛋白质的量是增强的或增加的。在本发明的仍另外的方面,可以选择对感兴趣多肽进行编码的一种第一mRNA,与由编码相同的感兴趣多肽的一种第二mRNA生产的蛋白质的量相比,该第一mRNA生产的蛋白质的量是减弱的或减少的。基于使用本发明的方法对mRNA的选择,增强(例如增加)或减弱(例如减少、降低)的量可以按照希望的改变。因此,可以通过使用本发明的方法选择基于天然或第二mRNA生成的阵列的任意mRNA,与野生型或天然的mRNA或第二mRNA相比,该阵列的任意mRNA生产改变的量的感兴趣多肽。
此外,可以使用此处描述的这些方法作为一种工具以克服RNA沉默。作为一个实例,强的启动子经常被用来产生一种高水平的RNA转录物。但是,本领域的普通技术人员所熟知的是强的启动子常常导致基因沉默。反而,一种中等的或弱的启动子可以与一种包括根据本发明的方法选择的mRNA的基因构建体组合使用以生产一种更高效地被翻译的mRNA转录物。因此,尽管使用一种弱的或中等的启动子,通过使用本发明的方法可以获得高水平的蛋白质生产,这种启动子可以识别被更高效地翻译的mRNA转录物,并且在同时避免了由于高转录水平导致的基因沉默。
因此,本发明的一个方面提供了选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)每个单独mRNA序列确定一种或多种下列参数:(i)整体自由能(EFE);(ii)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及(iii)整体多样性(ED);c)根据在步骤(b)中确定的这些参数,对该阵列中的这些单独mRNA序列评等级;并且d)选择来自步骤(c)的分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。在某些实施方案中,如上所述的,当确定两种或更多种参数时,根据在步骤(b)中确定的这些参数的联合分布,对在步骤(c)的该阵列中的这些单独mRNA序列评等级。
本发明的另一方面提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;c)对(a)中每个单独mRNA序列确定一种或多种下列参数:(i)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。
在其他方面,本发明提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)进行确定;c)对(a)中每个单独mRNA序列确定一种或多种下列参数:(i)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。
因此,在本发明的某些实施方案中,可以对一个阵列的每个单独mRNA序列的下列参数或参数的组合进行确定,并且可以使用下列参数或参数的组合对单独mRNA序列评等级(应指出当确定两种或更多种参数时根据这些参数的联合分布进行评等级):(1)EFE;(2)FMFE;(3)MFE;(4)ED;(5)EFE和FMFE;(6)EFE和ED;(7)FMFE和ED;(8)EFE、FMFE和ED;(9)MFE和FMFE;(10)MFE和ED;以及(11)MFE、FMFE和ED。进一步地,在一些方面,本发明进一步包括除了对以上所述的这些参数或参数的组合之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。因此,如在此进一步提供的,可以对于一个阵列中的每个单独mRNA序列确定下列参数的组合,并且对于单独的mRNA序列可以根据联合分布使用下列参数的组合评等级:(1)EFE和BPP;(2)FMFE和BPP;(3)ED和BPP;(4)EFE、FMFE和BPP;(5)EFE、ED和BPP;(6)FMFE、ED和BPP;(7)EFE、FMFE、ED和BPP;(8)MFE、FMFE和BPP;(9)MFE、ED和BPP;以及(10)MFE、FMFE、ED和BPP。
将理解的是虽然术语“第一(first)”、“第二(second)”等可以在此使用以描述不同的要素,这些要素不应被这些术语限制。这些术语仅仅用于将一种要素与彼此区分。因此,以下讨论的一种“第一”要素(例如,第一mRNA序列)还可以在不偏离本发明所传授的内容下称为一种“第二”要素(例如,第二mRNA序列)。
“野生型”核苷酸、核苷酸序列、多肽或氨基酸序列指的是天然发生的(“天然的(native)”)或内源核酸、核苷酸序列、多肽或氨基酸序列。因此,“野生型mRNA”是一种生物内天然发生的或内源性的mRNA。
如在此使用的,术语“热力学优化方法”是指用来确定核酸分子的最小自由能结构的Zuker算法的任意实现方式(Zuker等人,《核酸研究》(NucleicAcids Research),9,133-148(1981);还参见,Mathews等人,《分子生物学期刊》(J.Mol.Biol.)288:911-940(1999)以及Walter等人,PNAS91:9218-9222(1994))。
在此使用的术语“最小自由能RNA二级结构”(MFE)是指经热力学优化(即Zuker算法(M.Zuker以及P.Stiegler.,《核酸研究》(Nucleic AcidsResearch)9:133-148(1981))的一种实现方式)发现的具有最低的自由能值的结构。
术语“最小自由能频率RNA二级结构”(FMFE)是指在热力学整体中的MFE结构的部分,该FMFE为:(e^(-E/kT))/Z,其中E是结构的最小自由能,k是玻尔兹曼常数,T是温度并且Z是配分函数(Wuchty等人,《生物聚合物》(Biopolymers)49:145-165(1999))。因此,配分函数以及热力学整体的结构被用来确定FMFE RNA二级结构。
在此使用的术语“配分函数”是指由J.S.McCasldll在《生物聚合物》(Biopolymers)29:1105-1119(1990)中定义的配分函数:Z=和(e^[Ei/kT]),其中对于给出序列,Ei是结构i的自由能并且和(sum)是对所有的结构(从i=1至i=n)进行求和。
在此使用的术语“整体自由能”(EFE)是指-kT*ln Z,其中k、T、以及Z是如上所定义的并且例如在ViennaRNA软件包中被执行(I.L.Hofacker等人,《化学月刊》(Monatsh.Chem.),125:167-188(1994))。整体自由能是由J.S.McCaskill在《生物聚合物》(Biopolymers)29:1105-1119(1990)中定义。
在此使用的术语“整体多样性”(ED)是指在热力学整体中的所有结构之间的碱基配对平均差:sum_a,b p_a*p_b*d(a,b),其中该和(sum)是对所有可能的结构的碱基对进行求和a,b,p_a是结构a的玻尔兹曼重量,并且d(a,b)是碱基对距离,其中碱基对距离是由Wuchty等人在《生物聚合物》(Biopolymers)49:145-165(1999)中所定义。
参数的“联合分布”以特定的确定参数(例如MFE、EFE、FMFE、ED和/或BPP)的形式限定了事件的概率。因此,当参数MFE、EFE、FMFE、ED和/或BPP中的两种或更多种参数确定时,根据对于每个单独mRNA的各个参数确定的值,使用一种联合分布来对mRNA评等级。
因此,在此使用的“联合分布”可以通过选择感兴趣序列的一个起始部分(例如较高的5%的如上定义的MFE结构)、并且然后通过使用确定的其他参数(如FMFE)选择该起始部分的一部分来限定。例如,取较高和较低10%的MFE结构(例如对应地对于增强的和减少的表达),然后根据它们的FMFE值取这些部分各自的前50%。
在此使用的术语“碱基配对概率”(BPP)是指在每个位置具有香农熵的核苷酸序列中的所有位置的平均碱基配对概率。碱基配对概率的计算是由J.S.McCaskill在《生物聚合物》(Biopolymers)29:1105-1119(1990)中定义的,并且被实施于,例如ViennaR A软件包中(I.L.Hofacker等人,《化学月刊》(Monatsh.Chem.),125:167-188(1994))。熵值的计算由M.Huynen在《分子生物学期刊》(J Mol.Biol.)267:1104-1112(1997)中描述。
在本发明的具体实施方案中,这些方法包括:生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列。
在本发明的某些实施方案中,通过将感兴趣多肽回译来生产一个阵列以生产对该感兴趣多肽进行编码的mRNAs。在具体实施方案中,通过将感兴趣多肽的N末端回译来生产一个阵列以生产对该感兴趣多肽的N末端进行编码的mRNAs。在另外的实施方案中,通过将感兴趣多肽的N末端回译来生产一个阵列以生产对该感兴趣多肽的N末端进行编码的mRNAs,其中这些生产的单独mRNAs包括一个起始密码子和一个大约20至70个核苷酸长度的序列。
因此,在某些实施方案中,生产单独mRNA序列的一个阵列,其中这些单独mRNA序列各自包括该起始密码子以及一个长度的核苷酸,该长度是大约20至大约25个核苷酸、大约20至大约30个核苷酸、大约20至大约35个核苷酸、大约20至大约40个核苷酸、大约20至大约45个核苷酸、大约20至大约50个核苷酸、大约20至大约55个核苷酸、大约20至大约55个核苷酸、大约20至大约60个核苷酸、大约20至大约65个核苷酸、大约25至大约30个核苷酸、大约25至大约35个核苷酸、大约25至大约40个核苷酸、大约25至大约45个核苷酸、大约25至大约50个核苷酸、大约25至大约55个核苷酸、大约25至大约60个核苷酸、大约25至大约65个核苷酸、大约25个核苷酸至大约70个核苷酸、大约30至大约35个核苷酸、大约30至大约40个核苷酸、大约30至大约45个核苷酸、大约30至大约55个核苷酸、大约30至大约55个核苷酸、大约30至大约60个核苷酸、大约30至大约65个核苷酸、大约30个核苷酸至大约70个核苷酸、大约35至大约40个核苷酸、大约35至大约45个核苷酸、大约35至大约50个核苷酸、大约35至大约55个核苷酸、大约35至大约60个核苷酸、大约35至大约65个核苷酸、大约35至大约70个核苷酸、大约40至大约45个核苷酸、大约40至大约50个核苷酸、大约40至大约55个核苷酸、大约40至大约60个核苷酸、大约40至大约65个核苷酸、大约40至大约70个核苷酸、大约45至大约50个核苷酸、大约45至大约55个核苷酸、大约45个核苷酸至大约60个核苷酸、大约45至大约65个核苷酸、大约45至大约70个核苷酸、大约50至大约55个核苷酸、大约50至大约60个核苷酸、大约50至大约65个核苷酸、大约50至大约70个核苷酸、大约55至大约60个核苷酸、大约55至大约65个核苷酸、大约55至大约70个核苷酸、大约60至大约65个核苷酸、大约60至大约70个核苷酸、大约65至大约70个核苷酸、等等。因此,在另外的实施方案中,一个阵列的这些单独mRNA序列包括一个起始密码子以及一个长度的核苷酸,该长度是大约20个核苷酸、大约21个核苷酸、大约22个核苷酸、大约23个核苷酸、大约24个核苷酸、大约25个核苷酸、大约26个核苷酸、大约27个核苷酸、大约28个核苷酸、大约29个核苷酸、大约30个核苷酸、大约31个核苷酸、大约32个核苷酸、大约33个核苷酸、大约34个核苷酸、大约35个核苷酸、大约36个核苷酸、大约37个核苷酸、大约38个核苷酸、大约39个核苷酸、大约40个核苷酸、大约41个核苷酸、大约42个核苷酸、大约43个核苷酸、大约44个核苷酸、大约45个核苷酸、大约46个核苷酸、大约47个核苷酸、大约48个核苷酸、大约49个核苷酸、大约50个核苷酸、大约51个核苷酸、大约52个核苷酸、大约53个核苷酸、大约54个核苷酸、大约55个核苷酸、大约56个核苷酸、大约57个核苷酸、大约58个核苷酸、大约59个核苷酸、大约60个核苷酸、大约61个核苷酸、大约62个核苷酸、大约63个核苷酸、大约64个核苷酸、大约65个核苷酸、大约66个核苷酸、大约67个核苷酸、大约68个核苷酸、大约69个核苷酸、或大约70个核苷酸。在本发明的具体实施方案中,一个阵列的这些单独mRNA序列包括一个起始密码子以及大约40个核苷酸。
在本发明的另外的实施方案中,这些阵列中的单独mRNA序列包括相对于该起始密码子在-20至50位置(即起始密码子ATG(AUG)的A是0位)的核苷酸。在本发明的某些具体实施方案中,这些单独mRNA序列的5'端包括相对于该起始密码子在-4至35位置的核苷酸。在本发明的另外的实施方案中,这些单独mRNA序列的5'端包括相对于该起始密码子在-4至37位置的核苷酸。
在其他实施方案中,这些单独mRNA序列包括以下各项:相对于该起始密码子在-15至50位置的核苷酸、相对于该起始密码子在-10至50位置的核苷酸、相对于该起始密码子在-5至50位置的核苷酸、相对于该起始密码子在-20至45位置的核苷酸、相对于该起始密码子在-15至45位置的核苷酸、相对于该起始密码子在-10至45位置的核苷酸、相对于该起始密码子在-5至45位置的核苷酸、相对于该起始密码子在-20至40位置的核苷酸、相对于该起始密码子在-15至40位置的核苷酸、相对于该起始密码子在-10至40位置的核苷酸、相对于该起始密码子在-5至40位置的核苷酸、相对于该起始密码子在-20至35位置的核苷酸、相对于该起始密码子在-15至35位置的核苷酸、相对于该起始密码子在-10至35位置的核苷酸、相对于该起始密码子在-5至35位置的核苷酸、相对于该起始密码子在-20至30位置的核苷酸、相对于该起始密码子在-15至30位置的核苷酸、相对于该起始密码子在-10至30位置的核苷酸、相对于该起始密码子在-5至30位置的核苷酸、相对于该起始密码子在-20至25位置的核苷酸、相对于该起始密码子在-15至25位置的核苷酸、相对于该起始密码子在-10至25位置的核苷酸、相对于该起始密码子在-5至25位置的核苷酸、相对于该起始密码子在-20至20位置的核苷酸、相对于该起始密码子在-15至20位置的核苷酸、相对于该起始密码子在-10至20位置的核苷酸、相对于该起始密码子在-5至20位置的核苷酸、相对于该起始密码子在-20至15位置的核苷酸、相对于该起始密码子在-15至15位置的核苷酸、相对于该起始密码子在-10至15位置的核苷酸、相对于该起始密码子在-5至15位置的核苷酸、相对于该起始密码子在-20至10位置的核苷酸、相对于该起始密码子在-15至10位置的核苷酸、相对于该起始密码子在-10至10位置的核苷酸、等等。因此,在某些具体实施方案中,一个阵列的这些单独mRNA序列包括一个起始密码子以及大约40个核苷酸,这些单独mRNA序列的5'端包括相对于该起始密码子在-4至35位置的核苷酸。
在本发明的某些实施方案中,生产的一个阵列包括对该感兴趣多肽进行编码的所有可能的mRNAs。在本发明的其他实施方案中,生产的一个阵列是一种“代表性阵列”。因此,如在此使用的,代表性阵列是指一种其中不是对所有的可能编码感兴趣多肽的mRNAs进行生产并且对在此所述的这些参数进行评估的阵列,而是对代表了编码该感兴趣多肽的mRNAs的分布的一种亚群或子群进行生产并且评估。可以通过使用本领域中已知的有偏协议或无偏协议对一个代表性阵列进行生产。一种生成代表性阵列的无偏方法的非限制性实例开始于一种氨基酸序列的输入。使用一种自动随机取样程序以生成对所输入的氨基酸序列进行编码的核苷酸序列(例如,BioPerl)。(Stajich等人,《基因组研究》(Genome Res)12(10):1611-8(2002))。对氨基酸序列中的各个位置,通过对来自均匀分布的可能的密码子进行取样来选择那个位置的密码子。因此,在某些实施方案中,用这种方式对于每一个输入的氨基酸序列生产了1万种核苷酸序列。在其他的实施方案中,生产了更多或更少数目的核苷酸序列。生产的序列的数目将依赖于许多因素,这些因素包括该输入的氨基酸序列的长度。
因此,在本发明的某些实施方案中,一个阵列包括大约103至大约108个单独mRNA序列。在其他实施方案中,本发明的一个阵列包括大约l03、大约2×l03、大约4×103、大约6×103、大约8×l03、大约104、大约2×l04、大约4×l04、大约6×l04、大约8×l04、大约105、大约2×l05、大约4×l05、大约6×l05、大约8×l05、大约106、大约2×l06、大约4×l06、大约6×l06、大约8×l06、大约107、大约2×l07、大约4×l07、大约6×l07、大约8×l07、或大约108个单独mRNA序列。
如在此描述的,本发明提供了选择mRNA的多种方法,该mRNA具有所希望的感兴趣多肽的生产水平。因此,在某些实施方案中,本发明提供了一种选择用于生产感兴趣多肽的mRNA的方法,其中该感兴趣多肽的生产增强了。在其他实施方案中,提供了一种选择用于生产感兴趣多肽的mRNA的方法,其中该感兴趣多肽的生产减少了。如在此描述的选择的mRNA可以具有轻微增强的、中等增强的或极大增强的蛋白质生产。
在本发明的其他实施方案中,可以选择一种mRNA,该mRNA具有所希望水平的蛋白质生产,该所希望水平的蛋白质生产是轻微减少的、中等减少的或极大减少的。在某些实施方案中,与由野生型mRNA生产的相同感兴趣多肽相比,由选择的mRNA生产的蛋白质的水平被增强或减少。在某些实施方案中,选择一种mRNA序列,该序列与由野生型mRNA生产的相同感兴趣多肽相比,生产了相同量的蛋白质(0%增强或减少)。
如在此使用的,轻微增强的或轻微减少的可以是指与天然mRNA或其他选择的mRNA相比,在感兴趣多肽的生产中的变化为:大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、等等。中等增强的或中等减少的可以是指与天然mRNA或其他选择的mRNA相比,在感兴趣多肽的生产中的变化为:25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、等等。极大增强的或极大减少的可以是指与天然mRNA或其他选择的mRNA相比,在感兴趣多肽的生产中的变化为:大约45%至大约100%(例如,45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、等)。
在其他实施方案中,本发明提供了一种选择用于生产感兴趣多肽的第一mRNA(选择的mRNA)的方法,其中与由一种第二mRNA生产该多肽相比,由该第一mRNA对该感兴趣多肽的生产增强或减少了,该第二mRNA编码与由第一mRNA所编码的相同的感兴趣多肽。
因此,本发明提供了用于选择mRNA的方法,该选择是基于对该mRNA的评等级,它的评等级是在对于阵列中这些单独mRNA序列的各个确定的参数值的分布之内进行。因此,例如将一个阵列的这些mRNAs从对于各个确定参数(即,MFE RNA二级结构、EFE、FMFE RNA二级结构、ED和/或BPP)的最高值至最低值分等级;因此,提供了对于单个感兴趣多肽进行编码的但是具有不同的确定参数值(即,MFE RNA二级结构、EFE、FMFERNA二级结构、ED、和/或BPP)的mRNAs的分布。可以将该分布描述为从在100%的最高值至在小于1%(例如0.0001%、0.0005%、0.001%、0.005%、0.01%、等)的最低值的范围。可以沿着这种分布从小于1%(例如0.0001%、0.0005%、0.001%、0.005%、0.01%、等)至100%的任何地方选择一种mRNA。因此,通过选择一种如在此描述的mRNA,可以获得所希望水平的蛋白质生产。
因此,在本发明的某些实施方案中,可以从给出的阵列的mRNAs中选择一种mRNA,该给出的阵列具有一种MFE RNA二级结构值,该MFE RNA二级结构值是在对该序列的阵列所确定的MFE最高值的大约95%-100%之间。在其他实施方案中,可以从具有下列MFE值的mRNA序列中选择一种mRNA,该MFE值是对mRNA序列阵列所确定的在大约90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之间的范围内。因此,在某些实施方案中,可以从具有下列MFE值的mRNA序列中选择一种mRNA,该MFE值是对该序列阵列所确定的MFE最高值的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。
在其他实施方案中,该MFE RNA二级结构(MFE)值相对于在该阵列内的这些mRNA的蛋白质生产的水平没有形成一种线性模式但是反而形成了一种分段模式,该分段模式中mRNAs分成多个组,其中对于各组之内的mRNAs尽管具有不同的MFE值但是其表达水平或蛋白质生产是相同的。确切地,在一个分段模式中,当影响蛋白质表达的其他因素保持不变,具有落入特定的范围内的MFE值的mRNAs可以具有相同的蛋白质表达水平。因此,在某些实施方案中mRNAs的分组是基于计算的MFE。
表达水平的分段模式可以发生,这是因为对于具有不同MFE值的mRNAs,打开给出的用于翻译的mRNA结构所要求的能量可以是相同的。因此,例如,在25°C下对于单个GTP至GDP的水解的ΔG°是-6.95kcal/mol(在37°C下该ΔG°是-7.14)。因此,在某些实例中,某些具有不同MFE值的mRNAs为了打开它们用于翻译的结构,可以各自要求单个GTP的能量(一种“单个能量包”)。因此,尽管MFE值不同,来自那些要求“单个能量包”(例如ATP、GTP等等)的mRNAs的表达水平或蛋白质生产可以是相同的或相似的,并且因此可以通过从特定范围内的MFE值选择任意的RNA来获得相似的蛋白质生产水平。作为一个实例,一种具有-3kcal/mol的MFE值的mRNA以及另一种具有-6kcal/mol的MFE值的mRNA两者都可以为了打开它们的翻译结构要求一种或少于一种的能量包。所以,对于这两种mRNA其蛋白质生产效率是相同的,并且因此可以不用考虑蛋白质生产水平的结果而选择两者之中的任一个。
通过水解的“能量包”(例如GTP、ATP等)以及对应的释放的能量的数目对在范围之间的边界进行确定。因此,例如,第一个范围可以对应于0个GTP水解,第二个范围对应于1个GTP水解,等等。这些边界在某些程度上可以是可变的,并且在相邻的范围之间存在一些重叠,这是因为(1)从水解释放的能量随着温度、以及体内水生的和离子的环境而变化并且(2)对于mRNAs的MFE的计算可以是近似的。通常,这些边界可以通过实验来计算并且在这些边界附近的mRNAs被避免。如在此所述的,计算MFE的方程在本领域中是已知的(即(e^(-E/kT))/Z,其中E是结构的最小自由能,k是玻尔兹曼常数,T是温度并且Z是配分函数(Wuchty等人,《生物聚合物》(Biopolymers)49:145-165(1999))。
因此,在某些实施方案中,可以从一组mRNAs选择一种mRNA,该组mRNAs是在给出的阵列中,该阵列具有在从大约0kcal/mol至大约-2kcal/mol范围内的、在从大约-2kcal/mol至大约-9kcal/mol范围内的、或在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构值。从哪个组选择的选择将依赖于所希望的蛋白质生产水平。因此,在某些实施方案中,当希望增强的蛋白质生产时,可以从以下一组mRNAs中选择该mRNA,该组mRNAs具有在从大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构值。因此,可以选择的mRNA具有以下MFE值:大约0kcal/mol、-0.1kcal/mol、-0.2kcal/mol、-0.3kcal/mol、-0.4kcal/mol、-0.5kcal/mol、-0.6kcal mol、-0.7kcal/mol、-0.9kcal/mol、-1kcal/mol、-1.1kcal/mol、-1.2kcal/mol、-1.3kcal/mol、-1.4kcal/mol、-1.5kcal/mol、-1.6cal/mol、-1.7kcal/mol、-1.8kcal/mol、-1.9kcal/mol、-2kcal/mol、等等。
在其他实施方案中,当希望减少的蛋白质生产时,可以从以下一组mRNAs中选择该mRNA,该组mRNAs具有在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构值。在某些实施方案中,当希望减少的蛋白质生产时,可以从以下一组mRNAs中选择该mRNA,该组mRNAs具有在从大约-9kcal/mol至大约-23kcal/mol范围内的MFE RNA二级结构值。在其他实施方案中,当希望减少的蛋白质生产时,可以从以下一组mRNAs中选择该mRNA,该组mRNAs具有在从大约-9kcal/mol至大约-30kcal/mol范围内的MFE RNA二级结构值。因此,在某些实施方案中,当希望减少的蛋白质生产时,可以选择一种具有以下MFE值的mRNA:大约-9kcal/mol、-9.1kcal/mol、-9.2kcal/mol、-9.3kcal/mol、-9.4kcal/mol、-9.5kcal/mol、-9.6kcal/mol、-9.7kcal/mol、-9.9kcal/mol、-10kcal/mol、-10.1kcal/mol、-10.2kcal/mol、-10.3kcal/mol、-10.4kcal/mol、-10.5kcal/mol、-10.6cal/mol、-10.7kcal/mol、-10.8kcal/mol、-10.9kcal/mol、-11kcal/mol、-11.1kcal/mol、-11.2kcal/mol、-11.3kcal/mol、-11.4kcal/mol、-11.5kcal/mol、-11.6cal/mol、-11.7kcal/mol、-11.8kcal/mol、-11.9kcal/mol、-12kcal/mol、-12.1kcal/mol、-12.2kcal/mol、-12.3kcal/mol、-12.4kcal/mol、-12.5kcal/mol、-12.6cal/mol、-12.7kcal/mol、-12.8kcal/mol、-12.9kcal/mol、-13kcal/mol、-13.1kcal/mol、-13.2kcal/mol、-13.3kcal/mol、-13.4kcal/mol、-13.5kcal/mol、-13.6cal/mol、-13.7kcal/mol、-13.8kcal/mol、-13.9kcal/mol、-14kcal mol、-14.1kcal/mol、-14.2kcal/mol、-14.3kcal/mol、-14.4kcal/mol、-14.5kcal/mol、-14.6cal/mol、-14.7kcal/mol、-14.8kcal/mol、-14.9kcal/mol、-15kcal/mol、-15.1kcal/mol、-15.2kcal/mol、-15.3kcal/mol、-15.4kcal/mol、-15.5kcal/mol、-15.6cai/mol、-15.7kcal/mol、-15.8kcal/mol、-15.9kcal/mol、-16kcal/mol、-16.1kcal/mol、-16.2kcal/mol、-16.3kcal/mol、-16.4kcal/mol、-16.5kcal/mol、-16.6cal/mol、-16.7kcal/mol、-16.8kcal/mol、-16.9kcal/mol、-17kcal/mol、-17.1kcal/mol、-17.2kcal/mol、-17.3kcal/mol、-17.4kcal/mol、-17.5kcal/mol、-17.6cal/mol、-17.7kcal/mol、-17.8kcal/mol、-17.9kcal/mol、-18kcal/mol、-18.1kcal/mol、-18.2kcal/mol、-18.3kcal/mol、-18.4kcal/mol、-18.5kcal/mol、-18.6cal/mol、-18.7kcal/mol、-18.8kcal/mol、-18.9kcal/mol、-19kcal/mol、-19.5kcal/mol、-20kcal/mol、-20.5kcal/mol、-21kcal/mol、-21.5kcal/mol、-22kcal/mol、-22.5kcal/mol、-23kcal/mol、-23.5kcal/mol、-24cal/mol、-24.5kcal/mol、-25kcal/mol、-25.5kcal/mol、-26kcal/mol、-26.5kcal/mol、-27kcal/mol、-27.5kcal/mol、-28.5kcal/mol、-29kcal/mol、-29.5kcal/mol、-30kcal/mol、等。
在仍其他实施方案中,依据所希望的表达水平,可以从以下一组mRNAs中选择该mRNA,该组mRNAs具有在从大约-2kcal/mol至大约-9kcal/mol范围内的MFE RNA二级结构值。因此,可以选择一种具有以下MFE值的mRNA:大约-2kcal/mol、-2.1kcal/mol、-2.2kcal/mol、-2.3kcal/mol、-2.4kcal/mol、-2.5kcal/mol、-2.6kcal/mol、-2.7kcal/mol、-2.9kcal/mol、-3kcal/mol、-3.1kcal/mol、-3.2kcal/mol、-3.3kcal/mol、-3.4kcal/mol、-3.5kcal/mol、-3.6cal/mol、-3.7kcal/mol、-3.8kcal/mol、-3.9kcal/mol、-4kcal/mol、-4.1kcal/mol、-4.2kcal/mol、-4.3kcal/mol、-4.4kcal/mol、-4.5kcal/mol、-4.6cal/mol、-4.7kcal/mol、-4.8kcal/mol、-4.9kcal/mol、-5kcal/mol、-5.1kcal/mol、-5.2kcal/mol、-5.3kcal/mol、-5.4kcal/mol、-5.5kcal/mol、-5.6cal/mol、-5.7kcal/mol、-5.8kcal/mol、-5.9kcal/mol、-6kcal/mol、-6.1kcal/mol、-6.2kcal/mol、-6.3kcal/mol、-6.4kcal/mol、-6.5kcal/mol、-6.6cal/mol、-6.7kcal/mol、-6.8kcal/mol、-6.9kcal/mol、-7kcal/mol、-7.1kcal mol、-7.2kcal/mol、-73kcal/mol、-7.4kcal/mol、-7.5kcal/mol、-7.6cal mol、-7.7kcal mol、-7.8kcal/mol、-7.9kcal/mol、-8kcal/mol、-8.1kcal/mol、-8.2kcal/mol、-8.3kcal/mol、-8.4kcal/mol、-8.5kcal/mol、-8.6cal/mol、-8.7kcal/mol、-8.8kcal/mol、-8.9kcal/mol、-9kcal/mol、等。
因此,在本发明的某些实施方案中,提供了一种选择用于生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;c)根据在(b)中该确定的MFERNA二级结构,从最高的MFE RNA二级结构至最低的MFE RNA二级结构,对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自下列各项:具有在大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构的mRNAs组,具有在大约-2kcal/mol至大约-9kcal/mol范围内的MFE RNA二级结构的mRNAs组,或具有在大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构的mRNAs组,其中该选择的mRNA生产该感兴趣多肽。
在其他实施方案中,本发明提供了一种选择选择用于增强生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;并且c)选择(a)中的一种具有在大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
在另外的实施方案中,提供了一种选择用于减少生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的表达水平进行确定;c)选择(a)中的一种具有在大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
在其他实施方案中,可以从给出阵列的mRNAs中选择一种mRNA,该给出的阵列具有一种EFE值,该EFE值是在对该序列的阵列所确定的大约95%-100%的EFE最高值之间。在其他实施方案中,可以从具有以下EFE值的mRNA序列中选择一种mRNA,该EFE值是在对该mRNA序列阵列所确定的EFE最高值的大约90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%~65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之间的范围内。因此,在某些实施方案中,可以从具有以下EFE值的mRNA序列中选择一种mRNA,该EFE值是对于该序列阵列所确定的的EFE最高值的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。
在仍其他实施方案中,可以从给出阵列的mRNA序列中选择一种mRNA,该给出的阵列具有一种FMFE RNA二级结构值,该FMFE RNA二级结构值是在对该序列阵列所确定的大约95%-100%的FMFE最高值之间。在其他实施方案中,可以从具有以下FMFE值的mRNAs中选择一种mRNA,该FMFE值是在对该序列阵列所确定的EFE最高值的大约90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之间的范围内。因此,在另外的实施方案中,可以从具有下列FMFE值的mRNA序列中选择一种mRNA,该FMFE值是对该序列阵列所确定的FMFE最高值的大约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。
在另外的实施方案中,可以从给出阵列的mRNA序列中选择一种mRNA,该给出的阵列具有一种MFE RNA二级结构值,该MFE RNA二级结构值是在对该序列阵列所确定的MFE最高值的大约95%-100%之间。在其他实施方案中,可以从具有以下MFE值的mRNAs中选择一种mRNA,该MFE值是在对该序列阵列所确定的MFE最高值的大约90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之间的范围内。因此,在另外的实施方案中,可以从具有下列MFE值的mRNA序列中选择一种mRNA,该MFE值是对该序列阵列所确定的MFE最高值的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。
在本发明的仍是另外的实施方案中,可以从一种给出阵列的mRNAs中选择一种mRNA,该给出的阵列具有的ED是在对该序列阵列所确定的最高值的大约95%-100%ED之间。在其他实施方案中,可以从具有以下ED值的mRNA序列中选择一种mRNA,该ED值是在对该序列阵列所确定的ED最高值的大约90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之间的范围内。因此,在某些实施方案中,可以从具有下列ED值的mRNA序列中选择一种mRNA,该ED值是对该序列阵列所确定的ED最高值的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。
在本发明的另外方面,可以从给出阵列的mRNA序列中选择一种mRNA,该给出的阵列具有的BPP值是在对该序列阵列所确定的最高值的大约95%-100%的BPP之间。在其他实施方案中,可以从具有以下BPP值的mRNA序列中选择一种mRNA,该BPP值是在对该序列阵列所确定的BPP最高值的大约90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之间的范围内。因此,在另外的实施方案中,可以从具有下列BPP值的mRNA序列中选择一种mRNA,该BPP值是对该序列阵列所确定的BPP最高值的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。
在本发明的另外方面,当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且MFE RNA二级结构、EFE、和/或ED是对于阵列中每个单独mRNA序列所确定的一个或多个参数(用来对阵列中的单独mRNA序列进行评等级)时,于是从具有对该mRNA序列阵列所确定的MFE RNA二级结构、EFE、和/或ED最高值的mRNA序列之中选择该mRNA。因此,在本发明的特定方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从以下mRNA序列中选择该mRNA:这些mRNA序列所具有的MFERNA二级结构、EFE、和/或ED的值是对该阵列的序列所确定的该参数值的最高值的大约95%-100%。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下值的mRNAs中选择该mRNA,该值是在对于该序列阵列所确定的MFE RNA二级结构、EFE、和/或ED的最高值的大约90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、等的范围内。在仍其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下值的阵列的mRNA序列中选择该mRNA,该值是对于该序列阵列所确定的MFE RNA二级结构、EFE、和/或ED的最高值的大约100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、等。
在本发明的其他方面,当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且FMFE RNA二级结构是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是从具有对该mRNA序列阵列所确定的FMFE RNA二级结构最低值的mRNA序列之中选择该mRNA。因此,在本发明的特定方面,可以从具有以下FMFE值的mRNAs中选择该mRNA,该值是在对该序列阵列所确定的FMFE二级结构最高值的大约0-5%之间。在其他实施方案中,可以从具有以下FMFE RNA二级结构值的mRNAs中选择该mRNA,该值是对于该序列阵列所确定的FMFE RNA二级结构最高值的大约0%-10%、5%-10%、0%-15%、0%-20%、5%-15%、10%-15%、5%-20%、10%-20%、15%-20%、10%-25%、15%-25%、20%-25%、15%-30%、20%-30%、25%-30%、20%-35%、25%-35%、30%-35%、25%-40%、30%-40%、35%-40%、30%-45%、35%-45%、40%-45%、35%-50%、40%-50%、45%-50%、40%-55%、45%-55%、等的范围内。在仍其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下FMFE值的阵列的mRNA序列中选择该mRNA,该值是对于该序列阵列所确定的FMFE最高值的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、等。
在本发明的另外方面,当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且BPP是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是从具有对该mRNA序列阵列所确定的BPP最高值的mRNA序列中选择该mRNA。因此,在本发明的特定方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下BPP值的mRNA序列中选择该mRNA,该值是对该序列阵列所确定的该参数的最大值的大约95%-100%。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下BPP值的mRNAs中选择该mRNA,该值是在对于序列阵列所确定的BPP最高值的大约90%-l00%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、等的范围内。在仍其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下BPP值的阵列的mRNA序列中选择该mRNA,该BPP值是对于序列阵列所确定的BPP最高值的大约100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、等。
在本发明的另外方面,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且MFE RNA二级结构、EFE、和/或ED是对于阵列中每个单独mRNA序列所确定的一个或多个参数(该(这些)参数被用来对阵列中的单独mRNA序列进行评等级)时,于是从具有对该mRNA序列阵列对应地确定的MFE RNA二级结构、EFE、和/或ED最低值的mRNA序列之中选择该mRNA。因此,在本发明的特定方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,可以从具有以下值的mRNAs中选择该mRNA,该值是对该序列阵列所确定的MFE RNA二级结构、EFE、和/或ED最高值的大约0-5%。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,可以从具有以下值的mRNAs中选择该mRNA,该值是在对于该序列阵列所确定的MFE RNA二级结构、EFE、和/或ED的最高值的大约0%-10%、5%-10%、0%-15%、0%-20%、5%-15%、10%-15%、5%-20%、10%-20%、15%-20%、10%-25%、15%-25%、20%-25%、15%-30%、20%-30%、25%-30%、20%-35%、25%-35%、30%-35%、25%-40%、30%-40%、35%-40%、30%-45%、35%-45%、40%-45%、35%-50%、40%-50%、45%-50%、40%-55%、45%-55%、等的范围内。在仍其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,可以从具有以下值的阵列的mRNA序列中选择该mRNA:该值是对于该序列阵列所确定的MFE RNA二级结构、EFE、和/或ED最高值的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、等。
在本发明的另外方面,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且FMFE RNA二级结构是对于阵列中每个单独mRNA序列所确定的一个或多个参数(该(这些)参数被用来对阵列中的单独mRNA序列进行评等级)时,于是从具有对该mRNA序列阵列所确定的FMFE RNA二级结构最高值的mRNA序列之中选择该mRNA。因此,在本发明的特定方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,可以从具有以下FMFE RNA二级结构值的mRNAs中选择该mRNA,该值是对该序列阵列所确定的FMFE最高值的大约95%-100%。因此,在某些实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,可以从具有以下FMFERNA二级结构值的mRNAs中选择该mRNA,该值是在对于该序列阵列所确定的FMFE RNA二级结构最高值的大约90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、等的范围内。在仍其他的实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有以下FMFE值的阵列的mRNA序列中,该值是对该序列阵列所确定的FMFE最高值的大约100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、等。
在另外的实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产,并且MFE RNA二级结构是对于阵列中每个单独mRNA序列确定的并且被用于该阵列的单独mRNA序列的评等级中时,于是该mRNA是选自对于该阵列具有所确定的MFE RNA二级结构最高值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%(例如大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以是选自具有MFE RNA二级结构最高值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有MFE RNA二级结构最高值的该分等级阵列中的mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
在本发明的其他方面,当选择一种mRNA用于如在此所述的感兴趣多肽的增强的生产,并且EFE是一种对于阵列中每个单独mRNA序列确定的参数(该参数被用于该阵列的单独mRNA序列的评等级中)时,于是该mRNA是选自具有EFE最高值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%(例如0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以是选自具有EFE最高值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有EFE最高值的分等级阵列中的mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
在本发明的其他方面,当选择一种mRNA用于如在此所述的感兴趣多肽的增强的生产,并且ED是一种对于阵列中的每个单独mRNA序列所确定的参数(该参数用来对该阵列中的单独mRNA序列评等级)时,于是该mRNA是选自具有ED最高值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%(例如0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合)。因此在本发明的另外方面,当选择一种mRNA用于如在此所述的感兴趣多肽的增强的生产时,该mRNA是选自具有ED最高值的分等级阵列中的mRNA序列的约0.0001%至约10%、约1%至约10%、约5%至约15%、约10%至约15%、约10%至约20%、约5%至约20%、或它们的任何组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有ED最高值的该分等级阵列中的mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
在本发明的仍其他的方面,当选择一种mRNA用于如在此所述的感兴趣多肽的增强的生产,并且FMFE RNA二级结构是一种对于阵列中每个单独mRNA序列确定的参数(该参数被用于该阵列的单独mRNA序列的评等级)时,于是该mRNA是选自具有FMFE RNA二级结构最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%(例如0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以选自具有FMFE RNA二级结构最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有FMFE RNA二级结构最低值的分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
本发明进一步提供了当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且BPP是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是该mRNA是选自具有BPP最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以选自具有BPP最高值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有BPP最高值的分等级阵列中的mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
在本发明的仍另外的方面,当选择一种mRNA用于如在此所述的感兴趣多肽的减少的生产,并且MFE RNA二级结构是一种对于阵列中每个单独mRNA序列确定的参数(该参数被用于该阵列的单独mRNA序列的评等级)时,于是该mRNA是选自具有MFE RNA二级结构最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%(例如0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有MFE RNA二级结构最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有MFE RNA二级结构最低值的该分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
在本发明的仍另外的方面,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且EFE是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是该mRNA是选自具有EFE最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有EFE最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有EFE最低值的分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
在本发明的一些方面,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且ED是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是该mRNA是选自具有ED最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%的mRNA。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有ED最低值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有ED最低值的分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合或范围。
在本发明的其他方面,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且FMFE RNA二级结构是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是该mRNA是选自具有FMFE RNA二级结构最高值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有FMFE RNA二级结构最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有FMFE RNA二级结构最高值的分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合或范围。
本发明进一步提供了当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且BPP是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是该mRNA是选自具有BPP最低值的分等级阵列中这些mRNA序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有BPP最低值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有BPP最低值的分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合或范围。
因此,在本发明的一些方面,提供了一种选择用于增强生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自具有MFERNA二级结构最高值以及FMFE RNA二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中,或选自具有如在室温下测量的在大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构以及FMFE RNA二级结构最低值的这些mRNA序列的mRNA之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以选自具有MFE RNA二级结构最高值以及FMFE RNA二级结构最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有MFE RNA二级结构最高值以及FMFE RNA二级结构最低值的分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
进一步地,在一些方面,本发明进一步包括除了对MFE和FMFE之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。因此,当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且BPP是确定的并且是根据联合分布用于对阵列中的单独mRNA序列进行评等级时,于是该mRNA是选自具有BPP最高值的分等级阵列中的这些序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以选自具有BPP最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有BPP最高值的分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
在本发明的另外方面提供了一种选择用于减少生产感兴趣多肽的mRNA的方法,该方法包括:a)制造一个阵列的包含编码该感兴趣多肽的不同的核苷酸序列的单独mRNA序列;b)对(a)中的每个单独mRNA序列的RNA二级结构最小自由能(MFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的RNA二级结构最小自由能频率(FMFE)进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自具有MFE RNA二级结构最低值以及RNA二级结构FMFE最高值的在从大约0.0001%至大约20%之间的该分等级阵列中的这些序列,或该mRNA序列是选自具有在室温下测量的在从大约-9kcal/mol至大约-18kcal/mol范围之内的MFE RNA二级结构以及RNA二级结构FMFE最高值的这些mRNA序列之中。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自该具有MFE RNA二级结构最低值以及FMFE RNA二级结构最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有MFE RNA二级结构最低值以及FMFE RNA二级结构最高值的分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
进一步地,在一些方面,本发明进一步包括除了对MFE和FMFE之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。在本发明的一些方面,该方法进一步包括除了对MFE和FMFE之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。因此,当选择一种mRNA用于在感兴趣多肽的减少的生产时,并且BPP被确定并且是根据联合分布用于对阵列中的单独mRNA序列进行评等级时,于是该mRNA是选自具有BPP最低值的分等级阵列中这些序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有BPP最低值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有BPP最低值的分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
本发明另外提供了一种选择用于增强生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;并且c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最高值以及FMFERNA二级结构最低值的分等级阵列中的大约0.0001%至大约20%的这些序列之中。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有EFE最高值以及FMFE RNA二级结构最低值的分等级阵列中这些mRNA序列的大约0.0001%至大约10%、大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
在本发明的一些方面,该方法进一步包括除了对EFE和FMFE之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。因此,当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且BPP被确定并且是根据联合分布用于对阵列中的单独mRNA序列进行评等级时,于是该mRNA是选自具有BPP最高值的分等级阵列中这些序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以选自具有BPP最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有BPP最高值的分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
在其他实施方案中,本发明提供了一种选择用于减少生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最低值以及FMFE RNA二级结构最高值的分等级阵列中的大约0.0001%至大约20%的这些序列之中。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有EFE最低值以及FMFE RNA二级结构最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有EFE最低值以及FMFE RNA二级结构最高值分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
在本发明的另外方面,该方法进一步包括除了对EFE和FMFE之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。因此,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且BPP是确定的并且是根据联合分布用于对阵列中的单独mRNA序列进行评等级时,于是该mRNA是选自具有BPP最低值的分等级阵列中这些序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有BPP最低值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有BPP最低值的分等级阵列中这些mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。
本发明的这些选择的mRNAs可以被进一步修饰以用于蛋白质生产。作为一个实例,在所选择的对感兴趣多肽进行编码的mRNA的起始密码子(AUG)中和/或起始密码子(AUG)周围的碱基配对可以被进一步修饰以使得该选择的mRNA的起始密码子更多开放(例如,具有用于蛋白质生产/翻译起始的较少的碱基配对或没有碱基配对)或更少开放(例如,具有更多的用于降低蛋白质生产/翻译起始的碱基配对)。将所选择的mRNA的起始密码子的碱基配对的量(即更多打开的或更少开放的)与对该感兴趣多肽进行编码的野生型(天然)mRNA的起始密码子作比较,或与对该多肽进行编码的第二mRNA(不同于该选择的mRNA(例如,第一mRNA))的起始密码子作比较。在本发明的另外的实施方案中,本发明中这些选择的mRNAs可以与其他修饰蛋白质生产的因子(例如转录和翻译增强子)组合。
在本发明的某些实施方案中,为了获得所希望水平的蛋白质生产,这些选择的mRNA序列被进一步改变(即突变),以所编码的该感兴趣多肽的氨基酸序列发生突变以结合成一种或多种无结果突变(nonconsequentialmutation)(例如一种或多种保守的氨基酸替换),这导致了所希望的mRNA的MFE值的改变以及对应的所希望的的蛋白质生产水平的改变。因此,尽管该突变的mRNA序列对突变的氨基酸序列进行编码,与野生型多肽序列相比,在该氨基酸序列中的突变没有改变该多肽的功能。
因此,在本发明的某些实施方案中,提供了对一种生物细胞中的感兴趣多肽的生产进行修饰的方法,该方法包括:(a)根据以上权利要求中任一项选择一种对感兴趣多肽进行编码的mRNA;(b)对(a)中mRNA的核苷酸序列进行突变以生产一种突变的mRNA,与(a)中mRNA的核苷酸序列的MFERNA二级结构相比,该突变的mRNA具有增加的或减少的MFE RNA二级结构,并且与(a)中mRNA编码的多肽序列相比,该突变的mRNA编码一种突变的多肽序列;其中该突变的多肽序列保留由(a)的mRNA编码的多肽的功能,并且与野生型mRNA序列相比在一种生物细胞中该突变的mRNA序列的表达导致该感兴趣多肽的修饰的生产。
保守的或无结果突变包括点突变(单个碱基核苷酸被另一个核苷酸置换)。导致无结果突变(即不影响功能)的点突变的类型在本领域中是熟知的(参见,例如D.Bordo和P.Argos,《对于在位点定向诱变中“安全”残基的替换的建议》(Suggestions for"Safe"Residue Substitutions in Site-DirectedMutagensis),《分子生物学期刊》(J.Mol.Biol.)217:721-729(1991);图2)。因此,例如,可以生成一个mRNA序列的阵列,其中保守位点突变被引入该mRNA序列并且可以从这个阵列中选择一种具有所希望的MFE值并对经突变但是仍保留野生型功能的(例如无结果突变)多肽进行编码的mRNA。因此,本发明中所选择的mRNA的MFE可以进一步地经对具有突变的mRNA序列进行突变来操作,从而导致多肽中的无结果突变。这类突变为用于获得所希望的蛋白质生产水平的用途的mRNA序列的选择提供了另外的灵活性。
在另外的实施方案中,可以通过使用优选的密码子进一步对该感兴趣多肽进行优化以提高在感兴趣的特定生物中的表达,或能够以优选的密码子使用频率使用密码子对该感兴趣多肽进行合成。因此,在某些实施方案中,这种基因的GC含量将会增加。参见,例如Campbell和Gowri(1990)《植物生理学》(Plant Physiol.)92:1-11中关于宿主优选密码子的使用的讨论。
可替代地,相对于野生型mRNA或另一个选择的mRNA的蛋白质生产,被认为可阻止或减慢翻译的稀有密码子对于调整(例如减少)蛋白质生产是有用的。基于具体物种对稀有密码子进行确定(即具体的密码子在一个物种中可能是稀有的但在另一个物种中不是稀有的)。因此,如在此使用的,“稀有密码子”是一种由tRNA编码的密码子,该tRNA具有占全体tRNAs的少于大约15%的丰度,这些全体tRNAs对在特定物种或在一种物种之内的细胞型中的特定氨基酸进行编码。因此,在本发明的某些实施方案中,根据本发明的这些方法选择的单独的mRNA序列可以包括在起始密码子附近的一种或多种稀有密码子。可替代地,在本发明的其他实施方案中,包含稀有密码子的mRNA序列可以从该阵列中去除。包含稀有密码子的序列的去除可以通过使用软件程序进行。
如在此使用的,“在起始密码子附近”是指那些编码最前12个氨基酸(AUG至+12氨基酸)的密码子。在多肽水平上,“在起始密码子附近”包括核苷酸1至+36。
如在此使用的,“一种/一个(a/an)”或“该”(the)可以表示一个或多于一个。例如,“一个”细胞可以表示一个单一的细胞或许多细胞。
如在此使用的,“和/或”表示并包括一个或多个相关地列出的项的任何的与所有的可能组合,并且当用可替代地(“或”)解释时组合的缺少。
此外,当提到一种可测量的值(例如本发明的一种化合物(如mRNA)或试剂的量、剂量、时间、百分比、温度、等等)时,在此使用的术语“大约”是指包括该指定量的±20%、±10%、±5%、±1%、±0.5%、或甚至±0.1%的变化。
如在此使用的,除非另外指明,术语“多肽”包括肽以及蛋白质两者。
如在此使用的,“分离的”多肽或多肽片段是指从天然发生的生物的至少一些其他组分中分离的或基本上游离的一种多肽或多肽片段,例如通常被发现是与该多肽相关联的细胞组分或其他多肽或核酸。
如在此使用的,过渡型短语“基本上由……组成”表示一种权利要求的范围是要解释为包括该权利要求中所述的指定材料或步骤以及并不实质上影响本发明的一种或多种基本特征或新颖特征的那些。因此,术语“基本上由……组成”当用于本发明的权利要求中时,并不意在解释为与“包括”(“comprising”)等同。
在此使用的术语“减少(reduce)”、“减少的(reduced)”、“减少(reducing)”、“减少(reduction)”、“减弱(diminish)”、以及“减少(decrease)”(以及其语法上的变体)描述的是由选择的mRNA编码的感兴趣多肽的生产的减少。这中种减少可以通过对选择的mRNA的感兴趣多肽的生产与编码相同的感兴趣多肽的野生型(即天然的)mRNA的感兴趣多肽的生产进行比较而观察到;或者可以通过对选择的mRNA的感兴趣多肽的生产与同所选择的mRNA编码相同的感兴趣多肽的另一个(第二)mRNA(不同于选择的(第一)mRNA)对该多肽的生产进行比较而观察到。
在此使用的术语“增强(enhance)”、“增强的(enhanced)”、“增强(enhancing)”、“增强(enhancement)”、“增加(increase)”(以及其语法上的变体)描述的是由选择的mRNA编码的感兴趣多肽的生产的增加。这种增加可以通过对选择的mRNA的感兴趣多肽的生产与野生型(即天然的)mRNA的感兴趣多肽的生产进行比较而观察到,该野生型mRNA与该选择的mRNA编码相同的感兴趣多肽;或者这种增加可以通过对选择的mRNA的感兴趣多肽的生产与另一个(第二)mRNA(不同于选择的(第一)mRNA)对该多肽的生产进行比较而观察到,该第二mRNA与该选择的mRNA编码相同的感兴趣多肽。
术语“调整(modulate)”、“调整(modulates)”、“调整的(modulated)”或“调整(modulation)”指的是指定的活性(例如调整的蛋白质生产)的增强(例如一种增加)或抑制(例如一种减少)。
感兴趣多肽可以是任意多肽。适合用于植物中表达的感兴趣多肽的非限制性实例包括导致农艺学上重要性状的那些,这些性状例如是除草剂抗性、病毒抗性、细菌性病原体抗性、昆虫抗性、线虫抗性、以及真菌抗性。参见例如美国专利号5,569,823、5,304,730、5,495,071、6,329,504、以及6,337,431。感兴趣的多肽还可以是导致植物活力或产量增加的多肽(包括允许植物在不同的温度、土壤条件以及日光和沉淀水平下生长的多肽),或是允许鉴定展现感兴趣的性状(例如,选择性标记基因、种皮颜色等)的植物的多肽。
除草剂抗性还有时被称为除草剂耐受性。赋予对抑制生长点或分生组织的除草剂(例如咪唑啉酮或磺酰脲)的抗性的基因可以是合适的。对于突变ALS和AHAS酶在这一分类号中的示例性基因如描述在例如在美国专利号5,767,366和5,928,937中。美国专利号4,761,373和5,013,659是针对抗不同的咪唑啉酮或磺酰脲除草剂的植物。美国专利号4,975,374涉及包含编码抵抗除草剂的抑制作用的谷氨酰胺合成酶(GS)突变体的基因的植物细胞以及植物,已知这些除草剂(例如草胺膦和蛋氨酸亚砜亚胺)抑制GS。美国专利号5,162,602披露了抵抗环己二酮和芳氧苯氧丙酸除草剂的抑制作用的植物。该抗性是由改变的乙酰辅酶A羧化酶(ACCase)赋予的。
由抗草甘膦的基因编码的感兴趣多肽也是适合的。参见例如美国专利号4,940,835和美国专利号4,769,061。美国专利号5,554,798披露了转基因抗草甘磷玉米植物,它的抗性是由改变的5-烯醇丙酮酰莽草酸-3-磷酸(EPSP)合成酶基因赋予的。
抵抗磷酰基化合物(例如草铵膦或草胺膦、以及吡啶氧丙酸或苯氧丙酸以及环己酮)的基因也是适合的。参见欧洲专利申请号0242246。还参见美国专利号5,879,903、5,276,268和5,561,236。
其他合适的除草剂包括抑制光合作用的那些,例如三嗪和苯基氰(腈水解酶)。参见美国专利号4,810,648。其他适合的除草剂包括2,2-二氯丙酸、稀禾定、吡氟氯禾灵、咪唑啉酮除草剂、磺酰脲除草剂、三唑嘧啶除草剂、均三嗪除草剂以及溴草腈。同样适合的是赋予对原卟啉原氧化酶的抗性或者提供增强的对植物疾病的抗性、增强的对不利环境条件(非生物胁迫)的耐受性(这些条件包括但不限于干旱、极冷、极热、或极端的土壤盐度或极端的酸度或碱度)、以及在植物构型或发育中的改变(包括发育时间方面的变化)的基因。参见例如美国专利申请公开号2001/0016956和美国专利号6,084,155。
对本发明有用的杀虫蛋白可以按一个足以控制昆虫害虫的量(即昆虫控制量)进行表达。应当理解的是,在植物中对控制昆虫必要的杀虫蛋白的表达量可以变化,这取决于栽培变种、昆虫的类型、环境因素等。对于昆虫抗性或害虫抗性有用的基因包括,例如编码在杆菌生物体中已鉴定的毒素的基因。已经克隆了编码来自几个亚种的苏云金芽孢杆菌(Bacillus thuringiensis,Bt)毒素的基因,并且已经发现这些重组克隆对鳞翅类、双翅类和鞘翅类昆虫幼虫是有毒的(例如不同的δ-内毒素基因例如Cry1Aa、Cry1Ab、Cry1Ac、Cry1B、Dy1C、Cry1D、Cry1Ea、Cry1Fa、Cry3A、Cry9A、Cry9C以及Cry9B;连同编码营养期杀虫蛋白例如Vip1、Vip2和Vip3的基因)。Bt毒素的完整清单可以在万维网在苏塞克斯大学维护的苏芸金芽胞杆菌毒素命名法数据库中找到(也参见,例如克里克摩尔(Crickmore)等人(1998)《微生物分子生物学综述》(Microbiol.Mol.Biol.Rev.)62:807-813)。
适合于在植物中表达的的感兴趣的多肽进一步包括改进或通过其他方式有助于所收获的甘蔗转化成为一种商业上有用的产品(包括例如增加的或改变的碳水化合物含量和/或分布、改进的发酵特性、增加的油含量、增加的蛋白含量、提高的消化率、以及增加的营养成分含量(例如,增加的植物甾醇含量、增加的生育酚含量、增加的甾烷醇含量或增加的维生素含量))的那些多肽。感兴趣的多肽还包括,例如在一种收获的作物中导致或促成不需要的成分,例如植酸、或降解糖的酶类的含量降低的那些多肽。“导致”或“促成”意指这种感兴趣的多肽可以直接地或间接地促成一种感兴趣的性状的存在(例如,通过异源表达一种纤维素酶来增加纤维素的降解)。
在一个实施方案中,感兴趣的多肽促成了改进的食品或饲料的可消化度。木聚糖酶是半纤维素分解酶,这些酶改进了植物细胞壁的分解,这导致动物更好地利用这些植物营养素。这导致了改进的生长率和饲料转化。同样,可以减小包含木聚糖的饲料的粘度。木聚糖酶在植物细胞中的表达还可以潜在地作用以协助在工业加工中木质纤维素到可发酵糖的转化。
众多的来自真菌和细菌微生物的木聚糖酶已经被鉴别并表征(参见例如美国专利号5,437,992;Coughlin,等人(1993);“关于里氏木霉以及其他水解酶的第二次TRICEL讨论会会刊”(“Proceedings of the Second TRICELSymposium on Trichoderma reesei Ceilulases and Other Hydrolases”),Espoo;Souminen和Reinikainen编写(1993),《生物技术以及工业发酵研究基础》(Foundation for Biotechnical and Industrial Fermentation Research)8:125-135(1993);美国专利申请公开号2005/0208178;以及WO03/16654)。特别地,在里氏木霉(T.reesei)中已经鉴定出三个特异性的木聚糖酶(XYL-I、XYL-II、以及XYL-III)(Tenkanen等人,(1992)《微生物酶技术》(EnzymeMicrob.Technol.)14:566;Torronen等人,(1992)《生物/工程》Bio/Technology10:1461;以及Xu,等人,(1998)《应用微生物生物技术》(Appl.Microbiol.Biotechnol.)49:718)。
在另一个实施方案中,该感兴趣的多肽是一种多糖降解酶。此类植物可以用于产生例如用于生物加工的发酵原料。在一些实施方案中,对于发酵工艺有用的酶类包括α淀粉酶类、蛋白酶类、支链淀粉酶类、异淀粉酶类、纤维素酶类、半纤维素酶类、木聚糖酶类、环糊精糖基转移酶类(glycotransferases)、脂肪酶类、植酸酶类、漆酶类、氧化酶类、酯酶类类、角质酶类(cutinases)、颗粒淀粉水解酶类和其他葡糖淀粉酶类。
多糖降解酶包括:淀粉降解酶类,例如,α-淀粉酶类(EC3.2.1.1)、葡萄糖醛酸酶类(E.C.3.2.1.131);外切1.4-α-D葡聚糖酶类,例如淀粉糖化酶类以及葡糖淀粉酶(EC3.2.1.3)、β-淀粉酶类(EC3.2.1.2)、α-糖苷酶类(EC3.2.1.20)、以及其他外切型淀粉酶类;以及淀粉脱支酶类,例如a)异淀粉酶(EC3.2.1.68)、支链淀粉酶(EC3.2.1.41)、以及类似物;b)纤维素酶类,例如外切-1,4-3-纤维素二糖水解酶(EC3.2.1.91)、外切-1,3-β-D-葡聚糖酶(EC3.2.1.39)、β-糖苷酶(EC3.2.1.21);c)L-阿拉伯糖酶类(arabinases),例如内切-1,5-α-L-阿拉伯糖酶(EC3.2.1.99)、α-阿拉伯糖苷酶类(EC3.2.1.55)以及类似物;d)半乳聚糖酶类(galactanases),例如内切-1,4-β-D-半乳聚糖酶(EC3.2.1.89)、内切-1,3-β-D-半乳聚糖酶(EC3.2.1.90)、α-半乳糖苷酶(EC3.2.1.22)、β-半乳糖苷酶(EC3.2.1.23)以及类似物;e)甘露聚糖酶类(mannanases),例如内切-1,4-β-D-甘露聚糖酶(EC3.2.1.78)、β-甘露糖苷酶(EC3.2.1.25)、α-甘露糖苷酶(EC3.2.1.24)以及类似物;f)木聚糖酶类,例如内-1,4-β-木聚糖酶(EC3.2.1.8)、β-D-木糖苷酶(EC3.2.1.37)、1,3-β-D-木聚糖酶、以及类似物;g)其他酶类,例如α-L-岩藻糖苷酶(EC3.2.1.51)、α-L-鼠李糖苷酶(EC3.2.1.40)、果聚糖酶(EC3.2.1.65)、菊粉酶(EC3.2.1.7)、以及类似物。
其他可以使用的额外的酶类包括蛋白酶类,例如真菌和细菌蛋白酶类。真菌蛋白酶类包括但不限于从曲霉属、木霉属、毛霉属以及根霉属(例如黑曲霉、泡盛曲霉(A.awamori)、米曲霉、以及米黑毛霉(M.miehei))获得的那些酶类。在某些实施方案中,该感兴趣多肽是纤维二糖水解酶(CBH)酶类(EC3.2.1.91)。在一个实施方案中,该纤维二糖水解酶是CBH1或CBH2。
其他酶类(感兴趣多肽)包括但不限于:半纤维素酶类,例如甘露聚糖酶类以及阿拉伯呋喃糖酶类(EC3.2.1.55);木素酶类;脂肪酶类(例如,E.C.3.1.1.3)、葡萄糖氧化酶类、果胶酶类、木聚糖酶类、转葡萄糖苷酶类、α1,6糖苷酶类(例如,E.C.3.2.1.20);酯酶类,例如阿魏酸酯酶(EC3.1.1.73)以及乙酰基木聚糖酯酶类(EC3.1.1.72);以及角质酶类(例如,E.C.3.1.1.74)。
在本发明的某些实施方案中,感兴趣多肽进一步包括一种前导肽。如在本领域中所熟知的,前导肽是一种由更大开放的阅读框的上游(5'端编码序列)编码的肽。可以用本发明的这些方法使用任何前导肽。前导肽可以是一种天然发现的肽或可以是一种被设计具有前导肽功能的合成肽。
因此,在本发明的某些实施方案中,感兴趣多肽包括一种前导肽,并且因此该编码感兴趣多肽的mRNA的5'端包括一种前导序列,该前导序列对一个开放阅读框的前导肽上游(5'端编码序列)进行编码。因此,在某些实施方案中,由这些单独mRNA序列的阵列对融合于感兴趣多肽的前导序列进行编码,这些mRNA序列包括对该感兴趣多肽进行编码的不同核苷酸序列。在某些实施方案中,可以通过对融合于该感兴趣多肽的前导序列的表达的调整而对该感兴趣多肽的生产进行调整。因此,根据本发明的任意方法选择一种编码前导肽的mRNA并且将该前导肽融合于该感兴趣多肽中。通过调整该前导肽的表达,可以对该前导序列融合到其中的多肽的表达进行调整。因此,可以对该感兴趣多肽的表达进行调整,而不用改变编码该感兴趣多肽的核苷酸序列或该感兴趣多肽的氨基酸序列。
前导肽的非限制性实例包括信号肽、转运肽、靶向肽、信号序列、以及类似物。如在本领域中熟知的,信号/转运肽将由一种核基因编码的蛋白质靶向或运送至特定的细胞器,这些细胞器例如线粒体、质体(如顶质体(apicoplast)、色质体、叶绿体、蓝色小体、类囊体、造粉体、以及类似物)、微体(如单膜界定的小细胞器,诸如过氧化物酶体、氢化酶体、乙醛酸循环体、以及糖酵解酶体)。
前导肽在本领域中是熟知的,并且可以在公共数据库中找到,例如:“信号肽网址:信号序列以及信号肽的信息平台”(www.signalpeptide.de);“信号肽数据库(Signal Peptide Database)”(proline.bic.nus.edu.sg/spdb/index.html)(Choo等人,《BMC生物信息学》(BMC Bioinformatics)6:249(2005))(在www.biomedcentral.com/1471-2105/6/249/abstract中是可获得的);ChloroP(www.cbs.dtu.dk/services/ChloroP/;预测在蛋白质序列中叶绿体转运肽(cTP)的存在以及潜在cTP切割位点的位置);LipoP(www.cbs.dtu.dk/services/LipoP/;预测革兰氏阴性菌中的脂蛋白以及信号肽);MITOPROT(mg2.helmholtz-muenchen.de/ihg/mitoprot.html;预测线粒体的靶向序列);PlasMit(gecco.org.chemie.unifrankfurt.de/plasmit/index.html;预测镰状疟原虫中的线粒体转运肽);Predotar(urgi.versailles.inra.fr/predotar/predotar.html;预测线粒体以及质体的靶向序列);PTS1(mendel.imp.ac.at/mendeljsp/sat/ptsl/PTSlpredictor.jsp;预测包含蛋白质的过氧化物酶体的靶向信号1);SignalP(www.cbs.dtu.dk/services/SignalP/;预测来自不同生物的氨基酸序列中的信号肽切割位点的存在以及位置,这些生物是:革兰氏阳性原核生物、革兰氏阴性原核生物、以及真核生物。该方法基于一些人工神经网络以及隐马尔可夫模型,将对切割位点的预测与信号肽/非信号肽的预测结合在一起);以及TargetP(www.cbs.dtu.dk services/TargetP/;预测真核蛋白质的亚细胞的位置-该位置分配是基于预测的任何N-末端的前序列的存在,这些N-末端的前序列为叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP))。(还参见,von Heijne,G.,《欧洲生物化学期刊》(Eur J Biochem)133(1)17-21(1983);Martoglio等人,《细胞生物学动向》(Trends Cell Biol)8(10):410-5(1998);Hegde等人,《生物化学科学动向》(Trends Biochem Sci)31(10):563-71(2006);Dultz等人,《生物化学期刊》(J Biol Chem)283(15):9966-76(2008);Emanuelsson等人,《自然研究步骤期刊》(Nature Protocols)2(4)953-971(2007);Zuegge等人,280(1-2):19-26(2001);Neuberger等人,《分子生物学期刊》(J Mol Biol)328(3):567-79(2003);以及Neuberger等人,《分子生物学期刊》(J Mol Biol)328(3):581-92(2003))。
具体的转运肽的非限制性实例在表1中提供。
表1.将蛋白质定向至不同细胞器(包括叶绿体、内质网、过氧化物酶体、线粒体以及液泡)的前导肽。
在此使用的术语“核苷酸序列”是指核苷酸杂聚物或这些从5'端至3'端核酸分子的核苷酸序列,并且包括DNA或RNA分子(包括cDNA、DNA片段、合成的(例如化学合成的)DNA、mRNA、以及反义RNA,这些中的任意一项可以是单链或双链的)。术语“核苷酸序列”、“核酸”、“核酸分子”、“寡核苷酸”以及“多核苷酸”在此可互换地使用,指的是核苷酸的杂聚物。
本发明的核酸可以包括能在序列上与天然发生的(即天然的或野生型)序列相同的核苷酸序列,或因核酸密码的良好表征的退化可以包括替代的密码子,这些替代的密码子编码对与天然发生的序列中发现的相同的氨基酸。此外,本发明的核酸可以包括能包含表示氨基酸保守取代(在本领域中是熟知的)的密码子的核苷酸序列,这样就保持了所得多肽和/或片段的生物活性。本发明的核酸可以是单链或双链。此外,本发明的核酸还可以包括与核酸序列的一部分部分地互补或者与全长核酸序列完全互补的一种核酸链。在此提供的核酸序列在此是以从左至右5'至3'的方向表示,并且它们是通过使用标准密码用于表示核苷酸特征,如在美国序列法则,37CFR§§1.821-1.825以及世界知识产权组织(WIPO)标准ST.25中提出的。
在此使用的术语“基因”是指能够被用来生产mRNA或反义RNA的核酸分子。基因可以或可以不能够被用来生产功能蛋白质。基因可以包括编码区以及非编码区(例如内含子、调节元件、启动子、增强子、末端序列以及5'和3'非翻译区)两者。基因可以是“分离的”,意思是一种实质上或基本上游离于一些组分之外的核酸,通常发现这些组分与在天然状态中的核酸相关联。这类组分包括其他细胞材料、来自重组生产的细胞基质、和/或用于化学合成该核酸的不同化学物。
本发明的“分离的”核酸通常是游离于位于生物基因组DNA的感兴趣核酸侧翼(flank)的核酸序列之外,核酸是从该生物中衍生(例如展现在5'或3'端的编码序列)。但是,本发明的核酸可以包括一些不会对该核酸的基本结构的和/或功能的特征造成有害影响的另外的碱基或部分。“分离的”不是意为该制品是工业纯(均匀的)。
因此,“分离的核酸”是一种核苷酸序列,该核苷酸序列不与在其衍生而来的生物的天然发生的基因组中的与其直接邻近(位于5'末端的或位于3'末端的)的核苷酸序列直接相邻。因此,在一个实施方案中,一个分离的核酸包括一些或全部的5'非编码(例如,启动子)序列,这些序列紧接一个编码序列。该术语因此包括,例如,一种重组核酸,它整合进入一种载体、进入一种自我复制的质粒或病毒、或进入一种原核生物或真核生物的基因组DNA,或者它作为独立于其他序列的一种单独分子(例如,一种cDNA或一种利用PCR或限制性内切核酸酶处理所得到的基因组DNA片段)而存在。它还包括一种重组核酸,该重组核酸是编码一种另外的多肽或肽序列的混合核酸的部分。
在此使用的术语“转基因”是指任何用于植物、动物、或其他生物的转化中的核酸序列。因此,转基因可以是编码序列、非编码序列、cDNA、基因或其片段或其部分、基因组序列、调节元件以及类似物。“转基因”生物(例如转基因植物、转基因微生物、或转基因动物)是一种转基因已经被递送或引入其中的生物,并且该转基因可以在转基因生物中表达以生产一种产物,该产物的存在可以给予该生物一种效应和/或表型。
在此使用的术语“互补的”或“互补性”,是指多核苷酸在容许的盐和温度条件下通过碱基配对的天然结合。例如,序列“A-G-T”与互补序列“T-C-A”结合。在两个单链分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当完全的互补性存在于单链分子之间时该互补性可以是完全的。在核酸链之间的互补性程度对核酸链之间杂交的效率和强度具有重要作用。
在此具有同源性的不同的核酸或蛋白质是指“同源物”。术语同源物包括来自相同以及其他物种的同源序列,以及来自相同以及其他物种的直系同源序列(orthologous sequence)。“同源性”是指在两种或更多种核酸和/或氨基酸序列之间的以位置一致性的百分比为形式(即序列相似性或一致性)的相似性水平。同源性还指在不同核酸或蛋白质中的相似的功能特性的概念。
在此使用的“序列一致性”是指两个最优比对的多核苷酸或肽序列通过组分(例如核苷酸或氨基酸)的比对窗口在多大程度是不变的。对于测试序列和参照序列的比对区段的“一致性部分”等于由这两个比对序列共享的一致组分的数目除以被参照序列区段(即整个参照序列或该参照序列的更小的限定部分)中的组分的总数。在此使用的术语“序列一致性百分比”或“一致性百分比”是指当测试和参照多核苷酸分子两个序列最优比对时(用适当的核苷酸插入、缺失,或通过比较窗口总计少于20%的参照序列的缺口(gap)),在参照(“查询”)多核苷酸分子(或它的互补链)与测试(“受试”)多核苷酸分子(或它的互补链)的线性多核苷酸序列中相比具有的相同核苷酸的百分比。在某些实施方案中,“一致性百分比”可以是指在一个氨基酸序列中相同氨基酸的百分比。
用于对齐比较窗口的序列优化比对,对于本领域中的普通技术人员是熟知的,并且可以通过以下工具进行:例如通过Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源比对算法、Pearson和Lipman的相似性法的搜索,以及可任选的是通过这些算法(诸如可获得的GAP、BESTFIT、FASTA、以及TFASTA,
Figure BDA00002825870000481
Figure BDA00002825870000482
(Accelrys公司,伯灵顿,Mass.)的部分)的计算机化实施。对于测试序列和参照序列的比对区段的“一致性部分”是由这两个比对序列共享的一致组分的数目除以被参照序列区段(即整个参照序列或该参照序列的更小的限定部分)中的组分的总数。序列一致性百分比表示为该一致性部分乘以100。一种或多种多核苷酸序列的比较可以是对于全长多核苷酸序列或其部分、或对于更长的多核苷酸序列。为了本发明的目的,“一致性百分比”还可以通过使用用于被翻译的核苷酸序列的BLASTX2.0版本以及用于多核苷酸序列的BLASTN2.0版本确定。
序列一致性的百分比可以通过使用序列分析软件包TM(版本10;遗传学计算机集团公司(Genetics Computer Group,Inc.),麦迪逊,威斯康星州)的“Best Fit(最佳拟合)”或“Gap(缺口)”程序确定。“Gap(缺口)”使用Needleman和Wunsch的算法(Needleman和Wunsch,《分子生物学期刊》(JMol Biol.)48:443-453,1970)去得到两个序列的比对,该比对使匹配数目最大化并且使缺口数目最小化。“BestFit(最佳拟合)”通过使用Smith和Waterman的局部同源性算法(Smith和Waterman,《应用数学进展》(Adv.Appl.Math.),2:482-489,1981,Smith等人,《核酸研究》(Nucleic Acids Res.)11:2205-2220,1983),执行了在两个序列之间的相似性的最优比对,并且插入缺口以使匹配数目最大化。
用于确定序列一致性的有用的方法还披露在《大型电脑指南》(Guide toHuge Computers)(Martin J.Bishop,编写,学术出版社(Academic Press),圣地亚哥(1994))、以及Carillo,H.,和Lipton,D.,(《应用数学》(Applied Math)48:1073(1988))中。更具体地,优选的用于确定序列一致性的电脑程序包括但不限于:公共可获得的来自国家生物技术信息中心(National CenterBiotechnology Information,NCBI)基本局部比对搜索工具(Basic LocalAlignment Search Tool,BLAST),该NCBI是在美国国立卫生研究院(贝塞斯达,马里兰州,20894)的国家医学库中;参见BLAST手册,Altschul等人,NCBI,NLM,NIH;(Altschul等人,《分子生物学期刊》(J.Mol.Biol.)215:403-410(1990));2.0版本或更高版本的BLAST程序允许缺口(缺失或插入)引入比对中;对于肽序列可以使用BLASTX对序列一致性进行确定;并且对于多核苷酸序列可以使用BLASTN对序列一致性进行确定。
在此使用的术语“启动子”是指一种核苷酸序列的区域,该区域的核苷酸结合了必要的信号用于编码序列的有效表达。这可以包括RNA聚合酶结合到其上的序列(但不限于此类序列),并且可以包括其他调节蛋白结合到其上的区域、连同涉及蛋白质的翻译控制的区域,并且还可以包括编码序列。
此外,本发明的“启动子”是能够在一种感兴趣的细胞或生物(例如动物、植物、微生物)中起始转录的启动子。此类启动子包括在本领域中已知的这些不同类型的启动子:组成型地驱动核酸序列表达的那些、当诱导时驱动表达的那些、以及以一种组织特异性或发育特异性的方式驱动表达的那些。
在此使用的术语“转化”是指将一种异源核酸引导入一种细胞中。细胞的转化可以是稳定的或瞬时的。术语“瞬时转化”或“瞬时转化的”是指将一种或多种异源核酸引导入细胞中,其中该异源核酸从一代到另一代不是可遗传的。
“稳定转化”或“稳定转化的”是指将异源核酸整合入生物的基因组中或将异源核酸整合入细胞或生物的细胞中(例如通过一种质粒),这样该异源核酸在重复传代中是可遗传的。因此,在本发明的一个实施方案中,生产了一种稳定转化的生物。在本发明的其他实施方案中,生产了一种稳定转化的植物。
瞬时转化可以通过例如酶联免疫吸附试验(ELISA)或Western blot检测,其中(ELISA)或Western blot可以检测由引导入生物中的一种或多种转基因编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞基因组DNA的Southern印迹杂交试验检测,该细胞基因组DNA具有的核酸序列与引导入生物中(例如一种植物)的转基因核苷酸序列进行特异性杂交。细胞的稳定转化可以通过例如细胞RNA的Northern印迹杂交试验检测,该细胞RNA具有的核酸序列与引导入植物或其他生物中的转基因核苷酸序列进行特异性杂交。细胞的稳定转化可以通过例如使用特异性引物序列的聚合酶链式反应(PCR)或其他在本领域中熟知的扩增反应进行检测,该特异性引物序列与转基因的一种或多种靶序列进行杂交从而导致可以根据标准方法检测到的转基因序列的扩增。转化还可以通过在本领域中熟知的直接测序和/或杂交方案检测。
可以通过本领域普通技术人已知的任意方法将本发明的核酸(例如选择的mRNA)引导入细胞中。在本发明的某些实施方案中,细胞的转化包括核转化。在其他实施方案中,细胞的转化包括质体转化(例如叶绿体转化)。因此,根据本发明的这些方法选择的mRNAs可以通过使用本领域的普通技术人员已知的方法用于转化任意生物。
转化多种多样的生物(包括但不限于细菌、蓝细菌、动物、植物、真菌、以及类似物)的步骤在本领域中是熟知的并且其描述贯穿本文献。作为一个实例,此类用于植物转化的方法包括但不限于通过以下项的转化:细菌介导的核酸递送(例如,通过土壤杆菌)、病毒介导的核酸递送、碳化硅或核酸晶须介导的核酸递送、脂质体介导的核酸递送、显微注射、微粒轰击、电穿孔、超声处理、浸润(infiltration)、PEG介导的核酸摄入、以及任何其他的电的、化学的、物理的(机械的)和/或生物机制,这些机制导致将核酸引导入植物细胞中,包括其任意组合。对与不同植物转化方法的概述指南在本领域中是已知的,这些指南包括Miki等人的“用于将外源DNA引导入植物中的步骤”(在《植物分子生物学与生物技术方法》(Methods in Plant MolecularBiology and Biotechnology),Glick,B.和Thompson,J.E.编写,CRC出版公司,波卡拉顿,1993,67-88页中)以及Rakowoczy-Trojanowska(《细胞分子生物学学报》(Cell Mol.Biol.Lett.)7:849-858(2002))。
术语“载体”是指一种用于将核酸(或多种核酸)转运、递送或引导入细胞中的组合物。载体包括含有待转运、递送或引入的核苷酸序列的核酸。在某些实施方案中,本发明的载体可以是一种病毒载体,该病毒载体可以包括例如病毒衣壳和/或其他用于协助核酸进入细胞中和/或协助该载体的核酸在细胞中进行复制的材料(例如逆转录酶,或其他包裹在病毒衣壳中、或作为病毒衣壳部分的酶)。病毒载体可以是侵染性的病毒颗粒,该病毒颗粒将核酸递送至细胞中随后该细胞被该病毒颗粒侵染。
因此,在本发明的具体实施方案中,可以通过本领域中已知的以及在此所述的任何方法对植物细胞进行转化,并且通过使用多种已知的技术可以使完整的植物从这些转化的细胞中再生。从植物细胞、植物组织培养物和/或培养的原生质体中的植物再生描述于,例如Evans等人(《植物细胞培养手册》(Handbook of Plant Cell Cultures),卷1,MacMilan出版公司,纽约(1983));以及Vasil I.R.(编写)(《植物的细胞培养与体细胞遗传学》(Cell Culture andSomatic Cell Genetics of Plants),Acad.出版社,Orlando,卷I(1984)、以及卷II(1986))中。用于转化的转基因植物、植物细胞和/或植物组织培养物的选择方法在本领域中是常规的,并且可以在本文提供的发明的这些方法中使用。
因此,在本发明的某些实施方案中,通过使用在此描述的这些方法选择的对感兴趣多肽进行编码的mRNA可以被引导入真核细胞中以生产一种转基因真核细胞或转基因真核生物,由此与野生型(即天然的)mRNA生产的蛋白质的量相比,该mRNA生产的感兴趣多肽的量增加或减少,该野生型mRNA与根据本发明的这些方法选择的mRNA编码相同的感兴趣多肽。在本发明的其他实施方案中,通过使用在此描述的这些方法选择的对感兴趣多肽进行编码的一种第一mRNA可以被引导入真核细胞中以生产一种转基因真核细胞或转基因真核生物,由此与一种第二mRNA生产的蛋白质的量相比,该第一mRNA生产的感兴趣多肽的量增加或减少,其中该第二mRNA是通过使用在此描述的这些方法选择的并且与该第一mRNA编码相同的感兴趣多肽。
在另外的实施方案中,通过使用在此描述的这些方法选择的对感兴趣多肽进行编码的mRNA可以如在此所述的被用于修饰(增强或减少)内源核苷酸序列(例如存在于在基因组中的)的蛋白质生产,该内源核苷酸序列与通过使用在此描述的这些方法选择的mRNA编码相同的感兴趣多肽。因此,在本发明的某些实施方案中,提供了对一种生物细胞中的感兴趣多肽的生产进行修饰的方法,该方法包括:(a)根据本发明的这些方法选择一种对感兴趣多肽进行编码的mRNA;(b)对在这种根据(a)选择的mRNA的核苷酸序列与一种所述有机体的野生型内源核苷酸序列之间的差别进行鉴别,其中该野生型内源核苷酸序列与这种根据(a)选择的mRNA编码相同的感兴趣多肽;并且(c)对这种编码该感兴趣多肽的内源核苷酸序列进行原位突变以将(b)中所鉴别的核苷酸的每个差别合并进该内源核苷酸序列中,由此在该有机体的细胞中来自该原位突变的内源核苷酸序列的该感兴趣多肽的生产被修饰。对核苷酸序列进行原位修饰的方法在本领域中是已知的。因此,例如锌指核酸酶可以如Cai等人(《植物分子生物学》(Plant Mol Biol.)69(6):699-709(2009))所述的被用于驱动至天然核苷酸序列中的DNA定点整合。
基因靶向以及基因组DNA修饰还可以通过使用本领域的普通技术人员已知的录激活(TAL)样的效应物核酸酶来完成。WO10054348,Shornack,S.等人,“基因-用于gen介导的对核靶向的类AvrBs细菌效应物蛋白的识别”(“Gene-for gen mediated recognition of nuclear-targeted AvrBs-like bacterialeffector proteins”),《植物生理学期刊》(Journal of Plant Physiology),163(2006)256-272,Boch等人,“破译TAL III型效应蛋白的DNA结合特异性的密码”(“Breaking the code of DNA binding specificity of TAL-type III effectors”),《自然》(Science),326卷,2009年12月。
还在此提供了一种转基因生物,该转基因生物包括、实质上由和/或由本发明的一种或多种核酸构建体组成。此外在此提供了一种包括本发明的转化细胞的转基因生物。
在具体实施方案中,还提供了一种转基因植物,该转基因生物包括、实质上由和/或由本发明的一种或多种核酸构建体组成。此外在此提供了一种包括本发明的转化植物细胞的转基因植物。
此外在此提供了本发明的转基因植物的转基因种子、转基因花粉粒以及转基因胚珠。另外提供了一种本发明的转基因植物的可再生的转基因细胞的组织培养物。
本发明进一步提供了一种选择用于增强生产感兴趣多肽的mRNA的方法,该方法包括确定对该感兴趣多肽进行编码的mRNA核苷酸序列,其中该mRNA具有一种二级结构,该二级结构包括少于四个的配对碱基核苷酸以及含有无配对碱基核苷酸的起始密码子。
此外在此提供了一种选择用于减少生产感兴趣多肽的mRNA的方法,该方法包括确定对该感兴趣多肽进行编码的mRNA核苷酸序列,其中该mRNA具有一种二级结构,该二级结构包括至少6个配对碱基核苷酸以及含有至少一个配对碱基的起始密码子。
在其他实施方案中,本发明提供了一种选择用于生产感兴趣多肽的mRNA的计算机实施的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;
b)对(a)每个单独mRNA序列确定一种或多种下列参数:(i)整体自由能(EFE);(ii)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及(iii)整体多样性(ED);c)根据在步骤(b)中确定的这些参数,
对该阵列中的这些单独mRNA序列评等级;并且d)选择来自步骤(c)的分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。
在另外的实施方案中,本发明提供了一种选择用于生产感兴趣多肽的mRNA的计算机实施的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;c)对(a)每个单独mRNA序列确定一种或多种下列参数:(i)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。
在其他实施方案中,本发明提供了一种选择用于生产感兴趣多肽的mRNA的计算机实施的方法,该方法包括:a)生产一个阵列的单独的mRNA序列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)进行确定;c)对(a)中的每个单独mRNA序列的一种或多种下列参数进行确定:(i)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。
根据本发明的实施方案提供了一种选择用于增强生产感兴趣多肽的mRNA的计算机实施的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;以及d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自具有MFE RNA二级结构最高值以及FMFE RNA二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中,或选自具有在室温下测量的在从大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构以及FMFERNA二级结构最低值的这些mRNA序列的mRNA之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
在其他实施方案中,提供了一种选择用于减少生产感兴趣多肽的mRNA的计算机实施方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有MFE RNA二级结构最低值以及FMFE RNA二级结构最高值的分等级阵列中的大约0.0001%至大约20%的这些序列之中,或选自具有在室温下测量的在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构以及FMFE RNA二级结构最高值的这些mRNA序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的减少生产。
在本发明的仍其他方面提供了一种选择用于增强生产感兴趣多肽的mRNA的计算机实施的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;并且c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最高值以及FMFE RNA二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
本发明的另外实施方案提供了一种选择用于减少生产感兴趣多肽的mRNA的计算机实施的方法,这些方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最低值以及FMFE RNA二级结构最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
本发明进一步提供了一种选择用于生产感兴趣多肽的mRNA的计算机实施的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;c)根据在(b)中该确定的MFERNA二级结构,从最高的MFE RNA二级结构至最低的MFE RNA二级结构,对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自下列各项:具有在从大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构的mRNAs组,具有在从大约-2kcal/mol至大约-9kcal/mol范围内的MFE RNA二级结构的mRNAs组,或具有在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构的mRNAs组,其中该选择的mRNA生产该感兴趣多肽。
此外提供了一种选择用于增强生产感兴趣多肽的mRNA的计算机实施的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;并且c)选择(a)中的一种具有在从大约0kcal/mol至大约-2kcal/mol范围内的MFERNA二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
在本发明的另外一方面中,提供了一种选择用于减少生产感兴趣多肽的mRNA的计算机实施的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的表达水平进行确定;c)选择(a)中的一种具有在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
在本发明的某些实施方案中,提供了对一种生物细胞中的感兴趣多肽的生产进行修饰的计算机实现的方法,该方法包括:(a)根据本发明的这些方法选择一种对感兴趣多肽进行编码的mRNA;(b)对(a)中的该mRNA的核苷酸序列进行突变以生产一种突变的mRNA,与(a)中mRNA的核苷酸序列的MFE RNA二级结构相比,该突变的mRNA具有增强的或减少的MFE RNA二级结构,并且与(a)中mRNA编码的多肽序列相比,该突变的mRNA编码一种突变的多肽序列;其中该突变的多肽序列保留由(a)的mRNA编码的多肽的功能,并且在一种生物细胞中该突变的mRNA序列与野生型mRNA序列相比其表达导致该感兴趣多肽的修饰的生产。
在本发明的另外的实施方案中,提供了对一种生物细胞中的感兴趣多肽的生产进行修饰的计算机实现的方法,该方法包括:(a)根据本发明的这些方法选择一种对感兴趣多肽进行编码的mRNA;(b)对在这种根据(a)选择的mRNA的核苷酸序列与一种所述有机体的野生型内源核苷酸序列之间的差别进行鉴别,其中该野生型内源核苷酸序列编码一种与这种根据(a)选择的mRNA编码的多肽相同的感兴趣多肽;并且(c)对这种编码该感兴趣多肽的内源核苷酸序列进行原位突变以将(b)中所鉴别的核苷酸的每个差别合并到该内源核苷酸序列中,由此在该有机体的细胞中来自该原位突变的内源核苷酸序列的该感兴趣多肽的生产被修饰。
在某些实施方案中,提供了用于执行在此所述的这些方法的系统和/或电脑程序产品。因此,根据本发明的实施方案,参照方法中的框图和/或流程图、仪器(系统)和/或计算机程序产品,对本发明描述如下。应理解的是每个框图和/或流程图、以及这些框图中框的组合和/或流程图可以用计算机程序指令执行。可以将这些计算机程序指令提供给通用计算机的、专用计算机的、和/或其他可编程的数据处理仪器(可生产一种机器)的处理器,这样经计算机的和/或其他可编程的数据处理仪器的计算机的处理器执行的这些指令创建一种工具,该工具是用于框图和/或流程框或框中限定的功能/行为的实现。
这些计算机程序指令还可以存储在计算机可读存储器中,该存储器可以指导计算机或其他可编程的数据处理仪器以用一种特殊的方式发挥功能,这样存储在计算机可读存储器中的这些指令生产一件包括指令的产品,这些指令实施了框图和/或流程框图或框中指定的功能/行为。
这些计算机程序指令还可以加载在计算机或其他可编程的数据处理仪器上以引起一系列的在计算机上或其他可编程的仪器上执行的运算步骤来产生一个计算机实施的过程,这样在该计算机上或其他可编程的仪器上执行的这些指令提供多个用于实施在框图和/或流程框图或框中指出的功能/行为的步骤。
因此,本发明可以在硬件和/或软件(包括固件、常驻软件、微码、等)中实施。此外,本发明的实施方案可以采取在具有计算机可用的或计算机可读的程序代码的计算机可用的或计算机可读的存储介质上的计算机程序产品的形式,该计算机可用的或计算机可读的程序代码在由一种指令执行系统使用或者与一种指令执行系统相连的介质中实施。在本文件的背景中,计算机可用的或计算机可读的介质可以是任意以下介质,该介质可以包含或存储由该指令执行系统、仪器或装置使用或者与指令执行系统、仪器或装置相连的程序。
如在图1中所展示的,根据本发明的某些实施方案的操作包括生产一个mRNA序列的阵列,这些序列编码一种感兴趣的多肽(框10)。例如,选择一种输入的氨基酸序列,并且使用随机取样程序生成了对该输入的氨基酸序列进行编码的核苷酸序列。对于该阵列中的每个单独mRNA序列热力学参数进行确定(框20)。对于该阵列中的每个单独mRNA序列提供参数数据(框30)。根据对每个参数确定的值对这些单独mRNA序列评等级(框40)。在其中确定了多于一种的参数的情况下,根据这些参数的联合分布进行该评等级。基于所希望的蛋白质生产的水平,从该分等级的mRNA序列中选择一种mRNA序列(框50)。所希望的蛋白质生产水平可以是蛋白质生产中的任何水平,包括极大增强的、增强的、中等增强的、中等减少的或减少的或极大减少的蛋白质生产。
如在图2中所展示的,一种数据处理系统包括一种处理器110。该处理器110通过地址/数据总线148与存储器114进行通信。处理器110可以是任何可商购的或定制的微处理器。存储器114代表总的分级存储设备,包含用来实施数据处理系统100功能的软件以及数据。存储器114可以包括但不限于以下类型的装置:缓存(cache)、ROM、PROM、EPROM、EEPROM、闪存器、SRAM,以及DRAM。
如在图2中所示,存储器114可以包括若干种用于数据处理系统中的软件以及数据,这些数据处理系统是:应用程序140、操作系统142;输入/输出(I/O)设备驱动程序148;以及数据146。应用程序140可以包括一个mRNA选择模块150和/或一个mRNA阵列生产模块152。在mRNA阵列生产模块152中,可以使用输入的氨基酸序列来生成一个mRNA序列的阵列,这些序列对该输入的氨基酸序列进行编码。在mRNA选择模块150中,mRNAs可以基于对该阵列的单独mRNAs确定的这些参数值来评等级,并且可以基于所希望的蛋白质生产水平来选择一种mRNA。数据146可以包括对阵列160的单独mRNA序列确定的参数数据以及在阵列162中的单独mRNAs的分布。可以对mRNA选择模块150以及mRNA阵列生产模块152进行配置以执行在图1中讨论的操作。
如将本领域中的普通技术人员被理解,图2中所示的操作系统152可以是任何适合与数据处理系统一起使用的操作系统,这些数据处理系统例如OS/2、AIX、OS/390或系统390(来自国际商业机器公司(International BusinessMachines Corporation),阿蒙克,纽约州),Windows CE、Windows NT、Windows95、Windows98、Windows2000或WindowsXP(来自微软公司(Microsoft Corporation),雷德蒙德,华盛顿州),Unix或Linux或FreeBSD、Mac OS(来自苹果公司(Apple Computer)),或专有的操作系统。I/O设备驱动程序148典型地包括通过操作系统142由与以下设备进行通信的应用程序144读取的软件程序,这些设备是例如一个或多个I/O数据端口、数据146以及存储器114的某些部件和/或组织学切片成像系统120。应用程序140是用作说明的程序,这些程序实现了数据处理系统100的不同特征,并且可以包括至少一种支持根据本发明实施方案的操作的应用。最终,数据140表示静态数据和动态数据,该数据是被应用程序140、操作系统142、I/O设备驱动程序148、以及其他可以驻留在存储器114中的软件程序所使用。
尽管本发明是例如参照成为图2中的应用程序的mRNA选择模块150以及mRNA阵列生产模块152来说明,如将被本领域中的普通技术人员理解的,还可以根据本发明的实施方案使用其他配置。例如,mRNA选择模块150还可以结合到操作系统142、I/O设备驱动程序148或数据处理系统100的其他此类逻辑分区中。因此,本发明不应当被解释为限制于图2配置,本发明旨在包括能完成在此所述的操作的任何配置。
I/O数据端口可以被用于在数据处理系统100和另一个计算机系统或网络(如,因特网)之间传送信息或向由处理器控制的其他装置传送信息。这些部件可以是常规的部件,例如在许多常规数据处理系统中使用的那些,这些常规数据处理系统可以依照本发明进行配置以如在此所述的进行操作。因此,mRNA选择模块150可以用于分析对于阵列160的单独mRNA序列确定的参数数据以及已经预先收集的在阵列162中单独mRNA的分布。
现在本发明将参照以下实例进行说明。应理解的是这里的实例是为了说明本发明的方面的目的,并且不限制如由权利要求所定义的本发明的范围。
实例
实例1.方法概要
(1)对于编码一种测试氨基酸序列的潜在序列,生成RNA折叠能量
(2)选择多种变体(一些被预测以高水平对蛋白质进行表达,而其他的则被预测导致低效率的蛋白质表达)
(3)产生每个变体的用于酵母表达以及用于烟草瞬时表达的载体构建体。
(4)转化(酵母以及烟草)
(5)使用定量RT-PCR估算mRNA转录水平(归一化蛋白质表达数据并减小一个或多个变体对转录水平造成的可能的影响)
(6)收集样品用于测量蛋白质表达水平。
(7)定量ELISA
(8)估算蛋白质以对待用于ELISA中的提取样品的质量进行检验
(9)蛋白质印迹分析(Western blot)以对该表达的蛋白质的任何可能的翻译后修饰进行检验。
(10)分析数据以建立在mRNA的热力学参数与蛋白质表达水平之间的相关性。
实例2.对于编码给定氨基酸序列的潜在序列,生成RNA折叠能量的方法
起始于一种输入的氨基酸序列,使用BioPerl以自动操纵随机取样程序,该程序生成了对该输入的氨基酸序列进行编码的核苷酸序列。(Stajich等人,《基因组研究》(Genome Res)12(10):1611-8(2002))。对氨基酸序列中的各个位置,通过对来自均匀分布的可能的密码子进行取样,那个位置的密码子被选择。用这种方式对于每一个输入的氨基酸序列生成了1万种核苷酸序列。对每个输出的核苷酸序列的长度以及翻译进行检验以确保取样程序的准确性。1.8.2版本的ViennaRNA包被用来计算每个输入序列的最小自由能、整体自由能、以及在该整体中的MFE结构频率。(Hofacker等人,Monatshefte f.Chemie125:167-188(1994);www.tbi.univie.ac.at/RNA)。对于计算的参数设置是“-p0-d2”,该“-p0-d2”打开分区功能的计算并且确保分区功能以及最小自由能用相同的方式对摇摆末端能量(dangling end energy)进行处理。这些能量的计算是在内部Linux集群(in-house Linux cluster)上执行的。使用R.绘制所得能量分布的直方图(该R.是R开发核心团队。R:一种用于统计计算的语言和环境。用于统计计算的R基金(R Development Core Team.R:Alanguage and environment for statistical computing.R Foundation for StatisticalComputing),Vienna,奥地利(2009);ISBN3-900051-07-0;www.R-proj ect.org)。
实例3.选择mRNA变体(增强的以及减少的蛋白质生产两者)
选择来自莱茵衣藻的具有N端叶绿体靶向信号多肽的马哈诺珊瑚氰基荧光蛋白(AmCyan报告基因)作为感兴趣多肽。通过(德国)合成了多种选择的mRNA变体。通过替换5'区域(被编码多肽的N端区域)的编码序列产生AmCyan核苷酸序列的变体。因此,在这个具体实例中,从N端信号肽(AmCyan报告序列的上游)的核苷酸序列的5'端的40个核苷酸使用在以下表2和/或表3中提出的序列(变体)替换。
烟草转化以及蛋白质表达的构建体。使用一种核酸构建体对烟草进行转化,该核酸构建体是对AmCyan核苷酸序列(CFP)进行编码,该AmCyan核苷酸序列是与小亚基核酮糖-1,5-二磷酸羧化酶(ssRubisco)叶绿体转运肽的核苷酸序列相融合的。该构建体的核苷酸序列(SEQ ID NO:l)以及由该构建体编码的氨基酸序列(SEQ ID NO:2)显示如下。
CACCATGgcc gcg gtc ata gcc aaa tca agc gtt tcc gcagccgtggcaaggcctgctagatctagcgtgaggccgatggctgccttgaaacccgcagtcaaagcggcacctgtggcagctecagcacaagcgaatcaggccctgagcaacaagttcatcggcgacgacatgaagatacctaccacatggacggctgcgtgaacggccactacttcaccgtgaaggggcgagggcagcggcaagccatacgagggccacccagaccagcaccttcaaggtgacgatggcaacggtggcccactggccttcagcttcgacatcctgagcaccgtgttcatgtaccggcaaccgctgctcaccgcctacccgaccagcatgccggactacttcaagcaggccttcccggacggcatgagctacgagcgcaccttcacctacgaggacggcggcgtggataccgccagctgggagatcagcctgaagggcaactgcttcgagcacaagagcaccttccacggcgtgaacttcccagccgacggcccggtgatggccaagatgaccaccggctgggatccgagcttcgagaagatgactgtgtgcgacggcatcctgaagggcgacgtgaccgccttcctgatgcttcaaggcggtggcaactaccgctgccagttccacaccagctacaagaccaagaagccggtgaccatgccgccaaaccatgacgtggagcacaggctcgcccgcaccgacctggacaagggaggcaacagcgtccagctgaccgagcacgccgtggcccacatcaccagcgtggtgccgttctga(SEQIDNO:1)
MALSNKFIGDDMKMTYHMDGCVNGHYFTVKGEGSGKPYEGTQTSTFKVTMANGGPLAFSFDILSTVFMYGNRCFTAYPTSMPDYFKQAFPDGMSYERTFTYEDGGVATASWEISLKGNCFEHKSTFHGVNFPADGPVMAKKTTGWDPSFEKMTVCDGILKGDVTAFLMLQGGGNYRCQFHTSYKTKKPVTMPPNHVVEHRIARTDLDKGGNSVQLTEHAVAHITSVVPF(SEQIDNO:2)
ssRubisco叶绿体转运肽在SEQ ID NO:1的5'端的以粗体字母指出。粗体的以及已加下划线的核苷酸(也是在序列的5'端)示出了在这些变体中的变化的SEQ ID NO:1的部分。另外,每个变体在其5'端包括四个核苷酸-CACC(灰色大写字母),恰好在ATG起始密码子的上游。用于生成这些变体的核苷酸序列在下表2(SEQ ID NOs:5-26)中提出。
表2.具有AmCyan(CFP)报告基因(用于烟草表达)的N端ssRubisco叶绿体转运肽的变体。
Figure BDA00002825870000611
MFE=最小自由能;EFE=整体自由能
这些核苷酸序列是通过使用本领域中熟知的标准重组DNA以及分子克隆技术产生的(参见例如Sambrook等人,《分子克隆:实验手册》(MolecularCloning:A Laboratory Manual),冷泉港实验室(Cold Spring HarborLaboratory),冷泉港,纽约(1989);Silhavy等人,《基因融合实验》(Experimentswith Gene Fusions),冷泉港实验室(Cold Spring Harbor Laboratory),冷泉港,纽约(1984);以及Ausubel等人,《分子生物学中实验室指南》(Currentprotocols in Molecular Biology),Greene出版协会以及Wiley Interscience(1987))。
酵母转化以及蛋白质表达的构建体。使用对AmCyan核苷酸序列进行编码的核酸构建体来转化酵母(酿酒酵母)。用Xhol/Kpnl对AmCyan核苷酸序列进行消化并且凝胶提取。用Xhol/Kpnl对单拷贝酵母表达载体、YpEB/peri异麦芽糖酶/V5进行消化并且提取主链。将这些片段连接并转化到感受态细胞中。挑取菌落并且用菌落PCR鉴别并且用限制性消化分析和测序来鉴定阳性。
该构建体的核苷酸序列(SEQ ID NO:3)以及由该构建体编码的氨基酸序列(SEQ ID NO:4)显示如下。在这个实例中,与用于植物表达的构建体相比,这种用于酵母表达的构建体不含有N端转运肽。
CACCBTGgccctgtccaacaagtttcstcggcgacgacatgaagatgacctaccacatggacggctgcgtgaacggccactacttcaccgtgaagggcgagggcagcggcaagccctacgagggcacccagacctccaccttcaaggtgacgatggccaacggcggccccctggccttctccttcgacatcctgtccaccgtgttcatgtacggcaaccgatgcttcaccgcctaccccaccagcatgcccgactacttcaagcaggccttccccgacggcatgtcctacgagagaaccttcacctacgaggacggcggcgtggccaccgccagctgggaggatagcctgaagggcaactgcttcgagcacaagtccaccttccacggcgtgaacttcccgccgacggccccgtgatggccaagaagaccaccggctgggatccctccttcgagaagatgaccgtgtgcgacggcatcttgaagggcgacgtgaccgccttcctgatgctgcagggcggcggcaactacagatgccagttccacacctcctacaagaccaagaagcccgtgaccatgccccccaaccacgtggtggagcaccgcatcgccagaaccgacctggacaagggcggcaacagagtgcagctgaccgagcacgccgtggcccacatcacctccgtggtgcccttctga(SEQIDNO:3)
MALSNKFIGDDMKMTYHMDGCVNGHYFTVKGEGSGKPYEGTQTSTFKVTMANGGPLAFSFDILSTVFMYGNRCFTAYPTSMPDYFKQAFPDGMSYERTFTYEDGGVATASWEISLKGNCFEHKSTFHGVNFPADGPVMAKKTTGWDPSFEKMTVCDGILKGDVWAFLMLQGGGN了RCQFHTSYKTKLPVTMPPNHVVEHRIARTDLDKGGNSVQLTEHAVAHTTSVVPF(SEQIDNO:4)
在SEQ ID NO:3的5'端的粗体的以及已加下划线指出的这些核苷酸示出了在这些变体中该序列的变化的部分。另外,在5'端,每个变体核苷酸序列还包括四个核苷酸-CACC(灰色大写字母),恰好在ATG起始密码子的上游。这些变体核苷酸序列是通过使用本领域中熟知的标准重组DNA以及分子克隆技术产生的(参见例如Sambrook等人,《分子克隆:实验手册》(MolecularCloning:A Laboratory Manual),冷泉港实验室(Cold Spring HarborLaboratory),冷泉港,纽约(1989);Silhavy等人,《基因融合实验》(Experimentswith Gene Fusions),冷泉港实验室(Cold Spring Harbor Laboratory),冷泉港,纽约(1984);以及Ausubel等人,《分子生物学中实验室指南》(Currentprotocols in Molecular Biology),Greene出版协会以及Wiley Interscience(1987))。表3(SEQ ID NOs:27-48)中提供了用于酵母实验中的变体核苷酸序列。
表3.用于酵母中的表达的AmCyan
Figure BDA00002825870000631
实例4.植物转化以及表达
设计了如以上所述的能够指导变体表达的表达载体。SEQ ID NO:l以及表2提供了这些变体的序列。
组成型CaMV35S启动子被用来驱动双子叶植物优化的变体基因的表达。烟草表达载体蛋白质即AmCyan通过与莱茵衣藻小亚基Rubisco转运肽序列的融合被靶向到叶绿体。
烟草表达载体使用了二元载体—pGR106(包含马铃薯病毒X(PVX)扩增子)(Lu等人,2003,《欧洲分子生物学组织杂志》(EMBO J),22:5690-5699)。应指出的是可以构建相似的载体用于在其他表达系统中的转化和表达。
所有的表达盒亚克隆到在用于转化进烟草的二元载体中,该转化是通过使用在本领域中已知的重组DNA技术进行。表达载体还可以包含原卟啉原氧化酶(PPO)选择性标记,该标记是由相同的启动子驱动,由此可见PPO可以作为内部的对照。
在烟草叶中的瞬时表达。将表达盒克隆到一种二元载体或者一种还含有来自甜菜曲顶病毒(BCTV)的复制起始位点的二元载体中。使用冻-融方法(An等人,“二元载体”(“Binary vector”).在Gelvin SB,Schilproot RA(编写),《植物分子生物学手册》(Plant molecular biology manual)Kluwar学术出版社,多德雷赫特,A31-19页(1988)中)将不含有来自BCTV复制起始位点的这些二元载体转入根癌土壤杆菌株LBA4404中。还通过使用在此描述的冻融法,将这些来自BCTV包含复制起始点的二元载体(BCTV二元载体)转运至根瘤土壤杆菌株LBA4404中,该根瘤土壤杆菌株LBA4404包含一种含有来自BCTV的复制酶序列的辅助质粒。
烟草叶被用于在植物组织中瞬时表达靶蛋白。将来自含有一个来自TEV的突变的P1/HC-Pro基因(该基因抑制转录后基因沉默(Mallory等人,《国家生物技术》(Nat Biotechnol)20:622(2002)))的转基因TEV-B烟草植物(在烟草栽培品种Xanthi中制备)的烟草叶用于瞬时表达选择的酶。如Azhakanandam等人,《植物分子生物学》(Plant Mol.Biol.)63:393-404(2007)所述进行土壤杆菌培养株的制备以及烟草叶的浸润。简而言之,遗传上修饰的土壤杆菌在50mL的LB培养基中生长过夜,该LB培养基含有100μM乙酰丁香酮以及10μM MES(pH5.6)。然后将这些土壤杆菌经在4000X g离心10分钟成为球粒并且将这些球粒再悬浮到侵染培养基(Murashige和Skoog盐,该盐含有维生素、2%蔗糖、500μM MES(pH5.6)、10μM MgSO4、以及100μM乙酰丁香酮)中直到浓度OD600=1.0并且随后在28°C下保存3小时。使用一个5mL注射器通过将该注射器的尖端(无针头)压抵到叶子的背轴面表面上,在甜菜(约3周龄)和TEV-B烟草植物(约4周龄)上对单独的叶进行浸润。将已浸润的植物保持在22°C-25°C下,其中光周期为16小时光照和8小时黑暗。浸润约5天后收获植物组织用于随后的分析。
实例5.酵母转化以及表达
使用FASTTM-酵母转化试剂盒(G-生物科学,圣路易斯,MO,美国)将这些如在实例3的描述中制备的质粒引导入酵母(酿酒酵母)中。由于该载体包含kanMX4盒,使用终浓度在200μg/ml的G-418二硫酸盐(西格玛公司(Sigma),A1720)作为选择试剂。
感受态细胞的制备。酵母细胞在30°C下在10ml YPD肉汤中生长直到对数中期(大约5x106至大约2x107个细胞/ml或OD600大约是0.8至大约1.0)。将细胞在500x g下球粒化4分钟并丢弃上清液。使用10ml洗涤溶液洗涤该球粒。洗涤之后,将这些细胞再粒化并丢弃上清液。将1ml感受态溶液添加至球粒中以对这些细胞进行再悬浮。
转化将感受态细胞(50μl)与在小于5μl的体积中的0.2-1μg DNA混合。将转化溶液(500μl)添加至这些细胞中并充分混合。将细胞/DNA混合物在30°C下孵育45分钟,并且然后通过用手指轻弹将其有力地混合。在45分钟的孵育过程中将该混合步骤执行2-3次。
将该转化混合物(DNA/细胞)涂布(50μl-150μl)在一种本领域中已知的适当的平板上。然后将具有该转化混合物的平板在30°C下孵育2-4天以允许转化体的生长。
对转基因酵母细胞的鉴别是基于当在荧光显微镜下对其观察时它们生产蓝色荧光的能力。
实例6.来自烟草叶的样品收集物瞬时地表达报告蛋白AmCyan。
将每个构建体植入三棵烟草植株中,用于为qRT-PCR和ELISA采样。用土壤杆菌对每棵植株的两片叶子进行浸润,该土壤杆菌含有对AmCyan进行表达的变体的核苷酸序列。在浸润3天后,从浸润的叶子中收集6个样品,从每棵植株采两个样。每个样品收集叶片组织的两个“孔”(大约20mg)。
从大约100-500mg的叶片组织中制备蛋白质提取物,该叶片组织是从瞬时表达AmCyan的烟草植株中采集的,如上所述地。确切地,将叶片材料放在含小钢球的24个深孔板中并在干冰上预冷却。使用一台Geno/grinder(SPEC/CertiPrep,Metuchen,新泽西州)将样品研磨成细粉末。在室温下将这些样品提取到500-1000μl的蛋白质印迹提取缓冲液(Western ExtractionBuffer)(WEB=12.5mM硼酸钠、pH10;2%BME以及1%SDS)中持续大约30分钟、随后以13,000rpm离心5分钟。
实例7.从酵母表达系统的取样。
对每个变体挑取三个克隆物。将转基因酵母细胞在YPD肉汤中在30°C255rpm振荡下生长过夜,该YPD肉汤含有G-418。第二天早晨,将培养物稀释至在600nm处的O.D.大约0.5。三至四个小时之后当这些培养物在600nm处的O.D.达到大约1.0时收获细胞。使用各变体2ml,并且分离总蛋白和总RNA。
使用Y-PER酵母蛋白提取试剂(赛默飞世尔公司(Thermo Scientific),伊利诺伊州罗克福德市)对蛋白质进行分离。使用RNA Easy Mini Kit(QIAGEN)对总RNA进行分离。为了产生原生质球,将酵母细胞再悬浮在2ml的含有酵母溶壁酶(zymolase)的缓冲液Y中,并且在30°C下伴随在75rpm的轻微振荡进行持续30分钟的孵育。缓冲液Y是通过将50x(10mg/ml)酵母溶壁酶(zymolase)-100T(来自藤黄节杆菌;Seikagaku生物商务公司,日本)以及0.1%的β-巯基丁醇添加至1M山梨醇和0.1EDTA的溶液(Ph7.4)中制得。为了去除DNA污染,根据厂家方案用RNAse-Free DNase Set(QIAGEN)对RNA样品进行消化。
对于每个变体,通过ELISA和定量PCR对三个蛋白质样品和三个RNA样品进行分析。
实例8.转录和蛋白质水平的估算
A.通过qRT-PCR方法估算转录水平。将表达变体的植物组织样品或酵母细胞进行收集并冷冻保存在-80°C下直到被加工。通过磁珠(Promega公司)程序从这些样品中提取RNA,随后进行DNA消化。基于感兴趣目标选择了TaqMan分析。因此,这些分析由正向引物和反向引物以及FAM标记的探针组成,该探针对于靶序列具有特异性。对于每个样品还对物种特异性的TET-标记的参照靶进行操作,以用于相关的表达计算。以一式三份在384孔PCR板中建立一步法RT-PCR反应(3个用于内源参照基因(例如野生型/天然的)并且3个用于目标基因)。野生型的对照以及非RT阴性对照被对应地包含在每个板上以对非特异性扩增和DNA污染进行测试。
这些结果被捕获在实时热循环仪(ABI7900HT)上。通过分析器为每个报告物设置临界值并且将所得数据输出到采样模板。对每个样品的相关表达进行计算。
B.定量CFP ELISA。CFP ELISA免疫测定是用于检测AmCyan荧光蛋白(CFP)的定量夹心法测定(quantitative sandwich assay)。它使用两种多克隆抗体,这两种多克隆抗体是针对CFP基因产物产生的并且是针对CFP蛋白免疫亲和纯化的。在4°C下在25mM硼酸盐、75mM NaCl、pH8.5中用2μg/ml的兔抗-CFP(纯化的蛋白质A)对高度粘合的聚苯乙烯板
Figure BDA00002825870000661
坎布里奇,马萨诸塞州)进行包被。用10mM Tris(pH8.0)将板洗涤五次,该Tris中包含0.05%的吐温-20和0.2%的NaN3。通过将四个1/4英寸的叶片孔的样品添加至含有钢珠的96孔板中制备了多个样品。使用Kleco研磨器对这些样品进行研磨,随后添加入500μl的0.1M硼砂(pH7.5)、0.5%的吐温-20、以及0.2%的聚乙烯吡咯烷酮(提取缓冲液)并且良好地混合。在对ELISA稀释剂(含有1%BSA、0.05%吐温-20以及0.2%NaN3的PBS)中的上清液进行稀释之前,将这些板在3500x g离心2分钟。在ELISA稀释剂中制备多个标准品(128、64、32、16、8、4、2、以及0ng/ml的纯化CFP蛋白)将适当稀释的样品或标准品各自100μl添加至植物中,在环境温度下伴随在200rpm的振荡对其孵育1小时,并且洗涤5次。然后将山羊抗CFP IgG按5μg/ml添加至该板(100μl/孔)中,在环境温度下伴随在200rpm的振荡对其孵育1小时,并且如前进行洗涤。然后将共轭至碱性磷酸酶的驴抗-山羊(Jackson Immuno Research公司,West Grove,宾夕法尼亚州)按1μg/ml添加至该板(100μl/孔)中,在环境温度下伴随在200rpm的振荡对其孵育,并且进行洗涤。添加底物—磷酸对硝基苯酯(西格玛公司,圣路易斯,密苏里州)并且允许在环境温度下发展30分钟。通过使用微板阅读器(Tecan Rainbow,三角研究园(ResearchTriangle Park),北卡州),以492作为对照品对在405nm的吸光值进行测量。标准曲线使用四参数曲线拟合以绘制浓度对吸光值的图。应指出可以使用其他涉及荧光测定(通过在475nm的激发和在515nm的发射可以检测AmCyan)的对AmCyan进行定量的方法对蛋白质表达水平进行估算。
C.进行蛋白质印迹分析,以对该表达的蛋白质其可能的翻译后修饰进行检验,并且进行数据分析以使mRNA的热力学参数与蛋白质生产水平相关连。将样品研磨成精细粉末,并且然后在室温下将这些粉末提取到500-1000μl的蛋白质印迹提取基质(Western Extraction Medium)(WEB=12.5mM硼酸钠、pH10;2%BME以及1%SDS)中持续大约30分钟、随后以13,000rpm离心5分钟。
D.SDS聚丙烯酰胺凝胶电泳(SDS-PAGE)是通过以下方法执行:将10μl的提取样品转移到微量滴定管(eppendorf tube)中并且添加入25μl的4XBioRad LDS或改性的BioRad加样缓冲液(4X BioRad LDS:BME,以2:1的比例)。将样品在70°C下加热10分钟然后立即放在冰上5分钟。冰上的孵育后,将样品简单离心。使样品提取物(5-10μl)在使用MOPS缓冲液的BioRad4%-12%Bis/Tris蛋白凝胶(18孔)上跑胶(run)。
E.免疫分析通过以下方法执行:将SDS-PAGE凝胶转移到硝酸纤维素膜上(使用冷硬的Nupage转移缓冲液(Invitrogen),在100伏特下持续30分钟)进行免疫印迹分析。使用丽春红染色(西格玛公司)使转移到印迹上的总蛋白可见。在丽春红染色之后,将该膜在封闭缓冲液中孵育30分钟(在具有3%的奶粉的TBST洗涤缓冲液(30mM Tris-HCL;pH7.5;100mM NaCl;以及0.05%Tween20),然后在TBST中洗涤三次,每次5分钟。在带有3%奶的TBST洗涤缓冲液中以1μg/ml添加一抗,并将该印迹孵化2小时至过夜。在孵化之后,将该印迹在TBST洗涤缓冲液中洗涤三次,每次5分钟。将二抗(Rabbit-AP)稀释到1:8000(在TBST中)并添加到印迹中持续至少30分钟。在二抗中孵化之后,再次将该印迹洗涤三次,每次5分钟。通过添加Moss BCIP/NBT-碱性磷酸酶底物来实现免疫的反应条带的显像。在BCIP/NBT底物中孵化之后将这些印迹在水中彻底漂洗并允许风干。
F.荧光显微。在显微镜(尼康SMZ1500)下检验这些烟草叶样品以对荧光AnCyan蛋白进行积累。
实例9.结果
A.烟草植株原位(Tn-Planta)瞬时表达系统。
植物中瞬时表达的AmCyan蛋白的表达水平。进行两组独立的实验以对烟草中瞬时表达的AmCyan蛋白的表达水平进行分析,该烟草是用不同核苷酸序列的不同载体构建体进行浸润的。参见图3,显示了在用指示载体构建体浸润的叶片样品中AmCyan转录物的水平(图3A)以及相对于PPO的AmCyan的mRNA水平(图3B)。
qRT-PCR的结果表明,在用于除了构建体8707(具有非常低的mRNA水平)之外的数据的典型qRT-PCR变化之内,所有的构建体具有相似的mRNA水平。
在烟草中,对于不同的构建体瞬时表达的AmCyan蛋白的表达水平是通过ELISA方法定量。对于每个构建体,收集来自三株烟草植株的复制的样品。将CPF的表达水平(经ELISA测量)相对于总提取细胞蛋白进行归一化。六个数据点的平均值绘制在图4A和图4B中。对来自相同样品的内化的PPO对照的表达水平也通过ELISA方法进行定量并相对于总提取细胞蛋白对其进行归一化。ELISA数据显示,对于不同的构建体PPO的表达水平几乎是相同的,而AmCyan(CFP)的表达水平在一个宽范围内是不同的。AmCyan的表达水平(方块-CFP)以及相对于PPO的归一化值(圆圈-CFP*)针对它们的40个核苷酸(-4至36)的mRNA转录物的自由能值(最小自由能)(图4A)和整体自由能(图4B)绘图。第二个数据组的类似的曲线图在图5A和图5B中示出。
这些结果清楚地显示,当数据使用一个线性方程拟合时,AmCyan蛋白的表达水平随着5'mRNA转录物的自由能值的增加而增加(R2值是0.8)。对相对于PPO的AmCyan表达水平(R2值是0.75)观察到了类似结果。
图6显示一个以上所述数据的可替代的曲线图。对在基因的前36个核苷酸中的密码子的使用进行的仔细检查表明了具有最低表达水平的三个构建体具有同型的双重稀有密码子。这表明了这些构建体的低表达可以部分上归咎于这些双重稀有密码子。除这三个构建体之外剩余的数据使用指数的衰变(R2=0.81)良好地拟合,如图6中所示的。
对用不同的核苷酸序列构建体进行浸润的烟草叶样品的荧光显微观察。在荧光纤维镜下对从叶片中取来的样品进行的肉眼观察表明了在AmCyan(CFP)变体蛋白表达与相关联转录物的折叠自由能之间存在相关性,这些叶片是用不同的在此所述的核苷酸构建体进行了浸润。
B.酵母表达系统。
酵母细胞中的RNA以及蛋白质分析。AmCyan mRNA的水平显示在不同变体中的,但是当它们相对于测量的kanMX4转录物(一种衍生自相同载体的内部对照)进行归一化时,在不同变体中的比例是显著不同的。
通过使用抗-CFP抗体(范围是从3021ng/mg至12,062ng/mg总可溶性蛋白)的ELISA测量的AmCyan蛋白水平(表4)。
表4.通过使用抗-CFP抗体的ELISA测量的单独AmCyan变体的蛋白质表达水平以及它们相应的mRNA水平。
Figure BDA00002825870000701
*Av.,测量平均值(n=3),**SE,标准差
转录折叠能量对AmCyan蛋白表达(由ELISA测量)与AmCyan mRNA(由qRT-PCR测量)间的比例的曲线图在图6中显示(表4数据)。在估算的mRNA折叠能与AmCyan蛋白表达之间的相关性为R2=0.34。因此,这个数据显示随着MFE值增加,蛋白质生产增加而mRNA转录物水平保持不变。
其中针对折叠自由能,绘制对于各个AmCyan变体的平均ELISA数据的第二个曲线图(图7),显示了一种线性相关性(R2=0.49)。与相应的在烟草中的实验相比,在酵母蛋白质表达与折叠自由能值之间的相关性更低(0.49对0.8)。对于酵母表达系统中更低的相关性的一些可能原因可以包括在表达系统中全面的不同(在这种情况中,酵母系统被选择用于高水平的蛋白质生产)、稀有密码子的使用和/或在少许测试的AmCyan变体中连贯的稀有密码子的出现。但是,应指出,对于酵母中观察到的R2值是可比的或略微地好于由Kudla等人(《科学》(Science)324(5924):255-258(2009))在大肠杆菌原核生物表达系统中观察到的R2值0.44。
C.玉米植株原位(In-Planta)瞬时表达系统。
将表达盒克隆到一个二元载体中。使用冻融方法,将这些构建体转移入含有辅助质粒(pSBI)的根瘤土壤杆菌菌株LBA4404中(An等人,“二元载 ”(“Binary vector”).在Gelvin SB,Schilproot RA(编写),《植物分子生物学手册》(Plant molecular biology manual)Kluwar学术出版社,多德雷赫特,A31-19页(1988)中)。如Azhakanandam等人,《植物分子生物学》(Plant Mol.Biol.)63:393-404(2007)中所述的对土壤杆菌培养株进行制备。简而言之,遗传上修饰的土壤杆菌在50mL的YP培养基中生长过夜,该YP培养基含有100μM的乙酰丁香酮以及10μM的MES(pH5.6),并且随后经4000Xg离心10分钟进行粒化。将这些球粒再悬浮在侵染培养基(Murashige和Skoog盐,该盐含有维生素、2%蔗糖、500μM的MES(pH5.6)、10μM的MgSO4、以及100μM的乙酰丁香酮)中直到OD600=0.5并且随后在28°C下保存2-3小时。
使用玉米幼苗建立该植株原位瞬时表达系统。种子在填充有Fafard发芽混合物的2.5英寸盆中在温室条件下发芽。将幼苗保持在14/10日间/夜间循环下,其中用补光维持的日间光照强度为2000μ-mol-m-2.s-1。将温度维持在23°C-26°C。大多数是通过使用V2期(两片叶子期)的初生叶和次生叶执行土壤杆菌浸润的实验(Ritchie S.W.,Hanway J.J.Benson G.O.(编写):玉米植株如何发育:爱荷华州立大学特别报告(How a Corn Plant Develops:IowaState Univ Special Report)No.48,2005年7月)。为了使得易于浸润,对这些幼苗在农杆菌浸润1-2小时之前浇水,这保持了叶子胀大以及气孔打开。使用一个无针头的5mL注射器体(具有Luer-LokTM针尖的BD5ml注射器,BDTM,富兰克林湖,新泽西州07427,美国)通过将该注射器的尖端压抵到叶子的背轴面表面上在玉米苗上进行单独的叶子的浸润。用1ml的土壤杆菌悬浮液/28秒/叶子对V2期的第一片和第二片可见的叶子进行浸润。将浸润的植物转移并保持在被设置为25°C、具有16/8日间/夜间循环、具有光照强度为1900μ-mol-m-2.s-1的生长室条件下。浸润后4天后收获植物组织用于随后的分析。
实例10.mRNA序列的分段式选择
为了显示由集群对mRNA序列进行选择(分段式的而不是线性的选择)的功效,如在此所述的选择了带有AmCyan的ssRubisco叶绿体转运肽(RbAmCyan)的不同变体mRNA序列。对于每个mRNA序列,确定了相对于蛋白质生产水平的MFE RNA二级结构(MFE)值。展示在下表5中的这些序列是如在此描述的具有叶绿体信号肽的AmCyan的变体,使用的是用于烟草表达的优化的密码子。除了表5中提供的前三个序列之外,每个序列被优化为大约50%的GC含量。此外,避免稀有密码子的使用(即少于15%的密码子的使用)。通过逆翻译或回译生成大约209,952个不同的序列,并且选择36个用于测试(对于每隔1kcal/mol的范围选择大约3个变体)(表5)。
表5:RbAmCyan的变体序列。
Figure BDA00002825870000721
Figure BDA00002825870000731
如前对表5中的在烟草瞬时表达系统中的mRNA序列进行测试,并且如在此描述的,可以通过qRT-PCR和ELISA对应地对转录物表达水平和蛋白质水平进行估算。
为了测试在玉米表达系统中的变体,对于玉米密码子的使用进行了序列优化并且不使用在起始密码子附近含有稀有密码子(如在此定义的)的序列(表6)。上表5中是相应的烟草优化序列。
表6:对于玉米密码子的使用优化的序列变体。
Figure BDA00002825870000732
如在此所述的,在玉米中的转录物和蛋白质的表达水平对应地通过qRT-PCR和ELISA估算。实例11.稀有密码子的使用
在某些实例中,稀有密码子的使用的避免可以是基于转录物序列的折叠自由能对其进行优化中的一个步骤。表7提供了具有叶绿体靶向信号肽的AmCyan的变体,每个变体在其起始密码子附近具有一个或多个稀有密码子。测试了六对变体:一组具有稀有密码子并且一组没有稀有密码子。稀有密码子是具有少于15%的丰度的tRNA的密码子。
可以通过使用表7中提出的序列(参见,例如下表7中AAV和VSA),对在起始密码子附近连贯的稀有密码子的影响进行研究。与在起始位点具有单个稀有密码子的一种情况相比,此类连贯的稀有密码子可以对由一种mRNA的蛋白质生产造成更严重的影响。
表7:具有烟草稀有密码子的RbAmCyan变体序列
Figure BDA00002825870000741
如在此所述的,对在烟草瞬时系统中的这些变体进行测试,并且如在此所述的,通过qRT-PCR和ELISA对应地对转录物和蛋白质的表达水平进行估算。
实例12.使用无结果突变以调整蛋白质生产水平。
生成多种对来自玉米的具有叶绿体靶向信号肽的5-烯醇丙酮-3-酰莽草酸-3-磷酸(EPSP)合成酶进行编码的核苷酸序列变体。野生型(WT)EPSPS序列也被包含在内作为对照,还有MFE RNA二级结构值为-6.4的EPSPS转录物。对密码子的使用进行优化以用于烟草表达(表8)。
表8:烟草中对于EPSPS的具有突变的并将稀有密码子排除在外的序列变体
Figure BDA00002825870000751
如前对在烟草瞬时系统中的这些变体测试的,并且如在此所述的,可以通过qRT-PCR和ELISA对应地对转录物和蛋白质的表达水平进行估算。
在此引用的所有的公开、专利申请、专利以及其他参考文件对于引用中提及的有关句子和/或段落的传授内容通过引用以其全文结合在此。
以上所述是用作说明本发明的,并且不对本发明构成限制。本发明由以下权利要求所定义,这些权利要求的等效物被包括在其中。
Figure IDA00002825870700011
Figure IDA00002825870700041
Figure IDA00002825870700051
Figure IDA00002825870700061
Figure IDA00002825870700071
Figure IDA00002825870700091
Figure IDA00002825870700101
Figure IDA00002825870700111
Figure IDA00002825870700121
Figure IDA00002825870700131
Figure IDA00002825870700141
Figure IDA00002825870700161
Figure IDA00002825870700181
Figure IDA00002825870700201
Figure IDA00002825870700211
Figure IDA00002825870700221
Figure IDA00002825870700231
Figure IDA00002825870700241

Claims (62)

1.一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:
a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;
b)对(a)的每个单独mRNA序列确定以下一个或多个参数:
(i)整体自由能(EFE);
(ii)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;
(iii)整体多样性(ED);
c)根据在步骤(b)中确定的这些参数的联合分布,对该阵列的这些单独mRNA序列评等级;并且
d)选择来自步骤(c)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。
2.根据权利要求1所述的方法,其中步骤(b)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
3.根据权利要求1或权利要求2所述的方法,其中该感兴趣多肽的生产增强。
4.根据权利要求1或权利要求2所述的方法,其中该感兴趣多肽的生产减少。
5.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE并且步骤(d)中的该mRNA是选自该具有EFE最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
6.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE并且该步骤(d)中的mRNA是选自该具有最低EFE值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
7.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是FMFE RNA二级结构并且该步骤(d)中的mRNA是选自该具有FMFE RNA二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
8.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是FMFE RNA二级结构并且该步骤(d)中的mRNA是选自该具有FMFE RNA二级结构最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
9.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是ED并且该步骤(d)中的mRNA是选自该具有ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
10.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是ED并且该步骤(d)中的mRNA是选自该具有最低ED值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
11.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和FMFE,并且该步骤(d)中的mRNA是选自该具有EFE最高值以及FMFE RNA二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
12.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和FMFE,并且该步骤(d)中的mRNA是选自该具有最低EFE值以及FMFE RNA二级结构最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
13.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和ED,并且该步骤(d)中的mRNA是选自该具有EFE最高值以及ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
14.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和ED,并且该步骤(d)中的mRNA是选自该具有EFE最低值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
15.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和FMFE RNA二级结构以及ED,并且该步骤(d)中的mRNA是选自该具有EFE最高值和FMFE最低值以及ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
16.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和FMFE RNA二级结构以及ED,并且该步骤(d)中的mRNA是选自该具有EFE最低值和FMFE最高值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
17.根据权利要求5、7、9、11、13或15中任一项所述的方法,其中在步骤(d)中该确定的一个或多个参数是碱基配对概率。
18.根据权利要求6、8、10、12、14或16中任一项所述的方法,其中在步骤(d)中该确定的一个或多个参数是碱基配对概率。
19.根据权利要求1所述的方法,其中当来自步骤(b)的两种或更多种参数被确定时,根据这些确定的参数的联合分布,对在步骤(c)的该阵列中的这些单独序列评等级。
20.根据权利要求1至9中任一项所述的方法,其中在步骤(d)中该选择的单独mRNA序列包括在起始密码子附近的一种或多种稀有密码子。
21.一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:
a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;
b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;以及
c)对(a)每个单独mRNA序列确定一种或多种下列参数:
(i)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及
(ii)整体多样性(ED);
d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且
e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。
22.根据权利要求21所述的方法,其中步骤(c)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
23.根据权利要求21所述的方法,其中该步骤(e)中的mRNA是选自以下各项:具有在从大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构的mRNA的组,具有在从大约-2kcal/mol至大约-9kcal/mol范围内的MFERNA二级结构的mRNA的组,或具有在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构的mRNA的组。
24.根据权利要求21-23中任一项所述的方法,其中该感兴趣多肽的生产增强。
25.根据权利要求21-23中任一项所述的方法,其中该感兴趣多肽的生产减少。
26.根据权利要求24所述的方法,其中在步骤(c)中该确定的一个或多个参数是ED并且该步骤(e)中的mRNA是选自该具有MFE RNA二级结构最高值以及ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
27.根据权利要求25所述的方法,其中在步骤(c)中该确定的一个或多个参数是ED并且该步骤(e)中的mRNA是选自该具有MFE RNA二级结构最低值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
28.根据权利要求24所述的方法,其中在步骤(c)中该确定的一个或多个参数是FMFE RNA二级结构以及ED,并且该步骤(e)中的mRNA是选自具有该MFE RNA二级结构最高值、FMFE RNA二级结构最低值以及ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
29.根据权利要求25所述的方法,其中在步骤(c)中该确定的一个或多个参数是FMFE RNA二级结构以及ED,并且该步骤(e)中的mRNA是选自具有该MFE RNA二级结构最低值、FMFE RNA二级结构最高值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
30.根据权利要求26或权利要求28所述的方法,其中在步骤(c)中该确定的一个或多个参数是碱基配对概率。
31.根据权利要求27或权利要求29所述的方法,其中在步骤(c)中该确定的一个或多个参数是碱基配对概率。
32.根据权利要求24所述的方法,其中该步骤(e)中的mRNA是选自具有如在室温下测量的在从大约0kcal/mol至大约-2kcal/mol范围内的MFERNA二级结构的mRNA之中。
33.根据权利要求25所述的方法,其中该步骤(e)中的mRNA是选自具有如在室温下测量的在从大约-9kcal/mol至大约-18kcal/mol范围内的MFERNA二级结构的mRNA之中。
34.一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:
a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;
b)对(a)中的每个单独mRNA序列的整体自由能(EFE)进行确定;
c)对(a)每个单独mRNA序列确定一种或多种下列参数:
(i)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及
(ii)整体多样性(ED);
d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且
e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。
35.根据权利要求34所述的方法,其中步骤(c)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
36.根据权利要求34或35所述的方法,其中该感兴趣多肽的生产增强。
37.根据权利要求34或35所述的方法,其中该感兴趣多肽的生产减少。
38.根据权利要求36所述的方法,其中在步骤(c)中该确定的一个或多个参数是ED并且该步骤(e)中的mRNA是选自该具有EFE最高值以及ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
39.根据权利要求37所述的方法,其中在步骤(c)中该确定的一个或多个参数是ED并且该步骤(e)中的mRNA是选自该具有EFE最低值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
40.根据权利要求36所述的方法,其中在步骤(c)中该确定的一个或多个参数是FMFE RNA二级结构以及ED,并且该步骤(e)中的mRNA是选自该具有EFE最高值、FMFE RNA二级结构最低值以及ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
41.根据权利要求37所述的方法,其中在步骤(c)中该确定的一个或多个参数是FMFE RNA二级结构以及ED,并且该步骤(e)中的mRNA是选自该具有EFE最低值、FMFE RNA二级结构最高值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
42.根据权利要求38或权利要求40所述的方法,其中在步骤(c)中该确定的一个或多个参数是碱基配对概率。
43.根据权利要求39或权利要求41所述的方法,其中在步骤(c)中该确定的一个或多个参数是碱基配对概率。
44.根据权利要求21至43中任一项所述的方法,其中在步骤(e)中该选择的单独mRNA序列包括在起始密码子附近的一种或多种稀有密码子。
45.一种选择用于增强生产感兴趣多肽的mRNA的方法,该方法包括:
a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;
b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;
c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且
d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有MFE RNA二级结构最高值以及FMFE RNA二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中,或选自具有如在室温下测量的在从大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构以及FMFE RNA二级结构最低值的这些mRNA序列之中,
其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
46.根据权利要求45所述的方法,其中步骤(b)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
47.一种选择用于减少生产感兴趣多肽的mRNA的方法,该方法包括:
a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;
b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;
c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且
d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有MFE RNA二级结构最低值以及FMFE RNA二级结构最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中,或选自具有如在室温下测量的在从大约-9kcal/mol至大约-18kcal/mol范围内的MFERNA二级结构以及FMFE RNA二级结构最高值的这些mRNA序列之中,
其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的减少生产。
48.根据权利要求47所述的方法,其中步骤(b)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
49.一种选择用于增强生产感兴趣多肽的mRNA的方法,该方法包括:
a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含编码该感兴趣多肽的不同核苷酸序列;
b)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;并且
c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且
d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最高值以及FMFE RNA二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
50.根据权利要求49所述的方法,其中步骤(b)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
51.一种选择用于减少生产感兴趣多肽的mRNA的方法,该方法包括:
a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含编码该感兴趣多肽的不同核苷酸序列;
b)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;
c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且
d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最低值以及FMFE RNA二级结构最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的减少生产。
52.根据权利要求51所述的方法,其中步骤(b)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
53.一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:
a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;
b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;
c)根据在(b)中该确定的MFE RNA二级结构,从最高的MFERNA二级结构至最低的MFE RNA二级结构,对该阵列中的这些单独mRNA序列评等级;并且
d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自下列各项:具有在从大约0kcal/mol至大约-2kcal/mol范围内的MFE RNA二级结构的mRNA的组,具有在从大约-2kcal/mol至大约-9kcal/mol范围内的MFE RNA二级结构的mRNA的组,或具有在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA二级结构的mRNA的组,其中该选择的mRNA生产该感兴趣多肽。
54.根据权利要求53所述的方法,其中该mRNA被选择用于一种感兴趣多肽的增强生产,并且是选自具有一种在从大约0kcal/mol至大约-2kcal/mol范围内的MFE的mRNA的组。
55.根据权利要求53所述的方法,其中该mRNA被选择用于一种感兴趣多肽的减少生产,并且是选自具有一种在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE的mRNA的组。
56.根据权利要求45至55中任一项所述的方法,其中在步骤(d)中该选择的单独mRNA序列包括在起始密码子附近的一种或多种稀有密码子。
57.一种选择用于增强生产感兴趣多肽的mRNA方法,该方法包括:
a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;
b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构进行确定;并且
c)选择(a)中的一种具有在从大约0kcal/mol至大约-2kcal/mol范围内的MFERNA二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
58.一种选择用于减少生产感兴趣多肽的mRNA方法,该方法包括:
a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;
b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的表达水平进行确定;
c)选择(a)中的一种具有在从大约-9kcal/mol至大约-18kcal/MFE范围内的MFE RNA二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
59.根据权利要求57或权利要求58所述的方法,其中在步骤(e)中该选择的单独mRNA序列包括在起始密码子附近的一种或多种稀有密码子。
60.根据权利要求1-19、21-43、44-55、57或58中任一项所述的方法,该方法进一步包括除去来自步骤(a)的该单独mRNA阵列中的包含在起始密码子附近的一种或多种稀有密码子的单独mRNA序列。
61.一种对生物细胞中的感兴趣多肽的生产进行修饰的方法,该方法包括:(a)根据以上权利要求中的任一项,选择一种对感兴趣多肽进行编码的mRNA;(b)对(a)中的该mRNA的核苷酸序列进行突变以生产一种突变的mRNA,与(a)中的该mRNA的核苷酸序列的MFE RNA二级结构相比,该突变的mRNA具有增强的或减少的MFE RNA二级结构;
其中与由(a)中的mRNA编码的多肽序列相比,该突变的mRNA编码一种突变的多肽序列,该突变的多肽序列保留了由(a)中的mRNA编码的多肽序列的功能,并且与野生型mRNA序列相比,该突变的mRNA序列的表达导致该感兴趣多肽的修饰的生产。
62.一种用于对生物细胞中的感兴趣多肽的生产进行修饰的方法,该方法包括:
(a)根据权利要求1-60中的任一项,选择一种对感兴趣多肽进行编码的mRNA;
(b)对在这种根据(a)选择的mRNA的核苷酸序列与一种所述生物的野生型内源核苷酸序列之间的差别进行鉴别,其中该野生型内源核苷酸序列编码了与根据(a)选择的mRNA所编码的相同的一种感兴趣多肽;并且
(c)对编码该感兴趣多肽的该内源核苷酸序列进行原位突变以将(b)中所鉴别的核苷酸的每个差别合并进该内源核苷酸序列中,由此在该生物的细胞中来自该原位突变的内源核苷酸序列的该感兴趣多肽的生产被修饰。
CN2011800388454A 2010-06-11 2011-06-09 组合物以及用于生产蛋白质的方法 Pending CN103080123A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US35387910P 2010-06-11 2010-06-11
US61/353,879 2010-06-11
PCT/US2011/039701 WO2011156539A2 (en) 2010-06-11 2011-06-09 Compositions and methods for protein production

Publications (1)

Publication Number Publication Date
CN103080123A true CN103080123A (zh) 2013-05-01

Family

ID=45098659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011800388454A Pending CN103080123A (zh) 2010-06-11 2011-06-09 组合物以及用于生产蛋白质的方法

Country Status (7)

Country Link
US (3) US9334494B2 (zh)
EP (1) EP2580230B1 (zh)
CN (1) CN103080123A (zh)
AU (1) AU2011264879B2 (zh)
BR (1) BR112012031559B1 (zh)
CA (1) CA2801564A1 (zh)
WO (1) WO2011156539A2 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112012001335A2 (pt) * 2009-07-21 2017-06-13 Syngenta Participations Ag peptídeos de trânsito de plastídeos derivados de eucariontes fotossintéticos inferiores e métodos
CA2801564A1 (en) 2010-06-11 2011-12-15 Syngenta Participations Ag Compositions and methods for protein production
RU2626535C2 (ru) 2012-02-01 2017-07-28 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Синтетические происходящие из brassica транзитные пептиды хлоропластов
EP2821486B1 (en) * 2012-02-27 2018-12-26 Riken Method of introducing nucleic acid into plant cells
WO2014178932A1 (en) * 2013-05-02 2014-11-06 Syngenta Participations Ag Glyphosate resistant class i epsps genes
US10724040B2 (en) 2015-07-15 2020-07-28 The Penn State Research Foundation mRNA sequences to control co-translational folding of proteins
EP3555289A1 (en) 2016-12-13 2019-10-23 ModernaTX, Inc. Rna affinity purification
EP3577221A4 (en) * 2017-02-01 2020-12-23 ModernaTX, Inc. SECONDARY POLYNUCLEOTIDE STRUCTURE
CN116705141B (zh) * 2022-12-15 2024-01-09 西北大学 一种基于cnn-lstm神经网络从核桃酶解产物中筛选阿尔兹海默症预防肽的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002029088A2 (en) * 2000-10-04 2002-04-11 The Trustees Of The University Of Pennsylvania Highly expressible genes
US20080268503A1 (en) * 2005-03-17 2008-10-30 Zenotech Laboratories Limited Method for Achieving High-Level Expression of Recombinant Human Interleukin-2 Upon Destabilization of the Rna Secondary Structure

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6366860B1 (en) 2000-01-31 2002-04-02 Biocatalytics, Inc. Synthetic genes for enhanced expression
US6818752B2 (en) 2000-01-31 2004-11-16 Biocatalytics, Inc. Synthetic genes for enhanced expression
WO2001068835A2 (en) * 2000-03-13 2001-09-20 Aptagen Method for modifying a nucleic acid
US20040002083A1 (en) 2002-01-29 2004-01-01 Ye Ding Statistical algorithms for folding and target accessibility prediction and design of nucleic acids
DE10205091B4 (de) 2002-02-07 2007-04-19 Biomax Informatics Ag Verfahren zur Vorhersage der Expressionseffizienz in zellfreien Expressionssystemen
US8855936B2 (en) 2009-10-02 2014-10-07 University Of Southern California Production of stable proteins
CA2801564A1 (en) 2010-06-11 2011-12-15 Syngenta Participations Ag Compositions and methods for protein production

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002029088A2 (en) * 2000-10-04 2002-04-11 The Trustees Of The University Of Pennsylvania Highly expressible genes
US20080268503A1 (en) * 2005-03-17 2008-10-30 Zenotech Laboratories Limited Method for Achieving High-Level Expression of Recombinant Human Interleukin-2 Upon Destabilization of the Rna Secondary Structure

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
EVA FREYHULT,等: ""A comparison of RNA folding measures"", 《BMC BIOINFORMATICS》 *
I.L.HOFACKER,等: ""Fast Folding and Comparison of RNA Secondary Structures"", 《MONATSHEFTE FÜR CHEMIE》 *
JEROME WALDISPÜHL,等: ""RNAmutants: a web server to explore the mutational landscape of RNA secondary structures"", 《NUCLEIC ACIDS RESEARCH》 *
YE DING: ""Statistical and Bayesian approaches to RNA secondary structure prediction"", 《RNA》 *

Also Published As

Publication number Publication date
US11643651B2 (en) 2023-05-09
US9334494B2 (en) 2016-05-10
BR112012031559B1 (pt) 2020-03-03
US20150152408A1 (en) 2015-06-04
CA2801564A1 (en) 2011-12-15
WO2011156539A2 (en) 2011-12-15
US20130084641A1 (en) 2013-04-04
EP2580230A2 (en) 2013-04-17
US20170226504A1 (en) 2017-08-10
AU2011264879B2 (en) 2015-11-12
EP2580230B1 (en) 2017-08-23
WO2011156539A3 (en) 2012-06-07
US9605258B2 (en) 2017-03-28
AU2011264879A1 (en) 2013-01-10
BR112012031559A2 (pt) 2017-09-19
EP2580230A4 (en) 2013-12-25

Similar Documents

Publication Publication Date Title
CN103080123A (zh) 组合物以及用于生产蛋白质的方法
CN103748230B (zh) 外源双链rna导入植物细胞的方法和组合物
Westwood et al. RNA translocation between parasitic plants and their hosts
Wang et al. The tRNA-derived small RNAs regulate gene expression through triggering sequence-specific degradation of target transcripts in the oomycete pathogen Phytophthora sojae
CN103298336A (zh) 用于大豆植物内瞬时表达系统的方法和组合物
CN105307480A (zh) 植物调控元件和其用途
Li et al. Identification of flower-specific promoters through comparative transcriptome analysis in Brassica napus
CN106754948A (zh) 褐飞虱NlMLP基因、编码蛋白及其应用
CN104995301A (zh) 植物调控元件及其用途
JP2022089861A (ja) 植物調節エレメント及びその使用法
CN101240280A (zh) 玉米根优先启动子及其用途
Zhao et al. A phosphate transporter from Medicago truncatula is expressed in the photosynthetic tissues of the plant and located in the chloroplast envelope
Danila et al. A single promoter‐TALE system for tissue‐specific and tuneable expression of multiple genes in rice
Miroshnichenko et al. Evaluation of plant-derived promoters for constitutive and tissue-specific gene expression in potato
CN114276429A (zh) 兼抗纹枯病与茎基腐病的转TaLRK-R基因小麦的培育方法及其相关生物材料
CN103667296B (zh) 一个组成型表达启动子及其应用
CN101605901B (zh) 植物miRNA、其芯片及用途
CN107109430A (zh) 通过微阵列分析鉴定的甘蓝型油菜种子特异性启动子
CN106676132A (zh) 一种高效的植物双元诱导基因表达重组质粒
Fan et al. Large-scale mRNA transfer between Haloxylon ammodendron (Chenopodiaceae) and herbaceous root holoparasite Cistanche deserticola (Orobanchaceae)
Su et al. Two Arabidopsis chloroplast GrpE homologues exhibit distinct biological activities and can form homo-and hetero-oligomers
CN104152454A (zh) 来源于大豆的干旱诱导启动子GmMYB363P及其应用
Chen et al. Achieving High Expression of Cry in Green Tissues and Negligible Expression in Endosperm Simultaneously via rbcS Gene Fusion Strategy in Rice
CN105823890B (zh) 一种利用高粱花叶病毒p3n‑pipo构建的亚细胞定位试剂盒
Zhu et al. Transcription Factor Pso9TF Assists Xinjiang Wild Myrobalan Plum (Prunus sogdiana) PsoRPM3 Disease Resistance Protein to Resist Meloidogyne incognita

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130501