CN114746099A - 真核半合成生物体 - Google Patents
真核半合成生物体 Download PDFInfo
- Publication number
- CN114746099A CN114746099A CN202080082837.9A CN202080082837A CN114746099A CN 114746099 A CN114746099 A CN 114746099A CN 202080082837 A CN202080082837 A CN 202080082837A CN 114746099 A CN114746099 A CN 114746099A
- Authority
- CN
- China
- Prior art keywords
- natural
- codon
- mrna
- trna
- base
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/33—Chemical structure of the base
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y601/00—Ligases forming carbon-oxygen bonds (6.1)
- C12Y601/01—Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Epidemiology (AREA)
- Cell Biology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本文提供了真核半合成生物体及其使用和制造方法。
Description
相关申请的交叉引用
本申请要求2019年9月30日提交的美国临时申请号62/908,421的优先权。
序列表
本申请含有已以ASCII格式电子提交并且通过引用以其整体特此并入的序列表。2020年9月24日创建的所述ASCII副本命名为36271-810_601_SL.txt并且大小为19,000字节。
关于联邦赞助研究的声明
本发明是在政府支持下在国家健康协会(NIH)授予的资助号GM118178下完成的。政府对本发明拥有一定的权利。
背景技术
细胞中从来产生的每种蛋白质都已经用四字母、两碱基对遗传字母表编码。这通常将可以构建蛋白质的氨基酸限制为规范的20种成蛋白质性氨基酸。尽管这已经允许生命的多样性,但许多潜在的功能性是不可用的,并且因此扩展到包括非规范氨基酸(ncAA)(包括经选择以提供希望的活性的氨基酸)可能允许产生具有改善的特性的新型蛋白质,用于范围从材料到治疗剂的应用。掺入ncAA的努力主要依赖于经由终止密码子(UAG)或四字母密码子(四联体密码子)遏制来扩展遗传字母表,尽管在这些情况下,ncAA的掺入必须与密码子的天然功能竞争。为了克服这种限制,努力集中在消除天然终止或稀有密码子的基因组的合成,从而使它们摆脱约束以重新分配给ncAA。然而,稀有密码子可能在翻译和蛋白质折叠的调节中潜在地发挥重要作用,并且基因组合成作为一般策略是不切实际的,尤其是对于大真核基因组。
一种替代方法依赖于使用非天然碱基对(UBP),从实际的角度来看,其原则上将允许产生几乎无限数量的不受任何天然功能阻碍的新的全新密码子。通过追求药物化学样,已经开发了UBP家族,以dNaM-dTPT3(图1B)为典型代表,其已经被用作大肠杆菌(E.coli)半合成生物体(SSO)的基础。大肠杆菌SSO将UBP储存在其基因组中或在质粒上,将其转录成mRNA和tRNA,并且与通过正交合成酶装载有ncAA的tRNA一起翻译含有ncAA的蛋白质。大肠杆菌SSO具有重要的实际应用,因为它目前正被用于产生新型治疗剂。
ncAA和可以产生的所得非天然多肽的广度至少部分地取决于所用的SSO。迄今为止,尚未在真核SSO或系统中显示UBP如dNAM-dTPT3的使用。本文在真核细胞方面概述的方法的概念验证将使得能够产生更宽范围的ncAA和所得非天然多肽,其可以用于重要的实际应用,如产生新型治疗剂。
发明内容
在一些实施方案中,本文提供了一种通过探索非天然密码子的翻译而产生的真核半合成生物体(SSO)。在用含有非天然密码子的mRNA、含有同源非天然密码子的tRNA以及编码适当合成酶以用非规范氨基酸(ncAA)装载tRNA的DNA直接、瞬时、三重转染后,表征蛋白质产生。
本文公开的方面提供了真核细胞,所述真核细胞包含(a)具有包含第一非天然碱基的密码子的信使RNA(mRNA)以及(b)具有包含第二非天然碱基的反密码子的转移RNA(tRNA),其中所述第一非天然碱基和所述第二非天然碱基在所述真核细胞中形成非天然碱基对(UBP),并且其中所述mRNA能够在所述细胞中被翻译以产生包含至少一个非天然氨基酸的多肽。在一些实施方案下,所述tRNA装载有非天然氨基酸。在一些实施方案中,所述真核细胞进一步包含从所述mRNA翻译的多肽,其中所述多肽包含至少一个非天然氨基酸。在一些实施方案中,真核细胞进一步包含核糖体,所述核糖体能够使用所述tRNA从所述mRNA翻译包含所述至少一个非天然氨基酸的多肽。
本文公开的方面还提供了包含非天然碱基对(UBP)的真核细胞,所述真核细胞包含:(a)包含第一非天然碱基的第一非天然核糖核苷酸;(b)包含第二非天然碱基的第二非天然核糖核苷酸,其中所述第一非天然碱基和所述第二非天然碱基在所述真核细胞中形成非天然碱基对(UBP)。
在一些实施方案中,所述第一非天然碱基或所述第二非天然碱基选自:(i)2-硫尿嘧啶、2-硫代-胸腺嘧啶、2'-脱氧尿苷、4-硫代-尿嘧啶、4-硫代-胸腺嘧啶、尿嘧啶-5-基、次黄嘌呤-9-基(I)、5-卤代尿嘧啶、5-丙炔基-尿嘧啶、6-偶氮-胸腺嘧啶、6-偶氮-尿嘧啶、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、假尿嘧啶、尿嘧啶-5-氧乙酸甲酯、尿嘧啶-5-氧乙酸、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、5-甲基-2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、尿嘧啶-5-氧乙酸、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶或二氢尿嘧啶;(ii)5-羟甲基胞嘧啶、5-三氟甲基胞嘧啶、5-卤代胞嘧啶、5-丙炔基胞嘧啶、5-羟基胞嘧啶、环胞嘧啶、阿糖胞苷、5,6-二氢胞嘧啶、5-硝基胞嘧啶、6-偶氮胞嘧啶、氮杂胞嘧啶、N4-乙基胞嘧啶、3-甲基胞嘧啶、5-甲基胞嘧啶、4-乙酰基胞嘧啶、2-硫胞嘧啶、吩噁嗪胞苷([5,4-b][l,4]苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并[5,4-b][l,4]苯并噻嗪-2(3H)-酮)、吩噁嗪胞苷(9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][l,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)或吡啶并吲哚胞苷(H-吡啶并[3',2':4,5]吡咯并[2,3-d]嘧啶-2-酮);(iii)2-氨基腺嘌呤,2-丙基腺嘌呤,2-氨基-腺嘌呤,2-F-腺嘌呤,2-氨基-丙基-腺嘌呤,2-氨基-2'-脱氧腺苷,3-脱氮腺嘌呤,7-甲基腺嘌呤,7-脱氮-腺嘌呤,8-氮杂腺嘌呤,8-卤代、8-氨基、8-硫醇、8-硫烷基和8-羟基取代的腺嘌呤,N6-异戊烯基腺嘌呤,2-甲基腺嘌呤,2,6-二氨基嘌呤,2-甲基硫代-N6-异戊烯基腺嘌呤,或6-氮杂-腺嘌呤;(iv)2-甲基鸟嘌呤,鸟嘌呤的2-丙基和烷基衍生物,3-脱氮鸟嘌呤,6-硫代-鸟嘌呤,7-甲基鸟嘌呤,7-脱氮鸟嘌呤,7-脱氮鸟苷,7-脱氮-8-氮杂鸟嘌呤,8-氮杂鸟嘌呤,8-卤代、8-氨基、8-硫醇、8-硫烷基和8-羟基取代的鸟嘌呤,1-甲基鸟嘌呤,2,2-二甲基鸟嘌呤,7-甲基鸟嘌呤,或6-氮杂-鸟嘌呤;以及(v)次黄嘌呤、黄嘌呤、1-甲基肌苷、辫苷(queosine)、β-D-半乳糖基辫苷、肌苷、β-D-甘露糖基辫苷、怀丁氧苷(wybutoxosine)、羟基脲、(acp3)w、2-氨基吡啶或2-吡啶酮。在一些实施方案中,所述第一非天然碱基和所述第二非天然碱基各自独立地选自
其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是(5SICS)时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是 时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述第一非天然碱基或所述第二非天然碱基包含选自以下的经修饰的糖部分:2'位置处的修饰:
OH、经取代的低级烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-烷基、S-烷基、N-烷基;
O-烯基、S-烯基、N-烯基;
O-炔基、S-炔基、N-炔基;
O-烷基-O-烷基、2'-F、2'-OCH3、2'-O(CH2)2OCH3,其中所述烷基、烯基和炔基可以是经取代或未经取代的C1-C10烷基、C2-C10烯基、C2-C10炔基、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2和-O(CH2)nON[(CH2)nCH3)]2,其中n和m是1至约10;
和/或5'位置处的修饰:
5'-乙烯基、5'-甲基(R或S);
4'位置处的修饰:
4'-S、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、经取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改善寡核苷酸的药代动力学特性的基团、或用于改善寡核苷酸的药效学特性的基团及其任何组合。
在一些实施方案中,所述真核细胞进一步包含:(a)具有包含所述第一非天然碱基的反密码子的转移RNA(tRNA);(b)具有包含所述第二非天然碱基的密码子的信使RNA(mRNA),其中所述第一非天然碱基和所述第二非天然碱基能够在所述真核细胞中形成非天然碱基对(UBP)。在一些实施方案中,所述真核细胞还包含:(a)具有包含所述第二非天然碱基的反密码子的转移RNA(tRNA);(b)具有包含所述第一非天然碱基的密码子的信使RNA(mRNA),其中所述第一非天然碱基和所述第二非天然碱基能够在所述真核细胞中形成非天然碱基对(UBP)。在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N)。在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X)。在一些实施方案中,所述真核细胞进一步包含从所述mRNA翻译的多肽,其中所述多肽包含至少一个非天然氨基酸。在一些实施方案中,所述至少一个非天然氨基酸:(a)是赖氨酸类似物;(b)包含芳族侧链;(c)包含叠氮基;(d)包含炔基;或(e)包含醛基或酮基。在一些实施方案中,所述一个或多个非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸和N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述至少一个非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。在一些实施方案中,所述至少一个非天然氨基酸是N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述至少一个非天然氨基酸是N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述至少一个非天然氨基酸是N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述真核细胞是人细胞。在一些实施方案中,所述人细胞是HEK293T细胞。在一些实施方案中,所述细胞是仓鼠细胞。在一些实施方案中,所述仓鼠细胞是中国仓鼠卵巢(CHO)细胞。在一些实施方案中,所述细胞是分离和纯化的。在一些实施方案中,所述mRNA和所述tRNA在所述真核细胞中稳定而不降解。
本文公开的方面提供了一种包含本文所述的真核细胞的半合成生物体。
本文公开的方面提供了一种包含多个本公开文本的真核细胞的真核细胞系。
本文公开的方面提供了在真核细胞中产生包含一个或多个非天然氨基酸的多肽的方法,所述方法包括:(a)向所述细胞中引入:(i)具有包含第一非天然碱基的密码子的信使RNA(mRNA);和(ii)在所述真核细胞中具有包含第二非天然碱基的反密码子的转移RNA(tRNA),其中所述第一非天然碱基和所述第二非天然碱基在所述真核细胞中形成非天然碱基对(UBP);以及(b)使用所述tRNA从所述mRNA翻译包含所述一个或多个非天然氨基酸的多肽。在一些实施方案下,所述tRNA装载有非天然氨基酸。
本文公开的方面还提供了在真核细胞中产生包含一个或多个非天然氨基酸的多肽的方法,所述方法包括:(a)提供真核细胞,所述真核细胞包含:(i)具有包含第一非天然碱基的密码子的信使RNA(mRNA);(ii)具有包含第二非天然碱基的反密码子的转移RNA(tRNA),其中所述第一非天然碱基和所述第二非天然碱基在所述真核细胞中形成非天然碱基对(UBP);(b)使用所述tRNA通过与所述真核细胞内源的核糖体从所述mRNA翻译包含所述一个或多个非天然氨基酸的多肽。在一些实施方案中,所述多肽包含真核糖基化模式。所述糖基化模式可以对应于产生它的细胞(例如,当所述细胞是哺乳动物时,是哺乳动物糖基化模式,当所述细胞是人时,是人糖基化模式,等)。
本文公开的方面还提供了在真核细胞中产生多肽的方法,其中所述多肽包含一个或多个非天然氨基酸,所述方法包括:(a)提供真核细胞,所述真核细胞包含:(i)包含密码子的mRNA,其中所述密码子包含第一非天然碱基;(ii)包含反密码子的tRNA,其中所述反密码子包含第二非天然碱基,并且其中所述第一非天然碱基和所述第二非天然碱基形成互补碱基对;和(iii)tRNA合成酶,其中与天然氨基酸相比,所述tRNA合成酶优先用所述一个或多个非天然氨基酸使所述tRNA氨酰化;以及(b)向所述真核细胞提供所述一个多个非天然氨基酸,其中所述真核细胞产生包含所述一个或多个非天然氨基酸的多肽。
本文公开的方面还提供了在真核细胞中产生包含一个或多个非天然氨基酸的多肽的方法,所述方法包括:(a)提供真核细胞,所述真核细胞包含:(i)具有包含第一非天然碱基的反密码子的转移RNA(tRNA);(ii)具有包含第二非天然碱基的密码子的信使RNA(mRNA),其中所述第一非天然碱基和所述第二非天然碱基在所述真核细胞中形成非天然碱基对(UBP);以及(c)使用所述tRNA通过与所述真核细胞内源的核糖体从所述mRNA翻译包含所述一个或多个非天然氨基酸的多肽。
在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N)。在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X)。在一些实施方案中,所述第一非天然碱基或所述第二非天然碱基选自:(a)2-硫尿嘧啶、2-硫代-胸腺嘧啶、2'-脱氧尿苷、4-硫代-尿嘧啶、4-硫代-胸腺嘧啶、尿嘧啶-5-基、次黄嘌呤-9-基(I)、5-卤代尿嘧啶、5-丙炔基-尿嘧啶、6-偶氮-胸腺嘧啶、6-偶氮-尿嘧啶、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、假尿嘧啶、尿嘧啶-5-氧杂乙酸甲酯、尿嘧啶-5-氧乙酸、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、5-甲基-2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、尿嘧啶-5-氧乙酸、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶、或二氢尿嘧啶;(b)5-羟甲基胞嘧啶、5-三氟甲基胞嘧啶、5-卤代胞嘧啶、5-丙炔基胞嘧啶、5-羟基胞嘧啶、环胞嘧啶、阿糖胞苷、5,6-二氢胞嘧啶、5-硝基胞嘧啶、6-偶氮胞嘧啶、氮杂胞嘧啶、N4-乙基胞嘧啶、3-甲基胞嘧啶、5-甲基胞嘧啶、4-乙酰基胞嘧啶、2-硫胞嘧啶、吩噁嗪胞苷([5,4-b][l,4]苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并[5,4-b][l,4]苯并噻嗪-2(3H)-酮)、吩噁嗪胞苷(9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][l,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)或吡啶并吲哚胞苷(H-吡啶并[3',2':4,5]吡咯并[2,3-d]嘧啶-2-酮);(c)2-氨基腺嘌呤,2-丙基腺嘌呤,2-氨基-腺嘌呤,2-F-腺嘌呤,2-氨基-丙基-腺嘌呤,2-氨基-2'-脱氧腺苷,3-脱氮腺嘌呤,7-甲基腺嘌呤,7-脱氮-腺嘌呤,8-氮杂腺嘌呤,8-卤代、8-氨基、8-硫醇、8-硫烷基和8-羟基取代的腺嘌呤,N6-异戊烯基腺嘌呤,2-甲基腺嘌呤,2,6-二氨基嘌呤,2-甲基硫代-N6-异戊烯基腺嘌呤,或6-氮杂-腺嘌呤;(d)2-甲基鸟嘌呤,鸟嘌呤的2-丙基和烷基衍生物,3-脱氮鸟嘌呤,6-硫代-鸟嘌呤,7-甲基鸟嘌呤,7-脱氮鸟嘌呤,7-脱氮鸟苷,7-脱氮-8-氮杂鸟嘌呤,8-氮杂鸟嘌呤,8-卤代、8-氨基、8-硫醇、8-硫烷基和8-羟基取代的鸟嘌呤,1-甲基鸟嘌呤,2,2-二甲基鸟嘌呤,7-甲基鸟嘌呤,或6-氮杂-鸟嘌呤;和(e)次黄嘌呤、黄嘌呤、1-甲基肌苷、辫苷、β-D-半乳糖基辫苷、肌苷、β-D-甘露糖基辫苷、怀丁氧苷、羟基脲、(acp3)w、2-氨基吡啶或2-吡啶酮。在一些实施方案中,所述第一非天然碱基或所述第二非天然碱基选自
其中波浪线指示与核糖基部分的键。在一些实施方案中,所述第一非天然碱基是 所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是 时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是 时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述第一非天然碱基或所述第二非天然碱基包含选自以下的经修饰的糖部分:2'位置处的修饰:
OH、经取代的低级烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-烷基、S-烷基、N-烷基;
O-烯基、S-烯基、N-烯基;
O-炔基、S-炔基、N-炔基;
O-烷基-O-烷基、2'-F、2'-OCH3、2'-O(CH2)2OCH3,其中所述烷基、烯基和炔基可以是经取代或未经取代的C1-C10烷基、C2-C10烯基、C2-C10炔基、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2和-O(CH2)nON[(CH2)nCH3)]2,其中n和m是1至约10;
和/或5'位置处的修饰:
5'-乙烯基、5'-甲基(R或S);
4'位置处的修饰:
4'-S、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、经取代的甲硅烷基、
RNA切割基团、报告基团、嵌入剂、用于改善寡核苷酸的药代动力学特性的基团、或用于改善寡核苷酸的药效学特性的基团及其任何组合。
在一些实施方案中,所述真核细胞是人细胞。在一些实施方案中,所述人细胞是HEK293T细胞。在一些实施方案中,所述细胞是仓鼠细胞。在一些实施方案中,所述仓鼠细胞是中国仓鼠卵巢(CHO)细胞。在一些实施方案中,所述非天然氨基酸:(a)是赖氨酸类似物;(b)包含芳族侧链;(c)包含叠氮基;(d)包含炔基;或(e)包含醛基或酮基。在一些实施方案中,所述非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸和N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。在一些实施方案中,所述一个或多个非天然氨基酸是N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述一个或多个非天然氨基酸是N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述一个或多个非天然氨基酸是N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。
本文公开的方面提供了在真核细胞中产生多肽的方法,其中所述多肽包含一个或多个非天然氨基酸,所述方法包括:(a)提供真核细胞,所述真核细胞包含:(i)包含密码子的mRNA,其中所述密码子包含一个或多个非天然碱基;(ii)包含反密码子的tRNA,其中所述反密码子包含一个或多个非天然碱基,并且其中构成所述mRNA中的密码子的一个或多个非天然碱基和构成所述tRNA中的反密码子的一个或多个非天然碱基形成互补碱基对;和(iii)tRNA合成酶,其中与天然氨基酸相比,所述tRNA合成酶优先用所述一个或多个非天然氨基酸使所述tRNA氨酰化;以及(b)向所述真核细胞提供所述一个多个非天然氨基酸,其中所述真核细胞产生包含所述一个或多个非天然氨基酸的多肽。在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N)。在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X)。在一些实施方案中,构成所述mRNA中的密码子的一个或多个非天然碱基具有下式: 其中R2选自氢、烷基、烯基、炔基、甲氧基、甲硫醇、甲烷硒基、卤素、氰基和叠氮基,并且波浪线指示与核糖基部分的键。在一些实施方案中,所述第一非天然碱基或所述第二非天然碱基选自其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是 时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是 时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,所述第二非天然碱基是并且当所述第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述第一非天然碱基是时,并且所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,其中构成所述mRNA中的密码子的非天然核苷酸选自 其中波浪线指示与核糖基部分的键。在一些实施方案中,构成所述mRNA中的密码子的非天然核苷酸是其中波浪线指示与核糖基部分的键。在一些实施方案中,构成所述mRNA中的密码子的非天然核苷酸是其中波浪线指示与核糖基部分的键。在一些实施方案中,构成所述mRNA中的密码子的非天然核苷酸是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N),其中所述非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N),其中所述非天然碱基选自 并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N),其中所述非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N),其中所述非天然碱基选自并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是 其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述mRNA的所述密码子包含三个连续核碱基(N-N-N),其中所述非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X),其中所述非天然碱基选自并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是 其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述tRNA的反密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述tRNA的反密码子中的第一位置(X-N-N)。在一些实施方案中,所述非天然碱基选自并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是 其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述tRNA的反密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述tRNA的反密码子中的中间位置(N-X-N)。在一些实施方案中,所述非天然碱基选自并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是 其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述tRNA的反密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述tRNA的反密码子中的最后位置(N-N-X)。在一些实施方案中,所述非天然碱基选自并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是 其中波浪线指示与核糖基部分的键。在一些实施方案中,所述非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的密码子包含位于所述密码子的第一位置(X-N-N)的第一非天然碱基(X),并且所述tRNA中的反密码子包含位于所述反密码子的最后位置(N-N-Y)的第二非天然碱基(Y)。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同或不同。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)不同。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)和位于所述tRNA的反密码子中的第二非天然碱基(Y)选自 其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)和位于所述tRNA的所述反密码子中的第二非天然碱基(Y)选自 其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)和位于所述tRNA的反密码子中的第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)和位于所述tRNA的反密码子中的第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)和位于所述tRNA的反密码子中的第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)是在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)是在一些实施方案中,所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的所述密码子包含位于所述密码子的中间位置(N-X-N)的第一非天然碱基(X),并且所述tRNA中的反密码子包含位于所述反密码子的中间位置(N-Y-N)的第二非天然碱基(Y)。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同或不同。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)不同。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)和位于所述tRNA的反密码子中的第二非天然碱基(Y)选自 其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)和位于所述tRNA的所述反密码子中的第二非天然碱基(Y)选自 其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)和位于所述tRNA的反密码子中的第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)和位于所述tRNA的反密码子中的第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)和位于所述tRNA的反密码子中的第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)选自和并且位于所述tRNA的所述反密码子中的第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)是在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)是在一些实施方案中,所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的所述密码子包含位于所述密码子的最后位置(N-N-X)的第一非天然碱基(X),并且所述tRNA中的反密码子包含位于所述反密码子的第一位置(Y-N-N)的第二非天然碱基(Y)。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同或不同。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)不同。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)和位于所述tRNA的所述反密码子中的第二非天然碱基(Y)选自
其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)和位于所述tRNA的所述反密码子中的第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)和位于所述tRNA的反密码子中的第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)和位于所述tRNA的反密码子中的第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)和位于所述tRNA的反密码子中的第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)是(NaM)。在一些实施方案中,位于所述mRNA的密码子中的第一非天然碱基(X)是在一些实施方案中,所述mRNA中的所述密码子选自AXC、GXC或GXU,其中X是所述非天然碱基。在一些实施方案中,所述mRNA中的密码子是AXC,其中X是所述非天然碱基。在一些实施方案中,所述mRNA中的密码子是GXC,其中X是所述非天然碱基。在一些实施方案中,所述mRNA中的密码子是GXU,其中X是所述非天然碱基。在一些实施方案中,所述mRNA中的密码子选自AXC、GXC或GXU,其中所述tRNA中的反密码子选自GYU、GYC和AYC,其中X是第一非天然碱基并且Y是第二非天然碱基。在一些实施方案中,X与Y相同或不同。在一些实施方案中,X与Y相同。在一些实施方案中,X与Y不同。在一些实施方案中,所述mRNA中的密码子是AXC并且所述tRNA中的反密码子是GYU。在一些实施方案中,X与Y相同或不同。在一些实施方案中,X与Y相同。在一些实施方案中,X与Y不同。在一些实施方案中,所述mRNA中的密码子是GXC并且所述tRNA中的反密码子是GYC。在一些实施方案中,X与Y相同或不同。在一些实施方案中,X与Y相同。在一些实施方案中,X与Y不同。在一些实施方案中,所述mRNA中的所述密码子是GXU并且所述反密码子是AYC。在一些实施方案中,X与Y相同或不同。在一些实施方案中,X与Y相同。在一些实施方案中,X与Y不同。在一些实施方案中,所述tRNA源自詹氏甲烷球菌(Methanococcus jannaschii)、巴氏甲烷八叠球菌(Methanosarcinabarkeri)、马氏甲烷八叠球菌(Methanosarcina mazei)或乙酸甲烷八叠球菌(Methanosarcina acetivorans)。在一些实施方案中,氨酰基tRNA合成酶(本文也简称为tRNA合成酶)源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。在一些实施方案中,所述tRNA和所述tRNA合成酶源自詹氏甲烷球菌。在一些实施方案中,所述tRNA和所述tRNA合成酶源自巴氏甲烷八叠球菌。在一些实施方案中,所述tRNA和所述tRNA合成酶源自马氏甲烷八叠球菌。在一些实施方案中,所述tRNA和所述tRNA合成酶源自乙酸甲烷八叠球菌。在一些实施方案中,所述tRNA源自詹氏甲烷球菌,并且tRNA合成酶源自巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。在一些实施方案中,所述tRNA源自巴氏甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。在一些实施方案中,所述tRNA源自马氏甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌或乙酸甲烷八叠球菌。在一些实施方案中,所述tRNA源自乙酸甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌或马氏甲烷八叠球菌。在一些实施方案中,所述tRNA源自马氏甲烷八叠球菌,并且tRNA合成酶源自巴氏甲烷八叠球菌。在一些实施方案中,所述细胞是人细胞。在一些实施方案中,所述人细胞是HEK293T细胞。在一些实施方案中,所述细胞是仓鼠细胞。在一些实施方案中,所述仓鼠细胞是中国仓鼠卵巢(CHO)细胞。在一些实施方案中,所述非天然氨基酸:(a)是赖氨酸类似物;(b)包含芳族侧链;(c)包含叠氮基;(d)包含炔基;或(e)包含醛基或酮基。在一些实施方案中,所述非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸或N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。在一些实施方案中,所述至少一个非天然氨基酸是N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述至少一个非天然氨基酸是N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述至少一个非天然氨基酸是N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述mRNA和所述tRNA在所述真核细胞中稳定而不降解。在一些实施方案中,所述多肽通过使用所述tRNA通过所述真核细胞内源的核糖体翻译所述mRNA来产生。
本文公开的方面提供了用于表达非天然多肽的系统,所述系统包含:(a)至少一个非天然氨基酸;(b)编码所述非天然多肽的mRNA,所述mRNA包含含有一个或多个第一非天然碱基的至少一个密码子;(c)tRNA,所述tRNA包含含有一个或多个第二非天然碱基的至少一个反密码子,其中所述一个或多个第一非天然碱基和所述一个或多个第二非天然碱基形成一个或多个互补碱基对;以及(d)真核核糖体,所述真核核糖体能够使用所述tRNA和tRNA合成酶将所述mRNA翻译成包含所述非天然氨基酸的多肽。所述tRNA可以装载有所述非天然氨基酸,和/或所述系统可以进一步包含tRNA合成酶和/或一个或多个包含编码tRNA合成酶的核酸序列的核酸构建体,其中所述tRNA合成酶优先用所述至少一个非天然氨基酸使所述tRNA氨酰化。所述系统可以在体外(例如,无细胞,如细胞裂解物或纯化组分的重构系统)或在真核细胞中。在一些实施方案中,所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述至少一个密码子中的第一位置(X-N-N)。在一些实施方案中,所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。在一些实施方案中,所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述至少一个密码子中的最后位置(N-N-X)。在一些实施方案中,所述一个或多个非天然碱基具有下式: 其中R2选自氢、烷基、烯基、炔基、甲氧基、甲硫醇、甲烷硒基、卤素、氰基和叠氮基,并且波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基或所述一个或多个第二非天然碱基选自 其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述一个或多个第一非天然碱基是 时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是 其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是 并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是并且所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基选自其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N),其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N),其中所述一个或多个第一非天然碱基选自 并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N),其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N),其中所述一个或多个第一非天然碱基选自 并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N),其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X),其中所述一个或多个第一非天然碱基选自 并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是(NaM),其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第一非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述tRNA的至少一个反密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第二非天然碱基(X)位于所述tRNA的反密码子中的第一位置(X-N-N)。在一些实施方案中,所述一个或多个第二非天然碱基选自 并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第二非天然碱基是 其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述tRNA的至少一个反密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第二非天然碱基(X)位于所述tRNA的反密码子中的中间位置(N-X-N)。在一些实施方案中,所述一个或多个第二非天然碱基选自 并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第二非天然碱基是 其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述tRNA的至少一个反密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第二非天然碱基(X)位于所述tRNA的反密码子中的最后位置(N-N-X)。在一些实施方案中,所述一个或多个第二非天然碱基选自 并且其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第二非天然碱基是 其中波浪线指示与核糖基部分的键。在一些实施方案中,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。在一些实施方案中,所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述至少一个密码子包含一个或多个位于所述密码子的第一位置(X-N-N)的第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含一个或多个位于所述反密码子的最后位置(N-N-Y)的第二非天然碱基(Y)。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)不同。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自 以及其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)是在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)是在一些实施方案中,所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述mRNA中的所述至少一个密码子包含位于所述至少一个密码子的中间位置(N-X-N)的一个或多个第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含位于所述反密码子的中间位置(N-Y-N)的一个或多个第二非天然碱基(Y)。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)不同。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自 以及其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)是在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)是在一些实施方案中,所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述mRNA中的所述至少一个密码子包含位于所述至少一个密码子的最后位置(N-N-X)的一个或多个第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含位于所述反密码子的第一位置(Y-N-N)的一个或多个第二非天然碱基(Y)。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)不同。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自
其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)是在一些实施方案中,位于所述mRNA的密码子中的一个或多个第一非天然碱基(X)是在一些实施方案中,所述mRNA中的至少一个密码子选自AXC、GXC或GXU,其中X是所述非天然碱基。在一些实施方案中,所述mRNA中的至少一个密码子是AXC,其中X是所述非天然碱基。在一些实施方案中,所述mRNA中的至少一个密码子是GXC,其中X是所述非天然碱基。在一些实施方案中,所述mRNA中的至少一个密码子是GXU,其中X是所述非天然碱基。在一些实施方案中,所述mRNA中的至少一个密码子选自AXC、GXC或GXU,其中所述tRNA中的至少一个反密码子选自GYU、GYC和AYC,其中X是所述一个或多个第一非天然碱基并且Y是所述一个或多个第二非天然碱基。在一些实施方案中,X与Y相同或不同。在一些实施方案中,X与Y相同。在一些实施方案中,X与Y不同。在一些实施方案中,所述mRNA中的所述至少一个密码子是AXC并且所述tRNA中的所述至少一个反密码子是GYU。在一些实施方案中,X与Y相同或不同。在一些实施方案中,X与Y相同。在一些实施方案中,X与Y不同。在一些实施方案中,所述mRNA中的所述至少一个密码子是GXC并且所述tRNA中的所述至少一个反密码子是GYC。在一些实施方案中,X与Y相同或不同。在一些实施方案中,X与Y相同。在一些实施方案中,X与Y不同。在一些实施方案中,所述mRNA中的所述至少一个密码子是GXU并且所述至少一个反密码子是AYC。在一些实施方案中,X与Y相同或不同。在一些实施方案中,X与Y相同。在一些实施方案中,X与Y不同。在一些实施方案中,所述tRNA源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。在一些实施方案中,所述tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌的tRNA合成酶。在一些实施方案中,所述tRNA和所述tRNA合成酶源自詹氏甲烷球菌。在一些实施方案中,所述tRNA和所述tRNA合成酶源自巴氏甲烷八叠球菌。在一些实施方案中,所述tRNA和所述tRNA合成酶源自马氏甲烷八叠球菌。在一些实施方案中,所述tRNA和所述tRNA合成酶源自乙酸甲烷八叠球菌。在一些实施方案中,所述tRNA源自詹氏甲烷球菌,并且tRNA合成酶源自巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。在一些实施方案中,所述tRNA源自巴氏甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。在一些实施方案中,所述tRNA源自马氏甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌或乙酸甲烷八叠球菌。在一些实施方案中,所述tRNA源自乙酸甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌或马氏甲烷八叠球菌。在一些实施方案中,所述tRNA源自马氏甲烷八叠球菌,并且tRNA合成酶源自巴氏甲烷八叠球菌。在一些实施方案中,所述细胞是人细胞。在一些实施方案中,所述人细胞是HEK293T细胞。在一些实施方案中,所述细胞是仓鼠细胞。在一些实施方案中,所述仓鼠细胞是中国仓鼠卵巢(CHO)细胞。在一些实施方案中,所述非天然氨基酸:(a)是赖氨酸类似物;(b)包含芳族侧链;(c)包含叠氮基;(d)包含炔基;或(e)包含醛基或酮基。在一些实施方案中,所述非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸或N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。在一些实施方案中,所述至少一个非天然氨基酸是N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述至少一个非天然氨基酸是N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述至少一个非天然氨基酸是N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。在一些实施方案中,所述mRNA和所述tRNA在所述真核细胞中稳定而不降解。在一些实施方案中,所述多肽通过使用所述tRNA通过所述真核细胞内源的核糖体翻译所述mRNA来产生。
在一个实施方案中,所述真核细胞包含编码在位置151处具有非天然密码子的增强绿色荧光蛋白(EGFP)的mRNA(EGFP151(NXN);其中N是指天然核碱基之一,并且X是指NaM)、用同源非天然反密码子重编码的马氏甲烷八叠球菌tRNAPyl(tRNAPyl(NYN),其中Y是指TPT3)、以及可以用N6-(2-叠氮基乙氧基)-羰基-L-赖氨酸(AzK)装载非天然tRNAPyl的嵌合巴氏甲烷八叠球菌吡咯赖氨酰-tRNA合成酶(ChPylRS)。
附图说明
本发明的各个方面具体陈述于所附的权利要求中。将通过参考陈述利用本发明原理的说明性实施方案的以下具体实施方式和附图获得对本发明的特征和优点的更好理解,在所述附图中:
图1A-图1C示出了UBP和使用本发明实施方案的UBP的工作流程。图1A描绘了示例性非天然碱基对(UBP)dNaM和dTPT3。图1B展示了使用UBP以使用非天然X-Y碱基对将非规范氨基酸(ncAA)位点特异性掺入蛋白质中的工作流程。向蛋白质中掺入三个ncAA仅作为例子示出;可以掺入任何数量的ncAA。图1C描绘了示例性UBP。
图2描绘了dXTP类似物。为清楚起见,省略了核糖和磷酸酯。
图3A-图3B示出了示例性非天然碱基。
图4A-图4G展示了示例性非天然氨基酸。这些非天然氨基酸(UAA)已经基因编码在蛋白质中(图4D-UAA#1-42;图4E-UAA#43-89;图4F-UAA#90-128;图4G-UAA#129-167)。图4D-图4G采用自Dumas等人,Chemical Science 2015,6,50-69的表1。
图5A-图5B展示了HEK293T细胞中的非天然密码子的翻译。图5A示出了通过流式细胞术测量的在有或没有同源tRNA的情况下用非天然密码子转染的HEK293T细胞的平均EGFP荧光信号。图5B示出了使用细胞裂解物用非天然密码子GXC转染的HEK293T细胞的蛋白质移位测定。
图6A-图6B展示了CHO细胞中的非天然密码子的翻译。图6A示出了通过流式细胞术测量的在有或没有同源tRNA(并且对于密码子AGX,自配对tRNA)的情况下用非天然密码子(由编码非天然密码子的DNA表示)转染的CHO细胞的平均EGFP荧光信号。图6B示出了使用纯化的EGFP用非天然密码子AXC、GXC、GXT、GYC和AGX(由编码非天然密码子的DNA表示)转染的CHO细胞的蛋白质移位测定。
图7A-图7B示出了CHO细胞中在CYBA UTR上下文内非天然密码子的翻译。图7A:通过流式细胞术测量的在有或没有同源tRNA(并且对于密码子AGX,自配对tRNA)的情况下在CYBA UTR上下文内用非天然密码子转染的CHO细胞的平均EGFP荧光信号。*P<0.05,**P<0.005,***P<0.0005,****P<0.00005(双尾配对t检验)。图7B:使用纯化的EGFP在CYBA UTR上下文内用非天然密码子GXC和GYC转染的CHO细胞的蛋白质移位测定。
图7C-图7D示出了具有CYBA UTR的mRNA与具有CS2 UTR的mRNA之间的蛋白质表达比。图7C示出了在CYBA UTR和CS2 UTR内不同非天然密码子的EGFP表达水平比。表达水平是通过流式细胞术测量的。图7D示出,使用RT-qPCR,在转录后4h和转录后8h测量mRNA丰度。在不同mRNA构建体之间比较8h后剩余的mRNA与4h后剩余的mRNA的比率。注意图7A和图7B中的非天然密码子由编码mRNA的DNA的编码序列表示。
具体实施方式
特定术语
除非另外定义,否则本文中使用的所有技术术语和科学术语具有与要求保护的主题所属领域的技术人员通常所理解的相同的含义。应理解,前述一般说明和以下具体实施方式只是示例性和解释性的,并且不限制要求保护的任何主题。在本申请中,除非另外明确陈述,否则单数的使用包括复数含义。必须指出,如在说明书和所附权利要求中所用,除非上下文另外清楚地规定,否则单数形式“一个/一种(a、an)”和“所述(the)”包括复数指示物。在本申请中,除非另外陈述,否则“或”的使用意指“和/或”。此外,术语“包括(including)”以及其他形式如“包括(include)”、“包括(includes)”和“包括(included)”的使用是非限制性的。
如本文所用,范围和数量可以表示为“约”特定值或范围。约也包括确切的量。因此,“约5μL”意指“约5μL”以及“5μL”。通常,术语“约”包括可预期在实验误差内的量。
如本文所用,在合成方法的上下文中,诸如“在适合提供……的条件下”或“在足以产生……的条件下”等短语是指在实验者的普通技术范围内可以改变的反应条件,如时间、温度、溶剂、反应物浓度等,以提供有用的量或产率的反应产物。所希望的反应产物不一定是唯一的反应产物或起始材料不一定被完全消耗,只要所希望的反应产物可以被分离或以其他方式进一步使用即可。
“化学上可行的”意指不违反一般理解的有机结构规则的键合排列或化合物;例如,在某些情况下将含有自然界中不存在的五价碳原子的在权利要求的定义内的结构应理解为不在权利要求范围内。本文公开的结构,在其所有实施方案中,旨在仅包括“化学上可行的”结构,并且任何在化学上不可行的所列举结构,例如显示为具有可变原子或基团的结构,不旨在于本文中公开或要求保护。
如本文所用的术语化学结构的“类似物”是指与母体结构保持基本相似性但它可能不容易从母体结构合成得到的化学结构。在一些实施方案中,核苷酸类似物是非天然核苷酸。在一些实施方案中,核苷类似物是非天然核苷。容易从母体化学结构合成得到的相关化学结构称为“衍生物”。
因此,如本文所用的术语多核苷酸是指DNA、RNA、DNA样或RNA样聚合物(如本领域熟知的肽核酸(PNA)、锁核酸(LNA)、硫代磷酸酯、非天然碱基等)。多核苷酸可以在自动合成仪中合成,例如,使用亚磷酰胺化学或适于合成仪使用的其他化学途径。
DNA包括但不限于cDNA和基因组DNA。DNA可以通过共价或非共价方式附接至另一个生物分子(包括但不限于RNA和肽)。RNA包括编码RNA,例如信使RNA(mRNA)。在一些实施方案中,RNA是rRNA、RNAi、snoRNA、微小RNA、siRNA、snRNA、exRNA、piRNA、长ncRNA或其任何组合或杂合体。在一些实例中,RNA是核酶的组分。DNA和RNA可以呈任何形式,包括但不限于线性、环状、超螺旋、单链和双链。
肽核酸(PNA)是合成的DNA/RNA类似物,其中肽样骨架替代了DNA或RNA的糖-磷酸酯骨架。PNA寡聚物在结合互补DNA时显示出更高的结合强度和更高的特异性,其中PNA/DNA碱基错配与DNA/DNA双链体中的类似错配相比导致更不稳定化。这种结合强度和特异性也适用于PNA/RNA双链体。PNA不容易被核酸酶或蛋白酶识别,使得它们对酶降解具有抗性。PNA在宽pH范围内也是稳定的。还参见Nielsen PE,Egholm M,Berg RH,Buchardt O(1991年12月)."Sequence-selective recognition of DNA by strand displacement with athymine-substituted polyamide",Science 254(5037):1497-500.doi:10.1126/science.1962210.PMID 1962210;以及Egholm M,Buchardt O,Christensen L,Behrens C,Freier SM,Driver DA,Berg RH,Kim SK,Nordén B,和Nielsen PE(1993),“PNAHybridizes to Complementary Oligonucleotides Obeying the Watson-CrickHydrogen Bonding Rules”.Nature 365(6446):566–8.doi:10.1038/365566a0.PMID7692304
锁核酸(LNA)是修饰的RNA核苷酸,其中LNA核苷酸的核糖部分用连接2'氧和4'碳的额外桥进行修饰。所述桥将核糖“锁定”在3'-内(北)构象中,这通常在A型双链体中发现。只要希望,LNA核苷酸可以与寡核苷酸中的DNA或RNA残基混合。此类寡聚物可以化学合成并且是可商购的。锁核糖构象增强了碱基堆积和骨架预组织。参见例如Kaur,H;Arora,A;Wengel,J;Maiti,S(2006),"Thermodynamic,Counterion,and Hydration Effects forthe Incorporation of Locked Nucleic Acid Nucleotides into DNA Duplexes",Biochemistry 45(23):7347-55.doi:10.1021/bi060307w.PMID 16752924;Owczarzy R.;You Y.,Groth C.L.,Tataurov A.V.(2011),"Stability and mismatch discriminationof locked nucleic acid-DNA duplexes.",Biochem.50(43):9352–9367.doi:10.1021/bi200904e.PMC 3201676.PMID 21928795;Alexei A.Koshkin;Sanjay K.Singh,PoulNielsen,Vivek K.Rajwanshi,Ravindra Kumar,Michael Meldgaard,Carl Erik Olsen,Jesper Wengel(1998),"LNA(Locked Nucleic Acids):Synthesis of the adenine,cytosine,guanine,5-methylcytosine,thymine and uracil bicyclonucleosidemonomers,oligomerisation,and unprecedented nucleic acid recognition",Tetrahedron 54(14):3607–30.doi:10.1016/S0040-4020(98)00094-5;以及SatoshiObika;Daishu Nanbu,Yoshiyuki Hari,Ken-ichiro Morio,Yasuko In,ToshimasaIshida,Takeshi Imanishi(1997),"Synthesis of2'-O,4'-C-methyleneuridine and-cytidine.Novel bicyclic nucleosides having a fixed C3'-endo sugar puckering",Tetrahedron Lett.38(50):8735–8.doi:10.1016/S0040-4039(97)10322-7。
分子信标或分子信标探针是寡核苷酸杂交探针,所述寡核苷酸杂交探针可以检测同质溶液中特定核酸序列的存在。分子信标是具有内部淬灭的荧光团的发夹形分子,当它们与靶核酸序列结合时所述荧光团的荧光会恢复。参见例如Tyagi S,Kramer FR(1996),"Molecular beacons:probes that fluoresce upon hybridization",Nat Biotechnol.14(3):303–8.PMID 9630890;I,Malmberg L,Rennel E,Wik M,AC(2000年4月),"Homogeneous scoring of single-nucleotide polymorphisms:comparison of the5'-nuclease TaqMan assay and Molecular Beacon probes",Biotechniques 28(4):732-8.PMID 10769752;以及Akimitsu Okamoto(2011),"ECHO probes:a concept offluorescence control for practical nucleic acid sensing",Chem.Soc.Rev.40:5815-5828。
在一些实施方案中,核碱基通常是核苷的杂环碱基部分。核碱基可以是天然存在的,可以是经修饰的,可以与天然碱基没有相似性,并且可以是合成的,例如通过有机合成而合成。在某些实施方案中,核碱基包含能够在使用或不使用氢键的情况下与另一核酸的碱基相互作用的任何原子或原子组。在某些实施方案中,非天然核碱基不是源自天然核碱基。应注意的是,非天然核碱基不一定具有碱基特性,然而为了简单起见,它们称为核碱基。在一些实施方案中,当提及核碱基时,“(d)”指示核碱基可以附接至脱氧核糖或核糖。
在一些实施方案中,核苷是包含核碱基部分和糖部分的化合物。核苷包括但不限于天然存在的核苷(如在DNA和RNA中发现的)、脱碱基核苷、经修饰的核苷和具有模拟碱基和/或糖基团的核苷。核苷包括包含任何种类的取代基的核苷。核苷可以是通过核酸碱基与糖的还原基团之间的糖苷连接形成的糖苷化合物。
本文使用的章节标题只是出于组织的目的,而不应解释为限制所描述的主题。真核细胞中包含非天然碱基对的方法、系统和组合物
本文在某些实施方案中公开了用于在真核细胞中产生具有扩展的遗传字母表的核酸的体内方法和组合物(图1A-图3B)。在一些实例中,所述核酸编码非天然蛋白质,其中所述非天然蛋白质包含至少一个非天然氨基酸。在一些情况下,本文所述的体内方法或组合物使用或包含半合成生物体。在一些实例中,所述方法包括将至少一种非天然碱基对(UBP)掺入一种或多种核酸中。此类碱基对是通过两个核苷的核碱基之间配对形成的。在图1B提供的示例性工作流程中,编码蛋白质102和tRNA 103的DNA 101(各自包含互补非天然核碱基(X,Y))被转录104以产生tRNA 106和mRNA 107。在tRNA装载非天然氨基酸105后,mRNA 107被翻译108以产生包含一个或多个非天然氨基酸109的蛋白质110。在一些实例中,本文所述的方法和组合物允许以高保真度和产率对非天然氨基酸进行位点特异性掺入。本文还描述了包含扩展的遗传字母的半合成生物体,使用所述半合成生物体产生蛋白质产物的方法,所述蛋白质产物包括包含至少一个非天然氨基酸残基的那些。
非天然核碱基的选择允许优化本文所述方法中的一个或多个步骤。例如,为高效复制、转录和/或翻译而选择核碱基。在一些实例中,多于一种非天然核碱基对用于本文所述的方法中。例如,包含脱氧核糖部分的第一组核碱基用于DNA复制(如第一核碱基和第二核碱基,被配置为形成第一碱基对),而第二组核碱基(如第三核碱基和第四核碱基,其中所述第三核碱基和所述第四核碱基附接至核糖,被配置为形成第二碱基对)用于转录/翻译。在一些实例中,第一组中的核碱基与第二组中的核碱基之间的互补配对允许基因转录以从包含来自第一组的核碱基的DNA模板产生tRNA或蛋白质。在一些实例中,第二组的核碱基之间的互补配对(第二碱基对)允许通过使包含非天然核酸的tRNA与mRNA匹配进行翻译。在一些情况下,第一组中的核碱基附接至脱氧核糖部分。在一些情况下,第一组中的核碱基附接至核糖部分。在一些实例中,两组的核碱基均是独特的。在一些实例中,至少一个核碱基在两组中是相同的。在一些实例中,第一核碱基与第三核碱基是相同的。在一些实施方案中,第一碱基对与第二碱基对不相同。在一些情况下,第一碱基对、第二碱基对和第三碱基对不相同。
真核工程化生物体
在一些实施方案中,本文公开的方法和质粒进一步用于产生真核工程化生物体,例如如下生物体,所述生物体掺入并且复制非天然核苷酸或非天然核酸碱基对(UBP),并且也可以使用含有非天然核苷酸的核酸以转录mRNA和tRNA,所述mRNA和tRNA用于翻译含有非天然氨基酸残基的蛋白质。在一些实例中,所述生物体是半合成生物体(SSO)。在一些实例中,所述SSO不是原核的。在一些实例中,所述SSO是哺乳动物的。在一些实例中,所述哺乳动物SSO是人的。在一些实例中,所述哺乳动物SSO是仓鼠的。在一些实例中,所述人SSO源自HEK293T细胞。在一些实例中,所述人SSO源自中国仓鼠卵巢(CHO)细胞。
在一些实例中,所用的细胞用编码异源蛋白例如tRNA合成酶的表达盒进行遗传转化。在一些实施方案中,所述tRNA合成酶优先用非天然氨基酸使包含含有非天然碱基的反密码子的tRNA氨酰化。在一些实施方案中,所述细胞包含tRNA合成酶,所述tRNA合成酶优先用非天然氨基酸使包含含有非天然碱基的反密码子的tRNA氨酰化。
所述细胞可以是真核细胞,并且非天然相互碱基配对核苷酸对可以是TPT3和NaM或CNMO。
本文描述了包括使用两种或更多种非天然碱基配对核苷酸的组合物和方法。在一些情况下,此类碱基配对核苷酸通过本领域已知的标准核酸转化方法(例如,电穿孔、化学转化或其中可以将包含非天然核苷酸的核酸引入细胞中的其他方法)进入细胞。在一些情况下,使用三种或更多种非天然碱基配对核苷酸。在一些情况下,碱基配对非天然核苷酸作为多核苷酸(如mRNA和/或tRNA)的一部分进入细胞。作为多核苷酸(RNA)的一部分进入细胞的一种或多种碱基配对非天然核苷酸本身不需要在体内复制。
在一些情况下,通过将核酸(例如,异源核酸)引入细胞中来产生基因工程化细胞。本文所述的任何细胞都可以是宿主细胞,并且可以包含表达载体。在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述哺乳动物细胞是人细胞(例如,HEK293T细胞)。在一些实施方案中,所述哺乳动物细胞是仓鼠细胞(例如,CHO细胞)。在一些实施方案中,细胞包含一种或多种异源多核苷酸。可以使用各种技术将核酸试剂引入微生物中。用于将异源核酸引入各种生物体中的方法的非限制性例子包括:转化、转染、转导、电穿孔、超声介导的转化、缀合、粒子轰击等。在一些实例中,添加载体分子(例如,双-苯并咪唑基化合物,例如,参见美国专利号5,595,899)典型地可以增加细胞中DNA的摄取,尽管通过常规方法难以转化。常规转化方法是技术人员容易获得的,并且可以在以下文献中找到:Maniatis,T.,E.F.Fritsch和J.Sambrook(1982)Molecular Cloning:a LaboratoryManual;Cold Spring Harbor Laboratory,Cold Spring Harbor,纽约。
在一些实例中,遗传转化是使用在但不限于质粒、病毒载体、病毒核酸、噬菌体核酸、噬菌体、粘粒和人工染色体中的表达盒的直接转移,或者经由细胞或载体如阳离子脂质体中遗传物质的转移来获得。此类方法是本领域中可获得的,并且易于针对在本文所述方法中的使用来调整。转移载体可以是用于将基因递送至细胞(例如,质粒)中的任何核苷酸构建体,或者作为递送基因的通用策略的一部分,例如,作为重组逆转录病毒或腺病毒的一部分(Ram等人Cancer Res.53:83-88(1993))。适当的转染方式,包括病毒载体、化学转染体或物理-机械方法如电穿孔以及DNA的直接扩散,描述于例如以下文献中:Wolff,J.A.等人,Science,247,1465-1468,(1990);和Wolff,J.A.Nature,352,815-818,(1991)。
核酸分子
在一些实施方案中,核酸(例如,在本文中也称为目的核酸分子)来自任何来源或组合物,例如,如RNA、siRNA(短抑制RNA)、RNAi、tRNA、mRNA或rRNA(核糖体RNA),并且呈任何形式(例如,线性、环状、超螺旋、单链、双链等)。在一些实施方案中,核酸包含核苷酸、核苷或多核苷酸。在一些情况下,核酸包含天然核酸和非天然核酸。在一些情况下,核酸还包含非天然核酸,如RNA类似物(例如,含有碱基类似物、糖类似物和/或非天然骨架等)。应理解,术语“核酸”并非是指或意指特定长度的多核苷酸链,因此多核苷酸和寡核苷酸也包括在定义内。示例性天然核苷酸包括而不限于ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP、GMP、dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP和dGMP。示例性天然脱氧核糖核苷酸包括dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP和dGMP。示例性天然核糖核苷酸包括ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP和GMP。对于天然RNA,尿嘧啶碱基是尿苷。核酸有时是载体、质粒、噬菌粒、自主复制序列(ARS)、着丝粒、人工染色体、酵母人工染色体(例如,YAC)或能够在宿主细胞中复制或被复制的其他核酸。在一些情况下,非天然核酸是核酸类似物。在另外的情况下,非天然核酸来自细胞外来源。在其他情况下,非天然核酸可用于本文提供的生物体(例如,遗传修饰的生物体)的细胞内空间。在一些实施方案中,非天然核苷酸不是天然核苷酸。在一些实施方案中,不包含天然碱基的核苷酸包含非天然核碱基。
非天然核酸
核苷酸类似物或非天然核苷酸包括含有对碱基、糖或磷酸酯部分的某一类型修饰的核苷酸。在一些实施方案中,修饰包括化学修饰。在一些情况下,修饰发生在3'OH或5'OH基团处、在骨架处、在糖组分处或在核苷酸碱基处。在一些实例中,修饰任选地包括非天然存在的接头分子和/或链间或链内交联。在一方面,经修饰的核酸包括以下中的一种或多种的修饰:3'OH或5'OH基团、骨架、糖组分或核苷酸碱基,和/或非天然存在的接头分子的添加。在一方面,经修饰的骨架包括除了磷酸二酯骨架以外的骨架。在一方面,经修饰的糖包括除了脱氧核糖以外(在经修饰的DNA中)或除了核糖以外(经修饰的RNA)的糖。在一方面,经修饰的碱基包括除了腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶以外的碱基(在经修饰的DNA中)或除了腺嘌呤、鸟嘌呤、胞嘧啶或尿嘧啶以外的碱基(在经修饰的RNA中)。
在一些实施方案中,核酸包含至少一种经修饰的碱基。在一些实例中,核酸包含2、3、4、5、6、7、8、9、10、15、20种或更多种经修饰的碱基。在一些情况下,对碱基部分的修饰包括A、C、G和T/U以及不同的嘌呤或嘧啶碱基的天然修饰和合成修饰。在一些实施方案中,修饰是针对腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶的修饰形式(在经修饰的DNA中)或腺嘌呤、鸟嘌呤、胞嘧啶或尿嘧啶的修饰形式(经修饰的RNA)。
非天然核酸的经修饰的碱基包括但不限于尿嘧啶-5-基,次黄嘌呤-9-基(I),2-氨基腺嘌呤-9-基,5-甲基胞嘧啶(5-me-C),5-羟甲基胞嘧啶,黄嘌呤,次黄嘌呤,2-氨基腺嘌呤,腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物,腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物,2-硫尿嘧啶,2-硫胸腺嘧啶和2-硫胞嘧啶,5-卤代尿嘧啶和胞嘧啶,5-丙炔基尿嘧啶和胞嘧啶,6-偶氮基尿嘧啶、胞嘧啶和胸腺嘧啶,5-尿嘧啶(假尿嘧啶),4-硫尿嘧啶,8-卤代、8-氨基、8-硫醇、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤代(特别是5-溴)、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤,8-氮杂鸟嘌呤和8-氮杂腺嘌呤,7-脱氮鸟嘌呤和7-脱氮腺嘌呤以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。某些非天然核酸,如5-取代的嘧啶,6-氮杂嘧啶和N-2取代的嘌呤,N-6取代的嘌呤,O-6取代的嘌呤,2-氨基丙基腺嘌呤,5-丙炔基尿嘧啶,5-丙炔基胞嘧啶,5-甲基胞嘧啶,增加双链体形成的稳定性的那些,通用核酸,疏水核酸,混杂核酸,尺寸扩展的核酸,氟化核酸,5-取代的嘧啶,6-氮杂嘧啶以及N-2、N-6和O-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶(5-me-C),5-羟甲基胞嘧啶,黄嘌呤,次黄嘌呤,2-氨基腺嘌呤,腺嘌呤和鸟嘌呤的6-甲基、其他烷基衍生物,腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物,2-硫尿嘧啶,2-硫胸腺嘧啶和2-硫胞嘧啶,5-卤代尿嘧啶,5-卤代胞嘧啶,5-丙炔基(-C≡C-CH3)尿嘧啶,5-丙炔基胞嘧啶,嘧啶核酸的其他炔基衍生物,6-偶氮基尿嘧啶,6-偶氮基胞嘧啶,6-偶氮基胸腺嘧啶,5-尿嘧啶(假尿嘧啶),4-硫尿嘧啶,8-卤代、8-氨基、8-硫醇、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤代(特别是5-溴)、5-三氟甲基、其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤,7-甲基腺嘌呤,2-F-腺嘌呤,2-氨基-腺嘌呤,8-氮杂鸟嘌呤,8-氮杂腺嘌呤,7-脱氮鸟嘌呤,7-脱氮腺嘌呤,3-脱氮鸟嘌呤,3-脱氮腺嘌呤,三环嘧啶,吩噁嗪胞苷([5,4-b][l,4]苯并噁嗪-2(3H)-酮),吩噻嗪胞苷(1H-嘧啶并[5,4-b][l,4]苯并噻嗪-2(3H)-酮),G-夹,吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][l,4]苯并噁嗪-2(3H)-酮),咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮),吡啶并吲哚胞苷(H-吡啶并[3',2':4,5]吡咯并[2,3-d]嘧啶-2-酮),其中嘌呤或嘧啶碱基被其他杂环替代的那些,7-脱氮-腺嘌呤,7-脱氮鸟嘌呤,2-氨基吡啶,2-吡啶酮,氮杂胞嘧啶,5-溴胞嘧啶,溴尿嘧啶,5-氯胞嘧啶,氯代胞嘧啶,环胞嘧啶,胞嘧啶阿拉伯糖苷,5-氟胞嘧啶,氟嘧啶,氟尿嘧啶,5,6-二氢胞嘧啶,5-碘胞嘧啶,羟基脲,碘尿嘧啶,5-硝基胞嘧啶,5-溴尿嘧啶,5-氯尿嘧啶,5-氟尿嘧啶和5-碘尿嘧啶,2-氨基-腺嘌呤,6-硫代-鸟嘌呤,2-硫代-胸腺嘧啶,4-硫代-胸腺嘧啶,5-丙炔基-尿嘧啶,4-硫代-尿嘧啶,N4-乙基胞嘧啶,7-脱氮鸟嘌呤,7-脱氮-8-氮杂鸟嘌呤,5-羟基胞嘧啶,2'-脱氧尿苷,2-氨基-2'-脱氧腺苷,以及描述于以下文献中的那些:美国专利号3,687,808;4,845,205;4,910,300;4,948,882;5,093,232;5,130,302;5,134,066;5,175,273;5,367,066;5,432,272;5,457,187;5,459,255;5,484,908;5,502,177;5,525,711;5,552,540;5,587,469;5,594,121;5,596,091;5,614,617;5,645,985;5,681,941;5,750,692;5,763,588;5,830,653和6,005,096;WO 99/62923;Kandimalla等人,(2001)Bioorg.Med.Chem.9:807-813;The Concise Encyclopedia ofPolymer Science and Engineering,Kroschwitz,J.I.编辑,John Wiley&Sons,1990,858-859;Englisch等人,Angewandte Chemie,International Edition,1991,30,613;和Sanghvi,第15章,Antisense Research and Applications,Crooke和Lebleu编辑,CRCPress,1993,273-288。另外的碱基修饰可以在例如以下文献中找到:美国专利号3,687,808;Englisch等人,Angewandte Chemie,International Edition,1991,30,613。在一些实例中,非天然核酸包含图2的核碱基。在一些实例中,非天然核酸包含图3A的核碱基。在一些实例中,非天然核酸包含图3B的核碱基。
包含各种杂环碱基和各种糖部分(和糖类似物)的非天然核酸是本领域中可获得的,并且在一些情况下,核酸包含除了天然存在的核酸的五种主要碱基组分以外的一种或若干种杂环碱基。例如,在一些情况下,杂环碱基包括尿嘧啶-5-基、胞嘧啶-5-基、腺嘌呤-7-基、腺嘌呤-8-基、鸟嘌呤-7-基、鸟嘌呤-8-基、4-氨基吡咯并[2.3-d]嘧啶-5-基、2-氨基-4-氧代吡咯并[2,3-d]嘧啶-5-基、2-氨基-4-氧代吡咯并[2.3-d]嘧啶-3-基,其中嘌呤经由9-位置、嘧啶经由1-位置、吡咯并嘧啶经由7-位置并且吡唑并嘧啶经由1-位置附接至核酸的糖部分。
在一些实施方案中,非天然核酸的经修饰的碱基描绘于下文中,其中波浪线标识与脱氧核糖或核糖的附接点。
在一些实施方案中,核苷酸类似物还在磷酸酯部分被修饰。经修饰的磷酸酯部分包括但不限于在两个核苷酸之间的连接处被修饰的那些,并且含有例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(包括3'-亚烷基膦酸酯)和手性膦酸酯、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯、硫羰氨基磷酸酯)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯和硼烷磷酸酯。应理解,两个核苷酸之间的这些磷酸酯或经修饰的磷酸酯连接是通过3'-5'连接或2'-5'连接,并且所述连接含有相反的极性,如3'-5'至5'-3'或2'-5'至5'-2'。还包括各种盐、混合盐和游离酸形式。许多美国专利传授了如何制备和使用含有经修饰的磷酸酯的核苷酸,并且包括但不限于3,687,808;4,469,863;4,476,301;5,023,243;5,177,196;5,188,897;5,264,423;5,276,019;5,278,302;5,286,717;5,321,131;5,399,676;5,405,939;5,453,496;5,455,233;5,466,677;5,476,925;5,519,126;5,536,821;5,541,306;5,550,111;5,563,253;5,571,799;5,587,361;和5,625,050。
在一些实施方案中,非天然核酸包括2',3'-二脱氧-2',3'-二脱氢-核苷(PCT/US2002/006460)、5'-取代的DNA和RNA衍生物(PCT/US2011/033961;Saha等人,J.OrgChem.,1995,60,788-789;Wang等人,Bioorganic&Medicinal Chemistry Letters,1999,9,885-890;以及Mikhailov等人,Nucleosides&Nucleotides,1991,10(1-3),339-343;Leonid等人,1995,14(3-5),901-905;以及Eppacher等人,Helvetica Chimica Acta,2004,87,3004-3020;PCT/JP2000/004720;PCT/JP2003/002342;PCT/JP2004/013216;PCT/JP2005/020435;PCT/JP2006/315479;PCT/JP2006/324484;PCT/JP2009/056718;PCT/JP2010/067560)或制成具有经修饰的碱基的单磷酸酯的5'-取代的单体(Wang等人,Nucleoside sNucleotides&Nucleic Acids,2004,23(1&2),317-337)。
在一些实施方案中,非天然核酸包括在糖环的5'-位置和2'-位置处的修饰(PCT/US94/02993),如5'-CH2-取代的2'-O-保护的核苷(Wu等人,Helvetica Chimica Acta,2000,83,1127-1143和Wu等人,Bioconjugate Chem.1999,10,921-924)。在一些情况下,非天然核酸包括酰胺连接的核苷二聚体,其已经被制备用于掺入寡核苷酸中,其中二聚体中3'连接的核苷(5'至3')包含2'-OCH3和5'-(S)-CH3(Mesmaeker等人,Synlett,1997,1287-1290)。非天然核酸可以包括2'-取代的5'-CH2(或O)修饰的核苷(PCT/US92/01020)。非天然核酸可以包括5'-亚甲基膦酸酯DNA和RNA单体以及二聚体(Bohringer等人,Tet.Lett.,1993,34,2723-2726;Collingwood等人,Synlett,1995,7,703-705;以及Hutter等人,Helvetica Chimica Acta,2002,85,2777-2806)。非天然核酸可以包括具有2'-取代基的5'-膦酸酯单体(US2006/0074035)和其他修饰的5'-膦酸酯单体(WO1997/35869)。非天然核酸可以包括5'-修饰的亚甲基膦酸酯单体(EP 614907和EP 629633)。非天然核酸可以包括在5'和/或6'位置处包含羟基的5'或6'-膦酸酯核糖核苷的类似物(Chen等人,Phosphorus,Sulfur and Silicon,2002,777,1783-1786;Jung等人,Bioorg.Med.Chem.,2000,8,2501-2509;Gallier等人,Eur.J.Org.Chem.,2007,925-933;以及Hampton等人,J.Med.Chem.,1976,19(8),1029-1033)。非天然核酸可以包括5'-膦酸酯脱氧核糖核苷单体和具有5'-磷酸酯基团的二聚体(Nawrot等人,Oligonucleotides,2006,16(1),68-82)。非天然核酸可以包括具有6'-膦酸酯基团的核苷,其中5'或/和6'-位置未被取代或被硫代-叔丁基(SC(CH3)3)(及其类似物);亚甲基氨基(CH2NH2)(及其类似物)或氰基(CN)(及其类似物)取代(Fairhurst等人,Synlett,2001,4,467-472;Kappler等人,J.Med.Chem.,1986,29,1030-1038;Kappler等人,J.Med.Chem.,1982,25,1179-1184;Vrudhula等人,J.Med.Chem.,1987,30,888-894;Hampton等人,J.Med.Chem.,1976,19,1371-1377;Geze等人,J.Am.Chem.Soc,1983,105(26),7638-7640;以及Hampton等人,J.Am.Chem.Soc,1973,95(13),4404-4414)。
在一些实施方案中,非天然核酸还包括糖部分的修饰。在一些情况下,核酸含有其中糖基团已被修饰的一种或多种核苷。此类糖修饰的核苷可以赋予增强的核酸酶稳定性、增加的结合亲和力或一些其他有益的生物学特性。在某些实施方案中,核酸包含化学修饰的呋喃核糖环部分。化学修饰的呋喃核糖环的例子包括而不限于添加取代基(包括5'和/或2'取代基;两个环原子桥接形成双环核酸(BNA);用S、N(R)或C(R1)(R2)替代核糖基环氧原子(R=H、C1-C12烷基或保护基团);及其组合。化学修饰的糖的例子可以在WO 2008/101157、US2005/0130923和WO 2007/134181中找到。
在一些实例中,经修饰的核酸包含经修饰的糖或糖类似物。因此,除核糖和脱氧核糖之外,所述糖部分还可以是戊糖、脱氧戊糖、己糖、脱氧己糖、葡萄糖、阿拉伯糖、木糖、来苏糖或糖“类似物”环戊基。所述糖可以呈吡喃糖基或呋喃糖基形式。所述糖部分可以是核糖、脱氧核糖、阿拉伯糖或2'-O-烷基核糖的呋喃糖苷,并且所述糖可以以[α]或[β]异头构型附接至相应的杂环碱基。糖修饰包括但不限于2'-烷氧基-RNA类似物、2'-氨基-RNA类似物、2'-氟-DNA和2'-烷氧基-或氨基-RNA/DNA嵌合体。例如,糖修饰可以包括2'-O-甲基-尿苷或2'-O-甲基-胞苷。糖修饰包括2'-O-烷基-取代的脱氧核糖核苷和2'-O-乙二醇样核糖核苷。这些糖或糖类似物以及其中此类糖或类似物附接至杂环碱基(核酸碱基)的相应“核苷”的制备是已知的。还可以进行糖修饰并且将其与其他修饰组合。
糖部分的修饰包括核糖和脱氧核糖的天然修饰以及非天然修饰。糖修饰包括但不限于在2'位置处的以下修饰:OH;F;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中烷基、烯基和炔基可以是经取代或未经取代的C1至C10烷基或C2至C10烯基和炔基。2'糖修饰还包括但不限于-O[(CH2)nO]m CH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)nONH2和-O(CH2)nON[(CH2)n CH3)]2,其中n和m是1至约10。
2'位置处的其他修饰包括但不限于:C1至C10低级烷基、经取代的低级烷基、烷芳基、芳烷基、O-烷芳基、O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2 CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、经取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改善寡核苷酸的药代动力学特性的基团或用于改善寡核苷酸的药效学特性的基团,以及具有类似特性的其他取代基。还可以在所述糖的其他位置(特别是在3'末端核苷酸或2'-5'连接的寡核苷酸中糖的3'位置和5'末端核苷酸的5'位置)处进行类似的修饰。经修饰的糖还包括在桥环氧处含有修饰(如CH2和S)的那些糖。核苷酸糖类似物也可以具有糖模拟物,如环丁基部分代替戊呋喃糖基糖。许多美国专利传授了此类经修饰的糖结构的制备,并且详述并描述了一系列的碱基修饰,所述美国专利如美国专利号4,981,957;5,118,800;5,319,080;5,359,044;5,393,878;5,446,137;5,466,786;5,514,785;5,519,134;5,567,811;5,576,427;5,591,722;5,597,909;5,610,300;5,627,053;5,639,873;5,646,265;5,658,873;5,670,633;4,845,205;5,130,302;5,134,066;5,175,273;5,367,066;5,432,272;5,457,187;5,459,255;5,484,908;5,502,177;5,525,711;5,552,540;5,587,469;5,594,121、5,596,091;5,614,617;5,681,941;和5,700,920,每个专利都通过引用以其整体并入本文。
具有经修饰的糖部分的核酸的例子包括而不限于包含5'-乙烯基、5'-甲基(R或S)、4'-S、2'-F、2'-OCH3和2'-O(CH2)2OCH3取代基的核酸。2'位置处的取代基还可以选自烯丙基、氨基、叠氮基、硫代、O-烯丙基、O-(C1-C10烷基)、OCF3、O(CH2)2SCH3、O(CH2)2-O-N(Rm)(Rn)和O-CH2-C(=O)-N(Rm)(Rn),其中Rm和Rn各自独立地是H或者经取代或未经取代的C1-C10烷基。
在某些实施方案中,本文所述的核酸包括一种或多种双环核酸。在某些此类实施方案中,双环核酸包含在4'核糖基环原子与2'核糖基环原子之间的桥。在某些实施方案中,本文提供的核酸包括一种或多种双环核酸,其中所述桥包含4'至2'双环核酸。此类4'至2'双环核酸的例子包括但不限于以下式中的一种:4'-(CH2)-O-2'(LNA);4'-(CH2)-S-2';4'-(CH2)2-O-2'(ENA);4'-CH(CH3)-O-2'和4'-CH(CH2OCH3)-O-2'及其类似物(参见,美国专利号7,399,845);4'-C(CH3)(CH3)-O-2'及其类似物(参见WO 2009/006478、WO2008/150729、US2004/0171570、美国专利号7,427,672;Chattopadhyaya等人,J.Org.Chem.,209,74,118-134;和WO2008/154401)。还参见例如:Singh等人,Chem.Commun.,1998,4,455-456;Koshkin等人,Tetrahedron,1998,54,3607-3630;Wahlestedt等人,Proc.Natl.Acad.Sci.U.S.A.,2000,97,5633-5638;Kumar等人,Bioorg.Med.Chem.Lett.,1998,8,2219-2222;Singh等人,J.Org.Chem.,1998,63,10035-10039;Srivastava等人,J.Am.Chem.Soc.,2007,129(26)8362-8379;Elayadi等人,Curr.Opinion Invens.Drugs,2001,2,558-561;Braasch等人,Chem.Biol,2001,8,1-7;Oram等人,Curr.Opinion Mol.Ther.,2001,3,239-243;美国专利号4,849,513、5,015,733、5,118,800、5,118,802、7,053,207、6,268,490、6,770,748、6,794,499、7,034,133、6,525,191、6,670,461和7,399,845;国际公开号WO2004/106356、WO1994/14226、WO 2005/021570、WO 2007/090071和WO 2007/134181;美国专利公开号US2004/0171570、US 2007/0287831和US 2008/0039618;美国临时申请号60/989,574、61/026,995、61/026,998、61/056,564、61/086,231、61/097,787和61/099,844;以及国际申请号PCT/US2008/064591、PCT US2008/066154、PCT US2008/068922和PCT/DK98/00393。
在某些实施方案中,核酸包含连接的核酸。核酸可以使用任何核酸间连接而连接在一起。核酸间连接基团的两个主要类别是通过磷原子的存在或不存在来定义的。代表性的含磷的核酸间连接包括但不限于磷酸二酯、磷酸三酯、甲基膦酸酯、氨基磷酸酯和硫代磷酸酯(P=S)。代表性的不含磷的核酸间连接基团包括但不限于亚甲基甲基亚氨基(-CH2-N(CH3)-O-CH2-)、硫代二酯(-O-C(O)-S-)、硫代氨基甲酸酯(-O-C(O)(NH)-S-);硅氧烷(-O-Si(H)2-O-);和N,N*-二甲基肼(-CH2-N(CH3)-N(CH3))。在某些实施方案中,可以将具有手性原子的核酸间连接制备为外消旋混合物,作为单独的对映体,例如烷基膦酸酯和硫代磷酸酯。非天然核酸可以含有单个修饰。非天然核酸可以在所述部分之一内或不同部分之间含有多个修饰。
对核酸的骨架磷酸修饰包括但不限于甲基膦酸酯、硫代磷酸酯、氨基磷酸酯(桥接或非桥接)、磷酸三酯、二硫代磷酸酯(phosphorodithioate)、二硫代磷酸酯(phosphodithioate)和硼烷磷酸酯,并且可以以任何组合来使用。还可以使用其他非磷酸酯连接。
在一些实施方案中,骨架修饰(例如,甲基膦酸酯、硫代磷酸酯、氨基磷酸酯和二硫代磷酸酯核苷酸间连接)可以赋予经修饰的核酸免疫调节活性和/或增强其体内稳定性。
在一些实例中,磷衍生物(或修饰的磷酸酯基团)附接至糖或糖类似物部分,并且可以是单磷酸酯、二磷酸酯、三磷酸酯、烷基膦酸酯、硫代磷酸酯、二硫代磷酸酯、氨基磷酸酯等。示例性的含有修饰的磷酸酯连接或非磷酸酯连接的多核苷酸可以在以下文献中找到:Peyrottes等人,1996,Nucleic Acids Res.24:1841-1848;Chaturvedi等人,1996,Nucleic Acids Res.24:2318-2323;以及Schultz等人,(1996)Nucleic Acids Res.24:2966-2973;Matteucci,1997,“Oligonucleotide Analogs:an Overview”inOligonucleotides as Therapeutic Agents,(Chadwick和Cardew编辑)John Wiley andSons,纽约州纽约市;Zon,1993,“Oligonucleoside Phosphorothioates”in Protocolsfor Oligonucleotides and Analogs,Synthesis and Properties,Humana Press,第165-190页;Miller等人,1971,JACS93:6657-6665;Jager等人,1988,Biochem.27:7247-7246;Nelson等人,1997,JOC62:7278-7287;美国专利号5,453,496;以及Micklefield,2001,Curr.Med.Chem.8:1157-1179。
在一些情况下,骨架修饰包括用可替代部分如阴离子基团、中性基团或阳离子基团替代磷酸二酯连接。此类修饰的例子包括:阴离子核苷间连接;N3'至P5'氨基磷酸酯修饰;硼烷磷酸酯DNA;前寡核苷酸;中性核苷间连接,如甲基膦酸酯;酰胺连接的DNA;亚甲基(甲基亚氨基)连接;甲缩醛和硫代甲缩醛连接;含有磺酰基的骨架;吗啉代寡聚物;肽核酸(PNA);以及带正电荷的脱氧核糖核酸胍(DNG)寡聚物(Micklefield,2001,CurrentMedicinal Chemistry 8:1157-1179)。经修饰的核酸可以包含嵌合或混合的骨架,所述嵌合或混合的骨架包含一种或多种修饰(例如,磷酸酯连接的组合,如磷酸二酯和硫代磷酸酯连接的组合)。
磷酸酯的取代基包括,例如,短链烷基或环烷基核苷间连接、混合的杂原子和烷基或环烷基核苷间连接,或一个或多个短链杂原子或杂环核苷间连接。这些包括具有以下的那些:吗啉代连接(部分地由核苷的糖部分形成);硅氧烷骨架;硫化物、亚砜和砜骨架;甲酰乙酰基和硫代甲酰乙酰基骨架;亚甲基甲酰乙酰基和硫代甲酰乙酰基骨架;含烯烃的骨架;氨基磺酸酯骨架;亚甲基亚胺基和亚甲基肼基骨架;磺酸酯和磺酰胺骨架;酰胺骨架;以及具有混合N、O、S和CH2组成部分的其他骨架。许多美国专利公开了如何制备和使用这些类型的磷酸酯替代品,并且包括但不限于美国专利号5,034,506;5,166,315;5,185,444;5,214,134;5,216,141;5,235,033;5,264,562;5,264,564;5,405,938;5,434,257;5,466,677;5,470,967;5,489,677;5,541,307;5,561,225;5,596,086;5,602,240;5,610,289;5,602,240;5,608,046;5,610,289;5,618,704;5,623,070;5,663,312;5,633,360;5,677,437;和5,677,439。还应理解,在核苷酸取代物中,核苷酸的糖和磷酸酯部分二者都可以被替代,例如被酰胺型连接(氨乙基甘氨酸)(PNA)替代。美国专利号5,539,082;5,714,331;和5,719,262传授了如何制备和使用PNA分子,每个专利通过引用并入本文。还参见Nielsen等人,Science,1991,254,1497-1500。还可以将其他类型的分子(缀合物)与核苷酸或核苷酸类似物连接,以增强例如细胞摄取。缀合物可以与所述核苷酸或核苷酸类似物化学连接。此类缀合物包括但不限于脂质部分,如胆固醇部分(Letsinger等人,Proc.Natl.Acad.Sci.USA,1989,86,6553-6556);胆酸(Manoharan等人,Bioorg.Med.Chem.Let.,1994,4,1053-1060);硫醚,例如己基-S-三苯甲基硫醇(Manoharan等人,Ann.KY.Acad.Sci.,1992,660,306-309;Manoharan等人,Bioorg.Med.Chem.Let.,1993,3,2765-2770);硫代胆固醇(Oberhauser等人,Nucl.Acids Res.,1992,20,533-538);脂肪链,例如十二烷二醇或十一烷基残基(Saison-Behmoaras等人,EM5OJ,1991,10,1111-1118;Kabanov等人,FEBS Lett.,1990,259,327-330;Svinarchuk等人,Biochimie,1993,75,49-54);磷脂,例如二-十六烷基-外消旋-甘油或三乙基铵l-二-O-十六烷基-外消旋-甘油-S-H-膦酸盐(Manoharan等人,Tetrahedron Lett.,1995,36,3651-3654;Shea等人,Nucl.Acids Res.,1990,18,3777-3783);多胺或聚乙二醇链(Manoharan等人,Nucleosides&Nucleotides,1995,14,969-973);或金刚烷乙酸(Manoharan等人,Tetrahedron Lett.,1995,36,3651-3654);棕榈基部分(Mishra等人,Biochem.Biophys.Acta,1995,1264,229-237);或十八烷基胺或己基氨基-羰基-氧基胆固醇部分(Crooke等人,J.Pharmacol.Exp.Ther.,1996,277,923-937)。许多美国专利传授了此类缀合物的制备,并且包括但不限于美国专利号4,828,979;4,948,882;5,218,105;5,525,465;5,541,313;5,545,730;5,552,538;5,578,717、5,580,731;5,580,731;5,591,584;5,109,124;5,118,802;5,138,045;5,414,077;5,486,603;5,512,439;5,578,718;5,608,046;4,587,044;4,605,735;4,667,025;4,762,779;4,789,737;4,824,941;4,835,263;4,876,335;4,904,582;4,958,013;5,082,830;5,112,963;5,214,136;5,082,830;5,112,963;5,214,136;5,245,022;5,254,469;5,258,506;5,262,536;5,272,250;5,292,873;5,317,098;5,371,241、5,391,723;5,416,203、5,451,463;5,510,475;5,512,667;5,514,785;5,565,552;5,567,810;5,574,142;5,585,481;5,587,371;5,595,726;5,597,696;5,599,923;5,599,928和5,688,941。
每个X独立地是碳或氮;
R2是任选的,并且当存在时独立地是氢、烷基、烯基、炔基、甲氧基、甲硫醇、甲烷硒基、卤素、氰基或叠氮基;
其中每个Y独立地是硫、氧、硒或仲胺;
其中每个E独立地是氧、硫或硒;并且
其中波浪线指示与核糖基、脱氧核糖基或二脱氧核糖基部分或其类似物键合的点,
其中所述核糖基、脱氧核糖基或二脱氧核糖基部分或其类似物呈游离形式,连接至单磷酸酯、二磷酸酯或三磷酸酯基团(任选地包括α-硫代三磷酸酯、β-硫代三磷酸酯或γ-硫代三磷酸酯基团),或包含在RNA或DNA中或者在RNA类似物或DNA类似物中。在一些实施方案中,R2是低级烷基(例如,C1-C6)、氢或卤素。在本文所述的核碱基的一些实施方案中,R2是氟。在本文所述的核碱基的一些实施方案中,X是碳。在本文所述的核碱基的一些实施方案中,E是硫。在本文所述的核碱基的一些实施方案中,Y是硫。在本文所述的核碱基的一些实施方案中,核碱基具有结构:
在本文所述的核碱基的一些实施方案中,E是硫并且Y是硫。在本文所述的核碱基的一些实施方案中,波浪线指示与核糖基或脱氧核糖基部分键合的点。在本文所述的核碱基的一些实施方案中,波浪线指示与核糖基或脱氧核糖基部分键合的点,所述核糖基或脱氧核糖基部分与三磷酸酯基团连接。在本文所述的核碱基的一些实施方案中,是核酸聚合物的组分。在本文所述的核碱基的一些实施方案中,核碱基是tRNA的组分。在本文所述的核碱基的一些实施方案中,核碱基是tRNA中的反密码子的组分。在本文所述的核碱基的一些实施方案中,核碱基是mRNA的组分。在本文所述的核碱基的一些实施方案中,核碱基是mRNA的密码子的组分。在本文所述的核碱基的一些实施方案中,核碱基是RNA或DNA的组分。在本文所述的核碱基的一些实施方案中,核碱基是DNA中的密码子的组分。在本文所述的核碱基的一些实施方案中,核碱基与另一个互补核碱基形成核碱基对。
在一些情况下,非天然脱氧核糖核酸(DNA)被转录成包含本文所述的非天然碱基(例如,d5SICS、dNAM、dTPT3、dTMTMO、dCNMO、dTAT1)的信使RNA(mRNA)。示例性mRNA密码子由包含三个连续脱氧核糖核苷酸(NNN)的非天然DNA的示例性区域编码,包括TTX、TGX、CGX、AGX、GAX、CAX、GXT、CXT、GXG、AXG、GXC、AXC、GXA、CXC、TXC、ATX、CTX、TTX、GTX、TAX或GGX,其中X是附接至2'脱氧核糖基团的非天然碱基。由示例性非天然DNA转录产生的示例性mRNA密码子包含三个连续核糖核苷酸(NNN),分别包括UUX、UGX、CGX、AGX、GAX、CAX、GXU、CXU、GXG、AXG、GXC、AXC、GXA、CXC、UXC、AUX、CUX、UUX、GUX、UAX或GGX,其中X是附接至核糖基部分的非天然碱基。在一些实施方案中,非天然碱基在密码子序列(X-N-N)中的第一位置。在一些实施方案中,非天然碱基在密码子序列(N-X-N)中的第二(或中间)位置。在一些实施方案中,非天然碱基在密码子序列(N-N-X)中的第三(最后)位置。
在一些情况下,包含本文所述的密码子的mRNA在细胞(例如,真核细胞)中体内翻译。包含本文所述的非天然碱基的mRNA的翻译由转移RNA(tRNA)介导,所述转移RNA包含反密码子序列,所述反密码子序列是本文所述的mRNA密码子序列的反向互补序列。在一些实施方案中,tRNA反密码子包含非天然碱基,包括YAA、XAA、YCA、XCA、YCG、XCG、YCU、XCU、YUC、XUC、YUG、XUG、AYC、AYG、CYC、CYU、GYC、GYU、UYC、GYG、GYA、YAU、XAU、XAG、YAG、XAC、YAC、XUA、YUA、XCC或YCC,其中X和Y各自表示非天然碱基,其中X与Y不同。在一些实施方案中,非天然碱基在反密码子序列(X/Y-N-N)中的第一位置。在一些实施方案中,非天然碱基在反密码子序列(N-X/Y-N)中的第二(或中间)位置。在一些实施方案中,非天然碱基在反密码子序列(N-N-X/Y)中的第三(最后)位置。
核酸碱基配对特性
在一些实施方案中,非天然核苷酸例如在翻译期间与另一非天然核苷酸形成碱基对(非天然碱基对;UBP)。例如,第一非天然核酸可以与第二非天然核酸形成碱基对。例如,可以例如在翻译期间进行碱基配对的一对非天然核苷三磷酸包括包含(d)5SICS的核苷酸和包含(d)NaM的核苷酸。其他例子包括但不限于:包含(d)CNMO的核苷酸和包含(d)TPT3的核苷酸。此类非天然核苷酸可以具有核糖或脱氧核糖糖部分(由“(d)”指示)。例如,可以在掺入核酸时进行碱基配对的一对非天然核苷三磷酸包括包含TAT1的核苷酸和包含NaM的核苷酸。在一些实施方案中,可以在掺入核酸时进行碱基配对的一对非天然核苷三磷酸包括包含dCNMO的核苷酸和包含TAT1的核苷酸。在一些实施方案中,可以在掺入核酸时进行碱基配对的一对非天然核苷三磷酸包括包含dTPT3的核苷酸和包含NaM的核苷酸。在一些实施方案中,非天然核酸基本上不与天然核酸(A、T、G、C)形成碱基对。在一些实施方案中,非天然核酸可以与天然核酸形成碱基对。
在一些实施方案中,非天然(脱氧)核糖核苷酸是可以形成UBP,但是基本上不与天然(脱氧)核糖核苷酸中的每任一种形成碱基对的非天然(脱氧)核糖核苷酸。在一些实施方案中,非天然(脱氧)核糖核苷酸是可以形成UBP,但是基本上不与一种或多种天然核酸形成碱基对的非天然(脱氧)核糖核苷酸。例如,非天然核酸可能基本上不与A、T和C形成碱基对,但是可以与G形成碱基对。例如,非天然核酸可能基本上不与A、T和G形成碱基对,但是可以与C形成碱基对。例如,非天然核酸可能基本上不与C、G和A形成碱基对,但是可以与T形成碱基对。例如,非天然核酸可能基本上不与C、G和T形成碱基对,但是可以与A形成碱基对。例如,非天然核酸可能基本上不与A和T形成碱基对,但是可以与C和G形成碱基对。例如,非天然核酸可能基本上不与A和C形成碱基对,但是可以与T和G形成碱基对。例如,非天然核酸可能基本上不与A和G形成碱基对,但是可以与C和T形成碱基对。例如,非天然核酸可能基本上不与C和T形成碱基对,但是可以与A和G形成碱基对。例如,非天然核酸可能基本上不与C和G形成碱基对,但是可以与T和G形成碱基对。例如,非天然核酸可能基本上不与T和G形成碱基对,但是可以与A和G形成碱基对。例如,非天然核酸可能基本上不与G形成碱基对,但是可以与A、T和C形成碱基对。例如,非天然核酸可能基本上不与A形成碱基对,但是可以与G、T和C形成碱基对。例如,非天然核酸可能基本上不与T形成碱基对,但是可以与G、A和C形成碱基对。例如,非天然核酸可能基本上不与C形成碱基对,但是可以与G、T和A形成碱基对。
能够在体内条件下形成非天然碱基对(UBP)(例如,在RNA中,如在tRNA与mRNA之间)的示例性非天然核苷酸包括但不限于5SICS、d5SICS、NaM、dNaM、dTPT3、dMTMO、dCNMO、TAT1及其组合。在一些实施方案中,非天然核苷酸碱基对包括但不限于:
在mRNA的密码子序列与tRNA的反密码子序列之间形成非天然碱基对(UBP)以促进mRNA翻译成非天然多肽。在一些实例中,密码子-反密码子UBP包含含有阅读mRNA的5'至3'的三个连续核酸的密码子序列(例如,UUX),以及含有阅读tRNA的5'至3'的三个连续核酸的反密码子序列(例如,YAA或XAA)。在一些实施方案中,当mRNA密码子是UUX时,tRNA反密码子是YAA或XAA。在一些实施方案中,当mRNA密码子是UGX时,tRNA反密码子是YCA或XCA。在一些实施方案中,当mRNA密码子是CGX时,tRNA反密码子是YCG或XCG。在一些实施方案中,当mRNA密码子是AGX时,tRNA反密码子是YCU或XCU。在一些实施方案中,当mRNA密码子是GAX时,tRNA反密码子是YUC或XUC。在一些实施方案中,当mRNA密码子是CAX时,tRNA反密码子是YUG或XUG。在一些实施方案中,当mRNA密码子是GXU时,tRNA反密码子是AYC。在一些实施方案中,当mRNA密码子是CXU时,tRNA反密码子是AYG。在一些实施方案中,当mRNA密码子是GXG时,tRNA反密码子是CYC。在一些实施方案中,当mRNA密码子是AXG时,tRNA反密码子是CYU。在一些实施方案中,当mRNA密码子是GXC时,tRNA反密码子是GYC。在一些实施方案中,当mRNA密码子是AXC时,tRNA反密码子是GYU。在一些实施方案中,当mRNA密码子是GXA时,tRNA反密码子是UYC。在一些实施方案中,当mRNA密码子是CXC时,tRNA反密码子是GYG。在一些实施方案中,当mRNA密码子是UXC时,tRNA反密码子是GYA。在一些实施方案中,当mRNA密码子是AUX时,tRNA反密码子是YAU或XAU。在一些实施方案中,当mRNA密码子是CUX时,tRNA反密码子是XAG或YAG。在一些实施方案中,当mRNA密码子是UUX时,tRNA反密码子是XAA或YAA。在一些实施方案中,当mRNA密码子是GUX时,tRNA反密码子是XAC或YAC。在一些实施方案中,当mRNA密码子是UAX时,tRNA反密码子是XUA或YUA。在一些实施方案中,当mRNA密码子是GGX时,tRNA反密码子是XCC或YCC。
天然氨基酸和非天然氨基酸
如本文所用,氨基酸残基可以指含有氨基和羧基二者的分子。合适的氨基酸包括而不限于天然存在的氨基酸的D-异构体和L-异构体二者,以及通过有机合成或任何其他方法制备的非天然存在的氨基酸。如本文所用,术语氨基酸包括而不限于α-氨基酸、天然氨基酸、非天然氨基酸和氨基酸类似物。
术语“α-氨基酸”可以指含有与命名为α-碳的碳结合的氨基和羧基二者的分子。例如:
术语“β-氨基酸”可以指呈β构型的含有氨基和羧基二者的分子。
“天然存在的氨基酸”可以指一般在自然界中合成的肽中找到的二十种氨基酸中的任一种,并且以单字母缩写A、R、N、C、D、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y和V而为人所知。
下表显示天然氨基酸的特性的汇总:
“疏水氨基酸”包括小疏水氨基酸和大疏水氨基酸。“小疏水氨基酸”可以是甘氨酸、丙氨酸、脯氨酸及其类似物。“大疏水氨基酸”可以是缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、甲硫氨酸、色氨酸及其类似物。“极性氨基酸”可以是丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、酪氨酸及其类似物。“带电荷的氨基酸”可以是赖氨酸、精氨酸、组氨酸、天冬氨酸、谷氨酸及其类似物。
“氨基酸类似物”可以是结构上与氨基酸类似并且可以在拟肽大环的形成中取代氨基酸的分子。氨基酸类似物包括而不限于β-氨基酸和其中氨基或羧基被类似反应性基团取代(例如,伯胺被仲胺或叔胺取代,或者羧基被酯取代)的氨基酸。
非规范氨基酸(ncAA)或“非天然氨基酸”可以是并非通常在自然界中合成的肽中找到的并且以单字母缩写A、R、N、C、D、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y和V而为人所知的二十种氨基酸之一的氨基酸。在一些实例中,非天然氨基酸是非规范氨基酸的子集。
氨基酸类似物可以包括β-氨基酸类似物。β-氨基酸类似物的例子包括但不限于以下:环状β-氨基酸类似物;β-丙氨酸;(R)-β-苯丙氨酸;(R)-1,2,3,4-四氢-异喹啉-3-乙酸;(R)-3-氨基-4-(1-萘基)-丁酸;(R)-3-氨基-4-(2,4-二氯苯基)丁酸;(R)-3-氨基-4-(2-氯苯基)-丁酸;(R)-3-氨基-4-(2-氰基苯基)-丁酸;(R)-3-氨基-4-(2-氟苯基)-丁酸;(R)-3-氨基-4-(2-呋喃基)-丁酸;(R)-3-氨基-4-(2-甲基苯基)-丁酸;(R)-3-氨基-4-(2-萘基)-丁酸;(R)-3-氨基-4-(2-噻吩基)-丁酸;(R)-3-氨基-4-(2-三氟甲基苯基)-丁酸;(R)-3-氨基-4-(3,4-二氯苯基)丁酸;(R)-3-氨基-4-(3,4-二氟苯基)丁酸;(R)-3-氨基-4-(3-苯并噻吩基)-丁酸;(R)-3-氨基-4-(3-氯苯基)-丁酸;(R)-3-氨基-4-(3-氰基苯基)-丁酸;(R)-3-氨基-4-(3-氟苯基)-丁酸;(R)-3-氨基-4-(3-甲基苯基)-丁酸;(R)-3-氨基-4-(3-吡啶基)-丁酸;(R)-3-氨基-4-(3-噻吩基)-丁酸;(R)-3-氨基-4-(3-三氟甲基苯基)-丁酸;(R)-3-氨基-4-(4-溴苯基)-丁酸;(R)-3-氨基-4-(4-氯苯基)-丁酸;(R)-3-氨基-4-(4-氰基苯基)-丁酸;(R)-3-氨基-4-(4-氟苯基)-丁酸;(R)-3-氨基-4-(4-碘苯基)-丁酸;(R)-3-氨基-4-(4-甲基苯基)-丁酸;(R)-3-氨基-4-(4-硝基苯基)-丁酸;(R)-3-氨基-4-(4-吡啶基)-丁酸;(R)-3-氨基-4-(4-三氟甲基苯基)-丁酸;(R)-3-氨基-4-五氟-苯基丁酸;(R)-3-氨基-5-己烯酸;(R)-3-氨基-5-己炔酸;(R)-3-氨基-5-苯基戊酸;(R)-3-氨基-6-苯基-5-己烯酸;(S)-1,2,3,4-四氢-异喹啉-3-乙酸;(S)-3-氨基-4-(1-萘基)-丁酸;(S)-3-氨基-4-(2,4-二氯苯基)丁酸;(S)-3-氨基-4-(2-氯苯基)-丁酸;(S)-3-氨基-4-(2-氰基苯基)-丁酸;(S)-3-氨基-4-(2-氟苯基)-丁酸;(S)-3-氨基-4-(2-呋喃基)-丁酸;(S)-3-氨基-4-(2-甲基苯基)-丁酸;(S)-3-氨基-4-(2-萘基)-丁酸;(S)-3-氨基-4-(2-噻吩基)-丁酸;(S)-3-氨基-4-(2-三氟甲基苯基)-丁酸;(S)-3-氨基-4-(3,4-二氯苯基)丁酸;(S)-3-氨基-4-(3,4-二氟苯基)丁酸;(S)-3-氨基-4-(3-苯并噻吩基)-丁酸;(S)-3-氨基-4-(3-氯苯基)-丁酸;(S)-3-氨基-4-(3-氰基苯基)-丁酸;(S)-3-氨基-4-(3-氟苯基)-丁酸;(S)-3-氨基-4-(3-甲基苯基)-丁酸;(S)-3-氨基-4-(3-吡啶基)-丁酸;(S)-3-氨基-4-(3-噻吩基)-丁酸;(S)-3-氨基-4-(3-三氟甲基苯基)-丁酸;(S)-3-氨基-4-(4-溴苯基)-丁酸;(S)-3-氨基-4-(4-氯苯基)丁酸;(S)-3-氨基-4-(4-氰基苯基)-丁酸;(S)-3-氨基-4-(4-氟苯基)丁酸;(S)-3-氨基-4-(4-碘苯基)-丁酸;(S)-3-氨基-4-(4-甲基苯基)-丁酸;(S)-3-氨基-4-(4-硝基苯基)-丁酸;(S)-3-氨基-4-(4-吡啶基)-丁酸;(S)-3-氨基-4-(4-三氟甲基苯基)-丁酸;(S)-3-氨基-4-五氟-苯基丁酸;(S)-3-氨基-5-己烯酸;(S)-3-氨基-5-己炔酸;(S)-3-氨基-5-苯基戊酸;(S)-3-氨基-6-苯基-5-己烯酸;1,2,5,6-四氢吡啶-3-甲酸;1,2,5,6-四氢吡啶-4-甲酸;3-氨基-3-(2-氯苯基)-丙酸;3-氨基-3-(2-噻吩基)-丙酸;3-氨基-3-(3-溴苯基)-丙酸;3-氨基-3-(4-氯苯基)-丙酸;3-氨基-3-(4-甲氧基苯基)-丙酸;3-氨基-4,4,4-三氟-丁酸;3-氨基己二酸;D-β-苯丙氨酸;β-亮氨酸;L-β-高丙氨酸;L-β-高天冬氨酸γ-苄基酯;L-β-高谷氨酸δ-苄基酯;L-β-高异亮氨酸;L-β-高亮氨酸;L-β-高甲硫氨酸;L-β-高苯丙氨酸;L-β-高脯氨酸;L-β-高色氨酸;L-β-高缬氨酸;L-Nω-苄氧基羰基-β-高赖氨酸;Nω-L-β-高精氨酸;O-苄基-L-β-高羟脯氨酸;O-苄基-L-β-高丝氨酸;O-苄基-L-β-高苏氨酸;O-苄基-L-β-高酪氨酸;γ-三苯甲基-L-β-高天冬酰胺;(R)-β-苯丙氨酸;L-β-高天冬氨酸γ-叔丁基酯;L-β-高谷氨酸δ-叔丁基酯;L-Nω-β-高赖氨酸;Nδ-三苯甲基-L-β-高谷氨酰胺;Nω-2,2,4,6,7-五甲基-二氢苯并呋喃-5-磺酰基-L-β-高精氨酸;O-叔丁基-L-β-高羟脯氨酸;O-叔丁基-L-β-高丝氨酸;O-叔丁基-L-β-高苏氨酸;O-叔丁基-L-β-高酪氨酸;2-氨基环戊烷羧酸;和2-氨基环己烷羧酸。
氨基酸类似物可以包括丙氨酸、缬氨酸、甘氨酸或亮氨酸的类似物。丙氨酸、缬氨酸、甘氨酸和亮氨酸的氨基酸类似物的例子包括但不限于以下:α-甲氧基甘氨酸;α-烯丙基-L-丙氨酸;α-氨基异丁酸;α-甲基-亮氨酸;β-(1-萘基)-D-丙氨酸;β-(1-萘基)-L-丙氨酸;β-(2-萘基)-D-丙氨酸;β-(2-萘基)-L-丙氨酸;β-(2-吡啶基)-D-丙氨酸;β-(2-吡啶基)-L-丙氨酸;β-(2-噻吩基)-D-丙氨酸;β-(2-噻吩基)-L-丙氨酸;β-(3-苯并噻吩基)-D-丙氨酸;β-(3-苯并噻吩基)-L-丙氨酸;β-(3-吡啶基)-D-丙氨酸;β-(3-吡啶基)-L-丙氨酸;β-(4-吡啶基)-D-丙氨酸;β-(4-吡啶基)-L-丙氨酸;β-氯-L-丙氨酸;β-氰基-L-丙氨酸;β-环己基-D-丙氨酸;β-环己基-L-丙氨酸;β-环戊烯-1-基-丙氨酸;β-环戊基-丙氨酸;β-环丙基-L-Ala-OH.二环己基铵盐;β-叔丁基-D-丙氨酸;β-叔丁基-L-丙氨酸;γ-氨基丁酸;L-α,β-二氨基丙酸;2,4-二硝基-苯基甘氨酸;2,5-二氢-D-苯基甘氨酸;2-氨基-4,4,4-三氟丁酸;2-氟-苯基甘氨酸;3-氨基-4,4,4-三氟-丁酸;3-氟-缬氨酸;4,4,4-三氟-缬氨酸;4,5-脱氢-L-leu-OH.二环己基铵盐;4-氟-D-苯基甘氨酸;4-氟-L-苯基甘氨酸;4-羟基-D-苯基甘氨酸;5,5,5-三氟-亮氨酸;6-氨基己酸;环戊基-D-Gly-OH.二环己基铵盐;环戊基-Gly-OH.二环己基铵盐;D-α,β-二氨基丙酸;D-α-氨基丁酸;D-α-叔丁基甘氨酸;D-(2-噻吩基)甘氨酸;D-(3-噻吩基)甘氨酸;D-2-氨基己酸;D-2-茚满基甘氨酸;D-烯丙基甘氨酸-二环己基铵盐;D-环己基甘氨酸;D-正缬氨酸;D-苯基甘氨酸;β-氨基丁酸;β-氨基异丁酸;(2-溴苯基)甘氨酸;(2-甲氧基苯基)甘氨酸;(2-甲基苯基)甘氨酸;(2-噻唑基)甘氨酸;(2-噻吩基)甘氨酸;2-氨基-3-(二甲基氨基)-丙酸;L-α,β-二氨基丙酸;L-α-氨基丁酸;L-α-叔丁基甘氨酸;L-(3-噻吩基)甘氨酸;L-2-氨基-3-(二甲基氨基)-丙酸;L-2-氨基己酸二环己基-铵盐;L-2-茚满基甘氨酸;L-烯丙基甘氨酸二环己基铵盐;L-环己基甘氨酸;L-苯基甘氨酸;L-炔丙基甘氨酸;L-正缬氨酸;N-α-氨基甲基-L-丙氨酸;D-α,γ-二氨基丁酸;L-α,γ-二氨基丁酸;β-环丙基-L-丙氨酸;(N-β-(2,4-二硝基苯基))-L-α,β-二氨基丙酸;(N-β-1-(4,4-二甲基-2,6-二氧代环己-1-亚基)乙基)-D-α,β-二氨基丙酸;(N-β-1-(4,4-二甲基-2,6-二氧代环己-1-亚基)乙基)-L-α,β-二氨基丙酸;(N-β-4-甲基三苯甲基)-L-α,β-二氨基丙酸;(N-β-烯丙氧基羰基)-L-α,β-二氨基丙酸;(N-γ-1-(4,4-二甲基-2,6-二氧代环己-1-亚基)乙基)-D-α,γ-二氨基丁酸;(N-γ-1-(4,4-二甲基-2,6-二氧代环己-1-亚基)乙基)-L-α,γ-二氨基丁酸;(N-γ-4-甲基三苯甲基)-D-α,γ-二氨基丁酸;(N-γ-4-甲基三苯甲基)-L-α,γ-二氨基丁酸;(N-γ-烯丙氧基羰基)-L-α,γ-二氨基丁酸;D-α,γ-二氨基丁酸;4,5-脱氢-L-亮氨酸;环戊基-D-Gly-OH;环戊基-Gly-OH;D-烯丙基甘氨酸;D-高环己基丙氨酸;L-1-芘基丙氨酸;L-2-氨基己酸;L-烯丙基甘氨酸;L-高环己基丙氨酸;和N-(2-羟基-4-甲氧基-Bzl)-Gly-OH。
氨基酸类似物可以包括精氨酸或赖氨酸的类似物。精氨酸和赖氨酸的氨基酸类似物的例子包括但不限于以下:瓜氨酸;L-2-氨基-3-胍基丙酸;L-2-氨基-3-脲基丙酸;L-瓜氨酸;Lys(Me)2-OH;Lys(N3)-OH;Nδ-苄氧基羰基-L-鸟氨酸;Nω-硝基-D-精氨酸;Nω-硝基-L-精氨酸;α-甲基-鸟氨酸;2,6-二氨基庚二酸;L-鸟氨酸;(Nδ-1-(4,4-二甲基-2,6-二氧代-环己-1-亚基)乙基)-D-鸟氨酸;(Nδ-1-(4,4-二甲基-2,6-二氧代-环己-1-亚基)乙基)-L-鸟氨酸;(Nδ-4-甲基三苯甲基)-D-鸟氨酸;(Nδ-4-甲基三苯甲基)-L-鸟氨酸;D-鸟氨酸;L-鸟氨酸;Arg(Me)(Pbf)-OH;Arg(Me)2-OH(不对称);Arg(Me)2-OH(对称);Lys(ivDde)-OH;Lys(Me)2-OH.HCl;Lys(Me3)-OH氯化物;Nω-硝基-D-精氨酸;和Nω-硝基-L-精氨酸。
氨基酸类似物可以包括天冬氨酸或谷氨酸的类似物。天冬氨酸和谷氨酸的氨基酸类似物的例子包括但不限于以下:α-甲基-D-天冬氨酸;α-甲基-谷氨酸;α-甲基-L-天冬氨酸;γ-亚甲基-谷氨酸;(N-γ-乙基)-L-谷氨酰胺;[N-α-(4-氨基苯甲酰基)]-L-谷氨酸;2,6-二氨基庚二酸;L-α-氨基辛二酸;D-2-氨基己二酸;D-α-氨基辛二酸;α-氨基庚二酸;亚氨基二乙酸;L-2-氨基己二酸;苏式-β-甲基-天冬氨酸;γ-羧基-D-谷氨酸γ,γ-二-叔丁基酯;γ-羧基-L-谷氨酸γ,γ-二-叔丁基酯;Glu(OAll)-OH;L-Asu(OtBu)-OH;和焦谷氨酸。
氨基酸类似物可以包括半胱氨酸和甲硫氨酸的类似物。半胱氨酸和甲硫氨酸的氨基酸类似物的例子包括但不限于Cys(法呢基)-OH、Cys(法呢基)-OMe、α-甲基-甲硫氨酸、Cys(2-羟乙基)-OH、Cys(3-氨基丙基)-OH、2-氨基-4-(乙硫基)丁酸、丁硫氨酸、丁硫氨酸亚砜亚胺、乙硫氨酸、甲硫氨酸甲基锍氯化物、硒代甲硫氨酸、磺基丙氨酸、[2-(4-吡啶基)乙基]-DL-青霉胺、[2-(4-吡啶基)乙基]-L-半胱氨酸、4-甲氧基苄基-D-青霉胺、4-甲氧基苄基-L-青霉胺、4-甲基苄基-D-青霉胺、4-甲基苄基-L-青霉胺、苄基-D-半胱氨酸、苄基-L-半胱氨酸、苄基-DL-高半胱氨酸、氨基甲酰基-L-半胱氨酸、羧乙基-L-半胱氨酸、羧甲基-L-半胱氨酸、二苯基甲基-L-半胱氨酸、乙基-L-半胱氨酸、甲基-L-半胱氨酸、叔丁基-D-半胱氨酸、三苯甲基-L-高半胱氨酸、三苯甲基-D-青霉胺、胱硫醚、高胱氨酸、L-高胱氨酸、(2-氨基乙基)-L-半胱氨酸、硒代-L-胱氨酸、胱硫醚、Cys(StBu)-OH和乙酰胺基甲基-D-青霉胺。
氨基酸类似物可以包括苯丙氨酸和酪氨酸的类似物。苯丙氨酸和酪氨酸的氨基酸类似物的例子包括β-甲基-苯丙氨酸、β-羟基苯丙氨酸、α-甲基-3-甲氧基-DL-苯丙氨酸、α-甲基-D-苯丙氨酸、α-甲基-L-苯丙氨酸、1,2,3,4-四氢异喹啉-3-甲酸、2,4-二氯-苯丙氨酸、2-(三氟甲基)-D-苯丙氨酸、2-(三氟甲基)-L-苯丙氨酸、2-溴-D-苯丙氨酸、2-溴-L-苯丙氨酸、2-氯-D-苯丙氨酸、2-氯-L-苯丙氨酸、2-氰基-D-苯丙氨酸、2-氰基-L-苯丙氨酸、2-氟-D-苯丙氨酸、2-氟-L-苯丙氨酸、2-甲基-D-苯丙氨酸、2-甲基-L-苯丙氨酸、2-硝基-D-苯丙氨酸、2-硝基-L-苯丙氨酸、2;4;5-三羟基-苯丙氨酸、3,4,5-三氟-D-苯丙氨酸、3,4,5-三氟-L-苯丙氨酸、3,4-二氯-D-苯丙氨酸、3,4-二氯-L-苯丙氨酸、3,4-二氟-D-苯丙氨酸、3,4-二氟-L-苯丙氨酸、3,4-二羟基-L-苯丙氨酸、3,4-二甲氧基-L-苯丙氨酸、3,5,3'-三碘-L-甲状腺原氨酸、3,5-二碘-D-酪氨酸、3,5-二碘-L-酪氨酸、3,5-二碘-L-甲状腺原氨酸、3-(三氟甲基)-D-苯丙氨酸、3-(三氟甲基)-L-苯丙氨酸、3-氨基-L-酪氨酸、3-溴-D-苯丙氨酸、3-溴-L-苯丙氨酸、3-氯-D-苯丙氨酸、3-氯-L-苯丙氨酸、3-氯-L-酪氨酸、3-氰基-D-苯丙氨酸、3-氰基-L-苯丙氨酸、3-氟-D-苯丙氨酸、3-氟-L-苯丙氨酸、3-氟-酪氨酸、3-碘-D-苯丙氨酸、3-碘-L-苯丙氨酸、3-碘-L-酪氨酸、3-甲氧基-L-酪氨酸、3-甲基-D-苯丙氨酸、3-甲基-L-苯丙氨酸、3-硝基-D-苯丙氨酸、3-硝基-L-苯丙氨酸、3-硝基-L-酪氨酸、4-(三氟甲基)-D-苯丙氨酸、4-(三氟甲基)-L-苯丙氨酸、4-氨基-D-苯丙氨酸、4-氨基-L-苯丙氨酸、4-苯甲酰基-D-苯丙氨酸、4-苯甲酰基-L-苯丙氨酸、4-双(2-氯乙基)氨基-L-苯丙氨酸、4-溴-D-苯丙氨酸、4-溴-L-苯丙氨酸、4-氯-D-苯丙氨酸、4-氯-L-苯丙氨酸、4-氰基-D-苯丙氨酸、4-氰基-L-苯丙氨酸、4-氟-D-苯丙氨酸、4-氟-L-苯丙氨酸、4-碘-D-苯丙氨酸、4-碘-L-苯丙氨酸、高苯丙氨酸、甲状腺素、3,3-二苯丙氨酸、甲状腺原氨酸、乙基-酪氨酸和甲基-酪氨酸。
氨基酸类似物可以包括脯氨酸的类似物。脯氨酸的氨基酸类似物的例子包括但不限于3,4-脱氢-脯氨酸、4-氟-脯氨酸、顺式-4-羟基-脯氨酸、噻唑烷-2-甲酸和反式-4-氟-脯氨酸。
氨基酸类似物可以包括丝氨酸和苏氨酸的类似物。丝氨酸和苏氨酸的氨基酸类似物的例子包括但不限于3-氨基-2-羟基-5-甲基己酸、2-氨基-3-羟基-4-甲基戊酸、2-氨基-3-乙氧基丁酸、2-氨基-3-甲氧基丁酸、4-氨基-3-羟基-6-甲基庚酸、2-氨基-3-苄氧基丙酸、2-氨基-3-苄氧基丙酸、2-氨基-3-乙氧基丙酸、4-氨基-3-羟基丁酸和α-甲基丝氨酸。
氨基酸类似物可以包括色氨酸的类似物。色氨酸的氨基酸类似物的例子包括但不限于以下:α-甲基-色氨酸;β-(3-苯并噻吩基)-D-丙氨酸;β-(3-苯并噻吩基)-L-丙氨酸;1-甲基-色氨酸;4-甲基-色氨酸;5-苄氧基-色氨酸;5-溴-色氨酸;5-氯-色氨酸;5-氟-色氨酸;5-羟基-色氨酸;5-羟基-L-色氨酸;5-甲氧基-色氨酸;5-甲氧基-L-色氨酸;5-甲基-色氨酸;6-溴-色氨酸;6-氯-D-色氨酸;6-氯-色氨酸;6-氟-色氨酸;6-甲基-色氨酸;7-苄氧基-色氨酸;7-溴-色氨酸;7-甲基-色氨酸;D-1,2,3,4-四氢-去甲哈尔满-3-甲酸;6-甲氧基-1,2,3,4-四氢去甲哈尔满-1-甲酸;7-氮杂色氨酸;L-1,2,3,4-四氢-去甲哈尔满-3-甲酸;5-甲氧基-2-甲基-色氨酸;和6-氯-L-色氨酸。
氨基酸类似物可以是外消旋的。在一些实例中,使用氨基酸类似物的D异构体。在一些情况下,使用氨基酸类似物的L异构体。在一些实例中,氨基酸类似物包含呈R构型或S构型的手性中心。有时,β-氨基酸类似物的一个或多个氨基被保护基团取代,所述保护基团例如叔丁氧基羰基(BOC基团)、9-芴基甲氧基羰基(FMOC)、甲苯磺酰基等。有时,β-氨基酸类似物的羧酸官能团受保护,例如,作为其酯衍生物受保护。在一些情况下,使用氨基酸类似物的盐。
在一些实施方案中,非天然氨基酸是以下文献中所述的非天然氨基酸:Liu C.C.,Schultz,P.G.Annu.Rev.Biochem.2010,79,413。在一些实施方案中,非天然氨基酸包括N6(2-叠氮基乙氧基)-羰基-L-赖氨酸。
在一些实施方案中,在与缀合部分结合之前,本文所述的氨基酸残基(例如,在蛋白质内)突变为非天然氨基酸。在一些情况下,突变为非天然氨基酸防止或最小化免疫系统的自身抗原反应。如本文所用,术语“非天然氨基酸”是指除蛋白质中天然存在的20种氨基酸之外的氨基酸。非天然氨基酸的非限制性例子包括:对-乙酰基-L-苯丙氨酸、对-碘-L-苯丙氨酸、对-甲氧基苯丙氨酸、O-甲基-L-酪氨酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-硼酸基苯丙氨酸、O-炔丙基酪氨酸、L-磷酸丝氨酸、膦酰丝氨酸、膦酰酪氨酸、对-溴苯丙氨酸、硒代半胱氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸、或N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸、酪氨酸氨基酸的非天然类似物;谷氨酰胺氨基酸的非天然类似物;苯丙氨酸氨基酸的非天然类似物;丝氨酸氨基酸的非天然类似物;苏氨酸氨基酸的非天然类似物;烷基、芳基、酰基、叠氮基、氰基、卤素、肼、酰肼、羟基、烯基、炔基、醚、硫醇、磺酰基、硒代、酯、硫代酸、硼酸盐、硼酸酯、磷酸、膦酰、磷化氢、杂环、烯酮、亚胺、醛、羟胺、酮或氨基取代的氨基酸或其组合;具有可光活化的交联剂的氨基酸;自旋标记的氨基酸;荧光氨基酸;金属结合氨基酸;含金属的氨基酸;放射性氨基酸;光笼化和/或光异构化氨基酸;含有氨基酸的生物素或生物素类似物;含有氨基酸的酮;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化学可裂解或可光裂解的氨基酸;具有细长侧链的氨基酸;含有毒性基团的氨基酸;糖取代的氨基酸;碳连接的含糖氨基酸;氧化还原活性氨基酸;含α-羟基的酸;氨基硫代酸;α,α二取代氨基酸;β-氨基酸;除脯氨酸或组氨酸之外的环状氨基酸,以及除苯丙氨酸、酪氨酸或色氨酸之外的芳族氨基酸。
在一些实施方案中,非天然氨基酸包含选择性反应性基团,或用于位点选择性标记靶蛋白或多肽的反应性基团。在一些实例中,化学是双正交反应(例如,生物相容性和选择性反应)。在一些情况下,化学是Cu(I)催化或“无铜”炔-叠氮三唑形成反应、施陶丁格连接(Staudinger ligation)、反电子需求的迪尔斯-阿尔德(inverse-electron-demandDiels-Alder,IEDDA)反应、“光-点击”化学或金属介导的过程(如烯烃复分解和铃木-宫浦(Suzuki-Miyaura)或薗头(Sonogashira)交叉偶联)。在一些实施方案中,非天然氨基酸包含光反应性基团,所述光反应性基团在用例如UV辐照时交联。在一些实施方案中,非天然氨基酸包括光笼化氨基酸。在一些实例中,非天然氨基酸是对位取代、间位取代或邻位取代的氨基酸衍生物。
在一些实例中,非天然氨基酸包括对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、O-甲基-L-酪氨酸、对-甲氧基苯丙氨酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、膦酰丝氨酸、膦酰酪氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸或异丙基-L-苯丙氨酸。
在一些情况下,非天然氨基酸是3-氨基酪氨酸、3-硝基酪氨酸、3,4-二羟基-苯丙氨酸或3-碘酪氨酸。在一些情况下,非天然氨基酸是苯基硒代半胱氨酸。在一些实例中,非天然氨基酸是含二苯甲酮、酮、碘化物、甲氧基、乙酰基、苯甲酰基或叠氮化物的苯丙氨酸衍生物。在一些实例中,非天然氨基酸是含二苯甲酮、酮、碘化物、甲氧基、乙酰基、苯甲酰基或叠氮化物的赖氨酸衍生物。在一些实例中,非天然氨基酸包含芳族侧链。在一些实例中,非天然氨基酸不包含芳族侧链。在一些实例中,非天然氨基酸包含叠氮基。在一些实例中,非天然氨基酸包含迈克尔(Michael)受体基团。在一些实例中,迈克尔受体基团包含能够通过1,2-加成反应形成共价键的不饱和部分。在一些实例中,迈克尔受体基团包含缺电子的烯烃或炔烃。在一些实例中,迈克尔受体基团包括但不限于α、β不饱和的:酮、醛、亚砜、砜、腈、亚胺或芳族化合物。在一些实例中,非天然氨基酸是脱氢丙氨酸。在一些实例中,非天然氨基酸包含醛基或酮基。在一些实例中,非天然氨基酸是包含醛基或酮基的赖氨酸衍生物。在一些实例中,非天然氨基酸是在β、γ或δ位置处包含一个或多个O、N、Se或S原子的赖氨酸衍生物。在一些实例中,非天然氨基酸是在γ位置处包含O、N、Se或S原子的赖氨酸衍生物。在一些实例中,非天然氨基酸是赖氨酸衍生物,其中εN原子被氧原子替代。在一些实例中,非天然氨基酸是赖氨酸衍生物,其不是天然存在的经翻译后修饰的赖氨酸。
在一些实例中,非天然氨基酸是包含侧链的氨基酸,其中从α位置起的第六个原子包含羰基。在一些实例中,非天然氨基酸是包含侧链的氨基酸,其中从α位置起的第六个原子包含羰基,并且从α位置起的第五个原子是氮。在一些实例中,非天然氨基酸是包含侧链的氨基酸,其中从α位置起的第七个原子是氧原子。
在一些实例中,非天然氨基酸是包含硒的丝氨酸衍生物。在一些实例中,非天然氨基酸是硒代丝氨酸(2-氨基-3-氢硒代丙酸)。在一些实例中,非天然氨基酸是2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸。在一些实例中,非天然氨基酸是2-氨基-3-(苯基硒基)丙酸。在一些实例中,非天然氨基酸包含硒,其中硒的氧化导致形成包含烯烃的非天然氨基酸。
在一些实例中,非天然氨基酸包含环辛炔基。在一些实例中,非天然氨基酸包含反式环辛烯基。在一些实例中,非天然氨基酸包含降冰片烯基。在一些实例中,非天然氨基酸包含环丙烯基。在一些实例中,非天然氨基酸包含二氮杂环丙烯基团。在一些实例中,非天然氨基酸包含四嗪基团。
在一些实例中,非天然氨基酸是赖氨酸衍生物,其中侧链氮被氨甲酰化。在一些实例中,非天然氨基酸是赖氨酸衍生物,其中侧链氮被酰化。在一些实例中,非天然氨基酸是2-氨基-6-{[(叔丁氧基)羰基]氨基}己酸。在一些实例中,非天然氨基酸是2-氨基-6-{[(叔丁氧基)羰基]氨基}己酸。在一些实例中,非天然氨基酸是N6-Boc-N6-甲基赖氨酸。在一些实例中,非天然氨基酸是N6-乙酰基赖氨酸。在一些实例中,非天然氨基酸是吡咯赖氨酸。在一些实例中,非天然氨基酸是N6-三氟乙酰基赖氨酸。在一些实例中,非天然氨基酸是2-氨基-6-{[(苄氧基)羰基]氨基}己酸。在一些实例中,非天然氨基酸是2-氨基-6-{[(对-碘代苄氧基)羰基]氨基}己酸。在一些实例中,非天然氨基酸是2-氨基-6-{[(对-硝基苄氧基)羰基]氨基}己酸。在一些实例中,非天然氨基酸是N6-脯氨酰基赖氨酸。在一些实例中,非天然氨基酸是2-氨基-6-{[(环戊基氧基)羰基]氨基}己酸。在一些实例中,非天然氨基酸是N6-(环戊烷羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-(四氢呋喃-2-羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-(3-乙炔基四氢呋喃-2-羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-((丙-2-炔-1-基氧基)羰基)赖氨酸。在一些实例中,非天然氨基酸是2-氨基-6-{[(2-叠氮基环戊基氧基)羰基]氨基}己酸。在一些实例中,非天然氨基酸是N6-((2-叠氮基乙氧基)羰基)赖氨酸。在一些实例中,非天然氨基酸是2-氨基-6-{[(2-硝基苄氧基)羰基]氨基}己酸。在一些实例中,非天然氨基酸是2-氨基-6-{[(2-环辛炔基氧基)羰基]氨基}己酸。在一些实例中,非天然氨基酸是N6-(2-氨基丁-3-炔酰基)赖氨酸。在一些实例中,非天然氨基酸是2-氨基-6-((2-氨基丁-3-炔酰基)氧基)己酸。在一些实例中,非天然氨基酸是N6-(烯丙氧基羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-(丁烯基-4-氧羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-(戊烯基-5-氧羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-((丁-3-炔-1-基氧基)羰基)-赖氨酸。在一些实例中,非天然氨基酸是N6-((戊-4-炔-1-基氧基)羰基)-赖氨酸。在一些实例中,非天然氨基酸是N6-(噻唑烷-4-羰基)赖氨酸。在一些实例中,非天然氨基酸是2-氨基-8-氧代壬酸。在一些实例中,非天然氨基酸是2-氨基-8-氧代辛酸。在一些实例中,非天然氨基酸是N6-(2-氧代乙酰基)赖氨酸。
在一些实例中,非天然氨基酸是N6-丙酰基赖氨酸。在一些实例中,非天然氨基酸是N6-丁酰基赖氨酸。在一些实例中,非天然氨基酸是N6-(丁-2-烯酰基)赖氨酸。在一些实例中,非天然氨基酸是N6-((双环[2.2.1]庚-5-烯-2-基氧基)羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-((螺[2.3]己-1-烯-5-基甲氧基)羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-(((4-(1-(三氟甲基)环丙-2-烯-1-基)苄基)氧基)羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-((双环[2.2.1]庚-5-烯-2-基甲氧基)羰基)赖氨酸。在一些实例中,非天然氨基酸是半胱氨酸赖氨酸。在一些实例中,非天然氨基酸是N6-((1-(6-硝基苯并[d][1,3]二氧杂环戊烯-5-基)乙氧基)羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-((2-(3-甲基-3H-二氮杂环丙烯-3-基)乙氧基)羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-((3-(3-甲基-3H-二氮杂环丙烯-3-基)丙氧基)羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-((间硝基苄氧基)N6-甲基羰基)赖氨酸。在一些实例中,非天然氨基酸是N6-((双环[6.1.0]壬-4-炔-9-基甲氧基)羰基)-赖氨酸。在一些实例中,非天然氨基酸是N6-((环庚-3-烯-1-基氧基)羰基)-L-赖氨酸。
在一些实施方案中,非天然氨基酸通过包含非天然核苷酸的非天然密码子掺入蛋白质中。
在一些实例中,将非天然氨基酸掺入蛋白质是由正交的、经修饰的合成酶/tRNA对介导的。此类正交对包含天然或突变的合成酶,所述天然或突变的合成酶能够使非天然tRNA装载有特定的非天然氨基酸,通常同时最小化:a)其他内源氨基酸或替代非天然氨基酸在非天然tRNA和b)任何其他(包括内源性)tRNA上的装载。此类正交对包含tRNA,所述tRNA能够通过合成酶进行装载,同时避免通过内源性合成酶装载其他内源性氨基酸。在一些实施方案中,从各种生物体(如细菌、酵母、古细菌或人来源)鉴定出此类对。在一些实施方案中,正交合成酶/tRNA对包含来自单一生物体的组分。在一些实施方案中,正交合成酶/tRNA对包含来自两种不同的生物体的组分。在一些实施方案中,正交合成酶/tRNA对包含在修饰之前促进不同氨基酸翻译的组分。在一些实施方案中,正交合成酶是经修饰的丙氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的精氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的天冬酰胺合成酶。在一些实施方案中,正交合成酶是经修饰的天冬氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的半胱氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的谷氨酰胺合成酶。在一些实施方案中,正交合成酶是经修饰的谷氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的丙氨酸甘氨酸。在一些实施方案中,正交合成酶是经修饰的组氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的亮氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的异亮氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的赖氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的甲硫氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的苯丙氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的脯氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的丝氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的苏氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的色氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的酪氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的缬氨酸合成酶。在一些实施方案中,正交合成酶是经修饰的磷酸丝氨酸合成酶。在一些实施方案中,正交tRNA是经修饰的丙氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的精氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的天冬酰胺tRNA。在一些实施方案中,正交tRNA是经修饰的天冬氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的半胱氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的谷氨酰胺tRNA。在一些实施方案中,正交tRNA是经修饰的谷氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的丙氨酸甘氨酸。在一些实施方案中,正交tRNA是经修饰的组氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的亮氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的异亮氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的赖氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的甲硫氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的苯丙氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的脯氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的丝氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的苏氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的色氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的酪氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的缬氨酸tRNA。在一些实施方案中,正交tRNA是经修饰的磷酸丝氨酸tRNA。
在一些实施方案中,非天然氨基酸通过氨酰(aaRS或RS)-tRNA合成酶-tRNA对掺入蛋白质中。示例性aaRS-tRNA对包括但不限于詹氏甲烷球菌(Mj-Tyr)aaRS/tRNA对、大肠杆菌TyrRS(Ec-Tyr)/嗜热脂肪芽孢杆菌(B.stearothermophilus)tRNACUA对、大肠杆菌LeuRS(Ec-Leu)/嗜热脂肪芽孢杆菌tRNACUA对和吡咯赖氨酰-tRNA对。在一些实例中,非天然氨基酸通过Mj-TyrRS/tRNA对掺入蛋白质中。可以通过Mj-TyrRS/tRNA对掺入的示例性非天然氨基酸(UAA)包括但不限于对位取代的苯丙氨酸衍生物,如对-氨基苯丙氨酸和对-甲氧基苯丙氨酸;间位取代的酪氨酸衍生物,如3-氨基酪氨酸、3-硝基酪氨酸、3,4-二羟基苯丙氨酸和3-碘酪氨酸;苯基硒代半胱氨酸;对-硼苯丙氨酸;以及邻-硝基苄基酪氨酸。
在一些实例中,非天然氨基酸通过Ec-Tyr/tRNACUA或Ec-Leu/tRNACUA对掺入蛋白质中。可以通过Ec-Tyr/tRNACUA或Ec-Leu/tRNACUA对掺入的示例性UAA包括但不限于含有苯甲酮、酮、碘化物或叠氮化物取代基的苯丙氨酸衍生物;O-炔丙基酪氨酸;α-氨基辛酸、O-甲基酪氨酸、O-硝基苄基半胱氨酸;和3-(萘-2-基氨基)-2-氨基-丙酸。
在一些实例中,非天然氨基酸通过吡咯赖氨酰-tRNA对掺入蛋白质中。在一些情况下,PylRS获自古细菌物种,例如获自产甲烷的古细菌。在一些情况下,PylRS获自巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。可以通过吡咯赖氨酰-tRNA对掺入的示例性UAA包括但不限于酰胺和氨基甲酸酯取代的赖氨酸,如2-氨基-6-((R)-四氢呋喃-2-甲酰胺基)己酸、N-ε-D-脯氨酰基-L-赖氨酸和N-ε-环戊基氧基羰基-L-赖氨酸;N-ε-丙烯酰基-L-赖氨酸;N-ε-[(1-(6-硝基苯并[d][1,3]二氧杂环戊烯-5-基)乙氧基)羰基]-L-赖氨酸;和N-ε-(1-甲基环丙-2-烯甲酰氨基)赖氨酸。
在一些实例中,非天然氨基酸通过US 9,988,619和US 9,938,516中公开的合成酶掺入本文所述的蛋白质中。可以通过此类合成酶掺入的示例性UAA包括对-甲基叠氮基-L-苯丙氨酸、芳烷基、杂环基、杂芳烷基非天然氨基酸等。在一些实施方案中,此类UAA包含吡啶基、吡嗪基、吡唑基、三唑基、噁唑基、噻唑基、噻吩基或其他杂环。在一些实施方案中,此类氨基酸包含叠氮化物、四嗪或能够与偶联配偶体(如水溶性部分)缀合的其他化学基团。在一些实施方案中,此类合成酶被表达并用于将UAA在体内掺入蛋白质中。在一些实施方案中,使用无细胞翻译系统如细胞裂解物或纯化组分的重构系统使用此类合成酶将UAA掺入蛋白质中。可以在无细胞系统中或事先在单独反应中用非天然氨基酸装载tRNA(使得装载的tRNA可以直接添加到包含核糖体、mRNA和其他组分的系统中,而无需向系统中添加合成酶或编码合成酶的构建体)。
用于体外翻译的系统例如描述在Zeenko等人,RNA 14:593-602(2008);Spirin,Trends Biotechnol.2004:538-545(2004);以及Endo等人,Curr.Opin.Biotechnol.17:373-380(2006)中。这些系统可以由细胞裂解物(例如,提取物)制备或由纯化的组分重构。除了核糖体、tRNA和本文所述的其他组分外,所述系统还可以包含一种或多种翻译起始因子;ATP;以及一种或多种翻译终止因子。在一些实施方案中,所述系统进一步包含一种或多种分子伴侣,其可以在翻译期间和/或之后辅助新生多肽的折叠。
在一些实例中,将非天然氨基酸通过天然存在的合成酶掺入本文所述的蛋白质中。在一些实施方案中,将非天然氨基酸通过对一种或多种氨基酸营养缺陷的生物体掺入蛋白质中。在一些实施方案中,对应于营养缺陷型氨基酸的合成酶能够将非天然氨基酸装载在对应的tRNA上。在一些实施方案中,非天然氨基酸是硒代半胱氨酸或其衍生物。在一些实施方案中,非天然氨基酸是硒代甲硫氨酸或其衍生物。在一些实施方案中,非天然氨基酸是芳族氨基酸,其中芳族氨基酸包含芳基卤化物,如碘化物。在实施方案中,非天然氨基酸在结构上与营养缺陷型氨基酸类似。
在一些实例中,非天然氨基酸包括图4A中展示的非天然氨基酸。
在一些实例中,非天然氨基酸包括赖氨酸或苯丙氨酸衍生物或类似物。在一些实例中,非天然氨基酸包括赖氨酸衍生物或赖氨酸类似物。在一些实例中,非天然氨基酸包括吡咯赖氨酸(Pyl)。在一些实例中,非天然氨基酸包括苯丙氨酸衍生物或苯丙氨酸类似物。在一些实例中,非天然氨基酸是Wan等人,“Pyrrolysyl-tRNA synthetase:an ordinaryenzyme but an outstanding genetic code expansion tool,”Biocheim BiophysAceta1844(6):1059-4070(2014)中描述的非天然氨基酸。在一些实例中,非天然氨基酸包括图4B和图4C中展示的非天然氨基酸。
在一些实施方案中,非天然氨基酸包括图4D-图4G中展示的非天然氨基酸(采用自Dumas等人,Chemical Science 2015,6,50-69的表1)。
在一些实施方案中,掺入本文所述的蛋白质中的非天然氨基酸在US 9,840,493;US 9,682,934;US 2017/0260137;US 9,938,516;或US 2018/0086734中公开。可以通过此类合成酶掺入的示例性UAA包括对-甲基叠氮基-L-苯丙氨酸、芳烷基、杂环基和杂芳烷基,以及赖氨酸衍生物非天然氨基酸。在一些实施方案中,此类UAA包含吡啶基、吡嗪基、吡唑基、三唑基、噁唑基、噻唑基、噻吩基或其他杂环。在一些实施方案中,此类氨基酸包含叠氮化物、四嗪或能够与偶联配偶体(如水溶性部分)缀合的其他化学基团。在一些实施方案中,UAA包含经由烷基接头附接至芳族部分的叠氮化物。在一些实施方案中,烷基接头是C1-C10接头。在一些实施方案中,UAA包含经由烷基接头附接至芳族部分的四嗪。在一些实施方案中,UAA包含经由氨基附接至芳族部分的四嗪。在一些实施方案中,UAA包含经由烷基氨基附接至芳族部分的四嗪。在一些实施方案中,UAA包含经由烷基链附接至氨基酸侧链的末端氮(例如,赖氨酸衍生物的N6,或包含较短烷基侧链的衍生物的N5、N4或N3)的叠氮化物。在一些实施方案中,UAA包含经由烷基链附接至氨基酸侧链的末端氮的四嗪。在一些实施方案中,UAA包含经由烷基接头附接至酰胺的叠氮化物或四嗪。在一些实施方案中,UAA是3-氨基丙氨酸、丝氨酸、赖氨酸或其衍生物的含有叠氮化物或四嗪的氨基甲酸酯或酰胺。在一些实施方案中,将此类UAA在体内掺入蛋白质中。在一些实施方案中,将此类UAA在无细胞系统中掺入蛋白质中。
细胞类型
在一些实施方案中,使用许多类型的细胞/微生物,例如,用于转化或基因工程化。在一些实施方案中,细胞是真核细胞。在一些情况下,细胞是真核细胞,如培养的动物、植物或人细胞。在另外的情况下,细胞存在于生物体如植物或动物中。
在一些实施方案中,工程化微生物是单细胞生物体,通常能够分裂和增殖。微生物可以包括以下特征中的一种或多种:需氧菌、厌氧菌、丝状、非丝状、单倍体、二倍体、营养缺陷型和/或非营养缺陷型。在某些实施方案中,工程化微生物是非原核微生物。在一些实施方案中,工程化微生物是真核微生物(例如,酵母、真菌、变形虫)。在一些实施方案中,工程化微生物是真菌。在一些实施方案中,工程化生物体是酵母。
可以选择任何合适的酵母作为宿主微生物、工程化微生物、遗传修饰的生物体、或者异源多核苷酸或经修饰的多核苷酸的来源。酵母包括但不限于耶氏酵母属(Yarrowia)酵母(例如,解脂耶氏酵母(Y.lipolytica)(曾归类为解脂假丝酵母(Candidalipolytica)))、假丝酵母属(Candida)酵母(例如,C.revkaufi、维斯假丝酵母(C.viswanathii)、铁红假丝酵母(C.pulcherrima)、热带假丝酵母(C.tropicalis)、产蛋白假丝酵母(C.utilis))、红酵母属(Rhodotorula)酵母(例如,粘红酵母(R.glutinus)、禾本红酵母(R.graminis))、红冬孢酵母属(Rhodosporidium)酵母(例如,圆红冬孢酵母(R.toruloides))、酵母属(Saccharomyces)酵母(例如,酿酒酵母(S.cerevisiae)、贝酵母(S.bayanus)、巴斯德酵母(S.pastorianus)、卡尔酵母(S.carlsbergensis))、隐球酵母属(Cryptococcus)酵母、丝孢酵母属(Trichosporon)酵母(例如,茁芽丝孢酵母(T.pullans)、皮状丝孢酵母(T.cutaneum))、毕赤酵母属(Pichia)酵母(例如,巴斯德毕赤酵母(P.pastoris))和油脂酵母属(Lipomyces)酵母(例如,斯达氏油脂酵母(L.starkeyii)、脂褐质油脂酵母(L.lipoferus))。在一些实施方案中,合适的酵母属于以下属:Arachniotus、曲霉菌属(Aspergillus)、短梗霉属(Aureobasidium)、Auxarthron、芽生菌属(Blastomyces)、假丝酵母属、金孢子菌属(Chrysosporuim)、德巴利酵母属(Debaryomyces)、球孢子菌属(Coccidiodes)、隐球酵母属、裸子囊菌属(Gymnoascus)、汉逊酵母属(Hansenula)、组织胞浆菌属(Histoplasma)、伊萨酵母属(Issatchenkia)、克鲁维酵母属(Kluyveromyces)、油脂酵母属、Lssatchenkia、小孢子菌属(Microsporum)、Myxotrichum、Myxozyma、树粉孢属(Oidiodendron)、管囊酵母属(Pachysolen)、青霉属(Penicillium)、毕赤酵母属、红冬孢酵母属、红酵母属、红酵母属、酵母属、裂殖酵母属(Schizosaccharomyces)、帚霉属(Scopulariopsis)、瘤胞霉属(Sepedonium)、丝孢酵母属或耶氏酵母属。在一些实施方案中,合适的酵母属于一下物种:Arachniotus flavoluteus、黄曲霉菌(Aspergillus flavus)、烟曲霉菌(Aspergillus fumigatus)、黑曲霉菌(Aspergillus niger)、出芽短梗霉菌(Aureobasidium pullulans)、Auxarthronthaxteri、皮炎芽生菌(Blastomyces dermatitidis)、白色假丝酵母(Candida albicans)、都柏林假丝酵母(Candida dubliniensis)、无名假丝酵母(Candida famata)、光滑假丝酵母(Candida glabrata)、吉利蒙假丝酵母(Candida guilliermondii)、乳酒假丝酵母(Candida kefyr)、克鲁斯假丝酵母(Candida krusei)、郎比可假丝酵母(Candidalambica)、解脂假丝酵母、Candida lustitaniae、近平滑假丝酵母(Candidaparapsilosis)、铁红假丝酵母、Candida revkaufi、皱褶假丝酵母(Candida rugosa)、热带假丝酵母、产蛋白假丝酵母、维斯假丝酵母、Candida xestobii、嗜角质金孢子菌(Chrysosporuim keratinophilum)、粗球孢子菌(Coccidiodes immitis)、浅白色隐球酵母扩散型变种(Cryptococcus albidus var.diffluens)、罗伦隐球酵母(Cryptococcuslaurentii)、新型隐球酵母(Cryptococcus neofomans)、汉氏德巴利酵母(Debaryomyceshansenii)、Gymnoascus dugwayensis、异常汉逊酵母(Hansenula anomala)、荚膜组织胞浆菌(Histoplasma capsulatum)、西方伊萨酵母(Issatchenkia occidentalis)、东方伊萨酵母(Isstachenkia orientalis)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、耐热克鲁维酵母(Kluyveromyces thermotolerans)、沃尔提克鲁维酵母(Kluyveromyces waltii)、脂褐质油脂酵母、斯达氏油脂酵母、石膏样小孢子菌(Microsporum gypseum)、Myxotrichum deflexum、棘刺树粉孢(Oidiodendronechinulatum)、嗜鞣管囊酵母(Pachysolen tannophilis)、点青霉(Penicilliumnotatum)、异常毕赤酵母(Pichia anomala)、巴斯德毕赤酵母、树干毕赤酵母(Pichiastipitis)、圆红冬孢酵母、粘红酵母、禾本红酵母、酿酒酵母、克鲁弗酵母(Saccharomyceskluyveri)、粟酒裂殖酵母(Schizosaccharomyces pombe)、顶孢帚霉(Scopulariopsisacremonium)、黄瘤孢菌(Sepedonium chrysospermum)、皮状丝孢酵母、茁芽丝孢酵母、解脂耶氏酵母、或解脂耶氏酵母(曾归类为解脂假丝酵母)。在一些实施方案中,酵母是解脂耶氏酵母菌株,包括但不限于ATCC20362、ATCC8862、ATCC18944、ATCC20228、ATCC76982和LGAM S(7)1菌株(Papanikolaou S.和Aggelis G.,Bioresour.Technol.82(1):43-9(2002))。在某些实施方案中,酵母是假丝酵母属物种(即,假丝酵母属物种)酵母。可以使用任何合适的假丝酵母属物种来产生脂肪二羧酸(例如,辛二酸、癸二酸、十二烷二酸、十四烷二酸、十六烷二酸、十八烷二酸、二十烷二酸),和/或可以针对脂肪二羧酸(例如,辛二酸、癸二酸、十二烷二酸、十四烷二酸、十六烷二酸、十八烷二酸、二十烷二酸)的产生对任何合适的假丝酵母属物种进行遗传修饰。在一些实施方案中,合适的假丝酵母属物种包括但不限于白色假丝酵母、都柏林假丝酵母、无名假丝酵母、光滑假丝酵母、吉利蒙假丝酵母、乳酒假丝酵母、克鲁斯假丝酵母、郎比可假丝酵母、解脂假丝酵母、Candida lustitaniae、近平滑假丝酵母、铁红假丝酵母、Candida revkaufi、皱褶假丝酵母、热带假丝酵母、产蛋白假丝酵母、维斯假丝酵母、Candida xestobii以及本文所述的任何其他假丝酵母属物种酵母。假丝酵母属物种菌株的非限制性例子包括但不限于sAA001(ATCC20336)、sAA002(ATCC20913)、sAA003(ATCC20962)、sAA496(US2012/0077252)、sAA106(US2012/0077252)、SU-2(ura3-/ura3-)、H5343(β氧化阻断的;美国专利号5648247)菌株。可以利用来自假丝酵母属物种酵母的任何合适的菌株作为用于遗传修饰的亲本菌株。
酵母属、物种和菌株的遗传内容通常密切相关,使得可能难以将它们区分、分类和/或命名。在一些情况下,解脂假丝酵母和解脂耶氏酵母的菌株可能难以区分、分类和/或命名,并且在一些情况下,可能被视为相同的生物体。在一些情况下,热带假丝酵母和维斯假丝酵母的各种菌株可能难以区分、分类和/或命名(例如,参见Arie等人,J.Gen.Appl.Microbiol.,46,257-262(2000)。从ATCC以及从其他商业或学术来源获得的一些热带假丝酵母和维斯假丝酵母菌株可以被视为是等同的并且同样适合于本文所述的实施方案。在一些实施方案中,热带假丝酵母和维斯假丝酵母的一些亲本菌株被视为仅名称不同。
可以选择任何合适的真菌作为宿主微生物、工程化微生物或异源多核苷酸的来源。真菌的非限制性例子包括但不限于曲霉菌属真菌(例如,寄生曲霉(A.parasiticus)、构巢曲霉(A.nidulans))、破囊壶菌属(Thraustochytrium)真菌、裂殖壶菌属(Schizochytrium)真菌和根霉属(Rhizopus)真菌(例如,无根根霉(R.arrhizus)、米根霉(R.oryzae)、黑根霉(R.nigricans))。在一些实施方案中,真菌是寄生曲霉菌株,包括但不限于菌株ATCC24690,并且在某些实施方案中,真菌是构巢曲霉菌株,包括但不限于菌株ATCC38163。
可以利用来自非微生物生物体的细胞作为宿主微生物、工程化微生物或异源多核苷酸的来源。此类细胞的例子包括但不限于昆虫细胞(例如,果蝇属(Drosophila)(例如,黑腹果蝇(D.melanogaster))、斜纹夜蛾属(Spodoptera)(例如,草地贪夜蛾(S.frugiperda)Sf9或Sf21细胞)和粉夜蛾属(Trichoplusa)(例如,High-Five细胞);线虫细胞(例如,秀丽隐杆线虫(C.elegans)细胞);禽类细胞;两栖动物细胞(例如,非洲爪蟾(Xenopus laevis)细胞);爬虫类动物细胞;哺乳动物细胞(例如,NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、Bowes黑色素瘤和HeLa细胞);以及植物细胞(例如,拟南芥(Arabidopsis thaliana)、烟草(Nicotania tabacum)、Cuphea acinifolia、Cuphea aequipetala、小叶萼距花(Cupheaangustifolia)、Cuphea appendiculata、Cuphea avigera、Cuphea avigeravar.pulcherrima、Cuphea axilliflora、巴菲萼距花(Cuphea bahiensis)、Cupheabaillonis、Cuphea brachypoda、Cuphea bustamanta、Cuphea calcarata、Cupheacalophylla、Cuphea calophylla subsp.mesostemon、Cuphea carthagenensis、圆叶萼距花(Cuphea circaeoides)、Cuphea confertiflora、心叶萼距花(Cuphea cordata)、Cupheacrassiflora、蓝斑萼距草(Cuphea cyanea)、Cuphea decandra、粗齿萼距花(Cupheadenticulata)、Cuphea disperma、Cuphea epilobiifolia、Cuphea ericoides、黄色萼距花(Cuphea flava)、Cuphea flavisetula、Cuphea fuchsiifolia、Cuphea gaumeri、Cupheaglutinosa、异叶萼距花(Cuphea heterophylla)、萼距花(Cuphea hookeriana)、细叶萼距花(Cuphea hyssopifolia)(墨西哥石楠花)、Cuphea hyssopoides、火红萼距花(Cupheaignea)、Cuphea ingrata、Cuphea jorullensis、披针叶萼距花(Cuphea lanceolata)、Cuphea linarioides、Cuphea llavea、Cuphea lophostoma、金黄萼距花(Cuphea lutea)、浅黄萼距花(Cuphea lutescens)、Cuphea melanium、Cuphea melvilla、小花萼距花(Cuphea micrantha)、小瓣萼距花(Cuphea micropetala)、Cuphea mimuloides、Cupheanitidula、沼泽萼距花(Cuphea palustris)、Cuphea parsonsia、Cuphea pascuorum、寡瓣萼距花(Cuphea paucipetala)、平卧萼距花(Cuphea procumbens)、Cuphea pseudosilene、Cuphea pseudovaccinium、美丽萼距花(Cuphea pulchra)、总状萼距花(Cuphearacemosa)、匍匐萼距花(Cuphea repens)、柳叶萼距花(Cuphea salicifolia)、Cupheasalvadorensis、Cuphea schumannii、无柄萼距花(Cuphea sessiliflora)、Cupheasessilifolia、刚毛萼距花(Cuphea setosa)、Cuphea spectabilis、Cuphea spermacoce、Cuphea splendida、Cuphea splendida var.viridiflava、Cuphea strigulosa、Cupheasubuligera、Cuphea teleandra、Cuphea thymoides、Cuphea tolucana、Cuphea urens、Cuphea utriculosa、蓝叶柄萼距花(Cuphea viscosissima)、Cuphea watsoniana、Cupheawrightii、披针叶萼距花)。
用作宿主生物体或异源多核苷酸的来源的微生物或细胞可在市场购得。本文所述的微生物和细胞以及其他合适的微生物和可以从例如以下获得:Invitrogen Corporation(卡尔斯巴德,加利福尼亚州)、美国典型培养物保藏中心(马纳萨斯,维吉尼亚州)和农业研究培养物保藏中心(NRRL;皮奥瑞亚,伊利诺伊州)。宿主微生物和工程化微生物可以以任何合适的形式来提供。例如,此类微生物可以以液体培养物或固体培养物(例如,基于琼脂的培养基)来提供,其可以是原代培养物或者可以已经传代(例如,稀释并培养)一次或多次。微生物还可以以冷冻形式或干燥形式(例如,冻干的)来提供。微生物可以以任何合适的浓度来提供。
核酸试剂和工具
用于本文所述的方法、细胞或工程化微生物的核苷酸和/或核酸试剂(或多核苷酸)包含具有或不具有非天然核苷酸的一个或多个ORF。ORF可以来自任何合适的来源,有时来自基因组DNA、mRNA、逆转录RNA或互补DNA(cDNA)或包含前述一种或多种的核酸文库,并且来自含有目的核酸序列、目的蛋白质或目的活性的任何生物体物种。可以从其获得ORF的生物体的非限制性例子包括例如细菌、酵母、真菌、人、昆虫、线虫、牛类、马类、犬类、猫类、大鼠或小鼠。在一些实施方案中,本文所述的核苷酸和/或核酸试剂或其他试剂是分离的或纯化的。可以通过已公布的体外方法创建包含非天然核苷酸的ORF。在一些情况下,核苷酸或核酸试剂包含非天然核碱基。
核酸试剂有时包含与ORF相邻的核苷酸序列,其与ORF结合翻译并编码氨基酸标签。编码标签的核苷酸序列位于核酸试剂中ORF的3'和/或5',由此编码由ORF编码的蛋白质或肽的C末端或N末端的标签。可以利用不消除体外转录和/或翻译的任何标签,并且可以由技术人员适当地选择。标签可以促进从培养物或发酵培养基分离和/或纯化所需ORF产物。在一些实例中,将核酸试剂文库与本文所述的方法和组合物一起使用。例如,文库中存在至少100、1000、2000、5000、10,000或多于50,000种独特多核苷酸的文库,其中每种多核苷酸包含至少一种非天然核碱基。
具有或不具有非天然核苷酸的核酸或核酸试剂可以包含通常根据核酸的计划用途选择的某些元件,例如,调节元件。核酸试剂中可以包括或排除以下元件中的任一种。例如,核酸试剂可以包括以下核苷酸元件中的一种或多种或全部:一种或多种启动子元件、一个或多个5'非翻译区(5'UTR)、一个或多个可以插入靶核苷酸序列的区域(“插入元件”)、一种或多种靶核苷酸序列、一个或多个3'非翻译区(3'UTR)以及一种或多种选择元件。核酸试剂可以提供有一种或多种此类元件,并且可以在将核酸引入所需生物体中之前将其他元件插入核酸中。在一些实施方案中,所提供的核酸试剂包含启动子、5'UTR、可选的3'UTR和一种或多种插入元件,通过所述插入元件将靶核苷酸序列插入(即,克隆)至核酸试剂中。在某些实施方案中,所提供的核酸试剂包含启动子、一种或多种插入元件和可选的3'UTR,并且用可选的3'UTR插入5'UTR/靶核苷酸序列。所述元件可以按适合于在所选表达系统中表达(例如,在所选生物体中的表达,或者例如在无细胞系统中的表达)的任何顺序排列,并且在一些实施方案中,核酸试剂在5'至3'方向上包含以下元件:(1)启动子元件、5'UTR和一种或多种插入元件;(2)启动子元件、5'UTR和靶核苷酸序列;(3)启动子元件、5'UTR、一种或多种插入元件和3'UTR;以及(4)启动子元件、5'UTR、靶核苷酸序列和3'UTR。在一些实施方案中,可以优化UTR以改变或增加完全天然或含有非天然核苷酸的ORF的转录或翻译。
在一些情况下,包含本文所述的核碱基的核酸(例如,mRNA)包含增强mRNA体内(例如,在真核细胞或真核SSO中)的稳定性的5'UTR和/或3'UTR。在一些实例中,5'UTR或3'UTR或二者经工程化以减少体内mRNA降解或衰变。增强mRNA在本文公开的真核系统中的稳定性的5'UTR和3'UTR的非限制性例子是CS2 3'UTR和5'UTR。在一些实施方案中,与未另外修饰的包含本文所述的核碱基的mRNA相比,修饰mRNA以降低mRNA的聚(A)尾的去除率。在一些实施方案中,顺式作用富AU元件(ARE)被阻断以免于促进mRNA衰变的细胞内和细胞外信号传导。在一些实施方案中,从mRNA中去除mRNA中的提前终止密码子以减少mRNA的无义介导的衰变(NMD)。
在一些情况下,5'UTR和/或3'UTR增加mRNA直接或间接翻译成多肽。5'UTR或3'UTR如何直接影响mRNA翻译成多肽的非限制性例子包括RNA结合蛋白的募集,所述RNA结合蛋白结合5'或3'顺式元件并且进行核糖体或效应蛋白(例如,mRNA脱腺苷酶、脱帽酶)的募集。5'UTR或3'UTR如何间接影响mRNA翻译成多肽的非限制性例子包括阻断或增强RNA结合蛋白与5'UTR区或3'UTR区的结合的5'UTR和3'UTR二级结构的形成,以及mRNA亚细胞定位。
在一些实施方案中,相对于未工程化的含有核碱基的mRNA的翻译效率,5'UTR和/或3'UTR增加mRNA在体外或体内的翻译效率。在一些实施方案中,通过工程化mRNA以减少在扫描期间核糖体跳过选择的AUG(起始密码子)来增加翻译效率。在一些实施方案中,mRNA包含改善起始密码子识别的序列元件,如Kozak序列或其变体。在一些实施方案中,mRNA的5'UTR经工程化以降低总鸟嘌呤-胞嘧啶(GC)含量。
在一些实施方案中,减少了涉及5'UTR内的AUG起始密码子的mRNA中的二级结构(例如,RNA G-四联体结构,RG4)的形成,从而增加了从所述AUG翻译的效率。在一些实施方案中,5'UTR经工程化以相对于未工程化的mRNA具有负折叠自由能(ΔG)。在一些实施方案中,ΔG是至多-40、-41、-42、-43、-44、-45、-46、-47、-48、-49、-50、-51、-52、-53、-54、-55、-56、-57、-58、-59或-60。在一些实施方案中,mRNA在5'UTR或3'UTR处经化学修饰以促进翻译效率。在一些实施方案中,所述化学修饰是N6-甲基腺苷。在体外系统(例如,工程化真核细胞或半合成生物体)中,eIF4A(与eIF3B和eIF4H协作促进RNA二级结构的解旋的eIF4F复合体的亚基)的过表达增加mRNA的翻译效率。在一些实施方案中,促进mRNA的二级结构形成的稳定蛋白(例如,脆性X智力迟钝蛋白(FMRP))的敲除或敲低减少二级结构的形成,从而增加mRNA的翻译效率。在一些实施方案中,将反式作用剂(例如,RNA、小分子、蛋白质)引入细胞(例如,真核细胞)中以促进mRNA的翻译。
在一些实例中,5'UTR和/或3'UTR促进mRNA的亚细胞定位,从而促进mRNA在体内的翻译。在一些实施方案中,修饰3'UTR或5'UTR顺式作用元件如mRNA zip编码,使得mRNA zip编码被zip编码结合蛋白(例如,Staufen)的结合被阻遏或增强,从而增加mRNA的翻译效率。
核酸试剂(例如,表达盒和/或表达载体(例如,用于表达异源tRNA合成酶))可以包括多种调节元件,包括启动子、增强子、翻译起始序列、转录终止序列和其他元件。“启动子”通常是一个或多个DNA序列,其在位于关于转录起始位点的相对固定位置时发挥作用。例如,启动子可以位于核苷三磷酸转运蛋白核酸区段的上游。“启动子”含有RNA聚合酶与转录因子的基础相互作用所需的核心元件,并且可以含有上游元件和反应元件。“增强子”通常是指DNA序列,其不在转录起始位点的固定距离处发挥作用,并且可以位于转录单元的5'或3”。此外,增强子可以在内含子内以及在编码序列本身内。增强子的长度通常在10与300之间,并且它们顺式作用。增强子发挥作用以增加来自附近启动子的转录。增强子像启动子一样,通常也含有介导转录调节的反应元件。增强子通常决定表达的调节,并且可以用于改变或优化ORF(包括完全天然或含有非天然核苷酸的ORF)表达。
如上所述,核酸试剂还可以包含一个或多个5'UTR以及一个或多个3'UTR。例如,真核宿主细胞(例如,酵母、真菌、昆虫、植物、动物、人或有核细胞)和原核宿主细胞(例如,病毒、细菌)中使用的表达载体可以含有针对转录终止进行信号传导的序列,所述序列可能影响mRNA表达。这些区域可以被转录为编码组织因子蛋白的mRNA的非翻译部分中的多腺苷酸化区段。3'非翻译区还包括转录终止位点。在一些优选实施方案中,转录单元包含多腺苷酸化区域。这个区域的一个益处在于,它增加像mRNA一样处理并转运所转录单元的可能性。表达构建体中的多腺苷酸化信号的鉴定和使用是众所周知的。在一些优选实施方案中,同源多腺苷酸化信号可以用于转基因构建体中。
5'UTR可以包含对于其所源自的核苷酸序列为内源的一种或多种元件,并且有时包括一种或多种外源元件。5'UTR可以源自任何合适的核酸,如基因组DNA、质粒DNA、RNA或mRNA,例如,源自任何合适的生物体(例如,病毒、细菌、酵母、真菌、植物、昆虫或哺乳动物)。技术人员可以基于所选表达系统(例如,在所选生物体中的表达,或者例如在无细胞系统中的表达)选择用于5'UTR的适当元件。5'UTR有时包含技术人员已知的以下元件中的一种或多种:增强子序列(例如,转录或翻译)、转录起始位点、转录因子结合位点、翻译调节位点、翻译起始位点、翻译因子结合位点、辅助蛋白结合位点、反馈调节剂结合位点、普里布诺盒(Pribnow box)、TATA盒、-35元件、E-盒(螺旋-环-螺旋结合元件)、核糖体结合位点、复制子、内部核糖体进入位点(IRES)、沉默子元件等。在一些实施方案中,可以分离启动子元件,使得适当的条件性调节所需的所有5'UTR元件都含于启动子元件片段中,或者启动子元件片段的功能性子序列内。
核酸试剂中的5'UTR可以包含翻译增强子核苷酸序列。翻译增强子核苷酸序列通常位于核酸试剂中的启动子与靶核苷酸序列之间。翻译增强子序列通常结合至核糖体,有时是18S rRNA结合核糖核苷酸序列(即,40S核糖体结合序列),并且有时是内部核糖体进入序列(IRES)。IRES通常形成具有精确放置的RNA三级结构的RNA支架,所述RNA三级结构经由多种特定分子间相互作用接触40S核糖体亚基。核糖体增强子序列的例子是已知的并且可以由技术人员鉴定(例如,Mignone等人,Nucleic Acids Research 33:D141-D146(2005);Paulous等人,Nucleic Acids Research 31:722-733(2003);Akbergenov等人,NucleicAcids Research 32:239-247(2004);Mignone等人,Genome Biology 3(3):reviews0004.1-0001.10(2002);Gallie,Nucleic Acids Research 30:3401-3411(2002);Shaloiko等人,DOI:10.1002/bit.20267;和Gallie等人,Nucleic Acids Research 15:3257-3273(1987))。
翻译增强子序列有时是真核序列,如Kozak共有序列或其他序列(例如,水螅体序列,GenBank登录号U07128)。翻译增强子序列有时是原核序列,如Shine-Dalgarno共有序列。在某些实施方案中,翻译增强子序列是病毒核苷酸序列。翻译增强子序列有时来自植物病毒的5'UTR,所述植物病毒如例如烟草花叶病毒(TMV)、苜蓿花叶病毒(AMV);烟草蚀纹病毒(ETV);马铃薯Y病毒(PVY);芜菁花叶(poty)病毒和豌豆种传花叶病毒。在某些实施方案中,在核酸试剂中包括来自TMV的长度约67个碱基的ω序列作为翻译增强子序列(例如,缺乏鸟苷核苷酸并且包括长度为25个核苷酸的聚(CAA)中心区域)。
3'UTR可以包含对于其所源自的核苷酸序列为内源的一种或多种元件,并且有时包括一种或多种外源元件。3'UTR可以源自任何合适的核酸,如基因组DNA、质粒DNA、RNA或mRNA,例如,源自任何合适的生物体(例如,病毒、细菌、酵母、真菌、植物、昆虫或哺乳动物)。技术人员可以基于所选表达系统(例如,在所选生物体中的表达)选择用于3'UTR的适当元件。3'UTR有时包含技术人员已知的以下元件中的一种或多种:转录调节位点、转录起始位点、转录终止位点、转录因子结合位点、翻译调节位点、翻译终止位点、翻译起始位点、翻译因子结合位点、核糖体结合位点、复制子、增强子元件、沉默子元件和聚腺苷尾。3'UTR通常包括聚腺苷尾并且有时不包括,并且如果存在聚腺苷尾,可以在其中添加或缺失一个或多个腺苷部分(例如,可以添加或减去约5、约10、约15、约20、约25、约30、约35、约40、约45或约50个腺苷部分)。
在一些实施方案中,使用5'UTR和/或3'UTR的修饰改变(例如,增加、添加、降低或基本上消除)启动子的活性。通过来自可操作地连接的包含经修饰的5'或3'UTR的启动子元件的一个或多个目的核苷酸序列的转录的改变,启动子活性的改变又可以改变肽、多肽或蛋白质的活性(例如,酶活性)。例如,在某些实施方案中,微生物可以通过遗传修饰来工程化以表达包含经修饰的5'或3'UTR的核酸试剂,所述经修饰的5'或3'UTR可以添加新型活性(例如,通常在宿主生物体中没有发现的活性),或者通过增加来自与目的核苷酸序列(例如,目的同源或异源核苷酸序列)可操作地连接的同源或异源启动子的转录来增加现有活性的表达。在一些实施方案中,在某些实施方案中,微生物可以通过遗传修饰来工程化以表达包含经修饰的5'UTR或3'UTR的核酸试剂,所述经修饰的5'UTR或3'UTR可以通过降低或基本上消除来自与目的核苷酸序列可操作地连接的同源或异源启动子的转录来降低活性的表达。
由表达盒或表达载体表达异源多肽如tRNA合成酶可以通过能够在原核细胞或真核细胞中表达的任何启动子来控制。DNA合成和/或RNA合成典型地需要启动子元件。启动子元件通常包含可以促进特定基因转录的DNA区域,通过提供对应于基因的RNA合成的起始位点来促进。在一些实施方案中,启动子通常位于其所调节的基因附近,位于基因上游(例如,基因的5'),并且与基因的有义链在相同的DNA链上。在一些实施方案中,启动子元件可以从基因或生物体分离,并且经插入而与多核苷酸序列呈功能性连接,以允许改变和/或调节表达。用于核酸表达的非天然启动子(例如,通常与给定的核酸序列无关的启动子)通常被称为异源启动子。在某些实施方案中,异源启动子和/或5'UTR可以经插入而与编码如本文所述的具有所需活性的多肽的多核苷酸呈功能性连接。如本文关于启动子所用的术语“可操作地连接”和“与……呈功能性连接”是指编码序列与启动子元件之间的关系。在启动子元件调节或控制编码序列经由转录的表达时,启动子与编码序列可操作地连接或呈功能性连接。术语“可操作地连接”和“与……呈功能性连接”在本文中关于启动子元件可互换使用。
启动子通常与RNA聚合酶相互作用。聚合酶是催化使用预先存在的核酸试剂合成核酸的酶。在模板是DNA模板时,转录RNA分子后合成蛋白质。具有适合于在本方法中使用的聚合酶活性的酶包括在使用所选模板合成蛋白质的所选系统中有活性的任何聚合酶。在一些实施方案中,启动子(例如,异源启动子)在本文中也称为启动子元件,可以与核苷酸序列或开放阅读框(ORF)可操作地连接。从启动子元件转录可以催化对应于与所述启动子可操作地连接的核苷酸序列或ORF序列的RNA的合成,这又导致所需肽、多肽或蛋白质的合成。
启动子元件有时展现对调节性控制的反应性。启动子元件有时还可以通过选择剂来调节。也就是说,来自启动子元件的转录有时可以响应于环境、营养或内部条件或信号的变化而被打开、关闭、上调或下调(例如,热诱导性启动子、光调节的启动子、反馈调节的启动子、激素影响的启动子、组织特异性启动子、氧和pH影响的启动子、对选择剂(例如,卡那霉素)有反应的启动子等)。受环境、营养或内部信号影响的启动子经常受在启动子处或附近结合并且增加或减少靶序列在某些条件下的表达的信号(直接的或间接的)影响。在采用本文公开的所有方法的情况下,包含天然或经修饰的启动子可以用于改变或优化完全天然的ORF(例如aaRS)或含有非天然核苷酸的ORF(例如mRNA或tRNA)的表达。
本文所述的实施方案中使用的影响从启动子元件转录的选择剂或调节剂的非限制性例子包括而不限于:(1)编码提供针对原本有毒的化合物(例如,抗生素)的抗性的产物的核酸区段;(2)编码原本在受体细胞中缺少的产物(例如,必需产物、tRNA基因、营养缺陷型标记)的核酸区段;(3)编码遏制基因产物的活性的产物的核酸区段;(4)编码可能易于鉴定的产物(例如,表型标记如抗生素(例如,β-内酰胺酶)、β-半乳糖苷酶、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)、青色荧光蛋白(CFP)和细胞表面蛋白)的核酸区段;(5)结合原本对细胞存活和/或功能有害的产物的核酸区段;(6)原本抑制上文1-5号中所述的任何核酸区段的活性的核酸区段(例如,反义寡核苷酸);(7)结合修饰底物的产物(例如,限制内切核酸酶)的核酸区段;(8)可以用于分离或鉴定所需分子的核酸区段(例如,特异性蛋白质结合位点);(9)编码可能原本无功能的特定核苷酸序列(例如,用于分子的子群体的PCR扩增)的核酸区段;(10)在不存在时直接或间接赋予对特定化合物的抗性或敏感性的核酸区段;(11)编码在受体细胞中有毒或将相对无毒化合物转化为毒性化合物的产物(例如,单纯疱疹胸苷激酶、胞嘧啶脱氨酶)的核酸区段;(12)抑制核酸分子的复制、分配或遗传力的核酸区段,所述核酸分子含有所述核酸区段;(13)编码条件复制功能(例如,在某些宿主或宿主细胞株系中或在某些环境条件(例如,温度、营养条件等)下复制)的核酸区段;和/或(14)编码包含非天然核苷酸的一种或多种mRNA或tRNA的核酸。在一些实施方案中,可以添加调节或选择剂以改变生物体所经受的现有生长条件(例如,在液体培养中生长,在发酵罐中生长、在固体营养板上生长等)。
在一些实施方案中,启动子元件的调节可以用于改变(例如,增加、添加、降低或基本上消除)肽、多肽或蛋白质的活性(例如,酶活性)。例如,在某些实施方案中,微生物可以通过遗传修饰进行工程化以表达核酸试剂,所述核酸试剂可以添加新型活性(例如,通常在宿主生物体中未发现的活性),或者通过增加来自与目的核苷酸序列(例如,同源或异源目的核苷酸序列)可操作地连接的同源或异源启动子的转录来增加现有活性的表达。在一些实施方案中,在某些实施方案中,微生物可以通过遗传修饰进行工程化以表达核酸试剂,所述核酸试剂可以通过降低或基本上消除来自与目的核苷酸序列可操作地连接的同源或异源启动子的转录来降低活性的表达。
可以将编码异源蛋白(例如,tRNA合成酶)的核酸插入或用于任何合适的表达系统中。在一些实施方案中,在某些实施方案中,核酸试剂有时被稳定整合至宿主生物体的染色体中,或者核酸试剂可以是宿主染色体的一部分的缺失(例如,遗传修饰的生物体,其中宿主基因组的改变赋予选择性或优先维持携带所述遗传修饰的所需生物体的能力)。此类核酸试剂(例如,核酸或遗传修饰的生物体,其改变的基因组赋予所述生物体以可选性状)可以针对其指导所希望的蛋白质或核酸分子的产生的能力加以选择。在希望时,可以改变核酸试剂使得密码子编码:(i)相同的氨基酸,使用与在天然序列中所指定的不同的tRNA,或(ii)与正常的不同的氨基酸,包括非常规或非天然氨基酸(包括可检测地标记的氨基酸)。
重组表达是使用可以作为载体如质粒的一部分的表达盒有效地完成。载体可以包括与核酸可操作地连接的启动子。载体还可以包括如本文所述的转录和翻译所需的其他元件。表达盒、表达载体以及盒或载体中的序列对于与非天然核苷酸接触的细胞可以是异源的。
可以产生适于携带、编码和/或表达异源蛋白质如tRNA合成酶的多种原核和真核表达载体。此类表达载体包括例如pET、pET3d、pCR2.1、pBAD、pUC和酵母载体。所述载体可以用于例如多种体内和体外情况中。可以使用的原核启动子的非限制性例子包括SP6、T7、T5、tac、bla、trp、gal、lac或麦芽糖启动子。可以使用的真核启动子的非限制性例子包括组成性启动子,例如,病毒启动子,如CMV、SV40和RSV启动子;以及可调节启动子,例如,可诱导或可阻遏启动子,如tet启动子、hsp70启动子和通过CRE调节的合成启动子。用于细菌表达的载体包括pGEX-5X-3,并且用于真核表达的载体包括pCIneo-CMV。可以采用的病毒载体包括与以下相关的那些:慢病毒、腺病毒、腺相关病毒、疱疹病毒、牛痘病毒、小儿麻痹症病毒、AIDS病毒、神经元营养病毒、辛德毕斯病毒和其他病毒。另外有用的是共享这些病毒的特性而使它们适于用作载体的任何病毒家族。可以采用的逆转录病毒载体包括以下文献中所述的那些:Verma,American Society for Microbiology,第229-232页,华盛顿,(1985)。例如,此类逆转录病毒载体可以包括莫洛尼鼠白血病病毒、MMLV和表达期望特性的其他逆转录病毒。典型地,病毒载体含有非结构性早期基因、结构性晚期基因、RNA聚合酶III转录物、复制和衣壳化所需的反向末端重复序列,以及控制病毒基因组的转录和复制的启动子。在作为载体工程化时,病毒典型地去除一个或多个早期基因,并且将基因或基因/启动子盒插入病毒基因组中代替所去除的病毒核酸。
克隆
可以利用本领域中已知的任何便利克隆策略将元件如ORF掺入核酸试剂中。可以利用已知方法将元件插入与插入元件无关的模板中,如:(1)在一个或多个现有限制酶位点处切割模板并连接目的元件,以及(2)通过使包括一个或多个合适的限制酶位点的寡核苷酸引物杂交将限制酶位点添加至模板,并通过聚合酶链式反应进行扩增(本文中更详细地描述)。其他克隆策略利用存在于或插入核酸试剂中的一个或多个插入位点,如例如用于PCR的寡核苷酸引物杂交位点,以及本文所述的其他位点。在一些实施方案中,克隆策略可以与遗传操纵如重组(例如,将具有目的核酸序列的核酸试剂重组至要修饰的生物体的基因组中,如本文进一步描述)组合。在一些实施方案中,一个或多个克隆的ORF可以通过用一个或多个目的ORF将微生物工程化来产生(直接地或间接地)修饰的或野生型聚合酶,所述微生物包含改变的聚合酶活性的活性。
可以通过使核酸与一种或多种特异性切割剂接触将所述核酸特异性切割。特异性切割剂通常将根据特定核苷酸序列在特定位点进行特异性切割。酶特异性切割剂的例子包括而不限于内切核酸酶(例如,DNA酶(例如,DNA酶I、DNA酶II);RNA酶(例如,RNA酶E、RNA酶F、RNA酶H、RNA酶P);CleavaseTM酶;Taq DNA聚合酶;大肠杆菌DNA聚合酶I和真核结构特异性内切核酸酶;鼠FEN-1内切核酸酶;I、II或III型限制内切核酸酶,如Acc I、Afl III、Alu I、Alw44 I、Apa I、Asn I、Ava I、Ava II、BamH I、Ban II、Bcl I、Bgl I、Bgl II、Bln I、BsaI、Bsm I、BsmBI、BssH II、BstE II、Cfo I、CIa I、Dde I、Dpn I、Dra I、EcIX I、EcoR I、EcoRI、EcoR II、EcoR V、Hae II、Hae II、Hind II、Hind III、Hpa I、Hpa II、Kpn I、Ksp I、MluI、MIuN I、Msp I、Nci I、Nco I、Nde I、Nde II、Nhe I、Not I、Nru I、Nsi I、Pst I、Pvu I、Pvu II、Rsa I、Sac I、Sal I、Sau3AI、Sca I、ScrF I、Sfi I、Sma I、Spe I、Sph I、Ssp I、Stu I、Sty I、Swa I、Taq I、Xba I、Xho I);糖基化酶(例如,尿嘧啶-DNA糖基化酶(UDG)、3-甲基腺嘌呤DNA糖基化酶、3-甲基腺嘌呤DNA糖基化酶II、嘧啶水合物-DNA糖基化酶、FaPy-DNA糖基化酶、胸腺嘧啶错配-DNA糖基化酶、次黄嘌呤-DNA糖基化酶、5-羟甲基尿嘧啶DNA糖基化酶(HmUDG)、5-羟甲基胞嘧啶DNA糖基化酶或1,N6-亚乙烯基-腺嘌呤DNA糖基化酶);外切核酸酶(例如,外切核酸酶III);核酶;以及DNA酶。样品核酸可以用化学剂处理,或者使用经修饰的核苷酸合成,并且可以切割经修饰的核酸。在非限制性例子中,样品核酸可以用以下处理:(i)烷化剂,如甲基亚硝脲,其产生若干种烷化碱基,包括N3-甲基腺嘌呤和N3-甲基鸟嘌呤,所述烷化碱基被烷基嘌呤DNA-糖基化酶识别并切割;(ii)亚硫酸氢钠,其引起DNA中的胞嘧啶残基发生脱氨以形成尿嘧啶残基,所述尿嘧啶残基可以被尿嘧啶N-糖基化酶切割;以及(iii)将鸟嘌呤转化为其氧化形式8-羟基鸟嘌呤的化学剂,所述8-羟基鸟嘌呤可以被甲酰胺基嘧啶DNA N-糖基化酶切割。化学切割过程的例子包括而不限于烷化(例如,硫代磷酸酯修饰的核酸的烷化);含有P3'-N5'-氨基磷酸酯的核酸的酸不稳定性的切割;以及核酸的四氧化锇和哌啶处理。
在一些实施方案中,核酸试剂包括一个或多个重组酶插入位点。重组酶插入位点是核酸分子上的识别序列,其参与重组蛋白的整合/重组反应。例如,Cre重组酶的重组位点是loxP,它是34碱基对序列,由在8碱基对核心序列侧翼的两个13碱基对反向重复序列(用作重组酶结合位点)构成(例如,Sauer,Curr.Opin.Biotech.5:521-527(1994))。重组位点的其他例子包括attB、attP、attL和attR序列以及其突变体、片段、变体和衍生物,它们由重组蛋白λInt以及由辅助蛋白整合宿主因子(IHF)、FIS和切除酶(Xis)识别(例如,美国专利号5,888,732;6,143,557;6,171,861;6,270,969;6,277,608;和6,720,140;美国专利申请号09/517,466和09/732,914;美国专利公开号US2002/0007051;以及Landy,Curr.Opin.Biotech.3:699-707(1993))。
克隆核酸的重组酶的例子在系统(Invitrogen,加利福尼亚州)中,所述系统包括至少一个重组位点以用于在体内或在体外克隆所需核酸分子。在一些实施方案中,所述系统利用含有至少两个不同的位点特异性重组位点的载体,所述重组位点通常基于噬菌体λ系统(例如,att1和att2),并且是从野生型(att0)位点突变的。每个突变的位点对其相同类型的同源配偶体att位点(即,其结合配偶体重组位点)具有独特的特异性(例如,attB1对attP1,或者attL1对attR1),并且不会与其他突变类型的重组位点或与野生型att0位点交叉反应。不同的位点特异性允许所需分子的定向克隆或连接,从而提供所克隆分子的所希望的取向。使用系统通过替代受体质粒分子上侧翼为att位点的可选标记(例如,ccdB)对侧翼为重组位点的核酸片段进行克隆和亚克隆,所述受体质粒分子有时称为目标载体(Destination Vector)。然后通过转化ccdB敏感性宿主菌株和对受体分子上的标记进行阳性选择来选择所希望的克隆。用于阴性选择(例如,使用毒性基因)的类似策略可以用于其他生物体中,如胸苷激酶(TK)用于哺乳动物和昆虫中。
核酸试剂有时含有一个或多个复制起点(ORI)元件。在一些实施方案中,模板包含两个或更多个ORI,其中一个ORI在一种生物体(例如,细菌)中高效发挥作用,并且另一个ORI在另一种生物体(例如,真核生物,如例如酵母)中高效发挥作用。在一些实施方案中,ORI可以在一个物种(例如,酿酒酵母)中高效发挥作用,并且另一个ORI可以在不同的物种(例如,粟酒裂殖酵母)中高效发挥作用。核酸试剂有时还包括一个或多个转录调节位点。
核酸试剂(例如,表达盒或载体)可以包括编码标记产物的核酸序列。标记产物用于确定是否已经将基因递送至细胞,以及一旦已被递送,则确定基因是否被表达。标记基因的例子包括编码β-半乳糖苷酶的大肠杆菌lacZ基因和绿色荧光蛋白。在一些实施方案中,标记可以是可选标记。在将此类可选标记成功转移至宿主细胞中时,转化的宿主细胞在被置于选择压力下时可以存活。有两个广泛使用的不同类别的选择方案。第一个类别基于细胞的代谢和突变体细胞系的使用,所述突变体细胞系缺少独立于补充的培养基生长的能力。第二个类别是显性选择,它是指用于任何细胞类型并且不需要使用突变体细胞系的选择方案。这些方案典型地使用药物来阻止宿主细胞的生长。具有新型基因的那些细胞会表达传递抗药性的蛋白质并且会在选择中存活。此类显性选择的例子使用药物新霉素(Southern等人,J.Molec.Appl.Genet.1:327(1982))、霉酚酸(Mulligan等人,Science209:1422(1980))或潮霉素(Sugden等人,Mol.Cell.Biol.5:410-413(1985))。
核酸试剂可以包括一个或多个选择元件(例如,用于选择核酸试剂的存在,并且不用于激活可以被选择性调节的启动子元件的元件)。选择元件通常使用已知过程用于确定细胞中是否包括核酸试剂。在一些实施方案中,核酸试剂包括两个或更多个选择元件,其中一个选择元件在一种生物体中高效发挥作用,并且另一个选择元件在另一种生物体中高效发挥作用。选择元件的例子包括但不限于:(1)编码提供针对原本有毒的化合物(例如,抗生素)的抗性的产物的核酸区段;(2)编码原本在受体细胞中缺少的产物(例如,必需产物、tRNA基因、营养缺陷型标记)的核酸区段;(3)编码遏制基因产物的活性的产物的核酸区段;(4)编码可能易于鉴定的产物(例如,表型标记如抗生素(例如,β-内酰胺酶)、β-半乳糖苷酶、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)、青色荧光蛋白(CFP)和细胞表面蛋白)的核酸区段;(5)结合原本对细胞存活和/或功能有害的产物的核酸区段;(6)原本抑制上文1-5号中所述任何核酸区段的活性的核酸区段(例如,反义寡核苷酸);(7)结合修饰底物的产物(例如,限制内切核酸酶)的核酸区段;(8)可以用于分离或鉴定所需分子的核酸区段(例如,特异性蛋白质结合位点);(9)编码可能原本无功能的特定核苷酸序列(例如,用于分子的子群体的PCR扩增)的核酸区段;(10)在不存在时直接或间接赋予对特定化合物的抗性或敏感性的核酸区段;(11)编码在受体细胞中有毒或将相对无毒化合物转化为毒性化合物的产物(例如,单纯疱疹胸苷激酶、胞嘧啶脱氨酶)的核酸区段;(12)抑制核酸分子的复制、分配或遗传力的核酸区段,所述核酸分子含有所述核酸区段;和/或(13)编码条件复制功能(例如,在某些宿主或宿主细胞株系中或在某些环境条件(例如,温度、营养条件等)下复制)的核酸区段。
核酸试剂可以呈用于体内转录和/或翻译的任何形式。核酸有时是质粒如超螺旋质粒,有时是酵母人工染色体(例如,YAC),有时是线性核酸(例如,通过PCR或通过限制消化产生的线性核酸),有时是单链并且有时是双链。核酸试剂有时是通过扩增过程制备的,如聚合酶链式反应(PCR)过程或转录介导的扩增过程(TMA)。在TMA中,在等温反应中使用两种酶产生通过光发射检测的扩增产物(例如,Biochemistry 1996年6月25日;35(25):8429-38)。标准PCR过程是已知的(例如,美国专利号4,683,202;4,683,195;4,965,188;和5,656,493),并且通常循环进行。每个循环包括热变性,其中杂合核酸解离;冷却,其中引物寡核苷酸杂交;以及通过聚合酶(即,Taq聚合酶)延伸寡核苷酸。PCR循环过程的例子是将样品在95℃下处理5分钟;重复95℃持续1分钟、59℃持续1分钟10秒和72℃持续1分钟30秒的四十五个循环;然后将样品在72℃下处理5分钟。多个循环通常是使用市场上购得的热循环仪来进行。有时将PCR扩增产物在较低温度下(例如,在4℃下)储存一段时间,并且有时在分析前将其冷冻(例如,在-20℃下)。
可以采用类似于上述那些的克隆策略来产生含有非天然核苷酸的DNA。例如,使用标准固相合成法合成在所需位置含有非天然核苷酸的寡核苷酸,并且通过HPLC纯化。然后使用克隆方法(如金门组装(Golden Gate Assembly))将寡核苷酸插入含有所需序列上下文(即UTR和编码序列)的具有克隆位点如BsaI位点(但可以使用上文讨论的其他位点)的质粒中。
试剂盒/制品
在某些实施方案中,本文公开了与本文所述的一种或多种方法一起使用的试剂盒和制品。此类试剂盒包括载体、包装或容器,其被分隔以容纳一个或多个容器如小瓶、管等,所述一个或多个容器中的每一个包含有待在本文所述的方法中使用的单独要素之一。合适的容器包括例如瓶子、小瓶、注射器和试管。在一个实施方案中,容器由各种材料(如玻璃或塑料)形成。
在一些实施方案中,试剂盒包括合适的包装材料来容纳试剂盒的内容物。在一些情况下,包装材料是通过熟知的方法来构建的,优选地以提供无菌无污染的环境。本文所用的包装材料可以包括例如通常用于出售用于与核酸测序系统一起使用的商业试剂盒中的那些。示例性包装材料包括而不限于能够将本文所述的组分保持在固定界限内的玻璃、塑料、纸、箔等。
包装材料可以包括指示组分具体用途的标签。标签所指示的试剂盒的用途可以是对于试剂盒中存在的特定组分组合适当的本文所述的一种或多种方法。例如,标签可以指示,试剂盒用于合成多核苷酸的方法中,或者用于确定核酸序列的方法中。
试剂盒中还可以包括所包装试剂或组分的使用说明。所述说明典型地将包括描述反应参数的有形表达,所述反应参数如要混合的试剂盒组分和样品的相对量、试剂/样品混合物的维持时间段、温度、缓冲条件等。
将理解,并非特定反应所需的所有组分都必须存在于特定试剂盒中。而是可以从其他来源提供一种或多种另外的组分。与试剂盒一起提供的说明可以标识要提供的一种或多种另外的组分以及可以从哪里获得所述组分。
在一些实施方案中,提供了试剂盒,所述试剂盒可用于将非天然核酸稳定掺入细胞核酸中,例如,使用本发明提供的用于制备基因工程化哺乳动物细胞(例如,CHO或HEK293T细胞)的方法。在一个实施方案中,本文所述的试剂盒包括基因工程化细胞以及一种或多种非天然核酸。
在另外的实施方案中,本文所述的试剂盒提供细胞和含有用于引入所述细胞中以由此提供基因工程化细胞的异源基因的核酸分子,如包含本段之前描述的任何实施方案的核酸的表达载体。
在一些实施方案中,将本文所述的细胞递送至生物体,所述生物体可以是多细胞生物体,如哺乳动物,例如人。因此,可以将包含具有非天然氨基酸的多肽的真核细胞引入生物体。
编号实施方案
本公开文本提供了以下非限制性编号实施方案:
实施方案1.一种在真核细胞中产生包含一个或多个非天然氨基酸的多肽的方法,所述方法包括:
(a)提供真核细胞,所述真核细胞包含:
(i)具有包含第一非天然碱基的反密码子的转移RNA(tRNA);
(ii)具有包含第二非天然碱基的密码子的信使RNA(mRNA),其中所述第一非天然碱基和所述第二非天然碱基在所述真核细胞中形成非天然碱基对(UBP);
(b)使用所述tRNA通过所述真核细胞内源的核糖体从所述mRNA翻译包含所述一个或多个非天然氨基酸的多肽。
实施方案2.根据实施方案1所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N)。
实施方案3.根据实施方案1所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。
实施方案4.根据实施方案1所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X)。
实施方案5.根据实施方案1至4中任一项所述的方法,其中所述第一非天然碱基或所述第二非天然碱基选自:
(i)2-硫尿嘧啶、2-硫代-胸腺嘧啶、2'-脱氧尿苷、4-硫代-尿嘧啶、4-硫代-胸腺嘧啶、尿嘧啶-5-基、次黄嘌呤-9-基(I)、5-卤代尿嘧啶、5-丙炔基-尿嘧啶、6-偶氮-胸腺嘧啶、6-偶氮-尿嘧啶、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、假尿嘧啶、尿嘧啶-5-氧杂乙酸甲酯、尿嘧啶-5-氧乙酸、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、5-甲基-2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、尿嘧啶-5-氧乙酸、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶、或二氢尿嘧啶;
(ii)5-羟甲基胞嘧啶、5-三氟甲基胞嘧啶、5-卤代胞嘧啶、5-丙炔基胞嘧啶、5-羟基胞嘧啶、环胞嘧啶、阿糖胞苷、5,6-二氢胞嘧啶、5-硝基胞嘧啶、6-偶氮胞嘧啶、氮杂胞嘧啶、N4-乙基胞嘧啶、3-甲基胞嘧啶、5-甲基胞嘧啶、4-乙酰基胞嘧啶、2-硫胞嘧啶、吩噁嗪胞苷([5,4-b][l,4]苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并[5,4-b][l,4]苯并噻嗪-2(3H)-酮)、吩噁嗪胞苷(9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][l,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)或吡啶并吲哚胞苷(H-吡啶并[3',2':4,5]吡咯并[2,3-d]嘧啶-2-酮);
(iii)2-氨基腺嘌呤,2-丙基腺嘌呤,2-氨基-腺嘌呤,2-F-腺嘌呤,2-氨基-丙基-腺嘌呤,2-氨基-2'-脱氧腺苷,3-脱氮腺嘌呤,7-甲基腺嘌呤,7-脱氮-腺嘌呤,8-氮杂腺嘌呤,8-卤代、8-氨基、8-硫醇、8-硫烷基和8-羟基取代的腺嘌呤,N6-异戊烯基腺嘌呤,2-甲基腺嘌呤,2,6-二氨基嘌呤,2-甲基硫代-N6-异戊烯基腺嘌呤,或6-氮杂-腺嘌呤;
(iv)2-甲基鸟嘌呤,鸟嘌呤的2-丙基和烷基衍生物,3-脱氮鸟嘌呤,6-硫代-鸟嘌呤,7-甲基鸟嘌呤,7-脱氮鸟嘌呤,7-脱氮鸟苷,7-脱氮-8-氮杂鸟嘌呤,8-氮杂鸟嘌呤,8-卤代、8-氨基、8-硫醇、8-硫烷基和8-羟基取代的鸟嘌呤,1-甲基鸟嘌呤,2,2-二甲基鸟嘌呤,7-甲基鸟嘌呤,或6-氮杂-鸟嘌呤;和
(v)次黄嘌呤、黄嘌呤、1-甲基肌苷、辫苷、β-D-半乳糖基辫苷、肌苷、β-D-甘露糖基辫苷、怀丁氧苷、羟基脲、(acp3)w、2-氨基吡啶或2-吡啶酮。
实施方案6.根据实施方案1至4中任一项所述的方法,其中所述第一非天然碱基或所述第二非天然碱基选自:
其中波浪线指示与核糖基部分的键。
实施方案13.根据实施方案1至12中任一项所述的方法,其中所述第一非天然碱基或所述第二非天然碱基包含选自以下的经修饰的糖部分:
2'位置处的修饰:
OH、经取代的低级烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-烷基、S-烷基、N-烷基;
O-烯基、S-烯基、N-烯基;
O-炔基、S-炔基、N-炔基;
O-烷基-O-烷基、2'-F、2'-OCH3、2'-O(CH2)2OCH3,其中所述烷基、烯基和炔基可以是经取代或未经取代的C1-C10烷基、C2-C10烯基、C2-C10炔基、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2和-O(CH2)nON[(CH2)nCH3)]2,其中n和m是1至约10;
和/或5'位置处的修饰:
5'-乙烯基、5'-甲基(R或S);
4'位置处的修饰:
4'-S、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、经取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改善寡核苷酸的药代动力学特性的基团、或用于改善寡核苷酸的药效学特性的基团及其任何组合。
实施方案14.根据实施方案1至13中任一项所述的方法,其中所述方法是人细胞。
实施方案15.根据实施方案14所述的方法,其中所述人细胞是HEK293T细胞。
实施方案16.根据实施方案1至13中任一项所述的方法,其中所述细胞是仓鼠细胞。
实施方案17.根据实施方案16所述的方法,其中所述仓鼠细胞是中国仓鼠卵巢(CHO)细胞。
实施方案18.根据实施方案1至17中任一项所述的方法,其中所述非天然氨基酸:
是赖氨酸类似物;
包含芳族侧链;
包含叠氮基;
包含炔基;或者
包含醛基或酮基。
实施方案19.根据实施方案1至17中任一项所述的方法,其中所述非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸或N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。
实施方案20.根据实施方案19所述的方法,其中所述非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。
实施方案21.一种在真核细胞中产生多肽的方法,其中所述多肽包含一个或多个非天然氨基酸,所述方法包括:
(a)提供真核细胞,所述真核细胞包含:
(i)包含密码子的mRNA;其中所述密码子包含或多个非天然碱基;
(ii)包含反密码子的tRNA,其中所述反密码子包含一个或多个非天然碱基,并且其中构成所述mRNA中的所述密码子的一个或多个非天然碱基和构成所述tRNA中的所述反密码子的一个或多个非天然碱基形成互补碱基对;以及
(iii)tRNA合成酶,其中与天然氨基酸相比,所述tRNA合成酶优先用所述一个或多个非天然氨基酸使所述tRNA氨酰化;以及
(b)向所述真核细胞提供所述一个多个非天然氨基酸,其中所述真核细胞产生包含所述一个或多个非天然氨基酸的多肽。
实施方案22.根据实施方案21所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N)。
实施方案23.根据实施方案21所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。
实施方案24.根据实施方案21所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X)。
实施方案25.根据实施方案21至24中任一项所述的方法,其中构成所述mRNA中的所述密码子的一个或多个非天然碱基具有下式
其中R2选自氢、烷基、烯基、炔基、甲氧基、甲硫醇、甲烷硒基、卤素、氰基和叠氮基,并且波浪线指示与核糖基部分的键。
实施方案26.根据实施方案21至24中任一项所述的方法,其中所述第一非天然碱基或所述第二非天然碱基选自:
实施方案38.根据实施方案21所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N),其中所述非天然碱基(X)位于所述mRNA的密码子中的第一位置(X-N-N),其中所述非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案42.根据实施方案21所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N),其中所述非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N),其中所述非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案46.根据实施方案21所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N),其中所述非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X),其中所述非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案50.根据实施方案21所述的方法,其中所述tRNA的所述反密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述tRNA的所述反密码子中的第一位置(X-N-N)。
实施方案55.根据实施方案21所述的方法,其中所述tRNA的所述反密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述tRNA的所述反密码子中的中间位置(N-X-N)。
实施方案60.根据实施方案21所述的方法,其中所述tRNA的所述反密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述tRNA的所述反密码子中的最后位置(N-N-X)。
实施方案65.根据实施方案21所述的方法,其中所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的所述密码子包含位于所述密码子的第一位置(X-N-N)的第一非天然碱基(X),并且所述tRNA中的所述反密码子包含位于所述反密码子的最后位置(N-N-Y)的第二非天然碱基(Y)。
实施方案66.根据实施方案65所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同或不同。
实施方案67.根据实施方案66所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同。
实施方案68.根据实施方案66所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)不同。
实施方案69.根据实施方案65至68中任一项所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)和位于所述tRNA的所述反密码子中的第二非天然碱基(Y)选自
其中波浪线指示与核糖基部分的键。
实施方案74.根据实施方案70所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。
实施方案77.根据实施方案21所述的方法,其中所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的所述密码子包含位于所述密码子的中间位置(N-X-N)的第一非天然碱基(X),并且所述tRNA中的反密码子包含位于所述反密码子的中间位置(N-Y-N)的第二非天然碱基(Y)。
实施方案78.根据实施方案77所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同或不同。
实施方案79.根据实施方案78所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同。
实施方案80.根据实施方案78所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)不同。
实施方案81.根据实施方案77至79中任一项所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)和位于所述tRNA的所述反密码子中的第二非天然碱基(Y)选自
实施方案86.根据实施方案82所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。
实施方案89.根据实施方案21所述的方法,其中所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的所述密码子包含位于所述密码子的最后位置(N-N-X)的第一非天然碱基(X),并且所述tRNA中的反密码子包含位于所述反密码子的第一位置(Y-N-N)的第二非天然碱基(Y)。
实施方案90.根据实施方案89所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同或不同。
实施方案91.根据实施方案89所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同。
实施方案92.根据实施方案89所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)不同。
实施方案93.根据实施方案89至92中任一项所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)和位于所述tRNA的所述反密码子中的第二非天然碱基(Y)选自
实施方案98.根据实施方案94所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。
实施方案101.根据实施方案21、23、25至37、42至45、55至59和77至88中任一项所述的方法,其中所述mRNA中的所述密码子选自AXC、GXC或GXU,其中X是所述非天然碱基。
实施方案102.根据实施方案101所述的方法,其中所述mRNA中的所述密码子是AXC,其中X是所述非天然碱基。
实施方案103.根据实施方案101所述的方法,其中所述mRNA中的所述密码子是GXC,其中X是所述非天然碱基。
实施方案104.根据实施方案101所述的方法,其中所述mRNA中的所述密码子是GXU,其中X是所述非天然碱基。
实施方案105.根据实施方案21、23、25至37、42至45、55至59和77至88中任一项所述的方法,其中所述mRNA中的所述密码子选自AXC、GXC或GXU,其中所述tRNA中的所述反密码子选自GYU、GYC和AYC,其中X是第一非天然碱基并且Y是第二非天然碱基。
实施方案106.根据实施方案105所述的方法,其中X与Y相同或不同。
实施方案107.根据实施方案106所述的方法,其中X与Y相同。
实施方案108.根据实施方案106所述的方法,其中X与Y不同。
实施方案109.根据实施方案105所述的方法,其中所述mRNA中的所述密码子是AXC并且所述tRNA中的所述反密码子是GYU。
实施方案110.根据实施方案109所述的方法,其中X与Y相同或不同。
实施方案111.根据实施方案109所述的方法,其中X与Y相同。
实施方案112.根据实施方案109所述的方法,其中X与Y不同。
实施方案113.根据实施方案106所述的方法,其中所述mRNA中的所述密码子是GXC并且所述tRNA中的所述反密码子是GYC。
实施方案114.根据实施方案113所述的方法,其中X与Y相同或不同。
实施方案115.根据实施方案113所述的方法,其中X与Y相同。
实施方案116.根据实施方案113所述的方法,其中X与Y不同。
实施方案117.根据实施方案106所述的方法,其中所述mRNA中的所述密码子是GXU并且所述反密码子是AYC。
实施方案118.根据实施方案117所述的方法,其中X与Y相同或不同。
实施方案119.根据实施方案117所述的方法,其中X与Y相同。
实施方案120.根据实施方案117所述的方法,其中X与Y不同。
实施方案121.根据实施方案21至120中任一项所述的方法,其中所述tRNA源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。
实施方案122.根据实施方案21至120中任一项所述的方法,其中所述tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌的tRNA合成酶。
实施方案123.根据实施方案122所述的方法,其中tRNA和tRNA合成酶源自詹氏甲烷球菌。
实施方案124.根据实施方案122所述的方法,其中tRNA和tRNA合成酶源自巴氏甲烷八叠球菌。
实施方案125.根据实施方案122所述的方法,其中tRNA和tRNA合成酶源自马氏甲烷八叠球菌。
实施方案126.根据实施方案122所述的方法,其中tRNA和tRNA合成酶源自乙酸甲烷八叠球菌。
实施方案127.根据实施方案21至120中任一项所述的方法,其中所述tRNA源自詹氏甲烷球菌,并且tRNA合成酶源自巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。
实施方案128.根据实施方案21至120中任一项所述的方法,其中所述tRNA源自巴氏甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。
实施方案129.根据实施方案21至120中任一项所述的方法,其中所述tRNA源自马氏甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌或乙酸甲烷八叠球菌。
实施方案130.根据实施方案21至120中任一项所述的方法,其中所述tRNA源自乙酸甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌或马氏甲烷八叠球菌。
实施方案131.根据实施方案21至120中任一项所述的方法,其中所述tRNA源自马氏甲烷八叠球菌,并且tRNA合成酶源自巴氏甲烷八叠球菌。
实施方案132.根据实施方案21至120中任一项所述的方法,其中所述细胞是人细胞。
实施方案133.根据实施方案132所述的方法,其中所述人细胞是HEK293T细胞。
实施方案134.根据实施方案21至120中任一项所述的方法,其中所述细胞是仓鼠细胞。
实施方案135.根据实施方案134所述的方法,其中所述仓鼠细胞是中国仓鼠卵巢(CHO)细胞。
实施方案136.根据实施方案21至135中任一项所述的方法,其中所述非天然氨基酸:
是赖氨酸类似物;
包含芳族侧链;
包含叠氮基;
包含炔基;或者
包含醛基或酮基。
实施方案137.根据实施方案21至135中任一项所述的方法,其中所述非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸或N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。
实施方案138.根据实施方案137所述的方法,其中所述非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。
实施方案139.一种用于在真核细胞中表达非天然多肽的系统,所述系统包含:
(a)至少一个非天然氨基酸;
(b)编码所述非天然多肽的mRNA,所述mRNA包含含有一个或多个第一非天然碱
基的至少一个密码子;
(c)tRNA,所述tRNA包含含有一个或多个第二非天然碱基的至少一个反密码子,其中所述一个或多个第一非天然碱基和所述一个或多个第二非天然碱基形成一个或
多个互补碱基对;
(d)一个或多个包含编码tRNA合成酶的核酸序列的核酸构建体,其中所述tRNA合
成酶优先用所述至少一个非天然氨基酸使所述tRNA氨酰化;以及
(e)真核细胞,所述真核细胞能够使用所述tRNA和tRNA合成酶将所述mRNA翻译成包含所述非天然氨基酸的多肽。
实施方案140.根据实施方案139所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述至少一个密码子中的第一位置(X-N-N)。
实施方案141.根据实施方案139所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。
实施方案142.根据实施方案139所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述至少一个密码子中的最后位置(N-N-X)。
实施方案143.根据实施方案139至142中任一项所述的系统,其中所述一个或多个非天然碱基具有下式
其中R2选自氢、烷基、烯基、炔基、甲氧基、甲硫醇、甲烷硒基、卤素、氰基和叠氮基,并且波浪线指示与核糖基部分的键。
实施方案144.根据实施方案139至142中任一项所述的系统,其中所述一个或多个第一非天然碱基或所述一个或多个第二非天然碱基选自
实施方案145.根据实施方案144所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案146.根据实施方案144所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案147.根据实施方案144所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案148.根据实施方案144所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案149.根据实施方案144所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案150.根据实施方案144所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案156.根据实施方案139所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N),其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N),其中所述一个或多个第一非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案160.根据实施方案139所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N),其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N),其中所述一个或多个第一非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案164.根据实施方案139所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N),其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X),其中所述一个或多个第一非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案168.根据实施方案139所述的系统,其中所述tRNA的所述至少一个反密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第二非天然碱基(X)位于所述tRNA的所述反密码子中的第一位置(X-N-N)。
实施方案173.根据实施方案139所述的系统,其中所述tRNA的所述至少一个反密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第二非天然碱基(X)位于所述tRNA的所述反密码子中的中间位置(N-X-N)。
实施方案178.根据实施方案139所述的系统,其中所述tRNA的所述至少一个反密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第二非天然碱基(X)位于所述tRNA的所述反密码子中的最后位置(N-N-X)。
实施方案183.根据实施方案139所述的系统,其中所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述至少一个密码子包含一个或多个位于所述密码子的第一位置(X-N-N)的第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含一个或多个位于所述反密码子的最后位置(N-N-Y)的第二非天然碱基(Y)。
实施方案184.根据实施方案183所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。
实施方案185.根据实施方案184所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同。
实施方案186.根据实施方案184所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)不同。
实施方案187.根据实施方案183至186中任一项所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自
其中波浪线指示与核糖基部分的键。
实施方案188.根据实施方案187所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。
实施方案189.根据实施方案188所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。
实施方案190.根据实施方案188所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。
实施方案191.根据实施方案188所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。
实施方案192.根据实施方案188所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。
实施方案195.根据实施方案139所述的系统,其中所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述mRNA中的所述至少一个密码子包含位于所述至少一个密码子的中间位置(N-X-N)的一个或多个第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含位于所述反密码子的中间位置(N-Y-N)的一个或多个第二非天然碱基(Y)。
实施方案196.根据实施方案195所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。
实施方案197.根据实施方案195所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同。
实施方案198.根据实施方案195所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)不同。
实施方案199.根据实施方案195至198中任一项所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自
其中波浪线指示与核糖基部分的键。
实施方案200.根据实施方案199所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。
实施方案201.根据实施方案200所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。
实施方案202.根据实施方案200所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。
实施方案203.根据实施方案200所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。
实施方案204.根据实施方案200所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。
实施方案207.根据实施方案139的系统,其中所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述mRNA中的所述至少一个密码子包含位于所述至少一个密码子的最后位置(N-N-X)的一个或多个第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含位于所述反密码子的第一位置(Y-N-N)的一个或多个第二非天然碱基(Y)。
实施方案208.根据实施方案207所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。
实施方案209.根据实施方案208所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同。
实施方案210.根据实施方案208所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)不同。
实施方案211.根据实施方案207至210中任一项所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自
其中波浪线指示与核糖基部分的键。
实施方案212.根据实施方案211所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。
实施方案213.根据实施方案212所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。
实施方案214.根据实施方案212所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。
实施方案215.根据实施方案212所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)二者都是其中波浪线指示与核糖基部分的键。
实施方案216.根据实施方案212所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。
实施方案219.根据实施方案139至218中任一项所述的系统,其中所述mRNA中的所述至少一个密码子选自AXC、GXC或GXU,其中X是所述非天然碱基。
实施方案220.根据实施方案219所述的系统,其中所述mRNA中的所述至少一个密码子是AXC,其中X是所述非天然碱基。
实施方案221.根据实施方案219所述的系统,其中所述mRNA中的所述至少一个密码子是GXC,其中X是所述非天然碱基。
实施方案222.根据实施方案219所述的系统,其中所述mRNA中的所述至少一个密码子是GXU,其中X是所述非天然碱基。
实施方案223.根据实施方案139至218中任一项所述的系统,其中所述mRNA中的至少一个密码子选自AXC、GXC或GXU,其中所述tRNA中的至少一个反密码子选自GYU、GYC和AYC,其中X是所述一个或多个第一非天然碱基并且Y是所述一个或多个第二非天然碱基。
实施方案224.根据实施方案223所述的系统,其中X与Y相同或不同。
实施方案225.根据实施方案224所述的系统,其中X与Y相同。
实施方案226.根据实施方案224所述的系统,其中X与Y不同。
实施方案227.根据实施方案223所述的系统,其中所述mRNA中的所述至少一个密码子是AXC并且所述tRNA中的所述至少一个反密码子是GYU。
实施方案228.根据实施方案227所述的系统,其中X与Y相同或不同。
实施方案229.根据实施方案228所述的系统,其中X与Y相同。
实施方案230.根据实施方案228所述的系统,其中X与Y不同。
实施方案231.根据实施方案223所述的系统,其中所述mRNA中的所述至少一个密码子是GXC并且所述tRNA中的所述至少一个反密码子是GYC。
实施方案232.根据实施方案231所述的系统,其中X与Y相同或不同。
实施方案233.根据实施方案232所述的系统,其中X与Y相同。
实施方案234.根据实施方案232所述的系统,其中X与Y不同。
实施方案235.根据实施方案223所述的系统,其中所述mRNA中的所述至少一个密码子是GXU并且所述至少一个反密码子是AYC。
实施方案236.根据实施方案235所述的系统,其中X与Y相同或不同。
实施方案237.根据实施方案236所述的系统,其中X与Y相同。
实施方案238.根据实施方案236所述的系统,其中X与Y不同。
实施方案239.根据实施方案139至238中任一项所述的系统,其中所述tRNA源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。
实施方案240.根据实施方案139至238中任一项所述的系统,其中所述tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌的tRNA合成酶。
实施方案241.根据实施方案240所述的系统,其中tRNA和tRNA合成酶源自詹氏甲烷球菌。
实施方案242.根据实施方案240所述的系统,其中tRNA和tRNA合成酶源自巴氏甲烷八叠球菌。
实施方案243.根据实施方案240所述的系统,其中tRNA和tRNA合成酶源自马氏甲烷八叠球菌。
实施方案244.根据实施方案240所述的系统,其中tRNA和tRNA合成酶源自乙酸甲烷八叠球菌。
实施方案245.根据实施方案139至239中任一项所述的系统,其中所述tRNA源自詹氏甲烷球菌,并且tRNA合成酶源自巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。
实施方案246.根据实施方案139至239中任一项所述的系统,其中所述tRNA源自巴氏甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。
实施方案247.根据实施方案139至239中任一项所述的系统,其中所述tRNA源自马氏甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌或乙酸甲烷八叠球菌。
实施方案248.根据实施方案139至239中任一项所述的系统,其中所述tRNA源自乙酸甲烷八叠球菌,并且tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌或马氏甲烷八叠球菌。
实施方案249.根据实施方案139至239中任一项所述的系统,其中所述tRNA源自马氏甲烷八叠球菌,并且tRNA合成酶源自巴氏甲烷八叠球菌。
实施方案250.根据实施方案139至249中任一项所述的系统,其中所述细胞是人细胞。
实施方案251.根据实施方案250所述的系统,其中所述人细胞是HEK293T细胞。
实施方案252.根据实施方案139至239中任一项所述的系统,其中所述细胞是仓鼠细胞。
实施方案253.根据实施方案252所述的系统,其中所述仓鼠细胞是中国仓鼠卵巢(CHO)细胞。
实施方案254.根据实施方案139至253中任一项所述的系统,其中所述非天然氨基酸:
是赖氨酸类似物;
包含芳族侧链;
包含叠氮基;
包含炔基;或者
包含醛基或酮基。
实施方案255.根据实施方案139至253中任一项所述的系统,其中所述非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸或N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。
实施方案256.根据实施方案255所述的系统,其中所述非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。
实施方案257.根据实施方案21至138中任一项所述的方法,其中所述mRNA和所述tRNA在所述真核细胞中稳定而不降解。
实施方案258.根据实施方案21至138和257中任一项所述的方法,其中所述多肽通过使用所述tRNA通过所述真核细胞内源的核糖体翻译所述mRNA来产生。
实施方案259.根据实施方案139至256中任一项所述的系统,其中所述mRNA和所述tRNA在所述真核细胞中稳定而不降解。
实施方案260.根据139至256和259中任一项所述的系统,其中多肽通过使用所述tRNA通过所述真核细胞内源的核糖体翻译所述mRNA来产生。
实施方案261.一种真核细胞,所述真核细胞包含:
(a)具有包含第一非天然碱基的密码子的信使RNA(mRNA);以及
(b)具有包含第二非天然碱基的反密码子的转移RNA(tRNA),其中所述第一非天然碱基和所述第二非天然碱基能够在所述真核细胞中形成非天然碱基对(UBP),并且其中所述mRNA能够在所述细胞中被翻译以产生包含至少一个非天然氨基酸的多肽。
实施方案262.根据实施方案261所述的真核细胞,其中所述tRNA装载有非天然氨基酸。
实施方案263.根据实施方案261-262中任一项所述的真核细胞,所述真核细胞进一步包含从所述mRNA翻译的多肽,其中所述多肽包含所述非天然氨基酸,任选地其中所述多肽包含真核糖基化模式。
实施方案264.根据实施方案261-263中任一项所述的真核细胞,所述真核细胞进一步包含tRNA合成酶,其中所述tRNA合成酶优先用所述非天然氨基酸使所述tRNA氨酰化。
实施方案265.根据实施方案261-264中任一项所述的真核细胞,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N)。
实施方案266.根据实施方案261-265中任一项所述的真核细胞,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。
实施方案267.根据实施方案261-266中任一项所述的真核细胞,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X)。
实施方案268.根据实施方案261-267中任一项所述的真核细胞,其中所述第一非天然碱基或所述第二非天然碱基选自:
(i)2-硫尿嘧啶、2-硫代-胸腺嘧啶、2'-脱氧尿苷、4-硫代-尿嘧啶、4-硫代-胸腺嘧啶、尿嘧啶-5-基、次黄嘌呤-9-基(I)、5-卤代尿嘧啶、5-丙炔基-尿嘧啶、6-偶氮-胸腺嘧啶、6-偶氮-尿嘧啶、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、假尿嘧啶、尿嘧啶-5-氧杂乙酸甲酯、尿嘧啶-5-氧乙酸、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、5-甲基-2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、尿嘧啶-5-氧乙酸、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶、或二氢尿嘧啶;
(ii)5-羟甲基胞嘧啶、5-三氟甲基胞嘧啶、5-卤代胞嘧啶、5-丙炔基胞嘧啶、5-羟基胞嘧啶、环胞嘧啶、阿糖胞苷、5,6-二氢胞嘧啶、5-硝基胞嘧啶、6-偶氮胞嘧啶、氮杂胞嘧啶、N4-乙基胞嘧啶、3-甲基胞嘧啶、5-甲基胞嘧啶、4-乙酰基胞嘧啶、2-硫胞嘧啶、吩噁嗪胞苷([5,4-b][l,4]苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并[5,4-b][l,4]苯并噻嗪-2(3H)-酮)、吩噁嗪胞苷(9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][l,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)或吡啶并吲哚胞苷(H-吡啶并[3',2':4,5]吡咯并[2,3-d]嘧啶-2-酮);
(iii)2-氨基腺嘌呤,2-丙基腺嘌呤,2-氨基-腺嘌呤,2-F-腺嘌呤,2-氨基-丙基-腺嘌呤,2-氨基-2'-脱氧腺苷,3-脱氮腺嘌呤,7-甲基腺嘌呤,7-脱氮-腺嘌呤,8-氮杂腺嘌呤,8-卤代、8-氨基、8-硫醇、8-硫烷基和8-羟基取代的腺嘌呤,N6-异戊烯基腺嘌呤,2-甲基腺嘌呤,2,6-二氨基嘌呤,2-甲基硫代-N6-异戊烯基腺嘌呤,或6-氮杂-腺嘌呤;
(iv)2-甲基鸟嘌呤,鸟嘌呤的2-丙基和烷基衍生物,3-脱氮鸟嘌呤,6-硫代-鸟嘌呤,7-甲基鸟嘌呤,7-脱氮鸟嘌呤,7-脱氮鸟苷,7-脱氮-8-氮杂鸟嘌呤,8-氮杂鸟嘌呤,8-卤代、8-氨基、8-硫醇、8-硫烷基和8-羟基取代的鸟嘌呤,1-甲基鸟嘌呤,2,2-二甲基鸟嘌呤,7-甲基鸟嘌呤,或6-氮杂-鸟嘌呤;和
(v)次黄嘌呤、黄嘌呤、1-甲基肌苷、辫苷、β-D-半乳糖基辫苷、肌苷、β-D-甘露糖基辫苷、怀丁氧苷、羟基脲、(acp3)w、2-氨基吡啶或2-吡啶酮。
实施方案269.根据实施方案261-267中任一项所述的真核细胞,其中所述第一非天然碱基或所述第二非天然碱基各自独立地选自
实施方案276.根据实施方案261-275中任一项所述的真核细胞,其中所述第一非天然碱基或所述第二非天然碱基包含选自以下的经修饰的糖部分:
2'位置处的修饰:
OH、经取代的低级烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-烷基、S-烷基、N-烷基;
O-烯基、S-烯基、N-烯基;
O-炔基、S-炔基、N-炔基;
O-烷基-O-烷基、2'-F、2'-OCH3、2'-O(CH2)2OCH3,其中所述烷基、烯基和炔基可以是经取代或未经取代的C1-C10烷基、C2-C10烯基、C2-C10炔基、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2和-O(CH2)nON[(CH2)nCH3)]2,其中n和m是1至约10;
和/或5'位置处的修饰:
5'-乙烯基、5'-甲基(R或S);
4'位置处的修饰:
4'-S、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、经取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改善寡核苷酸的药代动力学特性的基团、或用于改善寡核苷酸的药效学特性的基团及其任何组合。
实施方案277.根据实施方案263-276中任一项所述的真核细胞,其中所述至少一个非天然氨基酸:
是赖氨酸类似物;
包含芳族侧链;
包含叠氮基;
包含炔基;或者
包含醛基或酮基。
实施方案278.根据实施方案277所述的真核细胞,其中所述至少一个非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸或N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。
实施方案279.根据实施方案278所述的真核细胞,其中所述至少一个非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。
实施方案280.根据实施方案261-279中任一项所述的真核细胞,其中所述真核细胞是人细胞。
实施方案281.根据前一实施方案所述的真核细胞,其中所述人细胞是HEK293T细胞。
实施方案282.根据实施方案261至279中任一项所述的真核细胞,其中所述细胞是哺乳动物细胞,任选地其中所述哺乳动物细胞是仓鼠细胞。
实施方案283.根据前一实施方案所述的真核细胞,其中所述哺乳动物细胞是中国仓鼠卵巢(CHO)细胞。
实施方案284.根据实施方案261-283中任一项所述的真核细胞,其中所述细胞是分离的,任选地其中所述细胞是纯化的。
实施方案285.根据实施方案261-284中任一项所述的真核细胞,所述真核细胞进一步包含从所述mRNA翻译的多肽,其中所述多肽包含所述非天然氨基酸和哺乳动物糖基化模式。
实施方案285.1.一种半合成生物体,所述半合成生物体包含根据实施方案261-285中任一项所述的真核细胞。
实施方案286.一种真核细胞培养物,所述真核细胞培养物包含多个根据实施方案261-285中任一项所述的真核细胞。
实施方案286.1.一种将细胞递送至生物体的方法,所述方法包括使所述生物体与根据实施方案261-285中任一项所述的细胞接触。
实施方案286.2.根据实施方案286.1所述的方法,其中所述生物体是哺乳动物,任选地其中所述哺乳动物是人。
实施方案287.一种在真核细胞中产生包含至少一个非天然氨基酸的多肽的方法,所述方法包括:
(a)向所述细胞中引入:
(i)具有包含第一非天然碱基的密码子的信使RNA(mRNA);以及
(ii)在所述真核细胞中具有包含第二非天然碱基的反密码子的转移RNA(tRNA),其中所述第一非天然碱基和所述第二非天然碱基能够在所述真核细胞中形成非天然碱基对(UBP);以及
(b)使用所述tRNA从所述mRNA翻译包含所述至少一个非天然氨基酸的多肽。
实施方案288.根据前述实施方案所述的方法,其中所述tRNA装载有非天然氨基酸。
实施方案289.一种在真核细胞中产生包含至少一个非天然氨基酸的多肽的方法,所述方法包括:
(a)提供真核细胞,所述真核细胞包含:
(i)具有包含第一非天然碱基的密码子的信使RNA(mRNA);
(ii)具有包含第二非天然碱基的反密码子的转移RNA(tRNA),其中所述第一非天然碱基和所述第二非天然碱基能够在所述真核细胞中形成非天然碱基对(UBP);
(b)使用所述tRNA通过所述真核细胞内源的核糖体从所述mRNA翻译包含所述至少一个非天然氨基酸的多肽。
实施方案290.一种在真核细胞中产生多肽的方法,其中所述多肽包含至少一个非天然氨基酸,所述方法包括:
(a)提供真核细胞,所述真核细胞包含:
(i)包含密码子的mRNA;其中所述密码子包含第一非天然碱基;
(ii)包含反密码子的tRNA,其中所述反密码子包含第二非天然碱基,并且其中所述第一非天然碱基和所述第二非天然碱基能够形成互补碱基对;以及
(b)tRNA合成酶,其中与天然氨基酸相比,所述tRNA合成酶优先用所述至少一个非天然氨基酸使所述tRNA氨酰化;以及
(c)向所述真核细胞提供所述一个多个非天然氨基酸,其中所述真核细胞产生包含所述至少一个非天然氨基酸的多肽。
实施方案291.根据实施方案287至290中任一项所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N)。
实施方案292.根据实施方案287至290中任一项所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。
实施方案293.根据实施方案287至290中任一项所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X)。
实施方案294.根据实施方案287至293中任一项所述的方法,其中构成所述mRNA中的所述密码子的一个或多个非天然碱基具有下式
其中R2选自氢、烷基、烯基、炔基、甲氧基、甲硫醇、甲烷硒基、卤素、氰基和叠氮基,并且波浪线指示与核糖基部分的键。
实施方案295.根据实施方案287至293中任一项所述的方法,其中所述第一非天然碱基或所述第二非天然碱基选自:
(i)2-硫尿嘧啶、2-硫代-胸腺嘧啶、2'-脱氧尿苷、4-硫代-尿嘧啶、4-硫代-胸腺嘧啶、尿嘧啶-5-基、次黄嘌呤-9-基(I)、5-卤代尿嘧啶、5-丙炔基-尿嘧啶、6-偶氮-胸腺嘧啶、6-偶氮-尿嘧啶、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、假尿嘧啶、尿嘧啶-5-氧杂乙酸甲酯、尿嘧啶-5-氧乙酸、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、5-甲基-2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、尿嘧啶-5-氧乙酸、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶、或二氢尿嘧啶;
(ii)5-羟甲基胞嘧啶、5-三氟甲基胞嘧啶、5-卤代胞嘧啶、5-丙炔基胞嘧啶、5-羟基胞嘧啶、环胞嘧啶、阿糖胞苷、5,6-二氢胞嘧啶、5-硝基胞嘧啶、6-偶氮胞嘧啶、氮杂胞嘧啶、N4-乙基胞嘧啶、3-甲基胞嘧啶、5-甲基胞嘧啶、4-乙酰基胞嘧啶、2-硫胞嘧啶、吩噁嗪胞苷([5,4-b][l,4]苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并[5,4-b][l,4]苯并噻嗪-2(3H)-酮)、吩噁嗪胞苷(9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][l,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)或吡啶并吲哚胞苷(H-吡啶并[3',2':4,5]吡咯并[2,3-d]嘧啶-2-酮);
(iii)2-氨基腺嘌呤,2-丙基腺嘌呤,2-氨基-腺嘌呤,2-F-腺嘌呤,2-氨基-丙基-腺嘌呤,2-氨基-2'-脱氧腺苷,3-脱氮腺嘌呤,7-甲基腺嘌呤,7-脱氮-腺嘌呤,8-氮杂腺嘌呤,8-卤代、8-氨基、8-硫醇、8-硫烷基和8-羟基取代的腺嘌呤,N6-异戊烯基腺嘌呤,2-甲基腺嘌呤,2,6-二氨基嘌呤,2-甲基硫代-N6-异戊烯基腺嘌呤,或6-氮杂-腺嘌呤;
(iv)2-甲基鸟嘌呤,鸟嘌呤的2-丙基和烷基衍生物,3-脱氮鸟嘌呤,6-硫代-鸟嘌呤,7-甲基鸟嘌呤,7-脱氮鸟嘌呤,7-脱氮鸟苷,7-脱氮-8-氮杂鸟嘌呤,8-氮杂鸟嘌呤,8-卤代、8-氨基、8-硫醇、8-硫烷基和8-羟基取代的鸟嘌呤,1-甲基鸟嘌呤,2,2-二甲基鸟嘌呤,7-甲基鸟嘌呤,或6-氮杂-鸟嘌呤;和
(v)次黄嘌呤、黄嘌呤、1-甲基肌苷、辫苷、β-D-半乳糖基辫苷、肌苷、β-D-甘露糖基辫苷、怀丁氧苷、羟基脲、(acp3)w、2-氨基吡啶或2-吡啶酮。
实施方案296.根据实施方案287至295中任一项所述的方法,其中所述第一非天然碱基或所述第二非天然碱基选自:
实施方案303.根据实施方案287至296中任一项所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N),其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N),其中所述非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案304.根据实施方案287至296中任一项所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N),其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N),其中所述非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案305.根据实施方案287至296中任一项所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N),其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X),其中所述非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案306.根据实施方案287至296中任一项所述的方法,其中所述tRNA的所述反密码子包含三个连续核碱基(N-N-N);并且其中所述第二非天然碱基(X)位于所述tRNA的所述反密码子中的第一位置(X-N-N),其中所述非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案307.根据实施方案287至296中任一项所述的方法,其中所述tRNA的所述反密码子包含三个连续核碱基(N-N-N);并且其中所述第二非天然碱基(X)位于所述tRNA的所述反密码子中的中间位置(N-X-N),其中所述非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案308.根据实施方案287至296中任一项所述的方法,其中所述tRNA的所述反密码子包含三个连续核碱基(N-N-N);并且其中所述第二非天然碱基(X)位于所述tRNA的所述反密码子中的最后位置(N-N-X),其中所述非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案309.根据实施方案287至296中任一项所述的方法,其中所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的所述密码子的第一非天然碱基(X)位于所述密码子的第一位置(X-N-N),并且所述tRNA的所述反密码子的第二非天然碱基(Y)位于所述反密码子的最后位置(N-N-Y)。
实施方案310.根据实施方案287至296中任一项所述的方法,其中所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的所述密码子包含位于所述密码子的中间位置(N-X-N)的第一非天然碱基(X),并且所述tRNA中的所述反密码子包含位于所述反密码子的中间位置(N-Y-N)的第二非天然碱基(Y)。
实施方案311.根据实施方案287至296中任一项所述的方法,其中所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的所述密码子包含位于所述密码子的最后位置(N-N-X)的第一非天然碱基(X),并且所述tRNA中的所述反密码子包含位于所述反密码子的第一位置(Y-N-N)的第二非天然碱基(Y)。
实施方案312.根据实施方案309至311中任一项所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同或不同。
实施方案313.根据实施方案309至312中任一项所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)和位于所述tRNA的所述反密码子中的第二非天然碱基(Y)选自
实施方案316.根据实施方案314所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。
实施方案317.根据实施方案287至290、292、294至302、304、307和410中任一项所述的方法,其中所述mRNA中的所述密码子选自AXC、GXC或GXU,其中X是所述第一非天然碱基。
实施方案318.根据前一实施方案所述的方法,其中所述tRNA中的反密码子选自GYU、GYC和AYC,并且Y是第二非天然碱基。
实施方案319.根据实施方案318所述的方法,其中所述mRNA中的所述密码子是AXC并且所述tRNA中的所述反密码子是GYU。
实施方案320.根据实施方案318所述的方法,其中所述mRNA中的所述密码子是GXC并且所述tRNA中的所述反密码子是GYC。
实施方案321.根据实施方案318所述的方法,其中所述mRNA中的所述密码子是GXU并且所述反密码子是AYC。
实施方案322.根据实施方案287至321中任一项所述的方法,其中所述第一非天然碱基或所述第二非天然碱基包含选自以下的经修饰的糖部分:
2'位置处的修饰:
OH、经取代的低级烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F;
O-烷基、S-烷基、N-烷基;
O-烯基、S-烯基、N-烯基;
O-炔基、S-炔基、N-炔基;
O-烷基-O-烷基、2'-F、2'-OCH3、2'-O(CH2)2OCH3,其中所述烷基、烯基和炔基可以是经取代或未经取代的C1-C10烷基、C2-C10烯基、C2-C10炔基、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2和-O(CH2)nON[(CH2)nCH3)]2,其中n和m是1至约10;
和/或5'位置处的修饰:
5'-乙烯基、5'-甲基(R或S);
4'位置处的修饰:
4'-S、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、经取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改善寡核苷酸的药代动力学特性的基团、或用于改善寡核苷酸的药效学特性的基团及其任何组合。
实施方案323.根据实施方案287至322中任一项所述的方法,其中所述至少一个非天然氨基酸:
是赖氨酸类似物;
包含芳族侧链;
包含叠氮基;
包含炔基;或者
包含醛基或酮基。
实施方案324.根据实施方案287至322中任一项所述的方法,其中至少一个非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸或N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。
实施方案325.根据实施方案324所述的方法,其中所述非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。
实施方案326.根据实施方案287至325中任一项所述的方法,其中所述细胞是人细胞。
实施方案327.根据实施方案326所述的方法,其中所述人细胞是HEK293T细胞。
实施方案328.根据实施方案287至325中任一项所述的方法,其中所述细胞是仓鼠细胞。
实施方案329.根据实施方案328所述的方法,其中所述仓鼠细胞是中国仓鼠卵巢(CHO)细胞。
实施方案330.根据实施方案287至329中任一项所述的方法,其中所述tRNA源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。
实施方案331.根据实施方案287至330中任一项所述的方法,其中所述细胞包含源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌的tRNA合成酶。实施方案332.一种用于表达非天然多肽的系统,所述系统包含:
(a)至少一个非天然氨基酸;
(b)编码所述非天然多肽的mRNA,所述mRNA包含含有一个或多个第一非天然碱基的至少一个密码子;
(c)tRNA,所述tRNA包含含有一个或多个第二非天然碱基的至少一个反密码子,其中所述一个或多个第一非天然碱基和所述一个或多个第二非天然碱基能够形成一个或多个互补碱基对;
(d)真核核糖体,所述真核核糖体能够使用所述tRNA和tRNA合成酶将所述mRNA翻译成包含所述非天然氨基酸的多肽,其中所述tRNA装载有所述非天然氨基酸,或者所述系统进一步包含tRNA合成酶或一个或多个包含编码tRNA合成酶的核酸序列的核酸构建体,其中所述tRNA合成酶优先用所述至少一个非天然氨基酸使所述tRNA氨酰化。
实施方案333.根据实施方案332所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述至少一个密码子中的第一位置(X-N-N)。
实施方案334.根据实施方案332所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。
实施方案335.根据实施方案332所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述至少一个密码子中的最后位置(N-N-X)。
实施方案336.根据实施方案332至335中任一项所述的系统,其中所述一个或多个非天然碱基具有下式
其中R2选自氢、烷基、烯基、炔基、甲氧基、甲硫醇、甲烷硒基、卤素、氰基和叠氮基,并且波浪线指示与核糖基部分的键。
实施方案338.根据实施方案337所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案339.根据实施方案337所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案340.根据实施方案337所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案341.根据实施方案337所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案342.根据实施方案337所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案343.根据实施方案337所述的系统,当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是并且当所述一个或多个第一非天然碱基是时,所述一个或多个第二非天然碱基是其中波浪线指示与核糖基部分的键。
实施方案346.根据实施方案332所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N),其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N),其中所述一个或多个第一非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案347.根据实施方案332所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N),其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N),其中所述一个或多个第一非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案348.根据实施方案332所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N),其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X),其中所述一个或多个第一非天然碱基选自 并且其中波浪线指示与核糖基部分的键。
实施方案349.根据实施方案332所述的系统,其中所述tRNA的所述至少一个反密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第二非天然碱基(X)位于所述tRNA的所述反密码子中的第一位置(X-N-N),其中所述一个或多个第二非天然碱基选自并且其中波浪线指示与核糖基部分的键。
实施方案350.根据实施方案332所述的系统,其中所述tRNA的所述至少一个反密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第二非天然碱基(X)位于所述tRNA的所述反密码子中的中间位置(N-X-N),其中所述一个或多个第二非天然碱基选自并且其中波浪线指示与核糖基部分的键。
实施方案351.根据实施方案332所述的系统,其中所述tRNA的所述至少一个反密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第二非天然碱基(X)位于所述tRNA的所述反密码子中的最后位置(N-N-X),其中所述一个或多个第二非天然碱基选自并且其中波浪线指示与核糖基部分的键。
实施方案352.根据实施方案332所述的系统,其中所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述至少一个密码子包含一个或多个位于所述密码子的第一位置(X-N-N)的第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含一个或多个位于所述反密码子的最后位置(N-N-Y)的第二非天然碱基(Y)。
实施方案353.根据实施方案352所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。
实施方案354.根据实施方案352至353中任一项所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自
实施方案355.根据实施方案354所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。
实施方案356.根据实施方案355所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)是其中在每种情况下,波浪线指示与核糖基部分的键。
实施方案357.根据实施方案332所述的系统,其中所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述mRNA中的所述至少一个密码子包含位于所述至少一个密码子的中间位置(N-X-N)的一个或多个第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含位于所述反密码子的中间位置(N-Y-N)的一个或多个第二非天然碱基(Y)。
实施方案358.根据实施方案357所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。
实施方案359.根据实施方案357至358中任一项所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。
实施方案360.根据实施方案359所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。
实施方案361.根据实施方案360所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)是其中在每种情形下,波浪线指示与核糖基部分的键。
实施方案362.根据实施方案332的系统,其中所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述mRNA中的所述至少一个密码子包含位于所述至少一个密码子的最后位置(N-N-X)的一个或多个第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含位于所述反密码子的第一位置(Y-N-N)的一个或多个第二非天然碱基(Y)。
实施方案363.根据实施方案362所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。
实施方案364.根据实施方案362至363中任一项所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。
实施方案365.根据实施方案364所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)和位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)选自其中波浪线指示与核糖基部分的键。
实施方案366.根据实施方案365所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)选自并且位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)是其中在每种情形下,波浪线指示与核糖基部分的键。
实施方案367.根据实施方案332至366中任一项所述的系统,其中所述mRNA中的所述至少一个密码子选自AXC、GXC或GXU,其中X是所述一个或多个第一非天然碱基。
实施方案368.根据前一实施方案所述的系统,其中所述tRNA中的所述至少一个反密码子选自GYU、GYC和AYC,并且Y是所述一个或多个第二非天然碱基。
实施方案369.根据实施方案368所述的系统,其中所述mRNA中的所述至少一个密码子是AXC并且所述tRNA中的所述至少一个反密码子是GYU。
实施方案370.根据实施方案368所述的系统,其中所述mRNA中的所述至少一个密码子是GXC并且所述tRNA中的所述至少一个反密码子是GYC。
实施方案371.根据实施方案368所述的系统,其中所述mRNA中的所述至少一个密码子是GXU并且所述至少一个反密码子是AYC。
实施方案372.根据实施方案332至371中任一项所述的系统,其中所述tRNA源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。
实施方案373.根据实施方案332至372中任一项所述的系统,其中所述tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。
实施方案374.根据权利要求332至373中任一项所述的系统,所述系统在真核细胞中。
实施方案374.1.根据实施方案332至373中任一项所述的系统,所述系统在人细胞中。
实施方案375.根据实施方案374.1所述的系统,其中所述人细胞是HEK293T细胞。
实施方案376.根据实施方案332至373中任一项所述的系统,所述系统在哺乳动物细胞中。
实施方案376.1.根据实施方案332至373中任一项所述的系统,所述系统在仓鼠细胞中。
实施方案377.根据实施方案376.1所述的系统,其中所述仓鼠细胞是中国仓鼠卵巢(CHO)细胞。
实施方案377.1.根据实施方案332至377中任一项所述的系统,其中所述mRNA和所述tRNA在所述真核细胞中稳定而不降解。
实施方案377.2.根据实施方案332至377.1中任一项所述的系统,其中多肽通过使用所述tRNA通过所述真核细胞内源的核糖体翻译所述mRNA来产生。
实施方案377.3.根据权利要求332至373中任一项所述的系统,所述系统是在体外或无细胞的。
实施方案378.根据实施方案332至377.3中任一项所述的系统,其中所述非天然氨基酸:
是赖氨酸类似物;
包含芳族侧链;
包含叠氮基;
包含炔基;或者
包含醛基或酮基。
实施方案379.根据实施方案332至378中任一项所述的系统,其中所述非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸或N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。
实施方案380.根据实施方案379所述的系统,其中所述非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。
实施方案381.根据实施方案332至380中任一项所述的系统,其中所述tRNA装载有所述非天然氨基酸。
实施方案382.根据实施方案287至331中任一项所述的方法,其中所述mRNA和所述tRNA在所述真核细胞中稳定而不降解。
实施方案383.根据实施方案287至331和382中任一项所述的方法,其中所述多肽通过使用所述tRNA通过所述真核细胞内源的核糖体翻译所述mRNA来产生。
实施例
这些实施例仅仅出于说明性目的提供,并且不限制本文提供的权利要求的范围。详细的方法作为本文中最后的实施例提供。
实施例1:在HEK293T细胞中非天然密码子的翻译
编码EGFP(AXC)151和EGFP(GXC)151的质粒用在编码序列侧翼的CS2 3'UTR序列和5'UTR序列构建以增强mRNA稳定性。选择密码子AXC和GXC,因为已经显示它们在大肠杆菌SSO中被很好地解码。通过使用T7 RNA聚合酶进行体外转录反应来产生所希望的mRNA和同源tRNA。将ChPylRS引入质粒(pcDNA3.1_C211_IRES_mCherry)上,所述质粒具有通过内部核糖体结合位点连接的编码ChPylRS和mCherry标记二者的双顺反子序列。当它们达到50%汇合度时,用此质粒转染HEK293T细胞。使细胞生长24h以允许ChPyRS的表达,并且然后将N6-((叠氮乙氧基)-羰基)-L-赖氨酸(AzK)添加到培养基中,并且仅用mRNA(作为对照)或用mRNA和对应的同源非天然tRNA转染细胞。在另外24h后收获细胞,并且经由流式细胞术定量表达mCherry标记的细胞中的EGFP产生。在没有tRNA的对照中,用EGFP(AXC)151和EGFP(GXC)151mRNA转染导致低但可检测水平的EGFP信号,据推测这是由于当其同源tRNA不存在时,非天然密码子的通读所致。相反,用非天然mRNA和同源非天然tRNA二者转染的细胞展现出增加的荧光。尽管用EGFP(AXC)151实现的增加适中,但是用EGFP(GXC)151实现的增加更显著(图5A)。
基于相对较大的tRNA依赖性荧光增加,检查用EGFP(GXC)151构建体产生的蛋白质。使总细胞裂解物经受应变促进的点击化学以附接羧基-四甲基-罗丹明(TAMRA)染料(DBCO-TAMRA),已经显示其使EGFP的电泳迁移率移位(如由SDS-PAGE所分析)并且因此使得能够通过蛋白质印迹评估N6-((叠氮乙氧基)-羰基)-L-赖氨酸(AzK)掺入的保真度。差异的EGFP信号是明显的(图5B),其中对于由用合成酶质粒EGFP(GXC)151mRNA和tRNAPyl(GYC)转染并且在补充有N6-((叠氮乙氧基)-羰基)-L-赖氨酸(AzK)的培养基中生长的细胞制备的裂解物,移位为大约70%。相反,在由在没有同源非天然tRNA的情况下转染的细胞制备的裂解物中几乎没有观察到移位的条带。尽管EGFP的低表达水平妨碍了进一步的表征,但这些数据强烈表明,通过使用具有同源非天然反密码子的tRNA解码非天然密码子,N6-((叠氮乙氧基)-羰基)-L-赖氨酸(AzK)被掺入EGFP中。
实施例2:在CHO细胞中非天然密码子的翻译
使用FRT/Flp重组系统构建稳定表达ChPylRS的异质CHO细胞系CHO-KS3,从而将转染减少为单个RNA共转染步骤。用EGFP(AXC)151、EGFP(GXC)151或EGFP(GXC)151mRNA和同源tRNA转染CHO-KS3细胞;并且当细胞达到80%汇合度时,将N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)添加到生长培养基中。在一天孵育后收获细胞,并且然后直接经受流式细胞术以检测EGFP荧光。未提供同源非天然tRNA的对照细胞显示出类似的低但可检测水平的EGFP信号。相反,用同源非天然tRNA转染的细胞展现出显著增加的荧光,其中EGFP(AXC)151产生最高的荧光信号/个细胞并且EGFP(GXU)151产生最低的荧光信号/个细胞,但在所有情况下荧光都高于对于HEK293T细胞所观察到的荧光(图6A-图6B)。
选择上面探究的NaM密码子,因为它们被大肠杆菌核糖体很好地翻译。相反,大肠杆菌核糖体似乎不能翻译含有TPT3的密码子。为了产生原核核糖体与真核核糖体之间的比较结构-活性关系,产生EGFP(AYC)151、EGFP(GYC)151和EGFP(GYU)151以及其同源非天然tRNAtRNAPyl(GXU)、tRNAPyl(GXC)和tRNAPyl(AXC),并且将它们用于转染CHO-KS3细胞。与大肠杆菌SSO相反,与在没有tRNA的情况下转染的对照相比,当CHO-KS3细胞用其同源tRNA转染时,所有三个TPT3密码子都导致荧光增加,并且事实上,EGFP(GYU)151实现的荧光水平与用类似NaM密码子(GXU)观察到的荧光水平类似(图6A-图6B)。
在CHO-KS3细胞中EGFP表达水平较高的情况下,我们选择EGFP(AXC)151、EGFP(GXC)151、EGFP(GXU)151和EGFP(GYC)151用于更多的定量表征。使用串联C-末端Strep标签II从细胞裂解物亲和纯化EGFP,并且用DBCO-TAMRA染料经受点击化学,如上所述。然后通过蛋白质印迹分析纯化的EGFP。从用天然EGFP mRNA转染的对照细胞中,观察到显性条带以及较快迁移的较弱条带(图6B)。较快迁移的条带归因于Strep标签部分降解(数据未示出)。如所预期的,两个条带都没有显示出TAMRA信号。对于每种非天然mRNA及其同源tRNA进行的转染,观察到一组类似的两个条带,但这两个条带都移位并且显示出TAMRA信号。这些结果表明,在CHO细胞中,通过用同源非天然反密码子解码NaM或TPT3密码子,N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)被掺入EGFP中。
为了证实N6-((叠氮乙氧基)-羰基)-L-赖氨酸(AzK)的正确编码,使用液相色谱-串联质谱法(LC-MS/MS)分析从用EGFP(GXC)151或EGFP(GYC)151mRNA及其同源tRNA转染的CHO-KS3细胞纯化的蛋白质。如上所述从转染的细胞中纯化EGFP,并且然后经受铜催化的点击化学以将3-丁炔基苯部分附接至AzK,以促进MS分析。经由SDS-PAGE并且切割在25kDa与32kDa之间的条带而纯化反应产物,基于先前的凝胶移位测定,所述条带包括移位的EGFP条带和未移位的EGFP条带二者。用胰蛋白酶消化从凝胶切片回收的蛋白质,并且经受纳米-LC-MS/MS分析。检测含有EGFP氨基酸位点151的肽片段,其质量对应于点击反应产物,证实了在位点151处N6-((叠氮乙氧基)-羰基)-L-赖氨酸(AzK)的特异性掺入。未检测到未经修饰的肽,并且尽管不是定量的,但这个观察结果证实了N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)的掺入并且表明其以至少合理的保真度发生。尽管仍需要探究更彻底的序列上下文分析,但这些数据证明,与其大肠杆菌对应物不同,哺乳动物核糖体能够解码含有NaM或TPT3的非天然密码子。
先前已经显示大肠杆菌SSO也能够翻译几种密码子,这些密码子在第三位置具有非天然核苷酸NaM,包括密码子AGX。然而,与第二位置相反,解码在“杂配对”tRNAPyl(YCT)或“自配对”tRNAPyl(XCT)的情况下发生(图5)。在第三位置处的NaM-NaM自配对可以以类似于在第三位置处天然密码子的摆动配对的方式被促进。为了探究哺乳动物细胞中用自配对同源tRNA进行的解码,接下来在相同的mRNA上下文中测试AGX密码子。将CHO-KS3细胞用单独的EGFP(AGX)151mRNA转染,或者与tRNAPyl(YCT)或tRNAPyl(XCT)一起共转染。如第二位置非天然密码子那样,流式细胞术揭示了在没有任何tRNA转染的细胞的情况下有少量的通读EGFP表达。用tRNAPyl(YCT)进行的共转染导致荧光显著增加,而用tRNAPyl(XCT)(自配对tRNA)进行的共转染导致甚至更大程度的荧光增加(图6A)。然后我们使用上述相同的蛋白质移位测定来进一步评估由非天然密码子AGX产生的EGFP。在从用tRNAPyl(YCT)或tRNAPyl(XCT)共转染的细胞中纯化的蛋白质中检测到移位的条带(图6B)。在两种情况下,再次观察到两个移位的条带,而几乎没有可见的未移位的条带。这些结果证明,至少对于AGX密码子,经由异源配对或自配对进行解码是至少合理有效的。
TPT3密码子的结果证明在原核核糖体与真核核糖体之间有明显差异。为了进一步比较这些核糖体,翻译大肠杆菌核糖体似乎不能解码的在第一位置具有非天然核苷酸的密码子。体外产生EGFP(XCC)151和EGFP(YCC)151mRNA,并且分别在没有或有其同源非天然tRNAPyl(GGY)或tRNAPyl(GGX)的情况下转染到CHO-KS3细胞中。使用流式细胞术的分析表明,当在两种情况下不添加tRNA时,有少量的通读,并且与EGFP(XCC)151相比,EGFP(YCC)151导致相对更高的EGFP信号。当添加对应的tRNA时,在用EGFP(XCC)151的情况下观察到EGFP信号有少量增加,但在用EGFP(YCC)151的情况下未观察到EGFP信号的显著增加(图6)。在两种情况下,EGFP产量对于蛋白质印迹分析都太低。这些数据表明,如大肠杆菌核糖体那样,第一位置非天然密码子未被很好地解码。这可能是由于I型A-minor相互作用,由此核糖体在密码子的第一位置选择沃森-克里克样结构。
实施例3:在具有CYBA UTR的mRNA与具有CS2 UTR的mRNA之间的蛋白质表达比
检查交替5'UTR和3'UTR的使用。已经报道CYBA 5'UTR和CYBA 3'UTR的组合使用增加了蛋白质产生,而不影响它们在人细胞中的半衰期。构建具有以上测试的所有9种非天然密码子并且CS2 UTR被CYBA UTR替代的EGFP序列(CYBA-EGFP(NX/YN)151)。用这些新构建的mRNA在没有或有同源非天然tRNA的情况下转染CHO-KS3细胞。然后经由流式细胞术分析细胞,并且将结果与其具有CS2 UTR的对应物进行比较。流式细胞术数据表明,在所有情况下,在有CYBA UTR的情况下产生的蛋白质比其CS2对应物产生的蛋白质少。对于CYBA-EGFP(GXC)151和CYBA-EGFP(GYC)151转染的细胞,我们也使用如上所述的凝胶移位测定评估非天然密码子解码保真度。观察到的移位分别与对于CS2 UTR对应物(EGFP(GXC)151和EGFP(GYC)151)观察到的移位类似(图7A-图7B),证明通过改变侧翼UTR没有显著影响解码保真度。
尽管在CYBA UTR的情况下观察到的表达水平降低可能是由于使用了仓鼠细胞而不是人细胞,但我们还注意到,非常出乎意料地,在用不同的非天然密码子的情况下,效果程度显著不同。当用其同源非天然tRNA(与AGX密码子一起使用自配对tRNA)转染时,XCC、YCC、GXU和GYU密码子在CYBA UTR的情况下展现出的表达水平是其CS2对应物的约60%,而AXC、AYC、GXC、GYC和AGX密码子在CYBA UTR的情况下的表达水平仅为其CS2对应物的约30%(图7A-图7D)。使用琥珀构建体CYBA-EGFP(TA G)151和天然构建体CYBA-EGFP(TAC)151作为对照。CYBA-EGFP(TAG)151和CYBA-EGFP(TAC)151展现出的表达水平是其CS2 UTR对应物的约60%和约80%。
为了测试这种非天然密码子依赖性UTR效应是否可能起源于mRNA稳定性的差异,使用逆转录与定量PCR结合,对于EGFP(UAC)151、EGFP(GXC)151、EGFP(GXU)151、CYBA-EGFP(UAC)151、CYBA-EGFP(GXC)151和CYBA-EGFP(GXU)151,将转染后8hmRNA的水平与转染后4h的水平相比较。在这些不同构建体中观察到的降解差异没有说明上述显著的比率差异(图6),并且因此必定是其他因素的原因。认为UTR影响翻译的一种方式是通过调节核糖体募集效率。然而,难以合理解释这如何影响远离5'UTR或3'UTR(在这种情况下,相距至少350nt)的密码子的翻译。有趣的是,已知多个核糖体亚群存在于单个细胞中,并且可以例如通过可变的翻译延伸能力来区分。与天然密码子的翻译不同,这在原理上可以更显著地影响核糖体如何处理不同的非天然密码子,可能与我们的观察类似,即来自原核生物和真核生物的核糖体以不同的方式解码不同的非天然密码子。需要进一步的实验来解开这种令人着迷的可能性。
本文公开的结果证明,非天然密码子可以在HEK293T细胞和CHO细胞二者中以至少合理的效率和保真度被解码。有趣的是,被真核核糖体的识别显示出与由大肠杆菌核糖体介导的识别的相似性和差异二者。第一位置密码子XCC和YCC不能在大肠杆菌或CHO细胞中以良好的效率被解码;第二位置NaM密码子AXC、GXC和GXU可以在大肠杆菌和CHO细胞二者中以良好的效率被解码;第二位置密码子TPT3密码子AYC、GYC和GYU不能在大肠杆菌中被解码,但有趣的是可以在CHO细胞中被解码;并且第三位置密码子AGX可以在大肠杆菌和CHO细胞二者中由其同源异源配对tRNA以及其非同源自配对tRNA二者解码。
实施例4:方法
实施例1-3中使用的材料和方法如下:
材料。实施例1-4中使用的质粒和引物可以在表1和表2中找到。引物和天然寡核苷酸购自IDT(爱荷华科勒尔维尔)。通过Genewiz(加利福尼亚州圣地亚哥)进行测序。使用商业化小量制备试剂盒(miniprep kit)(产品#D4013,Zymo Research;加利福尼亚州欧文)纯化质粒。使用商业化DNA纯化试剂盒(D4054,Zymo Research)纯化PCR产物,并且使用Infinite M200 Pro酶标仪(TECAN)定量。所有涉及RNA物种的实验都是用无RNA酶试剂、移液管吸头、试管和手套进行的,以避免污染。商业上合成了dNAM、dTPT3、NAM、TPT3、d5SICS和dMMO2bio的核苷(WuXi AppTec;中国上海)并且使其三磷酸化(TriLink BioTechnologiesLLC;加利福尼亚州圣地亚哥;和MyChem LLC;加利福尼亚州圣地亚哥)。所有非天然寡核苷酸都是由Biosearch Technologies(加利福尼亚州佩塔卢马)合成的,通过HPLC纯化。
合成酶质粒的构建。嵌合合成酶ChPylPS_C211序列自pGEX_ChPylRS克隆,其描述于Fischer等人,Nat.Chem.Biol.16:570-576(2020)中。通过使用一系列限制性酶将ChPylRS、IRES和mCherry序列一个接一个地克隆到pcDNA3.1载体中来制备pcDNA3.1_C211_IRES_mCh。
EGFP和tRNA模板的构建。通过如先前所述金门(Golden Gate)组装但用EGFP序列上下文代替sfGFP上下文(参见Zhang等人,Nature 551:644-647(2017))来制备EGFP模板质粒pUCCS2_EGFP(NNN)和pUCCYBA_EGFP(NNN)。所有金门组装中使用的插入物都是用合成的含dNaM的寡核苷酸和引物YZ73和YZ74产生的PCR产物(参见表1)。在金门组装后纯化质粒pUCCS2_EGFP(NNN)和pUCCYBA_EGFP(NNN),并且使用Qubit(ThermoFisher)定量。将EGFP模板质粒(2ng)用于模板产生PCR反应中,其中对于pUCCS2_EGFP(NNN),使用引物ED101和AZ38,并且对于pUCCYBA_EGFP(NNN),使用引物ED101和AZ87。使PCR产物经受DpnI消化,并且然后纯化以产生EGFP模板,用于体外转录(见下文)。通过直接PCR由合成的含dNaM的寡核苷酸用引物AZ01和AZ67制备tRNA模板。将PCR产物纯化以产生体外转录中的tRNA模板。
生物素移位测定。如先前工作所述,使用d5SICSTP和dMMO2bio-TP用引物YZ73和YZ7测定RNA物种的模板中非天然碱基对的保留(参见Zhang等人,Nature551:644-647(2017))。使用Image Lab(BioRad)定量图像。通过将每个样品的原始移位百分比除以当构建EGFP质粒时在金门组装中使用的合成的含dNaM寡核苷酸模板的原始移位百分比来将非天然碱基对保留归一化。
EGFP mRNA的体外转录。在每个体外转录反应(HiScribe T7 ARCA,加尾,E2060S,New England Biolabs,(NEB))中使用模板(500-1000ng),相应地使用或不使用1.25mM非天然核糖核三磷酸,然后纯化(D7010,Zymo Research)。通过Qubit定量mRNA产物,并且然后以5μg等分试样储存在-80℃。
tRNA的体外转录。在每个体外转录反应(T7 RNA聚合酶,E0251L,NEB)中使用模板(500ng-1000ng),相应地使用或不使用2mM非天然核糖核三磷酸,然后纯化(D7010,Zymo)。通过Qubit定量tRNA产物,并且然后经受重折叠(95℃,1min,37℃,1min,10℃,2min)。将所有tRNA以1800ng等份试样储存在-80℃。
稳定细胞系的构建。经由平端连接克隆用潮霉素抗性盒HygroResist替代pcDNA3.1_C211_IRES_mCherry中的卡那霉素抗性盒KanR来制备含合成酶的质粒pcDNA3.1_FRT_HygroResist_C211_IRES_mCherry。使用Flp-InTM T-RExTM系统(ThermoFisher)根据制造商的说明书修饰CHO-KS3异质细胞系以稳定表达ChPylRS C211。在10%FBS、1%PS DMEM/F12培养物中回收原始Flip-inTM CHO-K1细胞。用pOG44和pcDNA3.1_C211_IRES_mCherry(对照)或pcDNA3.1_FRT_HygroResist_C211_IRES_mCherry共转染细胞。用100μg/mL潮霉素B(Sigma Aldrich)选择成功的重组细胞两周(每四天一次更新细胞培养基),直至对照组中的所有细胞死亡。然后通过胰蛋白酶(25200056,Life Technol ogy Invitrogen)消化(在37℃下5min)分离用pcDNA3.1_FRT_HygroResist_C211_IRES_mCherry转染的细胞,并且用含有100μg/mL潮霉素B的细胞培养基传代另外两轮。
细胞转染。在耗尽前一培养基后,将含有1mM AzK的新鲜细胞培养物添加到细胞培养板。对于RNA转染,使用Lipofectamine MessengerMax(ThermoFisher)根据试剂手册用RNA物种转染细胞。对于每个转染实验,将300ng mRNA和900ng tRNA各自与0.75μLlipofectamine试剂混合,并且单独地添加到细胞培养物(24孔平底聚苯乙烯微孔板的1个孔)中。对于DNA转染,使用Lipofectamine 3000(LMRNA008,ThermoFisher)根据试剂手册用DNA物种转染细胞。对于每个转染实验,将500ng DNA质粒与1.5μLlipofectamine试剂混合,并且添加到细胞培养物(24孔板的1个孔)中。在一些情况下,在12孔板中转染细胞,并且使转染试剂和RNA的体积加倍。
流式细胞术。通过胰蛋白酶消化(在37℃下5min)分离细胞并且然后用1’达尔伯克磷酸盐缓冲盐水(DPBS)洗涤。然后收集细胞并且在分选缓冲液(具有1%FBS的1'DPBS)中稀释,并且然后通过流式细胞术使用LSR II分析流式细胞仪(BD;用488nm激光和530/30滤光片检测EGFP信号)分析EGFP信号。
全细胞裂解物制备。通过胰蛋白酶消化(在37℃下5min)然后DPBS洗涤来分离来自转染实验的细胞。然后收集细胞,并且使用供应有HALT蛋白酶抑制剂(78430,ThermoFisher)的M-PER(78503,Thermo Fisher)根据试剂手册裂解。使用离心过滤器(AmiconUltra-0.5mL离心过滤器,10kDa NMWL,UFC501024,Millipore)使裂解物经受超滤以除去未掺入的AzK。将裂解物用含HALT的DPBS(’3)洗涤。在最后的洗涤步骤中将裂解物浓缩至体积为20μL。所有超滤都在4℃下以14,000rpm进行10min(5415C,Eppendorf)。
EGFP的亲和纯化。使用供应有HALT蛋白酶抑制剂的M-PER根据试剂手册裂解自转染实验收集的细胞。使用Infinite M200 Pro酶标仪和EGFP标准曲线确定裂解物样品中的EGFP浓度(荧光a.u.)。将含有200ng EGFP当量的裂解物用缓冲液W(50mM HEPES pH 8、150mM NaCl、1mM EDTA)稀释到200μL,并且与10μL磁性Strep-Tactin珠粒(5%(v/v)MagStrep‘3型’XT珠粒悬浮液,产品#2-4090-002,IBA Lifesciences,德国哥廷根)混合。根据试剂手册在延长的结合时间下进行纯化(在4℃下2h)。EGFP未从珠粒上洗脱。将珠粒-EGFP缀合物直接用于以下实验。
EGFP的点击反应。如先前工作(参见Zhang等人,Nature 551:644-647(2017))中所述在修改下进行点击反应。简短地讲,将来自亲和纯化步骤的珠粒-EGFP缀合物在20μLDPBS中稀释。将混合物与25μM TAMRA-DBCO(产品#A131,Click Chemistry Tools;亚利桑纳州斯科茨代尔)一起在37℃下在黑暗中孵育1h。可替代地,将来自亲和纯化步骤的珠粒-EGFP缀合物在20μL DPBS中稀释。将混合物与2mM三(3-羟丙基三唑基甲基)胺(THPTA)(CAS760952-88-3,Sigma-Aldrich)、1mM CuSO4、15mM抗坏血酸钠(CAS 134-03-2,Sigma-Aldrich)和0.5mM 4-苯基-1-丁炔(CAS 16520-62-0,Sigma-Aldrich)一起在37℃下在黑暗中孵育1h。通过以下方式进行经处理的全细胞裂解物的点击反应:将20μL超滤的细胞裂解物与25μM碘乙酰胺(CAS 144-48-9,Sigma-Aldrich)一起在37℃孵育1h,然后将得到的混合物与25μM DBCO-TAMRA一起在37℃下在黑暗中孵育1h。
蛋白质印迹蛋白质移位测定。如先前工作2所述在一定的修改下进行蛋白质印迹蛋白质移位测定。简短地讲,将点击反应混合物在1'蛋白质加载染料(250mM Tris-HCl、30%(v/v)甘油、2%(w/v)SDS)中在95℃下直接煮沸15min;并且在SDS-PAGE(使用5%(w/v)丙烯酰胺:双丙烯酰胺29:1(Fisher)、0.125M TrisHCl和0.1%SDS的浓缩胶(pH 6.8)(ProtoGel浓缩缓冲液,National Diagnostics));和15%(w/v)丙烯酰胺:双丙烯酰胺29:1(Fisher)、0.375M Tris-HCl和0.1%SDS的分离胶(pH 8.8)(ProtoGel分离缓冲液,National Diagnostics);1.5mm垫片Mini-PROTEAN短板(Bio-Rad))上用蛋白梯(彩色预染蛋白质标准品,宽范围,NEB)分离产物。在SDS-PAGE缓冲液(25mM Tris碱、200mM甘氨酸、0.1%(w/v)SDS)中在60V下跑胶30min,并且然后在135V下跑胶约3h。然后通过用含有20%(v/v)MeOH、50mM Tris碱、400mM甘氨酸、0.0373%(w/v)SDS的缓冲液在22V下进行半干式转移21min将条带转移到PVDF膜(0.2μm,Bio-Rad)。在室温下用在PBS-T(PBS pH 7.4,0.01%(v/v)Tween-20)中的5%(w/v)脱脂乳将膜封闭1h-2h,接着与兔抗GFP抗体(产品#G1544,批号046M4871V,Sigma-Aldrich;在PBS-T中1:3000)一起在4℃下孵育过夜。接下来,将膜用PBS-T洗涤2'5min,然后与羊抗兔Alexa Fluor 647缀合抗体(产品#A32733,批号SD250298,Thermo Fisher Scientific;在PBS-T中1:20000)一起在室温下孵育1h。将膜用PBS-T洗涤3'5min,并且通过磷成像(Typhoon 9410;Build S4 410 5.0.0409.0700,GE HealthcareLife Sciences)使用50-μm分辨率可视化;对于TAMRA,532-nm激光激发和580/30-nm发射光滤光片,400VPMT;对于Alexa Fluor 647,622-nm激光激发和670/30-nm发射光滤光片,500VPMT。图像被假着色并且使用ImageJ覆盖,将条带使用Image Lab(Bio-Rad)定量。
质谱法。将用4-苯基-1-丁炔点击的珠粒-EGFP缀合物直接与1'蛋白质加载染料一起在95℃下煮沸15min,并且经受SDS-PAGE(基本上与上述蛋白质印迹蛋白质移位一样,用蛋白梯进行)。在SDS-PAGE缓冲液中在60V下跑胶30min并且然后在135V下跑胶约30min。切割并且收集在25kDa与32kDa之间的凝胶条带,然后进行还原(10mM DTT)、烷基化(55mM碘乙酰胺)并且使用胰蛋白酶消化。然后如先前所述通过纳米-LC-MS/MS分析样品(参见Powers等人,J.Bacteriol.193:340-348(2011))。简短地讲,用Thermo Finnigan LTQ线性离子阱质谱仪在尖端在2kV下使用自建的纳升电喷雾源,获得数据依赖性MS/MS数据。在应用动态排除列表之后,在一个MS谱之后,对最丰富的离子进行4次MS/MS扫描。通过使用Xcalibur软件提取串联质谱。所有MS/MS样品都通过使用Mascot(2.1.04版;Matrix Science,英国伦敦)分析,其中提供了EGFP序列,假定为消化酶胰蛋白酶。
完整蛋白质的定量高分辨率质谱。完整蛋白质的质谱如先前所述进行(参见Feldman等人,J.Am.Chem.Soc.141:10644-10653(2019))。将纯化的EGFP蛋白(5μg)用水(质谱级)稀释,并且通过超滤(Amicon Ultra-0.5mL离心过滤器,10kDa NMWL,UFC501024,Millipore)脱盐。然后将脱盐的蛋白质(6μL,约250ng)注射到与Waters G2-XS TOF连接的Waters IClass LC中。流量条件为0.4mL/min的50:50水:乙腈加0.1%甲酸。通过ESI+进行电离,收集的数据在m/z 500与m/z 2000之间。对峰的主要部分进行光谱组合,并且使用Waters MaxEnt1对组合光谱进行解卷积。
mRNA衰变测定。对于每种测试的mRNA,用600ng mRNA和1800ng的对应tRNA转染12孔板中的2个孔的CHO-KS1细胞,随后向细胞培养物中添加1mM AzK。在4h孵育后,用DPBS洗涤两个孔的细胞两次并且然后使用TRIzole试剂(15596026,Thermo Fisher;对于每个孔使用400uL TRIzole)收获1个孔中的细胞。同时,耗尽另一孔中的细胞培养物(含有转染试剂)并且添加新鲜细胞培养基。另外4h(总共8h)后,将来自剩余孔的细胞两次用DPBS洗涤,并且然后使用TRIzole收获。使用总RNA提取试剂盒(R1013,Zymo)纯化两个TRIzole溶液样品。使用来自每个样品的总RNA(1000ng)作为RT-qPCR的模板,使用引物AZ112和AZ86(适用于CS2UTR和CYBA UTR二者),使用来自其的Cq值计算对应总RNA样品中mRNA的起始量。使用从体外转录制备的纯化的对应天然mRNA来构建用于定量参考的标准曲线。mRNA从4h(转染过程结束)到8h衰减的百分比通过将在4h与8h之间的mRNA差异量除以4h时的mRNA量来计算。
表1.引物
表2.寡核苷酸
其他序列
IRES(SEQ ID NO:33):
CATCTAGGGCGGCCAATTCCGCCCCTCTCCCTCCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTGATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAGCTTGCCAC
mCherry(SEQ ID NO:34)
ATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAA
ChPylRS_C211(SEQ ID NO:35)
ATGGATAAAAAACCGCTGGACGTTCTGATCTCCGCTACGGGTCTGTGGATGAGCCGCACGGGTACGCTGCATAAAATCAAGCACTATGAGATTTCTCGTTCTAAAATCTACATCGAAATGGCGTGTGGTGACCATCTGGTTGTGAACAACTCTCGTTCTTGTCGTCCGGCACGTGCATTCCGTTATCATAAATACCGTAAAACCTGCAAACGTTGTCGTGTTTCTGACGAAGATATCAACAACTTCCTGACCCGTTCTACCGAAGGCAAAACCTCTGTTAAAGTTAAAGTTGTTTCTGAACCGAAAGTGAAAAAAGCGATGCCGAAATCTGTTTCTCGTGCGCCGAAACCGCTGGAAAATCCGGTTTCTGCGAAAGCGTCTACCGACACCTCTCGTTCTGTTCCGTCTCCGGCGAAATCTACCCCGAACTCTCCGGTTCCGACCTCTGCAAGTGCCCCCGCACTTACGAAGAGCCAGACTGACAGGCTTGAAGTCCTGTTAAACCCAAAAGATGAGATTTCCCTGAATTCCGGCAAGCCTTTCAGGGAGCTTGAGTCCGAATTGCTCTCTCGCAGAAAAAAAGACCTGCAGCAGATCTACGCGGAAGAAAGGGAGAATTATCTGGGGAAACTCGAGCGTGAAATTACCAGGTTCTTTGTGGACAGGGGTTTTCTGGAAATAAAATCCCCGATCCTGATCCCTCTTGAGTATATCGAAAGGATGGGCATTGATAATGATACCGAACTTTCAAAACAGATCTTCAGGGTTGACAAGAACTTCTGCCTGAGACCCATGCTTGCTCCAAACCTTTACAACTACCTGCGCAAGCTTGACAGGGCCCTGCCTGATCCAATAAAAATTTTTGAAATAGGCCCATGCTACAGAAAAGAGTCCGACGGCAAAGAACACCTCGAAGAGTTTACCATGCTGAACTTCTGCCAGATGGGATCGGGATGCACACGGGAAAATCTTGAAAGCATAATTACGGACTTCCTGAACCACCTGGGAATTGATTTCAAGATCGTAGGCGATTCCTGCATGGTCTATGGGGATACCCTTGATGTAATGCACGGAGACCTGGAACTTTCCTCTGCAGTAGTCGGACCCATACCGCTTGACCGGGAATGGGGTATTGATAAACCCTGGATAGGGGCAGGTTTCGGACTCGAACGCCTTCTAAAGGTTAAACACGACTTTAAAAATATCAAGAGAGCTGCACGCTCGGAATCGTATTACAACGGCATCTCAACCAATCTGTAA
CS2 5’UTR(SEQ ID NO:36):
GAATACAAGCTACTTGTTCTTTTTGCAGGATCCGCCACC
CS2 3’UTR(SEQ ID NO:37):
AAGCTTAATTAGCTGAGCTTGGACTCCTAAGCATGCAAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGG
CYBA 5’UTR(SEQ ID NO:38):
CGCGCCTAGCAGTGTCCCAGCCGGGTTCGTGTCGCC
CYBA 3’UTR(SEQ ID NO:39):
CCTCGCCCCGGACCTGCCCTCCCGCCAGGTGCACCCACCTGCAATAAATGCAGCGAAGCCGGGA
EGFP(金门载体)(具有2xStrep标签)(SEQ ID NO:40):
ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGAGACCCTCGAGAATATTCTCGAGGGTCTCGGAATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGAAGCTTTGGAGCCACCCGCAGTTCGAGAAAGGTGGAGGTTCCGGAGGTGGATCGGGAGGTTCGGCGTGGAGCCACCCGCAGTTCGAAAAATAA
FLP(SEQ ID NO:41)
ATGCCACAATTTGATATATTATGTAAAACACCACCTAAGGTGCTTGTTCGTCAGTTTGTGGAAAGGTTTGAAAGACCTTCAGGTGAGAAAATAGCATTATGTGCTGCTGAACTAACCTATTTATGTTGGATGATTACACATAACGGAACAGCAATCAAGAGAGCCACATTCATGAGCTATAATACTATCATAAGCAATTCGCTGAGTTTGGATATTGTCAACAAGTCACTGCAGTTTAAATACAAGACGCAAAAAGCAACAATTCTGGAAGCCTCATTAAAGAAATTGATTCCTGCTTGGGAATTTACAATTATTCCTTACTATGGACAAAAACATCAATCTGATATCACTGATATTGTAAGTAGTTTGCAATTACAGTTCGAATCATCGGAAGAAGCAGATAAGGGAAATAGCCACAGTAAAAAAATGCTTAAAGCACTTCTAAGTGAGGGTGAAAGCATCTGGGAGATCACTGAGAAAATACTAAATTCGTTTGAGTATACTTCGAGATTTACAAAAACAAAAACTTTATACCAATTCCTCTTCCTAGCTACTTTCATCAATTGTGGAAGATTCAGCGATATTAAGAACGTTGATCCGAAATCATTTAAATTAGTCCAAAATAAGTATCTGGGAGTAATAATCCAGTGTTTAGTGACAGAGACAAAGACAAGCGTTAGTAGGCACATATACTTCTTTAGCGCAAGGGGTAGGATCGATCCACTTGTATATTTGGATGAATTTTTGAGGAATTCTGAACCAGTCCTAAAACGAGTAAATAGGACCGGCAATTCTTCAAGCAACAAGCAGGAATACCAATTATTAAAAGATAACTTAGTCAGATCGTACAACAAAGCTTTGAAGAAAAATGCGCCTTATTCAATCTTTGCTATAAAAAATGGCCCAAAATCTCACATTGGAAGACATTTGATGACCTCATTTCTTTCAATGAAGGGCCTAACGGAGTTGACTAATGTTGTGGGAAATTGGAGCGATAAGCGTGCTTCTGCCGTGGCCAGGACAACGTATACTCATCAGATAACAGCAATACCTGATCACTACTTCGCACTAGTTTCTCGGTACTATGCATATGATCCAATATCAAAGGAAATGATAGCATTGAAGGATGAGACTAATCCAATTGAGGAGTGGCAGCATATAGAACAGCTAAAGGGTAGTGCTGAAGGAAGCATACGATACCCCGCATGGAATGGGATAATATCACAGGAGGTACTAGACTACCTTTCATCCTACATAAATAGACGCATATAA
FRT(SEQ ID NO:42)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAACTTC
虽然本文中已经显示并且描述了本公开文本的优选实施方案,但是对于本领域技术人员明显的是,此类实施方案仅以举例的方式来提供。在不背离本公开文本的情况下,本领域技术人员现在将想到许多变化、改变和取代。应理解,本文描述的本公开文本的实施方案的不同替代方案可以用于实施本公开文本。以下权利要求旨在限定本发明的范围,并且由此涵盖这些权利要求及其等同物范围内的方法和结构。
序列表
<110> 斯克利普斯研究所
<120> 真核半合成生物体
<130> 36271-810.601
<140>
<141>
<150> 62/908,421
<151> 2019-09-30
<160> 42
<170> PatentIn 3.5版
<210> 1
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 1
gacaaattaa tacgactcac tataggaaac ctgatcatgt agatcgaac 49
<210> 2
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 2
ccccaggctt tacactttat g 21
<210> 3
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 3
tggcggaaac cccgggaatc taacccggct gaacggatt 39
<210> 4
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 4
tccacgccga acctcccgat c 21
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 5
tcccggcttc gctgcattta ttgc 24
<210> 6
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 6
aaaatcacgg cagacaaaca aaagaatgg 29
<210> 7
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 7
atgggtctca cacaaactcg agtacaactt taactcacac 40
<210> 8
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 8
atgggtctcg attccattct tttgtttgtc tgc 33
<210> 9
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 9
taatacgact cactatagg 19
<210> 10
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 10
ctcgagtaca actttaactc acacaatgta tacatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 11
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 11
ctcgagtaca actttaactc acacaatgta gtaatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 12
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (32)..(32)
<223> 烟酰胺修饰的核苷酸
<400> 12
ctcgagtaca actttaactc acacaatgta ancatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 13
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (32)..(32)
<223> TPT3修饰的核苷酸
<400> 13
ctcgagtaca actttaactc acacaatgta ancatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 14
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (32)..(32)
<223> 烟酰胺修饰的核苷酸
<400> 14
ctcgagtaca actttaactc acacaatgta gncatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 15
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (32)..(32)
<223> TPT3修饰的核苷酸
<400> 15
ctcgagtaca actttaactc acacaatgta gncatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 16
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (32)..(32)
<223> 烟酰胺修饰的核苷酸
<400> 16
ctcgagtaca actttaactc acacaatgta gntatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 17
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (32)..(32)
<223> TPT3修饰的核苷酸
<400> 17
ctcgagtaca actttaactc acacaatgta gntatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 18
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (33)..(33)
<223> 烟酰胺修饰的核苷酸
<400> 18
ctcgagtaca actttaactc acacaatgta agnatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 19
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (31)..(31)
<223> 烟酰胺修饰的核苷酸
<400> 19
ctcgagtaca actttaactc acacaatgta nccatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 20
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (31)..(31)
<223> TPT3修饰的核苷酸
<400> 20
ctcgagtaca actttaactc acacaatgta nccatcacgg cagacaaaca aaagaatgga 60
atc 63
<210> 21
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 21
cctgatcatg tagatcgaac ggactgtaaa tccgttcagc cgggttagat tc 52
<210> 22
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 22
cctgatcatg tagatcgaac ggactctaaa tccgttcagc cgggttagat tc 52
<210> 23
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (27)..(27)
<223> TPT3修饰的核苷酸
<400> 23
cctgatcatg tagatcgaac ggactgntaa tccgttcagc cgggttagat tc 52
<210> 24
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (27)..(27)
<223> 烟酰胺修饰的核苷酸
<400> 24
cctgatcatg tagatcgaac ggactgntaa tccgttcagc cgggttagat tc 52
<210> 25
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (27)..(27)
<223> TPT3修饰的核苷酸
<400> 25
cctgatcatg tagatcgaac ggactgncaa tccgttcagc cgggttagat tc 52
<210> 26
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (27)..(27)
<223> 烟酰胺修饰的核苷酸
<400> 26
cctgatcatg tagatcgaac ggactgncaa tccgttcagc cgggttagat tc 52
<210> 27
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (27)..(27)
<223> TPT3修饰的核苷酸
<400> 27
cctgatcatg tagatcgaac ggactancaa tccgttcagc cgggttagat tc 52
<210> 28
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (27)..(27)
<223> 烟酰胺修饰的核苷酸
<400> 28
cctgatcatg tagatcgaac ggactancaa tccgttcagc cgggttagat tc 52
<210> 29
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (26)..(26)
<223> TPT3修饰的核苷酸
<400> 29
cctgatcatg tagatcgaac ggactnctaa tccgttcagc cgggttagat tc 52
<210> 30
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (26)..(26)
<223> 烟酰胺修饰的核苷酸
<400> 30
cctgatcatg tagatcgaac ggactnctaa tccgttcagc cgggttagat tc 52
<210> 31
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (28)..(28)
<223> TPT3修饰的核苷酸
<400> 31
cctgatcatg tagatcgaac ggactggnaa tccgttcagc cgggttagat tc 52
<210> 32
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> 经修饰的碱基
<222> (28)..(28)
<223> 烟酰胺修饰的核苷酸
<400> 32
cctgatcatg tagatcgaac ggactggnaa tccgttcagc cgggttagat tc 52
<210> 33
<211> 604
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 33
catctagggc ggccaattcc gcccctctcc ctcccccccc cctaacgtta ctggccgaag 60
ccgcttggaa taaggccggt gtgcgtttgt ctatatgtga ttttccacca tattgccgtc 120
ttttggcaat gtgagggccc ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg 180
tctttcccct ctcgccaaag gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc 240
tctggaagct tcttgaagac aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc 300
cccacctggc gacaggtgcc tctgcggcca aaagccacgt gtataagata cacctgcaaa 360
ggcggcacaa ccccagtgcc acgttgtgag ttggatagtt gtggaaagag tcaaatggct 420
ctcctcaagc gtattcaaca aggggctgaa ggatgcccag aaggtacccc attgtatggg 480
atctgatctg gggcctcggt gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg 540
tctaggcccc ccgaaccacg gggacgtggt tttcctttga aaaacacgat gataagcttg 600
ccac 604
<210> 34
<211> 711
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 34
atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60
gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120
cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180
ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240
cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300
gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 360
ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420
atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480
gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540
gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600
aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660
cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta a 711
<210> 35
<211> 1260
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 35
atggataaaa aaccgctgga cgttctgatc tccgctacgg gtctgtggat gagccgcacg 60
ggtacgctgc ataaaatcaa gcactatgag atttctcgtt ctaaaatcta catcgaaatg 120
gcgtgtggtg accatctggt tgtgaacaac tctcgttctt gtcgtccggc acgtgcattc 180
cgttatcata aataccgtaa aacctgcaaa cgttgtcgtg tttctgacga agatatcaac 240
aacttcctga cccgttctac cgaaggcaaa acctctgtta aagttaaagt tgtttctgaa 300
ccgaaagtga aaaaagcgat gccgaaatct gtttctcgtg cgccgaaacc gctggaaaat 360
ccggtttctg cgaaagcgtc taccgacacc tctcgttctg ttccgtctcc ggcgaaatct 420
accccgaact ctccggttcc gacctctgca agtgcccccg cacttacgaa gagccagact 480
gacaggcttg aagtcctgtt aaacccaaaa gatgagattt ccctgaattc cggcaagcct 540
ttcagggagc ttgagtccga attgctctct cgcagaaaaa aagacctgca gcagatctac 600
gcggaagaaa gggagaatta tctggggaaa ctcgagcgtg aaattaccag gttctttgtg 660
gacaggggtt ttctggaaat aaaatccccg atcctgatcc ctcttgagta tatcgaaagg 720
atgggcattg ataatgatac cgaactttca aaacagatct tcagggttga caagaacttc 780
tgcctgagac ccatgcttgc tccaaacctt tacaactacc tgcgcaagct tgacagggcc 840
ctgcctgatc caataaaaat ttttgaaata ggcccatgct acagaaaaga gtccgacggc 900
aaagaacacc tcgaagagtt taccatgctg aacttctgcc agatgggatc gggatgcaca 960
cgggaaaatc ttgaaagcat aattacggac ttcctgaacc acctgggaat tgatttcaag 1020
atcgtaggcg attcctgcat ggtctatggg gatacccttg atgtaatgca cggagacctg 1080
gaactttcct ctgcagtagt cggacccata ccgcttgacc gggaatgggg tattgataaa 1140
ccctggatag gggcaggttt cggactcgaa cgccttctaa aggttaaaca cgactttaaa 1200
aatatcaaga gagctgcacg ctcggaatcg tattacaacg gcatctcaac caatctgtaa 1260
<210> 36
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 36
gaatacaagc tacttgttct ttttgcagga tccgccacc 39
<210> 37
<211> 141
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 37
aagcttaatt agctgagctt ggactcctaa gcatgcaagc ttggcgtaat catggtcata 60
gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 120
cataaagtgt aaagcctggg g 141
<210> 38
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 38
cgcgcctagc agtgtcccag ccgggttcgt gtcgcc 36
<210> 39
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 39
cctcgccccg gacctgccct cccgccaggt gcacccacct gcaataaatg cagcgaagcc 60
ggga 64
<210> 40
<211> 782
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 40
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagagaccct cgagaatatt ctcgagggtc tcggaatcaa ggtgaacttc aagatccgcc 480
acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg 540
gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca 600
aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga 660
tcactctcgg catggacgag ctgtacaaga agctttggag ccacccgcag ttcgagaaag 720
gtggaggttc cggaggtgga tcgggaggtt cggcgtggag ccacccgcag ttcgaaaaat 780
aa 782
<210> 41
<211> 1272
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 41
atgccacaat ttgatatatt atgtaaaaca ccacctaagg tgcttgttcg tcagtttgtg 60
gaaaggtttg aaagaccttc aggtgagaaa atagcattat gtgctgctga actaacctat 120
ttatgttgga tgattacaca taacggaaca gcaatcaaga gagccacatt catgagctat 180
aatactatca taagcaattc gctgagtttg gatattgtca acaagtcact gcagtttaaa 240
tacaagacgc aaaaagcaac aattctggaa gcctcattaa agaaattgat tcctgcttgg 300
gaatttacaa ttattcctta ctatggacaa aaacatcaat ctgatatcac tgatattgta 360
agtagtttgc aattacagtt cgaatcatcg gaagaagcag ataagggaaa tagccacagt 420
aaaaaaatgc ttaaagcact tctaagtgag ggtgaaagca tctgggagat cactgagaaa 480
atactaaatt cgtttgagta tacttcgaga tttacaaaaa caaaaacttt ataccaattc 540
ctcttcctag ctactttcat caattgtgga agattcagcg atattaagaa cgttgatccg 600
aaatcattta aattagtcca aaataagtat ctgggagtaa taatccagtg tttagtgaca 660
gagacaaaga caagcgttag taggcacata tacttcttta gcgcaagggg taggatcgat 720
ccacttgtat atttggatga atttttgagg aattctgaac cagtcctaaa acgagtaaat 780
aggaccggca attcttcaag caacaagcag gaataccaat tattaaaaga taacttagtc 840
agatcgtaca acaaagcttt gaagaaaaat gcgccttatt caatctttgc tataaaaaat 900
ggcccaaaat ctcacattgg aagacatttg atgacctcat ttctttcaat gaagggccta 960
acggagttga ctaatgttgt gggaaattgg agcgataagc gtgcttctgc cgtggccagg 1020
acaacgtata ctcatcagat aacagcaata cctgatcact acttcgcact agtttctcgg 1080
tactatgcat atgatccaat atcaaaggaa atgatagcat tgaaggatga gactaatcca 1140
attgaggagt ggcagcatat agaacagcta aagggtagtg ctgaaggaag catacgatac 1200
cccgcatgga atgggataat atcacaggag gtactagact acctttcatc ctacataaat 1260
agacgcatat aa 1272
<210> 42
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 42
gaagttccta ttccgaagtt cctattctct agaaagtata ggaacttc 48
Claims (124)
1.一种真核细胞,所述真核细胞包含:
(a)具有包含第一非天然碱基的密码子的信使RNA(mRNA);以及
(b)具有包含第二非天然碱基的反密码子的转移RNA(tRNA),
其中所述第一非天然碱基和所述第二非天然碱基能够在所述真核细胞中形成非天然碱基对(UBP),并且其中所述mRNA能够在所述细胞中被翻译以产生包含至少一个非天然氨基酸的多肽。
2.根据权利要求1所述的真核细胞,其中所述tRNA装载有非天然氨基酸。
3.根据前述权利要求中任一项所述的真核细胞,所述真核细胞进一步包含从所述mRNA翻译的多肽,其中所述多肽包含所述非天然氨基酸,任选地其中所述多肽包含真核糖基化模式。
4.根据前述权利要求中任一项所述的真核细胞,所述真核细胞进一步包含tRNA合成酶,其中所述tRNA合成酶优先用所述非天然氨基酸使所述tRNA氨酰化。
5.根据前述权利要求中任一项所述的真核细胞,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N)。
6.根据前述权利要求中任一项所述的真核细胞,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。
7.根据前述权利要求中任一项所述的真核细胞,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X)。
15.根据权利要求3至14中任一项所述的真核细胞,其中所述至少一个非天然氨基酸:
是赖氨酸类似物;
包含芳族侧链;
包含叠氮基;
包含炔基;或者
包含醛基或酮基。
16.根据权利要求15所述的真核细胞,其中所述至少一个非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸或N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。
17.根据权利要求16所述的真核细胞,其中所述至少一个非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。
18.根据前述权利要求中任一项所述的真核细胞,其中所述真核细胞是人细胞。
19.根据前一权利要求所述的真核细胞,其中所述人细胞是HEK293T细胞。
20.根据权利要求1至18中任一项所述的真核细胞,其中所述细胞是哺乳动物细胞,任选地其中所述细胞是仓鼠细胞。
21.根据前一权利要求所述的真核细胞,其中所述哺乳动物细胞是中国仓鼠卵巢(CHO)细胞。
22.根据权利要求18-21中任一项所述的真核细胞,所述真核细胞进一步包含从所述mRNA翻译的多肽,其中所述多肽包含所述非天然氨基酸和哺乳动物糖基化模式。
23.根据前述权利要求中任一项所述的真核细胞,其中所述细胞是分离的。
24.一种半合成生物体,所述半合成生物体包含根据前述权利要求中任一项所述的真核细胞。
25.一种真核细胞培养物,所述真核细胞培养物包含多个根据权利要求1-24中任一项所述的真核细胞。
26.一种将细胞递送至生物体的方法,所述方法包括使所述生物体与根据权利要求1-23中任一项所述的细胞接触。
27.根据权利要求26所述的方法,其中所述生物体是哺乳动物,任选地其中所述哺乳动物是人。
28.一种在真核细胞中产生包含至少一个非天然氨基酸的多肽的方法,所述方法包括:
(a)向所述细胞中引入:
(i)具有包含第一非天然碱基的密码子的信使RNA(mRNA);以及
(ii)在所述真核细胞中具有包含第二非天然碱基的反密码子的转移RNA(tRNA),其中所述第一非天然碱基和所述第二非天然碱基能够在所述真核细胞中形成非天然碱基对(UBP);以及
(b)使用所述tRNA从所述mRNA翻译包含所述至少一个非天然氨基酸的多肽。
29.根据前述权利要求所述的方法,其中所述tRNA装载有非天然氨基酸。
30.一种在真核细胞中产生包含至少一个非天然氨基酸的多肽的方法,所述方法包括:
(a)提供真核细胞,所述真核细胞包含:
(i)具有包含第一非天然碱基的密码子的信使RNA(mRNA);
(ii)具有包含第二非天然碱基的反密码子的转移RNA(tRNA),其中所述第一非天然碱基和所述第二非天然碱基能够在所述真核细胞中形成非天然碱基对(UBP);以及
(b)使用所述tRNA通过所述真核细胞内源的核糖体从所述mRNA翻译包含所述至少一个非天然氨基酸的多肽。
31.一种在真核细胞中产生多肽的方法,其中所述多肽包含至少一个非天然氨基酸,所述方法包括:
(a)提供真核细胞,所述真核细胞包含:
(i)包含密码子的mRNA;其中所述密码子包含第一非天然碱基;
(ii)包含反密码子的tRNA,其中所述反密码子包含第二非天然碱基,并且其中所述第一非天然碱基和所述第二非天然碱基能够形成互补碱基对;以及
(iii)tRNA合成酶,其中与天然氨基酸相比,所述tRNA合成酶优先用所述至少一个非天然氨基酸使所述tRNA氨酰化;以及
(b)向所述真核细胞提供所述一个多个非天然氨基酸,其中所述真核细胞产生包含所述至少一个非天然氨基酸的多肽。
32.根据权利要求26至31中任一项所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的第一位置(X-N-N)。
33.根据权利要求26至31中任一项所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。
34.根据权利要求26至31中任一项所述的方法,其中所述mRNA的所述密码子包含三个连续核碱基(N-N-N);并且其中所述第一非天然碱基(X)位于所述mRNA的所述密码子中的最后位置(N-N-X)。
48.根据权利要求26至36中任一项所述的方法,其中所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的所述密码子的第一非天然碱基(X)位于所述密码子的第一位置(X-N-N),并且所述tRNA的所述反密码子的第二非天然碱基(Y)位于所述反密码子的最后位置(N-N-Y)。
49.根据权利要求26至36中任一项所述的方法,其中所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的所述密码子包含位于所述密码子的中间位置(N-X-N)的第一非天然碱基(X),并且所述tRNA中的反密码子包含位于所述反密码子的中间位置(N-Y-N)的第二非天然碱基(Y)。
50.根据权利要求26至36中任一项所述的方法,其中所述密码子和所述反密码子各自包含三个连续核碱基(N-N-N),其中所述mRNA中的所述密码子包含位于所述密码子的最后位置(N-N-X)的第一非天然碱基(X),并且所述tRNA中的反密码子包含位于所述反密码子的第一位置(Y-N-N)的第二非天然碱基(Y)。
51.根据权利要求48至50中任一项所述的方法,其中位于所述mRNA的所述密码子中的第一非天然碱基(X)与位于所述tRNA的所述反密码子中的第二非天然碱基(Y)相同或不同。
56.根据权利要求26-29、31、33、35至41、43、46和49中任一项所述的方法,其中所述mRNA中的所述密码子选自AXC、GXC或GXU,其中X是所述第一非天然碱基。
57.根据前一权利要求所述的方法,其中所述tRNA中的反密码子选自GYU、GYC和AYC,并且Y是第二非天然碱基。
58.根据权利要求57所述的方法,其中所述mRNA中的所述密码子是AXC并且所述tRNA中的反密码子是GYU。
59.根据权利要求57所述的方法,其中所述mRNA中的所述密码子是GXC并且所述tRNA中的反密码子是GYC。
60.根据权利要求57所述的方法,其中所述mRNA中的所述密码子是GXU并且所述反密码子是AYC。
61.根据权利要求26至60中任一项所述的方法,其中所述第一非天然碱基或所述第二非天然碱基包含选自以下的经修饰的糖部分:
2'位置处的修饰,其包括:
OH、经取代的低级烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2F或其组合;
O-烷基、S-烷基、N-烷基或其组合;
O-烯基、S-烯基、N-烯基或其组合;
O-炔基、S-炔基、N-炔基或其组合;
O-烷基-O-烷基、2'-F、2'-OCH3、2'-O(CH2)2OCH3或其组合,其中所述烷基、烯基和炔基可以是经取代或未经取代的C1-C10烷基、C2-C10烯基、C2-C10炔基、-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-NH2和-O(CH2)nON[(CH2)nCH3)]2,其中n和m是1至约10;
5'位置处的修饰,其包括:
5'-乙烯基、5'-甲基(R或S)或其组合;
4'位置处的修饰,其包括:
4'-S、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、经取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改善寡核苷酸的药代动力学特性的基团、或用于改善寡核苷酸的药效学特性的基团或其组合;
或其组合。
62.根据权利要求26至61中任一项所述的方法,其中所述至少一个非天然氨基酸:
是赖氨酸类似物;
包含芳族侧链;
包含叠氮基;
包含炔基;或者
包含醛基或酮基。
63.根据权利要求26至61中任一项所述的方法,其中至少一个非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸和N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。
64.根据权利要求63所述的方法,其中所述非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。
65.根据权利要求26至64中任一项所述的方法,其中所述细胞是人细胞。
66.根据权利要求65所述的方法,其中所述人细胞是HEK293T细胞。
67.根据权利要求26至64中任一项所述的方法,其中所述细胞是仓鼠细胞。
68.根据权利要求67所述的方法,其中所述仓鼠细胞是中国仓鼠卵巢(CHO)细胞。
69.根据权利要求26至68中任一项所述的方法,其中所述tRNA源自詹氏甲烷球菌(Methanococcus jannaschii)、巴氏甲烷八叠球菌(Methanosarcina barkeri)、马氏甲烷八叠球菌(Methanosarcina mazei)或乙酸甲烷八叠球菌(Methanosarcina acetivorans)。
70.根据权利要求26至69中任一项所述的方法,其中所述细胞包含源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌的tRNA合成酶。
71.一种用于表达非天然多肽的系统,所述系统包含:
(a)至少一个非天然氨基酸;
(b)编码所述非天然多肽的mRNA,所述mRNA包含含有一个或多个第一非天然碱基的至少一个密码子;
(c)tRNA,所述tRNA包含含有一个或多个第二非天然碱基的至少一个反密码子,其中
所述一个或多个第一非天然碱基和所述一个或多个第二非天然碱基能够形成一个或多个互补碱基对;以及
(d)真核核糖体,所述真核核糖体能够使用所述tRNA和tRNA合成酶将所述mRNA翻译成包含所述非天然氨基酸的多肽,
其中所述tRNA装载有所述非天然氨基酸,或者所述系统进一步包含tRNA合成酶或一个或多个包含编码tRNA合成酶的核酸序列的核酸构建体,其中所述tRNA合成酶优先用所述至少一个非天然氨基酸使所述tRNA氨酰化。
72.根据权利要求71所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述至少一个密码子中的第一位置(X-N-N)。
73.根据权利要求71所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述密码子中的中间位置(N-X-N)。
74.根据权利要求71所述的系统,其中所述mRNA的所述至少一个密码子包含三个连续核碱基(N-N-N);并且其中所述一个或多个第一非天然碱基(X)位于所述mRNA的所述至少一个密码子中的最后位置(N-N-X)。
91.根据权利要求71所述的系统,其中所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述至少一个密码子包含一个或多个位于所述密码子的第一位置(X-N-N)的第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含一个或多个位于所述反密码子的最后位置(N-N-Y)的第二非天然碱基(Y)。
92.根据权利要求91所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。
96.根据权利要求71所述的系统,其中所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述mRNA中的所述至少一个密码子包含位于所述至少一个密码子的中间位置(N-X-N)的一个或多个第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含位于所述反密码子的中间位置(N-Y-N)的一个或多个第二非天然碱基(Y)。
97.根据权利要求96所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。
101.根据权利要求71所述的系统,其中所述至少一个密码子和所述至少一个反密码子各自独立地包含三个连续核碱基(N-N-N),并且其中所述mRNA中的所述至少一个密码子包含位于所述至少一个密码子的最后位置(N-N-X)的一个或多个第一非天然碱基(X),并且所述tRNA中的所述至少一个反密码子包含位于所述反密码子的第一位置(Y-N-N)的一个或多个第二非天然碱基(Y)。
102.根据权利要求101所述的系统,其中位于所述mRNA的所述密码子中的一个或多个第一非天然碱基(X)与位于所述tRNA的所述反密码子中的一个或多个第二非天然碱基(Y)相同或不同。
106.根据权利要求71至105中任一项所述的系统,其中所述mRNA中的所述至少一个密码子选自AXC、GXC或GXU,其中X是所述一个或多个第一非天然碱基。
107.根据前一权利要求所述的系统,其中所述tRNA中的所述至少一个反密码子选自GYU、GYC和AYC,并且Y是所述一个或多个第二非天然碱基。
108.根据权利要求107所述的系统,其中所述mRNA中的所述至少一个密码子是AXC并且所述tRNA中的所述至少一个反密码子是GYU。
109.根据权利要求107所述的系统,其中所述mRNA中的所述至少一个密码子是GXC并且所述tRNA中的所述至少一个反密码子是GYC。
110.根据权利要求107所述的系统,其中所述mRNA中的所述至少一个密码子是GXU并且所述至少一个反密码子是AYC。
111.根据权利要求71至110中任一项所述的系统,其中所述tRNA源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌。
112.根据权利要求71至111中任一项所述的系统,其中所述tRNA合成酶源自詹氏甲烷球菌、巴氏甲烷八叠球菌、马氏甲烷八叠球菌或乙酸甲烷八叠球菌的tRNA合成酶。
113.根据权利要求71至112中任一项所述的系统,所述系统是在体外或无细胞的。
114.根据权利要求71至113中任一项所述的系统,所述系统包含细胞裂解物。
115.根据权利要求71至113中任一项所述的系统,所述系统是纯化组分的重构系统。
116.根据权利要求71至112中任一项所述的系统,所述系统在真核细胞中。
117.根据权利要求116所述的系统,其中所述真核细胞是人细胞。
118.根据权利要求116所述的系统,其中所述真核细胞是HEK293T细胞。
119.根据权利要求116所述的系统,其中所述真核细胞是仓鼠细胞。
120.根据权利要求119所述的系统,其中所述仓鼠细胞是中国仓鼠卵巢(CHO)细胞。
121.根据权利要求71至120中任一项所述的系统,其中所述非天然氨基酸:
是赖氨酸类似物;
包含芳族侧链;
包含叠氮基;
包含炔基;或者
包含醛基或酮基。
122.根据权利要求71至121中任一项所述的系统,其中所述非天然氨基酸选自N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)、N6-((炔丙基乙氧基)-羰基)-L-赖氨酸(PraK)、BCN-L-赖氨酸、降冰片烯赖氨酸、TCO-赖氨酸、甲基四嗪赖氨酸、烯丙氧基羰基赖氨酸、2-氨基-8-氧代壬酸、2-氨基-8-氧代辛酸、对-乙酰基-L-苯丙氨酸、对-叠氮基甲基-L-苯丙氨酸(pAMF)、对-碘-L-苯丙氨酸、间-乙酰基苯丙氨酸、2-氨基-8-氧代壬酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、3-甲基-苯丙氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、O-烯丙基酪氨酸、O-甲基-L-酪氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、膦酰酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-磷酸丝氨酸、膦酰丝氨酸、L-3-(2-萘基)丙氨酸、2-氨基-3-((2-((3-(苄氧基)-3-氧代丙基)氨基)乙基)硒基)丙酸、2-氨基-3-(苯基硒基)丙酸、硒代半胱氨酸、N6-(((2-叠氮基苄基)氧基)羰基)-L-赖氨酸、N6-(((3-叠氮基苄基)氧基)羰基)-L-赖氨酸和N6-(((4-叠氮基苄基)氧基)羰基)-L-赖氨酸。
123.根据权利要求71至122中任一项所述的系统,其中所述非天然氨基酸是N6-((叠氮基乙氧基)-羰基)-L-赖氨酸(AzK)。
124.根据权利要求71至123中任一项所述的系统,其中所述tRNA装载有所述非天然氨基酸。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962908421P | 2019-09-30 | 2019-09-30 | |
US62/908,421 | 2019-09-30 | ||
PCT/US2020/053339 WO2021067313A1 (en) | 2019-09-30 | 2020-09-29 | Eukaryotic semi-synthetic organisms |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114746099A true CN114746099A (zh) | 2022-07-12 |
Family
ID=75336479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080082837.9A Pending CN114746099A (zh) | 2019-09-30 | 2020-09-29 | 真核半合成生物体 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20220228148A1 (zh) |
EP (1) | EP4041247A4 (zh) |
JP (1) | JP2022549931A (zh) |
KR (1) | KR20220075231A (zh) |
CN (1) | CN114746099A (zh) |
AU (1) | AU2020357614A1 (zh) |
BR (1) | BR112022005330A2 (zh) |
CA (1) | CA3151762A1 (zh) |
IL (1) | IL291635A (zh) |
MX (1) | MX2022003825A (zh) |
TW (1) | TW202128994A (zh) |
WO (1) | WO2021067313A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL3041854T3 (pl) | 2013-08-08 | 2020-06-29 | The Scripps Research Institute | Sposób miejscowo specyficznego oznakowania enzymatycznego kwasów nukleinowych in vitro przez inkorporację niewystępujących naturalnie nukleotydów |
WO2017106767A1 (en) | 2015-12-18 | 2017-06-22 | The Scripps Research Institute | Production of unnatural nucleotides using a crispr/cas9 system |
DK3475295T3 (da) | 2016-06-24 | 2022-10-24 | Scripps Research Inst | Hidtil ukendt nukleosidtriphosphat-transportør og anvendelser deraf |
AU2018300069A1 (en) | 2017-07-11 | 2020-02-27 | Synthorx, Inc. | Incorporation of unnatural nucleotides and methods thereof |
WO2020252262A1 (en) | 2019-06-14 | 2020-12-17 | The Scripps Research Institute | Reagents and methods for replication, transcription, and translation in semi-synthetic organisms |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180346901A1 (en) * | 2015-11-30 | 2018-12-06 | European Molecular Biology Laboratory | Means and methods for preparing engineered proteins by genetic code expansion in insect cells |
AU2018300069A1 (en) * | 2017-07-11 | 2020-02-27 | Synthorx, Inc. | Incorporation of unnatural nucleotides and methods thereof |
EP3651774A4 (en) * | 2017-07-11 | 2021-07-07 | The Scripps Research Institute | INTEGRATION OF INNATURAL NUCLEOTIDES AND APPLICATION METHODS IN VIVO |
-
2020
- 2020-09-29 EP EP20872617.4A patent/EP4041247A4/en active Pending
- 2020-09-29 BR BR112022005330A patent/BR112022005330A2/pt unknown
- 2020-09-29 CN CN202080082837.9A patent/CN114746099A/zh active Pending
- 2020-09-29 MX MX2022003825A patent/MX2022003825A/es unknown
- 2020-09-29 TW TW109133880A patent/TW202128994A/zh unknown
- 2020-09-29 AU AU2020357614A patent/AU2020357614A1/en active Pending
- 2020-09-29 KR KR1020227014157A patent/KR20220075231A/ko unknown
- 2020-09-29 JP JP2022519674A patent/JP2022549931A/ja active Pending
- 2020-09-29 CA CA3151762A patent/CA3151762A1/en active Pending
- 2020-09-29 WO PCT/US2020/053339 patent/WO2021067313A1/en unknown
-
2022
- 2022-03-23 IL IL291635A patent/IL291635A/en unknown
- 2022-03-30 US US17/709,041 patent/US20220228148A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20220075231A (ko) | 2022-06-07 |
WO2021067313A1 (en) | 2021-04-08 |
CA3151762A1 (en) | 2021-04-08 |
AU2020357614A1 (en) | 2022-03-31 |
EP4041247A4 (en) | 2024-03-06 |
BR112022005330A2 (pt) | 2022-08-23 |
JP2022549931A (ja) | 2022-11-29 |
TW202128994A (zh) | 2021-08-01 |
IL291635A (en) | 2022-05-01 |
US20220228148A1 (en) | 2022-07-21 |
EP4041247A1 (en) | 2022-08-17 |
MX2022003825A (es) | 2022-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240117363A1 (en) | Production of unnatural nucleotides using a crispr/cas9 system | |
US11879145B2 (en) | Reagents and methods for replication, transcription, and translation in semi-synthetic organisms | |
CN114746099A (zh) | 真核半合成生物体 | |
US20220243244A1 (en) | Compositions and methods for in vivo synthesis of unnatural polypeptides | |
JP7429642B2 (ja) | 非天然塩基対組成物および使用の方法 | |
US20230392140A1 (en) | Reverse transcription of polynucleotides comprising unnatural nucleotides | |
JP6618534B2 (ja) | アミノ酸修飾核酸とその利用 | |
US20220145332A1 (en) | Cell penetrating transposase | |
US20220002719A1 (en) | Oligonucleotide-mediated sense codon reassignment | |
RU2799441C2 (ru) | Композиции на основе неприродных пар оснований и способы их применения |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |