TW202113078A - 於半合成生物體中複製、轉錄及轉譯之試劑及方法 - Google Patents

於半合成生物體中複製、轉錄及轉譯之試劑及方法 Download PDF

Info

Publication number
TW202113078A
TW202113078A TW109119906A TW109119906A TW202113078A TW 202113078 A TW202113078 A TW 202113078A TW 109119906 A TW109119906 A TW 109119906A TW 109119906 A TW109119906 A TW 109119906A TW 202113078 A TW202113078 A TW 202113078A
Authority
TW
Taiwan
Prior art keywords
unnatural base
unnatural
base
natural
trna
Prior art date
Application number
TW109119906A
Other languages
English (en)
Inventor
佛洛伊德 E 羅曼斯柏格
薇薇安 T 狄恩
艾倫 W 費德曼
凌君 李
安 曉珘 周
邁可 P 萊柏特
蕾貝卡 J 卡拉德瑪
Original Assignee
美商史基普研究協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商史基普研究協會 filed Critical 美商史基普研究協會
Publication of TW202113078A publication Critical patent/TW202113078A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/24Heterocyclic radicals containing oxygen or sulfur as ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07006DNA-directed RNA polymerase (2.7.7.6)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Saccharide Compounds (AREA)

Abstract

本文揭示用於增加包含一或多種非天然胺基酸之蛋白質或多肽之產生的組合物、方法、細胞、工程化微生物體及套組。進一步提供用於增加編碼該等非天然胺基酸之非天然核酸保留在工程化細胞或半合成生物體中的組合物、細胞、工程化微生物體及套組。

Description

於半合成生物體中複製、轉錄及轉譯之試劑及方法
生物多樣性允許生命適應不同環境,且隨著時間之推移,進化出新形式及功能。此多樣性之來源係由20個天然胺基酸提供之蛋白質序列內之變異,該變異由四種天然DNA核苷酸在生物體之基因體中編碼。儘管天然胺基酸提供之功能多樣性可較高,但巨大的序列空間顯著限制實際上可開發之功能,且此外,一些功能性完全不可用。自然界使用輔因子進行氫負離子轉移、氧化還原活性及親電子鍵形成等證明了該等限制。此外,隨著日益關注開發蛋白質作為治療劑,該等限制成問題,此乃因與化學家設計之小分子藥物之生理化學多樣性相比,天然胺基酸之生理化學多樣性受到顯著限制。原則上,藉由擴增遺傳密碼以包括具有期望生理化學性質之額外非經典胺基酸(ncAA、或「非天然」胺基酸)來規避該等限制應係可能的。
幾乎20年前,藉由在大腸桿菌(Escherichia coli )中使用琥珀終止密碼子(UAG)編碼ncAA來擴增遺傳密碼,從而建立一種增加活的生物可利用之多樣性之方法。此係使用來自詹氏甲烷球菌(Methanococcus jannaschii)之tRNA-胺基酸tRNA合成酶(aaRS)對來實現,其中對tRNA進行重編碼以抑制終止密碼子,且使aaRS進化以用ncAA填充tRNA。此密碼子抑制方法早已擴展至其他終止密碼子及甚至四重密碼子,以及擴展至使用若干其他正交tRNA-aaRS對(最顯著地,來自巴氏甲烷八疊球菌(Methanosarcina barkeri )/馬氏甲烷八疊球菌(Methanosarcina mazei )之Pyl tRNA-合成酶對),從而拓寬可納入蛋白質中之ncAAs之範圍。該等方法已經開始徹底改變化學生物學及蛋白質治療劑。
儘管該等方法能在原核及真核細胞中納入最多兩種不同ncAA,異源之再編碼tRNA必須與內源釋放因子(RF)競爭,或在四重密碼子之情形下,必須與正常解碼競爭,此限制ncAA納入之效率及保真度。為了消除與識別琥珀終止密碼子並終止轉譯之RF1之競爭,已努力致力於去除宿主基因體中琥珀終止密碼子之許多或所有情況或修飾RF2以允許RF1之缺失。然而,真核生物僅具有一種釋放因子,且儘管其可經修飾,但不可缺失,且對於原核生物,RF1之缺失導致其他tRNA對琥珀終止密碼子之更大誤抑制,此降低ncAA納入之保真度。進一步利用密碼子冗餘性以釋放天然密碼子用於重新分配給ncAA之努力可由於多效作用而複雜化,此乃因密碼子並非真正冗餘,例如由於其對轉譯及蛋白質摺疊之速率之效應。另外,密碼子再挪用(reappropriation)受到大規模基因體工程化之挑戰之限制,尤其對於真核生物。
天然密碼子重新分配之替代方法係生成全新的密碼子,其無任何天然功能或限制,且其在核糖體處之識別固有地更具正交性。此可經由產生具有形成非天然鹼基對(UBP)之第五及第六核苷酸之生物體來完成。該等半合成生物體(SSO)將需要忠實地複製含有UBP之DNA,將其有效轉錄成含有非天然核苷酸之mRNA及tRNA,且然後用同源非天然反密碼子有效地解碼非天然密碼子。該等SSO將具有實際上無限數量之新密碼子來編碼ncAA。
在某些實施例中,本文揭示用於增加包含非天然核苷酸之核酸分子之產生的方法、細胞、工程化微生物體、質體及套組。
涵蓋以下實施例。
實施例A1係具有以下結構之核鹼基:
Figure 02_image001
, 其中: 每一X獨立地係碳或氮; 當X係碳時,R2 存在且獨立地係氫、烷基、烯基、炔基、甲氧基、甲硫醇、甲硒基、鹵素、氰基或疊氮基; Y係硫、氧、硒或二級胺;且 E係氧、硫或硒; 其中波形線指示與核糖基、去氧核糖基或二去氧核糖基部分或其類似物之鍵結點,其中核糖基、去氧核糖基或二去氧核糖基部分或其類似物呈游離形式,連接至單-磷酸酯、二磷酸酯、三磷酸酯、α-硫代三磷酸酯、β-硫代三磷酸酯、或γ-硫代三磷酸酯基團,或包括於RNA或DNA或RNA類似物或DNA類似物中。
實施例A2係實施例A1之核鹼基,其中X係碳。
實施例A3係實施例A1或A2之核鹼基,其中E係硫。
實施例A4係實施例A1至A3中任一實施例之核鹼基,其中Y係硫。
實施例A5係實施例A1之核鹼基,其具有結構
Figure 02_image003
實施例A6係實施例A1至A5中任一實施例之核鹼基,其結合至互補鹼基配對核鹼基以形成非天然鹼基對(UBP)。
實施例A7係實施例A6之核鹼基,其中該互補鹼基配對核鹼基係選自:
Figure 02_image005
Figure 02_image007
Figure 02_image009
實施例A8係雙股寡核苷酸雙螺旋體,其中第一寡核苷酸股包含實施例A1至A5中任一實施例之核鹼基,且第二互補寡核苷酸股包含互補鹼基配對核鹼基於其互補鹼基配對位點。
實施例A9係實施例A8之雙股寡核苷酸雙螺旋體,其中該第一寡核苷酸股包含
Figure 02_image011
;且該第二股包含選自以下之互補鹼基配對核鹼基於其互補鹼基配對位點:
Figure 02_image013
,
Figure 02_image015
Figure 02_image017
實施例A10係實施例A9之雙股寡核苷酸雙螺旋體,其中該第二股包含互補鹼基配對核鹼基
Figure 02_image019
實施例A11係實施例A9之雙股寡核苷酸雙螺旋體,其中該第二股包含互補鹼基配對核鹼基
Figure 02_image021
實施例A12係包含編碼轉運RNA (tRNA)之基因及/或編碼所關注蛋白質之基因的質體,其中該基因包含實施例A1至A5中任一實施例之至少一個核鹼基或TPT3 (
Figure 02_image023
)及實施例A7之至少一個互補鹼基配對核鹼基或NaM (
Figure 02_image025
),其中該互補鹼基配對核鹼基在互補鹼基配對位點中。
實施例A13係由編碼tRNA之實施例A10之質體編碼的mRNA。
實施例A14係由編碼蛋白質之實施例A10之質體編碼的mRNA。
實施例A15係轉運RNA (tRNA),其包含實施例A1至A5中任一實施例之核鹼基,該轉運RNA包含: 反密碼子,其中該反密碼子包含核鹼基,視情況其中該核鹼基在反密碼子之第一、第二或第三位置;及 識別元件,其中該識別元件促進tRNA藉由胺基醯基tRNA合成酶選擇性加載非天然胺基酸。
實施例A16係實施例A15之tRNA,其中該胺基醯基tRNA合成酶係源自甲烷八疊球菌(Methanosarcina )或其變體、或甲烷球菌屬(Methanococcus ) (甲烷暖球菌屬(Methanocaldococcus ))或其變體。
實施例A17係實施例A15之tRNA,其中該非天然胺基酸包含芳香族部分。
實施例A18係實施例A15之tRNA,其中該非天然胺基酸係離胺酸或苯丙胺酸衍生物。
實施例A19係包含下式之結構: N1 - Zx - N2 其中: 每一Z獨立地係實施例A1至A7中任一實施例之核鹼基,其鍵結至核糖基或去氧核糖基或其類似物; N1係在Z之核糖基或去氧核糖基或其類似物之5’端連接之一或多個核苷酸或其類似物、或末端磷酸酯基團; N2係連接至Z之核糖基或去氧核糖基或其類似物之3’端之一或多個核苷酸或其類似物、或末端羥基;且 x係1至20之整數。
實施例A20係實施例A19之結構,其中該結構編碼基因,視情況其中Zx位於該基因之轉譯區或其中Zx位於該基因之非轉譯區。
實施例A21係聚核苷酸庫,其中該庫包含至少5000個獨特聚核苷酸,且其中每一聚核苷酸包含實施例A1至A5中任一實施例之至少一個核鹼基。
實施例A22係包含核鹼基之核苷三磷酸,其中該核鹼基係選自:
Figure 02_image027
Figure 02_image029
實施例A23係實施例A22之核苷三磷酸,其中該核鹼基係
Figure 02_image031
實施例A24係實施例A22或A23之核苷三磷酸,其中該核苷包含核糖或去氧核糖。
實施例A25係DNA,其包含具有結構
Figure 02_image033
之核鹼基及具有結構
Figure 02_image035
之互補鹼基配對核鹼基。
實施例A26係DNA,其包含具有結構
Figure 02_image037
之核鹼基及具有結構
Figure 02_image039
之互補鹼基配對核鹼基。
實施例A27係將DNA轉錄為tRNA或編碼蛋白質之mRNA的方法,其包含: 使包含編碼tRNA或蛋白質之基因之DNA與核糖核苷三磷酸及RNA聚合酶接觸,其中編碼該tRNA或蛋白質之該基因包含與第二非天然鹼基配對且與第二非天然鹼基形成第一非天然鹼基對之第一非天然鹼基,且其中該等核糖核苷三磷酸包含能與第一非天然鹼基形成第二非天然鹼基對之第三非天然鹼基,其中該第一非天然鹼基對及該第二非天然鹼基對不相同。
實施例A28係實施例A27之方法,其中該等核糖核苷三磷酸進一步包含第四非天然鹼基,其中該第四非天然鹼基能與第三非天然鹼基形成第二非天然鹼基對。
實施例A29係實施例A28之方法,其中該第一非天然鹼基對及該第二非天然鹼基對不相同。
實施例A30係實施例A27至29中任一實施例之方法,其進一步包含在DNA與核糖核苷三磷酸及RNA聚合酶接觸之前,藉由使DNA與去氧核糖核苷三磷酸及DNA聚合酶接觸來複製DNA,其中該等核糖核苷三磷酸包含能與第一非天然鹼基形成第五非天然鹼基對之第五非天然鹼基,其中該第一非天然鹼基對及該第五非天然鹼基對不相同。
實施例A31係實施例A27至A30中任一實施例之方法,其中該第一非天然鹼基包含TPT3,該第二非天然鹼基包含CNMO或NaM,該第三非天然鹼基包含TAT1,且該第四非天然鹼基包含NaM或5FM。
實施例A32係實施例A27至A31中任一實施例之方法,其中該方法包含使用半合成生物體,視情況其中生物體係細菌,視情況其中該細菌係大腸桿菌。
實施例A33係實施例A32之方法,其中該生物體包含微生物體。
實施例A34係實施例A32之方法,其中該生物體包含細菌。
實施例A35係實施例A34之方法,其中該生物體包含革蘭氏陽性細菌(Gram-positive bacterium)。
實施例A36係實施例A34之方法,其中該生物體包含革蘭氏陰性細菌。
實施例A37係實施例A27至A34中任一實施例之方法,其中該生物體包含大腸桿菌。
實施例A38係實施例A27至A37中任一實施例之方法,其中至少一個非天然鹼基係選自由以下組成之群: (i)    2-硫尿嘧啶、2-硫-胸腺嘧啶、2’-去氧尿苷、4-硫-尿嘧啶、4-硫-胸腺嘧啶、尿嘧啶-5-基、次黃嘌呤-9-基(I)、5-鹵基尿嘧啶;5-丙炔基-尿嘧啶、6-偶氮基-胸腺嘧啶、6-偶氮基-尿嘧啶、5-甲基胺基甲基尿嘧啶、5-甲氧基胺基甲基-2-硫尿嘧啶、假尿嘧啶、尿嘧啶-5-乙醛酸甲基酯、尿嘧啶-5-乙醛酸、5-甲基-2-硫尿嘧啶、3-(3-胺基-3-N-2-羧基丙基)尿嘧啶、5-甲基-2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、5’-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、尿嘧啶-5-氧基乙酸、5-(羧基羥基甲基)尿嘧啶、5-羧基甲基胺基甲基-2-硫尿苷、5-羧基甲基胺基甲基尿嘧啶或二氫尿嘧啶; (ii)   5-羥基甲基胞嘧啶、5-三氟甲基胞嘧啶、5-鹵基胞嘧啶、5-丙炔基胞嘧啶、5-羥基胞嘧啶、環胞嘧啶、胞嘧啶阿拉伯糖苷、5,6-二氫胞嘧啶、5-硝基胞嘧啶、6-偶氮基胞嘧啶、氮雜胞嘧啶、N4-乙基胞嘧啶、3-甲基胞嘧啶、5-甲基胞嘧啶、4-乙醯基胞嘧啶、2-硫胞嘧啶、啡噁嗪胞苷([5,4-b][1,4]苯并噁嗪-2(3H)-酮)、啡噻嗪胞苷(1H-嘧啶并[5,4-b][1,4]苯并噻嗪-2(3H)-酮)、啡噁嗪胞苷(9-(2-胺基乙氧基)-H-嘧啶并[5,4-b][1,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)或吡啶并吲哚胞苷(H-吡啶并[3’,2’:4,5]吡咯并[2,3-d]嘧啶-2-酮); (iii)  2-胺基腺嘌呤、2-丙基腺嘌呤、2-胺基-腺嘌呤、2-F-腺嘌呤、2-胺基-丙基-腺嘌呤、2-胺基-2’-去氧腺苷、3-去氮腺嘌呤、7-甲基腺嘌呤、7-去氮-腺嘌呤、8-氮雜腺嘌呤、8-鹵基、8-胺基、8-硫醇、8-硫代烷基及8-羥基取代之腺嘌呤、N6-異戊烯基腺嘌呤、2-甲基腺嘌呤、2,6-二胺基嘌呤、2-甲硫基-N6-異戊烯基腺嘌呤或6-氮雜-腺嘌呤; (iv) 2-甲基鳥嘌呤、鳥嘌呤之2-丙基及烷基衍生物、3-去氮鳥嘌呤、6-硫-鳥嘌呤、7-甲基鳥嘌呤、7-去氮鳥嘌呤、7-去氮鳥苷、7-去氮-8-氮雜鳥嘌呤、8-氮雜鳥嘌呤、8-鹵基、8-胺基、8-硫醇、8-硫代烷基及8-羥基取代之鳥嘌呤、1-甲基鳥嘌呤、2,2-二甲基鳥嘌呤、7-甲基鳥嘌呤或6-氮雜-鳥嘌呤;及 (v)    次黃嘌呤、黃嘌呤、1-甲基肌苷、Q核苷(queosine)、β-D-半乳糖基Q核苷、肌苷、β-D-甘露糖基Q核苷、懷丁氧苷(wybutoxosine)、羥基脲、(acp3)w、2-胺基吡啶或2-吡啶酮。
實施例A39係實施例A27至A37中任一實施例之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
Figure 02_image041
Figure 02_image043
Figure 02_image045
實施例A40係實施例A27至A39中任一實施例之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image047
Figure 02_image049
Figure 02_image051
實施例A41係實施例A40之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image053
Figure 02_image055
Figure 02_image057
實施例A42係實施例A40之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image059
Figure 02_image061
Figure 02_image063
實施例A43係實施例A40之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image065
Figure 02_image067
實施例A44係實施例A40之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
Figure 02_image069
Figure 02_image071
實施例A45係實施例A40之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
Figure 02_image073
Figure 02_image075
實施例A46係實施例A40之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
Figure 02_image077
Figure 02_image079
實施例A47係實施例A40之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image081
Figure 02_image083
實施例A48係實施例A40之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係
Figure 02_image085
實施例A49係實施例A40之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
Figure 02_image087
Figure 02_image089
實施例A50係實施例A40之方法,其中該等第一或第二非天然鹼基係
Figure 02_image091
實施例A51係實施例A40之方法,其中該等第一或第二非天然鹼基係
Figure 02_image093
實施例A52係實施例A27至A40中任一實施例之方法,其中該第一非天然鹼基係
Figure 02_image095
且該第二非天然鹼基係
Figure 02_image097
,或該第一非天然鹼基係
Figure 02_image099
且該第二非天然鹼基係
Figure 02_image101
實施例A53係實施例A27至A40及A52中任一實施例之方法,其中該第三或第四非天然鹼基係
Figure 02_image103
實施例A54係實施例A53之方法,其中該第三非天然鹼基係
Figure 02_image105
實施例A55係實施例A54之方法,其中該第四非天然鹼基係
Figure 02_image107
實施例A56係實施例A27至A52中任一實施例之方法,其中該第三或第四非天然鹼基係
Figure 02_image109
Figure 02_image111
實施例A57係實施例A56之方法,其中該第三非天然鹼基係
Figure 02_image113
Figure 02_image115
實施例A58係實施例A56之方法,其中該第四非天然鹼基係
Figure 02_image117
Figure 02_image119
實施例A59係實施例A27至A40中任一實施例之方法,其中該第一非天然鹼基係
Figure 02_image121
,該第二非天然鹼基係
Figure 02_image123
,該第三非天然鹼基係
Figure 02_image125
,且該第四非天然鹼基係
Figure 02_image127
Figure 02_image129
實施例A60係實施例A27至A40中任一實施例之方法,其中該第一非天然鹼基係
Figure 02_image131
,該第二非天然鹼基係
Figure 02_image133
,該第三非天然鹼基係
Figure 02_image135
,且該第四非天然鹼基係
Figure 02_image137
Figure 02_image139
實施例A61係實施例A27至A40中任一實施例之方法,其中該第一非天然鹼基係
Figure 02_image141
,該第二非天然鹼基係
Figure 02_image143
,該第三非天然鹼基係
Figure 02_image145
Figure 02_image147
且該第四非天然鹼基係
Figure 02_image149
實施例A62係實施例A27至A40中任一實施例之方法,其中該第三非天然鹼基係
Figure 02_image151
Figure 02_image153
實施例A63係實施例A27至A51中任一實施例之方法,其中該第四非天然鹼基係
Figure 02_image155
實施例A64係實施例A27至A40中任一實施例之方法,其中該第一非天然鹼基係
Figure 02_image157
,該第二非天然鹼基係
Figure 02_image159
,該第三非天然鹼基係
Figure 02_image161
Figure 02_image163
,且該第四非天然鹼基係
Figure 02_image165
實施例A65係實施例A27至A64中任一實施例之方法,其中該第三非天然鹼基及該第四非天然鹼基包含核糖。
實施例A66係實施例A27至A64中任一實施例之方法,其中該第三非天然鹼基及該第四非天然鹼基包含去氧核糖。
實施例A67係實施例A27至A66中任一實施例之方法,其中該等第一及第二非天然鹼基包含去氧核糖。
實施例A68係實施例A27至A64中任一實施例之方法,其中該等第一及第二非天然鹼基包含去氧核糖且該第三非天然鹼基及該第四非天然鹼基包含核糖。
實施例A69係實施例A27至A40中任一實施例之方法,其中該DNA包含至少一個選自以下之非天然鹼基對(UBP):
Figure 02_image167
Figure 02_image169
Figure 02_image171
實施例A70係實施例A69之方法,其中該DNA模板包含至少一個為dNaM-d5SICS之非天然鹼基對(UBP)。
實施例A71係實施例A69之方法,其中該DNA模板包含至少一個為dCNMO-dTPT3之非天然鹼基對(UBP)。
實施例A72係實施例A69之方法,其中該DNA模板包含至少一個為dNaM-dTPT3之非天然鹼基對(UBP)。
實施例A73係實施例A69之方法,其中該DNA模板包含至少一個為dPTMO-dTPT3之非天然鹼基對(UBP)。
實施例A74係實施例A69之方法,其中該DNA模板包含至少一個為dNaM-dTAT1之非天然鹼基對(UBP)。
實施例A75係實施例A69之方法,其中該DNA模板包含至少一個為dCNMO-dTAT1之非天然鹼基對(UBP)。
實施例A76係實施例A27至A40中任一實施例之方法,其中該DNA包含至少一個選自以下之非天然鹼基對(UBP):
Figure 02_image173
Figure 02_image175
;且 其中該mRNA及/或該tRNA包含至少一個選自以下之非天然鹼基:
Figure 02_image177
Figure 02_image179
實施例A77係根據實施例A76之方法,其中該DNA模板包含至少一個為dNaM-d5SICS之非天然鹼基對(UBP)。
實施例A78係實施例A76之方法,其中該DNA模板包含至少一個為dCNMO-dTPT3之非天然鹼基對(UBP)。
實施例A79係實施例A76之方法,其中該DNA模板包含至少一個為dNaM-dTPT3之非天然鹼基對(UBP)。
實施例A80係實施例A76之方法,其中該DNA模板包含至少一個為dPTMO-dTPT3之非天然鹼基對(UBP)。
實施例A81係實施例A76之方法,其中該DNA模板包含至少一個為dNaM-dTAT1之非天然鹼基對(UBP)。
實施例A82係實施例A76之方法,其中該DNA模板包含至少一個為dCNMO-dTAT1之非天然鹼基對(UBP)。
實施例A83係實施例A76至A82中任一實施例之方法,其中該mRNA及該tRNA包含選自
Figure 02_image181
Figure 02_image183
之非天然鹼基。
實施例A84係實施例A83之方法,其中該mRNA及該tRNA包含選自
Figure 02_image185
Figure 02_image187
之非天然鹼基。
實施例A85係實施例A83之方法,其中該mRNA包含為
Figure 02_image189
之非天然鹼基。
實施例A86係實施例A83之方法,其中該mRNA包含為
Figure 02_image191
之非天然鹼基。
實施例A87係實施例A83之方法,其中該mRNA包含為
Figure 02_image193
之非天然鹼基。
實施例A88係實施例A76-A87中任一實施例之方法,其中該tRNA包含選自
Figure 02_image195
Figure 02_image197
之非天然鹼基。
實施例A89係實施例A88之方法,其中該tRNA包含為
Figure 02_image199
之非天然鹼基。
實施例A90係A88之方法,其中該tRNA包含為
Figure 02_image201
之非天然鹼基。
實施例A91係實施例A76至A87中任一實施例之方法,其中該tRNA包含為
Figure 02_image203
之非天然鹼基。
實施例A92係實施例A27至A40中任一實施例之方法,其中該第一非天然鹼基包含dCNMO,且該第二非天然鹼基包含dTPT3。
實施例A93係實施例A27至40及A92中任一實施例之方法,其中該第三非天然鹼基包含NaM,且該第二非天然鹼基包含TAT1。
實施例A94係實施例A27至A93中任一實施例之方法,其中該第一非天然鹼基或該第二非天然鹼基由DNA聚合酶識別。
實施例A95係實施例A27至A94中任一實施例之方法,其中該第三非天然鹼基或該第四非天然鹼基由RNA聚合酶識別。
實施例A96係實施例A27至A95中任一實施例之方法,其中轉錄該mRNA,且該方法進一步包含將該mRNA轉譯成蛋白質,其中該蛋白質包含在對應於包含該第三非天然鹼基之該mRNA之密碼子的位置處之非天然胺基酸。
實施例A97係實施例A27至A96中任一實施例之方法,其中該蛋白質包含至少兩個非天然胺基酸。
實施例A98係實施例A27至A96中任一實施例之方法,其中該蛋白質包含至少三個非天然胺基酸。
實施例A99係實施例A27至A98中任一實施例之方法,其中該蛋白質包含至少兩個不同非天然胺基酸。
實施例A100係實施例A27至A98中任一實施例之方法,其中該蛋白質包含至少三個不同非天然胺基酸。
實施例A101係實施例A27至A100中任一實施例之方法,其中該至少一個非天然胺基酸: 係離胺酸類似物; 包含芳香族側鏈; 包含疊氮基; 包含炔基;或 包含醛或酮基團。
實施例A102係實施例A27至A101中任一實施例之方法,其中該至少一個非天然胺基酸不包含芳香族側鏈。
實施例A103係實施例A27至A102中任一實施例之方法,其中該至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)、N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)、BCN-L-離胺酸、降莰烯離胺酸、TCO-離胺酸、甲基四嗪離胺酸、烯丙基氧基羰基離胺酸、2-胺基-8-側氧基壬酸、2-胺基-8-側氧基辛酸、對-乙醯基-L-苯丙胺酸、對-疊氮基甲基-L-苯丙胺酸(pAMF)、對-碘-L-苯丙胺酸、間-乙醯基苯丙胺酸、2-胺基-8-側氧基壬酸、對-炔丙基氧基苯丙胺酸、對-炔丙基-苯丙胺酸、3-甲基-苯丙胺酸、L-多巴、氟化苯丙胺酸、異丙基-L-苯丙胺酸、對-疊氮基-L-苯丙胺酸、對-醯基-L-苯丙胺酸、對-苯甲醯基-L-苯丙胺酸、對-溴苯丙胺酸、對-胺基-L-苯丙胺酸、異丙基-L-苯丙胺酸、O-烯丙基酪胺酸、O-甲基-L-酪胺酸、O-4-烯丙基-L-酪胺酸、4-丙基-L-酪胺酸、膦醯基酪胺酸、三-O-乙醯基-GlcNAcp-絲胺酸、L-磷絲胺酸、膦醯基絲胺酸、L-3-(2-萘基)丙胺酸、2-胺基-3-((2-((3-(苄基氧基)-3-側氧基丙基)胺基)乙基)硒烷基)丙酸、2-胺基-3-(苯基硒烷基)丙酸或硒基半胱胺酸。
實施例A104係實施例A102或A103之方法,其中該至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)或N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。
實施例A105係實施例A104之方法,其中該至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)。
實施例A106係實施例A104之方法,其中該至少一個非天然胺基酸包含N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。
實施例A107係由實施例A27至A106中任一實施例之方法產生之mRNA。
實施例A108係由實施例A27至A106中任一實施例之方法產生之tRNA。
實施例A109係由實施例A107之mRNA編碼之蛋白質,其包含在對應於包含該第三非天然鹼基之該mRNA之密碼子之位置處的非天然胺基酸。
實施例A110係包含擴展遺傳字母之半合成生物體,其中該遺傳字母包含至少三個不同非天然鹼基。
實施例A111係實施例A110之半合成生物體,其中該生物體包含微生物體,視情況其中該微生物體係大腸桿菌。
實施例A112係實施例A110或A111之半合成生物體,其中該生物體包含DNA,其包含至少一個選自以下之非天然核鹼基:
Figure 02_image205
Figure 02_image207
Figure 02_image209
實施例A113係實施例A110至A113中任一實施例之半合成生物體,其中該DNA包含至少一個非天然鹼基對(UBP),
其中該非天然鹼基對(UBP)係dCNMO-dTPT3、dNaM-dTPT3、dCNMO-dTAT1、d5FM-dTAT1或dNaM-dTAT1。
實施例A114係實施例A112之半合成生物體,其中該DNA包含至少一個為
Figure 02_image211
之非天然核鹼基。
實施例A115係實施例A110至A115中任一實施例之半合成生物體,其中該生物體表現異源核苷三磷酸轉運蛋白。
實施例A116係實施例A115之半合成生物體,其中該異源核苷三磷酸轉運蛋白係Pt NTT2。
實施例A117係實施例A110至A116中任一實施例之半合成生物體,其中該生物體進一步表現異源tRNA合成酶。
實施例A118係實施例A117之半合成生物體,其中該異源tRNA合成酶係巴氏甲烷八疊球菌吡咯離胺醯基-tRNA合成酶(Mb PylRS)。
實施例A119係實施例A110至A118中任一實施例之半合成生物體,其中該生物體進一步表現異源RNA聚合酶。
實施例A120係實施例A119之半合成生物體,其中該異源RNA聚合酶係T7 RNAP。
實施例A121係實施例A110至A120中任一實施例之半合成生物體,其中該生物體不表現具有DNA重組修復之功能之蛋白質。
實施例A122係實施例A121之半合成生物體,其中該生物體不表現RecA。
實施例A123係實施例A110至A122中任一實施例之半合成生物體,其進一步包含異源mRNA。
實施例A124係實施例A123之半合成生物體,其中該異源mRNA包含至少一個選自以下之非天然鹼基:
Figure 02_image213
Figure 02_image215
Figure 02_image217
實施例A125係實施例A110至A125中任一實施例之半合成生物體,其進一步包含異源tRNA。
實施例A126係實施例A125之半合成生物體,其中該異源tRNA包含至少一個選自以下之非天然鹼基:
Figure 02_image219
Figure 02_image221
Figure 02_image223
實施例A127係轉錄DNA之方法,該方法包含: 提供一或多種DNA,其包含(1) 編碼蛋白質之基因,其中編碼該蛋白質之該基因之模板股包含第一非天然鹼基,及(2) 編碼tRNA之基因,其中編碼該tRNA之該基因之模板股包含能與該第一非天然鹼基形成鹼基對之第二非天然鹼基; 轉錄編碼該蛋白質之該基因以將第三非天然鹼基納入mRNA中,該第三非天然鹼基能與該第一非天然鹼基形成第一非天然鹼基對; 轉錄編碼tRNA之該基因以將第四非天然鹼基納入tRNA中,其中該第四非天然鹼基能與該第二非天然鹼基形成第二非天然鹼基對,其中該第一非天然鹼基對及該第二非天然鹼基對不相同。
實施例A128係實施例A127之方法,其進一步包含利用該tRNA自該mRNA轉譯蛋白質,其中該蛋白質包含在對應於包含該mRNA中之該第三非天然鹼基之密碼子之位置處的非天然胺基酸。
實施例A129係複製DNA之方法,該方法包含: 提供DNA,其包含(1) 編碼蛋白質之基因,其中編碼該蛋白質之該基因之模板股包含第一非天然鹼基,及(2) 編碼tRNA之基因,其中編碼該tRNA之該基因之模板股包含能與該第一非天然鹼基形成鹼基對之第二非天然鹼基;及 複製該DNA以納入第一替代非天然鹼基代替該第一非天然鹼基,及/或納入第二替代非天然鹼基代替該第二非天然鹼基; 其中該方法視情況進一步包含: 轉錄編碼蛋白質之該基因以將第三非天然鹼基納入mRNA中,該第三非天然鹼基能與該第一非天然鹼基及/或該第一替代非天然鹼基形成第一非天然鹼基對;及/或 轉錄編碼tRNA之該基因以將第四非天然鹼基納入tRNA中,其中該第四非天然鹼基能與該第二非天然鹼基及/或該第二替代非天然鹼基形成第二非天然鹼基對,其中該第一非天然鹼基對及該第二非天然鹼基對不相同。
實施例A130係實施例A129之方法,其進一步包含轉錄編碼蛋白質之該基因以將第三非天然鹼基納入mRNA中,該第三非天然鹼基能與該第一非天然鹼基及/或該第一替代非天然鹼基形成第一非天然鹼基對。
實施例A131係實施例A129或A130之方法,其進一步包含轉錄編碼tRNA之該基因以將第四非天然鹼基納入tRNA中,其中該第四非天然鹼基能與該第二非天然鹼基及/或該第二替代非天然鹼基形成第二非天然鹼基對,其中該第一非天然鹼基對及該第二非天然鹼基對不相同。
實施例A132係實施例A127至A131中任一實施例之方法,其中該方法包含使用半合成生物體。
實施例A133係實施例A132之方法,其中該生物體包含微生物體。
實施例A134係實施例A132或A133之方法,其中該方法係活體內方法,其包含使用為細菌之半合成生物體。
實施例A135係實施例A134之方法,其中該生物體包含革蘭氏陽性細菌。
實施例A136係實施例A134之方法,其中該生物體包含革蘭氏陰性細菌。
實施例A137係實施例A132至A134之方法,其中該生物體包含大腸桿菌。
實施例A138係實施例A127至A137中任一實施例之之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
Figure 02_image225
Figure 02_image227
Figure 02_image229
實施例A139係實施例A138之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
Figure 02_image231
Figure 02_image233
實施例A140係實施例A138之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
Figure 02_image235
,及
Figure 02_image237
實施例A141係實施例A138之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含
Figure 02_image239
Figure 02_image241
實施例A142係實施例A138之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係
Figure 02_image243
實施例A143係實施例A138之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
Figure 02_image245
Figure 02_image247
實施例A144係實施例A138之方法,其中該等第一或第二非天然鹼基係
Figure 02_image249
實施例A145係實施例A138之方法,其中該等第一或第二非天然鹼基係
Figure 02_image251
實施例A146係實施例A138之方法,其中該第一非天然鹼基係
Figure 02_image253
且該第二非天然鹼基係
Figure 02_image255
實施例A147係實施例A138之方法,其中該第一非天然鹼基係
Figure 02_image257
且該第二非天然鹼基係
Figure 02_image259
實施例A148係實施例A138、A146及A147中任一實施例之方法,其中該第三或第四非天然鹼基係
Figure 02_image261
實施例A149係實施例A148之方法,其中該第三非天然鹼基係
Figure 02_image263
實施例A150係實施例A148之方法,其中該第四非天然鹼基係
Figure 02_image265
實施例A151係實施例A138、A146及A147中任一實施例之方法,其中該第三或第四非天然鹼基係
Figure 02_image267
Figure 02_image269
實施例A152係實施例A151之方法,其中該第三非天然鹼基係
Figure 02_image271
Figure 02_image273
實施例A153係實施例A151之方法,其中該第四非天然鹼基係
Figure 02_image275
Figure 02_image277
實施例A154係實施例A138中任一實施例之方法,其中該第一非天然鹼基係
Figure 02_image279
,該第二非天然鹼基係
Figure 02_image281
,該第三非天然鹼基係
Figure 02_image283
,且該第四非天然鹼基係
Figure 02_image285
Figure 02_image287
實施例A155係實施例A138之方法,其中該第一非天然鹼基係
Figure 02_image289
,該第二非天然鹼基係
Figure 02_image291
,該第三非天然鹼基係
Figure 02_image293
,且該第四非天然鹼基係
Figure 02_image295
Figure 02_image297
實施例A156係實施例A138之方法,其中該第一非天然鹼基係
Figure 02_image299
,該第二非天然鹼基係
Figure 02_image301
,該第三非天然鹼基係
Figure 02_image303
Figure 02_image305
且該第四非天然鹼基係
Figure 02_image307
實施例A157係實施例A138之方法,其中該第三非天然鹼基係
Figure 02_image309
Figure 02_image311
實施例A158係實施例A138之方法,其中該第四非天然鹼基係
Figure 02_image313
實施例A159係實施例A138之方法,其中該第一非天然鹼基係
Figure 02_image315
,該第二非天然鹼基係
Figure 02_image317
,該第三非天然鹼基係
Figure 02_image319
Figure 02_image321
,且該第四非天然鹼基係
Figure 02_image323
實施例A160係實施例A127至A159中任一實施例之方法,其中該第三非天然鹼基及該第四非天然鹼基包含核糖。
實施例A161係實施例A127至A159中任一實施例之方法,其中該第三非天然鹼基及該第四非天然鹼基包含去氧核糖。
實施例A162係實施例A127至A161中任一實施例之方法,其中該等第一及第二非天然鹼基包含去氧核糖。
實施例A163係實施例A127至A159中任一實施例之方法,其中該等第一及第二非天然鹼基包含去氧核糖且該第三非天然鹼基及該第四非天然鹼基包含核糖。
實施例A164係實施例A127至A137中任一實施例之方法,其中該DNA模板包含至少一個選自由以下組成之群之非天然鹼基對(UBP):
Figure 02_image325
Figure 02_image327
實施例A165係實施例A164之方法,其中該DNA模板包含至少一個為dNaM-d5SICS之非天然鹼基對(UBP)。
實施例A166係實施例A164之方法,其中該DNA模板包含至少一個為dCNMO-dTPT3之非天然鹼基對(UBP)。
實施例A167係實施例A164之方法,其中該DNA模板包含至少一個為dNaM-dTPT3之非天然鹼基對(UBP)。
實施例A168係實施例A164之方法,其中該DNA模板包含至少一個為dNaM-dTAT1之非天然鹼基對(UBP)。
實施例A169係實施例A164之方法,其中該DNA模板包含至少一個為dCNMO-dTAT1之非天然鹼基對(UBP)。
實施例A170係實施例A127至A137中任一實施例之方法,其中該DNA模板包含至少一個選自由以下組成之群之非天然鹼基對(UBP):
Figure 02_image329
Figure 02_image331
;且 其中該mRNA及該tRNA包含至少一個選自以下之非天然鹼基:
Figure 02_image333
Figure 02_image335
實施例A171係根據實施例A170之方法,其中該DNA模板包含至少一個為dNaM-d5SICS之非天然鹼基對(UBP)。
實施例A172係實施例A170之方法,其中該DNA模板包含至少一個為dCNMO-dTPT3之非天然鹼基對(UBP)。
實施例A173係實施例A170之方法,其中該DNA模板包含至少一個為dNaM-dTPT3之非天然鹼基對(UBP)。
實施例A174係實施例A170之方法,其中該DNA模板包含至少一個為dNaM-dTAT1之非天然鹼基對(UBP)。
實施例A175係實施例A170之方法,其中該DNA模板包含至少一個為dCNMO-dTAT1之非天然鹼基對(UBP)。
實施例A176係實施例A127至A175中任一實施例之方法,其中該mRNA及該tRNA包含選自
Figure 02_image337
Figure 02_image339
之非天然鹼基。
實施例A177係實施例A176之方法,其中該mRNA及該tRNA包含選自
Figure 02_image341
Figure 02_image343
之非天然鹼基。
實施例A178係實施例A176之方法,其中該mRNA包含為
Figure 02_image345
之非天然鹼基。
實施例A179係實施例A176之方法,其中該mRNA包含為
Figure 02_image347
之非天然鹼基。
實施例A180係實施例A176之方法,其中該mRNA包含為
Figure 02_image349
之非天然鹼基。
實施例A181係實施例A176之方法,其中該tRNA包含選自
Figure 02_image351
Figure 02_image353
之非天然鹼基。
實施例A182係實施例A176之方法,其中該tRNA包含為
Figure 02_image355
之非天然鹼基。
實施例A183係實施例A176之方法,其中該tRNA包含為
Figure 02_image357
之非天然鹼基。
實施例A184係實施例A176之方法,其中該tRNA包含為
Figure 02_image359
之非天然鹼基。
實施例A185係實施例A127至A137中任一實施例之方法,其中該第一非天然鹼基包含dCNMO,且該第二非天然鹼基包含dTPT3。
實施例A186係實施例A127至A137中任一實施例之方法,其中該第三非天然鹼基包含NaM,且該第二非天然鹼基包含TAT1。
實施例A187係實施例A127至A186中任一實施例之方法,其中該蛋白質包含至少兩個非天然胺基酸。
實施例A188係實施例A127至A186中任一實施例之方法,其中該蛋白質包含至少三個非天然胺基酸。
實施例A189係實施例A127至A186中任一實施例之方法,其中該蛋白質包含至少兩個不同非天然胺基酸。
實施例A190係實施例A127至A186中任一實施例之方法,其中該蛋白質包含至少三個不同非天然胺基酸。
實施例A191係實施例A127至A190中任一實施例之方法,其中該至少一個非天然胺基酸:
係離胺酸類似物;
包含芳香族側鏈;
包含疊氮基;
包含炔基;或
包含醛或酮基團。
實施例A192係實施例A127至A191中任一實施例之方法,其中該至少一個非天然胺基酸不包含芳香族側鏈。
實施例A193係實施例A191或A192之方法,其中該至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)或N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。
實施例A194係實施例A193之方法,其中該至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)。
實施例A195係實施例A193之方法,其中該至少一個非天然胺基酸包含N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。
相關申請案之交叉參考
本申請案主張於2019年6月14日提出申請之美國臨時申請案第62/861,901號之優先權,其全部揭示內容以引用方式併入本文中。 關於聯邦資助之研究之聲明
本文揭示之發明至少部分地係在美國政府支持下由國家衛生研究院(National Institutes of Health,NIH)在授權號5R35 GM118178及GM128376以及F31 GM128376下以及由國家科學基金會(National Science Foundation,NSF)在授權號NSF/DGE-1346837下製得。因此,美國政府對本發明享有一定權利。 某些術語
除非另外定義,否則本文所用之所有技術及科學術語皆具有與熟習所主張標的物所屬技術者通常所理解含義相同之含義。應理解,上文一般說明及下文詳細說明僅係例示性及解釋性,且不限制所主張之任何標的物。就以引用方式併入本文之任何材料與本揭示內容之表達內容不一致而言,以表達內容為準。在此申請案中,除非另外明確說明,否則單數之使用包括複數。必須注意,除非上下文另外明確說明,否則本說明書及隨附申請專利範圍中所用之單數形式「一(a、an)」及「該(the)」包括複數個指示物。在本申請案中,除非另有說明,否則使用「或」意指「及/或」。此外,術語「包括(including)」以及其他形式(例如「include」、「includes」及「included」)之使用不具有限制性。
如本文中所用,範圍及量可表示為「約」為一特定值或範圍。「約」亦包括精確量。因此,「約5 µL」意指「約5 µL」且亦構成「5 µL」之說明。通常,術語「約」包括預計在試驗誤差內之量。
本文所使用之諸如「在適於提供……之條件下」或「在足以產生……之條件下」及諸如此類之片語在合成方法之背景中係指反應條件,例如時間、溫度、溶劑、反應物濃度及諸如此類,其在實驗者之普通技術內有所改變,且提供有用量或產率之反應產物。期望反應產物不必為唯一反應產物或不必完全消耗起始材料,前提係可分離或以其他方式進一步使用期望反應產物。
「化學上可行」意指不違背通常所理解之有機結構規則之鍵結佈置或化合物;例如申請專利範圍之定義內之結構,若其在某些情況下含有自然界中不存在之五價碳原子,則將其理解為不在該申請專利範圍內。在所有其實施例中,本文所揭示之結構皆意欲僅包括「化學上可行」結構,且本文並非意欲揭示或主張任何所列舉化學上不可行結構(例如在顯示具有可變原子或基團之結構中)。
如本文所用術語,化學結構之「類似物」係指與母體結構保存實質類似性之化學結構,但其並不易於以合成方式衍生自母體結構。在一些實施例中,核苷酸類似物係非天然核苷酸。在一些實施例中,核苷類似物係非天然核苷。易於以合成方式衍生自母體化學結構之相關化學結構稱為「衍生物」。
如本文所用之「鹼基」或「核鹼基」係指核苷或核苷酸(核苷及核苷酸包括核糖或去氧核糖變體)之至少核鹼基部分,其在一些情形下可包含對核苷或核苷酸之糖部分之進一步修飾。在一些情形下,「鹼基」亦用於表示整個核苷或核苷酸(例如,「鹼基」可藉由DNA聚合酶納入DNA中,或藉由RNA聚合酶納入RNA中)。然而,除非上下文需要,否則術語「鹼基」不應解釋為必然代表整個核苷或核苷酸。在鹼基或核鹼基之本文提供之化學結構中,僅顯示核苷或核苷酸之鹼基,為清晰起見,省略糖部分及視情況任何磷酸殘基。如鹼基或核鹼基之本文提供之化學結構中所用,波浪線表示與核苷或核苷酸之連接,其中核苷或核苷酸之糖部分可經進一步修飾。在一些實施例中,波浪線表示鹼基或核鹼基與核苷或核苷酸之糖部分(例如戊醣)之連接。在一些實施例中,戊醣係核糖或去氧核糖。
在一些實施例中,核鹼基通常係核苷之雜環鹼基部分。核鹼基可為天然的,可經修飾,可與天然鹼基無類似性,及/或可例如藉由有機合成而合成。在某些實施例中,核鹼基包含核苷或核苷酸中之任何原子或原子團,其中原子或原子團能夠在使用或不使用氫鍵之情況下與另一核酸之鹼基相互作用。在某些實施例中,非天然核鹼基並非衍生自天然核鹼基。應注意,非天然核鹼基不一定具有鹼性性質,然而,為簡單起見,將其稱為核鹼基。在一些實施例中,當提及核鹼基時,「(d)」指示核鹼基可連接至去氧核糖或核糖,而不帶括號之「d」指示核鹼基連接至去氧核糖。
在一些實施例中,核苷係包含核鹼基部分及糖部分之化合物。核苷包括(但不限於)天然核苷(如在DNA及RNA中所發現)、無鹼基核苷、經修飾核苷、以及具有模擬鹼基及/或糖基團之核苷。核苷包括包含任何種類取代基之核苷。核苷可為經由核酸鹼基及糖之還原基團之間之醣苷鏈接形成的醣苷化合物。
如本文所用之「核苷酸」係指包含核苷部分及磷酸酯部分之化合物。實例性天然核苷酸包括(但不限於)腺苷三磷酸(ATP)、尿苷三磷酸(UTP)、胞苷三磷酸(CTP)、鳥苷三磷酸(GTP)、腺苷二磷酸(ADP)、尿苷二磷酸(UDP)、胞苷二磷酸(CDP)、鳥苷二磷酸(GDP)、腺苷單磷酸(AMP)、尿苷單磷酸(UMP)、胞苷單磷酸(CMP)、及鳥苷單磷酸(GMP)、去氧腺苷三磷酸(dATP)、去氧胸苷三磷酸(dTTP)、去氧胞苷三磷酸(dCTP)、去氧鳥苷三磷酸(dGTP)、去氧腺苷二磷酸(dADP)、胸苷二磷酸(dTDP)、去氧胞苷二磷酸(dCDP)、去氧鳥苷二磷酸(dGDP)、去氧腺苷單磷酸(dAMP)、去氧胸苷單磷酸(dTMP)、去氧胞苷單磷酸(dCMP)及去氧鳥苷單磷酸(dGMP)。包含去氧核糖作為糖部分之實例性天然去氧核糖核苷酸包括dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP及dGMP。包含核糖作為糖部分之實例性天然核糖核苷酸包括ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP及GMP。
本文所用之聚核苷酸係指DNA、RNA、DNA樣或RNA樣聚合物,例如肽核酸(PNA)、鎖核酸(LNA)、硫代磷酸酯及諸如此類,其實例為業內所熟知,且可含有非天然鹼基。聚核苷酸可在自動化合成器中、例如使用亞磷醯胺化學或適於合成器使用之其他化學方法來合成。
DNA包括(但不限於)互補DNA (cDNA)及基因體DNA (gDNA)。DNA可藉由共價或非共價方式連接至另一分子,包括但不限於RNA及肽。RNA包括編碼RNA,例如信使RNA (mRNA)。RNA亦包括非編碼RNA,例如核糖體RNA (rRNA)。RNA亦包括轉運RNA (tRNA)、RNA干擾(RNAi)、小核仁RNA (snoRNA)、微小RNA (miRNA)、小干擾RNA (siRNA) (亦稱為短干擾RNA)、小核RNA (snRNA)、細胞外RNA (exRNA)、PIWI相互作用RNA (piRNA)及長非編碼RNA (長ncRNA)。在一些實施例中,RNA係rRNA、tRNA、RNAi、snoRNA、微小RNA、siRNA、snRNA、exRNA、piRNA、長ncRNA或其任何組合或雜合物。在一些情況下,RNA係核酶之組分。DNA及RNA可呈任何形式,包括但不限於線性、環狀、超螺旋、單股及雙股。
肽核酸(PNA)係合成DNA/RNA類似物,其中肽樣主鏈代替DNA或RNA之糖-磷酸主鏈。PNA寡聚物在與互補DNA之結合中顯示更高結合強度及更大特異性,其中PNA/DNA鹼基失配比DNA/DNA雙螺旋體中之類似失配更不穩定。此結合強度及特異性亦適用於PNA/RNA雙螺旋體。PNA不易由核酸酶或蛋白酶識別,使其對酶降解具有抗性。PNA在寬pH範圍內亦係穩定的。亦參見Nielsen PE, Egholm M, Berg RH, Buchardt O (1991年12月)。「Sequence-selective recognition of DNA by strand displacement with a thymine-substituted polyamide」,Science 254 (5037): 1497-500. doi:10.1126/science.1962210. PMID 1962210;及Egholm M, Buchardt O, Christensen L, Behrens C, Freier SM, Driver DA, Berg RH, Kim SK, Nordén B及Nielsen PE (1993), 「PNA Hybridizes to Complementary Oligonucleotides Obeying the Watson-Crick Hydrogen Bonding Rules」.Nature 365 (6446): 566-8. doi:10.1038/365566a0. PMID 7692304;每一參考文獻之揭示內容係以全文引用之方式併入本文中。
鎖核酸(LNA)係經修飾RNA核苷酸,其中LNA核苷酸之核糖部分經連接2'氧及4'碳之額外橋修飾。橋將核糖「鎖定」在3'-內(North)構形中,其通常在A-形式雙螺旋體中發現。LNA核苷酸可在需要時與寡核苷酸中之DNA或RNA殘基混合。該等寡聚物可化學合成且有市售。鎖定核糖構形增強鹼基堆積及主鏈預組織。例如參見Kaur, H;Arora, A;Wengel, J;Maiti, S (2006), 「Thermodynamic, Counterion, and Hydration Effects for the Incorporation of Locked Nucleic Acid Nucleotides into DNA Duplexes」,Biochemistry 45 (23): 7347-55. doi:10.1021/bi060307w. PMID 16752924;Owczarzy R.;You Y., Groth C.L., Tataurov A.V. (2011), 「Stability and mismatch discrimination of locked nucleic acid-DNA duplexes.」,Biochem. 50 (43): 9352-9367. doi:10.1021/bi200904e. PMC 3201676. PMID 21928795;Alexei A. Koshkin;Sanjay K. Singh, Poul Nielsen, Vivek K. Rajwanshi, Ravindra Kumar, Michael Meldgaard, Carl Erik Olsen, Jesper Wengel (1998), 「LNA (Locked Nucleic Acids): Synthesis of the adenine, cytosine, guanine, 5-methylcytosine, thymine and uracil bicyclonucleoside monomers, oligomerisation, and unprecedented nucleic acid recognition」,Tetrahedron 54 (14): 3607-30. doi:10.1016/S0040-4020(98)00094-5;及Satoshi Obika;Daishu Nanbu, Yoshiyuki Hari, Ken-ichiro Morio, Yasuko In, Toshimasa Ishida, Takeshi Imanishi (1997), 「Synthesis of 2′-O ,4′-C -methyleneuridine and -cytidine. Novel bicyclic nucleosides having a fixed C3'-endo sugar puckering」,Tetrahedron Lett. 38 (50): 8735-8. doi:10.1016/S0040-4039(97)10322-7;每一參考文獻之揭示內容係以全文引用之方式併入本文中。
如本文所用術語「基因」係指編碼基因產物(例如RNA或蛋白質)之合成之聚核苷酸。
分子信標或分子信標探針係寡核苷酸雜交探針,其可檢測均質溶液中特定核酸序列之存在。分子信標係具有內部淬滅螢光團之髮夾形狀之分子,當其結合至靶核酸序列時,該螢光團螢光恢復。例如參見Tyagi S, Kramer FR (1996), 「Molecular beacons: probes that fluoresce upon hybridization」,Nat Biotechnol. 14 (3): 303-8。PMID 9630890;Täpp I, Malmberg L, Rennel E, Wik M, Syvänen AC (2000年4月), 「Homogeneous scoring of single-nucleotide polymorphisms: comparison of the 5'-nuclease TaqMan assay and Molecular Beacon probes」,Biotechniques 28 (4): 732-8。PMID 10769752;及Akimitsu Okamoto (2011), 「ECHO probes: a concept of fluorescence control for practical nucleic acid sensing」,Chem. Soc. Rev. 40 : 5815-5828;每一參考文獻之揭示內容係以全文引用之方式併入本文中。
如本文所用術語「非天然鹼基」係指除A、C、G、T、U及其他天然鹼基(例如5-甲基胞嘧啶、假尿苷及肌苷)以外之鹼基。
如本文所用術語「非天然鹼基對」係指彼此鍵結且位於DNA分子之相對股上之兩個鹼基,其中兩個鹼基中之至少一者係非天然鹼基。
如本文所用,「半合成生物體」係包含非天然組分之生物體,例如包含一或多個非天然鹼基之擴展遺傳字母。
本文所用各部分標題僅出於組織性目的,且不應視為限制所述標的物。方法及包含非天然鹼基對之組合物
在某些實施例中,本文揭示用於產生具有擴展遺傳字母之核酸之活體外及活體內方法及組合物( 1 )。在一些情況下,核酸編碼非天然蛋白質,其中非天然蛋白質包含非天然胺基酸。在一些情形下,本文所述之活體內方法或組合物利用或包含半合成生物體。在一些情況下,該方法包括將至少一個非天然鹼基對(UBP)納入一或多個核酸中。該等鹼基對係藉由兩個核苷之核鹼基之間之配對形成。在實例性工作流中,將編碼蛋白質102 及tRNA103 之DNA101 (即,用於蛋白質及tRNA之模板股編碼區,其包含互補、能形成鹼基對及/或其組態可以形成鹼基對之非天然核鹼基(X, Y))轉錄104 以生成tRNA106 及mRNA107 。在向tRNA中載入非天然胺基酸105 後,將mRNA107 轉譯108 以生成包含一或多種非天然胺基酸109 之蛋白質110 。在一些情況下,本文所述之方法及組合物允許以高保真度及產率位點特異性納入非天然胺基酸。本文亦闡述包含擴展遺傳字母之半合成生物體、以及使用半合成生物體產生蛋白質產物之方法,該等蛋白質產物包括包含至少一個非天然胺基酸殘基之彼等。
非天然核鹼基之選擇允許最佳化本文所述方法中之一或多個步驟。舉例而言,針對高效率複製、轉錄及/或轉譯選擇核鹼基。在一些情況下,本文所述之方法使用一個以上非天然核鹼基對。舉例而言,包含去氧核糖部分之第一組核鹼基用於DNA複製(例如第一核鹼基及第二核鹼基,其組態可以形成第一鹼基對),且第二組核鹼基(例如第三核鹼基及第四核鹼基,其中第三及第四核鹼基連接至核糖,其組態可以形成第二鹼基對)用於轉錄/轉譯。在一些實施例中,第一組核鹼基用於構築質體(例如第一核鹼基及第二核鹼基,其組態可以形成第一鹼基對),第二組核鹼基用於複製(例如第三核鹼基及第四核鹼基,其組態可以形成第二鹼基對),且第三組鹼基用於轉錄/轉譯(例如第五及第六核鹼基,其組態可以形成第三鹼基對)。在一些情況下,第一組之核鹼基與第二組之核鹼基之間之互補配對允許基因轉錄,以自包含來自第一組之核鹼基之DNA模板產生tRNA或蛋白質。在某些情況下,第二組核鹼基之間之互補配對(第二鹼基對)允許藉由匹配包含非天然核酸及mRNA之tRNA進行轉譯。在一些情況下,第一組中之核鹼基連接至去氧核糖部分。在一些情形下,第一組中之核鹼基連接至核糖部分。在一些情況下,兩組之核鹼基係獨特的。在一些情況下,在兩組中,至少一個核鹼基相同。在一些情況下,第一核鹼基及第三核鹼基相同。在一些實施例中,第一鹼基對及第二鹼基對不相同。在一些情形下,第一鹼基對、第二鹼基對及第三鹼基對不相同。
在一態樣中,本文提供產生包含非天然胺基酸之蛋白質之活體內方法,該方法包含: 轉錄包含第一非天然鹼基及第二非天然鹼基之DNA模板,該第二非天然鹼基與第一非天然鹼基互補、能與第一非天然鹼基形成鹼基對及/或組態可以與第一非天然鹼基形成鹼基對,以將第三非天然鹼基納入mRNA中,該第三非天然鹼基與第一非天然鹼基互補、能與第一非天然鹼基形成鹼基對及/或其組態可以與第一非天然鹼基形成第一非天然鹼基對; 轉錄DNA模板以將第四非天然鹼基納入tRNA中,其中第四非天然鹼基與第二非天然鹼基互補,能與第二非天然鹼基形成鹼基對,及/或其組態可以與第二非天然鹼基形成第二非天然鹼基對,其中第一非天然鹼基對及第二非天然鹼基對不相同;以及 自mRNA及tRNA轉譯蛋白質,其中該蛋白質包含非天然胺基酸。核酸分子
在一些實施例中,例如,核酸(例如,在本文中亦稱為所關注核酸分子)來自任何來源或組合物,例如DNA、cDNA、gDNA (基因體DNA)、RNA、siRNA (短抑制性RNA)、RNAi、tRNA、mRNA或rRNA (核糖體RNA),且呈任何形式(例如,線性、環狀、超螺旋、單股、雙股及諸如此類)。在一些實施例中,核酸包含核苷酸、核苷或聚核苷酸。在一些情形下,核酸包含天然及非天然核酸。在一些情況下,核酸亦包含非天然核酸,例如DNA或RNA類似物(例如,含有鹼基類似物、糖類似物及/或非天然主鏈及諸如此類)。應理解,術語「核酸」不指或推斷聚核苷酸鏈之特定長度,因此聚核苷酸及寡核苷酸亦包括在該定義中。實例性天然核苷酸包括(但不限於) ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP、GMP、dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP及dGMP。實例性天然去氧核糖核苷酸包括dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP及dGMP。實例性天然核糖核苷酸包括ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP及GMP。對於天然RNA,含尿嘧啶之核苷係尿苷。核酸有時係載體、質體、噬粒、自主複製序列(ARS)、著絲粒、人工染色體、酵母人工染色體(例如YAC)或能夠在宿主細胞中複製或被複製之其他核酸。在一些情況下,非天然核酸係核酸類似物。在額外情形下,非天然核酸來自細胞外來源。在其他情形下,非天然核酸可用於本文提供之生物體(例如經遺傳修飾之生物體)之細胞內空間。在一些實施例中,非天然核苷酸並非天然核苷酸。在一些實施例中,不包含天然鹼基之核苷酸包含非天然核鹼基。非天然核酸
核苷酸類似物或非天然核苷酸包含含有對鹼基、糖或磷酸部分之某種類型修飾之核苷酸。術語「修飾」 (及相關之語法形式,例如「經修飾」)不一定意味著核苷酸類似物或非天然核苷酸係藉由直接改變天然核苷酸來製備,而是核苷酸類似物或非天然核苷酸不同於天然核苷酸。在一些實施例中,修飾包含化學修飾。在一些情形下,修飾發生在3’OΗ或5’OΗ基團、主鏈、糖組分或核苷酸鹼基處。在一些情況下,修飾視情況包括非天然連接體分子及/或股間或股內交聯。在一態樣中,經修飾核酸包含3’OΗ或5’OΗ基團、主鏈、糖組分或核苷酸鹼基中之一或多者之修飾,及/或非天然連接體分子之添加。在一態樣中,經修飾主鏈包含除了磷酸二酯主鏈之外之主鏈。在一態樣中,經修飾糖包含除了去氧核糖(在經修飾DNA中)或除了核糖(經修飾RNA)以外之糖。在一態樣中,經修飾鹼基包含除了腺嘌呤、鳥嘌呤、胞嘧啶或胸腺嘧啶(在經修飾DNA中)以外之鹼基、或除了腺嘌呤、鳥嘌呤、胞嘧啶或尿嘧啶(在經修飾RNA中)以外之鹼基。在一些實施例中,非天然核苷酸包含非天然鹼基。在一些實施例中,非天然鹼基係具有除嘌呤或嘧啶之外之環或環系之鹼基(其中嘌呤及嘧啶包括具有環外取代基之嘌呤及嘧啶),或者包含含有一或多個非氮雜原子及/或不含氮之環或環系統。
在一些實施例中,核酸包含至少一個經修飾之鹼基。在一些情況下,核酸包含2、3、4、5、6、7、8、9、10、15、20個或更多個經修飾之鹼基。在一些情形下,對鹼基部分之修飾包括腺嘌呤(A)、胞嘧啶(C)、鳥嘌呤(G)及胸腺嘧啶(T)/尿嘧啶(U)以及不同嘌呤或嘧啶鹼基之天然及合成修飾。在一些實施例中,修飾係對腺嘌呤、鳥嘌呤、胞嘧啶或胸腺嘧啶之經修飾形式(在經修飾DNA中)或腺嘌呤、鳥嘌呤、胞嘧啶或尿嘧啶之經修飾形式(經修飾RNA)。
非天然核酸之經修飾鹼基包括(但不限於)尿嘧啶-5-基、次黃嘌呤-9-基(I)、2-胺基腺嘌呤-9-基、5-甲基胞嘧啶(5-me-C)、5-羥基甲基胞嘧啶、黃嘌呤、次黃嘌呤、2-胺基腺嘌呤、腺嘌呤及鳥嘌呤之6-甲基及其他烷基衍生物、腺嘌呤及鳥嘌呤之2-丙基及其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶及2-硫胞嘧啶、5-鹵基尿嘧啶及胞嘧啶、5-丙炔基尿嘧啶及胞嘧啶、6-偶氮基尿嘧啶、胞嘧啶及胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-鹵基、8-胺基、8-硫醇、8-硫代烷基、8-羥基及其他8-取代之腺嘌呤及鳥嘌呤、5-鹵基(具體而言5-溴)、5-三氟甲基及其他5-取代之尿嘧啶及胞嘧啶、7-甲基鳥嘌呤及7-甲基腺嘌呤、8-氮雜鳥嘌呤及8-氮雜腺嘌呤、7-去氮鳥嘌呤及7-去氮腺嘌呤以及3-去氮鳥嘌呤及3-去氮腺嘌呤。某些非天然核酸,例如5-取代之嘧啶、6-氮雜嘧啶及N-2取代之嘌呤、N-6取代之嘌呤、O-6取代之嘌呤、2-胺基丙基腺嘌呤、5-丙炔基尿嘧啶、5-丙炔基胞嘧啶、5-甲基胞嘧啶、增加雙螺旋體形成之穩定性之彼等、通用核酸、疏水核酸、混雜核酸、大小擴展之核酸、氟化核酸、5-取代之嘧啶、6-氮雜嘧啶及N-2、N-6及O-6取代之嘌呤,包括2-胺基丙基腺嘌呤、5-丙炔基尿嘧啶及5-丙炔基胞嘧啶。5-甲基胞嘧啶(5-me-C)、5-羥基甲基胞嘧啶、黃嘌呤、次黃嘌呤、2-胺基腺嘌呤、腺嘌呤及鳥嘌呤之6-甲基、其他烷基衍生物、腺嘌呤及鳥嘌呤之2-丙基及其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶及2-硫胞嘧啶、5-鹵基尿嘧啶、5-鹵基胞嘧啶、5-丙炔基(-C≡C-CH3 )尿嘧啶、5-丙炔基胞嘧啶、嘧啶核酸之其他炔基衍生物、6-偶氮基尿嘧啶、6-偶氮基胞嘧啶、6-偶氮基胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-鹵基、8-胺基、8-硫醇、8-硫代烷基、8-羥基及其他8-取代之腺嘌呤及鳥嘌呤、5-鹵基(具體而言5-溴)、5-三氟甲基、其他5-取代之尿嘧啶及胞嘧啶、7-甲基鳥嘌呤、7-甲基腺嘌呤、2-F-腺嘌呤、2-胺基-腺嘌呤、8-氮雜鳥嘌呤、8-氮雜腺嘌呤、7-去氮鳥嘌呤、7-去氮腺嘌呤、3-去氮鳥嘌呤、3-去氮腺嘌呤、三環嘧啶、啡噁嗪胞苷([5,4-b][1,4]苯并噁嗪-2(3H)-酮)、啡噻嗪胞苷(1H-嘧啶并[5,4-b][1,4]苯并噻嗪-2(3H)-酮)、G-夾、啡噁嗪胞苷(例如9-(2-胺基乙氧基)-H-嘧啶并[5,4-b][1,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并[3’,2’:4,5]吡咯并[2,3-d]嘧啶-2-酮)、嘌呤或嘧啶鹼基經其他雜環置換之彼等、7-去氮-腺嘌呤、7-去氮鳥苷、2-胺基吡啶、2-吡啶酮、氮雜胞嘧啶、5-溴胞嘧啶、溴尿嘧啶、5-氯胞嘧啶、氯化胞嘧啶、環胞嘧啶、胞嘧啶阿拉伯糖苷、5-氟胞嘧啶、氟嘧啶、氟尿嘧啶、5,6-二氫胞嘧啶、5-碘胞嘧啶、羥基脲、碘尿嘧啶、5-硝基胞嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-氟尿嘧啶及5-碘尿嘧啶、2-胺基-腺嘌呤、6-硫-鳥嘌呤、2-硫-胸腺嘧啶、4-硫-胸腺嘧啶、5-丙炔基-尿嘧啶、4-硫-尿嘧啶、N4-乙基胞嘧啶、7-去氮鳥嘌呤、7-去氮-8-氮雜鳥嘌呤、5-羥基胞嘧啶、2’-去氧尿苷、2-胺基-2’-去氧腺苷及闡述於以下中之彼等:美國專利第3,687,808號;第4,845,205號;第4,910,300號;第4,948,882號;第5,093,232號;第5,130,302號;第5,134,066號;第5,175,273號;第5,367,066號;第5,432,272號;第5,457,187號;第5,459,255號;第5,484,908號;第5,502,177號;第5,525,711號;第5,552,540號;第5,587,469號;第5,594,121號;第5,596,091號;第5,614,617號;第5,645,985號;第5,681,941號;第5,750,692號;第5,763,588號;第5,830,653號及第6,005,096號;WO 99/62923;Kandimalla等人,(2001) Bioorg. Med. Chem. 9:807-813;The Concise Encyclopedia of Polymer Science and Engineering, Kroschwitz, J.I.編輯, John Wiley & Sons, 1990, 858- 859;Englisch等人,Angewandte Chemie, 國際版, 1991, 30, 613;及Sanghvi, 第15章, Antisense Research and Appliation, Crooke及Lebleu編輯, CRC Press, 1993, 273-288。額外鹼基修飾可參見(例如)美國專利第3,687,808號;Englisch等人,Angewandte Chemie, 國際版, 1991, 30, 613。在一些情況下,非天然核酸包含 2 之核鹼基。在一些情況下,非天然核酸包含 4A 之核鹼基。在一些情況下,非天然核酸包含 4B 之核鹼基。
包含各種雜環鹼基及各種糖部分(及糖類似物)之非天然核酸在業內可獲得,且在一些情形下,核酸包括一個或若干除了天然核酸之五個主要鹼基組分外之雜環鹼基。舉例而言,在一些情形下,雜環鹼基包括尿嘧啶-5-基、胞嘧啶-5-基、腺嘌呤-7-基、腺嘌呤-8-基、鳥嘌呤-7-基、鳥嘌呤-8-基、4-胺基吡咯并[2.3-d]嘧啶-5-基、2-胺基-4-側氧基吡咯并[2,3-d]嘧啶-5-基、2-胺基-4-側氧基吡咯并[2.3-d]嘧啶-3-基,其中嘌呤經由9-位、嘧啶經由1-位、吡咯并嘧啶經由7-位且吡唑并嘧啶經由1-位連接至核酸之糖部分。
在一些實施例中,下文繪示非天然核酸之經修飾鹼基,其中波形線鑑別與核苷或核苷酸(例如去氧核糖或核糖)之糖之連接點。
Figure 02_image361
Figure 02_image363
Figure 02_image365
Figure 02_image367
(NaM)、
Figure 02_image369
(CNMO)、
Figure 02_image371
(MMO2)、
Figure 02_image373
(5FM)、
Figure 02_image375
(2OMe)、
Figure 02_image377
(5F2OMe)、
Figure 02_image379
(ClMO)、
Figure 02_image381
(BrMO)、
Figure 02_image383
(PTMO)、
Figure 02_image385
(MTMO)、
Figure 02_image387
(TPT3)、
Figure 02_image389
(SICS)、
Figure 02_image391
(FSICS)、
Figure 02_image393
(TAT1)、
Figure 02_image395
(dNaM)、
Figure 02_image397
(dCNMO)、
Figure 02_image399
(dMMO2)、
Figure 02_image401
(d5FM)、
Figure 02_image403
(d2OMe)、
Figure 02_image405
(d5F2OMe)、
Figure 02_image407
(dClMO)、
Figure 02_image409
(dBrMO)、
Figure 02_image411
(dPTMO)、
Figure 02_image413
(dMTMO)、
Figure 02_image415
(dTPT3)、
Figure 02_image417
(dSICS)、
Figure 02_image419
(dFSICS)、
Figure 02_image421
Figure 02_image423
(dTAT1)。
在一些實施例中,非天然鹼基(例如產生包含本文所述非天然胺基酸之蛋白質之方法的第一非天然鹼基、第二非天然鹼基、第三非天然鹼基或第四非天然鹼基中之至少一者)係選自由以下組成之群:
Figure 02_image425
Figure 02_image427
Figure 02_image429
。在一些實施例中,非天然鹼基係選自由以下組成之群:
Figure 02_image431
Figure 02_image433
。在一些實施例中,非天然鹼基係選自由以下組成之群:
Figure 02_image435
Figure 02_image437
。在一些實施例中,非天然鹼基係選自由以下組成之群:
Figure 02_image439
Figure 02_image441
。在一些實施例中,非天然鹼基係
Figure 02_image443
。在一些實施例中,非天然鹼基係選自:
Figure 02_image445
Figure 02_image447
在一些實施例中,非天然鹼基(例如產生包含本文所述非天然胺基酸之蛋白質之方法的第一或第二非天然鹼基)係
Figure 02_image449
。在一些實施例中,非天然鹼基(例如產生包含本文所述非天然胺基酸之蛋白質之方法的第一或第二非天然鹼基)係
Figure 02_image451
。在一些實施例中,第一非天然鹼基係
Figure 02_image453
且第二非天然鹼基係
Figure 02_image455
在一些實施例中,非天然鹼基(例如產生包含本文所述非天然胺基酸之蛋白質之方法的第三或第四非天然鹼基)係
Figure 02_image457
。在一些實施例中,第三非天然鹼基係
Figure 02_image459
。在一些實施例中,第四非天然鹼基係
Figure 02_image461
。在一些實施例中,非天然鹼基(例如產生包含本文所述非天然胺基酸之蛋白質之方法的第三或第四非天然鹼基)係
Figure 02_image463
Figure 02_image465
。在一些實施例中,第三非天然鹼基係
Figure 02_image467
Figure 02_image469
。在一些實施例中,第四非天然鹼基係
Figure 02_image471
Figure 02_image473
在一些實施例中,第一非天然鹼基係
Figure 02_image475
,第二非天然鹼基係
Figure 02_image477
,第三非天然鹼基係
Figure 02_image479
,且第四非天然鹼基係
Figure 02_image481
Figure 02_image483
。在一些實施例中,第一非天然鹼基係
Figure 02_image485
,第二非天然鹼基係
Figure 02_image487
,第三非天然鹼基係
Figure 02_image489
,且第四非天然鹼基係
Figure 02_image491
Figure 02_image493
。在一些實施例中,第一非天然鹼基係
Figure 02_image495
,第二非天然鹼基係
Figure 02_image497
,第三非天然鹼基係
Figure 02_image499
Figure 02_image501
且第四非天然鹼基係
Figure 02_image503
。在一些實施例中,第三非天然鹼基係
Figure 02_image505
Figure 02_image507
。在一些實施例中,第四非天然鹼基係
Figure 02_image509
。在一些實施例中,第一非天然鹼基係
Figure 02_image511
,第二非天然鹼基係
Figure 02_image513
,第三非天然鹼基係
Figure 02_image515
Figure 02_image517
,且第四非天然鹼基係
Figure 02_image519
在一些實施例中,第三非天然鹼基及第四非天然鹼基包含核糖。在一些實施例中,第三非天然鹼基及第四非天然鹼基包含去氧核糖。在一些實施例中,第一及第二非天然鹼基包含去氧核糖。在一些實施例中,第一及第二非天然鹼基包含去氧核糖且第三非天然鹼基及第四非天然鹼基包含核糖。
在產生包含本文所述非天然胺基酸之蛋白質之方法的一些實施例中,DNA包含至少一個選自以下之非天然鹼基對(UBP):
Figure 02_image521
Figure 02_image523
,其中每一糖部分獨立地係本文所述之任何實施例或變化形式。在一些實施例中,鹼基對中之兩個鹼基之糖部分包含核糖。在一些實施例中,鹼基對中之兩個鹼基之糖部分包含去氧核糖。在一些實施例中,鹼基對中之一個鹼基之糖部分包含核糖且鹼基對中之另一鹼基之糖部分包含去氧核糖。在一些實施例中,DNA模板包含至少一個為NaM-5SICS之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為CNMO-TPT3之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為NaM-TPT3之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為NaM-TAT1之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為CNMO-TAT1之非天然鹼基對(UBP)。
在產生包含本文所述非天然胺基酸之蛋白質之方法的一些實施例中,DNA包含至少一個選自由以下組成之群之非天然鹼基對(UBP):
Figure 02_image525
Figure 02_image527
。在一些實施例中,DNA包含至少一個為dNaM-d5SICS之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dCNMO-dTPT3之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dNaM-dTPT3之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dNaM-dTAT1之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dCNMO-dTAT1之非天然鹼基對(UBP)。
在產生包含本文所述非天然胺基酸之蛋白質之方法的一些實施例中,DNA包含至少一個選自以下之非天然鹼基對(UBP):
Figure 02_image529
,其中每一糖部分獨立地係本文所述之任何實施例或變化形式;且其中mRNA及tRNA包含至少一個選自以下之非天然鹼基:
Figure 02_image531
Figure 02_image533
。在一些實施例中,鹼基對中之兩個鹼基之糖部分包含核糖。在一些實施例中,鹼基對中之兩個鹼基之糖部分包含去氧核糖。在一些實施例中,鹼基對中之一個鹼基之糖部分包含核糖且鹼基對中之另一鹼基之糖部分包含去氧核糖。在一些實施例中,DNA包含至少一個為dNaM-d5SICS之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dCNMO-dTPT3之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dNaM-dTPT3之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dNaM-dTAT1之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dCNMO-dTAT1之非天然鹼基對(UBP)。
在產生包含本文所述非天然胺基酸之蛋白質之方法的一些實施例中,DNA包含至少一個選自由以下組成之群之非天然鹼基對(UBP):
Figure 02_image535
Figure 02_image537
;且其中mRNA及tRNA包含至少一個選自以下之非天然鹼基:
Figure 02_image539
Figure 02_image541
。在一些實施例中,DNA包含至少一個為dNaM-d5SICS之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dCNMO-dTPT3之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dNaM-dTPT3之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dNaM-dTAT1之非天然鹼基對(UBP)。在一些實施例中,DNA包含至少一個為dCNMO-dTAT1之非天然鹼基對(UBP)。
在一些實施例中,mRNA及tRNA包含選自
Figure 02_image543
Figure 02_image545
之非天然鹼基。在一些實施例中,mRNA及tRNA包含選自
Figure 02_image547
Figure 02_image549
之非天然鹼基。在一些實施例中,mRNA包含為
Figure 02_image551
之非天然鹼基。在一些實施例中,mRNA包含為
Figure 02_image553
之非天然鹼基。在一些實施例中,mRNA包含為
Figure 02_image555
之非天然鹼基。在一些實施例中,tRNA包含選自
Figure 02_image557
Figure 02_image559
之非天然鹼基。在一些實施例中,tRNA包含為
Figure 02_image561
之非天然鹼基。在一些實施例中,tRNA包含為
Figure 02_image563
之非天然鹼基。在一些實施例中,tRNA包含為
Figure 02_image565
之非天然鹼基。
在產生包含本文所述非天然胺基酸之蛋白質之方法的一些實施例中,第一非天然鹼基包含dCNMO,且第二非天然鹼基包含dTPT3。在一些實施例中,第三非天然鹼基包含NaM,且第二非天然鹼基包含TAT1。
本文亦提供包含至少一個非天然胺基酸之蛋白質,其中蛋白質係根據本文揭示之方法中之任一者產生。在一些實施例中,蛋白質包含至少一個非天然胺基酸。在一些實施例中,蛋白質包含一個非天然胺基酸。在一些實施例中,蛋白質包含兩個或更多個非天然胺基酸。在一些實施例中,蛋白質包含兩個非天然胺基酸。在一些實施例中,蛋白質包含三個或更多個非天然胺基酸。
在一些實施例中,核苷酸類似物亦在磷酸酯部分經修飾。經修飾磷酸酯部分包括(但不限於)在兩個核苷酸之間之鏈接處具有修飾之彼等,且含有(例如)硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、胺基烷基磷酸三酯、膦酸甲基值及其他膦酸烷基酯(包括膦酸3’-伸烷基酯及手性膦酸酯)、亞膦酸酯、胺基磷酸酯(包括3'-胺基胺基磷酸酯及胺基烷基胺基磷酸酯)、硫羰胺基磷酸酯、硫羰烷基膦酸酯、硫羰烷基磷酸三酯及硼烷磷酸酯。應理解,兩個核苷酸之間之該等磷酸酯或經修飾磷酸酯鏈接係經由3’-5’鏈接或2’-5’鏈接,且鏈接包含反轉之極性,例如3’-5’至5’-3’或2’-5’至5’-2’。亦包括各種鹽、混合鹽及游離酸形式。許多美國專利教示如何製備及使用含有經修飾磷酸酯之核苷酸,且包括(但不限於) 3,687,808;4,469,863;4,476,301;5,023,243;5,177,196;5,188,897;5,264,423;5,276,019;5,278,302;5,286,717;5,321,131;5,399,676;5,405,939;5,453,496;5,455,233;5,466,677;5,476,925;5,519,126;5,536,821;5,541,306;5,550,111;5,563,253;5,571,799;5,587,361;及5,625,050;每一專利之揭示內容係以全文引用之方式併入本文中。
在一些實施例中,非天然核酸包括2’,3’-二去氧-2’,3’-二去氫-核苷(PCT/US2002/006460)、5’-取代之DNA及RNA衍生物(PCT/US2011/033961;Saha等人,J. Org Chem., 1995, 60, 788-789;Wang等人,Bioorganic & Medicinal Chemistry Letters, 1999, 9, 885-890;及Mikhailov等人,Nucleosides & Nucleotides, 1991, 10(1-3), 339-343;Leonid等人,1995, 14(3-5), 901-905;及Eppacher等人,Helvetica Chimica Acta, 2004, 87, 3004-3020;PCT/JP2000/004720;PCT/JP2003/002342;PCT/JP2004/013216;PCT/JP2005/020435;PCT/JP2006/315479;PCT/JP2006/324484;PCT/JP2009/056718;PCT/JP2010/067560)、或由單磷酸酯與經修飾鹼基製得之5’-取代之單體(Wang等人,Nucleosides Nucleotides & Nucleic Acids, 2004, 23 (1及2), 317-337);每一參考文獻之揭示內容係以全文引用之方式併入本文中。
在一些實施例中,非天然核酸包括糖環之5’-位及2’-位之修飾(PCT/US94/02993),例如5’-CH2 -取代之2’-O-保護之核苷(Wu等人,Helvetica Chimica Acta, 2000, 83, 1127-1143及Wu等人,Bioconjugate Chem. 1999, 10, 921-924)。在一些情形下,非天然核酸包括已製備用於納入寡核苷酸中之醯胺連接之核苷二聚體,其中二聚體中之3’連接之核苷(5’至3’)包含2’-OCH3 及5’-(S)-CH3 (Mesmaeker等人,Synlett, 1997, 1287-1290)。非天然核酸可包括2’-取代之5’-CH2 (或O)修飾之核苷(PCT/US92/01020)。非天然核酸可包括5’-亞甲基膦酸酯DNA及RNA單體、及二聚體(Bohringer等人,Tet. Lett., 1993, 34, 2723-2726;Collingwood等人,Synlett, 1995, 7, 703-705;及Hutter等人,Helvetica Chimica Acta, 2002, 85, 2777-2806)。非天然核酸可包括具有2’-取代之5’-膦酸酯單體(US2006/0074035)及其他經修飾5’-膦酸酯單體(WO1997/35869)。非天然核酸可包括5’-修飾之亞甲基膦酸酯單體(EP614907及EP629633)。非天然核酸可包括在5’及/或6’-位包含羥基之5’或6’-膦酸酯核糖核苷的類似物(Chen等人,Phosphorus, Sulfur and Silicon, 2002, 777, 1783-1786;Jung等人,Bioorg. Med. Chem., 2000, 8, 2501-2509;Gallier等人,Eur. J. Org. Chem., 2007, 925-933;及Hampton等人,J. Med. Chem., 1976, 19(8), 1029-1033)。非天然核酸可包括5’-膦酸酯去氧核糖核苷單體及具有5’-磷酸酯基團之二聚體(Nawrot等人,Oligonucleotides, 2006, 16(1), 68-82)。非天然核酸可包括具有6’-膦酸酯基團之核苷,其中5’或/及6’-位未經取代或經以下取代:硫-第三丁基(SC(CH3 )3 ) (及其類似物);亞甲基胺基(CH2 NH2 ) (及其類似物)或氰基(CN) (及其類似物) (Fairhurst等人,Synlett, 2001, 4, 467-472;Kappler等人,J. Med. Chem., 1986, 29, 1030-1038;Kappler等人,J. Med. Chem., 1982, 25, 1179-1184;Vrudhula等人,J. Med. Chem., 1987, 30, 888-894;Hampton等人,J. Med. Chem., 1976, 19, 1371-1377;Geze等人,J. Am. Chem. Soc, 1983, 105(26), 7638-7640;及Hampton等人,J. Am. Chem. Soc, 1973, 95(13), 4404-4414)。此段落中列示之每一參考文獻之揭示內容係以全文引用之方式併入本文中。
在一些實施例中,非天然核酸亦包括糖部分之修飾。在一些情形下,核酸含有一或多個核苷,其中糖基團經修飾。該等糖修飾之核苷可賦予增強之核酸酶穩定性、增加之結合親和性或一些其他有益生物性質。在某些實施例中,核酸包含化學修飾之呋喃核糖環部分。化學修飾之呋喃核糖環之實例包括(但不限於)添加取代基(包括5’及/或2’取代基;橋接兩個環原子以形成二環核酸(BNA);用S、N(R)或C(R1 )(R2 ) (R = H、C1 -C12 烷基或保護基團)置換核糖基環氧原子;及其組合。化學修飾之糖之實例可參見WO2008/101157、US2005/0130923及WO2007/134181;每一者之揭示內容係以全文引用之方式併入本文中。
在一些情況下,經修飾核酸包含經修飾糖或糖類似物。因此,除了核糖及去氧核糖之外,糖部分可為戊醣、去氧戊醣、己醣、去氧己醣、葡萄糖、阿拉伯糖、木糖、來蘇糖或糖「類似物」環戊基。糖可為吡喃糖基或呋喃糖基形式。糖部分可為核糖、去氧核糖、阿拉伯糖或2’-O-烷基核糖之呋喃糖苷,且糖可以[α]或[β]變旋異構構形連接至各別雜環鹼基。糖修飾包括(但不限於) 2’-烷氧基-RNA類似物、2’-胺基-RNA類似物、2’-氟-DNA及2’-烷氧基-或胺基-RNA/DNA嵌合體。舉例而言,糖修飾可包括2’-O-甲基-尿苷或2’-O-甲基-胞苷。糖修飾包括2’-O-烷基-取代之去氧核糖核苷及2’-O-乙二醇樣核糖核苷。該等糖或糖類似物及其中該等糖或類似物連接至雜環鹼基(核酸鹼基)各別「核苷」之製備係已知的。亦可進行糖修飾並與其他修飾組合。
對糖部分之修飾包括核糖及去氧核糖之天然修飾以及非天然修飾。糖修飾包括(但不限於)在2’位置處之以下修飾:OH;F;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中烷基、烯基及炔基可為經取代或未取代之C1 至C10 烷基、或C2 至C10 烯基及炔基。2’糖修飾亦包括(但不限於) -O[(CH2 )n O]m CH3 、-O(CH2 )n OCH3 、-O(CH2 )n NH2 、-O(CH2 )n CH3 、-O(CH2 )n ONH2 及-O(CH2 )n ON[(CH2 )n CH3 )]2 ,其中n及m係1至約10。
2’位之其他修飾包括(但不限於):C1 至C10 低碳烷基、經取代之低碳烷基、烷芳基、芳烷基、O-烷芳基、O-芳烷基、SH、SCH3 、OCN、Cl、Br、CN、CF3 、OCF3 、SOCH3 、SO2 CH3 、ONO2 、NO2 、N3 、NH2 、雜環烷基、雜環烷芳基、胺基烷基胺基、聚烷基胺基、經取代之矽基、RNA切割基團、報導基因基團、嵌入劑、用於改良寡核苷酸之藥物動力學性質之基團、或用於改良寡核苷酸之藥效學性質之基團、以及具有類似性質之其他取代基。亦可在糖之其他位置、具體而言在3’末端核苷酸或2’-5’連接之寡核苷酸中之糖之3’位及5’末端核苷酸之5’位進行類似修飾。經修飾糖亦包括在橋環氧含有修飾之彼等,例如CH2 及S。核苷酸糖類似物亦可具有糖模擬物,例如代替呋喃戊糖基糖之環丁基部分。許多美國專利教示該等經修飾糖結構之製備,且詳述一系列鹼基修飾,例如美國專利第4,981,957號;第5,118,800號;第5,319,080號;第5,359,044號;第5,393,878號;第5,446,137號;第5,466,786號;第5,514,785號;第5,519,134號;第5,567,811號;第5,576,427號;第5,591,722號;第5,597,909號;第5,610,300號;第5,627,053號;第5,639,873號;第5,646,265號;第5,658,873號;第5,670,633號;第4,845,205號;第5,130,302號;第5,134,066號;第5,175,273號;第5,367,066號;第5,432,272號;第5,457,187號;第5,459,255號;第5,484,908號;第5,502,177號;第5,525,711號;第5,552,540號;第5,587,469號;第5,594,121, 5,596,091號;第5,614,617號;第5,681,941號;及第5,700,920號,每一案件之揭示內容係以全文引用之方式併入本文中。
具有經修飾糖部分之核酸之實例包括(但不限於)包含5’-乙烯基、5’-甲基(R或S)、4’-S、2’-F、2’-OCH3 及2’-O(CH2 )2 OCH3 取代基之核酸。2’位之取代基亦可選自烯丙基、胺基、疊氮基、硫基、O-烯丙基、O-(C1 -C10 烷基)、OCF3 、O(CH2 )2 SCH3 、O(CH2 )2 -O-N(Rm )(Rn )及O-CH2 -C(=O)-N(Rm )(Rn ),其中每一Rm 及Rn 獨立地係H或經取代或未經取代之C1 -C10 烷基。
在某些實施例中,本文所述之核酸包括一或多個二環核酸。在某些該等實施例中,二環核酸包含4’與2’核糖基環原子之間之橋。在某些實施例中,本文提供之核酸包括一或多個二環核酸,其中橋包含4’至2’二環核酸。該等4’至2’二環核酸之實例包括(但不限於)下式中之一者:4’-(CH2 )-O-2’ (LNA);4’-(CH2 )-S-2’;4’-(CH2 )2 -O-2’ (ENA);4’-CH(CH3 )-O-2’及4’-CH(CH2 OCH3 )-O-2’及其類似物(參見美國專利第7,399,845號);4’-C(CH3 )(CH3 )-O-2’及其類似物(參見WO2009/006478、WO2008/150729、US2004/0171570、美國專利第7,427,672號、Chattopadhyaya等人,J. Org. Chem., 209, 74, 118-134及WO2008/154401)。亦參見,例如:Singh等人,Chem. Comμn., 1998, 4, 455-456;Koshkin等人,Tetrahedron, 1998, 54, 3607-3630;Wahlestedt等人,Proc. Natl. Acad. Sci. U. S. A., 2000, 97, 5633-5638;Kumar等人,Bioorg. Med. Chem. Lett., 1998, 8, 2219-2222;Singh等人,J. Org. Chem., 1998, 63, 10035-10039;Srivastava等人,J. Am. Chem. Soc., 2007, 129(26) 8362-8379;Elayadi等人,Curr. Opinion Invens. Drugs, 2001, 2, 558-561;Braasch等人,Chem. Biol, 2001, 8, 1-7;Oram等人,Curr. Opinion Mol. Ther., 2001, 3, 239-243;美國專利第4,849,513號;第5,015,733號;第5,118,800號;第5,118,802號;第7,053,207號;第6,268,490號;第6,770,748號;第6,794,499號;第7,034,133號;第6,525,191號;第6,670,461號;及第7,399,845號;國際公開案第WO2004/106356號、第WO1994/14226號、第WO2005/021570號、第WO2007/090071號、第WO2007/134181號;美國專利公開案第US2004/0171570號、第US2007/0287831號及第US2008/0039618號;美國臨時公開案第60/989,574號、第61/026,995號、第61/026,998號、第61/056,564號、第61/086,231號、第61/097,787號及第61/099,844號;及國際申請案第PCT/US2008/064591號、第PCT US2008/066154號、第PCT US2008/068922號及第PCT/DK98/00393號;每一參考文獻之揭示內容係以全文引用之方式併入本文中。
在某些實施例中,核酸包括連接之核酸。核酸可使用任何核酸間鏈接而連接在一起。核酸間連接基團之兩個主要類別由磷原子之存在或不存在來定義。代表性含磷核酸間鏈接包括(但不限於)磷酸二酯、磷酸三酯、甲基膦酸酯、胺基磷酸酯及硫代磷酸酯(P=S)。代表性不含磷核酸間連接基團包括(但不限於)亞甲基甲基亞胺基(-CH2 -N(CH3 )-O-CH2 -)、硫代二酯(-O-C(O)-S-)、硫羰胺基甲酸酯(-O-C(O)(NH)-S-);矽氧烷(-O-Si(H)2 -O-);及N,N*-二甲基肼(-CH2 -N(CH3 )-N(CH3 ))。在某些實施例中,具有手性原子之核酸間鏈接可製備為外消旋混合物,或製備為單獨鏡像異構物,例如烷基膦酸酯及硫代磷酸酯。非天然核酸可含有單一修飾。非天然核酸可在一個部分內或不同部分之間含有多個修飾。
對核酸之主鏈磷酸酯修飾包括(但不限於)甲基膦酸酯、硫代磷酸酯、胺基磷酸酯(橋接或非橋接)、磷酸三酯、二硫代磷酸酯(phosphorodithioate)、二硫代磷酸酯(phosphodithioate)及硼烷磷酸酯,且可以任何組合使用。亦可使用其他非磷酸酯鏈接。
在一些實施例中,主鏈修飾(例如,甲基膦酸酯、硫代磷酸酯、胺基磷酸酯及二硫代磷酸酯核苷酸間鏈接)可賦予經修飾核酸免疫調節活性及/或增強其活體內穩定性。
在一些情況下,磷衍生物(或經修飾磷酸酯基團)連接至糖或糖類似物部分且可為單磷酸酯、二磷酸酯、三磷酸酯、烷基膦酸酯、硫代磷酸酯、二硫代磷酸酯、胺基磷酸酯或諸如此類。含有經修飾磷酸酯鏈接或非磷酸酯鏈接之實例性聚核苷酸可參見Peyrottes等人,1996, Nucleic Acids Res. 24: 1841-1848;Chaturvedi等人,1996, Nucleic Acids Res. 24:2318-2323;及Schultz等人,(1996) Nucleic Acids Res. 24:2966-2973;Matteucci, 1997, 「Oligonucleotide Analogs: an Overview」 in Oligonucleotides as Therapeutic Agents, (Chadwick及Cardew編輯) John Wiley and Sons, New York, NY;Zon, 1993, 「Oligonucleoside Phosphorothioates」 in Protocols for Oligonucleotides and Analogs, Synthesis and Properties, Humana Press, 第165-190頁;Miller等人, 1971, JACS 93:6657-6665;Jager等人, 1988, Biochem. 27:7247-7246;Nelson等人,1997, JOC 62:7278-7287;美國專利第5,453,496號;及Micklefield, 2001, Curr. Med. Chem. 8: 1157-1179;每一參考文獻之揭示內容係以全文引用之方式併入本文中。
在一些情形下,主鏈修飾包含用替代部分(例如陰離子、中性或陽離子基團)置換磷酸二酯鏈接。該等修飾之實例包括:陰離子核苷間連接;N3’至P5’胺基磷酸酯修飾;硼烷磷酸酯DNA;原寡核苷酸;中性核苷間鏈接,例如甲基膦酸酯;醯胺連接之DNA;亞甲基(甲基亞胺基)鏈接;甲縮醛及硫代甲縮醛鏈接;含有磺醯基之主鏈;嗎啉基寡聚物;肽核酸(PNA);及帶正電荷之去氧核糖核酸胍(DNG)寡聚物(Micklefield, 2001, Current Medicinal Chemistry 8: 1157-1179),其揭示內容係以全文引用之方式併入本文中。經修飾核酸可包含嵌合或混合主鏈,其包含一或多個修飾,例如磷酸酯鏈接之組合,例如磷酸二酯鏈接及硫代磷酸酯鏈接之組合。
磷酸酯之替代物包括(例如)短鏈烷基或環烷基核苷間鏈接、混合雜原子及烷基或環烷基核苷間鏈接、或一或多個短鏈雜原子或雜環核苷間鏈接。該等包括具有以下之彼等:嗎啉基鏈接(部分由核苷之糖部分形成);矽氧烷主鏈;硫化物、亞碸及碸主鏈;甲醯基及硫代甲醯基主鏈;亞甲基甲醯基及硫代甲醯基主鏈;含烯烴之主鏈;胺基磺酸酯主鏈;亞甲基亞胺基及亞甲基肼基主鏈;磺酸酯及磺醯胺主鏈;醯胺主鏈;以及具有混合之N、O、S及CH2 組成部分之其他。許多美國專利揭示如何製備及使用該等類型之磷酸酯替代物,且包括但不限於美國專利第5,034,506號;第5,166,315號;第5,185,444號;第5,214,134號;第5,216,141號;第5,235,033號;第5,264,562號;第5,264,564號;第5,405,938號;第5,434,257號;第5,466,677號;第5,470,967號;第5,489,677號;第5,541,307號;第5,561,225號;第5,596,086號;第5,602,240號;第5,610,289號;第5,602,240號;第5,608,046號;第5,610,289號;第5,618,704號;第5,623,070號;第5,663,312號;第5,633,360號;第5,677,437號;及第5,677,439號;每一專利之揭示內容係以全文引用之方式併入本文中。亦應理解,在核苷酸替代物中,核苷酸之糖及磷酸酯部分皆可經(例如)醯胺型鏈接(胺基乙基甘胺酸) (PNA)置換。美國專利第5,539,082號、第5,714,331號及第5,719,262號教示如何製備及使用PNA分子,每一案件皆以引用方式併入本文中。亦參見Nielsen等人,Science, 1991, 254, 1497-1500。亦可將其他類型之分子(結合物)與核苷酸或核苷酸類似物連接以增強(例如)細胞攝取。結合物可化學連接至核苷酸或核苷酸類似物。該等結合物包括(但不限於)脂質部分,例如膽固醇部分(Letsinger等人,Proc. Natl. Acad. Sci. USA, 1989, 86, 6553-6556)、膽酸(Manoharan等人,Bioorg. Med. Chem. Let., 1994, 4, 1053-1060)、硫醚(例如己基-S-三苯甲基硫醇) (Manoharan等人,Ann. KY. Acad. Sci., 1992, 660, 306-309;Manoharan等人,Bioorg. Med. Chem. Let., 1993, 3, 2765-2770)、硫代膽固醇(Oberhauser等人,Nucl. Acids Res., 1992, 20, 533-538)、脂肪族鏈(例如十二烷二醇或十一烷基殘基)(Saison-Behmoaras等人,EM5OJ, 1991, 10, 1111-1118;Kabanov等人,FEBS Lett., 1990, 259, 327-330;Svinarchuk等人,Biochimie, 1993, 75, 49-54)、磷脂(例如二-十六烷基-外消旋-甘油或三乙基銨1-二-O-十六烷基-外消旋-甘油-S-H-膦酸酯(Manoharan等人,Tetrahedron Lett., 1995, 36, 3651-3654;Shea等人,Nucl. Acids Res., 1990, 18, 3777-3783)、多胺或聚乙二醇鏈(Manoharan等人,Nucleosides & Nucleotides, 1995, 14, 969-973)、或金剛烷乙酸(Manoharan等人,Tetrahedron Lett., 1995, 36, 3651-3654)、棕櫚基部分(Mishra等人,Biochem. Biophys. Acta, 1995, 1264, 229-237)、或十八烷基胺或己基胺基-羰基-氧基膽固醇部分(Crooke等人,J. Pharmacol. Exp. Ther., 1996, 277, 923-937);每一參考文獻之揭示內容係以全文引用之方式併入本文中。許多美國專利教示該等結合物之製備且包括(但不限於)美國專利第4,828,979號;第4,948,882號;第5,218,105號;第5,525,465號;第5,541,313號;第5,545,730號;第5,552,538號;第5,578,717號、第5,580,731號;第5,580,731號;第5,591,584號;第5,109,124號;第5,118,802號;第5,138,045號;第5,414,077號;第5,486,603號;第5,512,439號;第5,578,718號;第5,608,046號;第4,587,044號;第4,605,735號;第4,667,025號;第4,762,779號;第4,789,737號;第4,824,941號;第4,835,263號;第4,876,335號;第4,904,582號;第4,958,013號;第5,082,830號;第5,112,963號;第5,214,136號;第5,082,830號;第5,112,963號;第5,214,136號;第5,245,022號;第5,254,469號;第5,258,506號;第5,262,536號;第5,272,250號;第5,292,873號;第5,317,098號;第5,371,241號;第5,391,723號;第5,416,203號;第5,451,463號;第5,510,475號;第5,512,667號;第5,514,785號;第5,565,552號;第5,567,810號;第5,574,142號;第5,585,481號;第5,587,371號;第5,595,726號;第5,597,696號;第5,599,923號;第5,599,928號及第5,688,941號;每一專利之揭示內容係以全文引用之方式併入本文中。
本文闡述用於複製、轉錄、轉譯非天然胺基酸及將其納入蛋白質中之組合物及方法中使用之核鹼基。在一些實施例中,本文所述之核鹼基包含以下結構:
Figure 02_image567
,   其中 每一X獨立地係碳或氮; 當X係碳時,R2 存在且獨立地係氫、烷基、烯基、炔基、甲氧基、甲硫醇、甲硒基、鹵素、氰基或疊氮基; 其中每一Y獨立地係硫、氧、硒或二級胺; 其中每一E獨立地係氧、硫或硒;且 其中波形線指示與核糖基、去氧核糖基或二去氧核糖基部分或其類似物之鍵結點,其中核糖基、去氧核糖基或二去氧核糖基部分或其類似物呈游離形式,連接至單-磷酸酯、二磷酸酯或三磷酸酯基團,視情況包含α-硫代三磷酸酯、β-硫代三磷酸酯或γ-硫代三磷酸酯基團,或包括於RNA或DNA或RNA類似物或DNA類似物中。
在一些實施例中,R2 係低碳烷基(例如C1 -C6 )、氫或鹵素。在本文所述之核鹼基之一些實施例中,R2 係氟。在本文所述之核鹼基之一些實施例中,X係碳。在本文所述之核鹼基之一些實施例中,E係硫。在本文所述之核鹼基之一些實施例中,Y係硫。
在本文所述之核鹼基之一些實施例中,核鹼基具有結構:
Figure 02_image569
。在一些實施例中,本文所述之核鹼基具有結構:
Figure 02_image571
。在本文所述之核鹼基之一些實施例中,E係硫且Y係硫。在一些實施例中,波形線指示與核糖基、去氧核糖基或二去氧核糖基部分或其類似物之鍵結點,其中核糖基、去氧核糖基或二去氧核糖基部分或其類似物呈游離形式,或連接至單-磷酸酯、二磷酸酯、三磷酸酯、α-硫代三磷酸酯、β-硫代三磷酸酯或γ-硫代三磷酸酯基團,或包括於RNA或DNA或RNA類似物或DNA類似物中。在本文所述之核鹼基之一些實施例中,波形線指示與核糖基或去氧核糖基部分之鍵結點。在本文所述之核鹼基之一些實施例中,波形線指示與連接至三磷酸酯基團之核糖基或去氧核糖基部分之鍵結點。在一些實施例中,本文所述之核鹼基係核酸聚合物之組分。在本文所述之核鹼基之一些實施例中,核鹼基係tRNA之組分。在本文所述之核鹼基之一些實施例中,核鹼基係tRNA中之反密碼子之組分。在本文所述之核鹼基之一些實施例中,核鹼基係mRNA之組分。在本文所述之核鹼基之一些實施例中,核鹼基係mRNA之密碼子之組分。在本文所述之核鹼基之一些實施例中,核鹼基係RNA或DNA之組分。在本文所述之核鹼基之一些實施例中,核鹼基係DNA中之密碼子之組分。在本文所述之核鹼基之一些實施例中,核鹼基與另一(例如互補)核鹼基形成、能形成或其組態可以形成核鹼基對。
在一些實施例中,本文所述之核鹼基具有結構:
Figure 02_image573
其中: 每一X獨立地係碳或氮; 當X係氮時,R2 存在,且在X係碳時,存在,且獨立地係氫、烷基、烯基、炔基、甲氧基、甲硫醇、甲硒基、鹵素、氰基或疊氮化物; Y係硫、氧、硒或二級胺; E係氧、硫或硒;且 波形線指示與核糖基、去氧核糖基或二去氧核糖基部分或其類似物之鍵結點,其中核糖基、去氧核糖基或二去氧核糖基部分或其類似物呈游離形式,連接至單-磷酸酯、二磷酸酯、三磷酸酯、α-硫代三磷酸酯、β-硫代三磷酸酯或γ-硫代三磷酸酯基團,或包括於RNA或DNA或RNA類似物或DNA類似物中。
在一些實施例中,每一X係碳。在一些實施例中,至少一個X係碳。在一些實施例中,一個X係碳。在一些實施例中,至少兩個X係碳。在一些實施例中,兩個X係碳。在一些實施例中,至少一個X係氮。在一些實施例中,一個X係氮。在一些實施例中,至少兩個X係氮。在一些實施例中,兩個X係氮。
在一些實施例中,Y係硫。在一些實施例中,Y係氧。在一些實施例中,Y係硒。在一些實施例中,Y係二級胺。
在一些實施例中,E係硫。在一些實施例中,E係氧。在一些實施例中,E係硒。
在一些實施例中,當X係碳時,R2 存在。在一些實施例中,當X係氮時,R2 不存在。在一些實施例中,每一R2 在存在之情況下係氫。在一些實施例中,R2 係烷基,例如甲基、乙基或丙基。在一些實施例中,R2 係烯基,例如-CH2 =CH2 。在一些實施例中,R2 係炔基,例如乙炔基。在一些實施例中,R2 係甲氧基。在一些實施例中,R2 係甲硫醇。在一些實施例中,R2 係甲硒基。在一些實施例中,R2 係鹵素,例如氯、溴或氟。在一些實施例中,R2 係氰基。在一些實施例中,R2 係疊氮化物。
在一些實施例中,E係硫,Y係硫,且每一X獨立地係碳或氮。在一些實施例中,E係硫,Y係硫,且每一X係碳。
在一些實施例中,核鹼基具有結構
Figure 02_image575
。在一些實施例中,核鹼基具有結構
Figure 02_image577
Figure 02_image579
在一些實施例中,核鹼基具有結構
Figure 02_image581
在一些實施例中,本文揭示之核鹼基結合(例如非共價)至互補鹼基配對核鹼基以形成非天然鹼基對(UBP),或能與核鹼基進行鹼基配對或其組態可與核鹼基進行鹼基配對。在一些實施例中,互補鹼基配對核鹼基係選自:
Figure 02_image583
Figure 02_image585
在一態樣中,本文提供雙股寡核苷酸雙螺旋體,其中第一寡核苷酸股包含本文揭示之核鹼基,且第二互補寡核苷酸股包含互補鹼基配對核鹼基於其互補鹼基配對位點。在一些實施例中,第一寡核苷酸股包含
Figure 02_image587
;且第二股包含選自由以下組成之群之互補鹼基配對核鹼基於其互補鹼基配對位點:
Figure 02_image589
Figure 02_image591
Figure 02_image593
在另一態樣中,本文提供轉運RNA (tRNA),其包含本文所述之核鹼基,其包含:反密碼子,其中反密碼子包含核鹼基;及識別元件,其中識別元件促進tRNA藉由胺基醯基tRNA合成酶選擇性加載非天然胺基酸。在一些實施例中,核鹼基位於tRNA之反密碼子區中。在一些實施例中,核鹼基位於反密碼子之第一位置中。在一些實施例中,核鹼基位於反密碼子之第二位置中。在一些實施例中,核鹼基位於反密碼子之第三位置中。在一些實施例中,胺基醯基tRNA合成酶係衍生自甲烷八疊球菌或其變體。在一些實施例中,胺基醯基tRNA合成酶係衍生自甲烷球菌屬(甲烷暖球菌屬)或其變體。在一些實施例中,非天然胺基酸包含芳香族部分。在一些實施例中,非天然胺基酸係離胺酸衍生物。在一些實施例中,非天然胺基酸係苯丙胺酸衍生物。
本文亦提供包含下式之結構: N1 - Zx - N2 其中: Z係如本文所述之核鹼基,其鍵結至核糖基或去氧核糖基或其類似物; N1係在Z之核糖基或去氧核糖基或其類似物之5’端連接之一或多個核苷酸或其類似物、或末端磷酸酯基團; N2係連接至Z之核糖基或去氧核糖基或其類似物之3’端之一或多個核苷酸或其類似物、或末端羥基;且 x係1至20之整數。
在一些實施例中,N1係在Z之核糖基或去氧核糖基部分或其類似物之5’端連接之一或多個核苷酸或其類似物。可經由磷酸二酯連接至核糖基或去氧核糖基部分之5’端。在一些實施例中,N1係在Z之核糖基或去氧核糖基部分或其類似物之5’端連接的末端磷酸酯基團。在一些實施例中,N2係連接至Z之核糖基或去氧核糖基部分或其類似物之3’端的一或多個核苷酸或其類似物。可經由磷酸二酯連接至核糖基或去氧核糖基部分之3’端。在一些實施例中,N2係連接至Z之核糖基或去氧核糖基部分或其類似物之3’端的末端羥基。
在一些實施例中,x係1至20之整數。在一些實施例中,x係1至15之整數。在一些實施例中,x係1至10之整數。在一些實施例中,x係1至5之整數。在一些實施例中,x係1。在一些實施例中,x係2。在一些實施例中,x係3。在一些實施例中,x係4。在一些實施例中,x係5。在一些實施例中,x係6。在一些實施例中,x係7。在一些實施例中,x係8。在一些實施例中,x係9。在一些實施例中,x係10。在一些實施例中,x係11。在一些實施例中,x係12。在一些實施例中,x係13。在一些實施例中,x係14。在一些實施例中,x係15。在一些實施例中,x係16。在一些實施例中,x係17。在一些實施例中,x係18。在一些實施例中,x係19。在一些實施例中,x係20。
在一些實施例中,Z具有如本文詳述之結構
Figure 02_image595
。在一些實施例中,Z具有結構
Figure 02_image597
在一些實施例中,式N1 - Zx - N2之結構編碼基因。在一些實施例中,Zx位於基因之轉譯區中。在一些實施例中,Zx位於基因之非轉譯區中。在一些實施例中,該結構進一步包含5’或3’非轉譯區(UTR)。在一些實施例中,該結構進一步包含終止子區。在一些實施例中,該結構進一步包含啟動子區。
在另一態樣中,本文提供聚核苷酸庫,其中該庫包含至少5000個獨特聚核苷酸,且其中每一聚核苷酸包含至少一個本文揭示之核鹼基。在一些實施例中,聚核苷酸庫編碼至少一個基因。
在又一態樣中,本文提供核苷三磷酸,其中核鹼基係選自
Figure 02_image599
Figure 02_image601
。在一些實施例中,核鹼基係
Figure 02_image603
。在一些實施例中,核鹼基係
Figure 02_image605
。在一些實施例中,核鹼基係
Figure 02_image607
。在一些實施例中,核鹼基係
Figure 02_image609
。在一些實施例中,核苷包含核糖。在一些實施例中,核苷包含去氧核糖。核酸鹼基配對性質 實例性鹼基對
在一些實施例中,一非天然核苷酸在納入DNA或RNA期間或之後與另一非天然核苷酸形成鹼基對(非天然鹼基對;UBP)。在一些實施例中,一穩定整合之非天然核酸係可與另一核酸(例如天然或非天然核酸)形成鹼基對之非天然核酸。在一些實施例中,一穩定整合之非天然核酸係可與另一非天然核酸形成鹼基對(非天然核酸鹼基對(UBP))之非天然核酸。舉例而言,第一非天然核酸可與第二非天然核酸形成鹼基對。舉例而言,可在納入核酸期間及之後鹼基配對之一對非天然核苷三磷酸包括(d)5SICS之三磷酸((d)5SICSTP)及(d)NaM之三磷酸((d)NaMTP)。其他實例包括(但不限於):(d)CNMO之三磷酸((d)CNMOTP)及(d)TPT3之三磷酸((d)TPT3TP)。該等非天然核苷酸可具有核糖或去氧核糖糖部分(由「(d)」指示)。舉例而言,當納入核酸時可鹼基配對之一對非天然核苷三磷酸包括TAT1之三磷酸((d)TAT1TP)及NaM之三磷酸((d)NaMTP)。在一些實施例中,當納入核酸時可鹼基配對之一對非天然核苷三磷酸包括dCNMO之三磷酸(dCNMOTP)及TAT1之三磷酸(TAT1TP)。在一些實施例中,當納入核酸時可鹼基配對之一對非天然核苷三磷酸包括dTPT3之三磷酸(dTPT3TP)及NaM之三磷酸(NaMTP)。在一些實施例中,非天然核酸實質上不與天然核酸(A、T、G、C)形成鹼基對。在一些實施例中,穩定整合之非天然核酸可與天然核酸形成鹼基對。
在一些實施例中,一穩定整合之非天然(去氧)核糖核苷酸係可形成UBP、但實質上不與天然(去氧)核糖核苷酸中任一者形成鹼基對的非天然(去氧)核糖核苷酸。在一些實施例中,一穩定整合之非天然(去氧)核糖核苷酸係可形成UBP、但實質上不與一或多個天然核酸形成鹼基對之非天然(去氧)核糖核苷酸。舉例而言,一穩定整合之非天然核酸可實質上不與A、T及C形成鹼基對,但可與G形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與A、T及G形成鹼基對,但可與C形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與C、G及A形成鹼基對,但可與T形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與C、G及T形成鹼基對,但可與A形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與A及T形成鹼基對,但可與C及G形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與A及C形成鹼基對,但可與T及G形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與A及G形成鹼基對,但可與C及T形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與C及T形成鹼基對,但可與A及G形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與C及G形成鹼基對,但可與T及G形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與T及G形成鹼基對,但可與A及G形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與G形成鹼基對,但可與A、T及C形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與A形成鹼基對,但可與G、T及C形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與T形成鹼基對,但可與G、A及C形成鹼基對。舉例而言,一穩定整合之非天然核酸可實質上不與C形成鹼基對,但可與G、T及A形成鹼基對。
能夠在活體內條件下形成非天然DNA或RNA鹼基對(UBP)之實例性非天然核苷酸包括(但不限於) 5SICS、d5SICS、NaM、dNaM、dTPT3、dMTMO、dCNMO、TAT1及其組合。在一些實施例中,能夠在活體內條件下形成非天然DNA或RNA鹼基對(UBP)之非天然核苷酸包括(但不限於) 5SICS、NaM、TPT3、MTMO、CNMO、TAT1及其組合,其中核苷酸之糖部分係去氧核糖。在一些實施例中,能夠在活體內條件下形成非天然DNA或RNA鹼基對(UBP)之非天然核苷酸包括(但不限於) 5SICS、NaM、TPT3、MTMO、CNMO、TAT1及其組合,其中核苷酸之糖部分係核糖。在一些實施例中,能夠在活體內條件下形成非天然DNA或RNA鹼基對(UBP)之非天然核苷酸包括(但不限於) (d)5SICS、(d)NaM、(d)TPT3、(d)MTMO、(d)CNMO、(d)TAT1及其組合。在一些實施例中,非天然核苷酸鹼基對包括(但不限於):
Figure 02_image611
Figure 02_image613
,其中糖部分係本文所述之任何實施例或變化形式。在一些實施例中,非天然核苷酸鹼基對包括(但不限於):
Figure 02_image615
。在任何該等實施例中,連接至非天然鹼基之一個或兩個去氧核糖可經核糖取代。工程化生物體
在一些實施例中,本文揭示之方法及質體進一步用於產生工程化生物體,例如納入及複製非天然核苷酸或非天然核酸鹼基對(UBP)且亦可使用含有非天然核苷酸之核酸來轉錄mRNA及tRNA之生物體,該mRNA及tRNA用於轉譯含有非天然胺基酸殘基之蛋白質。在一些情況下,生物體係非人類半合成生物體(SSO)。在一些情況下,生物體係半合成生物體(SSO)。在一些情況下,SSO係細胞。在一些情況下,活體內方法包含半合成生物體(SSO)。在一些情況下,半合成生物體包含微生物體。在一些情況下,生物體包含細菌。在一些情況下,生物體包含革蘭氏陰性細菌。在一些情況下,生物體包含革蘭氏陽性細菌。在一些情況下,生物體包含大腸桿菌(Escherichia coliE. coli )。該等經修飾生物體不同地包含額外組分,例如DNA修復機制、經修飾聚合酶、核苷酸轉運蛋白或其他組分。在一些情況下,SSO包含大腸桿菌菌株YZ3。在一些情況下,SSO包含大腸桿菌菌株ML1或ML2,如Ledbetter等人J. Am Chem. Soc .2018 ,140 (2), 758之圖1 (B-D)中闡述之彼等菌株,該參考文獻之揭示內容係以全文引用之方式併入本文中。
在一些情況下,所用細胞用編碼異源蛋白質(例如能夠將非天然核苷三磷酸轉運至細胞中之核苷三磷酸轉運蛋白)之表現盒及視情況CRISPR/Cas9系統進行遺傳轉變,以消除已經丟失非天然核苷酸之DNA (例如大腸桿菌菌株YZ3、ML1或ML2)。在一些情況下,細胞亦包含增強之非天然核酸攝取活性。在一些情形下,細胞進一步包含增強之非天然核酸輸入活性。
在一些實施例中,Cas9及適當嚮導RNA (sgRNA)在分開之質體上編碼。在一些情況下,Cas9及sgRNA在相同質體上編碼。在一些情形下,編碼Cas9、sgRNA之核酸分子或包含非天然核苷酸之核酸分子位於一或多個質體上。在一些情況下,Cas9在第一質體上編碼,且sgRNA及包含非天然核苷酸之核酸分子在第二質體上編碼。在一些情況下,Cas9、sgRNA及包含非天然核苷酸之核酸分子在相同質體上編碼。在一些情況下,核酸分子包含兩個或更多個非天然核苷酸。在一些情況下,Cas9納入宿主生物體之基因體中,且sgRNA在質體上或在生物體之基因體中編碼。
在一些情況下,將編碼Cas9及sgRNA之第一質體及編碼包含非天然核苷酸之核酸分子之第二質體引入工程化微生物體中。在一些情況下,將編碼Cas9之第一質體及編碼sgRNA之第二質體以及包含非天然核苷酸之核酸分子引入工程化微生物體中。在一些情況下,將編碼Cas9、sgRNA及包含非天然核苷酸之核酸分子之質體引入工程化微生物體中。在一些情況下,核酸分子包含兩個或更多個非天然核苷酸。
在一些實施例中,產生在其DNA (質體或基因體)內納入至少一個非天然核苷酸及/或至少一個非天然鹼基對(UBP)之活細胞。在一些情況下,非天然鹼基對包括一對非天然相互鹼基配對核苷酸,當呈其各別三磷酸酯形式之非天然相互鹼基配對核苷酸藉由核苷酸三磷酸轉運蛋白之作用被吸收至細胞中時,該等天然相互鹼基配對核苷酸能夠在活體內條件下形成非天然鹼基對。在一些情況下,非天然鹼基對包括一對非天然相互鹼基配對核苷酸,當呈其各別三磷酸酯形式之非天然相互鹼基配對核苷酸藉由核苷酸三磷酸轉運蛋白之作用被吸收至細胞中時,該等天然相互鹼基配對核苷酸之組態可以在活體內條件下形成非天然鹼基對。細胞可藉由編碼核苷酸三磷酸轉運蛋白之表現盒進行遺傳轉變,以使核苷酸三磷酸轉運蛋白表現並可用於將非天然核苷酸轉運至細胞中。細胞可為原核或真核細胞,且呈其各別三磷酸酯形式之非天然相互鹼基配對之核苷酸對可為dTPT3之三磷酸酯(dTP3TP)及dNAM之三磷酸(dNaMTP)或dCNMO之三磷酸酯(dCNMOTP)。
在一些實施例中,細胞係用核酸(例如編碼能夠將該等非天然核苷酸轉運至細胞中之核苷酸三磷酸轉運蛋白之表現盒)遺傳轉變之細胞。細胞可包含異源核苷三磷酸轉運蛋白,其中異源核苷三磷酸轉運蛋白可將天然及非天然核苷三磷酸轉運至細胞中。
在一些情形下,本文所述之方法亦包括在磷酸鉀及/或磷酸酶或核苷酸酶之抑制劑存在下,使遺傳轉變之細胞與各別三磷酸酯接觸。在該接觸期間或之後,可將細胞置於適於細胞生長及複製之支持生命培養基中。可將細胞維持於支持生命培養基中,使得非天然核苷酸之各別三磷酸酯形式納入細胞內之核酸中,並經過細胞之至少一個複製週期。呈各別三磷酸酯形式之非天然相互鹼基配對核苷酸對可包含dTPT3之三磷酸酯(dTPT3TP)及dCNMO或dNAM之三磷酸酯(dCNOMTP或dNaMTP),細胞可為大腸桿菌,且dTPT3TP及dNaMTP可藉由轉運蛋白PtNTT2輸入大腸桿菌中,其中大腸桿菌聚合酶(例如Pol III或Pol II)可使用非天然三磷酸酯複製含有UBP之DNA,從而將非天然核苷酸及/或非天然鹼基對納入細胞環境內之細胞核酸中。另外,在一些情況下,核糖核苷酸(例如NaMTP及TAT1TP、5FMTP及TPT3TP)藉由轉運蛋白Pt NTT2輸入大腸桿菌中。
本文闡述包含使用三個或更多個非天然鹼基配對核苷酸之組合物及方法。在一些情形下,該等鹼基配對核苷酸經由使用核苷酸轉運蛋白或經由業內已知之標準核酸轉變方法(例如,電穿孔、化學轉變或其他方法)進入細胞。在一些情況下,鹼基配對之非天然核苷酸作為聚核苷酸之一部分進入細胞,例如質體。作為聚核苷酸(RNA或DNA)之一部分進入細胞之一或多個鹼基配對之非天然核苷酸本身不需要在活體內複製。舉例而言,將包含其組態可以形成第一非天然鹼基對之鹼基的第一非天然去氧核糖核苷酸及第二非天然去氧核糖核苷酸之雙股DNA質體或其他核酸電穿孔至細胞中。採用其組態可以彼此形成第二非天然鹼基對之鹼基的第三非天然去氧核糖核苷酸、第四非天然去氧核糖核苷酸處理細胞培養基,其中第一非天然去氧核糖核苷酸之鹼基及第三非天然去氧核糖核苷酸之鹼基形成第二非天然型鹼基對,且其中第二非天然去氧核糖核苷酸之鹼基及第四非天然去氧核糖核苷酸之鹼基形成第三非天然型鹼基對。在一些情況下,最初轉變之雙股DNA質體之活體內複製產生隨後複製之質體,其包含第三非天然去氧核糖核苷酸及第四非天然去氧核糖核苷酸。或者或組合地,將第三非天然去氧核糖核苷酸及第四非天然去氧核糖核苷酸之核糖核苷酸變體添加至細胞培養基中。在一些情況下,該等核糖核苷酸納入RNA中,例如mRNA或tRNA。在一些情況下,第一、第二、第三及第四去氧核苷酸包含不同鹼基。在一些情況下,第一、第三及第四去氧核苷酸包含不同鹼基。在一些情況下,第一及第三去氧核苷酸包含相同鹼基。
藉由實踐本發明之方法,普通技術人員可獲得活的且增殖之細胞群體,其在至少一些個別細胞內維持之至少一個核酸內具有至少一個非天然核苷酸及/或至少一個非天然鹼基對(UBP),其中至少一個核酸在細胞內穩定增殖,且其中細胞表現核苷酸三磷酸轉運蛋白,其適於在與適於生物體生長及複製之支持生命培養基中之非天然核苷酸接觸(例如,在存在非天然核苷酸下生長)時提供對一或多個非天然核苷酸之三磷酸形式的細胞攝取。
在藉由核苷酸三磷酸轉運蛋白轉運至細胞中後,藉由細胞機制將非天然鹼基配對核苷酸納入細胞內之核酸中,該細胞機制係例如細胞自身之DNA及/或RNA聚合酶、異源聚合酶或已使用定向進化而進化之聚合酶(Chen T, Romesberg FE, FEBS Lett. 2014年1月21日;588(2):219-29;Betz K等人,J Am Chem Soc. 2013年12月11日;135(49):18637-43;每一參考文獻之揭示內容係以全文引用之方式併入本文中)。非天然核苷酸可納入細胞核酸(例如基因體DNA、基因體RNA、mRNA、tRNA、結構RNA、微小RNA及自主複製核酸(例如質體、病毒或載體))中。
在一些情形下,藉由將核酸(例如異源核酸)引入細胞中來產生遺傳工程化細胞。本文所述之任何細胞可為宿主細胞,且可包含表現載體。在一個實施例中,宿主細胞係原核細胞。在另一實施例中,宿主細胞係大腸桿菌。在一些實施例中,細胞包含一或多種異源聚核苷酸。可使用各種技術將核酸試劑引入微生物體中。用於將異源核酸引入各種生物體之方法之非限制性實例包括:轉變、轉染、轉導、電穿孔、超音波介導之轉變、結合、粒子轟擊及諸如此類。在一些情況下,添加載劑分子(例如,雙-苯并咪唑基化合物,例如,參見美國專利第5,595,899號)可增加細胞中DNA之攝取,通常認為藉由習用方法難以轉變。習用轉變方法係本領域技術人員容易獲得的,且可參見Maniatis, T., E. F. Fritsch及J. Sambrook (1982) Molecular Cloning: a Laboratory Manual;Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.,其揭示內容係以全文引用之方式併入本文中。
在一些情況下,使用表現盒在但不限於質體、病毒載體、病毒核酸、噬菌體核酸、噬菌體、黏粒及人工染色體中之直接轉移、或經由遺傳物質在細胞或載體(例如陽離子脂質體)中之轉移,獲得遺傳轉變。該等方法在業內可獲得,且容易地適用於本文所述之方法。轉移載體可為用於將基因遞送至細胞(例如質體)中之任何核苷酸構築體,或作為遞送基因之一般策略之一部分,例如作為重組反轉錄病毒或腺病毒之一部分(Ram等人Cancer Res. 53:83-88, (1993))。適當轉染方式(包括病毒載體、化學轉染子或物理-機械方法,例如DNA之電穿孔及直接擴散)闡述於例如Wolff, J. A.等人,Science, 247, 1465-1468, (1990);及Wolff, J. A. Nature, 352, 815-818, (1991)中,每一參考文獻之揭示內容係以全文引用之方式併入本文中。
舉例而言,編碼核苷三磷酸轉運蛋白或聚合酶表現盒及/或載體之DNA可藉由任何方法(包括但不限於鈣介導之轉變、電穿孔、顯微注射、脂轉染、粒子轟擊及諸如此類)引入細胞。
在一些情形下,細胞包含納入細胞內之一或多個核酸中之非天然核苷三磷酸。舉例而言,細胞可為能夠在細胞內維持之DNA或RNA內納入至少一個非天然核苷酸之活細胞。細胞亦可在活體內條件下將至少一個包含一對非天然相互鹼基配對核苷酸之非天然鹼基對(UBP)納入細胞內之核酸中,其中非天然相互鹼基配對核苷酸(例如,其各別三磷酸酯)藉由核苷三磷酸轉運蛋白之作用被吸收至細胞中,該核苷三磷酸轉運蛋白之基因藉由遺傳轉變而呈遞(例如,引入)至細胞中。舉例而言,在納入細胞內維持之核酸時,dTPT3及dCNMO可形成穩定非天然鹼基對,例如,當在包含dTPT3TP及dCNMOTP之支持生命培養基中生長時,該穩定非天然鹼基對可藉由生物體之DNA複製機制穩定地增殖。
在一些情形下,細胞能夠複製含有非天然核苷酸之核酸。該等方法可包括用編碼核苷三磷酸轉運蛋白之表現盒遺傳轉變細胞,該核苷三磷酸轉運蛋白能夠在活體內條件下以各別三磷酸形式將一或多個非天然核苷酸轉運至細胞中。或者,可採用先前用表現盒遺傳轉變之細胞,該表現盒可表現編碼之核苷三磷酸轉運蛋白。該方法亦可包括在適於細胞生長及複製之支持生命培養基中使遺傳轉變之細胞接觸或暴露於磷酸鉀及至少一個非天然核苷酸之各別三磷酸形式(例如,能夠形成非天然鹼基對(UBP)之兩個相互鹼基配對之核苷酸),及在活體內條件下在支持生命培養基中在至少一個非天然核苷酸之各別三磷酸形式(例如,能夠形成非天然鹼基對(UBP)之兩個相互鹼基配對之核苷酸)存在下維持轉變之細胞,貫穿細胞之至少一個複製週期。該方法亦可包括在適於細胞生長及複製之支持生命培養基中使遺傳轉變之細胞接觸或暴露於磷酸鉀及至少一個非天然核苷酸之各別三磷酸形式(例如,其組態可以形成非天然鹼基對(UBP)之兩個相互鹼基配對之核苷酸),及在活體內條件下在支持生命培養基中在至少一個非天然核苷酸之各別三磷酸形式(例如,其組態可以形成非天然鹼基對(UBP)之兩個相互鹼基配對之核苷酸)存在下維持轉變之細胞,貫穿細胞之至少一個複製週期。
在一些實施例中,細胞包含穩定納入之非天然核酸。一些實施例包含將除A、G、T及C以外之核苷酸穩定納入細胞內維持之核酸內之細胞(例如,大腸桿菌)。舉例而言,除A、G、T及C以外之核苷酸可為d5SICS、dCNMO、dNaM及/或dTPT3,其在納入細胞之核酸時,可在核酸內形成穩定非天然鹼基對。在一態樣中,當用三磷酸轉運蛋白之基因轉變之生物體在包括磷酸鉀及d5SICS、dNAM、dCNMO及/或dTPT3之三磷酸形式之支持生命培養基中生長時,非天然核苷酸及非天然鹼基對可藉由生物體之複製裝置穩定地增殖。
在一些情形下,細胞包含擴展遺傳字母。細胞可包含穩定納入之非天然核酸。在一些實施例中,具有擴展遺傳字母之細胞包含含有可與另一非天然核苷酸配對之非天然核苷酸的非天然核酸。在一些實施例中,具有擴展遺傳字母之細胞包含與另一核酸氫鍵結之非天然核酸。在一些實施例中,具有擴展遺傳字母之細胞包含非天然核酸,其不與和其鹼基配對之另一核酸氫鍵結。在一些實施例中,具有擴展遺傳字母之細胞包含含有非天然核苷酸之非天然核酸,該非天然核苷酸具有經由疏水及/或堆積相互作用與核鹼基或另一非天然核苷酸鹼基配對之核鹼基。在一些實施例中,具有擴展遺傳字母之細胞包含經由非氫鍵結相互作用與另一核酸鹼基配對之非天然核酸。具有擴展遺傳字母之細胞可為可拷貝同源核酸以形成包含非天然核酸之核酸的細胞。具有擴展遺傳字母之細胞可為包含與另一非天然核酸鹼基配對之非天然核酸(非天然核酸鹼基對(UBP))的細胞。
在一些實施例中,細胞在活體內條件下自輸入之非天然核苷酸形成非天然DNA鹼基對(UBP)。在一些實施例中,磷酸鉀及/或磷酸酶及/或核苷酸酶活性之抑制劑可促進非天然核苷酸之轉運。該方法包括使用表現異源核苷三磷酸轉運蛋白之細胞。當該細胞與一或多個核苷三磷酸接觸時,核苷三磷酸被轉運至細胞中。細胞可存在磷酸鉀及/或磷酸酶及核苷酸酶之抑制劑。非天然核苷三磷酸可藉由細胞之天然機制(即聚合酶)納入細胞內之核酸中,且例如相互鹼基配對以在細胞之核酸內形成非天然鹼基對。在一些實施例中,在帶有非天然鹼基之DNA與RNA核苷酸之間形成UBP。
在一些實施例中,當暴露於非天然三磷酸時,UBP可納入細胞或細胞群體中。在一些實施例中,當實質上一致地暴露於非天然三磷酸時,UBP可納入細胞或細胞群體中。
在一些實施例中,與不誘導異源基因表現之細胞中一或多個非天然三磷酸之生長及攝取相比,誘導異源基因(例如核苷三磷酸轉運蛋白(NTT))在細胞中之表現可導致更慢之細胞生長及增加之非天然三磷酸攝取。攝取不同地包含例如經由擴散、滲透或經由轉運蛋白之作用將核苷酸轉運至細胞中。在一些實施例中,與不誘導異源基因表現之細胞生長及攝取相比,誘導異源基因(例如NTT)在細胞中之表現可導致增加之細胞生長及增加之非天然核酸攝取。
在一些實施例中,在對數生長期期間納入UBP。在一些實施例中,在非對數生長期期間納入UBP。在一些實施例中,在實質上線性生長期期間納入UBP。在一些實施例中,生長一段時間後將UBP穩定納入細胞或細胞群體中。舉例而言,UBP可在生長至少約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45或50或更多個重複之後穩定地納入細胞或細胞群體中。舉例而言,UBP可生長至少約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24小時後穩定地納入細胞或細胞群體中。舉例而言,UBP可生長至少約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或31天後穩定地納入細胞或細胞群體中。舉例而言,UBP可生長至少約1、2、3、4、5、6、7、8、9、10、11或12個月後穩定地納入細胞或細胞群體中。舉例而言,UBP可在生長至少約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45或50年後穩定地納入細胞或細胞群體中。
在一些實施例中,本文揭示之半合成生物體包含DNA,其包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image617
Figure 02_image619
Figure 02_image621
。在一些實施例中,包含至少一個非天然鹼基之半合成生物體的DNA形成非天然鹼基對(UBP)。在一些實施例中,非天然鹼基對(UBP)係dCNMO-dTPT3、dNaM-dTPT3、dCNMO-dTAT1或dNaM-dTAT1。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image623
Figure 02_image625
Figure 02_image627
。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image629
Figure 02_image631
。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image633
Figure 02_image635
。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image637
Figure 02_image639
。在一些實施例中,DNA包含至少一個選自
Figure 02_image641
Figure 02_image643
之非天然核鹼基。在一些實施例中,DNA包含至少兩個選自
Figure 02_image645
Figure 02_image647
之非天然核鹼基。在一些實施例中,DNA包含兩股,第一股包含至少一個為
Figure 02_image649
之核鹼基,且第二股包含至少一個為
Figure 02_image651
之核鹼基。在一些實施例中,DNA包含至少一個為
Figure 02_image653
之非天然核鹼基。
在一些實施例中,細胞進一步利用RNA聚合酶以產生含有一或多個非天然核苷酸之mRNA。在一些實施例中,RNA聚合酶係異源RNA聚合酶。在一些情況下,細胞進一步利用聚合酶以產生含有反密碼子之tRNA,該反密碼子包含一或多個非天然核苷酸。在一些實施例中,tRNA係異源tRNA。在一些情況下,tRNA加載有非天然胺基酸。在一些情況下,tRNA之非天然反密碼子在轉譯期間與mRNA之非天然密碼子配對以合成含有非天然胺基酸之蛋白質。
在一些實施例中,本文揭示之半合成生物體表現異源核苷三磷酸轉運蛋白。在一些實施例中,異源核苷三磷酸轉運蛋白係Pt NTT2。在一些實施例中,半合成生物體進一步表現異源tRNA合成酶。在一些實施例中,異源tRNA合成酶係巴氏甲烷八疊球菌吡咯離胺醯基-tRNA合成酶(Mb PylRS)。在一些實施例中,半合成生物體表現核苷三磷酸轉運蛋白Pt NTT2且進一步表現tRNA合成酶巴氏甲烷八疊球菌吡咯離胺醯基-tRNA合成酶(Mb PylRS)。在一些實施例中,半合成生物體進一步表現異源RNA聚合酶。在一些實施例中,異源RNA聚合酶係T7 RNAP。在一些實施例中,半合成生物體不表現具有DNA重組修復功能之蛋白質。在一些實施例中,半合成生物體係大腸桿菌,且生物體不表現RecA。
在一些實施例中,半合成生物體進一步包含異源mRNA。在一些實施例中,異源mRNA包含至少一個選自
Figure 02_image655
Figure 02_image657
之非天然鹼基。在一些實施例中,異源mRNA包含至少一個為
Figure 02_image659
之非天然鹼基。在一些實施例中,異源mRNA包含至少一個為
Figure 02_image661
之非天然鹼基。在一些實施例中,異源mRNA包含至少一個為
Figure 02_image663
之非天然鹼基。
在一些實施例中,半合成生物體進一步包含異源tRNA。在一些實施例中,異源tRNA包含至少一個選自
Figure 02_image665
Figure 02_image667
之非天然鹼基。在一些實施例中,異源tRNA包含至少一個為
Figure 02_image669
之非天然鹼基。在一些實施例中,異源tRNA包含至少一個為
Figure 02_image671
之非天然鹼基。在一些實施例中,異源tRNA包含至少一個為
Figure 02_image673
之非天然鹼基。
在一些實施例中,本文揭示之半合成生物體亦包含異源mRNA及異源tRNA。在一些實施例中半合成生物體進一步包含(a) 異源核苷三磷酸轉運蛋白,(b) 異源mRNA,(c) 異源tRNA,(d) 異源tRNA合成酶,及(e) 異源RNA聚合酶,且其中生物體不表現具有DNA重組修復功能之蛋白質。在一些實施例中,核苷三磷酸轉運蛋白係Pt NTT2,tRNA合成酶係巴氏甲烷八疊球菌吡咯離胺醯基-tRNA合成酶(Mb PylRS),且RNA聚合酶係T7 RNAP。在一些實施例中,半合成生物體係大腸桿菌且生物體不表現RecA。在一些實施例中,半合成生物體過表現一或多種DNA聚合酶。在一些實施例中,生物體過表現DNA Pol II。天然及非天然胺基酸
如本文所用,胺基酸殘基可指含有胺基及羧基二者之分子。適宜胺基酸包括(但不限於)天然胺基酸之D-及L-異構物、以及藉由有機合成或任何其他方法製備之非天然胺基酸。如本文所用,術語胺基酸包括(但不限於) α-胺基酸、β-胺基酸、天然胺基酸、非經典胺基酸、非天然胺基酸及胺基酸類似物。
術語「α-胺基酸」可指含有與命名為α-碳之碳結合之胺基及羧基二者的分子。舉例而言:
Figure 02_image675
術語「β-胺基酸」可指含有呈β構形之胺基及羧基二者的分子。
「天然胺基酸」可指20種胺基酸中之任一者,該20種胺基酸通常在自然界中合成之肽中發現,且藉由單字母縮寫A、R、N、C、D、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y及V而已知。
下表顯示天然胺基酸之性質之概述:
胺基酸 3-字母 代碼 1-字母代碼 側鏈極性 側鏈電荷(pH 7.4) 親水性指數
丙胺酸 Ala A 非極性 中性 1.8
精胺酸 Arg R 極性 −4.5
天冬醯胺 Asn N 極性 中性 −3.5
天冬胺酸 Asp D 極性 −3.5
半胱胺酸 Cys C 極性 中性 2.5
麩胺酸 Glu E 極性 −3.5
麩醯胺酸 Gln Q 極性 中性 −3.5
甘胺酸 Gly G 非極性 中性 −0.4
組胺酸 His H 極性 正(10%) 中性(90%) −3.2
異白胺酸 Ile I 非極性 中性 4.5
白胺酸 Leu L 非極性 中性 3.8
離胺酸 Lys K 極性 −3.9
甲硫胺酸 Met M 非極性 中性 1.9
苯丙胺酸 Phe F 非極性 中性 2.8
脯胺酸 Pro P 非極性 中性 −1.6
絲胺酸 Ser S 極性 中性 −0.8
蘇胺酸 Thr T 極性 中性 −0.7
色胺酸 Trp W 非極性 中性 −0.9
酪胺酸 Tyr Y 極性 中性 −1.3
纈胺酸 Val V 非極性 中性 4.2
「疏水胺基酸」包括小的疏水胺基酸及大的疏水胺基酸。「小的疏水胺基酸」可為甘胺酸、丙胺酸、脯胺酸及其類似物。「大的疏水胺基酸」可為纈胺酸、白胺酸、異白胺酸、苯丙胺酸、甲硫胺酸、色胺酸及其類似物。「極性胺基酸」可為絲胺酸、蘇胺酸、天冬醯胺、麩醯胺酸、半胱胺酸、酪胺酸及其類似物。「帶電胺基酸」可為離胺酸、精胺酸、組胺酸、天冬胺酸鹽、麩胺酸鹽及其類似物。
「胺基酸類似物」可為結構上類似於胺基酸且可在肽模擬物大環之形成中替代胺基酸的分子。胺基酸類似物包括(但不限於) β-胺基酸及其中胺基或羧基由類似反應基團取代(例如用二級或三級胺取代一級胺、或用酯取代羧基)之胺基酸。
「非經典胺基酸(ncAA)」或「非天然胺基酸(non-natural amino acid)」或「非天然胺基酸(unnatural amino acid)」可為並非20種胺基酸中之一者的胺基酸,該20種胺基酸通常在自然界中合成之肽中發現,且藉由單字母縮寫A、R、N、C、D、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y及V而已知。在一些情況下,非天然胺基酸係非經典胺基酸之亞組。
胺基酸類似物可包括β-胺基酸類似物。β-胺基酸類似物之實例包括(但不限於)以下:環狀β-胺基酸類似物;β-丙胺酸;(R)-β-苯丙胺酸;(R)-1,2,3,4-四氫-異喹啉-3-乙酸;(R)-3-胺基-4-(1-萘基)-丁酸;(R)-3-胺基-4-(2,4-二氯苯基)丁酸;(R)-3-胺基-4-(2-氯苯基)-丁酸;(R)-3-胺基-4-(2-氰基苯基)-丁酸;(R)-3-胺基-4-(2-氟苯基)-丁酸;(R)-3-胺基-4-(2-呋喃基)-丁酸;(R)-3-胺基-4-(2-甲基苯基)-丁酸;(R)-3-胺基-4-(2-萘基)-丁酸;(R)-3-胺基-4-(2-噻吩基)-丁酸;(R)-3-胺基-4-(2-三氟甲基苯基)-丁酸;(R)-3-胺基-4-(3,4-二氯苯基)丁酸;(R)-3-胺基-4-(3,4-二氟苯基)丁酸;(R)-3-胺基-4-(3-苯并噻吩基)-丁酸;(R)-3-胺基-4-(3-氯苯基)-丁酸;(R)-3-胺基-4-(3-氰基苯基)-丁酸;(R)-3-胺基-4-(3-氟苯基)-丁酸;(R)-3-胺基-4-(3-甲基苯基)-丁酸;(R)-3-胺基-4-(3-吡啶基)-丁酸;(R)-3-胺基-4-(3-噻吩基)-丁酸;(R)-3-胺基-4-(3-三氟甲基苯基)-丁酸;(R)-3-胺基-4-(4-溴苯基)-丁酸;(R)-3-胺基-4-(4-氯苯基)-丁酸;(R)-3-胺基-4-(4-氰基苯基)-丁酸;(R)-3-胺基-4-(4-氟苯基)-丁酸;(R)-3-胺基-4-(4-碘苯基)-丁酸;(R)-3-胺基-4-(4-甲基苯基)-丁酸;(R)-3-胺基-4-(4-硝基苯基)-丁酸;(R)-3-胺基-4-(4-吡啶基)-丁酸;(R)-3-胺基-4-(4-三氟甲基苯基)-丁酸;(R)-3-胺基-4-五氟-苯基丁酸;(R)-3-胺基-5-己烯酸;(R)-3-胺基-5-己炔酸;(R)-3-胺基-5-苯基戊酸;(R)-3-胺基-6-苯基-5-己烯酸;(S)-1,2,3,4-四氫-異喹啉-3-乙酸;(S)-3-胺基-4-(1-萘基)-丁酸;(S)-3-胺基-4-(2,4-二氯苯基)丁酸;(S)-3-胺基-4-(2-氯苯基)-丁酸;(S)-3-胺基-4-(2-氰基苯基)-丁酸;(S)-3-胺基-4-(2-氟苯基)-丁酸;(S)-3-胺基-4-(2-呋喃基)-丁酸;(S)-3-胺基-4-(2-甲基苯基)-丁酸;(S)-3-胺基-4-(2-萘基)-丁酸;(S)-3-胺基-4-(2-噻吩基)-丁酸;(S)-3-胺基-4-(2-三氟甲基苯基)-丁酸;(S)-3-胺基-4-(3,4-二氯苯基)丁酸;(S)-3-胺基-4-(3,4-二氟苯基)丁酸;(S)-3-胺基-4-(3-苯并噻吩基)-丁酸;(S)-3-胺基-4-(3-氯苯基)-丁酸;(S)-3-胺基-4-(3-氰基苯基)-丁酸;(S)-3-胺基-4-(3-氟苯基)-丁酸;(S)-3-胺基-4-(3-甲基苯基)-丁酸;(S)-3-胺基-4-(3-吡啶基)-丁酸;(S)-3-胺基-4-(3-噻吩基)-丁酸;(S)-3-胺基-4-(3-三氟甲基苯基)-丁酸;(S)-3-胺基-4-(4-溴苯基)-丁酸;(S)-3-胺基-4-(4-氯苯基)丁酸;(S)-3-胺基-4-(4-氰基苯基)-丁酸;(S)-3-胺基-4-(4-氟苯基)丁酸;(S)-3-胺基-4-(4-碘苯基)-丁酸;(S)-3-胺基-4-(4-甲基苯基)-丁酸;(S)-3-胺基-4-(4-硝基苯基)-丁酸;(S)-3-胺基-4-(4-吡啶基)-丁酸;(S)-3-胺基-4-(4-三氟甲基苯基)-丁酸;(S)-3-胺基-4-五氟-苯基丁酸;(S)-3-胺基-5-己烯酸;(S)-3-胺基-5-己炔酸;(S)-3-胺基-5-苯基戊酸;(S)-3-胺基-6-苯基-5-己烯酸;1,2,5,6-四氫吡啶-3-甲酸;1,2,5,6-四氫吡啶-4-甲酸;3-胺基-3-(2-氯苯基)-丙酸;3-胺基-3-(2-噻吩基)-丙酸;3-胺基-3-(3-溴苯基)-丙酸;3-胺基-3-(4-氯苯基)-丙酸;3-胺基-3-(4-甲氧基苯基)-丙酸;3-胺基-4,4,4-三氟-丁酸;3-胺基己二酸;D-β-苯丙胺酸;β-白胺酸;L-β-高丙胺酸;L-β-高天冬胺酸γ-苄基酯;L-β-高麩胺酸δ-苄基酯;L-β-高異白胺酸;L-β-高白胺酸;L-β-高甲硫胺酸;L-β-高苯丙胺酸;L-β-高脯胺酸;L-β-高色胺酸;L-β-高纈胺酸;L-Nω-苄基氧基羰基-β-高離胺酸;Nω-L-β-高精胺酸;O-苄基-L-β-高羥脯胺酸;O-苄基-L-β-高絲胺酸;O-苄基-L-β-高蘇胺酸;O-苄基-L-β-高酪胺酸;γ-三苯甲基-L-β-高天冬醯胺;(R)-β-苯丙胺酸;L-β-高天冬胺酸γ-第三丁基酯;L-β-高麩胺酸δ-第三丁基酯;L-Nω-β-高離胺酸;Nδ-三苯甲基-L-β-高麩醯胺酸;Nω-2,2,4,6,7-五甲基-二氫苯并呋喃-5-磺醯基-L-β-高精胺酸;O-第三丁基-L-β-高羥基-脯胺酸;O-第三丁基-L-β-高絲胺酸;O-第三丁基-L-β-高蘇胺酸;O-第三丁基-L-β-高酪胺酸;2-胺基環戊烷羧酸;及2-胺基環己烷羧酸。
胺基酸類似物可包括丙胺酸、纈胺酸、甘胺酸或白胺酸之類似物。丙胺酸、纈胺酸、甘胺酸及白胺酸之胺基酸類似物之實例包括(但不限於)以下:α-甲氧基甘胺酸;α-烯丙基-L-丙胺酸;α-胺基異丁酸;α-甲基-白胺酸;β-(1-萘基)-D-丙胺酸;β-(1-萘基)-L-丙胺酸;β-(2-萘基)-D-丙胺酸;β-(2-萘基)-L-丙胺酸;β-(2-吡啶基)-D-丙胺酸;β-(2-吡啶基)-L-丙胺酸;β-(2-噻吩基)-D-丙胺酸;β-(2-噻吩基)-L-丙胺酸;β-(3-苯并噻吩基)-D-丙胺酸;β-(3-苯并噻吩基)-L-丙胺酸;β-(3-吡啶基)-D-丙胺酸;β-(3-吡啶基)-L-丙胺酸;β-(4-吡啶基)-D-丙胺酸;β-(4-吡啶基)-L-丙胺酸;β-氯-L-丙胺酸;β-氰基-L-丙胺酸;β-環己基-D-丙胺酸;β-環己基-L-丙胺酸;β-環戊烯-1-基-丙胺酸;β-環戊基-丙胺酸;β-環丙基-L-Ala-OH.二環己基銨鹽;β-第三丁基-D-丙胺酸;β-第三丁基-L-丙胺酸;γ-胺基丁酸;L-α,β-二胺基丙酸;2,4-二硝基-苯基甘胺酸;2,5-二氫-D-苯基甘胺酸;2-胺基-4,4,4-三氟丁酸;2-氟-苯基甘胺酸;3-胺基-4,4,4-三氟-丁酸;3-氟-纈胺酸;4,4,4-三氟-纈胺酸;4,5-去氫-L-leu-OH.二環己基銨鹽;4-氟-D-苯基甘胺酸;4-氟-L-苯基甘胺酸;4-羥基-D-苯基甘胺酸;5,5,5-三氟-白胺酸;6-胺基己酸;環戊基-D-Gly-OH.二環己基銨鹽;環戊基-Gly-OH.二環己基銨鹽;D-α,β-二胺基丙酸;D-α-胺基丁酸;D-α-第三丁基甘胺酸;D-(2-噻吩基)甘胺酸;D-(3-噻吩基)甘胺酸;D-2-胺基己酸;D-2-二氫茚基甘胺酸;D-烯丙基甘胺酸-二環己基銨鹽;D-環己基甘胺酸;D-正纈胺酸;D-苯基甘胺酸;β-胺基丁酸;β-胺基異丁酸;(2-溴苯基)甘胺酸;(2-甲氧基苯基)甘胺酸;(2-甲基苯基)甘胺酸;(2-噻唑基)甘胺酸;(2-噻吩基)甘胺酸;2-胺基-3-(二甲基胺基)-丙酸;L-α,β-二胺基丙酸;L-α-胺基丁酸;L-α-第三丁基甘胺酸;L-(3-噻吩基)甘胺酸;L-2-胺基-3-(二甲基胺基)-丙酸;L-2-胺基己酸二環己基-銨鹽;L-2-二氫茚基甘胺酸;L-烯丙基甘胺酸二環己基銨鹽;L-環己基甘胺酸;L-苯基甘胺酸;L-炔丙基甘胺酸;L-正纈胺酸;N-α-胺基甲基-L-丙胺酸;D-α,γ-二胺基丁酸;L-α,γ-二胺基丁酸;β-環丙基-L-丙胺酸;(N-β-(2,4-二硝基苯基))-L-α,β-二胺基丙酸;(N-β-1-(4,4-二甲基-2,6-二側氧基環己-1-亞基)乙基)-D-α,β-二胺基丙酸;(N-β-1-(4,4-二甲基-2,6-二側氧基環己-1-亞基)乙基)-L-α,β-二胺基丙酸;(N-β-4-甲基三苯甲基)-L-α,β-二胺基丙酸;(N-β-烯丙基氧基羰基)-L-α,β-二胺基丙酸;(N-γ-1-(4,4-二甲基-2,6-二側氧基環己-1-亞基)乙基)-D-α,γ-二胺基丁酸;(N-γ-1-(4,4-二甲基-2,6-二側氧基環己-1-亞基)乙基)-L-α,γ-二胺基丁酸;(N-γ-4-甲基三苯甲基)-D-α,γ-二胺基丁酸;(N-γ-4-甲基三苯甲基)-L-α,γ-二胺基丁酸;(N-γ-烯丙基氧基羰基)-L-α,γ-二胺基丁酸;D-α,γ-二胺基丁酸;4,5-去氫-L-白胺酸;環戊基-D-Gly-OH;環戊基-Gly-OH;D-烯丙基甘胺酸;D-高環己基丙胺酸;L-1-芘基丙胺酸;L-2-胺基己酸;L-烯丙基甘胺酸;L-高環己基丙胺酸;及N-(2-羥基-4-甲氧基-Bzl)-Gly-OH。
胺基酸類似物可包括精胺酸或離胺酸之類似物。精胺酸及離胺酸之胺基酸類似物之實例包括(但不限於)以下:瓜胺酸;L-2-胺基-3-胍基丙酸;L-2-胺基-3-脲基丙酸;L-瓜胺酸;Lys(Me)2 -OH;Lys(N3 )—OH;Nδ-苄基氧基羰基-L-鳥胺酸;Nω-硝基-D-精胺酸;Nω-硝基-L-精胺酸;α-甲基-鳥胺酸;2,6-二胺基庚烷二酸;L-鳥胺酸;(Nδ-1-(4,4-二甲基-2,6-二側氧基-環己-1-亞基)乙基)-D-鳥胺酸;(Nδ-1-(4,4-二甲基-2,6-二側氧基-環己-1-亞基)乙基)-L-鳥胺酸;(Nδ-4-甲基三苯甲基)-D-鳥胺酸;(Nδ-4-甲基三苯甲基)-L-鳥胺酸;D-鳥胺酸;L-鳥胺酸;Arg(Me)(Pbf)-OH;Arg(Me)2 -OH (不對稱);Arg(Me)2-OH (對稱);Lys(ivDde)-OH;Lys(Me)2-OH.HCl;Lys(Me3)-OH氯化物;Nω-硝基-D-精胺酸;及Nω-硝基-L-精胺酸。
胺基酸類似物可包括天冬胺酸或麩胺酸之類似物。天冬胺酸及麩胺酸之胺基酸類似物之實例包括(但不限於)以下:α-甲基-D-天冬胺酸;α-甲基-麩胺酸;α-甲基-L-天冬胺酸;γ-亞甲基-麩胺酸;(N-γ-乙基)-L-麩醯胺酸;[N-α-(4-胺基苯甲醯基)]-L-麩胺酸;2,6-二胺基庚二酸;L-α-胺基辛二酸;D-2-胺基己二酸;D-α-胺基辛二酸;α-胺基庚二酸;亞胺基二乙酸;L-2-胺基己二酸;蘇-β-甲基-天冬胺酸;γ-羧基-D-麩胺酸γ,γ-二-第三丁基酯;γ-羧基-L-麩胺酸γ,γ-二-第三丁基酯;Glu(OAll)-OH;L-Asu(OtBu)—OH;及焦麩胺酸。
胺基酸類似物可包括半胱胺酸及甲硫胺酸之類似物。半胱胺酸及甲硫胺酸之胺基酸類似物之實例包括(但不限於)以下:Cys(法尼基)-OH、Cys(法尼基)-OMe、α-甲基-甲硫胺酸、Cys(2-羥基乙基)-OH、Cys(3-胺基丙基)-OH、2-胺基-4-(乙基硫基)丁酸、丁硫胺酸、丁硫胺酸磺醯亞胺、乙硫胺酸、甲硫胺酸甲基氯化鋶、硒基甲硫胺酸、磺基丙胺酸、[2-(4-吡啶基)乙基]-DL-青黴胺、[2-(4-吡啶基)乙基]-L-半胱胺酸、4-甲氧基苄基-D-青黴胺、4-甲氧基苄基-L-青黴胺、4-甲基苄基-D-青黴胺、4-甲基苄基-L-青黴胺、苄基-D-半胱胺酸、苄基-L-半胱胺酸、苄基-DL-高半胱胺酸、胺甲醯基-L-半胱胺酸、羧基乙基-L-半胱胺酸、羧基甲基-L-半胱胺酸、二苯基甲基-L-半胱胺酸、乙基-L-半胱胺酸、甲基-L-半胱胺酸、第三丁基-D-半胱胺酸、三苯甲基-L-高半胱胺酸、三苯甲基-D-青黴胺、胱硫醚、高胱胺酸、L-高胱胺酸、(2-胺基乙基)-L-半胱胺酸、硒基-L-胱胺酸、胱硫醚、Cys(StBu)—OH及乙醯胺基甲基-D-青黴胺。
胺基酸類似物可包括苯丙胺酸及酪胺酸之類似物。苯丙胺酸及酪胺酸之胺基酸類似物之實例包括(但不限於)以下:β-甲基-苯丙胺酸、β-羥基苯丙胺酸、α-甲基-3-甲氧基-DL-苯丙胺酸、α-甲基-D-苯丙胺酸、α-甲基-L-苯丙胺酸、1,2,3,4-四氫異喹啉-3-甲酸、2,4-二氯-苯丙胺酸、2-(三氟甲基)-D-苯丙胺酸、2-(三氟甲基)-L-苯丙胺酸、2-溴-D-苯丙胺酸、2-溴-L-苯丙胺酸、2-氯-D-苯丙胺酸、2-氯-L-苯丙胺酸、2-氰基-D-苯丙胺酸、2-氰基-L-苯丙胺酸、2-氟-D-苯丙胺酸、2-氟-L-苯丙胺酸、2-甲基-D-苯丙胺酸、2-甲基-L-苯丙胺酸、2-硝基-D-苯丙胺酸、2-硝基-L-苯丙胺酸、2;4;5-三羥基-苯丙胺酸、3,4,5-三氟-D-苯丙胺酸、3,4,5-三氟-L-苯丙胺酸、3,4-二氯-D-苯丙胺酸、3,4-二氯-L-苯丙胺酸、3,4-二氟-D-苯丙胺酸、3,4-二氟-L-苯丙胺酸、3,4-二羥基-L-苯丙胺酸、3,4-二甲氧基-L-苯丙胺酸、3,5,3′-三碘-L-甲狀腺胺酸、3,5-二碘-D-酪胺酸、3,5-二碘-L-酪胺酸、3,5-二碘-L-甲狀腺胺酸、3-(三氟甲基)-D-苯丙胺酸、3-(三氟甲基)-L-苯丙胺酸、3-胺基-L-酪胺酸、3-溴-D-苯丙胺酸、3-溴-L-苯丙胺酸、3-氯-D-苯丙胺酸、3-氯-L-苯丙胺酸、3-氯-L-酪胺酸、3-氰基-D-苯丙胺酸、3-氰基-L-苯丙胺酸、3-氟-D-苯丙胺酸、3-氟-L-苯丙胺酸、3-氟-酪胺酸、3-碘-D-苯丙胺酸、3-碘-L-苯丙胺酸、3-碘-L-酪胺酸、3-甲氧基-L-酪胺酸、3-甲基-D-苯丙胺酸、3-甲基-L-苯丙胺酸、3-硝基-D-苯丙胺酸、3-硝基-L-苯丙胺酸、3-硝基-L-酪胺酸、4-(三氟甲基)-D-苯丙胺酸、4-(三氟甲基)-L-苯丙胺酸、4-胺基-D-苯丙胺酸、4-胺基-L-苯丙胺酸、4-苯甲醯基-D-苯丙胺酸、4-苯甲醯基-L-苯丙胺酸、4-雙(2-氯乙基)胺基-L-苯丙胺酸、4-溴-D-苯丙胺酸、4-溴-L-苯丙胺酸、4-氯-D-苯丙胺酸、4-氯-L-苯丙胺酸、4-氰基-D-苯丙胺酸、4-氰基-L-苯丙胺酸、4-氟-D-苯丙胺酸、4-氟-L-苯丙胺酸、4-碘-D-苯丙胺酸、4-碘-L-苯丙胺酸、高苯丙胺酸、甲狀腺素、3,3-二苯丙胺酸、甲狀腺胺酸、乙基-酪胺酸及甲基-酪胺酸。
胺基酸類似物可包括脯胺酸之類似物。脯胺酸之胺基酸類似物之實例包括(但不限於)以下:3,4-去氫-脯胺酸、4-氟-脯胺酸、順式-4-羥基-脯胺酸、噻唑啶-2-甲酸及反式-4-氟-脯胺酸。
胺基酸類似物可包括絲胺酸及蘇胺酸之類似物。絲胺酸及蘇胺酸之胺基酸類似物之實例包括(但不限於)以下:3-胺基-2-羥基-5-甲基己酸、2-胺基-3-羥基-4-甲基戊酸、2-胺基-3-乙氧基丁酸、2-胺基-3-甲氧基丁酸、4-胺基-3-羥基-6-甲基庚酸、2-胺基-3-苄基氧基丙酸、2-胺基-3-苄基氧基丙酸、2-胺基-3-乙氧基丙酸、4-胺基-3-羥基丁酸及α-甲基絲胺酸。
胺基酸類似物可包括色胺酸之類似物。色胺酸之胺基酸類似物之實例包括(但不限於)以下:α-甲基-色胺酸;β-(3-苯并噻吩基)-D-丙胺酸;β-(3-苯并噻吩基)-L-丙胺酸;1-甲基-色胺酸;4-甲基-色胺酸;5-苄基氧基-色胺酸;5-溴-色胺酸;5-氯-色胺酸;5-氟-色胺酸;5-羥基-色胺酸;5-羥基-L-色胺酸;5-甲氧基-色胺酸;5-甲氧基-L-色胺酸;5-甲基-色胺酸;6-溴-色胺酸;6-氯-D-色胺酸;6-氯-色胺酸;6-氟-色胺酸;6-甲基-色胺酸;7-苄基氧基-色胺酸;7-溴-色胺酸;7-甲基-色胺酸;D-1,2,3,4-四氫-去甲哈爾滿(norharman)-3-甲酸;6-甲氧基-1,2,3,4-四氫去甲哈爾滿-1-甲酸;7-氮雜色胺酸;L-1,2,3,4-四氫-去甲哈爾滿-3-甲酸;5-甲氧基-2-甲基-色胺酸;及6-氯-L-色胺酸。
胺基酸類似物可為外消旋的。在一些情況下,使用胺基酸類似物之D異構物。在一些情形下,使用胺基酸類似物之L異構物。在一些情況下,胺基酸類似物包含呈R或S構形之手性中心。有時,β-胺基酸類似物之胺基經保護基團(例如第三丁基氧基羰基(BOC基團)、9-茀基甲基氧基羰基(FMOC)、甲苯磺醯基及諸如此類)取代。有時,β-胺基酸類似物之羧酸官能基經保護為例如其酯衍生物。在一些情形下,使用胺基酸類似物之鹽。
在一些實施例中,非天然胺基酸係闡述於Liu C.C., Schultz, P.G.Annu. Rev. Biochem . 2010, 79, 413中之非天然胺基酸,該參考文獻之揭示內容係以全文引用之方式併入本文中。在一些實施例中,非天然胺基酸包含N6(2-疊氮基乙氧基)-羰基-L-離胺酸。
在一些實施例中,本文所述之胺基酸殘基(例如在蛋白質內)在結合至結合部分之前突變成非天然胺基酸。在一些情形下,突變成非天然胺基酸防止或最小化免疫系統之自體抗原反應。如本文所用術語「非天然胺基酸」係指除在蛋白質中天然存在之20種胺基酸之外的胺基酸。非天然胺基酸之非限制性實例包括:對-乙醯基-L-苯丙胺酸、對-碘-L-苯丙胺酸、對-甲氧基苯丙胺酸、O-甲基-L-酪胺酸、對-炔丙基氧基苯丙胺酸、對-炔丙基-苯丙胺酸、L-3-(2-萘基)丙胺酸、3-甲基-苯丙胺酸、O-4-烯丙基-L-酪胺酸、4-丙基-L-酪胺酸、三-O-乙醯基-GlcNAcp-絲胺酸、L-多巴、氟化苯丙胺酸、異丙基-L-苯丙胺酸、對-疊氮基-L-苯丙胺酸、對-醯基-L-苯丙胺酸、對-苯甲醯基-L-苯丙胺酸、 - 硼醯苯丙胺酸、O -炔丙基酪胺酸、L-磷絲胺酸、膦醯基絲胺酸、膦醯基酪胺酸、對-溴苯丙胺酸、硒基半胱胺酸、對-胺基-L-苯丙胺酸、異丙基-L-苯丙胺酸、疊氮基-離胺酸(N6-疊氮基乙氧基-羰基-L-離胺酸,AzK)、酪胺酸胺基酸之非天然類似物;麩醯胺酸胺基酸之非天然類似物;苯丙胺酸胺基酸之非天然類似物;絲胺酸胺基酸之非天然類似物;蘇胺酸胺基酸之非天然類似物;烷基、芳基、醯基、疊氮基、氰基、鹵基、肼、醯肼、羥基、烯基、炔基、醚、硫醇、磺醯基、硒基、酯、硫代酸、硼酸酯、
Figure 109119906-A0101-12-0030-1
酸酯、磷酸基、膦醯基、膦、雜環、烯酮、亞胺、醛、羥基胺、酮基或胺基取代之胺基酸、或其組合;具有光可活化交聯劑之胺基酸;自旋標記之胺基酸;螢光胺基酸;金屬結合胺基酸;含金屬之胺基酸;放射性胺基酸;光籠化及/或光異構化胺基酸;含有生物素或生物素類似物之胺基酸;含酮基胺基酸;包含聚乙二醇或聚醚之胺基酸;重原子取代之胺基酸;可化學裂解或光裂解之胺基酸;具有延長之側鏈之胺基酸;含有毒性基團之胺基酸;糖取代之胺基酸;碳連接之含糖胺基酸;氧化還原活性胺基酸;含a-羥基之酸;胺基硫代酸;α, α二取代之胺基酸;β-胺基酸;除脯胺酸或組胺酸以外之環狀胺基酸、及除苯丙胺酸、酪胺酸或色胺酸以外之芳香族胺基酸。
在一些實施例中,非天然胺基酸包含選擇性反應基團、或用於位點選擇性標記靶蛋白質或多肽之反應基團。在一些情況下,化學係雙正交反應(例如,生物相容及選擇性反應)。在一些情形下,化學係Cu(I)催化之或「無銅之」炔烴-疊氮化物三唑形成反應、Staudinger連接、反向電子需求Diels-Alder (IEDDA)反應、「光-點擊」化學或金屬介導之方法,例如烯烴易位及Suzuki-Miyaura或Sonogashira交叉偶合。在一些實施例中,非天然胺基酸包含光反應基團,其在用(例如) UV輻照時交聯。在一些實施例中,非天然胺基酸包含光籠化胺基酸。在一些情況下,非天然胺基酸係對位取代、間位取代或鄰位取代之胺基酸衍生物。
在一些情況下,非天然胺基酸包含對-乙醯基-L-苯丙胺酸、對-疊氮基甲基-L-苯丙胺酸(pAMF)、對-碘-L-苯丙胺酸、O-甲基-L-酪胺酸、對-甲氧基苯丙胺酸、對-炔丙基氧基苯丙胺酸、對-炔丙基-苯丙胺酸、L-3-(2-萘基)丙胺酸、3-甲基-苯丙胺酸、O-4-烯丙基-L-酪胺酸、4-丙基-L-酪胺酸、三-O-乙醯基-GlcNAcp-絲胺酸、L-多巴、氟化苯丙胺酸、異丙基-L-苯丙胺酸、對-疊氮基-L-苯丙胺酸、對-醯基-L-苯丙胺酸、對-苯甲醯基-L-苯丙胺酸、L-磷絲胺酸、膦醯基絲胺酸、膦醯基酪胺酸、對-溴苯丙胺酸、對-胺基-L-苯丙胺酸或異丙基-L-苯丙胺酸。
在一些情形下,非天然胺基酸係3-胺基酪胺酸、3-硝基酪胺酸、3,4-二羥基-苯丙胺酸或3-碘酪胺酸。在一些情形下,非天然胺基酸係苯基硒基半胱胺酸。在一些情況下,非天然胺基酸係含有二苯甲酮、酮、碘化物、甲氧基、乙醯基、苯甲醯基或疊氮化物之苯丙胺酸衍生物。在一些情況下,非天然胺基酸係含有二苯甲酮、酮、碘化物、甲氧基、乙醯基、苯甲醯基、或疊氮化物之離胺酸衍生物。在一些情況下,非天然胺基酸包含芳香族側鏈。在一些情況下,非天然胺基酸不包含芳香族側鏈。在一些情況下,非天然胺基酸包含疊氮基。在一些情況下,非天然胺基酸包含邁克爾受體基團(Michael-acceptor group)。在一些情況下,邁克爾受體基團包含能夠經由1,2-加成反應形成共價鍵之不飽和部分。在一些情況下,邁克爾受體基團包含缺電子烯烴或炔烴。在一些情況下,邁克爾受體基團包括(但不限於) α,β不飽和:酮、醛、亞碸、碸、腈、亞胺或芳香族基團。在一些情況下,非天然胺基酸係去氫丙胺酸。在一些情況下,非天然胺基酸包含醛或酮基團。在一些情況下,非天然胺基酸係包含醛或酮基團之離胺酸衍生物。在一些情況下,非天然胺基酸係在β、γ或δ位包含一或多個O、N、Se或S原子之離胺酸衍生物。在一些情況下,非天然胺基酸係在γ位包含O、N、Se或S原子之離胺酸衍生物。在一些情況下,非天然胺基酸係離胺酸衍生物,其中ε N原子經氧原子置換。在一些情況下,非天然胺基酸係離胺酸衍生物,其並非天然轉譯後修飾之離胺酸。
在一些情況下,非天然胺基酸係包含側鏈之胺基酸,其中α位之第六原子包含羰基。在一些情況下,非天然胺基酸係包含側鏈之胺基酸,其中α位之第六原子包含羰基,且α位之第五原子係氮。在一些情況下,非天然胺基酸係包含側鏈之胺基酸,其中α位之第七原子係氧原子。
在一些情況下,非天然胺基酸係包含硒之絲胺酸衍生物。在一些情況下,非天然胺基酸係硒基絲胺酸(2-胺基-3-氫硒基丙酸)。在一些情況下,非天然胺基酸係2-胺基-3-((2-((3-(苄基氧基)-3-側氧基丙基)胺基)乙基)硒烷基)丙酸。在一些情況下,非天然胺基酸係2-胺基-3-(苯基硒烷基)丙酸。在一些情況下,非天然胺基酸包含硒,其中硒之氧化引起形成包含烯烴之非天然胺基酸。
在一些情況下,非天然胺基酸包含環辛炔基基團。在一些情況下,非天然胺基酸包含反式環辛烯基。在一些情況下,非天然胺基酸包含降莰烯基。在一些情況下,非天然胺基酸包含環丙烯基。在一些情況下,非天然胺基酸包含二氮吮基團。在一些情況下,非天然胺基酸包含四嗪基團。
在一些情況下,非天然胺基酸係離胺酸衍生物,其中側鏈氮經胺甲醯化。在一些情況下,非天然胺基酸係離胺酸衍生物,其中側鏈氮經醯化。在一些情況下,非天然胺基酸係2-胺基-6-{[(第三丁氧基)羰基]胺基}己酸。在一些情況下,非天然胺基酸係2-胺基-6-{[(第三丁氧基)羰基]胺基}己酸。在一些情況下,非天然胺基酸係N6-Boc-N6-甲基離胺酸。在一些情況下,非天然胺基酸係N6-乙醯基離胺酸。在一些情況下,非天然胺基酸係吡咯離胺酸。在一些情況下,非天然胺基酸係N6-三氟乙醯基離胺酸。在一些情況下,非天然胺基酸係2-胺基-6-{[(苄基氧基)羰基]胺基}己酸。在一些情況下,非天然胺基酸係2-胺基-6-{[(對-碘苄基氧基)羰基]胺基}己酸。在一些情況下,非天然胺基酸係2-胺基-6-{[(對-硝基苄基氧基)羰基]胺基}己酸。在一些情況下,非天然胺基酸係N6-脯胺醯基離胺酸。在一些情況下,非天然胺基酸係2-胺基-6-{[(環戊基氧基)羰基]胺基}己酸。在一些情況下,非天然胺基酸係N6-(環戊烷羰基)離胺酸。在一些情況下,非天然胺基酸係N6-(四氫呋喃-2-羰基)離胺酸。在一些情況下,非天然胺基酸係N6-(3-乙炔基四氫呋喃-2-羰基)離胺酸。在一些情況下,非天然胺基酸係N6-((丙-2-炔-1-基氧基)羰基)離胺酸。在一些情況下,非天然胺基酸係2-胺基-6-{[(2-疊氮基環戊基氧基)羰基]胺基}己酸。在一些情況下,非天然胺基酸係N6-((2-疊氮基乙氧基)羰基)離胺酸。在一些情況下,非天然胺基酸係2-胺基-6-{[(2-硝基苄基氧基)羰基]胺基}己酸。在一些情況下,非天然胺基酸係2-胺基-6-{[(2-環辛炔基氧基)羰基]胺基}己酸。在一些情況下,非天然胺基酸係N6-(2-胺基丁-3-炔醯基)離胺酸。在一些情況下,非天然胺基酸係2-胺基-6-((2-胺基丁-3-炔醯基)氧基)己酸。在一些情況下,非天然胺基酸係N6-(烯丙基氧基羰基)離胺酸。在一些情況下,非天然胺基酸係N6-(丁烯基-4-氧基羰基)離胺酸。在一些情況下,非天然胺基酸係N6-(戊烯基-5-氧基羰基)離胺酸。在一些情況下,非天然胺基酸係N6-((丁-3-炔-1-基氧基)羰基)-離胺酸。在一些情況下,非天然胺基酸係N6-((戊-4-炔-1-基氧基)羰基)-離胺酸。在一些情況下,非天然胺基酸係N6-(噻唑啶-4-羰基)離胺酸。在一些情況下,非天然胺基酸係2-胺基-8-側氧基壬酸。在一些情況下,非天然胺基酸係2-胺基-8-側氧基辛酸。在一些情況下,非天然胺基酸係N6-(2-側氧基乙醯基)離胺酸。
在一些情況下,非天然胺基酸係N6-丙醯基離胺酸。在一些情況下,非天然胺基酸係N6-丁醯基離胺酸。在一些情況下,非天然胺基酸係N6-(丁-2-烯醯基)離胺酸。在一些情況下,非天然胺基酸係N6-((二環[2.2.1]庚-5-烯-2-基氧基)羰基)離胺酸。在一些情況下,非天然胺基酸係N6-((螺[2.3]己-1-烯-5-基甲氧基)羰基)離胺酸。在一些情況下,非天然胺基酸係N6-(((4-(1-(三氟甲基)環丙-2-烯-1-基)苄基)氧基)羰基)離胺酸。在一些情況下,非天然胺基酸係N6-((二環[2.2.1]庚-5-烯-2-基甲氧基)羰基)離胺酸。在一些情況下,非天然胺基酸係半胱胺醯基離胺酸。在一些情況下,非天然胺基酸係N6-((1-(6-硝基苯并[d][1,3]二氧雜環戊烯-5-基)乙氧基)羰基)離胺酸。在一些情況下,非天然胺基酸係N6-((2-(3-甲基-3H-二氮吮-3-基)乙氧基)羰基)離胺酸。在一些情況下,非天然胺基酸係N6-((3-(3-甲基-3H-二氮吮-3-基)丙氧基)羰基)離胺酸。在一些情況下,非天然胺基酸係N6-((間硝基苄基氧基)N6-甲基羰基)離胺酸。在一些情況下,非天然胺基酸係N6-((二環[6.1.0]壬-4-炔-9-基甲氧基)羰基)-離胺酸。在一些情況下,非天然胺基酸係N6-((環庚-3-烯-1-基氧基)羰基)-L-離胺酸。
在一些情況下,非天然胺基酸係2-胺基-3-(((((苄基氧基)羰基)胺基)甲基)硒烷基)丙酸。在一些實施例中,非天然胺基酸藉由再利用琥珀、蛋白石或赭石終止密碼子納入蛋白質中。在一些實施例中,非天然胺基酸藉由4-鹼基密碼子納入蛋白質中。在一些實施例中,非天然胺基酸藉由再利用罕見有義密碼子納入蛋白質中。
在一些實施例中,非天然胺基酸藉由包含非天然核苷酸之非天然密碼子納入蛋白質中。
在一些實施例中,蛋白質包含至少兩個非天然胺基酸。在一些實施例中,蛋白質包含至少三個非天然胺基酸。在一些實施例中,蛋白質包含至少兩個不同非天然胺基酸。在一些實施例中,蛋白質包含至少三個不同非天然胺基酸。至少一個非天然胺基酸係離胺酸類似物;包含芳香族側鏈;包含疊氮基;包含炔基;或包含醛或酮基。在一些實施例中,至少一個非天然胺基酸不包含芳香族側鏈。在一些實施例中,至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)或N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。在一些實施例中,至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)。在一些實施例中,至少一個非天然胺基酸包含N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。
在一些情況下,藉由正交之經修飾合成酶/ tRNA對介導非天然胺基酸向蛋白質中之納入。該等正交對包含天然或突變之合成酶,其能向非天然tRNA中加載特定非天然胺基酸,同時通常能使a)其他內源性胺基酸或替代非天然胺基酸向非天然tRNA上及b)任何其他(包括內源性) tRNA之加載最小化。該等正交對包含能由合成酶加載、同時避免內源性合成酶加載其他內源性胺基酸的tRNA。在一些實施例中,自各種生物體(例如細菌、酵母、古細菌或人類來源)鑑別該等對。在一些實施例中,正交合成酶/tRNA對包含來自單一生物體之組分。在一些實施例中,正交合成酶/tRNA對包含來自兩種不同生物體之組分。在一些實施例中,正交合成酶/tRNA對包含在修飾之前促進不同胺基酸轉譯之組分。在一些實施例中,正交合成酶係經修飾丙胺酸合成酶。在一些實施例中,正交合成酶係經修飾精胺酸合成酶。在一些實施例中,正交合成酶係經修飾天冬醯胺合成酶。在一些實施例中,正交合成酶係經修飾天冬胺酸合成酶。在一些實施例中,正交合成酶係經修飾半胱胺酸合成酶。在一些實施例中,正交合成酶係經修飾麩醯胺酸合成酶。在一些實施例中,正交合成酶係經修飾麩胺酸合成酶。在一些實施例中,正交合成酶係經修飾丙胺酸甘胺酸。在一些實施例中,正交合成酶係經修飾組胺酸合成酶。在一些實施例中,正交合成酶係經修飾白胺酸合成酶。在一些實施例中,正交合成酶係經修飾異白胺酸合成酶。在一些實施例中,正交合成酶係經修飾離胺酸合成酶。在一些實施例中,正交合成酶係經修飾甲硫胺酸合成酶。在一些實施例中,正交合成酶係經修飾苯丙胺酸合成酶。在一些實施例中,正交合成酶係經修飾脯胺酸合成酶。在一些實施例中,正交合成酶係經修飾絲胺酸合成酶。在一些實施例中,正交合成酶係經修飾蘇胺酸合成酶。在一些實施例中,正交合成酶係經修飾色胺酸合成酶。在一些實施例中,正交合成酶係經修飾酪胺酸合成酶。在一些實施例中,正交合成酶係經修飾纈胺酸合成酶。在一些實施例中,正交合成酶係經修飾磷絲胺酸合成酶。在一些實施例中,正交tRNA係經修飾丙胺酸tRNA。在一些實施例中,正交tRNA係經修飾精胺酸tRNA。在一些實施例中,正交tRNA係經修飾天冬醯胺tRNA。在一些實施例中,正交tRNA係經修飾天冬胺酸tRNA。在一些實施例中,正交tRNA係經修飾半胱胺酸tRNA。在一些實施例中,正交tRNA係經修飾麩醯胺酸tRNA。在一些實施例中,正交tRNA係經修飾麩胺酸tRNA。在一些實施例中,正交tRNA係經修飾丙胺酸甘胺酸。在一些實施例中,正交tRNA係經修飾組胺酸tRNA。在一些實施例中,正交tRNA係經修飾白胺酸tRNA。在一些實施例中,正交tRNA係經修飾異白胺酸tRNA。在一些實施例中,正交tRNA係經修飾離胺酸tRNA。在一些實施例中,正交tRNA係經修飾甲硫胺酸tRNA。在一些實施例中,正交tRNA係經修飾苯丙胺酸tRNA。在一些實施例中,正交tRNA係經修飾脯胺酸tRNA。在一些實施例中,正交tRNA係經修飾絲胺酸tRNA。在一些實施例中,正交tRNA係經修飾蘇胺酸tRNA。在一些實施例中,正交tRNA係經修飾色胺酸tRNA。在一些實施例中,正交tRNA係經修飾酪胺酸tRNA。在一些實施例中,正交tRNA係經修飾纈胺酸tRNA。在一些實施例中,正交tRNA係經修飾磷絲胺酸tRNA。在該等實施例中之任一者中,tRNA可為異源tRNA。
在一些實施例中,非天然胺基酸藉由胺基醯基(aaRS或RS)-tRNA合成酶-tRNA對納入蛋白質中。實例性aaRS-tRNA對包括(但不限於)詹氏甲烷球菌(Mj-Tyr ) aaRS/tRNA對、大腸桿菌TyrRS (Ec-Tyr )/嗜熱脂肪芽孢桿菌(B. stearothermophilus ) tRNACUA 對、大腸桿菌LeuRS (Ec-Leu )/嗜熱脂肪芽孢桿菌tRNACUA 對及吡咯離胺醯基-tRNA對。在一些情況下,非天然胺基酸藉由Mj-Tyr RS/tRNA對納入蛋白質中。可藉由Mj-Tyr RS/tRNA對納入之實例性非天然胺基酸(UAA)包括(但不限於)對位取代之苯丙胺酸衍生物,例如 - 胺基苯丙胺酸及 - 甲氧基苯丙胺酸;間位取代之酪胺酸衍生物,例如3-胺基酪胺酸、3-硝基酪胺酸、3,4-二羥基苯丙胺酸及3-碘酪胺酸;苯基硒基半胱胺酸; - 硼醯苯丙胺酸;及 -硝基苄基酪胺酸。
在一些情況下,非天然胺基酸藉由Ec-Tyr /tRNACUAEc-Leu /tRNACUA 對納入蛋白質中。可藉由Ec-Tyr /tRNACUAEc-Leu /tRNACUA 對納入之實例性UAA包括(但不限於)含有二苯甲酮、酮、碘化物或疊氮化物取代基之苯丙胺酸衍生物;O -炔丙基酪胺酸;α-胺基辛酸、O-甲基酪胺酸、O-硝基苄基半胱胺酸;及3-(萘-2-基胺基)-2-胺基-丙酸。
在一些情況下,非天然胺基酸藉由吡咯離胺醯基-tRNA對納入蛋白質中。在一些情形下,PylRS係自古細菌物種、例如自產甲烷古細菌獲得。在一些情形下,PylRS係自巴氏甲烷八疊球菌、馬氏甲烷八疊球菌或噬乙酸甲烷八疊球菌(Methanosarcina acetivorans )獲得。可藉由吡咯離胺醯基-tRNA對納入之實例性UAA包括(但不限於)醯胺及胺基甲酸酯取代之離胺酸,例如2-胺基-6-((R)-四氫呋喃-2-甲醯胺基)己酸、N -ε-D -脯胺醯基-L -離胺酸及N -ε-環戊基氧基羰基-L -離胺酸;N -ε-丙烯醯基-L -離胺酸;N -ε-[(1-(6-硝基苯并[d][1,3]二氧雜環戊烯-5-基)乙氧基)羰基]-L -離胺酸;及N -ε-(1-甲基環丙-2-烯甲醯胺基)離胺酸。
在一些情況下,非天然胺基酸藉由US 9,988,619及US 9,938,516中揭示之合成酶納入本文所述之蛋白質中,每一專利之揭示內容係以全文引用之方式併入本文中。可藉由該等合成酶納入之實例性UAA包括對-甲基疊氮基-L-苯丙胺酸、芳烷基、雜環基、雜芳烷基非天然胺基酸及其他。在一些實施例中,該等UAA包含吡啶基、吡嗪基、吡唑基、三唑基、噁唑基、噻唑基、噻吩基或其他雜環。在一些實施例中,該等胺基酸包含疊氮化物、四嗪或能夠結合至偶聯配偶體(例如水溶性部分)之其他化學基團。在一些實施例中,表現該等合成酶並用於在活體內將UAA納入蛋白質中。在一些實施例中,使用無細胞轉譯系統,使用該等合成酶以將UAA納入蛋白質中。
在一些情況下,非天然胺基酸藉由天然合成酶納入本文所述之蛋白質中。在一些實施例中,非天然胺基酸藉由一或多種胺基酸營養缺陷型生物體納入蛋白質中。在一些實施例中,對應於營養缺陷型胺基酸之合成酶能夠向相應tRNA中加載非天然胺基酸。在一些實施例中,非天然胺基酸係硒基半胱胺酸或其衍生物。在一些實施例中,非天然胺基酸係硒基甲硫胺酸或其衍生物。在一些實施例中,非天然胺基酸係芳香族胺基酸,其中芳香族胺基酸包含芳基鹵化物,例如碘化物。在實施例中,非天然胺基酸在結構上類似於營養缺陷型胺基酸。
在一些情況下,非天然胺基酸包含 8A 中圖解說明之非天然胺基酸。
在一些情況下,非天然胺基酸包含離胺酸或苯丙胺酸衍生物或類似物。在一些情況下,非天然胺基酸包含離胺酸衍生物或離胺酸類似物。在一些情況下,非天然胺基酸包含吡咯離胺酸(Pyl)。在一些情況下,非天然胺基酸包含苯丙胺酸衍生物或苯丙胺酸類似物。在一些情況下,非天然胺基酸係以下中所述之非天然胺基酸:Wan等人,「Pyrrolysyl-tRNA synthetase: an ordinary enzyme but an outstanding genetic code expansion tool,」 Biocheim Biophys Aceta 1844(6): 1059-4070 (2014)。在一些情況下,非天然胺基酸包含 8B 8C 中圖解說明之非天然胺基酸。
在一些實施例中,非天然胺基酸包含 8D - 8G (取自Dumas等人 Chemical Science 2015,6 , 50-69之表1)中圖解說明之非天然胺基酸。
在一些實施例中,納入本文所述蛋白質中之非天然胺基酸揭示於US 9,840,493;US 9,682,934;US 2017/0260137;US 9,938,516;或US 2018/0086734中;每一專利之揭示內容係以全文引用之方式併入本文中。可藉由該等合成酶納入之實例性UAA包括對-甲基疊氮基-L-苯丙胺酸、芳烷基、雜環基、及雜芳烷基及離胺酸衍生物非天然胺基酸。在一些實施例中,該等UAA包含吡啶基、吡嗪基、吡唑基、三唑基、噁唑基、噻唑基、噻吩基或其他雜環。在一些實施例中,該等胺基酸包含疊氮化物、四嗪或能夠結合至偶聯配偶體(例如水溶性部分)之其他化學基團。在一些實施例中,UAA包含經由烷基連接體連接至芳香族部分之疊氮化物。在一些實施例中,烷基連接體係C1 -C10 連接體。在一些實施例中,UAA包含經由烷基連接體連接至芳香族部分之四嗪。在一些實施例中,UAA包含經由胺基連接至芳香族部分之四嗪。在一些實施例中,UAA包含經由烷基胺基連接至芳香族部分之四嗪。在一些實施例中,UAA包含經由烷基鏈連接至胺基酸側鏈之末端氮(例如,離胺酸衍生物之N6、包含較短烷基側鏈之衍生物之或N5、N4或N3)的疊氮化物。在一些實施例中,UAA包含經由烷基鏈連接至胺基酸側鏈之末端氮的四嗪。在一些實施例中,UAA包含經由烷基連接體連接至醯胺之疊氮化物或四嗪。在一些實施例中,UAA係3-胺基丙胺酸、絲胺酸、離胺酸之含有疊氮化物或四嗪之胺基甲酸酯或醯胺或其衍生物。在一些實施例中,在活體內將該等UAA納入蛋白質中。在一些實施例中,在無細胞系統中將該等UAA納入蛋白質中。細胞類型
在一些實施例中,使用許多類型之細胞/微生物體,例如用於轉變或遺傳工程。在一些實施例中,細胞係原核或真核細胞。在一些實施例中,原核細胞係細菌細胞。在一些實施例中,真核細胞係真菌細胞或單細胞性原生動物。在一些實施例中,真菌細胞係酵母細胞。在其他情形下,真核細胞係培養之動物、植物或人類細胞。在額外情形下,真核細胞存在於生物體(例如植物、多細胞真菌或動物)中。
在一些實施例中,工程化微生物體係通常能夠分裂及增殖之單細胞生物。如本文所用,「工程化微生物體」係其遺傳物質已使用遺傳工程技術(即,重組DNA技術)改變之微生物。微生物可包括以下特徵中之一或多者:需氧菌、厭氧菌、絲狀菌、非絲狀菌、單倍體、二倍體、營養缺陷型及/或非營養缺陷型。在某些實施例中,工程化微生物體係原核微生物(例如,細菌),且在某些實施例中,工程化微生物體係非原核微生物,例如真核微生物。在一些實施例中,工程化微生物體係真核微生物體(例如,酵母、其他真菌、變形蟲)。在一些實施例中,工程化微生物體係真菌。在一些實施例中,工程化生物體係酵母。
可選擇任何適宜酵母作為宿主微生物體、工程化微生物體、遺傳修飾之生物體或異源或經修飾聚核苷酸之來源。酵母包括(但不限於)耶羅威亞酵母屬(Yarrowia)酵母(例如解脂耶羅威亞酵母(Y. lipolytica) (先前分類為解脂念珠菌(Candida lipolytica)))、念珠菌屬(Candida)酵母(例如拉考夫念珠菌(C. revkaufi)、維斯念珠菌(C. viswanathii)、鐵紅念珠菌(C. pulcherrima)、熱帶念珠菌(C. tropicalis)、產朊念珠菌(C. utilis))、紅酵母屬(Rhodotorula)酵母(例如黏紅酵母(R. glutinus)、禾本紅酵母(R. graminis))、紅冬孢酵母屬(Rhodosporidium)酵母(例如圓紅冬孢酵母(R. toruloides))、酵母屬(Saccharomyces)酵母(例如啤酒酵母(S. cerevisiae)、貝酵母(S. bayanus)、巴斯德酵母(S. pastorianus)、卡爾斯伯酵母(S. carlsbergensis))、隱球菌屬(Cryptococcus)酵母、毛孢子菌屬(Trichosporon)酵母(例如茁芽絲孢酵母(T. pullans)、皮狀絲孢酵母(T. cutaneum))、畢赤酵母(Pichia yeast) (例如巴斯德畢赤酵母(P. pastoris)、法夫駒形氏酵母(K. phaffii))及油脂酵母屬(Lipomyces)酵母(例如斯達油脂酵母(L. starkeyii)、產油油脂酵母(L. lipoferus))。在一些實施例中,適宜酵母屬以下屬:蛛網黴屬(Arachniotus)、麴菌屬(Aspergillus)、短梗黴屬(Aureobasidium)、Auxarthron屬、芽生菌屬(Blastomyces)、念珠菌屬、金小抱子屬(Chrysosporuim)、金孢子菌屬(Chrysosporium)、德巴利酵母屬(Debaryomyces)、球孢子菌屬(Coccidiodes)、隱球菌屬、裸子囊菌屬(Gymnoascus)、漢遜酵母屬(Hansenula)、組織胞漿菌屬(Histoplasma)、伊薩酵母屬(Issatchenkia)、克魯維酵母屬(Kluyveromyces)、油脂酵母屬、拉薩酵母屬(Lssatchenkia)、小孢子菌屬(Microsporum)、黏毛菌屬(Myxotrichum)、油脂酵母屬無性屬(Myxozyma)、樹粉孢屬(Oidiodendron)、管囊酵母屬(Pachysolen)、青黴菌屬(Penicillium)、畢赤酵母屬(Pichia)、紅冬孢酵母屬、紅酵母屬、酵母屬、裂殖酵母屬(Schizosaccharomyces)、帚黴屬(Scopulariopsis)、瘤孢屬(Sepedonium)、毛孢子菌屬(Trichosporon)或耶羅威亞酵母。在一些實施例中,適宜酵母係以下物種:黃褐蛛網黴(Arachniotus flavoluteus)、黃麴菌(Aspergillus flavus)、熏煙色麴菌(Aspergillus fumigatus)、黑麯黴(Aspergillus niger)、黑酵母菌(Aureobasidium pullulans)、黑粉菌(Auxarthron thaxteri)、皮炎芽生菌(Blastomyces dermatitidis)、白色念珠菌(Candida albicans)、都柏林念珠菌(Candida dubliniensis)、無名念珠菌(Candida famata)、光滑念珠菌(Candida glabrata)、季也蒙念珠菌(Candida guilliermondii)、假熱帶念珠菌(Candida kefyr)、克魯斯念珠菌(Candida krusei)、朗比克念珠菌(Candida lambica)、解脂念珠菌、葡萄牙念珠菌(Candida lustitaniae)、近平滑念珠菌(Candida parapsilosis)、鐵紅念珠菌、拉考夫念珠菌、皺褶念珠菌(Candida rugosa)、熱帶念珠菌、產朊念珠菌、維斯念珠菌、贊斯托念珠菌(Candida xestobii)、角質金小抱子菌(Chrysosporuim keratinophilum)、粗球孢子菌(Coccidiodes immitis)、白隱球菌流散變種(Cryptococcus albidus var. diffluens)、羅倫隱球菌(Cryptococcus laurentii)、新型隱球菌(Cryptococcus neofomans)、漢斯德巴利酵母菌(Debaryomyces hansenii)、達瓦斯裸子囊菌(Gymnoascus dugwayensis)、異常漢遜酵母(Hansenula anomala)、莢膜組織漿菌(Histoplasma capsulatum)、西方伊薩酵母(Issatchenkia occidentalis)、東方伊薩酵母(Isstachenkia orientalis)、乳酸克魯維酵母(Kluyveromyces lactis)、馬克斯克魯維酵母(Kluyveromyces marxianus)、耐熱克魯維酵母(Kluyveromyces thermotolerans)、瓦爾提克魯維酵母(Kluyveromyces waltii)、產油油脂酵母、斯達油脂酵母、石膏樣小孢子菌(Microsporum gypseum)、反折地衣內生菌(Myxotrichum deflexum)、棘枝粉孢(Oidiodendron echinulatum)、嗜鞣管囊酵母(Pachysolen tannophilis)、特異青黴(Penicillium notatum)、異常畢赤酵母(Pichia anomala)、巴斯德畢赤酵母(Pichia pastoris)、樹幹畢赤酵母菌(Pichia stipitis)、圓紅冬孢酵母、黏紅酵母(Rhodotorula glutinus)、禾本紅酵母(Rhodotorula graminis)、啤酒酵母(Saccharomyces cerevisiae)、克魯維酵母、粟酒裂殖酵母(Schizosaccharomyces pombe)、頂孢帚黴(Scopulariopsis acremonium)、黃瘤孢菌(Sepedonium chrysospermum)、皮狀毛孢子菌屬、茁芽絲孢酵母(Trichosporon pullans)、解脂耶羅威亞酵母(先前分類為解脂念珠菌)。在一些實施例中,酵母係解脂耶羅威亞酵母菌株,其包括(但不限於) ATCC20362、ATCC8862、ATCC18944、ATCC20228、ATCC76982及LGAM S(7)1菌株(Papanikolaou S.及Aggelis G., Bioresour. Technol. 82(1):43-9 (2002))。在某些實施例中,酵母係念珠菌屬(Candida species)(即,念珠菌屬(Candida spp.))酵母。任何適宜念珠菌屬可用於及/或遺傳修飾用於產生脂肪二羧酸(例如,辛二酸、癸二酸、十二烷二酸、十四烷二酸、十六烷二酸、十八烷二酸、二十烷二酸)。在一些實施例中,適宜念珠菌屬包括(但不限於)白色念珠菌、都柏林念珠菌、無名念珠菌、光滑念珠菌、季也蒙念珠菌、假熱帶念珠菌、克魯斯念珠菌、朗比克念珠菌、解脂念珠菌、葡萄牙念珠菌、近平滑念珠菌、鐵紅念珠菌、拉考夫念珠菌、皺褶念珠菌、熱帶念珠菌、產朊念珠菌、維斯念珠菌、贊斯托念珠菌及本文所述之任何其他念珠菌屬酵母。念珠菌屬菌株之非限制性實例包括(但不限於) sAA001 (ATCC20336)、sAA002 (ATCC20913)、sAA003 (ATCC20962)、sAA496 (US2012/0077252)、sAA106 (US2012/0077252)、SU-2 (ura3-/ura3-)、H5343 (β氧化阻斷;美國專利第5648247號)菌株。來自念珠菌屬酵母之任何適宜菌株可用作遺傳修飾之親代菌株。
酵母屬、種及菌株在遺傳內容上通常密切相關,以致其可能難以區分、分類及/或命名。在一些情形下,解脂念珠菌及解脂耶羅威亞酵母之菌株可能難以區分、分類及/或命名,且在一些情形下,可被認為係相同生物體。在一些情形下,各種熱帶念珠菌及維斯念珠菌菌株可能難以區分、分類及/或命名(例如參見Arie等人,J. Gen. Appl.Microbiol., 46, 257-262 (2000))。自ATCC以及其他商業或學術來源獲得之一些熱帶念珠菌及維斯念珠菌菌株可被視為等效且同樣適於本文所述實施例。在一些實施例中,熱帶念珠菌及維斯念珠菌之一些親代菌株被視為僅在名稱上有所不同。
可選擇任何適宜真菌作為宿主微生物體、工程化微生物體或異源聚核苷酸之來源。真菌之非限制性實例包括(但不限於)麴菌屬真菌(例如寄生麴菌(A. parasiticus)、小巢狀麴菌(A. nidulans))、破囊壺菌(Thraustochytrium)真菌、裂殖壺菌(Schizochytrium)真菌及根黴屬(Rhizopus)真菌(例如少根根黴(R. arrhizus)、米根黴(R. oryzae)、黑根黴(R. nigricans))。在一些實施例中,真菌係寄生麴菌菌株,其包括但不限於菌株ATCC24690,且在某些實施例中,真菌係小巢狀麴菌菌株,其包括但不限於菌株ATCC38163。
可選擇任何適宜原核生物作為宿主微生物體、工程化微生物體或異源聚核苷酸之來源。可選擇革蘭氏陰性或革蘭氏陽性細菌。細菌之實例包括(但不限於)芽孢桿菌屬(Bacillus)細菌(例如枯草芽孢桿菌(B. subtilis)、巨大芽孢桿菌(B. megaterium))、不動桿菌(Acinetobacter bacteria)、諾卡氏菌(Norcardia baceteria)、黃色桿菌(Xanthobacter bacteria)、大腸桿菌細菌(例如大腸桿菌(例如菌株DH10B、Stbl2、DH5-α、DB3、DB3.1)、DB4、DB5、JDP682及ccdA-over (例如美國申請案第09/518,188號)))、鏈黴菌屬(Streptomyces)細菌、伊文氏桿菌屬(Erwinia)細菌、克雷伯氏菌屬(Klebsiella)細菌、沙雷氏菌屬(Serratia)細菌(例如黏質沙雷氏菌(S. marcessans))、假單胞菌屬(Pseudomonas)細菌(例如銅綠假單胞菌(P. aeruginosa))、沙門氏菌屬(Salmonella)細菌(例如鼠傷寒沙門氏菌(S. typhimurium)、傷寒沙門氏菌(S. typhi))、巨球菌屬(Megasphaera)(例如丹尼巨球菌(Megasphaera denii))。細菌亦包括(但不限於)光合細菌(例如綠色非硫細菌(例如綠彎菌屬(Chroflexus)細菌(例如橙黃綠彎菌(C. aurantiacus))、綠線菌屬(Chloronema)細菌(例如巨大綠線菌(C. gigateum)))、綠色硫細菌(例如綠菌屬(Chlorobium) (例如泥生綠菌(C. limicola))、暗網菌屬(Pelodityon)細菌(例如微黃暗網菌(P. luteolum))、紫色硫細菌(例如著色菌屬(Chromatium)細菌(例如奧氏著色菌(C. okenii)))及紫色非硫細菌(例如紅螺菌屬(Rhodospirillum)細菌(例如紅紅螺菌(R. rubrum))、紅桿菌屬(Rhodobacter)細菌(例如球形紅桿菌(R. sphaeroides)、莢膜紅桿菌(R. capsulatus))及紅微菌屬(Rhodomicrobium)細菌(例如瓦尼氏紅微菌(R. vanellii)))。
來自非微生物生物體之細胞可用作宿主微生物體、工程化微生物體或異源聚核苷酸之來源。該等細胞之實例包括(但不限於)昆蟲細胞(例若蠅屬(Drosophila) (例如黑腹果蠅(D. melanogaster))、斜紋夜蛾屬(Spodoptera) (例如草地貪夜蛾(S. frugiperda) Sf9或Sf21細胞)及銀紋夜蛾屬(Trichoplusa) (例如High-Five細胞);線蟲細胞(例如隱桿線蟲(C. elegans)細胞);禽類細胞;兩棲動物細胞(例如光滑爪蟾(Xenopus laevis)細胞);爬蟲類動物細胞;哺乳動物細胞(例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、Bowes黑色素瘤及HeLa細胞);及植物細胞(例如擬南芥(Arabidopsis thaliana)、菸草(Nicotania tabacum)、腺泡葉萼距花(Cuphea acinifolia)、等大花瓣萼距花(Cuphea aequipetala)、狹葉萼距花(Cuphea angustifolia)、附蓋萼距花(Cuphea appendiculata)、阿維吉拉萼距花(Cuphea avigera)、阿維吉拉萼距花鐵紅變種(Cuphea avigera var. pulcherrima)、腋花萼距花(Cuphea axilliflora)、巴希萼距花(Cuphea bahiensis)、貝羅尼萼距花(Cuphea baillonis)、短柄萼距花(Cuphea brachypoda)、巴氏萼距花(Cuphea bustamanta)、囊距萼距花(Cuphea calcarata)、美葉萼距花(Cuphea calophylla)、美葉萼距花亞種美索萼距花(Cuphea calophylla subsp. mesostemon)、香膏萼距花(Cuphea carthagenensis)、露珠萼距花(Cuphea circaeoides)、密花萼距花(Cuphea confertiflora)、柯達他萼距花(Cuphea cordata)、厚瓣萼距花(Cuphea crassiflora)、藍萼距花(Cuphea cyanea)、十蕊萼距花(Cuphea decandra)、齒狀萼距花(Cuphea denticulata)、二籽萼距花(Cuphea disperma)、艾氏萼距花(Cuphea epilobiifolia)、長枝萼距花(Cuphea ericoides)、黃萼距花(Cuphea flava)、弗氏萼距花(Cuphea flavisetula)、紫斑葉萼距花(Cuphea fuchsiifolia)、高姆瑞萼距花(Cuphea gaumeri)、黏毛萼距花(Cuphea glutinosa)、異葉萼距花(Cuphea heterophylla)、虎克裡亞納萼距花(Cuphea hookeriana)、細葉萼距花(Cuphea hyssopifolia)(墨西哥石南(Mexican-heather))、尖果萼距花(Cuphea hyssopoides)、火紅萼距花(Cuphea ignea)、臭味萼距花(Cuphea ingrata)、約魯萼距花(Cuphea jorullensis)、杉木萼距花(Cuphea lanceolata)、長葉萼距花(Cuphea linarioides)、拉維亞萼距花(Cuphea llavea)、羅氏萼距花(Cuphea lophostoma)、黃萼距花(Cuphea lutea)、金色萼距花(Cuphea lutescens)、美麗萼距花(Cuphea melanium)、梅爾維亞萼距花(Cuphea melvilla)、小花萼距花(Cuphea micrantha)、小瓣萼距花(Cuphea micropetala)、米姆羅德萼距花(Cuphea mimuloides)、光葉萼距花(Cuphea nitidula)、沼澤萼距花(Cuphea palustris)、同心結萼距花(Cuphea parsonsia)、巴斯庫洛姆萼距花(Cuphea pascuorum)、寡瓣萼距花(Cuphea paucipetala)、樸氏萼距花(Cuphea procumbens)、假蠅子草萼距花(Cuphea pseudosilene)、假越橘萼距花(Cuphea pseudovaccinium)、美花萼距花(Cuphea pulchra)、紅花萼距花(Cuphea racemosa)、匍匐萼距花(Cuphea repens)、柳葉萼距花(Cuphea salicifolia)、薩爾瓦多萼距花(Cuphea salvadorensis)、斯庫瑪妮萼距花(Cuphea schumannii)、無梗萼距花(Cuphea sessiliflora)、無柄萼距花(Cuphea sessilifolia)、刺芒萼距花(Cuphea setosa)、奇麗萼距花(Cuphea spectabilis)、闊葉萼距花(Cuphea spermacoce)、華麗萼距花(Cuphea splendida)、華麗萼距花變種綠黃萼距花(Cuphea splendida var. viridiflava)、斯氏萼距花(Cuphea strigulosa)、薩氏萼距花(Cuphea subuligera)、特氏萼距花(Cuphea teleandra)、賽姆德萼距花(Cuphea thymoides)、托卡尼卡萼距花(Cuphea tolucana)、尖葉萼距花(Cuphea urens)、膨脹萼距花(Cuphea utriculosa)、藍葉柄萼距花(Cuphea viscosissima)、沃森萼距花(Cuphea watsoniana)、來提萼距花(Cuphea wrightii)、杉木萼距花(Cuphea lanceolata))。
用作宿主生物體或異源聚核苷酸來源之微生物體或細胞有市售。本文所述之微生物體及細胞及其他適宜微生物體及細胞可獲自例如Invitrogen Corporation (Carlsbad, CA)、American Type Culture Collection (Manassas, Virginia)及Agricultural Research Culture Collection (NRRL;Peoria, Illinois)。宿主微生物體及工程化微生物體可以任何適宜形式提供。舉例而言,該等微生物體可在液體培養物或固體培養物(例如,基於瓊脂之培養基)中提供,其可為原代培養物或可已經傳代(例如,稀釋及培養)一或多次。微生物體亦可以冷凍形式或乾燥形式(例如凍乾)提供。微生物體可以任何適宜濃度提供。聚合酶
聚合酶之特別有用之功能係使用現有核酸作為模板催化核酸鏈之聚合。其他有用之功能在本文別處闡述。有用聚合酶之實例包括DNA聚合酶及RNA聚合酶。
在多種情況下,例如期望納入非天然核酸之情況下,包括擴增、測序、標記、檢測、選殖及許多其他情況下,高度期望改良聚合酶非天然核酸之特異性、持續合成能力或其他特徵之能力。
在一些情況下,本文揭示包括例如在DNA擴增期間將非天然核酸納入生長模板拷貝中之聚合酶。在一些實施例中,可修飾聚合酶,使得聚合酶之活性位點經修飾以減少非天然核酸進入活性位點之空間進入抑制。在一些實施例中,聚合酶可經修飾以與非天然核酸之一或多個非天然特徵之互補。該等聚合酶可在細胞中表現或工程化以將UBP穩定納入細胞中。因此,本發明包括包含異源或重組聚合酶之組合物及其使用方法。
聚合酶可使用與蛋白質工程化相關之方法進行修飾。舉例而言,可基於晶體結構實施分子建模以鑑別可進行突變以修飾靶活性之聚合酶的位置。鑑別為置換之靶標之殘基可用使用能量最小化建模、同源性建模及/或保守胺基酸取代選擇之殘基置換,例如以下中所述:Bordo等人 J Mol Biol 217: 721-729 (1991)及Hayes等人 Proc Natl Acad Sci, USA 99: 15926- 15931 (2002),每一參考文獻之揭示內容係以全文引用之方式併入本文中。
多種聚合酶中之任一者可用於本文所述之方法或組合物中,包括例如分離自生物系統之基於蛋白質之酶及其功能變體。除非另有說明,否則提及特定聚合酶(例如下文所例示之彼等)時將理解為包括其功能變體。在一些實施例中,聚合酶係野生型聚合酶。在一些實施例中,聚合酶係經修飾或突變之聚合酶。在一些實施例中,聚合酶可為異源聚合酶。
亦可使用具有改良非天然核酸進入活性位點區中及與活性位點區中之非天然核苷酸配位之特徵的聚合酶。在一些實施例中,經修飾聚合酶具有經修飾核苷酸結合位點。
在一些實施例中,經修飾聚合酶對非天然核酸之特異性為野生型聚合酶對非天然核酸之特異性的至少約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、97%、98%、99%、99.5%或99.99%。在一些實施例中,經修飾或野生型聚合酶對包含經修飾糖之非天然核酸之特異性為野生型聚合酶對天然核酸及/或無經修飾糖之非天然核酸之特異性的至少約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、97%、98%、99%、99.5%或99.99%。在一些實施例中,經修飾或野生型聚合酶對包含經修飾鹼基之非天然核酸之特異性為野生型聚合酶對天然核酸及/或無經修飾鹼基之非天然核酸之特異性的至少約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、97%、98%、99%、99.5%或99.99%。在一些實施例中,經修飾或野生型聚合酶對包含三磷酸之非天然核酸之特異性為野生型聚合酶對包含三磷酸之核酸及/或無三磷酸之非天然核酸之特異性的至少約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、97%、98%、99%、99.5%或99.99%。舉例而言,經修飾或野生型聚合酶對包含三磷酸酯之非天然核酸之特異性可為野生型聚合酶對具有二磷酸或單磷酸或無磷酸或其組合之非天然核酸之特異性的至少約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、97%、98%、99%、99.5%或99.99%。
在一些實施例中,經修飾或野生型聚合酶對非天然核酸具有寬鬆特異性。在一些實施例中,經修飾或野生型聚合酶對非天然核酸之特異性及對天然核酸之特異性為野生型聚合酶對天然核酸之特異性的至少約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、97%、98%、99%、99.5%或99.99%。在一些實施例中,經修飾或野生型聚合酶對包含經修飾糖之非天然核酸之特異性及對天然核酸之特異性為野生型聚合酶對天然核酸之特異性的至少約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、97%、98%、99%、99.5%或99.99%。在一些實施例中,經修飾或野生型聚合酶對包含經修飾鹼基之非天然核酸之特異性及對天然核酸之特異性為野生型聚合酶對天然核酸之特異性的至少約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、97%、98%、99%、99.5%或99.99%。
核酸外切酶活性之缺失可為野生型特徵或由變體或工程化聚合酶賦予之特徵。舉例而言,exo減Klenow片段係Klenow片段之突變形式,其缺乏3’至5’校正外核酸酶活性。
本發明之方法可用於擴展任何缺乏固有3至5'外核酸酶校正活性或其中3至5'外核酸酶校正活性已經例如經由突變而喪失之DNA聚合酶的受質範圍。DNA聚合酶之實例包括polA、polB (例如,參見Parrel及Loeb, Nature Struc Biol 2001) polC、polD、polY、polX及反轉錄酶(RT),但較佳係進行性高保真度聚合酶(PCT/GB2004/004643)。在一些實施例中,經修飾或野生型聚合酶實質上缺乏3’至5’校正外核酸酶活性。在一些實施例中,經修飾或野生型聚合酶實質上缺乏非天然核酸之3’至5’校正外核酸酶活性。在一些實施例中,經修飾或野生型聚合酶具有3’至5’校正外核酸酶活性。在一些實施例中,經修飾或野生型聚合酶具有天然核酸之3’至5’校正外核酸酶活性且實質上缺乏非天然核酸之3’至5’校正外核酸酶活性。
在一些實施例中,經修飾聚合酶之3’至5’校正外核酸酶活性為野生型聚合酶之校正外核酸酶活性的至少約60%、70%、80%、90%、95%、97%、98%、99%、99.5%或99.99%。在一些實施例中,經修飾聚合酶針對非天然核酸之3’至5’校正外核酸酶活性為野生型聚合酶對天然核酸之校正外核酸酶活性的至少約60%、70%、80%、90%、95%、97%、98%、99%、99.5%、99.99%。在一些實施例中,經修飾聚合酶針對非天然核酸之3’至5’校正外核酸酶活性及針對天然核酸之3’至5’校正外核酸酶活性為野生型聚合酶對天然核酸之校正外核酸酶活性的至少約60%、70%、80%、90%、95%、97%、98%、99%、99.5%或99.99%。在一些實施例中,經修飾聚合酶針對天然核酸之3’至5’校正外核酸酶活性為野生型聚合酶對天然核酸之校正外核酸酶活性的至少約60%、70%、80%、90%、95%、97%、98%、99%、99.5%或99.99%。
在一些實施例中,聚合酶根據其自核酸之解離速率來表徵。在一些實施例中,聚合酶對一或多種天然及非天然核酸具有相對低之解離速率。在一些實施例中,聚合酶對一或多種天然及非天然核酸具有相對高之解離速率。解離速率係聚合酶之活性,其可經調整以調節本文所述方法中之反應速率。
在一些實施例中,聚合酶根據其與特定天然及/或非天然核酸或天然及/或非天然核酸之集合一起使用時之保真度來表徵。保真度通常係指聚合酶在製備核酸模板之拷貝時將正確之核酸納入生長核酸鏈中之準確度。當天然及非天然核酸以例如相等濃度存在以競爭聚合酶-股-模板核酸二元複合物中相同位點之股合成時,DNA聚合酶保真度可量測為正確與不正確天然及非天然核酸納入之比率。DNA聚合酶保真度可計算為天然及非天然核酸之(kcat /Km )與不正確天然及非天然核酸之(kcat /Km )之比;其中kcat 及Km 係穩態酶動力學中之Michaelis-Menten參數(Fersht, A. R. (1985) Enzyme Structure and Mechanism, 第2版, 第350頁, W. H. Freeman & Co., New York.,以引用方式併入本文中)。在一些實施例中,聚合酶具有至少約100、1000、10,000、100,000或1×106 之保真度值,具有或無校正活性。
在一些實施例中,使用檢測具有特定結構之非天然核酸之納入之分析來篩選來自天然來源或其變體之聚合酶。在一個實例中,可篩選聚合酶納入非天然核酸或UBP之能力;例如d5SICSTP、dCNMOTP、dTPT3TP、dNaMTP、dCNMOTP-dTPT3TP、或d5SICSTP- dNaMTP UBP。可使用聚合酶,例如異源聚合酶,其與野生型聚合酶相比顯示非天然核酸之經修飾性質。舉例而言,經修飾性質可為(例如) Km 、kcat 、Vmax 、在非天然核酸(或天然核苷酸)存在下之聚合酶持續合成能力、在非天然核酸存在下聚合酶之平均模板讀取長度、聚合酶對非天然核酸之特異性、非天然核酸之結合速率、產物(焦磷酸酯、三磷酸酯等)釋放速率、分支速率或其任何組合。在一個實施例中,經修飾性質係非天然核酸之降低Km 及/或非天然核酸之增加之kcat /Km 或Vmax /Km 。類似地,與野生型聚合酶相比,聚合酶視情況具有增加之非天然核酸結合速率、增加之產物釋放速率及/或降低之分支速率。
同時,聚合酶可將天然核酸(例如A、C、G及T)納入生長之核酸拷貝中。舉例而言,聚合酶視情況展示之對天然核酸之比活性為相應野生型聚合酶的至少約5% (例如,5%、10%、25%、50%、75%、100%或更高),以及在模板存在下與天然核酸之持續合成能力為在天然核酸存在下之野生型聚合酶的至少5% (例如5%、10%、25%、50%、75%、100%或更高)。視情況,聚合酶展示之對天然核苷酸之kcat /Km 或Vmax /Km 為野生型聚合酶的至少約5% (例如,約5%、10%、25%、50%、75%或100%或更高)。
本文所用之可具有納入特定結構之非天然核酸之能力的聚合酶亦可使用定向進化方法產生。核酸合成分析可用於篩選對多種非天然核酸中之任一者具有特異性之聚合酶變體。舉例而言,可篩選聚合酶變體納入DNA模板中與非天然核苷酸相對之非天然核苷三磷酸的能力;例如,與dCNMO相對之dTPT3TP、與dTPT3相對之dCNMOTP、與dTPT3相對之NaMTP、或與dCNMO或dNaM相對之TAT1TP。在一些實施例中,該分析係例如使用重組聚合酶變體之活體外分析。在一些實施例中,該分析係例如在細胞中表現聚合酶變體之活體內分析。該等定向進化技術可用於篩選任何適宜聚合酶之變體對本文所述任何非天然核酸之活性。在一些情況下,本文所用之聚合酶具有將非天然核糖核苷酸納入核酸(例如RNA)中之能力。舉例而言,NaM或TAT1核糖核苷酸可使用本文所述之聚合酶納入核酸中。
所述組合物之經修飾聚合酶可視情況為經修飾及/或重組Φ29型DNA聚合酶。視情況,聚合酶可為經修飾及/或重組Φ29、B103、GA-1、PZA、Φ15、BS32、M2Y、Nf、G1、Cp-1、PRD1、PZE、SF5、Cp-5、Cp-7、PR4、PR5、PR722或L17聚合酶。
所述組合物之經修飾聚合酶可視情況為經修飾及/或重組原核DNA聚合酶,例如DNA聚合酶II (Pol II)、DNA聚合酶III (Pol III)、DNA聚合酶IV (Pol IV)、DNA聚合酶V (Pol V)。在一些實施例中,經修飾聚合酶包含介導跨非指導之受損核苷酸之DNA合成的聚合酶。在一些實施例中,編碼Pol I、Pol II (polB )、Poll IV (dinB )及/或Pol V (umuCD )之基因在工程化細胞或SSO中組成型表現或過表現。在一些實施例中,Pol II表現或過表現之增加有助於增加非天然鹼基對(UBP)在工程化細胞或SSO中之保留率。
通常可用於本發明之核酸聚合酶包括DNA聚合酶、RNA聚合酶、反轉錄酶及其之突變或改變之形式。DNA聚合酶及其性質尤其詳細闡述於DNA Replication 第2版, Kornberg及Baker, W. H. Freeman, New York, N. Y. (1991)中。可用於本發明之已知習用DNA聚合酶包括(但不限於)激烈火球菌(Pyrococcus furiosus) (Pfu) DNA聚合酶(Lundberg等人,1991, Gene, 108: 1, Stratagene)、沃氏火球菌(Pyrococcus woesei) (Pwo) DNA聚合酶(Hinnisdaels等人,1996, Biotechniques, 20:186-8, Boehringer Mannheim)、嗜熱棲熱菌(Thermus thermophilus) (Tth) DNA聚合酶(Myers及Gelfand 1991, Biochemistry 30:7661)、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus) DNA聚合酶(Stenesh及McGowan, 1977, Biochim Biophys Acta 475:32)、海濱嗜熱球菌(Thermococcus litoralis) (TIi) DNA聚合酶(亦稱為Vent™ DNA聚合酶,Cariello等人,1991, Polynucleotides Res, 19: 4193, New England Biolabs)、9°Nm™ DNA聚合酶(New England Biolabs)、Stoffel片段、Thermo Sequenase® (Amersham Pharmacia Biotech UK)、Therminator™ (New England Biolabs)、喜溫海洋桿菌(Thermotoga maritima) (Tma) DNA聚合酶(Diaz及Sabino, 1998 Braz J Med. Res, 31 :1239)、水生棲熱菌(Thermus aquaticus) (Taq) DNA聚合酶(Chien等人,1976, J. Bacteoriol, 127: 1550)、DNA聚合酶、幸田氏熱球菌(Pyrococcus kodakaraensis) KOD DNA聚合酶(Takagi等人,1997, Appl. Environ. Microbiol. 63:4504)、JDF-3 DNA聚合酶(來自熱球菌屬(thermococcus sp.) JDF-3,專利申請案WO 0132887)、焦球菌屬(Pyrococcus) GB-D (PGB-D) DNA聚合酶(亦稱作Deep Vent™ DNA聚合酶, Juncosa-Ginesta等人,1994, Biotechniques, 16:820, New England Biolabs)、UlTma DNA聚合酶(來自適溫性喜溫海洋桿菌;Diaz及Sabino, 1998 Braz J. Med. Res, 31 :1239;PE Applied Biosystems)、Tgo DNA聚合酶(來自蛇發女怪熱球菌(thermococcus gorgonarius), Roche Molecular Biochemicals)、大腸桿菌DNA聚合酶I (Lecomte及Doubleday, 1983, Polynucleotides Res. 11 :7505)、T7 DNA聚合酶(Nordstrom等人,1981, J Biol. Chem. 256:3112)及古細菌DP1I/DP2 DNA聚合酶II (Cann等人,1998, Proc. Natl. Acad. Sci. USA 95:14250)。涵蓋嗜溫聚合酶及嗜熱聚合酶二者。嗜熱DNA聚合酶包括(但不限於) ThermoSequenase® 、9°Nm™、Therminator™、Taq、Tne、Tma、Pfu、TfI、Tth、TIi、Stoffel片段、Vent™及Deep Vent™ DNA聚合酶、KOD DNA聚合酶、Tgo、JDF-3及其突變體、變體及衍生物。亦涵蓋為3 ‘外核酸酶缺乏突變體之聚合酶。可用於本發明中之反轉錄酶包括(但不限於)來自HIV、HTLV-I、HTLV-II、FeLV、FIV、SIV、AMV、MMTV、MoΜLV及其他反轉錄病毒之反轉錄酶(參見Levin, Cell 88:5-8 (1997);Verma, Biochim Biophys Acta. 473:1-38 (1977);Wu等人,CRC Crit Rev Biochem. 3:289- 347(1975))。聚合酶之其他實例包括(但不限於) 9°N DNA聚合酶、Taq DNA聚合酶、Phusion® DNA聚合酶、Pfu DNA聚合酶、RB69 DNA聚合酶、KOD DNA聚合酶及VentR® DNA聚合酶,Gardner等人 (2004) 「Comparative Kinetics of Nucleotide Analog Incorporation by Vent DNA Polymerase」 (J. Biol. Chem., 279(12), 11834-11842;Gardner及Jack 「Determinants of nucleotide sugar recognition in an archaeon DNA polymerase」 Nucleic Acids Research, 27(12) 2545-2553。) 分離自非嗜熱生物體之聚合酶可為熱不活化的。實例係來自噬菌體之DNA聚合酶。應理解,可修飾來自多種來源中之任一者之聚合酶以增加或降低其對高溫條件之耐受性。在一些實施例中,聚合酶可為嗜熱的。在一些實施例中,嗜熱聚合酶可為熱不活化的。嗜熱聚合酶通常可用於高溫條件或熱循環條件,例如用於聚合酶鏈式反應(PCR)技術之彼等。
在一些實施例中,聚合酶包含Φ29、B103、GA-1、PZA、Φ15、BS32、M2Y、Nf、G1、Cp-1、PRD1、PZE、SF5、Cp-5、Cp-7、PR4、PR5、PR722、L17、ThermoSequenase®、9°Nm™、Therminator™ DNA聚合酶、Tne、Tma、TfI、Tth、TIi、Stoffel片段、Vent™及Deep Vent™ DNA聚合酶、KOD DNA聚合酶、Tgo、JDF-3、Pfu、Taq、T7 DNA聚合酶、T7 RNA聚合酶、PGB-D、UlTma DNA聚合酶、大腸桿菌DNA聚合酶I、大腸桿菌DNA聚合酶III、古細菌DP1I/DP2 DNA聚合酶II、9°N DNA聚合酶、Taq DNA聚合酶、Phusion® DNA聚合酶、Pfu DNA聚合酶、SP6 RNA聚合酶、RB69 DNA聚合酶、禽類成髓細胞瘤病毒(AMV)反轉錄酶、莫洛尼鼠類白血病病毒(Moloney Murine Leukemia Virus,MMLV)反轉錄酶、SuperScript® II反轉錄酶或SuperScript® III反轉錄酶。
在一些實施例中,聚合酶係DNA聚合酶I (或Klenow片段)、Vent聚合酶、Phusion® DNA聚合酶、KOD DNA聚合酶、Taq聚合酶、T7 DNA聚合酶、T7 RNA聚合酶、Therminator™ DNA聚合酶、POLB聚合酶、SP6 RNA聚合酶、大腸桿菌DNA聚合酶I、大腸桿菌DNA聚合酶III、禽類成髓細胞瘤病毒(AMV)反轉錄酶、莫洛尼鼠類白血病病毒(MMLV)反轉錄酶、SuperScript® II反轉錄酶或SuperScript® III反轉錄酶。核苷酸轉運蛋白
核苷酸轉運蛋白(NT)係一組膜轉運蛋白,其促進核苷酸受質跨細胞膜及囊泡之轉移。在一些實施例中,存在兩種類型之NT,即濃縮核苷轉運蛋白及平衡核苷轉運蛋白。在一些情況下,NT亦涵蓋有機陰離子轉運蛋白及有機陽離子轉運蛋白(OCT)。在一些情況下,核苷酸轉運蛋白係核苷三磷酸轉運蛋白(NTT)。
在一些實施例中,核苷三磷酸轉運蛋白(NTT)係來自細菌、植物或藻類。在一些實施例中,核苷酸核苷三磷酸轉運蛋白係TpNTT1、TpNTT2、TpNTT3、TpNTT4、TpNTT5、TpNTT6、TpNTT7、TpNTT8 (假微型海鏈藻(T. pseudonana ))、PtNTT1、PtNTT2、PtNTT3、PtNTT4、PtNTT5、PtNTT6 (三角褐指藻(P. tricornutum )) GsNTT (溫泉紅藻(Galdieria sulphuraria ))、AtNTT1、AtNTT2 (擬南芥)、CtNTT1、CtNTT2 (沙眼衣原體(Chlamydia trachomatis ))、PamNTT1、PamNTT2 (阿米巴副衣原體(Protochlamydia amoebophila ))、CcNTT (卡氏凱迪菌(Caedibacter caryophilus ))、或RpNTT1 (普氏立克次氏體(Rickettsia prowazekii ))。
在一些實施例中,NTT係CNT1、CNT2、CNT3、ENT1、ENT2、OAT1、OAT3或OCT1。
在一些實施例中,NTT將非天然核酸輸入生物體(例如細胞)中。在一些實施例中,NTT可經修飾,使得NTT之核苷酸結合位點經修飾,以減少非天然核酸進入核苷酸結合位點之空間進入抑制。在一些實施例中,NTT可經修飾以提供與非天然核酸之一或多種天然或非天然特徵之增加之相互作用。該等NTT可在細胞中表現或工程化以將UBP穩定輸入細胞中。因此,本發明包括包含異源或重組NTT之組合物及其使用方法。
NTT可用與蛋白質工程化有關之方法修飾。舉例而言,可基於晶體結構實施分子建模以鑑別可進行突變以修飾靶活性或結合位點之NTT的位置。鑑別為置換之靶標之殘基可用使用能量最小化建模、同源性建模及/或保守胺基酸取代選擇之殘基置換,例如以下中所述:Bordo等人 J Mol Biol 217: 721-729 (1991)及Hayes等人 Proc Natl Acad Sci, USA 99: 15926- 15931 (2002),每一參考文獻之揭示內容係以全文引用之方式併入本文中。
多種NTT中之任一者可用於本文所述之方法或組合物中,包括例如分離自生物系統之基於蛋白質之酶及其功能變體。除非另有說明,否則提及特定NTT(例如下文所例示之彼等)時將理解為包括其功能變體。在一些實施例中,NTT係野生型NTT。在一些實施例中,NTT係經修飾或突變NTT。
亦可使用具有改良非天然核酸進入細胞中及與核苷酸結合區中之非天然核苷酸配位之特徵的NTT。在一些實施例中,經修飾NTT具有經修飾核苷酸結合位點。在一些實施例中,經修飾或野生型NTT對非天然核酸具有寬鬆特異性。舉例而言,NTT視情況展示之對非天然核苷酸之比輸入活性為相應野生型NTT的至少約0.1% (例如,約0.1%、0.2%、0.5%、0.8%、1%、1.1%、1.2%、1.5%、1.8%、2%、3%、4%、5%、10%、25%、50%、75%、100%或更高)。視情況,NTT展示之對非天然核苷酸的kcat /Km 或Vmax /Km 為野生型NTT的至少約0.1% (例如,約0.1%、0.2%、0.5%、0.8%、1%、1.1%、1.2%、1.5%、1.8%、2%、3%、4%、5%、10%、25%、50%、75%或100%或更高)。
NTT可根據其對三磷酸之親和性(即Km)及/或輸入速率(即Vmax)來表徵。在一些實施例中,NTT對一或多種天然及非天然三磷酸具有相對高之Km或Vmax。
天然來源之NTT或其變體可使用檢測三磷酸之量之分析(若三磷酸經適當標記,則使用質譜或放射性)來篩選。在一實例中,可針對輸入非天然三磷酸之能力篩選NTT;例如,dTPT3TP、dCNMOTP、d5SICSTP、dNaMTP、NaMTP及/或TPT1TP。可使用NTT,例如異源NTT,其與野生型NTT相比展示非天然核酸之經修飾性質。舉例而言,經修飾性質可為例如對於三磷酸酯輸入之Km 、kcat 、Vmax 。在一個實施例中,經修飾性質係非天然三磷酸之降低Km 及/或非天然三磷酸之增加kcat /Km 或Vmax /Km 。類似地,與野生型NTT相比,NTT視情況具有增加之非天然三磷酸結合速率、增加之細胞內釋放速率及/或增加之細胞輸入速率。
同時,NTT可將天然三磷酸(例如dATP、dCTP、dGTP、dTTP、ATP、CTP、GTP及/或TTP)輸入細胞中。在一些情況下,NTT視情況展示對能夠支持複製及轉錄之天然核酸之特異性輸入活性。在一些實施例中,NTT視情況展示對能夠支持複製及轉錄之天然核酸之kcat /Km 或Vmax /Km
本文所用之可具有輸入特定結構之非天然三磷酸之能力的NTT亦可使用定向進化方法產生。核酸合成分析可用於篩選對多種非天然三磷酸中之任一者具有特異性之NTT變體。舉例而言,可針對輸入非天然三磷酸之能力篩選NTT變體;例如d5SICSTP、dNaMTP、dCNMOTP、dTPT3TP、NaMTP及/或TPT1TP。在一些實施例中,該分析係例如使用重組NTT變體之活體外分析。在一些實施例中,該分析係例如在細胞中表現NTT變體之活體內分析。該等技術可用於篩選任何適宜NTT之變體對本文所述任何非天然三磷酸之活性。核酸試劑及工具
用於本文所述之方法、細胞或工程化微生物體之核苷酸及/或核酸試劑(或聚核苷酸)包含一或多個具有或不具有非天然核苷酸之ORF。ORF可來自任何適宜來源,有時來自基因體DNA、mRNA、反轉錄之RNA或互補DNA (cDNA)或包含上述中之一或多者之核酸庫,且來自含有所關注核酸序列、所關注蛋白質或所關注活性的任何生物體物種。可自其獲得ORF之生物體之非限制性實例包括(例如)細菌、酵母、真菌、人類、昆蟲、線蟲、牛、馬、犬、貓、大鼠或小鼠。在一些實施例中,核苷酸及/或核酸試劑或本文所述之其他試劑經分離或純化。可經由公開之活體外方法產生包括非天然核苷酸之ORF。在一些情形下,核苷酸或核酸試劑包含非天然核鹼基。
核酸試劑有時包含與ORF毗鄰之核苷酸序列,其連同ORF經轉譯並編碼胺基酸標籤。編碼標籤之核苷酸序列位於核酸試劑中ORF之3’及/或5’,從而在ORF編碼之蛋白質或肽之C末端或N末端編碼標籤。可利用任何不消除活體外轉錄及/或轉譯之標籤,且可由技術人員適當地選擇。標籤可促進自培養物或發酵培養基分離及/或純化期望ORF產物。在一些情況下,核酸試劑庫與本文所述之方法及組合物一起使用。舉例而言,至少100、1000、2000、5000、10,000或50,000個以上獨特聚核苷酸之庫存在於庫中,其中每一聚核苷酸包含至少一個非天然核鹼基。
具有或無非天然核苷酸之核酸或核酸試劑可包含某些元件,例如調節元件,其通常根據核酸之預期用途進行選擇。核酸試劑中可包括或排除以下元件中之任一者。核酸試劑(例如)可包括一或多個或所有以下核苷酸元件:一或多個啟動子元件、一或多個5’非轉譯區(5’UTR)、一或多個可插入靶核苷酸序列之區(「插入元件」)、一或多個靶核苷酸序列、一或多個3’非轉譯區(3’UTR)及一或多個選擇元件。核酸試劑可提供有一或多個該等元件,且可在將核酸引入期望生物體之前將其他元件插入核酸中。在一些實施例中,提供之核酸試劑包含啟動子、5’UTR、可選3’UTR及插入元件,藉由該(等)插入元件,將靶核苷酸序列插入(即,選殖)至核苷酸試劑中。在某些實施例中,提供之核酸試劑包含啟動子、插入元件及可選3’UTR及5’ UTR/靶核苷酸序列與可選3’UTR一起插入。元件可以適於在所選表現系統中表現(例如,在所選生物體中表現、或在無細胞系統中表現)之任何順序佈置,且在一些實施例中,核酸試劑在5’至3’方向上包含以下元件:(1)啟動子元件、5’UTR及插入元件;(2)啟動子元件、5’UTR及靶核苷酸序列;(3)啟動子元件、5’UTR、插入元件及3’UTR;及(4)啟動子元件、5’UTR、靶核苷酸序列及3’UTR。在一些實施例中,可最佳化UTR以改變或增加完全天然或含有非天然核苷酸之ORF之轉錄或轉譯。
核酸試劑(例如表現盒及/或表現載體)可包括多種調節元件,包括啟動子、增強子、轉譯起始序列、轉錄終止序列及其他元件。「啟動子」通常係當相對於轉錄起始位點在相對固定位置時起作用之一或多個DNA序列。舉例而言,啟動子可在核苷酸三磷酸轉運蛋白核酸區段之上游。「啟動子」含有RNA聚合酶及轉錄因子之基本相互作用所需之核心元件,且可含有上游元件及反應元件。「增強子」通常係指在距轉錄起始位點不固定距離作用之DNA序列,且可在轉錄單元之5’或3’。此外,增強子可在內含子內以及在編碼序列本身內。其之長度通常在10及300之間,且其以順式起作用。增強子用於增加自附近啟動子之轉錄。與啟動子一樣,增強子亦經常含有介導轉錄之調控之反應元件。增強子經常決定表現之調控,且可用於改變或最佳化ORF表現,包括完全天然或含有非天然核苷酸之ORF。
如上所述,核酸試劑亦可包含一或多個5’ UTR及一或多個3’UTR。舉例而言,用於真核宿主細胞(例如酵母、真菌、昆蟲、植物、動物、人類或有核細胞)及原核宿主細胞(例如病毒、細菌)之表現載體可含有能發出可影響mRNA表現之終止轉錄信號之序列。該等區可轉錄為編碼組織因子蛋白之mRNA之非轉譯部分中的多腺苷酸化區段。3’非轉譯區亦包括轉錄終止位點。在一些較佳實施例中,轉錄單元包含多聚腺苷酸化區。此區之一個益處係其增加轉錄單元像mRNA一樣經處理及轉運之可能性。已充分建立在表現構築體中鑑別及使用多腺苷酸化信號。在一些較佳實施例中,同源多腺苷酸化信號可用於轉基因構築體中。
5’ UTR可包含一或多個其來源之核苷酸序列之內源元件,且有時包括一或多個外源元件。5’ UTR可源自任何適宜核酸,例如基因體DNA、質體DNA、RNA或mRNA,例如源自任何適宜生物體(例如病毒、細菌、酵母、真菌、植物、昆蟲或哺乳動物)。技術人員可基於所選表現系統(例如,在所選生物體中之表現或在無細胞系統中之表現)選擇5’ UTR之適當元件。5’ UTR有時包含技術人員已知之以下元件中之一或多者:增強子序列(例如轉錄或轉譯)、轉錄起始位點、轉錄因子結合位點、轉譯調控位點、轉譯起始位點、轉譯因子結合位點、輔助蛋白結合位點、反饋調控劑結合位點、Pribnow盒、TATA盒、-35元件、E盒(螺旋-環-螺旋結合元件)、核糖體結合位點、複製子、內部核糖體進入位點(IRES)、沉默子元件及諸如此類。在一些實施例中,啟動子元件可經分離,使得適當條件調控所必需之所有5’ UTR元件皆包含在啟動子元件片段中,或者包含在啟動子元件片段之功能子序列中。
核酸試劑中之5 ‘UTR可包含轉譯增強子核苷酸序列。轉譯增強子核苷酸序列經常位於核酸試劑中之啟動子與靶核苷酸序列之間。轉譯增強子序列經常與核糖體結合,有時係18S rRNA結合之核糖核苷酸序列(即40S核糖體結合序列),且有時係內部核糖體進入序列(IRES)。IRES通常形成具有精確定位之RNA三級結構之RNA支架,其經由許多特異性分子間相互作用接觸40S核糖體亞基。核糖體增強子序列之實例係已知之的,且可由技術人員鑑別(例如,Mignone等人, Nucleic Acids Research 33: D141-D146 (2005);Paulous等人, Nucleic Acids Research 31: 722-733 (2003);Akbergenov等人, Nucleic Acids Research 32: 239-247 (2004);Mignone等人, Genome Biology 3(3): reviews0004.1-0001.10 (2002);Gallie, Nucleic Acids Research 30: 3401-3411 (2002);Shaloiko等人, DOI: 10.1002/bit.20267;及Gallie等人, Nucleic Acids Research 15: 3257-3273 (1987);每一參考文獻之揭示內容係以全文引用之方式併入本文中)。
轉譯增強子序列有時係真核序列,例如Kozak共有序列或其他序列(例如,氫水螅體序列,GenBank登錄號U07128)。轉譯增強子序列有時係原核序列,例如Shine-Dalgarno共有序列。在某些實施例中,轉譯增強子序列係病毒核苷酸序列。轉譯增強子序列有時來自植物病毒之5’ UTR,該植物病毒係例如煙草嵌紋病毒(Tobacco Mosaic Virus,TMV)、紫苜蓿嵌紋病毒(Alfalfa Mosaic Virus,AMV);煙草蝕紋病毒(Tobacco Etch Virus,ETV);馬鈴薯病毒Y (PVY);蕪菁花葉(Turnip Mosaic) (poty)病毒及豌豆種傳嵌紋病毒。在某些實施例中,核酸試劑中包括來自TMV之長度為約67個鹼基之ω序列作為轉譯增強子序列(例如,不含鳥苷核苷酸,且包括25個核苷酸長之聚(CAA)中心區)。
3’ UTR可包含一或多個其來源之核苷酸序列之內源元件,且有時包括一或多個外源元件。3’ UTR可源自任何適宜核酸,例如基因體DNA、質體DNA、RNA或mRNA,例如源自任何適宜生物體(例如病毒、細菌、酵母、真菌、植物、昆蟲或哺乳動物)。技術人員可基於所選之表現系統(例如,在所選生物體中之表現)選擇3’ UTR之適當元件。3’ UTR有時包含技術人員已知之以下元件中之一或多者:轉錄調控位點、轉錄起始位點、轉錄終止位點、轉錄因子結合位點、轉譯調控位點、轉譯終止位點、轉譯起始位點、轉譯因子結合位點、核糖體結合位點、複製子、增強子元件、沉默子元件及多腺苷尾。3’ UTR經常包括多腺苷尾,且有時不包括,且若存在多腺苷尾,則可自其中添加或缺失一或多個腺苷部分(例如,可添加或減去約5、約10、約15、約20、約25、約30、約35、約40、約45或約50個腺苷部分)。
在一些實施例中,5’ UTR及/或3’ UTR之修飾用於改變(例如,增加、添加、減少或實質上消除)啟動子之活性。啟動子活性之改變進而可藉由改變所關注核苷酸序列自包含經修飾5’或3’ UTR之可操作連接之啟動子元件的轉錄來改變肽、多肽或蛋白質之活性(例如酶活性)。舉例而言,在某些實施例中,可藉由遺傳修飾來工程化微生物體以表現包含經修飾5’或3’ UTR之核酸試劑,該經修飾5’或3’ UTR可藉由增加自可操作地連接至所關注核苷酸序列(例如,所關注同源或異源核苷酸序列)之同源或異源啟動子之轉錄來增加新活性(例如,通常不在宿主生物體中發現之活性)或增加現有活性之表現。在一些實施例中,可藉由遺傳修飾來工程化微生物體以表現包含經修飾5’或3’ UTR之核酸試劑,在某些實施例中,該經修飾5’或3’ UTR可藉由減少或實質上消除自可操作地連接至所關注核苷酸序列之同源或異源啟動子之轉錄來減少活性之表現。
核苷酸三磷酸轉運蛋白自表現盒或表現載體之表現可由能夠在原核細胞或真核細胞中表現之任何啟動子控制。啟動子元件通常係DNA合成及/或RNA合成所需的。啟動子元件經常包含藉由提供合成對應於基因之RNA之起始位點而促進特定基因之轉錄的DNA區。在一些實施例中,啟動子通常位於其調控之基因附近,位於基因之上游(例如,基因之5’),且與基因之有義股在DNA之相同股上。在一些實施例中,啟動子元件可自基因或生物體分離,且與聚核苷酸序列功能性連接地插入,以允許改變及/或調控之表現。用於核酸表現之非天然啟動子(例如,通常不與給定核酸序列相關之啟動子)經常稱為異源啟動子。在某些實施例中,異源啟動子及/或5’UTR可與編碼具有本文所述之期望活性之多肽的聚核苷酸功能性連接地插入。如本文關於啟動子所用之術語「可操作連接」及「與……功能性連接」係指編碼序列與啟動子元件之間之關係。當啟動子元件調控或控制經由轉錄自編碼序列之表現時,啟動子與編碼序列可操作地連接或功能性連接。術語「可操作連接」及「與……功能性連接」在本文中關於啟動子元件可互換使用。
啟動子經常與RNA聚合酶相互作用。聚合酶係使用預先存在之核酸試劑催化核酸合成之酶。當模板係DNA模板時,在蛋白質合成之前轉錄RNA分子。適用於本發明方法之具有聚合酶活性之酶包括在具有所選模板之所選系統中有活性以合成蛋白質之任何聚合酶。在一些實施例中,啟動子(例如,異源啟動子)在本文中亦稱為啟動子元件,可操作地連接至核苷酸序列或開放閱讀框(ORF)。自啟動子元件之轉錄可催化對應於可操作地連接至啟動子之核苷酸序列或ORF序列之RNA之合成,此進而導致期望肽、多肽或蛋白質之合成。
啟動子元件有時展現對調控控制之反應。啟動子元件有時亦可藉由選擇劑來調控。亦即,自啟動子元件之轉錄有時可因應環境、營養或內部條件或信號之變化而開啟、關閉、上調或下調(例如,熱誘導型啟動子、光調控啟動子、反饋調控啟動子、激素影響之啟動子、組織特異性啟動子、氧及pH影響之啟動子、對選擇劑(例如,康黴素(kanamycin))有反應之啟動子及諸如此類)。受環境、營養或內部信號影響之啟動子經常受在啟動子處或附近結合且在某些條件下增加或減少靶序列表現之信號影響(直接或間接)。至於本文揭示之所有方法,包含天然或經修飾啟動子可用於改變或最佳化完全天然ORF (例如NTT或aaRS)或含有非天然核苷酸之ORF (例如mRNA或tRNA)之表現。
影響自本文所述實施例中使用之啟動子元件轉錄的選擇劑或調控劑之非限制性實例包括(但不限於):(1)編碼提供針對其他毒性化合物(例如抗生素)之抗性之產物的核酸區段;(2)編碼受體細胞中另外缺乏之產物(例如,必需產物、tRNA基因、營養缺陷型標記物)之核酸區段;(3)編碼抑制基因產物之活性之產物的核酸區段;(4)編碼可容易鑑別之產物(例如表型標記物,例如抗生素(例如β-內醯胺酶)、β-半乳糖苷酶、綠色螢光蛋白(GFP)、黃色螢光蛋白(YFP)、紅色螢光蛋白(RFP)、青色螢光蛋白(CFP)及細胞表面蛋白)之核酸區段;(5)結合原本對細胞存活及/或功能有害之產物之核酸區段;(6)以其他方式抑制上述編號1-5中所述之任何核酸區段(例如反義寡核苷酸)之活性的核酸區段;(7)結合修飾受質之產物(例如,限制性內切核酸酶)之核酸區段;(8)可用於分離或鑑別期望分子(例如,特異性蛋白質結合位點)之核酸區段;(9)編碼原本可無功能之特定核苷酸序列之核酸區段(例如,用於分子亞群體之PCR擴增);(10)當不存在時直接或間接賦予對特定化合物之抗性或敏感性的核酸區段;(11)編碼產物之核酸區段,該等產物在受體細胞中係有毒或將相對無毒之化合物轉化為毒性化合物(例如單純疱疹胸苷激酶、胞嘧啶去胺酶);(12)抑制含有其之核酸分子之複製、分配或遺傳性之核酸區段;(13)編碼條件性複製功能之核酸區段,該等條件性複製功能例如在某些宿主或宿主細胞系中或在某些環境條件(例如溫度、營養條件及諸如此類)下複製;及/或(14)編碼一或多種包含非天然核苷酸之mRNA或tRNA之核酸。在一些實施例中,可添加調控劑或選擇劑以改變生物體所經受之現有生長條件(例如,在液體培養物中生長、在發酵罐中生長、在固體營養板上生長及諸如此類)。
在一些實施例中,啟動子元件之調控可用於改變(例如,增加、添加、減少或實質上消除)肽、多肽或蛋白質之活性(例如,酶活性)。舉例而言,在某些實施例中,可藉由遺傳修飾工程化微生物體以表現核酸試劑,該核酸試劑可藉由增加自可操作地連接至所關注核苷酸序列(例如,所關注同源或異源核苷酸序列)之同源或異源啟動子之轉錄來增加新活性(例如,通常不在宿主生物體中發現之活性)或增加現有活性之表現。在一些實施例中,可藉由遺傳修飾來工程化微生物體以表現核酸試劑,該核酸試劑可藉由減少或實質上消除自自可操作地連接至所關注核苷酸序列之同源或異源啟動子之轉錄來減少活性之表現。
編碼異源蛋白(例如核苷酸三磷酸轉運蛋白)之核酸可插入任何適宜表現系統中或與任何適宜表現系統一起使用。在一些實施例中,核酸試劑有時穩定整合至宿主生物體之染色體中,或在某些實施例中,核酸試劑可為宿主染色體之一部分之缺失(例如,遺傳修飾之生物體,其中宿主基因體之改變賦予選擇性或優先維持攜帶遺傳修飾之期望生物體之能力)。該等核酸試劑(例如,改變之基因體賦予生物體可選擇之性狀之核酸或經遺傳修飾之生物體)可針對其指導期望蛋白質或核酸分子產生之能力進行選擇。當期望時,可改變核酸試劑,使得密碼子編碼(i)相同之胺基酸,使用與天然序列中指定之不同之tRNA,或(ii)與正常不同之胺基酸,包括非習用或非天然胺基酸(包括可檢測標記之胺基酸)。
重組表現使用可為載體(例如質體)之一部分之表現盒有效地完成。載體可包括可操作連接至編碼核苷酸三磷酸轉運蛋白之核酸的啟動子。載體亦可包括本文所述之轉錄及轉譯所需之其他元件。表現盒、表現載體及盒或載體中之序列對於接觸非天然核苷酸之細胞可為異源的。舉例而言,核苷酸三磷酸轉運蛋白序列對於細胞可為異源的。
可產生適於攜帶、編碼及/或表現核苷酸三磷酸轉運蛋白之多種原核及真核表現載體。該等表現載體包括(例如) pET、pET3d、pCR2.1、pBAD、pUC及酵母載體。載體可用於(例如)多種活體內及活體外情況。可使用之原核啟動子之非限制性實例包括SP6、T7、T5、tacblatrpgallac 或麥芽糖啟動子。可使用之真核啟動子之非限制性實例包括組成型啟動子,例如病毒啟動子(例如CMV、SV40及RSV啟動子;以及可調控啟動子,例如誘導型或阻抑型啟動子,例如tet 啟動子、hsp70啟動子及由CRE調控之合成啟動子。用於細菌表現之載體包括pGEX-5X-3,且用於真核表現之載體包括pCIneo-CMV。可採用之病毒載體包括關於慢病毒屬、腺病毒、腺相關病毒、疱疹病毒、牛痘病毒、脊髓灰白質炎病毒、AIDS病毒、神經元營養病毒、辛德畢斯病毒(Sindbis)及其他病毒之彼等。亦有用者係任何病毒家族,其共用該等病毒之性質,使其適合用作載體。可採用之反轉錄病毒載體包括Verma, American Society for Microbiology, 第229-232頁, Washington, (1985)中所述之彼等。舉例而言,該等反轉錄病毒載體可包括鼠Maloney白血病病毒、MMLV及其他表現期望性質之反轉錄病毒。通常,病毒載體含有非結構性早期基因、結構性晚期基因、RNA聚合酶III轉錄本、複製及衣殼化所必需之末端反向重複序列以及控制病毒基因體之轉錄及複製之啟動子。當工程化為載體時,病毒通常具有一或多個去除之早期基因,且基因或基因/啟動子盒插入病毒基因體中以代替去除之病毒核酸。選殖
可利用業內已知之任何方便之選殖策略將元件(例如ORF)納入核酸試劑中。可使用已知方法將元件插入模板中,而不依賴於插入元件,例如(1)在一或多個現有限制性酶位點裂解模板,並連接所關注元件,及(2)藉由雜交包括一或多個適宜限制性酶位點之寡核苷酸引子,將限制性酶位點添加至模板中,並藉由聚合酶鏈式反應(本文更詳細地闡述)擴增。其他選殖策略利用存在或插入核酸試劑中之一或多個插入位點,例如用於PCR之寡核苷酸引子雜交位點以及本文所述之其他位點。在一些實施例中,選殖策略可與遺傳操縱(例如重組(例如,核酸試劑與所關注核酸序列重組至欲修飾之生物體之基因體中,如本文進一步闡述)組合。在一些實施例中,選殖之ORF可藉由用一或多種所關注ORF工程化微生物體而(直接或間接)產生經修飾或野生型核苷三磷酸轉運蛋白及/或聚合酶,該微生物體包含核苷三磷酸轉運蛋白活性或聚合酶活性之改變活性。
核酸可藉由使核酸與一或多種特異性裂解劑接觸而特異性裂解。特異性裂解劑通常根據特定核苷酸序列在特定位點特異性裂解。酶特異性裂解劑之實例包括(但不限於)內核酸酶(例如DN酶I、II);RN酶(例如RN酶E、F、H、P);Cleavase™酶;Taq DNA聚合酶;大腸桿菌DNA聚合酶I及真核結構特異性內核酸酶;鼠類FEN-1內核酸酶;I、II或III型限制性內核酸酶,例如Acc I、Afl III、Alu I、Alw44 I、Apa I、Asn I、Ava I、Ava II、BamH I、Ban II、Bcl I、Bgl I. Bgl II、Bln I、BsaI、Bsm I、BsmBI、BssH II、BstE II、Cfo I、CIa I、Dde I、Dpn I、Dra I、EcIX I、EcoR I、EcoR I、EcoR II、EcoR V、Hae II、Hae II、Hind II、Hind III、Hpa I、Hpa II、Kpn I、Ksp I、Mlu I、MIuN I、Msp I、Nci I、Nco I、Nde I、Nde II、Nhe I、Not I、Nru I、Nsi I、Pst I、Pvu I、Pvu II、Rsa I、Sac I、Sal I、Sau3A I、Sca I、ScrF I、Sfi I、Sma I、Spe I、Sph I、Ssp I、Stu I、Sty I、Swa I、Taq I、Xba I、Xho I);醣苷酶(例如尿嘧啶-DNA醣苷酶(UDG)、3-甲基腺嘌呤DNA醣苷酶、3-甲基腺嘌呤DNA醣苷酶II、嘧啶水合物-DNA醣苷酶、FaPy-DNA醣苷酶、胸腺嘧啶失配-DNA醣苷酶、次黃嘌呤-DNA醣苷酶、5-羥基甲基尿嘧啶DNA醣苷酶(HmUDG)、5-羥基甲基胞嘧啶DNA醣苷酶或1,N6-亞乙烯基-腺嘌呤DNA醣苷酶);外核酸酶(例如外核酸酶III);核酶;及DNA酶。樣品核酸可用化學劑處理,或使用經修飾核苷酸合成,且經修飾核酸可裂解。在非限制性實例中,樣品核酸可用以下物質處理:(i)烷基化劑,例如甲基亞硝基脲,其產生若干烷基化鹼基,包括N3-甲基腺嘌呤及N3-甲基鳥嘌呤,其由烷基嘌呤DNA-醣苷酶識別及裂解;(ii)亞硫酸氫鈉,其引起DNA中胞嘧啶殘基之去胺化,以形成可由尿嘧啶N-醣苷酶裂解之尿嘧啶殘基;及(iii)將鳥嘌呤轉化成其氧化形式8-羥基鳥嘌呤之化學劑,其可由甲醯胺基嘧啶DNA N-醣苷酶裂解。化學裂解方法之實例包括(但不限於)烷基化(例如硫代磷酸酯修飾之核酸之烷基化);酸不穩定性之含P3’-N5’-胺基磷酸酯之核酸的裂解;及核酸之四氧化鋨及六氫吡啶處理。
在一些實施例中,核酸試劑包括一或多個重組酶插入位點。重組酶插入位點係核酸分子上參與重組蛋白之整合/重組反應之識別序列。舉例而言,Cre重組酶之重組位點係loxP,其係由側接8鹼基對核心序列之兩個13鹼基對反向重複序列(用作重組酶結合位點)構成的34鹼基對序列(例如Sauer, Curr. Opin. Biotech. 5:521-527 (1994))。重組位點之其他實例包括attB、attP、attL及attR序列及其突變體、片段、變體及衍生物,其由重組蛋白λ Int及輔助蛋白整合宿主因子(IHF)、FIS及切除酶(Xis)識別(例如美國專利第5,888,732號、第6,143,557號、第6,171,861號、第6,270,969號、第6,277,608號及第6,720,140號;美國專利申請案第09/517,466號及第09/732,914號;美國專利公開案第US2002/0007051號;及Landy, Curr. Opin. Biotech. 3:699-707 (1993);每一參考文獻之揭示內容係以全文引用之方式併入本文中)。
重組酶選殖核酸之實例係在Gateway®系統(Invitrogen, California)中,其包括至少一個用於活體內或活體外選殖期望核酸分子之重組位點。在一些實施例中,通常基於噬菌體λ系統(例如,att1及att2),該系統利用含有至少兩個不同位點特異性重組位點之載體,且自野生型(att0)位點突變。每一突變位點對其相同類型之同源配偶體att位點(即,其結合配偶體重組位點) (例如,attB1與attP1、或attL1與attR1)具有獨特特異性,且不會與其他突變類型之重組位點或與野生型att0位點交叉反應。不同位點特異性允許定向選殖或連接期望分子,從而提供選殖分子之期望定向。使用Gateway®系統藉由置換受體質體分子(有時稱為目的載體)上側接有att位點之可選標記物(例如ccdB)來選殖及亞選殖側接重組位點之核酸片段。然後藉由轉變ccdB敏感宿主菌株及陽性選擇受體分子上之標記物來選擇期望純系。用於負向選擇之類似策略(例如,使用毒性基因)可用於其他生物體,例如哺乳動物及昆蟲中之胸苷激酶(TK)。
核酸試劑有時含有一或多個複製起點(ORI)元件。在一些實施例中,模板包含兩個或更多個ORI,其中一個ORI在一種生物體(例如細菌)中有效發揮功能,且另一ORI在另一種生物體(例如真核生物,如酵母)中有效發揮功能。在一些實施例中,ORI可在一個物種(例如啤酒酵母)中有效發揮功能,而另一ORI可在不同物種(例如粟酒裂殖酵母)中有效發揮功能。核酸試劑有時亦包括一或多個轉錄調控位點。
核酸試劑(例如表現盒或載體)可包括編碼標記產物之核酸序列。標記產物用於確定基因是否已遞送至細胞,且一旦遞送,基因是否表現。標記基因之實例包括編碼β-半乳糖苷酶及綠色螢光蛋白之大腸桿菌lacZ基因。在一些實施例中,標記物可為可選標記物。當該等可選標記物成功地轉移至宿主細胞中時,若置於選擇壓力下,轉變之宿主細胞可存活。存在兩種廣泛使用之不同類別之選擇性方案。第一類別係基於細胞之代謝及缺乏不依賴於補充培養基生長之能力之突變細胞系的使用。第二類別係顯性選擇,其係指在任何細胞類型中使用之選擇方案,且不需要使用突變細胞系。該等方案通常使用藥物來阻止宿主細胞之生長。具有新基因之彼等細胞將表現傳遞抗藥性之蛋白質,並將在選擇中存活。該顯性選擇之實例使用藥物新黴素(neomycin)(Southern等人,J. Molec. Appl. Genet. 1: 327 (1982))、黴酚酸(Μlligan等人,Science 209: 1422 (1980))或潮黴素(hygromycin) (Sugden等人,Mol. Cell. Biol. 5: 410-413 (1985);每一參考文獻之揭示內容係以全文引用之方式併入本文中)。
核酸試劑可包括一或多個選擇元件(例如,用於選擇核酸試劑之存在之元件,而非用於活化可經選擇性調控之啟動子元件之元件)。選擇元件經常使用已知之方法來確定細胞中是否包括核酸試劑來利用。在一些實施例中,核酸試劑包括兩個或更多個選擇元件,其中一個選擇元件在一種生物體中有效發揮功能,且另一選擇元件在另一種生物體中有效發揮功能。選擇元件之實例包括(但不限於):(1)編碼提供針對其他毒性化合物(例如抗生素)之抗性之產物的核酸區段;(2)編碼受體細胞中另外缺乏之產物(例如,必需產物、tRNA基因、營養缺陷型標記物)之核酸區段;(3)編碼抑制基因產物之活性之產物的核酸區段;(4)編碼可容易鑑別之產物(例如表型標記物,例如抗生素(例如β-內醯胺酶)、β-半乳糖苷酶、綠色螢光蛋白(GFP)、黃色螢光蛋白(YFP)、紅色螢光蛋白(RFP)、青色螢光蛋白(CFP)及細胞表面蛋白)之核酸區段;(5)結合原本對細胞存活及/或功能有害之產物之核酸區段;(6)以其他方式抑制上述編號1-5中所述之任何核酸區段(例如反義寡核苷酸)之活性的核酸區段;(7)結合修飾受質之產物(例如,限制性內切核酸酶)之核酸區段;(8)可用於分離或鑑別期望分子(例如,特異性蛋白質結合位點)之核酸區段;(9)編碼原本可無功能之特定核苷酸序列之核酸區段(例如,用於分子亞群體之PCR擴增);(10)當不存在時直接或間接賦予對特定化合物之抗性或敏感性的核酸區段;(11)編碼產物之核酸區段,該等產物在受體細胞中係有毒或將相對無毒之化合物轉化為毒性化合物(例如單純疱疹病毒胸苷激酶、胞嘧啶去胺酶);(12)抑制含有其之核酸分子之複製、分配或遺傳性之核酸區段;及/或(13)編碼條件性複製功能之核酸區段,該等條件性複製功能例如在某些宿主或宿主細胞系中或在某些環境條件(例如溫度、營養條件及諸如此類)下複製。
核酸試劑可為任何可用於活體內轉錄及/或轉譯之形式。核酸有時係質體,例如超螺旋質體,有時係酵母人工染色體(例如YAC),有時係線性核酸(例如藉由PCR或藉由限制性消解產生之線性核酸),有時係單股的,且有時係雙股的。核酸試劑有時藉由擴增方法(例如聚合酶鏈式反應(PCR)方法、轉錄介導之擴增方法(TMA))來製備。在TMA中,在等溫反應中使用兩種酶以產生藉由光發射檢測之擴增產物(例如Biochemistry 1996年6月25日;35(25):8429-38)。標準PCR方法係已知的(例如美國專利第4,683,202號、第4,683,195號、第4,965,188號及第5,656,493號),且通常在循環中實施。每一循環包括熱變性,其中雜交核酸解離;冷卻,其中引子寡核苷酸雜交;及藉由聚合酶(即,Taq聚合酶)延伸寡核苷酸。PCR循環過程之實例係在95℃下處理樣品5分鐘;重複四十五個循環,95℃持續1分鐘、59℃持續1分鐘10秒及72℃持續1分鐘30秒;及然後在72℃處理樣品5分鐘。使用市售熱循環儀頻繁地實施多個循環。PCR擴增產物有時在較低溫度下(例如,在4℃下)儲存一段時間,且有時在分析前冷凍(例如,在-20℃下)。
可採用類似於上述彼等選殖策略之選殖策略來產生含有非天然核苷酸之DNA。舉例而言,在期望位置含有非天然核苷酸之寡核苷酸係使用標準固相合成方法合成,且藉由HPLC純化。然後使用具有選殖位點(例如BsaI位點)(但可使用上文論述之其他位點)之選殖方法(例如Golden Gate組裝法),將寡核苷酸插入含有所需序列背景(即UTR及編碼序列)之質體中。套組 / 製品
在某些實施例中,本文揭示與與本文所述之一或多種方法一起使用之套組及製品。該等套組包括載劑、包裝或間隔化成可容納一或多個容器(例如小瓶、管及諸如此類)之容器,各容器包含一個欲用於本文所述方法之單獨元件。適宜容器包括(例如)瓶子、小瓶、注射器及試管。在一個實施例中,容器係自諸如玻璃或塑膠等各種材料形成。
在一些實施例中,套組包括適宜包裝材料以容納套組之內容物。在一些情況下,包裝材料藉由眾所周知之方法構築,以較佳提供無菌、無污染之環境。本文所用之包裝材料可包括(例如)通常用於出售之與核酸測序系統一起使用之商業套組中之彼等。實例性之包裝材料包括(但不限於)玻璃、塑膠、紙、箔及諸如此類,其能夠將本文所述之組分保持在固定之限度內。
包裝材料可包括指示組分之特定用途之標籤。由標籤指示之套組之用途可為本文所述之一或多種方法,其適於套組中存在之組分之特定組合。舉例而言,標籤可指示套組可用於合成聚核苷酸之方法或測定核酸序列之方法。
套組中亦可包括使用包裝之試劑或組分之說明書。說明書通常包括闡述反應參數(例如套組組分及欲混合樣品之相對量、試劑/樣品混合物之維持時間、溫度、緩衝液條件及諸如此類)之有形表示。
應當理解,並非特定反應所必需之所有組分皆需要存在於特定套組中。相反,可自其他來源提供一或多種額外組分。與套組一起提供之說明書可鑑別欲提供之額外組分及其可在哪裡獲得。
在一些實施例中,提供套組,其可用於例如使用本發明提供之用於製備遺傳工程化細胞之方法將非天然核酸穩定納入細胞核酸中。在一個實施例中,本文所述之套組包括遺傳工程化細胞及一或多種非天然核酸。在另一實施例中,本文所述之套組包括包含選自SEQ ID NO: 1-2之序列之分離及純化之質體。在另一實施例中,本文所述之套組包括包含選自SEQ ID NO: 3-20之序列的引子。
在其他實施例中,本文所述之套組提供細胞及含有異源基因之核酸分子,該異源基因用於引入細胞中,從而提供遺傳工程化細胞,例如包含本段中上文所述之任何實施例之核酸之表現載體。實例性實施例
藉由以下實施例進一步闡述本發明。若適當且實際,該等實施例中之每一者之特徵可與其他實施例中之任一者組合。
實施例1.  一種產生包含非天然胺基酸之蛋白質的活體內方法,該方法包含: 轉錄包含第一非天然鹼基及互補第二非天然鹼基之DNA模板以將第三非天然鹼基納入mRNA中,該第三非天然鹼基之組態可以與該第一非天然鹼基形成第一非天然鹼基對; 轉錄該DNA模板以將第四非天然鹼基納入tRNA中,其中該第四非天然鹼基之組態可以與該第二非天然鹼基形成第二非天然鹼基對,其中該第一非天然鹼基對及該第二非天然鹼基對不相同;及 自該mRNA及tRNA轉譯蛋白質,其中該蛋白質包含非天然胺基酸。
實施例2.  如實施例1之方法,其中該活體內方法包含使用半合成生物體。
實施例3.  如實施例2之方法,其中該生物體包含微生物體。
實施例4.  如實施例3之方法,其中該生物體包含細菌。
實施例5.  如實施例4之方法,其中該生物體包含革蘭氏陽性細菌。
實施例6.  如實施例4之方法,其中該生物體包含革蘭氏陰性細菌。
實施例7.  如實施例2至4中任一實施例之方法,其中該生物體包含大腸桿菌。
實施例8.  如實施例1至7中任一實施例之方法,其中至少一個非天然鹼基係選自由以下組成之群: (i)    2-硫尿嘧啶、2-硫-胸腺嘧啶、2’-去氧尿苷、4-硫-尿嘧啶、4-硫-胸腺嘧啶、尿嘧啶-5-基、次黃嘌呤-9-基(I)、5-鹵基尿嘧啶;5-丙炔基-尿嘧啶、6-偶氮基-胸腺嘧啶、6-偶氮基-尿嘧啶、5-甲基胺基甲基尿嘧啶、5-甲氧基胺基甲基-2-硫尿嘧啶、假尿嘧啶、尿嘧啶-5-乙醛酸甲基酯、尿嘧啶-5-乙醛酸、5-甲基-2-硫尿嘧啶、3-(3-胺基-3-N-2-羧基丙基)尿嘧啶、5-甲基-2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、5’-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、尿嘧啶-5-氧基乙酸、5-(羧基羥基甲基)尿嘧啶、5-羧基甲基胺基甲基-2-硫尿苷、5-羧基甲基胺基甲基尿嘧啶或二氫尿嘧啶; (ii)   5-羥基甲基胞嘧啶、5-三氟甲基胞嘧啶、5-鹵基胞嘧啶、5-丙炔基胞嘧啶、5-羥基胞嘧啶、環胞嘧啶、胞嘧啶阿拉伯糖苷、5,6-二氫胞嘧啶、5-硝基胞嘧啶、6-偶氮基胞嘧啶、氮雜胞嘧啶、N4-乙基胞嘧啶、3-甲基胞嘧啶、5-甲基胞嘧啶、4-乙醯基胞嘧啶、2-硫胞嘧啶、啡噁嗪胞苷([5,4-b][1,4]苯并噁嗪-2(3H)-酮)、啡噻嗪胞苷(1H-嘧啶并[5,4-b][1,4]苯并噻嗪-2(3H)-酮)、啡噁嗪胞苷(9-(2-胺基乙氧基)-H-嘧啶并[5,4-b][1,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)、或吡啶并吲哚胞苷(H-吡啶并[3’,2’:4,5]吡咯并[2,3-d]嘧啶-2-酮); (iii)  2-胺基腺嘌呤、2-丙基腺嘌呤、2-胺基-腺嘌呤、2-F-腺嘌呤、2-胺基-丙基-腺嘌呤、2-胺基-2’-去氧腺苷、3-去氮腺嘌呤、7-甲基腺嘌呤、7-去氮-腺嘌呤、8-氮雜腺嘌呤、8-鹵基、8-胺基、8-硫醇、8-硫代烷基及8-羥基取代之腺嘌呤、N6-異戊烯基腺嘌呤、2-甲基腺嘌呤、2,6-二胺基嘌呤、2-甲硫基-N6-異戊烯基腺嘌呤或6-氮雜-腺嘌呤; (iv) 2-甲基鳥嘌呤、鳥嘌呤之2-丙基及烷基衍生物、3-去氮鳥嘌呤、6-硫-鳥嘌呤、7-甲基鳥嘌呤、7-去氮鳥嘌呤、7-去氮鳥苷、7-去氮-8-氮雜鳥嘌呤、8-氮雜鳥嘌呤、8-鹵基、8-胺基、8-硫醇、8-硫代烷基及8-羥基取代之鳥嘌呤、1-甲基鳥嘌呤、22-二甲基鳥嘌呤、7-甲基鳥嘌呤或6-氮雜-鳥嘌呤;及 (v)    次黃嘌呤、黃嘌呤、1-甲基肌苷、Q核苷、β-D-半乳糖基Q核苷、肌苷、β-D-甘露糖基Q核苷、懷丁氧苷、羥基脲、(acp3)w、2-胺基吡啶或2-吡啶酮。
實施例9.  如實施例1至7中任一實施例之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image677
Figure 02_image679
Figure 02_image681
實施例10.     如實施例1至7中任一實施例之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image683
Figure 02_image685
Figure 02_image687
實施例11.     如實施例9之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image689
Figure 02_image691
Figure 02_image693
實施例12.     如實施例9之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image695
Figure 02_image697
實施例13.     如實施例9之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image699
Figure 02_image701
實施例14.     如實施例9之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image703
Figure 02_image705
實施例15.     如實施例9之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image707
Figure 02_image709
實施例16.     如實施例9之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image711
Figure 02_image713
實施例17.     如實施例9之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image715
Figure 02_image717
實施例18.     如實施例9之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係
Figure 02_image719
實施例19.     如實施例9之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自:
Figure 02_image721
Figure 02_image723
實施例20.     如實施例9之方法,其中該等第一或第二非天然鹼基係
Figure 02_image725
實施例21.     如實施例9之方法,其中該等第一或第二非天然鹼基係
Figure 02_image727
實施例22.     如實施例9之方法,其中該第一非天然鹼基係
Figure 02_image729
且該第二非天然鹼基係
Figure 02_image731
實施例23.     如實施例9之方法,其中該第一非天然鹼基係
Figure 02_image733
且該第二非天然鹼基係
Figure 02_image735
實施例24.     如實施例9之方法,其中該第三或第四非天然鹼基係
Figure 02_image737
實施例25.     如實施例9之方法,其中該第三非天然鹼基係
Figure 02_image739
實施例26.     如實施例9之方法,其中該第四非天然鹼基係
Figure 02_image741
實施例27.     如實施例9之方法,其中該第三或第四非天然鹼基係
Figure 02_image743
Figure 02_image745
實施例28.     如實施例9之方法,其中該第三非天然鹼基係
Figure 02_image747
Figure 02_image749
實施例29.     如實施例9之方法,其中該第四非天然鹼基係
Figure 02_image751
Figure 02_image753
實施例30.     如實施例9之方法,其中該第一非天然鹼基係
Figure 02_image755
,該第二非天然鹼基係
Figure 02_image757
,該第三非天然鹼基係
Figure 02_image759
,且該第四非天然鹼基係
Figure 02_image761
Figure 02_image763
實施例31.     如實施例9之方法,其中該第一非天然鹼基係
Figure 02_image765
,該第二非天然鹼基係
Figure 02_image767
,該第三非天然鹼基係
Figure 02_image769
,且該第四非天然鹼基係
Figure 02_image771
Figure 02_image773
實施例32.     如實施例9之方法,其中該第一非天然鹼基係
Figure 02_image775
,該第二非天然鹼基係
Figure 02_image777
,該第三非天然鹼基係
Figure 02_image779
Figure 02_image781
且該第四非天然鹼基係
Figure 02_image783
實施例33.     如實施例9之方法,其中該第三非天然鹼基係
Figure 02_image785
Figure 02_image787
實施例34.     如實施例9之方法,其中該第四非天然鹼基係
Figure 02_image789
實施例35.     如實施例9之方法,其中該第一非天然鹼基係
Figure 02_image791
,該第二非天然鹼基係
Figure 02_image793
,該第三非天然鹼基係
Figure 02_image795
Figure 02_image797
,且該第四非天然鹼基係
Figure 02_image799
實施例36.     如實施例9至35中任一實施例之方法,其中該第三非天然鹼基及該第四非天然鹼基包含核糖。
實施例37.     如實施例9至35中任一實施例之方法,其中該第三非天然鹼基及該第四非天然鹼基包含去氧核糖。
實施例38.     如實施例9至35中任一實施例之方法,其中該等第一及第二非天然鹼基包含去氧核糖。
實施例39.     如實施例9至35中任一實施例之方法,其中該等第一及第二非天然鹼基包含去氧核糖且該第三非天然鹼基及該第四非天然鹼基包含核糖。
實施例40.     如實施例9之方法,其中該DNA模板包含至少一個選自由以下組成之群之非天然鹼基對(UBP):
Figure 02_image801
Figure 02_image803
實施例41.     如實施例40之方法,其中該DNA模板包含至少一個為dNaM-d5SICS之非天然鹼基對(UBP)。
實施例42.     如實施例40之方法,其中該DNA模板包含至少一個為dCNMO-dTPT3之非天然鹼基對(UBP)。
實施例43.     如實施例40之方法,其中該DNA模板包含至少一個為dNaM-dTPT3之非天然鹼基對(UBP)。
實施例44.     如實施例40之方法,其中該DNA模板包含至少一個為dPTMO-dTPT3之非天然鹼基對(UBP)。
實施例45.     如實施例40之方法,其中該DNA模板包含至少一個為dNaM-dTAT1之非天然鹼基對(UBP)。
實施例46.     如實施例40之方法,其中該DNA模板包含至少一個為dCNMO-dTAT1之非天然鹼基對(UBP)。
實施例47.     如實施例1之方法,其中該DNA模板包含至少一個選自由以下組成之群之非天然鹼基對(UBP):
Figure 02_image805
Figure 02_image807
;且 其中該mRNA及該tRNA包含至少一個選自以下之非天然鹼基:
Figure 02_image809
Figure 02_image811
實施例48.     如實施例47之方法,其中該DNA模板包含至少一個為dNaM-d5SICS之非天然鹼基對(UBP)。
實施例49.     如實施例47之方法,其中該DNA模板包含至少一個為dCNMO-dTPT3之非天然鹼基對(UBP)。
實施例50.     如實施例47之方法,其中該DNA模板包含至少一個為dNaM-dTPT3之非天然鹼基對(UBP)。
實施例51.     如實施例47之方法,其中該DNA模板包含至少一個為dPTMO-dTPT3之非天然鹼基對(UBP)。
實施例52.     如實施例47之方法,其中該DNA模板包含至少一個為dNaM-dTAT1之非天然鹼基對(UBP)。
實施例53.     如實施例47之方法,其中該DNA模板包含至少一個為dCNMO-dTAT1之非天然鹼基對(UBP)。
實施例54.     如實施例47至53中任一實施例之方法,其中該mRNA及該tRNA包含選自
Figure 02_image813
Figure 02_image815
之非天然鹼基。
實施例55.     如實施例54之方法,其中該mRNA及該tRNA包含選自
Figure 02_image817
Figure 02_image819
之非天然鹼基。
實施例56.     如實施例54之方法,其中該mRNA包含為
Figure 02_image821
之非天然鹼基。
實施例57.     如實施例54之方法,其中該mRNA包含為
Figure 02_image823
之非天然鹼基。
實施例58.     如實施例54之方法,其中該mRNA包含為
Figure 02_image825
之非天然鹼基。
實施例59.     如實施例54之方法,其中該tRNA包含選自
Figure 02_image827
Figure 02_image829
之非天然鹼基。
實施例60.     如實施例54之方法,其中該tRNA包含為
Figure 02_image831
之非天然鹼基。
實施例61.     如實施例54之方法,其中該tRNA包含為
Figure 02_image833
之非天然鹼基。
實施例62.     如實施例54之方法,其中該tRNA包含為
Figure 02_image835
之非天然鹼基。
實施例63.     如實施例1至7中任一實施例之方法,其中該第一非天然鹼基包含dCNMO,且該第二非天然鹼基包含dTPT3。
實施例64.     如實施例1至7或41中任一實施例之方法,其中該第三非天然鹼基包含NaM,且該第二非天然鹼基包含TAT1。
實施例65.     如實施例1至64中任一實施例之方法,其中該第一非天然鹼基或該第二非天然鹼基由DNA聚合酶識別。
實施例66.     如實施例1至65中任一實施例之方法,其中該第三非天然鹼基或該第四非天然鹼基由RNA聚合酶識別。
實施例67.     如實施例1至66中任一實施例之方法,其中該蛋白質包含至少兩個非天然胺基酸。
實施例68.     如實施例1至66中任一實施例之方法,其中該蛋白質包含至少三個非天然胺基酸。
實施例69.     如實施例1至66中任一實施例之方法,其中其中該蛋白質包含至少兩個不同非天然胺基酸。
實施例70.     如實施例1至66中任一實施例之方法,其中其中該蛋白質包含至少三個不同非天然胺基酸。
實施例71.     如實施例1至70中任一實施例之方法,其中該至少一個非天然胺基酸: 係離胺酸類似物; 包含芳香族側鏈; 包含疊氮基; 包含炔基;或 包含醛或酮基團。
實施例72.     如實施例1至70中任一實施例之方法,其中該至少一個非天然胺基酸不包含芳香族側鏈。
實施例73.     如實施例1至70中任一實施例之方法,其中該至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)、N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)、BCN-L-離胺酸、降莰烯離胺酸、TCO-離胺酸、甲基四嗪離胺酸、烯丙基氧基羰基離胺酸、2-胺基-8-側氧基壬酸、2-胺基-8-側氧基辛酸、對-乙醯基-L-苯丙胺酸、對-疊氮基甲基-L-苯丙胺酸(pAMF)、對-碘-L-苯丙胺酸、間-乙醯基苯丙胺酸、2-胺基-8-側氧基壬酸、對-炔丙基氧基苯丙胺酸、對-炔丙基-苯丙胺酸、3-甲基-苯丙胺酸、L-多巴、氟化苯丙胺酸、異丙基-L-苯丙胺酸、對-疊氮基-L-苯丙胺酸、對-醯基-L-苯丙胺酸、對-苯甲醯基-L-苯丙胺酸、對-溴苯丙胺酸、對-胺基-L-苯丙胺酸、異丙基-L-苯丙胺酸、O-烯丙基酪胺酸、O-甲基-L-酪胺酸、O-4-烯丙基-L-酪胺酸、4-丙基-L-酪胺酸、膦醯基酪胺酸、三-O-乙醯基-GlcNAcp-絲胺酸、L-磷絲胺酸、膦醯基絲胺酸、L-3-(2-萘基)丙胺酸、2-胺基-3-((2-((3-(苄基氧基)-3-側氧基丙基)胺基)乙基)硒烷基)丙酸、2-胺基-3-(苯基硒烷基)丙酸或硒基半胱胺酸。
實施例74.     如實施例73之方法,其中該至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)及N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。
實施例75.     如實施例72之方法,其中該至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)。
實施例76.     如實施例72之方法,其中該至少一個非天然胺基酸包含N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。
實施例77.     一種包含擴展遺傳字母之半合成生物體,其中該遺傳字母包含至少兩個獨特非天然鹼基。
實施例78.     如實施例77之半合成生物體,其中該生物體包含微生物體。
實施例79.     如實施例77至78中任一實施例之半合成生物體,其中該生物體包含細菌。
實施例80.       如實施例79之半合成生物體,其中該生物體包含革蘭氏陽性細菌。
實施例81.       如實施例79之半合成生物體,其中該生物體包含革蘭氏陽性細菌。
實施例82.      如實施例77至79中任一實施例之半合成生物體,其中該生物體包含大腸桿菌。
實施例83.       如實施例77至82中任一實施例之半合成生物體,其中該等非天然鹼基中之至少一者係選自由以下組成之群:2-胺基腺嘌呤-9-基、2-胺基腺嘌呤、2-F-腺嘌呤、2-硫尿嘧啶、2-硫-胸腺嘧啶、2-硫胞嘧啶、腺嘌呤及鳥嘌呤之2-丙基及烷基衍生物、2-胺基-腺嘌呤、2-胺基-丙基-腺嘌呤、2-胺基吡啶、2-吡啶酮、2’-去氧尿苷、2-胺基-2’-去氧腺苷3-去氮鳥嘌呤、3-去氮腺嘌呤、4-硫-尿嘧啶、4-硫-胸腺嘧啶、尿嘧啶-5-基、次黃嘌呤-9-基(I)、5-甲基-胞嘧啶、5-羥基甲基胞嘧啶、黃嘌呤、次黃嘌呤、5-溴及5-三氟甲基尿嘧啶及胞嘧啶;5-鹵基尿嘧啶、5-鹵基胞嘧啶、5-丙炔基-尿嘧啶、5-丙炔基胞嘧啶、5-尿嘧啶、5-取代、5-鹵基、5-取代之嘧啶、5-羥基胞嘧啶、5-溴胞嘧啶、5-溴尿嘧啶、5-氯胞嘧啶、氯化胞嘧啶、環胞嘧啶、胞嘧啶阿拉伯糖苷、5-氟胞嘧啶、氟嘧啶、氟尿嘧啶、5,6-二氫胞嘧啶、5-碘胞嘧啶、羥基脲、碘尿嘧啶、5-硝基胞嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-氟尿嘧啶及5-碘尿嘧啶、腺嘌呤及鳥嘌呤之6-烷基衍生物、6-氮雜嘧啶、6-偶氮基-尿嘧啶、6-偶氮基胞嘧啶、氮雜胞嘧啶、6-偶氮基-胸腺嘧啶、6-硫-鳥嘌呤、7-甲基鳥嘌呤、7-甲基腺嘌呤、7-去氮鳥嘌呤、7-去氮鳥苷、7-去氮-腺嘌呤、7-去氮-8-氮雜鳥嘌呤、8-氮雜鳥嘌呤、8-氮雜腺嘌呤、8-鹵基、8-胺基、8-硫醇、8-硫烷基,及8-羥基取代之腺嘌呤及鳥嘌呤;N4-乙基胞嘧啶、N-2取代之嘌呤、N-6取代之嘌呤、O-6取代之嘌呤、增加雙螺旋體形成之穩定性者、通用核酸、疏水核酸、混雜(promiscuous)核酸、大小擴展(expanded)之核酸、氟化核酸、三環嘧啶、啡噁嗪胞苷([5,4-b][1,4]苯并噁嗪-2(3H)-酮)、啡噻嗪胞苷(1H-嘧啶并[5,4-b][1,4]苯并噻嗪-2(3H)-酮)、G-夾(clamps)、啡噁嗪胞苷(9-(2-胺基乙氧基)-H-嘧啶并[5,4-b][1,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并[3’,2’:4,5]吡咯并[2,3-d]嘧啶-2-酮)、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黃嘌呤、黃嘌呤、4-乙醯基胞嘧啶、5-(羧基羥基甲基)尿嘧啶、5-羧基甲基胺基甲基-2-硫尿苷、5-羧基甲基胺基甲基尿嘧啶、二氫尿嘧啶、β-D-半乳糖基Q核苷、肌苷、N6-異戊烯基腺嘌呤、1-甲基鳥嘌呤、1-甲基肌苷、2,2-二甲基鳥嘌呤、2-甲基腺嘌呤、2-甲基鳥嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鳥嘌呤、5-甲基胺基甲基尿嘧啶、5-甲氧基胺基甲基-2-硫尿嘧啶、β-D-甘露糖基Q核苷、5’-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-異戊烯基腺嘌呤、尿嘧啶-5氧基乙酸、懷丁氧苷、假尿嘧啶、Q核苷、2-硫胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-乙醛酸(oxacetic acid)甲基酯、尿嘧啶-5-乙醛酸、5-甲基-2-硫尿嘧啶、3-(3-胺基-3-N-2-羧基丙基)尿嘧啶、(acp3)w,及2,6-二胺基嘌呤,及其中嘌呤或嘧啶鹼基經雜環置換者。
實施例84.       如實施例77至82中任一實施例之半合成生物體,其中該生物體包含含有至少一個選自由以下組成之群之非天然核鹼基的DNA:
Figure 02_image837
Figure 02_image839
Figure 02_image841
實施例85.     如實施例77至84中任一實施例之半合成生物體,其中包含該等非天然鹼基中之至少一者之該DNA形成非天然鹼基對(UBP)。
實施例86.     如實施例85之半合成生物體,其中該非天然鹼基對(UBP)係dCNMO-dTPT3、dNaM-dTPT3、dCNMO-dTAT1或dNaM-dTAT1。
實施例87.     如實施例84之半合成生物體,其中該DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image843
Figure 02_image845
Figure 02_image847
實施例88.     如實施例87之半合成生物體,其中該DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image849
Figure 02_image851
Figure 02_image853
實施例89.     如實施例88之半合成生物體,其中該DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image855
Figure 02_image857
實施例90.     如實施例88之半合成生物體,其中該DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image859
Figure 02_image861
實施例91.     如實施例88之半合成生物體,其中該DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image863
Figure 02_image865
實施例92.     如實施例88之半合成生物體,其中該DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image867
Figure 02_image869
實施例93.     如實施例88之半合成生物體,其中該DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image871
Figure 02_image873
實施例94.     如實施例88之半合成生物體,其中該DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image875
Figure 02_image877
實施例95.     如實施例88之半合成生物體,其中該DNA包含至少一個選自
Figure 02_image879
Figure 02_image881
之非天然核鹼基。
實施例96.     如實施例88之半合成生物體,其中該DNA包含至少兩個選自
Figure 02_image883
Figure 02_image885
之非天然核鹼基。
實施例97.     如實施例88之半合成生物體,其中該DNA包含兩股,第一股包含至少一個為
Figure 02_image887
之核鹼基,且第二股包含至少一個為
Figure 02_image889
之核鹼基。
實施例98.     如實施例88之半合成生物體,其中該DNA包含至少一個為
Figure 02_image891
之非天然核鹼基。
實施例99.     如實施例77至98中任一實施例之半合成生物體,其中該生物體表現核苷三磷酸轉運蛋白。
實施例100.   如實施例99之半合成生物體,其中該生物體表現核苷三磷酸轉運蛋白Pt NTT2。
實施例101.   如實施例77至100中任一實施例之半合成生物體,其中該生物體進一步表現tRNA合成酶。
實施例102.   如實施例101之半合成生物體,其中該tRNA合成酶係巴氏甲烷八疊球菌吡咯離胺醯基-tRNA合成酶(Mb PylRS)。
實施例103.   如實施例99之半合成生物體,其中該生物體表現該核苷三磷酸轉運蛋白Pt NTT2且進一步表現該tRNA合成酶巴氏甲烷八疊球菌吡咯離胺醯基-tRNA合成酶(Mb PylRS)。
實施例104.   如實施例77至103中任一實施例之半合成生物體,其中該生物體進一步表現RNA聚合酶。
實施例105.   如實施例104之半合成生物體,其中該RNA聚合酶係T7 RNAP。
實施例106.   如實施例77至105中任一實施例之半合成生物體,其中該生物體不表現具有DNA重組修復功能之蛋白質。
實施例107.   如實施例77至105中任一實施例之半合成生物體,其中該生物體係大腸桿菌且該生物體不表現RecA。
實施例108.   如實施例77至107中任一實施例之半合成生物體,其進一步包含mRNA。
實施例109.   如實施例108之半合成生物體,其中該mRNA包含至少一個選自
Figure 02_image893
Figure 02_image895
之非天然鹼基。
實施例110.   如實施例108之半合成生物體,其中該mRNA包含至少一個為
Figure 02_image897
之非天然鹼基。
實施例111.   如實施例108之半合成生物體,其中該mRNA包含至少一個為
Figure 02_image899
之非天然鹼基。
實施例112.   如實施例108之半合成生物體,其中該mRNA包含至少一個為
Figure 02_image901
之非天然鹼基。
實施例113.   如實施例77至112中任一實施例之半合成生物體,其進一步包含tRNA。
實施例114.   如實施例113之半合成生物體,其中該tRNA包含至少一個選自
Figure 02_image903
Figure 02_image905
之非天然鹼基。
實施例115.   如實施例113之半合成生物體,其中該tRNA包含至少一個為
Figure 02_image907
之非天然鹼基。
實施例116.   如實施例113之半合成生物體,其中該tRNA包含至少一個為
Figure 02_image909
之非天然鹼基。
實施例117.   如實施例113之半合成生物體,其中該tRNA包含至少一個為
Figure 02_image911
之非天然鹼基。
實施例118.   如實施例77至107中任一實施例之半合成生物體,其進一步包含mRNA及tRNA。
實施例119.   如實施例77至98中任一實施例之半合成生物體,其中該生物體進一步包含(a) 核苷三磷酸轉運蛋白,(b) mRNA,(c) tRNA,(d) tRNA合成酶,及(e) RNA聚合酶,且其中該生物體不表現具有DNA重組修復功能之蛋白質。
實施例120.   如實施例119之半合成生物體,其中該核苷三磷酸轉運蛋白係Pt NTT2,該tRNA合成酶係巴氏甲烷八疊球菌吡咯離胺醯基-tRNA合成酶(Mb PylRS),且該RNA聚合酶係T7 RNAP。
實施例121.   如實施例119之半合成生物體,其中該生物體係大腸桿菌且該生物體不表現RecA。
實施例122.   如實施例118或119之半合成生物體,其中該生物體過表現一或多種DNA聚合酶。
實施例123.   如實施例122之半合成生物體,其中該生物體過表現DNA Pol II。
實施例124.   如實施例77至123中任一實施例之半合成生物體,其中至少一個非天然鹼基進一步包含非天然糖部分。
實施例125.   如實施例124之半合成生物體,其中該非天然糖部分選自由以下組成之群: 2’位之修飾: OH、經取代之低碳烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3 、OCN、Cl、Br、CN、CF3 、OCF3 、SOCH3 、SO2 CH3 、ONO2 、NO2 、N3 、NH2 F; O-烷基、S-烷基、N-烷基; O-烯基、S-烯基、N-烯基; O-炔基、S-炔基、N-炔基; O-烷基-O-烷基、2’-F、2’-OCH3 、2’-O(CH2 )2 OCH3 ,其中該烷基、烯基及炔基可為經取代或未經取代之C1 -C10 、烷基、C2 -C10 烯基、C2 -C10 炔基、-O[(CH2 )n O]m CH3 、-O(CH2 )n OCH3 、-O(CH2 )n NH2 、-O(CH2 )n CH3 、-O(CH2 )n -NH2 及-O(CH2 )n ON[(CH2 )n CH3 )]2 ,其中n及m係1至約10; 及/或5’位之修飾: 5’-乙烯基、5’-甲基(R或S); 4’位之修飾: 4’-S、雜環烷基、雜環烷芳基、胺基烷基胺基、聚烷基胺基、經取代之矽基、RNA切割基團、報導基因基團、嵌入劑、用於改良寡核苷酸之藥物動力學性質之基團或用於改良寡核苷酸之藥效學性質之基團及其任何組合。
實施例126.   如實施例77至125中任一實施例之半合成生物體,其中至少一個非天然鹼基由DNA聚合酶識別。
實施例127.   如實施例73至126中任一實施例之半合成生物體,其中至少一個非天然鹼基由RNA聚合酶識別。
實施例128.   一種組合物,其包含具有以下結構核鹼基類似物:
Figure 02_image913
, 其中 每一X獨立地係碳或氮; R2 係可選的且當存在時獨立地係氫、烷基、烯基、炔基、甲氧基、甲硫醇、甲硒基、鹵素、氰基或疊氮基; 其中每一Y獨立地係硫、氧、硒或二級胺; 其中每一E獨立地係氧、硫或硒;且 其中波形線指示與核糖基、去氧核糖基或二去氧核糖基部分或其類似物之鍵結點,其中該核糖基、去氧核糖基或二去氧核糖基部分或其類似物呈游離形式,連接至單-磷酸酯、二磷酸酯或三磷酸酯基團,視情況包含α-硫代三磷酸酯、β-硫代三磷酸酯或γ-硫代三磷酸酯基團,或包括於RNA或DNA或RNA類似物或DNA類似物中。
實施例129.   如實施例128之組合物,其中該核糖基或去氧核糖基部分帶有鍵結至其5’-羥基之三磷酸酯或α-硫代三磷酸酯基團。
實施例130.   如實施例128或129中任一實施例之組合物,其中該核糖基或去氧核糖基部分分別納入RNA或DNA寡核苷酸股中,或該核糖基或去氧核糖基部分或其類似物納入聚核苷酸中。
實施例131.   如實施例128或130中任一實施例之組合物,其中X係碳。
實施例132.   如實施例128至131中任一實施例之組合物,其中E係硫。
實施例133.   如實施例128至132中任一實施例之組合物,其中Y係硫。
實施例134.   如實施例128之組合物,其中該核鹼基包含結構
Figure 02_image915
實施例135.   如實施例128至134中任一實施例之組合物,其中該核鹼基結合至互補鹼基配對核鹼基以形成非天然鹼基對(UBP)。
實施例136.   如實施例135之組合物,其中該互補鹼基配對核鹼基係選自:
Figure 02_image917
Figure 02_image919
實施例137.   一種雙股寡核苷酸雙螺旋體,其中第一寡核苷酸股包含實施例128至134中任一實施例之化合物,且第二互補寡核苷酸股包含互補鹼基配對核鹼基於其互補鹼基配對位點。
實施例138.   如實施例137之雙股寡核苷酸雙螺旋體,其中該第一寡核苷酸股包含
Figure 02_image921
;且該第二股包含選自由以下組成之群之互補鹼基配對核鹼基於其互補鹼基配對位點:
Figure 02_image923
,
Figure 02_image925
實施例139.   一種包含實施例128至136中任一實施例之核鹼基類似物的轉運RNA (tRNA),其包含: 反密碼子,其中該反密碼子包含該核鹼基類似物;及 識別元件,其中該識別元件促進tRNA藉由胺基醯基tRNA合成酶選擇性加載非天然胺基酸。
實施例140.   如實施例139之tRNA,其中該核鹼基類似物位於tRNA之反密碼子區中。
實施例141.   如實施例140之tRNA,其中該核鹼基類似物位於該反密碼子之第一位置中。
實施例142.   如實施例140之tRNA,其中該核鹼基類似物位於該反密碼子之第二位置中。
實施例143.   如實施例140之tRNA,其中該核鹼基類似物位於該反密碼子之第三位置中。
實施例144.   如實施例139之tRNA,其中該胺基醯基tRNA合成酶係衍生自嗜熱生物。
實施例145.   如實施例139之tRNA,其中該胺基醯基tRNA合成酶係衍生自甲烷八疊球菌或其變體。
實施例146.   如實施例139之tRNA,其中該胺基醯基tRNA合成酶係衍生自甲烷球菌屬(甲烷暖球菌屬)或其變體。
實施例147.   如實施例139之tRNA,其中該非天然胺基酸包含芳香族部分。
實施例148.   如實施例139之tRNA,其中該非天然胺基酸係離胺酸衍生物。
實施例149.   如實施例139之tRNA,其中該非天然胺基酸係苯丙胺酸衍生物。
實施例150.   如實施例139之tRNA,其中該非天然胺基酸係選自由以下組成之群:N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)、N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)、BCN-L-離胺酸、降莰烯離胺酸、TCO-離胺酸、甲基四嗪離胺酸、烯丙基氧基羰基離胺酸、2-胺基-8-側氧基壬酸、2-胺基-8-側氧基辛酸、對-乙醯基-L-苯丙胺酸、對-疊氮基甲基-L-苯丙胺酸(pAMF)、對-碘-L-苯丙胺酸、間-乙醯基苯丙胺酸、2-胺基-8-側氧基壬酸、對-炔丙基氧基苯丙胺酸、對-炔丙基-苯丙胺酸、3-甲基-苯丙胺酸、L-多巴、氟化苯丙胺酸、異丙基-L-苯丙胺酸、對-疊氮基-L-苯丙胺酸、對-醯基-L-苯丙胺酸、對-苯甲醯基-L-苯丙胺酸、對-溴苯丙胺酸、對-胺基-L-苯丙胺酸、異丙基-L-苯丙胺酸、O-烯丙基酪胺酸、O-甲基-L-酪胺酸、O-4-烯丙基-L-酪胺酸、4-丙基-L-酪胺酸、膦醯基酪胺酸、三-O-乙醯基-GlcNAcp-絲胺酸、L-磷絲胺酸、膦醯基絲胺酸、L-3-(2-萘基)丙胺酸、2-胺基-3-((2-((3-(苄基氧基)-3-側氧基丙基)胺基)乙基)硒烷基)丙酸、2-胺基-3-(苯基硒烷基)丙酸及硒基半胱胺酸。
實施例151.   一種包含下式之結構, N1 - Zx - N2 其中N1係核苷酸或其類似物或末端磷酸酯基團;其中N2係核苷酸或其類似物或末端羥基;其中Z係實施例128至136中任一實施例之化合物,且其中x係1至20之整數。
實施例152.   如實施例151之結構,其中該結構編碼基因。
實施例153.   如實施例151之結構,其中Zx位於該基因之轉譯區。
實施例154.   如實施例151之結構,其中Zx位於該基因之非轉譯區。
實施例155.   如實施例151之結構,其中該結構進一步包含5’或3’非轉譯區(UTR)。
實施例156.   如實施例151之結構,其中該結構進一步包含終止子區。
實施例157.   如實施例151之結構,其中該結構進一步包含啟動子區。
實施例158.   一種聚核苷酸庫,其中該庫包含至少5000個獨特聚核苷酸,且其中每一聚核苷酸包含實施例128至136中任一實施例之至少一種化合物。
實施例159.   如實施例158之庫,其中該聚核苷酸庫編碼至少一個基因。
實施例160.   一種核苷三磷酸,其中核鹼基係選自
Figure 02_image927
Figure 02_image929
Figure 02_image931
實施例161.   如實施例160之核苷三磷酸,其中該核苷包含核糖。
實施例162.   如實施例160之核苷三磷酸,其中該核苷包含去氧核糖。
實施例163.   如實施例160至162中任一實施例之核苷三磷酸,其中該核鹼基係選自
Figure 02_image933
Figure 02_image935
Figure 02_image937
實施例164.   如實施例163之核苷三磷酸,其中該核鹼基係選自
Figure 02_image939
Figure 02_image941
實施例165.   如實施例163之核苷三磷酸,其中該核鹼基係選自
Figure 02_image943
Figure 02_image945
實施例166.   如實施例163之核苷三磷酸,其中該核鹼基係選自
Figure 02_image947
Figure 02_image949
實施例167.   如實施例165之核苷三磷酸,其中該核鹼基係
Figure 02_image951
實施例168.   如實施例167之核苷三磷酸,其中該核苷包含核糖。
實施例169.   如實施例167之核苷三磷酸,其中該核苷包含去氧核糖。
實施例170.   如實施例165之核苷三磷酸,其中該核鹼基係
Figure 02_image953
實施例171.   如實施例170之核苷三磷酸,其中該核苷包含核糖。
實施例172.   如實施例170之核苷三磷酸,其中該核苷包含去氧核糖。
實施例173.   如實施例165之核苷三磷酸,其中該核鹼基係
Figure 02_image955
實施例174.   如實施例173之核苷三磷酸,其中該核苷包含核糖。
實施例175.   如實施例173之核苷三磷酸,其中該核苷包含去氧核糖。
本文闡述產生包含非天然胺基酸之蛋白質之活體內方法,該方法包含:轉錄包含第一非天然鹼基及互補第二非天然鹼基之DNA模板以將第三非天然鹼基納入mRNA中,該第三非天然鹼基之組態可以與該第一非天然鹼基形成第一非天然鹼基對;轉錄該DNA模板以將第四非天然鹼基納入tRNA中,其中該第四非天然鹼基之組態可以與該第二非天然鹼基形成第二非天然鹼基對,其中該第一非天然鹼基對及該第二非天然鹼基對不相同;及自該mRNA及該tRNA轉譯蛋白質,其中該蛋白質包含非天然胺基酸。在一些實施例中,活體內方法包含使用半合成生物體。在一些實施例中,生物體包含微生物體。在一些實施例中,生物體包含細菌。在一些實施例中,生物體包含革蘭氏陽性細菌。在一些實施例中,生物體包含革蘭氏陰性細菌。在一些實施例中,生物體包含大腸桿菌。在一些實施例中,至少一個非天然鹼基係選自由以下組成之群:(i) 2-硫尿嘧啶、2-硫-胸腺嘧啶、2’-去氧尿苷、4-硫-尿嘧啶、4-硫-胸腺嘧啶、尿嘧啶-5-基、次黃嘌呤-9-基(I)、5-鹵基尿嘧啶;5-丙炔基-尿嘧啶、6-偶氮基-胸腺嘧啶、6-偶氮基-尿嘧啶、5-甲基胺基甲基尿嘧啶、5-甲氧基胺基甲基-2-硫尿嘧啶、假尿嘧啶、尿嘧啶-5-乙醛酸甲基酯、尿嘧啶-5-乙醛酸、5-甲基-2-硫尿嘧啶、3-(3-胺基-3-N-2-羧基丙基)尿嘧啶、5-甲基-2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、5’-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、尿嘧啶-5-氧基乙酸、5-(羧基羥基甲基)尿嘧啶、5-羧基甲基胺基甲基-2-硫尿苷、5-羧基甲基胺基甲基尿嘧啶或二氫尿嘧啶;(ii)      5-羥基甲基胞嘧啶、5-三氟甲基胞嘧啶、5-鹵基胞嘧啶、5-丙炔基胞嘧啶、5-羥基胞嘧啶、環胞嘧啶、胞嘧啶阿拉伯糖苷、5,6-二氫胞嘧啶、5-硝基胞嘧啶、6-偶氮基胞嘧啶、氮雜胞嘧啶、N4-乙基胞嘧啶、3-甲基胞嘧啶、5-甲基胞嘧啶、4-乙醯基胞嘧啶、2-硫胞嘧啶、啡噁嗪胞苷([5,4-b][1,4]苯并噁嗪-2(3H)-酮)、啡噻嗪胞苷(1H-嘧啶并[5,4-b][1,4]苯并噻嗪-2(3H)-酮)、啡噁嗪胞苷(9-(2-胺基乙氧基)-H-嘧啶并[5,4-b][1,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)或吡啶并吲哚胞苷(H-吡啶并[3’,2’:4,5]吡咯并[2,3-d]嘧啶-2-酮);(iii) 2-胺基腺嘌呤、2-丙基腺嘌呤、2-胺基-腺嘌呤、2-F-腺嘌呤、2-胺基-丙基-腺嘌呤、2-胺基-2’-去氧腺苷、3-去氮腺嘌呤、7-甲基腺嘌呤、7-去氮-腺嘌呤、8-氮雜腺嘌呤、8-鹵基、8-胺基、8-硫醇、8-硫代烷基及8-羥基取代之腺嘌呤、N6-異戊烯基腺嘌呤、2-甲基腺嘌呤、2,6-二胺基嘌呤、2-甲硫基-N6-異戊烯基腺嘌呤或6-氮雜-腺嘌呤;(iv) 2-甲基鳥嘌呤、鳥嘌呤之2-丙基及烷基衍生物、3-去氮鳥嘌呤、6-硫-鳥嘌呤、7-甲基鳥嘌呤、7-去氮鳥嘌呤、7-去氮鳥苷、7-去氮-8-氮雜鳥嘌呤、8-氮雜鳥嘌呤、8-鹵基、8-胺基、8-硫醇、8-硫代烷基及8-羥基取代之鳥嘌呤、1-甲基鳥嘌呤、2,2-二甲基鳥嘌呤、7-甲基鳥嘌呤或6-氮雜-鳥嘌呤;及(v)    次黃嘌呤、黃嘌呤、1-甲基肌苷、Q核苷、β-D-半乳糖基Q核苷、肌苷、β-D-甘露糖基Q核苷、懷丁氧苷、羥基脲、(acp3)w、2-胺基吡啶或2-吡啶酮。在一些實施例中,該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image957
Figure 02_image959
Figure 02_image961
Figure 02_image963
。在一些實施例中,該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image965
Figure 02_image967
Figure 02_image969
Figure 02_image971
。在一些實施例中,該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image973
Figure 02_image975
Figure 02_image977
。在一些實施例中,該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image979
Figure 02_image981
Figure 02_image983
。在一些實施例中,該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image985
Figure 02_image987
Figure 02_image989
。僅顯示核苷或核苷酸之鹼基,為清晰起見,省略糖部分及視情況任何磷酸酯殘基。此處及貫穿全文,波形線代表與去氧-或核糖核苷或核苷酸之連接,其中核苷酸之糖部分可進一步經修飾。在一些實施例中,該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image991
Figure 02_image993
。在一些實施例中,該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image995
Figure 02_image997
。在一些實施例中,該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image999
Figure 02_image1001
。在一些實施例中,該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自由以下組成之群:
Figure 02_image1003
Figure 02_image1005
。在一些實施例中,該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係
Figure 02_image1007
。在一些實施例中,該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係選自:
Figure 02_image1009
Figure 02_image1011
Figure 02_image1013
。在一些實施例中,該等第一或第二非天然鹼基係
Figure 02_image1015
。在一些實施例中,該等第一或第二非天然鹼基係
Figure 02_image1017
。在一些實施例中,該第一非天然鹼基係
Figure 02_image1019
且該第二非天然鹼基係
Figure 02_image1021
。在一些實施例中,該第一非天然鹼基係
Figure 02_image1023
且該第二非天然鹼基係
Figure 02_image1025
。在一些實施例中,該第三或第四非天然鹼基係
Figure 02_image1027
。在一些實施例中,該第三非天然鹼基係
Figure 02_image1029
。在一些實施例中,該第四非天然鹼基係
Figure 02_image1031
。在一些實施例中,該第三或第四非天然鹼基係
Figure 02_image1033
Figure 02_image1035
。在一些實施例中,該第三非天然鹼基係
Figure 02_image1037
Figure 02_image1039
。在一些實施例中,該第四非天然鹼基係
Figure 02_image1041
Figure 02_image1043
。在一些實施例中,該第一非天然鹼基係
Figure 02_image1045
,該第二非天然鹼基係
Figure 02_image1047
,該第三非天然鹼基係
Figure 02_image1049
,且該第四非天然鹼基係
Figure 02_image1051
Figure 02_image1053
。在一些實施例中,該第一非天然鹼基係
Figure 02_image1055
,該第二非天然鹼基係
Figure 02_image1057
,該第三非天然鹼基係
Figure 02_image1059
,且該第四非天然鹼基係
Figure 02_image1061
Figure 02_image1063
。在一些實施例中,該第一非天然鹼基係
Figure 02_image1065
,該第二非天然鹼基係
Figure 02_image1067
,該第三非天然鹼基係
Figure 02_image1069
Figure 02_image1071
且該第四非天然鹼基係
Figure 02_image1073
。在一些實施例中,該第三非天然鹼基係
Figure 02_image1075
Figure 02_image1077
。在一些實施例中,該第四非天然鹼基係
Figure 02_image1079
。在一些實施例中,該第一非天然鹼基係
Figure 02_image1081
,該第二非天然鹼基係
Figure 02_image1083
,該第三非天然鹼基係
Figure 02_image1085
Figure 02_image1087
,且該第四非天然鹼基係
Figure 02_image1089
。在一些實施例中,該第三非天然鹼基及該第四非天然鹼基包含核糖。在一些實施例中,該第三非天然鹼基及該第四非天然鹼基包含去氧核糖。在一些實施例中,該等第一及第二非天然鹼基包含去氧核糖。在一些實施例中,該等第一及第二非天然鹼基包含去氧核糖且該第三非天然鹼基及該第四非天然鹼基包含核糖。在一些實施例中,DNA模板包含至少一個選自由以下組成之群之非天然鹼基對(UBP):
Figure 02_image1091
Figure 02_image1093
。在一些實施例中,DNA模板包含至少一個為dNaM-d5SICS之非天然鹼基對(UBP)。在一些實施例中,DNA模板包含至少一個為dCNMO-dTPT3之非天然鹼基對(UBP)。在一些實施例中,DNA模板包含至少一個為dNaM-dTPT3之非天然鹼基對(UBP)。在一些實施例中,DNA模板包含至少一個為dPTMO-dTPT3之非天然鹼基對(UBP)。在一些實施例中,DNA模板包含至少一個選自由以下組成之群之非天然鹼基對(UBP):
Figure 02_image1095
Figure 02_image1097
;且其中該mRNA及該tRNA包含至少一個具有選自以下之非天然鹼基的非天然核糖核苷酸:
Figure 02_image1099
Figure 02_image1101
Figure 02_image1103
。在一些實施例中,DNA模板包含至少一個為dNaM -d5SICS 之非天然鹼基對(UBP)。在一些實施例中,DNA模板包含至少一個為dCNMO-dTPT3之非天然鹼基對(UBP)。在一些實施例中,DNA模板包含至少一個為dNaM-dTPT3之非天然鹼基對(UBP)。在一些實施例中,DNA模板包含至少一個為dPTMO-dTPT3之非天然鹼基對(UBP)。在一些實施例中,該mRNA及該tRNA包含選自
Figure 02_image1105
Figure 02_image1107
之非天然鹼基。在一些實施例中,該mRNA及該tRNA包含選自
Figure 02_image1109
Figure 02_image1111
之非天然鹼基。在一些實施例中,該mRNA包含為
Figure 02_image1113
之非天然鹼基。在一些實施例中,該mRNA包含為
Figure 02_image1115
之非天然鹼基。在一些實施例中,該mRNA包含為
Figure 02_image1117
之非天然鹼基。在一些實施例中,tRNA包含選自
Figure 02_image1119
Figure 02_image1121
之非天然鹼基。在一些實施例中,該tRNA包含為
Figure 02_image1123
之非天然鹼基。在一些實施例中,該tRNA包含為
Figure 02_image1125
之非天然鹼基。在一些實施例中,該tRNA包含為
Figure 02_image1127
之非天然鹼基。在一些實施例中,第一非天然鹼基包含dCNMO ,且第二非天然鹼基包含dTPT3。在一些實施例中,第三非天然鹼基包含NaM ,且第二非天然鹼基包含TAT1。在一些實施例中,第一非天然鹼基或第二非天然鹼基由DNA聚合酶識別。在一些實施例中,第三非天然鹼基或第四非天然鹼基由RNA聚合酶識別。在一些實施例中,蛋白質包含至少兩個非天然胺基酸。在一些實施例中,蛋白質包含至少三個非天然胺基酸。在一些實施例中,至少一個非天然胺基酸:係離胺酸類似物;包含芳香族側鏈;包含疊氮基;包含炔基;或包含醛或酮基。在一些實施例中,至少一個非天然胺基酸不包含芳香族側鏈。在一些實施例中,至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)、N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)、BCN-L-離胺酸、降莰烯離胺酸、TCO-離胺酸、甲基四嗪離胺酸、烯丙基氧基羰基離胺酸、2-胺基-8-側氧基壬酸、2-胺基-8-側氧基辛酸、對-乙醯基-L-苯丙胺酸、對-疊氮基甲基-L-苯丙胺酸(pAMF)、對-碘-L-苯丙胺酸、間-乙醯基苯丙胺酸、2-胺基-8-側氧基壬酸、對-炔丙基氧基苯丙胺酸、對-炔丙基-苯丙胺酸、3-甲基-苯丙胺酸、L-多巴、氟化苯丙胺酸、異丙基-L-苯丙胺酸、對-疊氮基-L-苯丙胺酸、對-醯基-L-苯丙胺酸、對-苯甲醯基-L-苯丙胺酸、對-溴苯丙胺酸、對-胺基-L-苯丙胺酸、異丙基-L-苯丙胺酸、O-烯丙基酪胺酸、O-甲基-L-酪胺酸、O-4-烯丙基-L-酪胺酸、4-丙基-L-酪胺酸、膦醯基酪胺酸、三-O-乙醯基-GlcNAcp-絲胺酸、L-磷絲胺酸、膦醯基絲胺酸、L-3-(2-萘基)丙胺酸、2-胺基-3-((2-((3-(苄基氧基)-3-側氧基丙基)胺基)乙基)硒烷基)丙酸、2-胺基-3-(苯基硒烷基)丙酸或硒基半胱胺酸。在一些實施例中,至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)及N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。在一些實施例中,至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)。在一些實施例中,至少一個非天然胺基酸包含N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。
本文闡述包含擴展遺傳字母之半合成生物體,其中遺傳字母包含至少三個獨特非天然鹼基。在一些實施例中,生物體包含微生物體。在一些實施例中,生物體包含細菌。在一些實施例中,生物體包含革蘭氏陽性細菌。在一些實施例中,生物體包含革蘭氏陽性細菌。在一些實施例中,生物體包含大腸桿菌。在一些實施例中,該等非天然鹼基中之至少一者係選自由以下組成之群:2-胺基腺嘌呤-9-基、2-胺基腺嘌呤、2-F-腺嘌呤、2-硫尿嘧啶、2-硫-胸腺嘧啶、2-硫胞嘧啶、腺嘌呤及鳥嘌呤之2-丙基及烷基衍生物、2-胺基-腺嘌呤、2-胺基-丙基-腺嘌呤、2-胺基吡啶、2-吡啶酮、2’-去氧尿苷、2-胺基-2’-去氧腺苷3-去氮鳥嘌呤、3-去氮腺嘌呤、4-硫-尿嘧啶、4-硫-胸腺嘧啶、尿嘧啶-5-基、次黃嘌呤-9-基(I)、5-甲基-胞嘧啶、5-羥基甲基胞嘧啶、黃嘌呤、次黃嘌呤、5-溴及5-三氟甲基尿嘧啶及胞嘧啶;5-鹵基尿嘧啶、5-鹵基胞嘧啶、5-丙炔基-尿嘧啶、5-丙炔基胞嘧啶、5-尿嘧啶、5-取代、5-鹵基、5-取代之嘧啶、5-羥基胞嘧啶、5-溴胞嘧啶、5-溴尿嘧啶、5-氯胞嘧啶、氯化胞嘧啶、環胞嘧啶、胞嘧啶阿拉伯糖苷、5-氟胞嘧啶、氟嘧啶、氟尿嘧啶、5,6-二氫胞嘧啶、5-碘胞嘧啶、羥基脲、碘尿嘧啶、5-硝基胞嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-氟尿嘧啶及5-碘尿嘧啶、腺嘌呤及鳥嘌呤之6-烷基衍生物、6-氮雜嘧啶、6-偶氮基-尿嘧啶、6-偶氮基胞嘧啶、氮雜胞嘧啶、6-偶氮基-胸腺嘧啶、6-硫-鳥嘌呤、7-甲基鳥嘌呤、7-甲基腺嘌呤、7-去氮鳥嘌呤、7-去氮鳥苷、7-去氮-腺嘌呤、7-去氮-8-氮雜鳥嘌呤、8-氮雜鳥嘌呤、8-氮雜腺嘌呤、8-鹵基、8-胺基、8-硫醇、8-硫代烷基及8-羥基取代之腺嘌呤及鳥嘌呤;N4-乙基胞嘧啶、N-2取代之嘌呤、N-6取代之嘌呤、O-6取代之嘌呤、增加雙螺旋體形成之穩定性之彼等、通用核酸、疏水核酸、混雜核酸、大小擴展之核酸、氟化核酸、三環嘧啶、啡噁嗪胞苷([5,4-b][1,4]苯并噁嗪-2(3H)-酮)、啡噻嗪胞苷(1H-嘧啶并[5,4-b][1,4]苯并噻嗪-2(3H)-酮)、G-夾、啡噁嗪胞苷(9-(2-胺基乙氧基)-H-嘧啶并[5,4-b][1,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并[3’,2’:4,5]吡咯并[2,3-d]嘧啶-2-酮)、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黃嘌呤、黃嘌呤、4-乙醯基胞嘧啶、5-(羧基羥基甲基)尿嘧啶、5-羧基甲基胺基甲基-2-硫尿苷、5-羧基甲基胺基甲基尿嘧啶、二氫尿嘧啶、β-D-半乳糖基Q核苷、肌苷、N6-異戊烯基腺嘌呤、1-甲基鳥嘌呤、1-甲基肌苷、2,2-二甲基鳥嘌呤、2-甲基腺嘌呤、2-甲基鳥嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鳥嘌呤、5-甲基胺基甲基尿嘧啶、5-甲氧基胺基甲基-2-硫尿嘧啶、β-D-甘露糖基Q核苷、5’-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-異戊烯基腺嘌呤、尿嘧啶-5氧基乙酸、懷丁氧苷、假尿嘧啶、Q核苷、2-硫胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-乙醛酸甲基酯、尿嘧啶-5-乙醛酸、5-甲基-2-硫尿嘧啶、3-(3-胺基-3-N-2-羧基丙基)尿嘧啶、(acp3)w及2,6-二胺基嘌呤及其中嘌呤或嘧啶鹼基經雜環置換之彼等。在一些實施例中,生物體包含DNA,其包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image1129
Figure 02_image1131
Figure 02_image1133
Figure 02_image1135
。在一些實施例中,包含非天然鹼基中之至少一者之DNA形成非天然鹼基對(UBP)。在一些實施例中,非天然鹼基對(UBP)係dCNMO-dTPT3、dNaM-dTPT3、dCNMO-dTAT1或dNaM-dTAT1。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image1137
Figure 02_image1139
Figure 02_image1141
。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image1143
Figure 02_image1145
Figure 02_image1147
。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image1149
Figure 02_image1151
Figure 02_image1153
。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image1155
Figure 02_image1157
Figure 02_image1159
。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image1161
Figure 02_image1163
Figure 02_image1165
。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image1167
Figure 02_image1169
。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image1171
Figure 02_image1173
。在一些實施例中,DNA包含至少一個選自由以下組成之群之非天然核鹼基:
Figure 02_image1175
Figure 02_image1177
。在一些實施例中,DNA包含至少一個選自
Figure 02_image1179
Figure 02_image1181
之非天然核鹼基。在一些實施例中,DNA包含至少兩個選自
Figure 02_image1183
Figure 02_image1185
之非天然核鹼基。在一些實施例中,DNA包含兩股,第一股包含至少一個為
Figure 02_image1187
之核鹼基,且第二股包含至少一個為
Figure 02_image1189
之核鹼基。在一些實施例中,DNA包含至少一個為
Figure 02_image1191
之非天然核鹼基。在一些實施例中,生物體表現核苷三磷酸轉運蛋白。在一些實施例中,生物體表現為Pt NTT2之核苷三磷酸轉運蛋白。在一些實施例中,生物體進一步表現tRNA合成酶。在一些實施例中,tRNA合成酶係巴氏甲烷八疊球菌吡咯離胺醯基-tRNA合成酶(Mb PylRS)。在一些實施例中,生物體表現核苷三磷酸轉運蛋白Pt NTT2且進一步表現tRNA合成酶巴氏甲烷八疊球菌吡咯離胺醯基-tRNA合成酶(Mb PylRS)。在一些實施例中,生物體進一步表現RNA聚合酶。在一些實施例中,RNA聚合酶係T7 RNAP。在一些實施例中,生物體不表現具有DNA重組修復功能之蛋白質。在一些實施例中,生物體係大腸桿菌且生物體不表現RecA。在一些實施例中,生物體過表現DNA聚合酶。在一些實施例中,生物體過表現DNA聚合酶II。在一些實施例中,半合成生物體進一步包含mRNA。在一些實施例中,mRNA包含至少一個選自
Figure 02_image1193
Figure 02_image1195
Figure 02_image1197
之非天然鹼基。在一些實施例中,mRNA包含至少一個為
Figure 02_image1199
之非天然鹼基。在一些實施例中,mRNA包含至少一個為
Figure 02_image1201
之非天然鹼基。在一些實施例中,mRNA包含至少一個為
Figure 02_image1203
之非天然鹼基。在一些實施例中,半合成生物體進一步包含tRNA。在一些實施例中,tRNA包含至少一個選自
Figure 02_image1205
Figure 02_image1207
之非天然鹼基。在一些實施例中,tRNA包含至少一個為
Figure 02_image1209
之非天然鹼基。在一些實施例中,tRNA包含至少一個為
Figure 02_image1211
之非天然鹼基。在一些實施例中,tRNA包含至少一個為
Figure 02_image1213
之非天然鹼基。在一些實施例中,半合成生物體進一步包含mRNA及/或tRNA。在一些實施例中,生物體進一步包含(a) 核苷三磷酸轉運蛋白,(b) mRNA,(c) tRNA,(d) tRNA合成酶,及(e) RNA聚合酶,且其中生物體不表現具有DNA重組修復功能之蛋白質。在一些實施例中,核苷三磷酸轉運蛋白係Pt NTT2,tRNA合成酶係巴氏甲烷八疊球菌吡咯離胺醯基-tRNA合成酶(Mb PylRS),且RNA聚合酶係T7 RNAP。在一些實施例中,生物體係大腸桿菌且生物體不表現RecA。在一些實施例中,生物體過表現一或多種DNA聚合酶。在一些實施例中,生物體過表現一種DNA Pol II。在一些實施例中,至少一個非天然鹼基進一步包含非天然糖部分。在一些實施例中,非天然糖部分係選自由以下組成之群:2’位之修飾:OH、經取代之低碳烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3 、OCN、Cl、Br、CN、CF3 、OCF3 、SOCH3 、SO2 CH3 、ONO2 、NO2 、N3 、NH2 F;O-烷基、S-烷基、N-烷基;O-烯基、S-烯基、N-烯基;O-炔基、S-炔基、N-炔基;O-烷基-O-烷基、2’-F、2’-OCH3 、2’-O(CH2 )2 OCH3 (其中烷基、烯基及炔基可為經取代或未經取代之C1 -C10 烷基、C2 -C10 烯基、C2 -C10 炔基)、-O[(CH2 )n O]m CH3 、-O(CH2 )n OCH3 、-O(CH2 )n NH2 、-O(CH2 )n CH3 、-O(CH2 )n -NH2 及-O(CH2 )nON[(CH2 )n CH3 )]2,其中n及m係1至約10;及/或5’位之修飾:5’-乙烯基、5’-甲基(R或S);4’位之修飾:4’-S、雜環烷基、雜環烷芳基、胺基烷基胺基、聚烷基胺基、經取代之矽基、RNA切割基團、報導基因基團、嵌入劑、用於改良寡核苷酸之藥物動力學性質之基團、或用於改良寡核苷酸之藥效學性質之基團及其任何組合。在一些實施例中,至少一個非天然鹼基由DNA聚合酶識別。在一些實施例中,至少一個非天然鹼基由RNA聚合酶識別。
本文闡述組合物,其包含具有以下結構之核鹼基類似物:
Figure 02_image1215
,其中每一X獨立地係碳或氮;R2 係可選的且當存在時獨立地係氫、烷基、烯基、炔基、甲氧基、甲硫醇、甲硒基、鹵素、氰基或疊氮基;其中每一Y獨立地係硫、氧、硒或二級胺;其中每一E獨立地係氧、硫或硒;且其中波形線指示與核糖基、去氧核糖基或二去氧核糖基部分或其類似物之鍵結點,其中核糖基、去氧核糖基或二去氧核糖基部分或其類似物呈游離形式,連接至單-磷酸酯、二磷酸酯或三磷酸酯基團,視情況包含α-硫代三磷酸酯、β-硫代三磷酸酯或γ-硫代三磷酸酯基團,或包括於RNA或DNA或RNA類似物或DNA類似物中。在一些實施例中,核糖基或去氧核糖基部分帶有鍵結至其5’-羥基之三磷酸酯或α-硫代三磷酸酯基團。在一些實施例中,核糖基或去氧核糖基部分分別納入RNA或DNA寡核苷酸股中,或核糖基或去氧核糖基部分或其類似物納入RNA或DNA類似物中。在一些實施例中,X係碳。在一些實施例中,E係硫。在一些實施例中,Y係硫。在一些實施例中,核鹼基包含結構
Figure 02_image1217
。在一些實施例中,核鹼基包含結構
Figure 02_image1219
。在一些實施例中,核鹼基與互補核鹼基配對以形成非天然鹼基對(UBP)。在一些實施例中,互補鹼基配對核鹼基係選自:
Figure 02_image1221
Figure 02_image1223
本文闡述雙股寡核苷酸雙螺旋體,其中第一寡核苷酸股包含本文所述化合物,且第二互補寡核苷酸股包含互補鹼基配對核鹼基於其互補鹼基配對位點。在一些實施例中,第一寡核苷酸股包含
Figure 02_image1225
;且第二股包含選自由以下組成之群之互補鹼基配對核鹼基於其互補鹼基配對位點:
Figure 02_image1227
Figure 02_image1229
本文闡述包含本文所述核糖核鹼基類似物之轉運RNA (tRNA),其包含:反密碼子,其中反密碼子包含核糖核鹼基類似物;及識別元件,其中識別元件促進tRNA藉由胺基醯基tRNA合成酶選擇性加載非天然胺基酸。在tRNA之一些實施例中,核鹼基類似物位於tRNA之反密碼子區中。在tRNA之一些實施例中,核鹼基類似物位於反密碼子之第一位置中。在tRNA之一些實施例中,核鹼基類似物位於反密碼子之第二位置中。在tRNA之一些實施例中,核鹼基類似物位於反密碼子之第三位置中。在tRNA之一些實施例中,胺基醯基tRNA合成酶係衍生自嗜熱生物。在tRNA之一些實施例中,胺基醯基tRNA合成酶係衍生自甲烷八疊球菌或其變體。在tRNA之一些實施例中,胺基醯基tRNA合成酶係衍生自甲烷球菌屬(甲烷暖球菌屬)或其變體。在tRNA之一些實施例中,非天然胺基酸包含芳香族部分。在tRNA之一些實施例中,非天然胺基酸係離胺酸衍生物。在tRNA之一些實施例中,非天然胺基酸係苯丙胺酸衍生物。在tRNA之一些實施例中,非天然胺基酸係選自由以下組成之群:N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)、N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)、BCN-L-離胺酸、降莰烯離胺酸、TCO-離胺酸、甲基四嗪離胺酸、烯丙基氧基羰基離胺酸、2-胺基-8-側氧基壬酸、2-胺基-8-側氧基辛酸、對-乙醯基-L-苯丙胺酸、對-疊氮基甲基-L-苯丙胺酸(pAMF)、對-碘-L-苯丙胺酸、間-乙醯基苯丙胺酸、2-胺基-8-側氧基壬酸、對-炔丙基氧基苯丙胺酸、對-炔丙基-苯丙胺酸、3-甲基-苯丙胺酸、L-多巴、氟化苯丙胺酸、異丙基-L-苯丙胺酸、對-疊氮基-L-苯丙胺酸、對-醯基-L-苯丙胺酸、對-苯甲醯基-L-苯丙胺酸、對-溴苯丙胺酸、對-胺基-L-苯丙胺酸、異丙基-L-苯丙胺酸、O-烯丙基酪胺酸、O-甲基-L-酪胺酸、O-4-烯丙基-L-酪胺酸、4-丙基-L-酪胺酸、膦醯基酪胺酸、三-O-乙醯基-GlcNAcp-絲胺酸、L-磷絲胺酸、膦醯基絲胺酸、L-3-(2-萘基)丙胺酸、2-胺基-3-((2-((3-(苄基氧基)-3-側氧基丙基)胺基)乙基)硒烷基)丙酸、2-胺基-3-(苯基硒烷基)丙酸及硒基半胱胺酸。
本文闡述包含下式之結構:      N1 - Zx - N2,其中N1係核苷酸或其類似物或末端磷酸酯基團;其中N2係核苷酸或其類似物或末端羥基;其中Z係本文所述化合物,且其中x係1至20之整數。在一些實施例中,該結構編碼基因。在一些實施例中,Zx位於基因之編碼區中。在一些實施例中,Zx位於密碼子中。在一些實施例中,該結構進一步包含5’或3’非轉譯區(UTR)。在一些實施例中,該結構進一步包含終止子區。在一些實施例中,該結構進一步包含啟動子區。
本文闡述聚核苷酸庫,其中該等庫包含至少5000個獨特聚核苷酸,且其中每一聚核苷酸包含至少一個本文所述之非天然核鹼基。在一些實施例中,聚核苷酸庫編碼至少一個基因。
本文闡述核苷三磷酸,其中核鹼基係選自
Figure 02_image1231
Figure 02_image1233
Figure 02_image1235
。在一些實施例中,核苷包含核糖。在一些實施例中,核苷包含去氧核糖。在一些實施例中,核鹼基係選自
Figure 02_image1237
Figure 02_image1239
Figure 02_image1241
。在一些實施例中,核鹼基係選自
Figure 02_image1243
Figure 02_image1245
Figure 02_image1247
。在一些實施例中,核鹼基係選自
Figure 02_image1249
Figure 02_image1251
。在一些實施例中,核鹼基係選自
Figure 02_image1253
Figure 02_image1255
。在一些實施例中,核鹼基係
Figure 02_image1257
。在一些實施例中,核苷包含核糖。在一些實施例中,核苷包含去氧核糖。在一些實施例中,核鹼基係
Figure 02_image1259
。在一些實施例中,核苷包含核糖。在一些實施例中,核苷包含去氧核糖。在一些實施例中,核鹼基係
Figure 02_image1261
。在一些實施例中,核苷包含核糖。在一些實施例中,核苷包含去氧核糖。實例
僅出於闡釋目的提供該等實例且並不限制本文所提供之申請專利範圍之範圍。
實例 1A 轉錄之複製及模板化之概述 .
用兩個dNaM -dTPT3 UBP構築質體,使得序列AX C (此處及貫穿全文,X 係指(d)NaM (d)NaM 類似物)經定位以模板化sfGFP mRNA之密碼子151 (sfGFP151 (AX C)),且序列GY T (此處及貫穿全文,Y 係指(d)TPT3 或(d)TPT3 類似物)經定位以模板化馬氏甲烷八疊球菌Pyl tRNA之反密碼子(tRNAPyl (GY T)),其藉由巴氏甲烷八疊球菌吡咯離胺醯基-tRNA合成酶(Mb PylRS)選擇性地加載ncAAN 6-(2-疊氮基乙氧基)-羰基-L-離胺酸(AzK)。該等質體用於轉變表現核苷三磷酸轉運蛋白Pt NTT2 (菌株YZ38)並具有編碼Mb PylRS之質體之大腸桿菌。轉變後,選擇菌落並在補充有dTPT3 TP (10 μM)及以不同濃度(150 μM、10 μM或5 μM)添加之七種不同dX TP之一(圖2)之液體培養基中生長至OD600為約1.0。然後將細胞稀釋至含有相同非天然去氧核糖核苷酸以及NaM TP (250 μM)、TPT3 TP (30 μM)及AzK (10 mM)之新鮮表現培養基中。短暫培育後,藉由添加異丙基-β-d-硫代半乳糖苷(IPTG,1 mM)誘導T7 RNAP及tRNAPyl(GY T)表現。再培育1 h後,藉由添加無水四環素(aTc,100 ng/mL)起始sfGFP151 (AX C)之表現。
PCR 產物之分析 . 2.5 h後,分離質體,且然後使用d5SICS TP及dNaM TP7之生物素化類似物使所關注基因獨立地進行PCR擴增。經由凝膠遷移率位移分析使用鏈黴抗生物素蛋白分析所得PCR產物,以將保留之UBP定量為總擴增產物之百分比位移(下文稱為鏈黴抗生物素蛋白凝膠位移分析) ( 3A 3B )。在所檢查之最高dX TP濃度(150 μM)下,對於每一dX TP類似物而言,sfGFP151 (AX C)基因中之保留率類似,自dNaM TP之99%變化至dMTMO TP之92%。tRNAPyl (GY T)基因內之保留率稍低,範圍為dMTMO TP之82%至dMMO2 TP之74%。在添加10 μM之每一dX TP的情況下,sfGFP151 (AX C)基因中之保留率範圍為d5FM TP之96%至dNaM TP之73%。對於tRNAPyl (GY T)基因,保留率通常亦稍低,範圍為d5FM TP及dPTMO TP之82%至dNaM TP之71%。在最低濃度(5 μM)下,sfGFP151 (AX C)基因中之保留率範圍為d5FM TP之94%至dMTMO TP之64%,且tRNAPyl (GY T)基因中之保留率範圍為d5FM TP之83%至dMTMO TP之71%。通常,在最高濃度下,所有dX TP皆在sfGFP基因內UBP之幾乎定量保留率情況下實施。然而,在較低濃度下,dCNMO- dTPT3 d5FM -dTPT3 及dPTMO -dTPT3 以顯著更高之保留率複製。tRNA基因中之保留率對dX TP濃度之依賴顯著較少。
報導基因蛋白質產生之分析 . 為了表徵產生之蛋白質之量,在誘導蛋白質表現後2.5 h量測對細胞生長正規化之大量培養物螢光( 3C )。在不存在AzK之情況下,螢光通常較低,較低濃度之dPTMO TP及dMTMO TP除外,其似乎稍高。當向培養基中添加AzK時,用150或10 μM之每一dX TP生長之細胞通常顯示顯著及類似之螢光程度,dNaM TP除外,其在10 μM下比在150 μM下顯示顯著更少之螢光。在最低濃度(5 μM)下,AzK之添加導致利用dMTMO TP觀察到之螢光較少,而在dCNMO TP、d5FM TP、dClMO TP、dMMO2 TP或dPTMO TP下保持相同。當僅提供5 μM dNaM TP時,未觀察到細胞生長。儘管在高濃度下類似,但在較低濃度下,使用每一dX TP類似物導致比使用dNaM TP更大之AzK依賴性螢光增加。具體而言,dCNMO TP、d5FM TP及dClMO TP顯示最大之AzK依賴性螢光增加。
報導基因蛋白質保真度之分析 . 為了直接評價非天然蛋白質產生之保真度,在誘導蛋白質表現後2.5 h收穫細胞,且純化產生之sfGFP,且使其與藉由四個PEG單元連接至TAMRA染料之二苯并環辛炔(DBCO)進行菌株促進之疊氮化物-炔環加成反應。除了用可檢測之螢光團標記含有ncAA之蛋白質之外,結合產生電泳遷移之位移,從而允許將含有AzK之蛋白質量化為產生之總蛋白質之百分比(即ncAA納入之保真度; 3D )。至於dNaM ,使用最高濃度(150 μM)之每一dX TP導致純化蛋白質之幾乎完全之位移,反映ncAA之高保真度納入。當在10 μM之dX TP存在下生長時,對於dCNMO TP、d5FM TP、dClMO TP、dMMO2 TP、dPTMO TP及dMTMO TP而言,ncAA納入之保真度仍較高,但對於dNaM TP而言,該保真度急劇下降。最後,在5 μM dX TP之濃度下,ncAA納入之保真度保持與在10 μM下觀察到之dCNMO TP、d5FM TP、dClMO TP、dMMO2 TP及dPTMOT P之保真度類似,但對於dMTMO TP而言則下降(再次由於存活率,在此濃度下不能量測到dNaM TP之保真度)。
結果 . 產生最大量之純非天然蛋白質(尤其在較低濃度下)之非天然鹼基係dCNMO TP及d5FM TP。然而,相對於d5FM TP,使用dCNMO TP先前已經顯示在更難複製序列中導致更高之UBP保留率。dCNMO -dTPT3 UBP勝任儲存及檢索增加之資訊。先前報導之SSO用UBP dNaM -dTPT3 、dPTMO -dTPT3 或dMTMO -dTPT3 儲存資訊,且使用NaM TP及TPT3 TP檢索該資訊。為了研究SSO之最佳化,使用先前及新近報導之去氧-及核糖核苷酸三磷酸類似物之集合檢查UBP之保留率、至sfGFP mRNA及tRNAPyl 之轉錄以及核糖體處之解碼。檢查用七個不同dX -dTPT3 UBP儲存資訊之能力。在每一情形下,UBP之鏈環境係相同的,其中dTPT3 及dX 分別位於sfGFP及tRNAPyl 基因之相應反義(模板)股中。在提供高濃度之每一dXTP之情況下,每一dX -dTPT3 UBP在mRNA基因中以高程度保留,其中在dMTMO TP之92%與dCNMO TP、dPTMO TP及dNaM TP之96%至99%之間變化。tRNA基因中之保留率有所減少,在74%至82%之間變化。隨著dX TP濃度降低,在tRNA基因中之保留率大致保持恆定,但在mRNA基因中以dX TP特異性方式降低,對於dMTMO TP降低至64%,但對於dCNMO TP及d5FM TP保持相對較高,為約94%。不受限於理論,tRNA及mRNA基因中之保留率之不同濃度依賴性可能係由於序列環境效應產生,該等序列環境效應導致mRNA中核苷酸插入之速率受限及tRNA基因中連續延伸之速率受限。用dNaM TP所觀察例外,其中10 μM下之保留率降低至73%,且當以5 μM提供dNaM TP時細胞不能存活。此外,用dCNMO TP及d5FM TP,在甚至最低之檢查濃度下,mRNA中之保留率仍較高(約93%)。不受限於理論,tRNA基因中保留率之損失會導致更少非天然蛋白產生,且可能更成問題的是,由於「近同源」天然tRNA對解碼非天然密碼子之競爭增加,導致ncAA納入之保真度降低。然而,ncAA納入之保真度與mRNA基因中之保留率相關(數據未顯示)。因此,數據展現,每一dX 以足夠之效率及保真度模板化tRNA之轉錄,而不限制非天然蛋白質產生之保真度。基於該等結果,d5FM -dTPT3 及dCNMO -dTPT3 係能夠增加資訊儲存之UBP,其相對於dNaM -dTPT3 之效用主要源自其在較低非天然三磷酸濃度下之較高保留率及蛋白質產生。
實例1B:轉錄之複製及模板化之詳細程序.
質體之Golden Gate組裝. 含有UBP (及若需要,編碼sfGFP或tRNAPyl 之基因)的插入物係如下產生:藉由人工合成(參見寡核苷酸合成)或由Synthorx贈送之非天然寡核苷酸O3及O6-12 (關於寡核苷酸序列,參見表S1)之PCR,使用dTPT3 TP及dNaM TP、及用以生成末端BsaI識別位點之引子P1-2 (當擴增O3或O7-12時)及P3-4 (當擴增O6時) (關於引子序列,參見表S1),一旦消解,該等末端BsaI識別位點即引入與用於sfGFP轉譯之適當目標質體p[sfGFP(gg)151 tRNAPyl (gg)] GG目標質體相容之突出,序列如下所示(SEQ ID NO: 2)。在PTC-200 Peltier熱循環儀(MJ Research)中實施PCR擴增。使用以下試劑濃度對模板寡核苷酸(0.025 ng/50 μL反應)進行PCR擴增:OneTaq標準反應緩衝液(1×, New England BioLabs)、dNTP (0.2 mM)、dTPT3 TP (0.1 mM)、dNaM TP (0.1 mM)、MgSO4 (1.2 mM)、引子(各自1 μM)及OneTaq聚合酶(1.25 U)。在不存在非天然三磷酸之情況下擴增天然寡核苷酸。該等在以下熱循環條件下擴增(時間表示為mm:ss):[94℃ 0:30 | 20× (94℃ 0:30 | 54℃ 0:30 | 68℃ 4:00)]。藉由旋轉管柱(DNA清潔及濃縮器-5;Zymo Research)純化其餘溶液,然後使用Infinite M200 Pro多模式微板讀數器(Tecan)藉由280 nm下之吸光度定量。 S1 . 本研究中使用之寡核苷酸及引子之序列,其中X 表示dNAMY 表示dTPT3
SEQ ID NO. 名稱 代碼 說明 序列 (5’-3’)
3 O1 GFP151 (TAG) sfGFP位置151琥珀密碼子 CTCGAGTACAACTTTAACTCACACAATGTATAG ATCACGGCAGACAAACAAAAGAATGGAATC
4 O2 GFP151 (TAC) sfGFP位置151天然(Tyr)密碼子 CTCGAGTACAACTTTAACTCACACAATGTATAC ATCACGGCAGACAAACAAAAGAATGGAATC
5 O3 GFP151 (AX C) sfGFP位置151非天然密碼子 CTCGAGTACAACTTTAACTCACACAATGTAAXC ATCACGGCAGACAAACAAAAGAATGGAATC
6 O4 Mm (CTA) 馬氏甲烷八疊球菌tRNAPyl 琥珀反密碼子 GAATCTAACCCGGCTGAACGGATTTAG AGTCCGTTCGATCTACATGATCAGG
7 O5 Mm (GTA)    馬氏甲烷八疊球菌tRNAPyl 天然(Tyr)反密碼子 GAATCTAACCCGGCTGAACGGATTTAC AGTCCGTTCGATCTACATGATCAGG   
8 O6 Mm (GY T) 馬氏甲烷八疊球菌tRNAPyl 非天然反密碼子 GAATCTAACCCGGCTGAACGGATTAXC AGTCCGTTCGATCTACATGATCAGG   
9 O7 GFP149 (AX C) sfGFP位置149非天然密碼子 CTCGAGTACAACTTTAACTCACACAXC GTATACATCACGGCAGACAAACAAAAGAATGGAATC
10 O8 GFP153 (AX C)    sfGFP位置153非天然密碼子 CTCGAGTACAACTTTAACTCACACAATGTATACATCAXC GCAGACAAACAAAAGAATGGAATC
11 O9 GFP149+151 (AX C×2) sfGFP位置149+151雙重非天然密碼子 CTCGAGTACAACTTTAACTCACACAXC GTAAXC ATCACGGCAGACAAACAAAAGAATGGAATC
12 O10 GFP151+153 (AX C×2) sfGFP位置151+153雙重非天然密碼子 CTCGAGTACAACTTTAACTCACACAATGTAAXC ATCAXC GCAGACAAACAAAAGAATGGAATC   
13 O11 GFP149+153 (AX C×2) sfGFP位置149+153雙重非天然密碼子 CTCGAGTACAACTTTAACTCACACAXC GTATACATCAXC GCAGACAAACAAAAGAATGGAATC   
14 O12 GFP149+151+153 (AX C×3) sfGFP位置149+151+153三重非天然密碼子 CTCGAGTACAACTTTAACTCACACAXC GTAAXC ATCAXC GCAGACAAACAAAAGAATGGAATC   
15 P1 YZ73 對於sfGFP F,插入PCR引子 ATGGGTCTCACACAAACTCGAGTACAACTTTAACTCACAC
16 P2 YZ74    對於sfGFP R,插入PCR引子 ATGGGTCTCGATTCCATTCTTTTGTTTGTCTGC
17 P3 YZ435    對於馬氏甲烷八疊球菌tRNAPyl F,插入PCR + 鏈黴抗生物素蛋白凝膠位移引子 ATGGGTCTCGAAACCTGATCATGTAGATCGAACGG   
18 P4 YZ436 對於馬氏甲烷八疊球菌tRNAPyl R,插入PCR + 鏈黴抗生物素蛋白凝膠位移引子 ATGGGTCTCATCTAACCCGGCTGAACGG   
19 P5 YZ351    sfGFP F之鏈黴抗生物素蛋白凝膠位移引子 CTCGAGTACAACTTTAACTCACAC
20 P6 YZ352 sfGFP R之鏈黴抗生物素蛋白凝膠位移引子 GATTCCATTCTTTTGTTTGTCTGC   
寡核苷酸合成 . 使用Expedite 8909基因合成儀、具有1,000 Å之孔徑之琥珀醯基連接之LCAA-CPG (長鏈烷基胺可控孔徑玻璃)管柱及納入dABz、dCBz、dGiBu及dT DNA亞磷醯胺之標準方案,以0.2 μmol規模合成經修飾寡核苷酸。使用以下手工偶合條件納入單體dNaM (15 min;CH3 CN中之四唑;>95%)。經修飾亞磷醯胺以50倍莫耳過量及0.05 M濃度在無水CH3 CN中使用。自固體載體裂解及去除保護基團係使用約30%之氨水溶液(55℃,16 h)完成。使用裝備有Hypersil Gold C18管柱(5 μm, 4.6 × 150 mm)之Vanquish UHPLC系統、使用0-50% B在25 min內實施DMT-on粗寡核苷酸之純化(緩衝液A = 0.05 M TEAA,pH 7;緩衝液B = 25% CH3CN中之H2O;流速= 1.0 mL/min)。彙集適當級分,蒸發至乾燥,之後去三苯甲基化(80% AcOH水溶液)及沈澱(NaOAc/NaClO4/丙酮,-80℃持續3 h)。藉由以分析模式(>90%)運行之離子對反相HPLC驗證純度。
在以下條件下以80 μL反應體積組裝質體:將目標質體(1 μg)、PCR插入物(4:1插入物: 質體莫耳比)、T4 DNA連接酶(532U)、BsaI-HF (53.4 U)及ATP (1 mM)在CutSmart緩衝液(1×,New England BioLabs)中合併,並在以下條件下熱循環(時間表示為mm:ss): [37℃ 20:00 | 40× (37℃ 5:00 | 16℃ 10:00 | 22℃ 5:00) | 37℃ 20:00 | 50℃ 15:00 | 70℃ 30:00]。在Golden Gate反應後,添加T5外核酸酶(13.3 U)及BsaI-HF (26.6 U),且將試劑在37℃下培育1 h以消解其餘DNA片段及未納入之目標質體。將組裝之質體在Zymo-Spin I管柱上純化,且使用Qubit dsDNA HS分析套組(Thermo Fisher Scientific)量化。
pGEX-MbPylRS TetR 轉變 YZ3/ML2 使SSO菌株YZ3或ML2之過夜培養物在補充有50 mM磷酸鉀及5 μg/mL氯黴素之2×YT (本文中在本部分中稱為「培養基」)中生長,然後在相同培養基中稀釋回OD600為0.03,且生長至OD600為0.4-0.6。然後將培養物在冰水上在振盪下冷卻5 min,然後藉由以3,200×g離心10 min來沈澱。然後將細胞重懸並用冰冷ddH2 O洗滌兩次,然後重懸於冰冷ddH2O中至OD600為50-60。將電感受態細胞(50 μL)及2 ng pGEX-MbPylRS TetR質體(SEQ ID NO: 1)轉移至預冷卻之電穿孔比色管(0.2-cm-間隙)中,且然後根據製造商之建議(電壓25 kV、電容器2.5 μF、電阻200Ω)電穿孔(Gene Pulser II;Bio-Rad),然後立即用950 μL培養基稀釋。然後將此電穿孔反應之等分試樣(40 μL)用培養基稀釋五倍至200 μL之最終體積,且然後允許在37℃下回收1 h。將兩倍回收稀釋物平鋪於補充有50 mM磷酸鉀、5 μg/mL氯黴素、100 μg/mL卡本西林(carbenicillin)及2% w/v瓊脂之固體2×YT培養基上,且然後允許在37℃下生長過夜。挑取單個菌落以接種補充有100 μg/mL卡本西林之液體培養基之培養物,且然後在-80℃下儲存於甘油(25% v/v)中。
dXTP 之活體內轉譯篩選 . 使攜帶pGEX-MbPylRS TetR質體之SSO菌株YZ3之過夜培養物在補充有50 mM磷酸鉀、5 μg/mL氯黴素及100 μg/mL卡本西林之2×YT (本文中在本部分中稱為「培養基」)中生長,然後在相同培養基中稀釋回OD600 為0.03,且生長至OD600 為0.4至0.6。然後將培養物在冰水上在振盪下冷卻15分鐘,然後藉由以3,200×g離心10 min來沈澱。然後將細胞重懸並用冰冷之ddH2O洗滌兩次,然後重懸於冰冷ddH2 O中至OD600為55-65。將電感受態細胞(50 μL)及1 ng在sfGFP及tRNAPyl基因內具有UBP之Golden Gate組裝之質體(參見質體之Golden Gate組裝)轉移至預冷卻之電穿孔比色管(0.2-cm-間隙)中,然後根據製造商之建議(電壓25 kV、電容器2.5 μF、電阻器200 Ω)電穿孔(Gene Pulser II;Bio-Rad),且然後立即用950 μL培養基稀釋。然後將轉變之等分試樣(40 μL)在補充有dNaM TP (150 μM)及dTPT3 TP (10 μM)之培養基中稀釋五倍至200 μL之最終體積,然後允許在37℃下振盪1 h回收。將兩倍回收稀釋物平鋪於補充有吉歐黴素(zeocin) (50 μg/mL)、dNaM TP (150 μM)、dTPT3 TP (10 μM)及瓊脂(2% w/v)之固體培養基上,然後在37℃下生長過夜。挑取單個菌落並在補充有50 μg/mL吉歐黴素之培養基(300 μL) (下文中在本部分中稱為「生長培養基」)中生長,且提供dNaM TP (150 μM)及dTPT3 TP (10 μM)。監測培養物之細胞生長(具有590/20 nm濾波器之Envision 2103多標記讀板器),且然後在OD600為約1.0下收集。使用ZR質體Prep套組(Zymo Research)使等分試樣(50 μL)經受質體分離。然後使分離之質體經受下述鏈黴抗生物素蛋白凝膠位移分析(使用引子P3-4及P5-6,表S1)以測定UBP保留率。然後將具有優良UBP保留率之菌落於-80℃下儲存於甘油(25% v/v)中。
將十倍稀釋之甘油原液重新平鋪於補充有dNaM TP (150 μM)、dTPT3 TP (10 μM)及2% w/v瓊脂之固體生長培養基上,然後在37℃下生長過夜。挑取單個菌落並在補充有相應dX TP (各種濃度)及dTPT3 TP (10 μM)之生長培養基(300 μL)中生長,然後監測細胞生長並在OD600為約1.0下下收集。一旦收集所有樣品,將樣品在冰上放置過夜。然後將樣品再稀釋至OD600為約0.1至300 μL之最終體積,並提供相應dXTP (各種濃度)及dTPT3 TP (10 μM)。沈澱未使用之其餘培養物,並在-80℃下儲存,以便隨後使用ZR質體Prep套組(Zymo Research)分離質體,以測定UBP保留率。當培養物達到OD600為約0.4-0.6時,向其提供NaM TP (250 μM)及TPT3 TP (30 μM)及AzK (10 mM) (或對於在AzK不存在下生長之培養物,ddH2 O)。在添加AzK之後,將樣品遮光以防止光降解。然後使該等樣品在37℃下生長20 min,之後添加1 mM IPTG,並在37℃下再生長1 h以誘導T7 RNAP及tRNAPyl及PylRS之轉錄。自此時刻開始,監測細胞之生長及螢光。然後用無水四環素(100 ng/mL)誘導sfGFP之表現。在37℃下再生長2.5 h後,收集細胞(50 μL用於質體分離以測定UBP保留率,230 μL用於sfGFP之親和純化),冷卻,且然後沈澱並在-80℃下儲存,之後評價UBP保留率及蛋白質純化。
XTP/YTP之活體內轉譯篩選. 使攜帶pGEX-MbPylRS TetR質體之SSO菌株ML2之過夜培養物在補充有50 mM磷酸鉀、5 μg/mL氯黴素及100 μg/mL卡本西林之2×YT (本文中在本部分中稱為「培養基」)中生長,然後在相同培養基中稀釋回OD600 為0.03,且生長至OD600 為0.4至0.6。然後將培養物在冰水上在振動下冷卻15分鐘,然後藉由以3,200×g離心10 min來沈澱。然後將細胞重懸並用冰冷之ddH2 O洗滌兩次,然後重懸於冰冷ddH2 O中至OD600 為55-65。將電感受態細胞(50 μL)及1 ng在sfGFP及tRNAPyl基因內具有UBP之Golden Gate組裝之質體(參見質體之Golden Gate組裝)轉移至預冷卻之電穿孔比色管(0.2-cm-間隙)中,然後根據製造商之建議(電壓25 kV、電容器2.5 μF、電阻器200 Ω)電穿孔(Gene Pulser II;Bio-Rad),且然後立即用950 μL培養基稀釋。然後將轉變之等分試樣(40 μL)在補充有dCNMO TP (25 μM)及dTPT3 TP (10 μM)之培養基中稀釋五倍達成200 μL之最終體積,然後允許在37℃下振盪1 h回收。將兩倍回收稀釋物平鋪於補充有吉歐黴素(50 μg/mL)、dCNMO TP (10 μM)、dTPT3 TP (10 μM)及瓊脂(2% w/v)之固體培養基上,然後在37℃下生長18 h。挑取單個菌落並在補充有50 μg/mL吉歐黴素之培養基(300 μL)中生長且提供dCNMO TP (25 μM)及dTPT3 TP (10 μM) (下文中在本部分中稱為「生長培養基」)。監測培養物之細胞生長(具有590/20 nm濾波器之Envision 2103多標記讀板器),且然後在OD600為約1.0下收集。使用ZR質體Prep套組(Zymo Research)使等分試樣(50 μL)經受質體分離。然後使分離之質體經受下述鏈黴抗生物素蛋白凝膠位移分析(使用引子P3-4及P5-6,表S1)以測定UBP保留率。
然後將具有優良UBP保留率之菌落在生長培養基中稀釋至OD600 為約0.01,並生長至OD600 為約0.4-0.6。然後將此培養物分成多個300 μL培養物,且為了篩選X TP類似物,向每一者提供相應X TP (25 μM或250 μM)或ddH2 O用於「-X TP」樣品、TPT3 TP (30 μM)及AzK (10 mM)。為了篩選Y TP類似物,為每一300 μL培養物提供相應Y TP (25 μM或250 μM)或ddH2 O用於「-Y TP」樣品、NaM TP (250 μM)及AzK (10 mM)。在添加AzK之後,將樣品遮光以防止光降解。然後使該等樣品在37℃下生長20 min,之後添加1 mM IPTG,並在37℃下再生長1 h以誘導T7 RNAP及tRNAPyl及PylRS之轉錄。自此時刻開始,監測細胞之生長及螢光。然後用無水四環素(100 ng/mL)誘導sfGFP之表現。在37℃下再生長3 h後,收集細胞(230 μL用於sfGFP之親和純化),冷卻,且然後沈澱並在-80℃下儲存,之後進行蛋白質純化。 S2 . 在針對核糖核苷酸篩選闡述之條件下蛋白質誘導3 h後觀察到之每一非天然核糖核苷酸之OD600值,經由比較所提供之三磷酸之高濃度與低濃度,毒性係明顯的。
   三磷酸 OD600
   不添加XTP 1.10 ± 0.03
   250 μM NaM 1.06 ± 0.06
      CNMO 1.07 ± 0.05
      MMO2 0.88 ± 0.05
      5FM 1.05 ± 0.04
      CIMO 1.01 ± 0.05
      BrMO 1.09 ± 0.05
      PTMO 1.09 ± 0.04
      MTMO 1.13 ± 0.07
      2OMe 1.04 ± 0.09
XTP    5F2OMe 1.16 ± 0.07
      NaM 1.16 ± 0.07
      CNMO 1.17 ± 0.07
      MMO2 1.06 ± 0.09
      5FM 1.16 ± 0.07
      CIMO 1.16 ± 0.05
   25 μM BrMO 1.12 ± 0.04
      PTMO 1.15 ± 0.05
      MTMO 1.21 ± 0.07
      2OMe 1.06 ± 0.05
      5F2OMe 1.14 ± 0.05
   不添加YTP 1.26 ± 0.16
   250 μM TPT3 0.73 ± 0.03
      SICS 0.90 ± 0.04
      FSICS 0.86 ± 0.04
      5SICS 1.06 ± 0.07
YTP    TAT1 1.28 ± 0.11
      TPT3 1.11 ± 0 05
      SICS 1.25 ± 0.10
   25 μM FSICS 1.15 ± 0.08
      5SICS 1.16 ± 0.09
      TAT1 1.68 ± 0.12
鏈黴抗生物素蛋白凝膠位移分析 . 在CFX Connect即時PCR檢測系統(Bio- Rad)中實施PCR擴增。在以下條件下以15 μL之總反應體積對進行質體微量製備物(minipreps)或Golden Gate組裝之質體(0.5 μL至2 μL,0.5 ng/μL至5 ng/μL)或含dNaM 之寡核苷酸(0.025 ng)進行PCR擴增:OneTaq標準反應緩衝液(1×, New England BioLabs)、dNTP (400 μM)、SYBR Green I (1×,Life Technologies)、MgSO4 (2.2 mM)、引子P3-4或P5-6 (各自1 μM,關於引子序列,參見表S1)、d5SICS TP (65 μM)、dMMO2BIO TP (65 μM;結構顯示於下文,為清晰起見,省略糖及磷酸酯)、Onetaq DNA聚合酶(0.27 U,New England BioLabs)、DeepVent DNA聚合酶(0.105 U,New England BioLabs)。
Figure 02_image1263
dMMO2BIO TP 使用以下熱循環條件(時間表示為mm:ss)對自轉譯實驗分離之質體進行擴增:[96℃ 5:00 | 20 × (95℃ 00:15 | 54℃ 00:15 | 68℃ 4:00]。之後,將鏈黴抗生物素蛋白(2.5 μL,2 μg /μL;Promega)與每一試劑(1 μL)混合且於室溫下培育5 min。將具有(3.5 μL)及不具有(1 μL)鏈黴抗生物素蛋白之樣品各自與上樣緩衝液混合且在6% (wt/vol)聚丙烯醯胺(29:1丙烯醯胺:雙-丙烯醯胺) Tris/硼酸鹽/EDTA (TBE)凝膠上在120V下分離約30 min。然後用1× SYBR金染料(Thermo Fisher)染色凝膠並使用裝備有520DF30濾餅器(Bio-Rad)之分子成像儀Gel Doc XR + (Bio-Rad)成像。然後可藉由比較每一泳道中之轉變帶對未轉變帶相對於輸入質體(用於起始轉變之質體)所獲得者的比率來測定UBP保留率。此分析先前已展現係定量的。
鏈黴抗生物素蛋白凝膠位移分析對各種因素(例如微量製備純度)敏感,且可重複多次,有時以更高之質體濃度,以獲得用於檢測UBP保留率之含有UBP之質體的合理擴增。在質體濃度過低之情形下,根據鏈黴抗生物素蛋白凝膠位移分析,UBP保留率似乎較低,並使用更多之微量製備質體重複。 S3. 自攜帶與檢索更高密度非天然遺傳資訊相關之構築體之細胞提取之質體的鏈黴抗生物素蛋白凝膠位移數據(UBP保留百分子)。
Figure 02_image1265
sfGFP 之親和純化 . 將自轉譯實驗收集之細胞糰粒重懸於BugBuster (100 µL 1×, EMD Millipore)中,並於室溫下振盪15 min。然後用緩衝液W (380 μL;50 mM HEPES pH 8、150mM NaCl、1 mM EDTA)稀釋細胞溶解物,且添加在緩衝液W中平衡之磁性Strep-Tactin珠粒(20 μL,5% (v/v) MagStrep 「3型」 XT珠粒之懸浮液,IBA Lifesciences)。將混合物於4℃下輕輕倒置30 min。然後用磁性支架拉下珠粒,且用緩衝液W (2 × 500 μL)洗滌,且然後添加25 μL BXT緩衝液(100 mM Tris-HCl pH 8,50 mM D-生物素),且將懸浮液於室溫下培育10 min,偶爾進行混合。再次將珠粒拉下以收集溶析液。使用Qubit蛋白質分析套組(Thermo Fisher Scientific)量化純化之蛋白質。
TAMRA 之無銅點擊結合 . 將純化之蛋白質(300 ng)與TAMRA-DBCO (0.1 mM,點擊化學工具;產品編號A131)混合,且添加水至6 μL之最終反應體積,並於室溫下培育過夜,且避光。在結合後,採取措施以使樣品、凝膠及印跡之光暴露最小化,從而使TAMRA之光漂白最小化。
sfGFP 之西方印跡法 . 將與TAMRA-DBCO結合之純化之蛋白質(300 ng)與上樣緩衝液/染料(250 mM Tris-HCl、30% (v/v)甘油、2% (w/v) SDS,pH6.8)混合(2:1 v:v),然後在95℃下加熱5 min。將蛋白梯(顏色預染之蛋白質標準品,寬範圍,New England BioLabs)及每一點擊反應之一部分(約60 ng蛋白質)上樣至SDS-PAGE凝膠(堆積凝膠:5% (w/v)丙烯醯胺:雙-丙烯醯胺29:1 (Fisher)、0.125 M Tris-HCl及0.1% SDS (pH 6.8) (ProtoGel堆積緩衝液,National Diagnostics);拆分凝膠:15% (w/v)丙烯醯胺:雙-丙烯醯胺29:1 (Fisher)、0.375 M Tris-HCl及0.1% SDS (pH 8.8) (ProtoGel拆分緩衝液,National Diagnostics)),然後在SDS-緩衝液(25 Tris-鹼、200 mM甘胺酸、0.1% (w/v) SDS)中在50 V下運行15 min,然後在120V下再運行約4.5 h。然後藉由在適當緩衝液(20% (v/v) MeOH、50mM Tris-鹼、400 mM甘胺酸、0.0373% (w/v) SDS)中半乾轉移,將樣品轉移至低螢光PVDF (0.2 μM,Bio-Rad),在15 V下運行約30-45 min。然後於4℃下將膜在封閉溶液(PBS-T (PBS pH 7.4,0.01% (v/v) Tween-20)中之5% (w/v)脫脂乳(Carnation),於37℃下溶解1 h)中搖動過夜。然後用PBS-T沖洗膜2×,然後於室溫下在兔抗GFP抗體(在PBS-T中1:3000,產品編號G1544,批號046M4871V,SigmaAldrich)中振盪1 h。然後將膜用PBS-T洗滌5 min,且然後於室溫下在山羊抗兔Alexa Fluor 647結合之抗體(在PBS-T中1:20,000,產品編號A32733,批號SD250298,Thermo Fisher Scientific)中振盪45 min。然後將膜用PBS-T洗滌(3 × 5 min),且用具有以下偏好設置之平板雷射掃描儀(Typhoon 9410, GE Amersham Biosciences)成像:50 μM解析度、TAMRA用400 V PMT之532 nm雷射激發及580/30 nm發射濾波器、及Alexafluor 647用500V PMT之633 nm雷射激發及670/30 nm發射濾波器。
為了評價AzK之納入,將純化之蛋白質與DBCO-TAMRA結合,藉由SDS-PAGE產生凝膠位移。不同帶大小對應於天然sfGFP及sfGFP結合之TAMRA。然後使用Image Studio Lite 5.2.5軟體(LI-COR Biosciences)藉由帶之密度計量量化來量化該等帶,以產生移位(結合)帶對移位(結合)及未移位(天然) sfGFP帶產生之總信號的比率。此可解釋為蛋白質位移百分比或已納入ncAA AzK之樣品中sfGFP之百分比。
完整蛋白質之定量高解析度質譜 . 樣品製備及數據采集 . 將純化之蛋白質(4 μg)用450 μL質譜級水稀釋,且施加至離心過濾裝置(Amicon Ultra-0.5 - Millipore)用於脫鹽。將裝置以14,000 ×g離心10 min,並將所得濃縮溶液用質譜級水稀釋回500 μL之總體積。重複此過程總共四次離心,最後旋轉持續18分鐘。在最後離心之後,藉由將過濾裝置倒置至新的微量離心管中並以1,000 × g離心2 min回收樣品。然後將脫鹽之蛋白質注射(6 μL,約250ng)至與Waters G2-XS TOF連接之Waters I類LC中。流動條件為0.4 mL/min之50:50之水:乙腈加0.1%甲酸。藉由ESI+離子化,收集m/z 500與m/z 2000之間之數據。在峰之主要部分上實施光譜合併,且使用Waters MaxEnt1對合併之光譜進行去卷積。
驗證量化 . 使用與上述相同之質體製備及蛋白表現條件製備其中sfGFP之151位含有酪胺酸殘基或AzK殘基之真正蛋白樣品,但分別使用sfGFP151(TAC)及sfGFP151(TAG),且不補充非天然三磷酸。使用該等真正蛋白質,製備Y151及AzK151 sfGFP之混合物,其界定之比率跨越AzK對Y之100:0至0:100之範圍。然後製備該等混合物並如上所述藉由HRMS量化。觀察到之數據在整個樣品範圍內皆係非常線性的,且與預期之比率精確匹配,驗證此方法係高度定量的。
檢查核糖核苷三磷酸之毒性 . 使ML2之過夜培養物在補充有50 mM磷酸鉀及氯黴素(5 μg/mL)之2×YT培養基(貫穿此部分稱為「培養基」)中生長。將此培養物稀釋回OD600為0.01,分成多個300 μL培養物,每一培養物中補充有不同濃度之TPT3 TP、TAT1 TP、NaM TP或5FM TP,以及無三磷酸對照。然後將培養物於37℃下在230 rpm振盪下培育。然後每小時監測細胞之細胞生長(具有590/20 nm濾波器之Envision 2103多標記讀板儀),總共監測八小時。然後將OD600繪製為每一濃度下每一核苷酸之時間之函數,以可視化生長速率之差異。
實例 2 核糖核苷酸候選者之合成及第一 SAR 分析 .
先前僅使用NaM TP及TPT3 TP來研究UBP可獲得之資訊之檢索。為了開始闡明在SSO中管控有效轉錄及轉譯之SAR,設計並合成九種新穎NaM TP類似物( 4A )及四種新穎TPT3 TP類似物( 4B )。該等類似物經設計用於研究核鹼基形狀、芳香族表面積及雜原子衍生化之作用。通常,X TP類似物之合成係經由相應芳基鹵化物之鋰化、之後將鋰化之物質偶合至苄基-或TBS-保護之核糖內酯來進行。在三氟化硼合二乙醚及三乙基矽烷之存在下還原所得半縮醛中間體,在每一情況下得到期望之保護核苷。去保護後,使用標準Ludwig磷酸化條件將所得X 核苷類似物轉化為三磷酸酯。如先前報導合成NaM TP及MMO2 TP。Y TP類似物之合成通常經由相應醯基疊氮化物之分子內庫爾提斯重排(Curtius rearrangement)、之後路易斯酸(Lewis-acid)介導之偶合至1-O 乙醯基-2,3,5-三-O -苯甲醯基-b-D-呋喃核糖來進行,從而產生期望之保護核苷之純β-變旋異構物。在將吡啶轉化為相應硫代吡啶酮及隨後之苯甲醯基去保護之後,使用標準Ludwig磷酸化條件將相應游離核苷轉化為三磷酸酯。如先前報導合成5SICS TP。
NaM TP及九種X TP類似物起始SAR分析。基於上述dX TP篩選之性能且為了消除DNA層級上作為複雜因素之可變損失,用dCNMO -dTPT3 UBP編碼非天然資訊。另外,使用大腸桿菌菌株ML2,其表現核苷三磷酸轉運蛋白Pt NTT2,但亦藉由使編碼RecA之基因(如在選殖菌株中常見)缺失及過表現DNA pol II經遺傳工程化以用於UBP之更高保真度複製。使用具有sfGFP151 (AX C)及tRNAPyl (GY T)之與上述實例1A及1B中所述相同之質體,且為了集中篩選單個非天然核糖核苷酸,在30 μMTPT3 TP存在下轉錄馬氏甲烷八疊球菌Pyl tRNA。如上所述使細胞生長並誘導其產生蛋白質,只是在表現培養基中以高(250 μM)或低(25 μM)濃度提供各種X TP ( 5A-5D )。誘導後3 h純化表現之sfGFP,且使用上述DBCO介導之凝膠位移分析來分析ncAA含量( 5B )。使用250 μM之每一X TP導致至少63%之sfGFP凝膠位移。除了在X TP不存在下缺乏可觀察到之位移之外,X TP藉由Pt NTT2輸入並以至少合理之效率參與核糖體處之轉錄及轉譯。儘管CNMO TP及5F2OMe TP各自表現良好,分別導致92%及94%之凝膠位移,但NaM TP、MMO2 TP及5FM TP表現最佳,蛋白質凝膠位移分別為98%、97%及98%。在類似高程度之蛋白質純度下,在不存在由顯著含量之天然sfGFP污染物導致之任何複雜情形之情況下,比較使用該三種X TP產生之相對螢光。與用相同濃度之NaM TP生長之細胞相比,用250 μMMMO2 TP或5FM TP生長之細胞分別產生63%及90%之本體螢光( 5A )。
在較低之測試濃度(25 μM)下,使用NaM TP導致較低之ncAA納入保真度,且蛋白質位移降至86%。儘管9種NaM TP類似物中之7種亦顯示保真度之顯著降低,但使用MMO2 TP及5FM TP各自產生94%之蛋白質位移。比較用該等核糖核苷酸生長之細胞之相對螢光(同樣可能係由於產生之非天然蛋白質之類似及高保真度),在此較低濃度下,5FM TP產生之螢光比MMO2 TP多34%。執行類似實驗,其中供應恆定量之NaM TP (250 μM)及高(250 μM)或低(25 μM)濃度之Y TP類似物。與先前報導一致,以較高濃度添加TPT3 TP導致細胞生長顯著降低,且相對於未接受Y TP之對照樣品幾乎沒有螢光( 5C )。相反,其他Y TP類似物中之每一者產生高於背景之螢光及至少51%之蛋白質位移( 5D )。TAT1 TP之使用導致比任何其他Y TP多至少2.6倍之螢光,同時維持96%之蛋白質位移。以此濃度添加TAT1 TP導致細胞生長適當程度降低(數據未顯示)。TPT3 TP在以較低濃度提供時毒性稍低,且相應地,當以25 μM提供時,細胞產生顯著量之純蛋白質。在該等條件下,TPT3 TP產生之螢光比SICS TP、FSICS TP及5SICS TP分別大2倍、5倍及6倍。在較高濃度下用TAT1 TP觀察到之毒性在較低濃度下幾乎完全消除(數據未顯示),且其使用導致比在較高濃度下更大之螢光。當以25 μM提供時,TAT1 TP產生之螢光比以250 μM提供時多41%,且有趣的是,其產生之螢光比以25 μM提供TPT3 TP時多57%。以該等濃度使用TAT1 TP導致產生納入98% ncAA之蛋白質。
合成方案 .
一般材料及方法 . 對於合成程序,所有反應皆在惰性氣氛下在烘箱乾燥之玻璃器皿中實施。蒸餾溶劑及/或在4 Å分子篩上乾燥。除非另有說明,否則所有其他化學試劑皆不經進一步純化即使用。1 H、13C及31P譜係在Bruker NMR光譜儀(AV-600、DRX-500或DPX-400)上獲取。質譜數據係自The Scripps Research Institute之核心設施獲得。非天然去氧核糖核苷三磷酸係如先前報告合成(參見 Dien, V. T.等人J. Am. Chem. Soc. 2018,140 , 16115-16123;Lavergne, T.等人J. Am. Chem. Soc. 2013,135 , 5408-5419;Matsuda, S.等人J. Am. Chem. Soc. 2007,129 , 5551-5557;Seo, Y. J.等人J. Am. Chem. Soc. 2009,131 , 3246-3252,每一參考文獻之揭示內容係以全文引用之方式併入本文中)。核苷三磷酸dNaM TP、dTPT3 TP、dCNMO TP及TPT3 TP由Synthorx Inc友好贈予。
核鹼基 13a 之合成 . TAT1核鹼基(化合物13a )係基於文獻方法合成(參見 New, J. S.等人J. Med. Chem. 1989 ,32 , 1147-1156;Asagarasu, A.等人Chem. Pharm. Bull. 2009 ,57 , 34-42,每一參考文獻之揭示內容係以全文引用之方式併入本文中)。簡言之,在100℃下使用吡啶作為溶劑及六氫吡啶作為催化劑(2:1吡啶對六氫吡啶,2.75 M最終反應濃度)使噻唑-4-甲醛(1 eq)與丙二酸縮合13小時,之後回流1 h,產生相應丙烯酸中間體(化合物11 )。在催化DMF (0.2 eq)存在下,在氯仿(1.3 M反應濃度)中用亞硫醯氯(1.1 eq)氯化該酸(1 eq),得到醯氯。在不經進一步純化之情況下,於5℃下在1,4-二噁烷及水之1:1雙相混合物中用疊氮化鈉(2 eq)將醯氯轉化為相應疊氮化物(化合物12 )。將粗製醯基疊氮化物溶解於氯仿中,且逐滴添加至二苯醚中至0.2 M。然後將所得混合物加熱至230℃,保持2小時。在冷卻至室溫後,添加己烷,並過濾反應混合物,使用額外己烷洗滌。藉由急速層析使用矽膠作為固定相純化所得粗產物,以產生期望核鹼基(化合物13a )。方案 S1. (g) 六氫吡啶,吡啶,100℃,12 h,然後回流1 h,(h) SOCl2 ,DMF,CHCl3 ,回流,3 h,(i) NaN3 ,1,4-二噁烷,H2 O,5℃,0.5 h,(j) 二苯醚,230℃,1 h
Figure 02_image1267
TBS 保護之核糖內酯 2 之核鹼基偶合及去保護 . 將芳基鹵化物(1.0 eq)在無水THF中溶解至0.1 M且冷卻至-78℃。一旦冷卻,向反應燒瓶中逐滴添加n-BuLi之溶液(1.6 eq, 1.6 M,於己烷中)。於-78℃下攪拌此混合物30 min後,逐滴添加TBS-保護之核糖內酯(化合物2 ,1.6 eq)於無水THF中之溶液,濃度為約0.8 M。然後於-78℃下將試劑再攪拌1小時,之後用飽和氯化銨水溶液淬滅。在升溫至室溫後,在真空中去除揮發物,且用乙酸乙酯及水萃取所得殘餘物。有機物經硫酸鈉乾燥,過濾,且再次在真空中去除揮發物。
於室溫下高真空去除殘餘溶劑1 h,之後在無水DCM中再溶解至0.1 M。將溶液冷卻至-78℃,之後逐滴添加三乙基矽烷(3 eq),之後逐滴添加48%三氟化硼合二乙醚溶液(3 eq)。然後將反應於-78℃下攪拌15-20 min,之後用1:1之甲醇及三乙胺溶液(添加反應體積之30%之體積)淬滅。將此混合物於-78℃下攪拌3 min,之後添加飽和碳酸氫鈉(初始反應體積之50%)。然後將混合物用DCM稀釋2倍,且分離有機層。將水層用DCM再萃取兩次,且將合併之有機物經硫酸鈉乾燥,過濾,且在真空中濃縮。
於室溫下高真空1 h,自剩餘殘餘物中去除任何殘餘溶劑。此時,將殘餘物在THF中溶解至0.1 M,且添加四丁基氟化銨溶液(3.3 eq,1.0 M,於THF中)。將反應攪拌1 h,之後用乙酸乙酯稀釋且用水萃取。將合併之有機物用硫酸鈉乾燥,過濾,且在真空中濃縮。然後藉由急速層析在矽膠上使用DCM中之5-10%乙醇作為移動相純化所得殘餘物。
苄基保護之核糖內酯 10 之核鹼基偶合及去保護 . 將芳基鹵化物(1.0 eq)在無水THF中溶解至0.1 M且冷卻至-78℃。一旦冷卻,向反應燒瓶中逐滴添加n-BuLi之溶液(1.6 eq, 1.6 M,於己烷中)。於-78℃下攪拌此混合物30 min後,逐滴添加苄基-保護之核糖內酯(化合物10 ,1.6 eq)於無水THF中之溶液,濃度為約0.8 M。然後在-78℃下將試劑再攪拌1小時,之後用飽和氯化銨水溶液淬滅。在升溫至室溫後,在真空中去除揮發物,且用乙酸乙酯及水萃取所得殘餘物。有機物經硫酸鈉乾燥,過濾,且再次在真空中去除揮發物。
於室溫下高真空去除殘餘溶劑1 h,之後在無水DCM中再溶解至0.1 M。將溶液冷卻至-78℃,之後逐滴添加三乙基矽烷(3 eq),之後逐滴添加48%三氟化硼合二乙醚溶液(3 eq)。然後將反應於-78℃下攪拌15-20 min,之後用1:1之甲醇及三乙胺溶液(添加反應體積之30%之體積)淬滅。將此混合物於-78℃下攪拌3 min,之後添加飽和碳酸氫鈉(初始反應體積之50%)。然後將混合物用DCM稀釋2倍,且分離有機層。將水層用DCM再萃取兩次,且將合併之有機物經硫酸鈉乾燥,過濾,且在真空中濃縮。然後藉由急速層析在矽膠上使用己烷中之0至8-10%乙酸乙酯之梯度作為移動相純化苄基保護之核苷中間體。
將純化之苄基保護之核苷與10%鈀載碳(0.1 eq)一起在甲醇中稀釋至0.1 M。用液氮冷凍溶液,且在冷凍的同時,用氫氣吹掃反應燒瓶三次,在最後一次吹掃之後將燒瓶留在氫氣球下。然後使試劑解凍並在氫氣下於室溫下劇烈攪拌3 h。然後在矽膠片上過濾反應混合物,用乙酸乙酯洗滌。然後在真空中去除揮發物,且藉由急速層析在矽膠上使用DCM中之5-10%乙醇作為移動相純化所得粗殘餘物。
芳基溴化物之氰化 . 向無水微波小瓶中裝入CuCN (8 eq)、Pd2 (dba)3 (0.1 eq)及DPPF (0.1 eq),且用氬氣吹掃三次。將芳基溴化物(1 eq)在脫氣之無水DMF中溶解至0.05-0.1M並轉移至反應燒瓶中。然後將燒瓶在氬氣下密封並在155℃劇烈攪拌過夜(約16 h)。然後將試劑冷卻至室溫,並在矽膠之短片上過濾,用乙酸乙酯洗滌。在真空中去除揮發物,且藉由急速層析在矽膠上使用己烷中之70-95%乙酸乙酯之梯度作為移動相純化所得粗殘餘物。
核苷之三磷酸化之一般方案 . 在惰性氣體下,向無水微波小瓶中裝入質子海綿(1.3 eq)及游離核苷(1 eq)。向燒瓶中添加無水磷酸三甲酯(40 eq),且所得混合物在鹽冰浴中冷卻至-15℃。將新鮮蒸餾之氧氯化磷(1.3 eq)逐滴添加至冷卻之燒瓶中,並將試劑在-15℃下攪拌3 h。此時,在單獨乾燥燒瓶中將焦磷酸三丁基銨(5 eq)以0.5 M溶解於無水DMF中,且逐滴添加至反應燒瓶中,之後逐滴添加無水三丁胺(6 eq)。將所得混合物緩慢升溫至0℃,且於此溫度下再攪拌30 min。然後藉由添加三乙基碳酸氫銨水溶液(0.5M,pH 7.5,與總反應體積1:1)淬滅反應,並在室溫下攪拌15 min。然後藉由陰離子交換層析DEAE Sephadex A-25作為固定相及pH 7.5之0-1.2M TEAB之緩慢梯度作為移動相純化此淬滅之反應混合物。合併含有核苷三磷酸之級分,並藉由SpeedVac濃縮,以提供乾燥之期望產物。
苯甲醯基保護之核糖內酯 14 之核鹼基偶合及去保護 . 在氬氣氛下於室溫下將核鹼基(1.0 eq)及N,O-雙(三甲基矽基)乙醯胺(1.2 eq)於乙腈中至0.1 M之混合物攪拌30 min。此時,添加1-O-乙醯基-2,3,5-三-O-苯甲醯基-ß-D-呋喃核糖(化合物14 , 1.2 eq),將所得反應混合物冷卻至0℃。然後向反應混合物中添加SnCl4 (1 eq),且溶液於室溫下攪拌過夜。用乙酸乙酯及飽和NaHCO3 水溶液萃取試劑,並將合併之有機層用無水Na2 SO4 乾燥。過濾及蒸發後,藉由矽膠上急速層析純化殘餘物。
吡啶酮至硫 - 吡啶酮之轉化 . 藉由與無水甲苯重複共蒸發乾燥吡啶酮(1 eq)。在氬氣下添加勞氏試劑(Lawesson’s reagent) (3 eq),且將混合物在120℃加熱過夜。在棉上過濾後,濃縮濾液,且藉由矽膠上急速層析純化粗產物。
保護之核苷之氟化 . 將保護之核苷(1 eq)在MeOH- CH3 CN (1:1 v/v)中溶解至0.1 M,且添加Selectfluor (1.1 eq)。將混合物加熱回流3 h。然後在真空中去除揮發物,且將所得殘餘物用乙酸乙酯及水萃取。蒸發合併之有機層,且藉由與無水甲苯共蒸發三次來乾燥所得粗殘餘物。將殘餘物在TfOH-DCM (1:1 v/v)中溶解至0.1 M,並將混合物在室溫下攪拌1 h。此時,在真空中濃縮試劑,且藉由矽膠上急速層析純化所得粗產物。
化合物表徵 .
化合物 1b. (0.387 mmol, 38%產率, 3個步驟)。1H NMR (600 MHz, 氯仿-d) 7.46 (dd, J = 8.2, 0.9 Hz, 1H), 7.01 (dd, J = 8.2, 1.9 Hz,  1H), 6.87 (d, J = 1.9 Hz, 1H), 5.32 (d, J = 3.3 Hz, 1H), 4.43 (dd, J = 4.6, 3.3 Hz, 1H), 4.37 (dd, J = 8.1, 4.6 Hz, 1H), 4.05 - 4.01 (m, 1H), 3.97 (dd, J = 12.0, 3.2 Hz, 1H), 3.83 (s, 3H), 3.77 (dd, J = 11.9, 4.1 Hz, 1H)。13C NMR (151 MHz, CDCl3) 156.40, 134.51, 128.81, 124.00, 121.01, 111.03, 82.18, 78.55, 73.31, 72.25, 62.57, 55.85。HRMS (ESI-TOF+) C12H15ClO5 [M+Na]+之計算值297.0500;實驗值297.0501。
化合物 3b. (0.333 mmol, 52%產率, 3個步驟)。1H NMR (600 MHz, 甲醇-d4) 7.53 (d, J = 7.4, 1.5 Hz, 1H), 7.24 (td, J = 7.8, 1.8 Hz, 1H), 6.98- 6.92 (m, 2H), 5.33 (d, J = 2.9 Hz, 1H), 4.35 - 4.28 (m, 2H), 4.03 (ddd, J = 8.2, 4.7, 2.6 Hz, 1H), 3.89 (dd, J = 13.1, 3.8 Hz, 1H), 3.84 (s, 3H), 3.70 (dd, J = 12.0, 4.7 Hz, 1H)。13C NMR (151 MHz, MeOD) 157.46, 129.07, 129.03, 127.68, 121.09, 110.69, 83.00, 79.66, 74.04, 73.61, 63.32, 55.72。HRMS (ESI-TOF+) C12H16O5 [M+Na]+之計算值263.0890;263.0888。
化合物 4b. (0.765 mmol, 62%產率, 3個步驟)。1H NMR (600 MHz, 氯仿-d ) 7.23 (dd,J = 9.2, 3.1 Hz, 1H), 6.94 (td,J = 8.4, 3.2 Hz, 1H), 6.77 (dd,J = 8.9, 4.2 Hz, 1H), 5.28 (d,J = 3.3 Hz, 1H), 4.43 - 4.38 (m, 1H), 4.30 (dd,J = 8.2, 4.6 Hz, 1H), 3.99 (dt,J = 7.8, 3.6 Hz, 1H), 3.90 (dd,J = 12.0, 3.2 Hz, 1H), 3.79 (s, 3H), 3.72 (dd,J = 12.0, 4.0 Hz, 1H)。13C NMR (151 MHz, CDCl3) 158.28, 156.69, 151.87, 151.86, 127.64, 127.59, 115.09,   114.92, 114.62, 114.46, 110.95, 110.90, 81.92, 78.51, 73.10, 72.30, 62.37, 56.02。HRMS (ESI-TOF+) C12H15FO5 [M+Na}+之計算值281.0796;281.0799。
化合物 5b. (0.366 mmol, 50%產率, 3個步驟)。1H NMR (600 MHz, 甲醇-d4) δ 7.95 (s, 1H), 7.43 (s, 1H), 7.32 (d, J = 5.4 Hz, 1H), 7.26 (d, J = 5.4 Hz, 1H), 5.38 (d, J = 3.0 Hz, 1H), 4.40 - 4.35 (m, 1H), 4.32 (dd, J = 8.5, 4.4 Hz, 1H),  4.06 (ddd, J = 8.2, 4.6, 2.6 Hz, 1H), 3.92 (dd, J = 12.0, 2.5 Hz, 1H), 3.90 (s, 3H), 3.71 (dd, J = 12.0, 4.7 Hz, 1H)。13C NMR (151 MHz, 甲醇-d 4) δ 154.39, 139.73, 133.33, 124.79, 123.31, 122.99, 122.24, 102.01, 81.60, 78.62, 72.69, 72.23, 61.98, 54.69。HRMS (ESI-TOF+) C14H16O5S [M+Na]+之計算值319.0611;319.0612。
化合物 6b. (0.160 mmol, 51%產率, 3個步驟)。1H NMR (600 MHz, 甲醇-d 4) δ 7.98 (s, 1H), 7.48 (d,J = 5.4 Hz, 1H), 7.34 (s, 1H), 7.29 (d,J = 5.4 Hz, 1H), 5.39 (d,J = 3.7 Hz, 1H), 4.40 - 4.35 (m, 1H), 4.32 (dd,J = 8.5, 4.4 Hz, 1H), 4.05 (ddd,J = 8.4, 4.7, 2.6 Hz, 1H), 3.91 (dd,J = 11.9, 2.6 Hz, 1H), 3.89 (s, 3H), 3.71 (dd,J = 12.0, 4.7 Hz, 1H)。13C NMR (151 MHz, 甲醇-d 4) δ 154.41, 139.63, 131.85, 126.26, 125.11, 123.24, 120.94, 102.92, 81.60, 78.66, 72.68, 72.29, 61.95。HRMS (ESI-TOF+) C14H16O5S [M+Na]+之計算值319.0611;319.0609。
化合物7b. (1.248 mmol, 61%產率, 3個步驟)。1H NMR (600 MHz, 氯仿-d) δ 7.41 (dd, J = 8.1, 0.9 Hz, 1H), 7.17 (dd, J = 8.1, 1.8 Hz, 1H), 7.02 (d, J = 1.8 Hz, 1H), 5.32 (d, J = 3.3 Hz, 1H), 4.44 (dd, J = 4.6, 3.4 Hz, 1H), 4.38 (dd, J = 8.1, 4.6 Hz, 1H), 4.04 (dt, J = 7.7, 3.6 Hz, 1H), 3.98 (dd, J = 11.9, 3.2 Hz, 1H), 3.83 (s, 3H), 3.79 (dd, J = 11.9, 4.1 Hz, 1H)。13C NMR (151 MHz, CDCl3) δ 155.82, 128.57, 123.94, 123.44, 121.77, 113.26, 81.62, 78.00, 72.72, 71.60, 61.99, 55.28。HRMS (ESI-TOF-) C12H15BrO5 [M+Cl]-之計算值352.9797;實驗值352.9799。
化合物8a. (0.066 mmol, 42%產率,來自化合物6b)。1H NMR (600 MHz, 甲醇-d4) δ 7.68 (dd, J = 7.8, 0.9 Hz, 1H), 7.34 (dd, J = 7.8, 1.5 Hz, 1H), 7.28 (d, J = 1.5 Hz, 1H), 5.32 (d, J = 3.1 Hz, 1H), 4.39 (dd, J = 4.5, 3.2 Hz, 1H), 4.30 (dd, J = 8.6, 4.5 Hz, 1H), 4.03 (ddd, J = 8.6, 4.6, 2.5 Hz, 1H), 3.93 - 3.89 (m, 4H), 3.70 (dd, J = 12.0, 4.6  Hz, 1H)。13C NMR (151 MHz, MeOD) δ 157.65, 134.76, 129.90, 125.39, 120.07, 113.77, 112.30, 83.14, 79.64, 73.80, 73.50, 63.17, 56.31, 50.87。HRMS (ESI-TOF-) C13H15NO5 [M-H]-之計算值264.0877;實驗值264.0869。
化合物 9b. (0.288 mmol, 29%產率, 3個步驟)。1H NMR (600 MHz, 氯仿-d) δ 7.12 (d, J = 9.9 Hz, 1H), 6.73 (d, J = 6.1 Hz, 1H), 5.02 (d, J = 6.1 Hz, 1H), 4.17 (dd, J = 5.9, 4.8 Hz, 1H), 4.13 - 4.09 (m, 1H), 4.08 (t, J = 6.0 Hz, 1H), 3.98 (dd, J = 11.9, 3.3 Hz, 1H), 3.87 (s, 3H), 3.85,  3.81 (m, 1H), 2.29 (d, J = 2.0 Hz, 3H)。13C NMR (151 MHz, CDCl3) δ 156.19, 154.61, 151.45, 126.24, 124.08, 123.95, 113.10, 83.98, 80.69, 71.56, 62.65, 55.76, 14.22。HRMS (ESI-TOF+) C13H17FO5 [M+Na]+之計算值295.0952;295.0952。
化合物 13a (3.184 mmol, 經4個步驟為11%)。1H NMR (500 MHz, DMSO-d6) δ 11.87 (br, 1 H, N-H), 9.59 (s, 1H, Ar-H), 7.50 (d, J = 5.0 Hz, 1 H, Ar-H), 6.98 (d, J = 5.0 Hz, 1 H, Ar-H)。13C NMR (125 MHz, CDCl3) δ 161.9, 150.3, 159.2, 133.1, 124.3, 102.5。HRMS (ESI-TOF+) C6H5N2OS+ [M+H]+之計算值153.0117;實驗值153.0115。
化合物 13b. (0.530 mmol,53%產率)。1H NMR (500 MHz, CDCl3) δ 9.13 (s, 1 H, Ar-H), 7.36-8.16 (m, 16H, Ar-H), 6.87 (d,J = 5.0 Hz, 1 H, H-1’), 6.71 (d,J = 5.0 Hz, 1 H, Ar-H), 5.99-6.01 (m, 1 H, H-3’), 5.90-5.92 (m, 1 H, H-2’),  4.92 (dd,J1 = 15 Hz,J2 = 5 Hz, 1 H, H-5’a), 4.80-4.82 (m, 1 H, H-4’), 4.72 (dd,J1 = 15 Hz,J2 = 5 Hz, 1 H, H-5’b)。13C NMR (125 MHz, CDCl3) δ 166.5. 165.7, 165.6, 160.7, 156.7, 134.1, 133.9, 130.9, 130.3, 130.2, 130.1, 130.1, 130.1, 129.8, 129.1, 129.0, 128.9, 128.8, 104.5, 89.2, 80.8, 75.3, 71.4, 64.0。HRMS (ESI-TOF+) C32H25N2O8S [M+H]+之計算值597.1326;實驗值597.1330。
化合物 13c. (0.056 mmol,56%產率)。1H NMR (500 MHz, CDCl3) δ 9.16 (s, 1 H, Ar-H), 7.31-8.24 (m, 17 H, Ar-H), 7.12 (d,J = 5 Hz, 1H, H-1’), 5.95-5.96 (m, 1 H, H-2’ ), 5.87-5.90 (m, 1 H, H-3’), 4.99 (dd,J1 = 15 Hz,J2 = 5 Hz, 1 H, H-5’a), 4.89-4.91 (m, 1H, H-4’), 4.73 (dd,J1 = 15 Hz,J2 = 5 Hz, 1 H, H-5’b)。13C NMR (125 MHz, CDCl3) δ 175.7, 166.4, 165.6, 165.3, 163.7, 151.8, 142.1, 134.2, 134.1, 134.0, 132.5, 130.5, 130.3, 130.1, 129.2, 129.2, 128.9, 128.9, 109.7, 92.2, 80.8, 75.9, 69.9, 63.0。HRMS (ESI-TOF+) C32H25N2O7S2 [M+H]+之計算值613.1098;實驗值613.1095。
化合物 13d. (0.043 mmol,89%產率)。1H NMR (500 MHz, DMSO-d6 ) δ 9.58 (s, 1 H, Ar-H), 8.68 (d, J = 10 Hz, 1 H, Ar-H), 7.45 (d,J = 10 Hz, 1 H, Ar-H), 6.81 (d,J = 2.5 Hz, 1 H, H-1’), 5.48 (d,J = 5 Hz, 1 H, -OH), 5.39-5.41 (m, 1 H, -OH), 5.18 (d,J = 5 Hz, 1 H , -OH), 4.03-4.05 (m, 2 H, H-2’, H-3’), 3.98-4.00 (m, 1 H, H-4’), 3.78 (dd,J1 = 10Hz,J2 = 2.5 Hz, 1 H, H-5’a), 3.64 (dd,J1 = 10Hz,J2 = 2.5 Hz, 1 H, H-5’b)。13C NMR (125 MHz, DMSO-d6 ) δ 174.2, 166.6, 152.2, 135.5, 109.4, 99.9, 95.1, 85.5, 76.6, 69.0, 60.2。HRMS (ESI-TOF+) C11H13N2O4S2 [M+H]+之計算值301.0311;實驗值301.0309。
化合物 15b. (0.931 mmol,93%產率)。1H NMR (500 MHz, CDCl3) δ 9.05 (d,J = 10 Hz, 1 H, H-Ar), 7.30-8.16 (m, 20 H, Ar-H), 6.72 (d,J = 5 Hz, 1 H, H-1’), 5.97-5.99 (m, 1 H, H-2’), 5.85-5.88 (m, 1 H, H-3’), 4.98 (dd,J1 = 10 Hz,J2 = 5 Hz, 1 H, H-5’a), 4.89-4.90 (m, 1 H, H-4’), 4.72 (dd,J1 = 10 Hz,J2 = 5 Hz, 1 H, H-5’b)。13C NMR (125 MHz, CDCl3) δ 182.1, 179.6, 166.6, 165.5, 165.5, 165.2, 151.1, 143.9, 134.0, 133.9, 133.6, 130.4, 130.3, 130.2, 130.1, 129.6, 129.4, 129.1, 128.9, 128.9, 128.8, 92.8, 80.4,75.7, 69.7, 62.8。HRMS (ESI-TOF+) C35H28NO8 [M+H]+之計算值590.1809;實驗值590.1811。
化合物 15c. (0.088 mmol,87%產率)。1H NMR (500 MHz, CDCl3) δ 9.07 (d,J = 10 Hz, 1 H, Ar-H), 7.30-8.17 (m, 20 H, Ar-H, H-1’), 5.98-5.99 (m, 1 H, H-2’), 5.82-5.84 (m, 1 H, H-3’), 4.89-4.94 (m, 2 H, H-5’a, H-4’), 4.80 (dd,J1 = 15 Hz,J2 = 5 Hz, 1 H, H-5’b)。13C NMR (125 MHz, CDCl3) δ 184.9, 166.5, 165.6, 165.3, 134.0, 133.9, 133.3, 132.7, 130.5, 130.3, 130.2, 129.8, 129.5, 129.1, 128.9, 128.9, 128.8, 127.3, 127.1, 112.8, 92.6, 80.3, 75.9, 70.1, 63.2。HRMS (ESI-TOF+) C35H28NO7S [M+H]+之計算值606.1581;實驗值606.1579。
化合物 15d. (0.044 mmol,92%產率)。1H NMR (500 MHz, MeOH-d4 ) δ 8.33 (d,J = 10 Hz, 1 H, Ar-H), 7.52-7.80 (m, 4 H, Ar-H), 6.71 (d,J = 5 Hz, 1 H, Ar-H), 6.36 (d,J = 2.5 Hz, 1 H, H-1’), 4.22-4.26 (m, 2 H, H-2’, H-3’), 4.10-4.11 (m, 1 H, H-4’), 3.94 (dd,J1 = 15 Hz,J2 = 5 Hz, 1 H, H-5’a), 3.82 (dd,J1 = 15 Hz,J2 = 5 Hz, 1 H, H- 5’b)。13C NMR (125 MHz, MeOH-d4 ) δ 163.0, 137.6, 133.0, 127.5, 127.4, 127.1, 126.3, 125.6, 106.9, 90.1, 85.1, 75.5, 70.3, 61.4。HRMS (ESI-TOF+) C14H16NO4S [M+H]+之計算值294.0795;實驗值294.0799。
化合物 16a. (0.077 mmol,71%產率)。1H NMR (500 MHz, CDCl3) δ 7.33-8.42 (m, 20 H, Ar-H), 6.82 (d,J = 5 Hz, 1 H, H-1’), 5.94-5.97 (m, 1 H, H-2’), 5.83-5.85 (m, 1 H, H-3’), 4.87 (d,J = 10 Hz, 1 H, H-5’a), 4.74-4.79 (m, 2 H, H-4’, H-5’b)。13C NMR (125 MHz, CDCl3) δ 166.6, 165.7, 165.6, 162.9, 160.8, 134.0, 134.0, 133.9, 133.5, 130.3, 130.2, 130.1, 129.7, 129.1, 129.1, 129.1, 128.9, 128.8, 128.8, 120.3, 111.1, 88.9, 87.8, 85.3, 80.6, 80.4, 74.8, 71.4, 64.1。19F NMR (376 MHz, CDCl3) δ -145.6. HRMS (ESI-TOF+) C35H27FNO8 [M+H]+之計算值608.1715;實驗值608.1717。
化合物 16b. (0.066 mmol,65%產率)。1H NMR (500 MHz, CDCl3) δ 9.07 (d,J = 10 Hz,1 H, Ar-H), 7.32-8.18 (m, 20 H, Ar-H, H-1’), 5.96- 5.98 (m, 1 H, H-2’), 5.87-5.89 (m, 1 H, H-3’), 4.97 (dd,J1 = 15 Hz,J2 = 5 Hz, 1 H, H-5’a), 4.89-4.91 (m, 1H, H-4’), 4.76 (dd,J1 = 15 Hz,J2 = 5 Hz, 1 H, H-5’b)。13C NMR (125 MHz, CDCl3) δ 184.3, 166.6, 165.6, 165.3, 134.7, 134.1, 134.0, 133.9, 133.9, 133.3, 133.2, 130.5, 130.3, 130.3, 129.8, 129.7, 129.3, 129.2, 128.9, 128.9, 128.9, 128.8, 128.3, 126.8, 108.4, 100.0, 92.3, 80.7, 75.8, 70.3, 63.2, 56.0。HRMS (ESI-TOF+) C35H27FNO7S [M+H]+之計算值624.1487;實驗值624.1490。
化合物 16c. (0.042 mmol,90%產率)。1H NMR (500 MHz, MeOH-d4 ) δ 9.04 (d,J = 10 Hz, 1 H, H-Ar), 8.73 (d,J = 10 Hz, 1 H, H-Ar), 7.83-7.87 (m, 2 H, Ar-H), 7.65-7.68 (m, 1 H, H-Ar), 6.96 (s, 1 H, H-1’), 4.23-4.29 (m, 2 H, H-2’, H-3’), 4.18-4.4.21 (m, 1 H, H-4’), 4.11 (dd,J1 = 10 Hz,J2 = 5 Hz, H-5’a), 3.91 (dd,J1 = 10 Hz,J2 = 5 Hz, H-5’b)。13C NMR (125 MHz, MeOH-d4 ) δ 180.5, 150.5, 148.6, 134.2, 134.1, 133.2, 132.0, 132.0, 129.2, 126.1, 125.9, 119.6, 119.6, 115.5, 115.1, 96.2, 84.4, 76.1, 68.1, 59.4。HRMS (ESI-TOF)+ C14H15FNO4S [M+H]+之計算值312.0700;實驗值312.0702。
化合物 1c. (0.048, 24%產率)。31P NMR (162 MHz, H2O) δ -8.79 - -10.99 (m), -21.21 - -21.58 (m), -21.77 - -23.23 (m)。MS (MALDI-TOF-,基質:9-胺基吖啶) (m/z) [M-H]- C12H17ClO14P3-之計算值,512.95;實驗值512.7。
化合物 3c. (0.031 mmol,31%產率)。31P NMR (162 MHz, H2O) δ -11.19 - -11.91 (m), -22.06 - -22.73 (m), -23.87 - -24.46 (m)。MS (MALDI-TOF-,基質:9-胺基吖啶) (m/z) [M-H]- C12H18O14P3-之計算值,479.00;實驗值497.4。
化合物 4c. (0.014 mmol,14%產率)。31P NMR (162 MHz, H2O) δ -7.31 (d), -11.47 (d), -22.79 - -23.21 (m)。MS (MALDI-TOF-,基質:9-胺基吖啶) (m/z): [M-H]- C12H17FO14P3-之計算值,496.97;實驗值497.3。
化合物 5c. (0.042 mmol,23%產率)。31P NMR (162 MHz, D2O) δ -8.48 (d,J = 17.8 Hz), -11.21 (d,J = 20.7 Hz), -22.96 (t,J = 21.6 Hz)。MS (MALD-TOF-,基質:9-胺基吖啶) (m/z): [M-H]- C14H18O14P3S-之計算值,534.97;實驗值535.4。
化合物 6c. (0.017 mmol,21%產率)。31P NMR (162 MHz, D2O) δ -9.25 (d,J = 21.0 Hz), -10.93 (d,J = 19.5 Hz), -22.94 (t,J = 20.5 Hz)。MS (MALDI-TOF-,基質:9-胺基吖啶) (m/z): [M-H]- C14H18O14P3S-之計算值,534.97;實驗值535.4。
化合物 7c. (0.009 mmol,12%產率)。31P NMR (162 MHz, H2O) δ -10.07 - -11.45 (m), -21.8 - -22.21 (m), -24.06 - -24.60 (m)。MS (MALDI-TOF-,基質:9-胺基吖啶) (m/z) [M-H]- C12H17BrO14P3-之計算值,556.91;實驗值556.6。
化合物 8b. (0.023 mmol,22%產率)。31P NMR (162 MHz, H2O) δ -9.96 - -12.34 (m), -21.91 - -22.45 (m), -22.88 - -24.4 (m)。MS (MALDI-TOF-,基質:9-胺基吖啶) (m/z) [M-H]- C13H17NO14P3-之計算值,503.99;實驗值504.3。
化合物 9c. (0.021 mmol,21%產率)。31P NMR (162 MHz, H2O) δ -9.77 - -10.37 (m), -10.8 - -11.17 (m), -22.0 - -22.2 (m)。MS (MALDI-TOF-,基質:9-胺基吖啶) (m/z) [M-H]- C13H19FO14P3-之計算值,511.0;實驗值511.0。
化合物 13e. (0.007 mmol,22%產率)。31P NMR (400 MHz, D2O): δ -10.82-10.94 (m), -11.68-11.74 (m), -23.21-23.45 (m)。MS (MALDI-TOF,基質:9-胺基吖啶) (m/z): [M-H]- C11H14N2O13P3S2-之計算值,538.9,實驗值538.3。
化合物 15e. (0.012 mmol,35%產率)。31P NMR (400 MHz, D2O): δ -10.74-10.84 (m), -11.55-11.67 (m), -23.17-23.42 (m)。MS (MALDI-TOF,基質:9-胺基吖啶) (m/z): [M-H]- C14H17NO13P3S-之計算值532.0,實驗值532.5。
化合物 16d. (0.009 mmol,29%產率)。31P NMR (400 MHz, D2O): δ -10.65-10.79 (m), -11.45-11.54 (m), -22.16-23.40 (m)。MS (MALDI-TOF,基質:9-胺基吖啶) (m/z): [M-H]- C14H16FNO13P3S-之計算值,550.0,實驗值550.6。方案 S2. (a) 1.6 Mn -BuLi,THF,-78℃,1 h,(b) 三乙基矽烷,DCM,BF3 •OEt2 ,-78℃,15-20 min,(c) 1.0 M TBAF,THF,1 h,(d) 質子海綿,POCl3 ,Bu3 N,Bu3 NPPi,(MeO)3 P,DMF,-15℃,3 h。
Figure 02_image1269
方案 S3. (a) 1.6 Mn -BuLi,THF,-78℃,1 h,(b) 三乙基矽烷,DCM,BF3 •OEt2 ,-78℃,15-20 min,(c) 1.0 M TBAF,THF,1 h,(d) 質子海綿,POCl3 ,Bu3 N,Bu3 NPPi,(MeO)3 P,DMF,-15℃,3 h。
Figure 02_image1271
方案 S4. (a) 1.6 Mn -BuLi,THF,-78℃,1 h,(b) 三乙基矽烷,DCM,BF3 •OEt2 ,-78℃,15-20 min,(c) 1.0 M TBAF,THF,1 h,(d) 質子海綿,POCl3 ,Bu3 N,Bu3 NPPi,(MeO)3 P,DMF,-15℃,3 h。
Figure 02_image1273
方案 S5. (a) 1.6 Mn -BuLi,THF,-78℃,1 h,(b) 三乙基矽烷,DCM,BF3 •OEt2 ,-78℃,15-20 min,(c) 1.0 M TBAF,THF,1 h,(d) 質子海綿,POCl3 ,Bu3 N,Bu3 NPPi,(MeO)3 P,DMF,-15℃,3 h。
Figure 02_image1275
方案 S6. (a) 1.6 Mn -BuLi,THF,-78℃,1 h,(b) 三乙基矽烷,DCM,BF3 •OEt2 ,-78℃,15-20 min,(c) 1.0 M TBAF,THF,1 h,(d) 質子海綿,POCl3 ,Bu3 N,Bu3 NPPi,(MeO)3 P,DMF,-15℃,3 h。
Figure 02_image1277
方案 S7. (a) 1.6 Mn -BuLi,THF,-78℃,1 h,(b) 三乙基矽烷,DCM,BF3 •OEt2 ,-78℃,15-20 min,(c) 1.0 M TBAF,THF,1 h,(d) 質子海綿,POCl3 ,Bu3 N,Bu3 NPPi,(MeO)3 P,DMF,-15℃,3 h。
Figure 02_image1279
方案 S8. (d) 質子海綿,POCl3 ,Bu3 N,Bu3 NPPi,(MeO)3 P,DMF,-15℃,3 h,(e) CuCN,Pd2 (dba)3 ,DPPF,DMF,155℃,16 h
Figure 02_image1281
方案 S9. (a) 1.6 Mn -BuLi,THF,-78℃,1 h,(b) 三乙基矽烷,DCM,BF3 •OEt2 ,-78℃,15-20 min,(d) 質子海綿,POCl3 ,Bu3 N,Bu3 NPPi,(MeO)3 P,DMF,-15℃,3 h,(f) H2 (g),Pd/C (10%),MeOH,rt,3 h
Figure 02_image1283
方案 S10. (k) N, O-雙(三甲基矽基)乙醯胺,SnCl4 ,CH3 CN,RT,過夜,(l) 勞氏試劑,120℃,過夜,(m) 30% NaOMe,DCM,0℃,2 h,(d) 質子海綿,POCl3 ,Bu3 N,Bu3 NPPi,(MeO)3 P,DMF,-15℃,3 h
Figure 02_image1285
方案 S11. (k) N, O-雙(三甲基矽基)乙醯胺,SnCl4,CH3CN,RT,過夜,(l) 勞氏試劑,120℃,過夜,(m) 30% NaOMe,DCM,0℃,2 h,(d) 質子海綿,POCl3 ,Bu3 N,Bu3 NPPi,(MeO)3 P,DMF,-15℃,3 h
Figure 02_image1287
方案 S12. (n) i. Selectfluor,MeOH/CH3 CN (1:1 v/v),回流,3h;ii. TfOH/DCM (1:1 v/v),1 h,(l) 勞氏試劑,120℃,過夜,(m) 30% NaOMe,DCM,0℃,2 h,(d) 質子海綿,POCl3 ,Bu3 N,Bu3 NPPi,(MeO)3 P,DMF,-15℃,3 h
Figure 02_image1289
實例 3 :非天然蛋白質產生之最佳化 .
實例1A、1B及2鑑別dCNMO -dTPT3 為用於資訊儲存之感受態UBP,且TAT1 TP及NaM TP或5FM TP為用於其檢索之感受態核糖核苷三磷酸。在用上述使用之相同質體轉變後,在生長培養基中提供10 μM dTPT3 TP及25 μM dCNMO TP,該生長培養基然後亦補充有濃度範圍為100 μM至12.5 μM之TAT1 TP及濃度範圍為200 μM至12.5 μM之NaM TP或5FM TP,所有皆呈2倍稀釋系列,且在添加1 mM AzK後,誘導細胞以表現sfGFP。在提供有TAT1 TP及NaM TP之細胞中觀察到之總sfGFP螢光通常高於在提供有TAT1 TP及5FM TP之細胞中觀察到之螢光( 6A 6B )。在兩種情形下,在較低濃度之NaM TP或5FM TP下,螢光較高(由於污染性天然sfGFP之產生增加,參見下文)。另外,細胞通常在較高濃度之TAT1 TP下產生較高螢光。然而,由於生長稍微降低,提供有100 μMTAT1 TP之細胞產生之螢光低於提供有50 μMTAT1 TP之彼等細胞。經由凝膠位移分析再次量化蛋白質之產生( 6C 6D )。通常,當NaM TP之濃度降低至200 μM以下時,觀察到AzK納入sfGFP之保真度逐漸降低,而在使用5FM TP之情況下,僅在50 μM之濃度以下觀察到此保真度降低。顯然,可使用較低濃度之5FM TP而不損害保真度。提供有高濃度之5FM TP (≥50 μM)之細胞在所有研究之TAT1 TP濃度(100 μM、50 μM、25 μM或12.5 μM)下皆產生高蛋白質位移。然而,當5FM TP之濃度為25 μM或更低時,降低TAT1 TP之濃度導致蛋白質位移減少。當NaM TP以200 μM提供時,研究之所有濃度之TAT1 TP皆導致以高保真度ncAA納入產生蛋白質,但在較低濃度之NaM TP之情況下,降低TAT1 TP之濃度再次導致蛋白質位移減少。總之,該等研究揭示,分別用以200 μM及50 μM濃度提供之NaM TP及TAT1 TP、或用二者皆以50 μM濃度提供之5FM TP及TAT1 TP,實現蛋白質純度及產率之組合最佳化。就單獨之蛋白質產生而言,使用NaM TP及TAT1 TP係最佳的,而使用5FM TP及TAT1 TP導致純ncAA標記之蛋白質之產率稍低,但需要顯著更低濃度之X TP。
活體內轉譯條件之最佳化 . 使攜帶pGEX-MbPylRS TetR質體之SSO菌株ML2之過夜培養物在補充有50 mM磷酸鉀、5 μg/mL氯黴素及100 μg/mL卡本西林之2×YT (本文中在本部分中稱為「培養基」)中生長,然後在相同培養基中稀釋回OD600 為0.03,且生長至OD600 為0.4-0.6。然後將培養物在冰水上在振盪下冷卻15 min,然後藉由以3,200×g離心10 min來沈澱。然後將細胞重懸並用冰冷之ddH2 O洗滌兩次,然後重懸於冰冷ddH2 O中至OD600為55-65。將電感受態細胞(50 μL)及約1 ng在sfGFP及tRNAPyl基因內具有UBP之Golden Gate組裝之質體(參見質體之Golden Gate組裝)轉移至預冷卻之電穿孔比色管(0.2-cm-間隙)中,然後根據製造商之建議(電壓25 kV、電容器2.5 μF、電阻器200 Ω)電穿孔(Gene Pulser II;Bio-Rad),且然後立即用950 μL培養基稀釋。然後將轉變之等分試樣(40 μL)在補充有dCNMO TP (25 μM)及dTPT3 TP (10 μM)之培養基中稀釋五倍達成200 μL之最終體積,然後允許在37℃下振盪1 h回收。將兩倍回收稀釋物平鋪於補充有吉歐黴素(50 μg/mL)、dCNMO TP (10 μM)、dTPT3 TP (10 μM)及瓊脂(2% w/v)之固體培養基上,然後在37℃下生長18 h。挑取單個菌落並在補充有50 μg/mL吉歐黴素之培養基(300 μL)中生長且提供dCNMO TP (25 μM)及dTPT3 TP (10 μM) (下文中在本部分中稱為「生長培養基」)。監測培養物之細胞生長(具有590/20 nm濾波器之Envision 2103多標記讀板器),且然後在OD600為約1.0下收集。使用ZR質體Prep套組(Zymo Research)使等分試樣(50 μL)經受質體分離。然後使分離之質體經受下述鏈黴抗生物素蛋白凝膠位移分析(使用引子P3-4及P5-6,表S1)以測定UBP保留率。
然後將具有優良UBP保留率之菌落在生長培養基中稀釋至OD600 為約0.01,並生長至OD600 為約0.4-0.6。然後將此培養物分成多份300 μL培養物,且各自以可變濃度之每一X TP (12.5 μM、25 μM、50 μM、100 μM或200 μM)及TAT1 TP (12.5 μM、25 μM、50 μM或100 μM)提供有5FM TP、TAT1 TP或NaM TP、TAT1 TP。此時亦向細胞提供AzK (10 mM)。在添加AzK之後,將樣品遮光以防止光降解。然後使該等樣品在37℃下生長20 min,之後添加1 mM IPTG,並在37℃下再生長1 h以誘導T7 RNAP及tRNAPyl及PylRS之轉錄。自此時刻開始,監測細胞之生長及螢光。然後用無水四環素(100 ng/mL)誘導sfGFP之表現。在37℃下再生長3 h後,收集細胞(230 μL用於sfGFP之親和純化),冷卻,且然後沈澱並在-80℃下儲存,之後進行蛋白質純化。
高密度非天然密碼子之活體內轉譯 . 使攜帶pGEX-MbPylRS TetR質體之SSO菌株ML2之過夜培養物在補充有50 mM磷酸鉀、5 μg/mL氯黴素及100 μg/mL卡本西林之2×YT (本文中在本部分中稱為「培養基」)中生長,然後在相同培養基中稀釋回OD600 為0.03,且生長至OD600 為0.4-0.6。然後將培養物在冰水上在振盪下冷卻15分鐘,然後藉由以3,200×g離心10 min來沈澱。然後將細胞重懸並用冰冷之ddH2 O洗滌兩次,然後重懸於冰冷ddH2 O中至OD600 為55-65。將電感受態細胞(50 μL)及約1 ng Golden Gate組裝之質體轉移至預冷之電穿孔比色管(0.2-cm-間隙)中,該等Golden Gate組裝之質體在sfGFP之149或153密碼子位置、三個驗證密碼子位置中之兩個、或所有三個位置處具有UBP (sfGFP149(AXC)、sfGFP151(AXC)、sfGFP149,151(AXC,AXC)、sfGFP151,153(AXC,AXC)、sfGFP149,153(AXC,AXC)及(sfGFP149,151,153(AXC,AXC,AXC)) (參見質體之Golden Gate組裝)。然後根據製造商之推薦(電壓25 kV、電容器2.5 μF、電阻器200 Ω)電穿孔細胞(Gene Pulser II;Bio-Rad),且然後立即用950 μl培養基稀釋。然後將轉變之等分試樣(40μl)在補充有dNaM TP (150 μM)及dTPT3TP (10 μM) (此後在此部分中稱為「舊條件」)或dCNMO TP (150 μM)及dTPT3 TP (10 μM) (此後在此部分中稱為「新條件」)之培養基中稀釋五倍達成200 μl之最終體積,然後允許在37℃下振盪1 h回收。將兩倍回收稀釋物平鋪於補充有吉歐黴素(50 μg/mL)、相應非天然三磷酸酯及瓊脂(2% w/v)之固體培養基上,然後在37℃下生長約18 h。挑取單個菌落並在補充有50μg/mL吉歐黴素之培養基(300μL) (此後在此部分中稱為「生長培養基」)中生長且為舊條件或新條件提供相應非天然三磷酸。監測培養物之細胞生長(具有590/20 nm濾波器之Envision 2103多標記讀板器),且然後在OD600 為約1.0下收集。將收集之細胞在冰上冷卻過夜。
然後在生長培養基中將細胞再稀釋至OD600 為約0.1,且為舊條件或新條件提供相應非天然三磷酸酯,然後生長至OD600 為約0.4-0.6。然後為對應於舊條件之細胞提供NaM TP (250 μM)及TPT3 TP (30 μM),而為對應於新條件之細胞提供NaM TP (200 μM)及TAT1 TP (50 μM)。此時亦向細胞提供AzK (10 mM) (或對於在不存在AzK下生長之培養物,為ddH2 O)。在添加AzK之後,將樣品遮光以防止光降解。然後使該等樣品在37℃下生長20分鐘,之後添加1 mM IPTG,並在37℃下再生長1 h以誘導T7 RNAP及tRNAPyl及PylRS之轉錄。自此時刻開始,監測細胞之生長及螢光。然後用無水四環素(100 ng/mL)誘導sfGFP之表現。在37℃下再生長3 h後,冷卻、收集細胞(50 μL用於質體分離以測定UBP保留率,230 μL用於sfGFP之親和純化),且然後沈澱並在-80℃下儲存,之後蛋白質純化及評價UBP保留率。
結果 . 所有十個以高濃度研究之X TP皆能夠介導具有至少中等ncAA納入保真度(98%至63%)之蛋白質產生。通常,隨著X TP濃度降低,ncAA納入之保真度降低,指示非天然mRNA轉錄之保真度降低。此與當X TP受到抑制時觀察到之顯著螢光一致。
此實例提供用於轉錄及轉譯主要為疏水性核糖核苷酸之SAR。對於X TP,當考慮NaM TP、PTMO TP及MTMO TP時,在一些情況下,環收縮及/或雜原子衍生係有害的。然而,對於單環核鹼基X TP,除了ClMO TP外,相對於MTMO TP及PTMO TP,觀察到更高之保真度之蛋白質產生。在一些情況下,非天然核鹼基之間或與聚合酶之特異性相互作用有益於鹼基配對。舉例而言,在一些情況下,單環核鹼基之4-及5-位之取代影響鹼基配對。與2OMe TP相比,4-位之Cl或Br取代基(ClMO TP及BrMO TP)在一些情況下係有害的,而4-位之甲基(MMO2 TP)降低總體螢光,但蛋白質保真度增加。4-位之腈取代基(CNMO TP)導致產生最大量之非天然蛋白質,且亦適度地增加ncAA納入之保真度。在5-位添加氟取代基(5F2OMe TP)相對於2OMe TP亦增加蛋白質產生及保真度。在一些情況下,4-及5-位之取代之效應至少大致係加和的,此乃因組合5-氟及4-甲基取代基(5FM TP)使得相對於其他非天然三磷酸,在較低濃度下能高產率地產生純非天然蛋白質。然而,儘管需要更高濃度,但NaM TP提供所檢查之X TP類似物之產率及純度之平衡組合。在一些情況下,X TP類似物衍生之SAR明顯不同於自dX TP類似物之複製衍生之彼等。舉例而言,儘管dPTMO TP、dClMO TP及dCNMO 在一些情形下比dNaM TP更理想,但ClMO TP及PTMO TP在一些情形下適度地且明顯不如NaM TP理想。此外,儘管dCNMO 係迄今為止發現之dTPT3 之最佳配偶體,但相對於NaM TP,使用CNMO TP導致ncAA納入之保真度稍微降低,但其使用導致最多非天然蛋白質產生。在最高濃度下,所有五種研究之Y TP皆有效地納入tRNAPyl 之反密碼子中且能介導具有至少中等ncAA納入保真度(98%至51%)之蛋白質產生。不受限於理論,UBP保留率數據表明蛋白質產生之保真度對非天然tRNA之適度損失不敏感,此意味著對於導致較低蛋白質凝膠位移之Y TP,tRNA之轉錄效率極低或保真度低。TPT3 TP、SICS TP、FSICS TP及TAT1 TP在最高濃度下皆係至少輕微毒性的(數據未顯示),且總體細胞螢光隨著濃度降低而增加。與X TP及mRNA之轉錄不同,非天然蛋白質之保真度未降低,表明增加之蛋白質產生僅僅係增加之細胞生長的結果。相反,5SICS TP顯示最小毒性(數據未顯示),且非天然蛋白質產生及保真度隨濃度降低而降低,此同樣可能係由於非天然tRNA產生顯著受損。當考慮此Y TP SAR且使用SICS TP作為參照時,7-氟取代基(FSICS TP)在一些情況下係有害的,且僅產生少量之蛋白質且保真度低。在5-位添加甲基(5SICS TP)降低毒性,但在一些情況下亦降低非天然tRNA產生。環收縮及雜原子衍生(TPT3 TP)在一些情況下改良蛋白質產生及保真度二者,但在高濃度下,與其他Y TP類似物相比,其通常係有毒的。TPT3 TP之噻吩環之進一步雜原子衍生以產生TAT1 TP之噻唑,導致產生比TPT3 TP更多之非天然蛋白質,同時毒性降低。鑒於產生之蛋白質之量及ncAA納入之保真度,在一些情形下,使用TAT1 TP作為Y TP。
實例 4 :較高密度非天然資訊之存儲及檢索 .
評估含有較高密度之UBP之基因之資訊的存儲及檢索。為了此目標,驗證SSO複製含有sfGFP基因之DNA之能力,其中UBP經定位以編碼密碼子149或153,其各自藉由單一天然密碼子與上述密碼子(密碼子151)分開。因此,如上所述構築表現質體,但其中序列A XC經定位以編碼密碼子149或153 (分別為sfGFP149 (AX C)或sfGFP153 (AX C))。在ML2轉變時,在非天然核苷三磷酸存在下生長細胞,對應於吾人先前報導之系統(去氧核糖核苷酸dNaM TP及dTPT3TP 及核糖核苷酸NaM TP及TPT3 TP,表示為dNaM -dTPT3 /NaM TP,TPT3 TP)、或本研究中發現之最佳化系統(dCNMO dTPT3 /NaM TP,TAT1 TP)。然後如上所述,使用鏈黴抗生物素蛋白凝膠位移分析表徵UBP保留率。在兩種條件下皆觀察到sfGFP149 (AX C)及sfGFP153 (AX C)基因中相應UBP之高保留率(≥95%)以及tRNA基因中相應UBP之高保留率(≥91%) (數據未顯示)。
誘導後3 h觀察到之總sfGFP螢光揭示在AzK存在下在兩組條件下自兩種構築體產生大量蛋白質( 7A )。
然而,來自提供有dCNMO dTPT3 /NaM ,TAT1 之表現sfGFP149 (AX C)構築體之細胞的螢光比提供有dNaM -dTPT3 /NaM ,TPT3 之細胞高58%。在sfGFP153(AX C)基因之情形下,用dCNMO dTPT3 /NaM TP,TAT1 TP觀察到之螢光比用dNaM dTPT3 /NaM TP,TPT3 TP觀察到之螢光多43%。在兩組條件下,用sfGFP153 (AX C)觀察到之螢光比用sfGFP149 (AX C)觀察到之螢光多大約2倍。如上所述純化蛋白質並分析AzK納入( 7B )。在利用dNaM -dTPT3 /NaM TP,TPT3 TP之情況下,用sfGFP149 (AX C)及sfGFP153 (AX C)分別觀察到86%及94%之蛋白質位移。然而,在利用dCNMO dTPT3 /NaM TP,TAT1 TP之情況下,利用自任一構築體產生之蛋白質觀察到96%之位移。該等結果清楚地展現,兩個額外密碼子位置皆有效地轉錄及轉譯,但其再次由新近鑑別之dCNMO -dTPT3 /NaM TP,TAT1 TP系統更好地轉錄及轉譯。構築在兩個或所有三個檢查位置同時編碼非天然密碼子之表現質體(分別sfGFP149,151 (AX C,AX C)、sfGFP151,153 (AX C,AX C)、sfGFP149,153 (AX C,AX C)及sfGFP149,151,153 (AX C,AX C,AX C))。轉變ML2細胞,在dNaM dTPT3 /NaM TP,TPT3 TP或dCNMO dTPT3 /NaM TP,TAT1 TP存在下生長,並如上所述誘導蛋白質表現。儘管tRNAPyl (GY T)基因中之UBP保留率在所有情形下皆較高(≥88%) (數據未顯示),但利用mRNA基因之生物素位移分析產生複雜且不可解釋之帶型,此可能至少部分係由於與結合至多個鏈黴抗生物素蛋白之單一PCR產物形成複合物之混合物。檢查經由如上所述與DBCO-TAMRA結合而產生之蛋白質( 7B )。可喜地,相對於利用單一ncAA觀察到之位移,對於自sfGFP149,151 (AX C,AX C)、sfGFP151,153 (AX C,AX C)及sfGFP149,153 (AX C,AX C)構築體表現之蛋白質觀察到顯著進一步移位之帶,指示兩個DBCO-TAMRA分子與帶有兩個AzK殘基之sfGFP之結合。當分析利用dNaM -dTPT3 /NaM TP,TPT3 TP表現之純化蛋白時,該等雙移位帶相對於總sfGFP之量化揭示,當分別使用sfGFP149,151 (AX C,AX C)、sfGFP151,153 (AX C,AX C)或sfGFP149,153 (AX C,AX C)構築體時,分別80%、87%及83%之蛋白質具有兩個AzK殘基,且20%、13%或9%具有單一AzK。在利用dCNMO dTPT3 /NaM TP,TAT1 TP之情況下,對於sfGFP149,151 (AX C,AX C)、sfGFP151,153 (AX C,AX C)及sfGFP149,153 (AX C,AX C),81%、89%及93%之蛋白質分別具有兩個ncAA,而19%、11%及6%具有單一ncAA。經sfGFP149,151,153 (AX C,AX C,AX C)構築體轉變之細胞表現產生甚至進一步移位之帶之蛋白質,清楚地表明三個AzK殘基之納入。相對於總sfGFP對每一帶之量化揭示,使用dNaM -dTPT3 /NaM TP,TPT3 TP導致分別39%、24%及33%之蛋白質具有三個、兩個及一個ncAA,且螢光及蛋白質位移高度可變( 7A7B )。相反,使用dCNMO -dTPT3 /NaM TP,TAT1 TP系統導致90%之產生之蛋白質具有所有三個ncAA,其餘具有兩個。
為了進一步驗證利用dCNMO -dTPT3 /NaM TP,TAT1 TP系統成功地納入所有三個ncAA,藉由定量完整蛋白質譜分析分離之sfGFP。簡言之,使用離心過濾裝置(AmiconR Ultra-0.5- Millipore)使純化之蛋白質脫鹽,並藉由HRMS (ESI-TOF)分析。隨後使用Waters MaxEnt1軟體對獲得之質譜去卷積,其在峰積分後證明係定量的(數據未顯示)。與凝膠位移分析一致,此分析揭示88%之分離之蛋白質含有預期三個AzK殘基,而剩餘之12%含有兩個AzK殘基及單一Ile或Leu殘基( 7C )。結果. 總之,SAR鑑別dCNMO dTPT3 /NaM TP,TAT1 TP系統以ncAA之高保真度納入產生高量之蛋白質。使用dCNMO dTPT3 /5FMTP ,TAT1 TP以相同高保真度產生蛋白質,而在其產生稍微較少蛋白質時,其需要使用顯著更少之非天然核糖核苷酸。dCNMO -dTPT3 /NaM TP,TAT1 TP系統之效用在一些情況下可用於編碼及檢索較高密度之非天然資訊。兩種系統皆以高保真度產生具有兩個ncAA之蛋白質,但dCNMO dTPT3 /NaM TP,TAT1 TP系統通常產生更大量之期望蛋白質。此外,當編碼三個ncAA時,dNaM -dTPT3 /NaM TP,TPT3 TP系統以顯著降低及更可變之保真度及產率產生三重標記之蛋白質,而利用dCNMO -dTPT3 /NaM TP,TAT1 TP系統之保真度及產率保持可再現地高。不受限於理論,Ile或Leu置換一個ncAA之污染物不可能由非天然tRNA產生引起,此乃因tRNA基因中之UBP保留率高且對於兩種系統類似,且即使存在小的差異,單一ncAA納入數據亦表明其不應引起非天然蛋白質產生之保真度的顯著降低。其亦不可能由mRNA轉錄產生,此對於兩個系統應相同(在兩種情形下dTPT3 引導NaM 納入mRNA中)。不受限於理論,Leu/Ile污染物之起點可能係複製期間mRNA基因中之UBP之損失;此亦與預期之最常見突變(dX至dT)一致,該突變將產生Ile密碼子。
本文藉由標識引用提及之所有出版物、專利申請按及公開之專利申請案之揭示內容以引用方式整體併入本文中。序列 SEQ ID NO:1. pGEX-MbPylRS TetR PylRS表現質體之序列(5923 bp) GTAAATCACTGCATAATTCGTGTCGCTCAAGGCGCACTCCCGTTCTGGATAATGTTTTTTGCGCCGACAT CATAACGGTTCTGGCAAATATTCTGAAATGAGCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGA ATTGTGAGCGGATAACAATTTCACACAGGAAACAGTATTCATGGATAAAAAACCGCTGGACGTTCTGATC TCCGCTACGGGTCTGTGGATGAGCCGCACGGGTACGCTGCATAAAATTAAACACCACGAAGTGTCACGTT CGAAAATCTATATCGAAATGGCGTGCGGTGATCATCTGGTGGTTAACAATAGCCGTTCTTGTCGCACCGC GCGTGCCTTTCGCCATCACAAATACCGCAAAACGTGCAAACGTTGTCGCGTGTCAGATGAAGACATTAAC AATTTCCTGACCCGTAGTACGGAATCCAAAAACTCAGTGAAAGTTCGCGTCGTGAGTGCTCCGAAAGTTA AAAAAGCGATGCCGAAAAGTGTCTCCCGTGCCCCGAAACCGCTGGAAAACTCAGTGTCGGCAAAAGCTTC CACCAATACGAGCCGCTCTGTTCCGTCGCCGGCAAAAAGCACCCCGAACAGCTCTGTCCCGGCAAGCGCA CCGGCACCGTCTCTGACGCGTAGTCAGCTGGATCGCGTGGAAGCCCTGCTGTCCCCGGAAGACAAAATCT CACTGAATATGGCAAAACCGTTTCGTGAACTGGAACCGGAACTGGTTACCCGTCGCAAAAACGATTTCCA ACGTCTGTATACGAATGATCGCGAAGACTACCTGGGTAAACTGGAACGTGATATCACCAAATTTTTCGTG GACCGCGGCTTTCTGGAAATCAAATCTCCGATTCTGATCCCGGCTGAATATGTTGAACGCATGGGTATTA ACAATGATACCGAACTGAGTAAACAGATTTTTCGTGTGGATAAAAACCTGTGCCTGCGGCCGATGCTGGC ACCGACGCTGTATAATTACCTGCGTAAACTGGATCGCATTCTGCCGGGTCCGATTAAAATCTTTGAAGTG GGCCCGTGTTATCGTAAAGAATCGGATGGCAAAGAACACCTGGAAGAATTTACCATGGTTAACTTCTGCC AAATGGGCAGCGGTTGTACGCGCGAAAATCTGGAAGCGCTGATCAAAGAATTCCTGGATTACCTGGAAAT CGACTTCGAAATCGTCGGTGATTCTTGCATGGTGTATGGCGATACCCTGGACATCATGCATGGTGACCTG GAACTGAGTTCCGCTGTTGTCGGTCCGGTCAGCCTGGATCGTGAATGGGGCATTGACAAACCGTGGATCG GCGCGGGTTTTGGCCTGGAACGCCTGCTGAAAGTTATGCACGGCTTCAAAAACATCAAACGTGCGTCTCG CTCGGAATCGTATTACAACGGCATCTCAACCAATCTGTAATAATGACTGACGATCTGCCTCGCGCGTTTC GGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATG CCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCCA GTCACGTAGCGATAGCGGAGTGTATAATTCTTGAAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAG GTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCC CTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCT TCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCG GCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGG GTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGA ACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTGTTGACGCCGGG CAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAA AGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGC GGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGAT CATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCA CGATGCCTGCAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCG GCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCT GGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGC CAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAA TAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATAT ATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATC TCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGG ATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCG GTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGA TACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTAC ATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTG GACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCA GCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCC CGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTT CCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTT TGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGC CTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCGAGCTCTTAGCGCGAATTGTCGAGG GAAATTTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATA ATATTAAATATGGCTGGTTCTCGCAGAAAGAAACATATCCATGAAATCCCGCCCCGAATTGATATGTCCA GATTAGATAAAAGTAAAGTGATTAACAGCGCATTAGAGCTGCTTAATGAGGTCGGAATCGAAGGTTTAAC AACCCGTAAACTCGCCCAGAAGCTAGGTGTAGAGCAGCCTACATTGTATTGGCATGTAAAAAATAAGCGG GCTTTGCTCGACGCCTTAGCCATTGAGATGTTAGATAGGCACCATACTCACTTTTGCCCTTTAGAAGGGG AAAGCTGGCAAGATTTTTTACGTAATAACGCTAAAAGTTTTAGATGTGCTTTACTAAGTCATCGCGATGG AGCAAAAGTACATTTAGGTACACGGCCTACAGAAAAACAGTATGAAACTCTCGAAAATCAATTAGCCTTT TTATGCCAACAAGGTTTTTCACTAGAGAATGCATTATATGCACTCAGCGCTGTGGGGCATTTTACTTTAG GTTGCGTATTGGAAGATCAAGAGCATCAAGTCGCTAAAGAAGAAAGGGAAACACCTACTACTGATAGTAT GCCGCCATTATTACGACAAGCTATCGAATTATTTGATCACCAAGGTGCAGAGCCAGCCTTCTTATTCGGC CTTGAATTGATCATTTGCGGATTAGAAAAACAACTTAAATGTGAAAGTGGGTCTTAAGCACTAGGTCTAG GGCGGCGGATTTGTCCTACTCAGGAGAGCGTTCACCGACAAACAACAGATAAAACGAAAGGCCCAGTCTT TCGACTGAGCCTTTCGTTTTATTTGATGCCTCTAGCACGCGTAGAGCTAGAGCCTTCAACCCAGTCAGCT CCTTCCGGTGGGCGCGGGGCATGACTAACATGAGAATTACAACTTATATCGTATGGGGCTGACTTCAGGT GCTACATTTGAAGAGATAAATTGCACTGAAATCTAGATGATTCTGTGGATAACCGTATTACCGCCTTTGA GTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAG CGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATAAATTCCGACACCATCG AATGGTGCAAAACCTTTCGCGGTATGGCATGATAGCGCCCGGAAGAGAGTCAATTCAGGGTGGTGAATGT GAAACCAGTAACGTTATACGATGTCGCAGAGTATGCCGGTGTCTCTTATCAGACCGTTTCCCGCGTGGTG AACCAGGCCAGCCACGTTTCTGCGAAAACGCGGGAAAAAGTGGAAGCGGCGATGGCGGAGCTGAATTACA TTCCCAACCGCGTGGCACAACAACTGGCGGGCAAACAGTCGTTGCTGATTGGCGTTGCCACCTCCAGTCT GGCCCTGCACGCGCCGTCGCAAATTGTCGCGGCGATTAAATCTCGCGCCGATCAACTGGGTGCCAGCGTG GTGGTGTCGATGGTAGAACGAAGCGGCGTCGAAGCCTGTAAAGCGGCGGTGCACAATCTTCTCGCGCAAC GCGTCAGTGGGCTGATCATTAACTATCCGCTGGATGACCAGGATGCCATTGCTGTGGAAGCTGCCTGCAC TAATGTTCCGGCGTTATTTCTTGATGTCTCTGACCAGACACCCATCAACAGTATTATTTTCTCCCATGAA GACGGTACGCGACTGGGCGTGGAGCATCTGGTCGCATTGGGTCACCAGCAAATCGCGCTGTTAGCGGGCC CATTAAGTTCTGTCTCGGCGCGTCTGCGTCTGGCTGGCTGGCATAAATATCTCACTCGCAATCAAATTCA GCCGATAGCGGAACGGGAAGGCGACTGGAGTGCCATGTCCGGTTTTCAACAAACCATGCAAATGCTGAAT GAGGGCATCGTTCCCACTGCGATGCTGGTTGCCAACGATCAGATGGCGCTGGGCGCAATGCGCGCCATTA CCGAGTCCGGGCTGCGCGTTGGTGCGGATATCTCGGTAGTGGGATACGACGATACCGAAGACAGCTCATG TTATATCCCGCCGTTAACCACCATCAAACAGGATTTTCGCCTGCTGGGGCAAACCAGCGTGGACCGCTTG CTGCAACTCTCTCAGGGCCAGGCGGTGAAGGGCAATCAGCTGTTGCCCGTCTCACTGGTGAAAAGAAAAA CCACCCTGGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACG ACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATSEQ ID NO: 2. sfGFP及tRNAPyl 表現之p[sfGFP(gg)151;tRNAPyl(gg)] GG目標質體之序列(3101 bp) TAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATAT CCGGATTGGTTAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCTAGAAAAGCATT GGAAACCGAGACCGGTACCGGTCTCTTAGATTCCCGGGGTTTCCGCCAAATTCGAAAAGCCTGCTCAACG AGCAGGCTTTTTTGCATCTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCCTGA ACGAGCAGGCTTTTTTGCATAAGCTTCCTAGTGGCAGCGGCTAACTAAGCGGCCTGCTGACTTTCTCGCC GATCAAAAGGCATTTTGCTATTAAGGGATTGACGAGGGCGTATCTGCGCAGTAAGATGCGCCCCGCATTG GAGACGCCATGGCGTCTCGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACT TGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTAATTCGAAAAGCCTGCTCAACGAGCAGGCTTTTTTGGT CGACAGTAGTGGCAGCGGCTAACTAAGCGGCCTGCTGACTTTCTCGCCGATCAAAAGGCATTTTGCTATT AAGGGATTGACGAGGGCGTATCTGCGCAGTAAGATGCGCCCCGCATGAGACGGCATGCCGTCTCTAGAGC TAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTT TTTAATTCGAAAAGCCTGCTCAACGAGCAGGCTTTTTTGGTCGACAGTTCATAGGTGATTGCGGATCCCG TCGTTGACAATTAATCATCGGCATAGTATATCGGCATAGTATAATACGACAAGGTGAGGAACTAAACCAT GGCCAAGTTGACCAGTGCCGTTCCGGTGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGGACC GACCGGCTCGGGTTCTCCCGCGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCC TGTTCATCAGCGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCT GGACGAGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCCGGCCATG ACCGAGATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCCGGCAACTGCGTGCACT TCGTGGCCGAGGAGCAGGACTGAGAGCTCGCTTGGACTCCTGTTGATAGATCCAGTAATGACCTCAGAAC TCCATCTGGATTTGTTCAGAACGCTCGGTTGCCGCCGGGCGTTTTTTATTGGTGAGAATCCAAGCACTAG CTAGTAACAACTTATATCGTATGGGGCTGACTTCAGGTGCTACATTTGAAGAGATAAATTGCACTGAAAT CTAGTAATATTTTATCTGATTAATAAGATGATCTTCTTGAGATCGTTTTGGTCTGCGCGTAATCTCTTGC TCTGAAAACGAAAAAACCGCCTTGCAGGGCGGTTTTTCGAAGGTTCTCTGAGCTACCAACTCTTTGAACC GAGGTAACTGGCTTGGAGGAGCGCAGTCACCAAAACTTGTCCTTTCAGTTTAGCCTTAACCGGCGCATGA CTTCAAGACTAACTCCTCTAAATCAATTACCAGTGGCTGCTGCCAGTGGTGCTTTTGCATGTCTTTCCGG GTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGACTGAACGGGGGGTTCGTGCATACAG TCCAGCTTGGAGCGAACTGCCTACCCGGAACTGAGTGTCAGGCGTGGAATGAGACAAACGCGGCCATAAC AGCGGAATGACACCGGTAAACCGAAAGGCAGGAACAGGAGAGCGCACGAGGGAGCCGCCAGGGGGAAACG CCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCACTGATTTGAGCGTCAGATTTCGTGATGCTTGTC AGGGGGGCGGAGCCTATGGAAAAACGGCTTTGCCGCGGCCCTCTCACTTCCCTGTTAAGTATCTTCCTGG CATCTTCCAGGAAATCTCCGCCCCGTTCGTAAGCCATTTCCGCTCGCCGCAGTCGAACGACCGAGCGTAG CGAGTCAGTGAGCGAGGAAGCGGAATATATCCCTTAATACGACTCACTATAGGGTCCCTATCAGTGATAG AGAGGTCTAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATACATATGTCGAAAGGCGAAGAACTGTT TACGGGAGTGGTGCCTATCCTGGTAGAGCTCGACGGAGATGTAAACGGTCACAAATTTTCAGTCCGCGGG GAAGGCGAAGGCGATGCGACCAACGGTAAATTAACTTTGAAGTTTATTTGCACCACCGGCAAATTACCGG TGCCTTGGCCGACGCTTGTGACGACCCTGACTTACGGGGTGCAGTGTTTCAGTCGCTACCCAGATCACAT GAAACGCCATGACTTCTTCAAATCTGCGATGCCGGAAGGCTATGTGCAGGAACGTACAATTAGCTTTAAA GACGACGGCACGTATAAAACGCGGGCAGAGGTTAAATTTGAGGGAGATACCCTGGTAAACCGTATTGAAC TGAAAGGCATCGATTTTAAAGAAGATGGGAACATCTTGGGCCACAAGAGACCGGTACCGGTCTCGGAATC AAAGCAAATTTCAAGATCCGTCATAACGTGGAGGACGGTTCCGTGCAGCTTGCAGATCACTATCAGCAGA ATACGCCGATTGGCGATGGCCCGGTGCTGCTGCCCGATAATCACTACCTCTCTACTCAGAGTGTTTTATC GAAAGACCCGAACGAGAAGCGTGATCACATGGTGCTGCTTGAATTTGTTACCGCGGCAGGTATTACACAC GGCATGGATGAGTTGTATAAGGGATCCGCTTGGAGCCACCCGCAGTTCGAGAAAGGTGGAGGTTCCGGAG GTGGATCGGGAGGTTCGGCGTGGAGCCACCCGCAGTTCGAAAAATAAAAGCTTAATTAGCTGAGCTTGGA CTCCCTGCCACCGCTGAGCAA
101:DNA 102:蛋白質 103:tRNA 104:轉錄 105:非天然胺基酸 106:tRNA 107:mRNA 108:轉譯 109:非天然胺基酸 110:蛋白質
本發明之各種態樣具體陳述於隨附申請專利範圍中。藉由參照陳述其中利用本發明原理之說明性實施例的下文詳細說明及附圖將會更好地瞭解本發明之特徵及優點,在附圖中:
1A 圖解說明使用非天然鹼基對(UBP)以使用非天然X-Y鹼基對將非經典胺基酸(ncAA)位點特異性地納入蛋白質中的工作流。將三個ncAA納入蛋白質中僅作為實例顯示;可納入任何數量之ncAA。
1B 繪示非天然鹼基對(UBP)。
2 繪示dX TP類似物。為清晰起見,已省略核糖及磷酸酯。
3A 圖解說明使用各種dX TP最佳化AzK向sfGFP中之納入之sfGFP基因中UBP保留率(%)之圖。每個槓代表平均值,其中誤差槓指示標準誤差(n = 3)。空心圓代表每一獨立試驗之數據。星號指示細胞不能在所指示條件下生長。
3B 圖解說明使用各種dX TP最佳化AzK向sfGFP中之納入之tRNAPyl基因中UBP保留率(%)之圖。每個槓代表平均值,其中誤差槓指示標準誤差(n = 3)。空心圓代表每一獨立試驗之數據。星號指示細胞不能在所指示條件下生長。
3C 圖解說明觀察到之相對sfGFP螢光之圖,其在存在或不存在AzK下對細胞生長(相對螢光單位(RFU)/OD600)進行正規化以使用各種dX TP最佳化AzK向sfGFP中之納入。每個槓代表平均值,其中誤差槓指示標準誤差(n = 3)。空心圓代表每一獨立試驗之數據。星號指示細胞不能在所指示條件下生長。
3D 圖解說明使用各種dX TP最佳化AzK向sfGFP中之納入之藉由西方印跡量測之相對蛋白質位移(%)的圖。每個槓代表平均值,其中誤差槓指示標準誤差(n = 3)。空心圓代表每一獨立試驗之數據。星號指示細胞不能在所指示條件下生長。
4A 繪示核糖核苷酸XTP類似物。為清晰起見,已省略核糖及磷酸酯。
4B 繪示核糖核苷酸YTP類似物。為清晰起見,已省略核糖及磷酸酯。
5A 圖解說明使用各種非天然核糖核苷酸以將AzK納入sfGFP中之轉譯之SAR分析的圖,在y軸上觀察到在AzK存在下X TP類似物之總sfGFP螢光(RFU)。每個槓代表平均值,其中誤差槓指示標準誤差(n = 4)。空心圓代表每一獨立試驗之數據。
5B 圖解說明使用各種非天然核糖核苷酸以將AzK納入sfGFP中之轉譯之SAR分析的圖,在y軸上觀察到X TP類似物之藉由西方印跡量測之蛋白質位移(%)。每個槓代表平均值,其中誤差槓指示標準誤差(n = 4)。空心圓代表每一獨立試驗之數據。
5C 圖解說明使用各種非天然核糖核苷酸以將AzK納入sfGFP中之轉譯之SAR分析的圖,在y軸上觀察到在AzK存在下Y TP類似物之總sfGFP螢光(RFU)。每個槓代表平均值,其中誤差槓指示標準誤差(n = 4)。空心圓代表每一獨立試驗之數據。
5D 圖解說明使用各種非天然核糖核苷酸以將AzK納入sfGFP中之轉譯之SAR分析的圖,在y軸上觀察到Y TP類似物之藉由西方印跡量測之蛋白質位移(%)。每個槓代表平均值,其中誤差槓指示標準誤差(n = 4)。空心圓代表每一獨立試驗之數據。
6A 圖解說明隨NaM TP及TAT1 TP濃度(μM)變化之總sfGFP螢光(RFU)之非天然核糖核苷酸三磷酸濃度之最佳化的圖。誤差槓指示每一值之標準誤差(n = 3)。
6B 圖解說明隨5FM TP及TAT1 TP濃度(μM)變化之總sfGFP螢光(RFU)之非天然核糖核苷酸三磷酸濃度之最佳化的圖。誤差槓指示每一值之標準誤差(n = 3)。
6C 圖解說明隨NaM TP及TAT1 TP濃度(μM)變化之蛋白質位移(%)之非天然核糖核苷酸三磷酸濃度之最佳化的圖。誤差槓指示每一值之標準誤差(n = 3)。
6D 圖解說明隨5FM TP及TAT1 TP濃度(μM)變化之蛋白質位移(%)之非天然核糖核苷酸三磷酸濃度之最佳化的圖。誤差槓指示每一值之標準誤差(n = 3)。
7A 為在AzK存在下觀察到之各種非天然鹼基對、密碼子位置及總sfGFP螢光(RFU)之較高密度非天然資訊之儲存及檢索的圖。對於條形圖,每一杠代表平均值,其中誤差杠指示標準誤差(n = 4),且空心圓代表每一獨立試驗之數據。
7B 為在AzK存在下觀察到之各種非天然鹼基對、密碼子位置及藉由西方印跡量測之蛋白質位移(%)之較高密度非天然資訊之儲存及檢索的圖。對於條形圖,每一杠代表平均值,其中誤差杠指示標準誤差(n = 4),且空心圓代表每一獨立試驗之數據。
7C 繪示使用dCNMOdTPT3/NaMTP、TAT1TP產生之三重標記之蛋白質之定量HRMS分析的代表性譜。峰標記顯示完整蛋白質之去卷積分子量,其中顯示149、151及153位之胺基酸殘基,且以下顯示每一峰(%,n = 3)之定量。
8A 顯示實例性非天然胺基酸。此圖改編自Young等人,「Beyond the canonical 20 amino acids: expanding the genetic lexicon,」J. of Biological Chemistry 285(15): 11039-11044 (2010)之圖2。
8B 圖解說明實例性非天然胺基酸離胺酸衍生物。
8C 圖解說明實例性非天然胺基酸苯丙胺酸衍生物。
8D-8G 圖解說明實例性非天然胺基酸。該等非天然胺基酸(UAA)在蛋白質中經遺傳編碼( 8D - UAA #1-42; 8E - UAA # 43-89; 8F - UAA # 90-128; 8G - UAA # 129-167)。 8D-8G 係改編自Dumas等人,Chemical Science 2015, 6, 50-69之表1。
 
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008
Figure 12_A0101_SEQ_0009
Figure 12_A0101_SEQ_0010
Figure 12_A0101_SEQ_0011
Figure 12_A0101_SEQ_0012
Figure 12_A0101_SEQ_0013
101:DNA
102:蛋白質
103:tRNA
104:轉錄
105:非天然胺基酸
106:tRNA
107:mRNA
108:轉譯
109:非天然胺基酸
110:蛋白質

Claims (102)

  1. 一種以下結構之核鹼基,
    Figure 03_image1291
    , 其中: 各X獨立地係碳或氮; 當X係碳時,R2 存在且獨立地係氫、烷基、烯基、炔基、甲氧基、甲硫醇、甲硒基、鹵素、氰基或疊氮基; Y係硫、氧、硒或二級胺;且 E係氧、硫或硒; 其中波形線指示與核糖基、去氧核糖基或二去氧核糖基部分或其類似物之鍵結點,其中該核糖基、去氧核糖基或二去氧核糖基部分或其類似物係呈游離形式,連接至單-磷酸酯、二磷酸酯、三磷酸酯、α-硫代三磷酸酯、β-硫代三磷酸酯、或γ-硫代三磷酸酯基團,或包括於RNA或DNA或RNA類似物或DNA類似物中。
  2. 如請求項1之核鹼基,其中X係碳。
  3. 如請求項1或2之核鹼基,其中E係硫。
  4. 如請求項1至3中任一項之核鹼基,其中Y係硫。
  5. 如請求項1之核鹼基,其具有結構
    Figure 03_image1293
  6. 如請求項1至5中任一項之核鹼基,其結合至互補鹼基配對核鹼基,以形成非天然鹼基對(UBP)。
  7. 如請求項6之核鹼基,其中該互補鹼基配對核鹼基係選自:
    Figure 03_image1295
    Figure 03_image1297
    Figure 03_image1299
  8. 一種雙股寡核苷酸雙螺旋體(duplex),其中第一寡核苷酸股包含如請求項1至5中任一項之核鹼基,且第二互補寡核苷酸股於其互補鹼基配對位點包含互補鹼基配對核鹼基。
  9. 如請求項8之雙股寡核苷酸雙螺旋體,其中該第一寡核苷酸股包含
    Figure 03_image1301
    ;且該第二股於其互補鹼基配對位點包含選自以下之互補鹼基配對核鹼基:
    Figure 03_image1303
    Figure 03_image1305
    Figure 03_image1307
  10. 如請求項9之雙股寡核苷酸雙螺旋體,其中該第二股包含互補鹼基配對核鹼基
    Figure 03_image1309
  11. 如請求項9之雙股寡核苷酸雙螺旋體,其中該第二股包含互補鹼基配對核鹼基
    Figure 03_image1311
  12. 一種質體,其包含編碼轉運RNA (tRNA)之基因及/或編碼所關注蛋白質之基因,其中該基因包含至少一個如請求項1至5中任一項之核鹼基或TPT3 (
    Figure 03_image1313
    )及至少一個如請求項7之互補鹼基配對核鹼基或NaM (
    Figure 03_image1315
    ),其中該互補鹼基配對核鹼基係在互補鹼基配對位點。
  13. 一種mRNA,其由如請求項12之編碼tRNA之質體編碼。
  14. 一種mRNA,其由如請求項12之編碼蛋白質之質體編碼。
  15. 一種轉運RNA (tRNA),其包含如請求項1至5中任一項之核鹼基,該轉運RNA包含: 反密碼子,其中該反密碼子包含該核鹼基,視情況其中該核鹼基在該反密碼子之第一、第二或第三位置;及 識別元件,其中該識別元件促進該tRNA藉由胺基醯基tRNA合成酶選擇性加載非天然胺基酸。
  16. 如請求項15之tRNA,其中該胺基醯基tRNA合成酶係源自甲烷八疊球菌屬(Methanosarcina )或其變體,或甲烷球菌屬(Methanococcus ) (甲烷暖球菌屬(Methanocaldococcus ))或其變體。
  17. 如請求項15之tRNA,其中該非天然胺基酸包含芳香族部分。
  18. 如請求項15之tRNA,其中該非天然胺基酸係離胺酸或苯丙胺酸衍生物。
  19. 一種包含下式之結構, N1 - Zx - N2 其中: 各Z獨立地係如請求項1至7中任一項之核鹼基,其鍵結至核糖基或去氧核糖基或其類似物; N1係連接在Z之核糖基或去氧核糖基或其類似物之5’端之一或多個核苷酸或其類似物、或末端磷酸酯基團; N2係連接至Z之核糖基或去氧核糖基或其類似物之3’端之一或多個核苷酸或其類似物、或末端羥基;且 x係1至20之整數。
  20. 如請求項19之結構,其中該結構編碼基因,視情況其中Zx位於該基因之轉譯區或其中Zx位於該基因之非轉譯區。
  21. 一種聚核苷酸庫,其中該庫包含至少5000個獨特聚核苷酸,且其中各聚核苷酸包含至少一個如請求項1至5中任一項之核鹼基。
  22. 一種包含核鹼基之核苷三磷酸,其中該核鹼基係選自:
    Figure 03_image1317
    Figure 03_image1319
  23. 如請求項22之核苷三磷酸,其中該核鹼基係
    Figure 03_image1321
  24. 如請求項22或23之核苷三磷酸,其中該核苷包含核糖或去氧核糖。
  25. 一種DNA,其包含具有結構
    Figure 03_image1323
    之核鹼基及具有結構
    Figure 03_image1325
    之互補鹼基配對核鹼基。
  26. 一種DNA,其包含具有結構
    Figure 03_image1327
    之核鹼基及具有結構
    Figure 03_image1329
    之互補鹼基配對核鹼基。
  27. 一種將DNA轉錄為tRNA或編碼蛋白質之mRNA的方法,其包含: 使包含編碼該tRNA或蛋白質之基因之DNA與核糖核苷三磷酸及RNA聚合酶接觸,其中編碼該tRNA或蛋白質之基因包含與第二非天然鹼基配對且形成第一非天然鹼基對之第一非天然鹼基,且其中該核糖核苷三磷酸包含能與該第一非天然鹼基形成第二非天然鹼基對之第三非天然鹼基,其中該第一非天然鹼基對及該第二非天然鹼基對不相同。
  28. 如請求項27之方法,其中該等核糖核苷三磷酸進一步包含第四非天然鹼基,其中該第四非天然鹼基能與該第三非天然鹼基形成第二非天然鹼基對。
  29. 如請求項28之方法,其中該第一非天然鹼基對及該第二非天然鹼基對不相同。
  30. 如請求項27至29中任一項之方法,其進一步包含在該DNA與該等核糖核苷三磷酸及RNA聚合酶接觸之前,藉由使該DNA與去氧核糖核苷三磷酸及DNA聚合酶接觸來複製該DNA,其中該等核糖核苷三磷酸包含能與該第一非天然鹼基形成第五非天然鹼基對之第五非天然鹼基,其中該第一非天然鹼基對及該第五非天然鹼基對不相同。
  31. 如請求項27至30中任一項之方法,其中該第一非天然鹼基包含TPT3,該第二非天然鹼基包含CNMO或NaM,該第三非天然鹼基包含TAT1,且該第四非天然鹼基包含NaM或5FM。
  32. 如請求項27至31中任一項之方法,其中該方法包含使用半合成生物體,視情況其中該生物體係細菌,視情況其中該細菌係大腸桿菌(Escherichia coli )。
  33. 如請求項27至32中任一項之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
    Figure 03_image1331
    Figure 03_image1333
    Figure 03_image1335
  34. 如請求項33之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
    Figure 03_image1337
    Figure 03_image1339
  35. 如請求項34之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
    Figure 03_image1341
    Figure 03_image1343
  36. 如請求項34之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
    Figure 03_image1345
    Figure 03_image1347
  37. 如請求項34之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係
    Figure 03_image1349
  38. 如請求項34之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
    Figure 03_image1351
    Figure 03_image1353
  39. 如請求項34至38中任一項之方法,其中該第一或第二非天然鹼基係
    Figure 03_image1355
  40. 如請求項34至39中任一項之方法,其中該第一或第二非天然鹼基係
    Figure 03_image1357
  41. 如請求項34至38中任一項之方法,其中該第一非天然鹼基係
    Figure 03_image1359
    且該第二非天然鹼基係
    Figure 03_image1361
    或該第一非天然鹼基係
    Figure 03_image1363
    且該第二非天然鹼基係
    Figure 03_image1365
  42. 如請求項34至41中任一項之方法,其中該第三或第四非天然鹼基係
    Figure 03_image1367
  43. 如請求項34至42中任一項之方法,其中該第三或第四非天然鹼基係
    Figure 03_image1369
    Figure 03_image1371
  44. 如請求項34至38中任一項之方法,其中該第一非天然鹼基係
    Figure 03_image1373
    ,該第二非天然鹼基係
    Figure 03_image1375
    ,該第三非天然鹼基係
    Figure 03_image1377
    ,且該第四非天然鹼基係
    Figure 03_image1379
    Figure 03_image1381
  45. 如請求項34至38中任一項之方法,其中該第一非天然鹼基係
    Figure 03_image1383
    ,該第二非天然鹼基係
    Figure 03_image1385
    ,該第三非天然鹼基係
    Figure 03_image1387
    ,且該第四非天然鹼基係
    Figure 03_image1389
    Figure 03_image1391
  46. 如請求項34至38中任一項之方法,其中該第一非天然鹼基係
    Figure 03_image1393
    ,該第二非天然鹼基係
    Figure 03_image1395
    ,該第三非天然鹼基係
    Figure 03_image1397
    Figure 03_image1399
    且該第四非天然鹼基係
    Figure 03_image1401
  47. 如請求項34至43中任一項之方法,其中該第三非天然鹼基係
    Figure 03_image1403
    Figure 03_image1405
  48. 如請求項34至47中任一項之方法,其中該第四非天然鹼基係
    Figure 03_image1407
  49. 如請求項34至38中任一項之方法,其中該第一非天然鹼基係
    Figure 03_image1409
    ,該第二非天然鹼基係
    Figure 03_image1411
    ,該第三非天然鹼基係
    Figure 03_image1413
    Figure 03_image1415
    ,且該第四非天然鹼基係
    Figure 03_image1417
  50. 如請求項34至49中任一項之方法,其中該DNA包含至少一個選自以下之非天然鹼基對(UBP):
    Figure 03_image1419
    Figure 03_image1421
    Figure 03_image1423
  51. 如請求項34至50中任一項之方法,其中該DNA包含至少一個選自以下之非天然鹼基對(UBP):
    Figure 03_image1425
    Figure 03_image1427
    ;且其中該mRNA及/或該tRNA包含至少一個選自以下之非天然鹼基:
    Figure 03_image1429
    Figure 03_image1431
  52. 如請求項27至51中任一項之方法,其中該第一非天然鹼基包含dCNMO,且該第二非天然鹼基包含dTPT3。
  53. 如請求項27至52中任一項之方法,其中該第三非天然鹼基包含NaM,且該第二非天然鹼基包含TAT1。
  54. 如請求項27至53中任一項之方法,其中轉錄該mRNA,且該方法進一步包含將該mRNA轉譯成蛋白質,其中該蛋白質在對應於包含該第三非天然鹼基之mRNA之密碼子的位置包含非天然胺基酸。
  55. 如請求項27至54中任一項之方法,其中該蛋白質包含至少兩個非天然胺基酸。
  56. 如請求項27至54中任一項之方法,其中該蛋白質包含至少三個非天然胺基酸。
  57. 如請求項27至54中任一項之方法,其中該蛋白質包含至少兩個不同非天然胺基酸。
  58. 如請求項27至54中任一項之方法,其中該蛋白質包含至少三個不同非天然胺基酸。
  59. 如請求項27至58中任一項之方法,其中該至少一個非天然胺基酸: 係離胺酸類似物; 包含芳香族側鏈; 包含疊氮基; 包含炔基;或 包含醛或酮基。
  60. 如請求項27至59中任一項之方法,其中該至少一個非天然胺基酸不包含芳香族側鏈。
  61. 如請求項59或60之方法,其中該至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)或N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。
  62. 如請求項61之方法,其中該至少一個非天然胺基酸包含N6-疊氮基乙氧基-羰基-L-離胺酸(AzK)。
  63. 如請求項61之方法,其中該至少一個非天然胺基酸包含N6-炔丙基乙氧基-羰基-L-離胺酸(PraK)。
  64. 一種由如請求項27至63中任一項之方法產生之mRNA。
  65. 一種由如請求項27至63中任一項之方法產生之tRNA。
  66. 一種由如請求項64之mRNA編碼之蛋白質,其在對應於包含第三非天然鹼基之mRNA之密碼子之位置包含非天然胺基酸。
  67. 一種包含擴展遺傳字母之半合成生物體,其中該遺傳字母包含至少三個不同非天然鹼基。
  68. 如請求項67之半合成生物體,其中該生物體包含微生物,視情況其中該微生物係大腸桿菌。
  69. 如請求項67或68之半合成生物體,其中該生物體包含含有至少一個選自以下之非天然核鹼基的DNA:
    Figure 03_image1433
    Figure 03_image1435
    Figure 03_image1437
  70. 如請求項67至69中任一項之半合成生物體,其中該DNA包含至少一個非天然鹼基對(UBP), 其中該非天然鹼基對(UBP)係dCNMO-dTPT3、dNaM-dTPT3、dCNMO-dTAT1、d5FM-dTAT1或dNaM-dTAT1。
  71. 如請求項67之半合成生物體,其中該DNA包含至少一個非天然核鹼基,其為
    Figure 03_image1439
  72. 如請求項67至71中任一項之半合成生物體,其中該生物體表現異源核苷三磷酸轉運體。
  73. 如請求項72之半合成生物體,其中該異源核苷三磷酸轉運體係Pt NTT2。
  74. 如請求項67至73中任一項之半合成生物體,其中該生物體進一步表現異源tRNA合成酶。
  75. 如請求項74之半合成生物體,其中該異源tRNA合成酶係巴氏甲烷八疊球菌(M. barkeri )吡咯離胺醯基-tRNA合成酶(Mb PylRS)。
  76. 如請求項67至75中任一項之半合成生物體,其中該生物體進一步表現異源RNA聚合酶。
  77. 如請求項76之半合成生物體,其中該異源RNA聚合酶係T7 RNAP。
  78. 如請求項67至77中任一項之半合成生物體,其中該生物體不表現具有DNA重組修復功能之蛋白質。
  79. 如請求項78之半合成生物體,其中該生物體不表現RecA。
  80. 如請求項67至79中任一項之半合成生物體,其進一步包含異源mRNA。
  81. 如請求項80之半合成生物體,其中該異源mRNA包含至少一個選自以下之非天然鹼基:
    Figure 03_image1441
    Figure 03_image1443
  82. 如請求項67至81中任一項之半合成生物體,其進一步包含異源tRNA。
  83. 如請求項82之半合成生物體,其中該異源tRNA包含至少一個選自以下之非天然鹼基:
    Figure 03_image1445
    Figure 03_image1447
  84. 一種轉錄DNA之方法,該方法包含: 提供一或多種DNA,其包含(1) 編碼蛋白質之基因,其中編碼該蛋白質之基因之模板股包含第一非天然鹼基,及(2) 編碼tRNA之基因,其中編碼該tRNA之基因之模板股包含能與該第一非天然鹼基形成鹼基對之第二非天然鹼基; 轉錄編碼該蛋白質之基因,以將第三非天然鹼基納入mRNA中,該第三非天然鹼基能與該第一非天然鹼基形成第一非天然鹼基對; 轉錄編碼tRNA之基因,以將第四非天然鹼基納入tRNA中,其中該第四非天然鹼基能與該第二非天然鹼基形成第二非天然鹼基對,其中該第一非天然鹼基對及該第二非天然鹼基對不相同。
  85. 如請求項84之方法,其進一步包含利用該tRNA,自該mRNA轉譯蛋白質,其中該蛋白質在對應於包含該mRNA中第三非天然鹼基之密碼子之位置包含非天然胺基酸。
  86. 一種複製DNA之方法,該方法包含: 提供DNA,其包含(1) 編碼蛋白質之基因,其中編碼該蛋白質之基因之模板股包含第一非天然鹼基,及(2) 編碼tRNA之基因,其中編碼該tRNA之基因之模板股包含能與該第一非天然鹼基形成鹼基對之第二非天然鹼基;及 複製該DNA,以納入第一替代非天然鹼基代替該第一非天然鹼基,及/或納入第二替代非天然鹼基代替該第二非天然鹼基; 其中該方法視情況進一步包含: 轉錄編碼蛋白質之基因,以將第三非天然鹼基納入mRNA中,該第三非天然鹼基能與該第一非天然鹼基及/或該第一替代非天然鹼基形成第一非天然鹼基對;及/或 轉錄編碼tRNA之基因,以將第四非天然鹼基納入tRNA中,其中該第四非天然鹼基能與該第二非天然鹼基及/或該第二替代非天然鹼基形成第二非天然鹼基對,其中該第一非天然鹼基對及該第二非天然鹼基對不相同。
  87. 如請求項86之方法,其進一步包含轉錄編碼蛋白質之基因,以將第三非天然鹼基納入mRNA中,該第三非天然鹼基能與該第一非天然鹼基及/或該第一替代非天然鹼基形成第一非天然鹼基對。
  88. 如請求項86或87之方法,其進一步包含轉錄編碼tRNA之基因,以將第四非天然鹼基納入tRNA中,其中該第四非天然鹼基能與該第二非天然鹼基及/或該第二替代非天然鹼基形成第二非天然鹼基對,其中該第一非天然鹼基對及該第二非天然鹼基對不相同。
  89. 如請求項84至88中任一項之方法,其中該方法係活體內方法,其包含使用細菌為半合成生物體。
  90. 如請求項89之方法,其中該生物體包含大腸桿菌。
  91. 如請求項84至90中任一項之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
    Figure 03_image1449
    Figure 03_image1451
    ,及
    Figure 03_image1453
  92. 如請求項84至91中任一項之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
    Figure 03_image1455
    Figure 03_image1457
  93. 如請求項84至92中任一項之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
    Figure 03_image1459
    ,及
    Figure 03_image1461
  94. 如請求項84至93中任一項之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含
    Figure 03_image1463
    Figure 03_image1465
  95. 如請求項84至94中任一項之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者係
    Figure 03_image1467
  96. 如請求項84至95中任一項之方法,其中該第一非天然鹼基、該第二非天然鹼基、該第三非天然鹼基或該第四非天然鹼基中之至少一者包含:
    Figure 03_image1469
    Figure 03_image1471
  97. 如請求項84至96中任一項之方法,其中該第一非天然鹼基係
    Figure 03_image1473
    ,該第二非天然鹼基係
    Figure 03_image1475
    ,該第三非天然鹼基係
    Figure 03_image1477
    ,且該第四非天然鹼基係
    Figure 03_image1479
    Figure 03_image1481
  98. 如請求項84至97中任一項之方法,其中該第一非天然鹼基係
    Figure 03_image1483
    ,該第二非天然鹼基係
    Figure 03_image1485
    ,該第三非天然鹼基係
    Figure 03_image1487
    ,且該第四非天然鹼基係
    Figure 03_image1489
    Figure 03_image1491
  99. 如請求項84至98中任一項之方法,其中該第一非天然鹼基係
    Figure 03_image1493
    ,該第二非天然鹼基係
    Figure 03_image1495
    ,該第三非天然鹼基係
    Figure 03_image1497
    Figure 03_image1499
    且該第四非天然鹼基係
    Figure 03_image1501
  100. 如請求項84至99中任一項之方法,其中該第一非天然鹼基包含dCNMO,且該第二非天然鹼基包含dTPT3。
  101. 如請求項84至100中任一項之方法,其中該第三非天然鹼基包含NaM,且該第二非天然鹼基包含TAT1。
  102. 如請求項84至101中任一項之方法,其中該蛋白質包含至少兩個非天然胺基酸。
TW109119906A 2019-06-14 2020-06-12 於半合成生物體中複製、轉錄及轉譯之試劑及方法 TW202113078A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201962861901P 2019-06-14 2019-06-14
US62/861,901 2019-06-14

Publications (1)

Publication Number Publication Date
TW202113078A true TW202113078A (zh) 2021-04-01

Family

ID=73744600

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109119906A TW202113078A (zh) 2019-06-14 2020-06-12 於半合成生物體中複製、轉錄及轉譯之試劑及方法

Country Status (12)

Country Link
US (2) US11879145B2 (zh)
EP (1) EP3983543A4 (zh)
JP (1) JP2022538784A (zh)
KR (1) KR20220034109A (zh)
CN (1) CN114207129A (zh)
AU (1) AU2020291535A1 (zh)
BR (1) BR112021025130A2 (zh)
CA (1) CA3143330A1 (zh)
IL (1) IL288941A (zh)
MX (1) MX2021015450A (zh)
TW (1) TW202113078A (zh)
WO (1) WO2020252262A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT3041854T (pt) * 2013-08-08 2020-03-05 Scripps Research Inst Um método para a identificação enzimática específica ao local de ácidos nucleicos in vitro pela incorporação de nucleótidos não-naturais
TWI638047B (zh) 2014-04-09 2018-10-11 史基普研究協會 藉由核酸三磷酸酯轉運子將非天然或經修飾的核苷三磷酸酯輸入至細胞中
WO2017106767A1 (en) 2015-12-18 2017-06-22 The Scripps Research Institute Production of unnatural nucleotides using a crispr/cas9 system
WO2017223528A1 (en) 2016-06-24 2017-12-28 The Scripps Research Institute Novel nucleoside triphosphate transporter and uses thereof
WO2019014267A1 (en) 2017-07-11 2019-01-17 Synthorx, Inc. INCORPORATION OF NON-NATURAL NUCLEOTIDES AND ASSOCIATED METHODS
CN111690587B (zh) * 2019-03-13 2022-10-25 上海凯赛生物技术股份有限公司 一种离心筛选具有高含油率油脂酵母菌株的方法及其应用
BR112021025130A2 (pt) 2019-06-14 2022-03-15 Scripps Research Inst Reagentes e métodos para replicação, transcrição e tradução em organismos semissintéticos
TW202128996A (zh) * 2019-10-10 2021-08-01 美商史基普研究協會 用於活體內合成非天然多肽的組合物及方法
CN114031648A (zh) * 2021-11-08 2022-02-11 河南师范大学 一类非天然碱基三磷酸及其合成方法和应用
WO2023164676A1 (en) * 2022-02-27 2023-08-31 The Regents Of The University Of California Methods to generate novel acyl-trna species

Family Cites Families (204)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3687808A (en) 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US4469863A (en) 1980-11-12 1984-09-04 Ts O Paul O P Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof
US5023243A (en) 1981-10-23 1991-06-11 Molecular Biosystems, Inc. Oligonucleotide therapeutic agent and method of making same
US4476301A (en) 1982-04-29 1984-10-09 Centre National De La Recherche Scientifique Oligonucleotides, a process for preparing the same and their application as mediators of the action of interferon
JPS5927900A (ja) 1982-08-09 1984-02-14 Wakunaga Seiyaku Kk 固定化オリゴヌクレオチド
FR2540122B1 (fr) 1983-01-27 1985-11-29 Centre Nat Rech Scient Nouveaux composes comportant une sequence d'oligonucleotide liee a un agent d'intercalation, leur procede de synthese et leur application
US4605735A (en) 1983-02-14 1986-08-12 Wakunaga Seiyaku Kabushiki Kaisha Oligonucleotide derivatives
US4948882A (en) 1983-02-22 1990-08-14 Syngene, Inc. Single-stranded labelled oligonucleotides, reactive monomers and methods of synthesis
US4824941A (en) 1983-03-10 1989-04-25 Julian Gordon Specific antibody to the native form of 2'5'-oligonucleotides, the method of preparation and the use as reagents in immunoassays or for binding 2'5'-oligonucleotides in biological systems
US4587044A (en) 1983-09-01 1986-05-06 The Johns Hopkins University Linkage of proteins to nucleic acids
US4849513A (en) 1983-12-20 1989-07-18 California Institute Of Technology Deoxyribonucleoside phosphoramidites in which an aliphatic amino group is attached to the sugar ring and their use for the preparation of oligonucleotides containing aliphatic amino groups
US5118800A (en) 1983-12-20 1992-06-02 California Institute Of Technology Oligonucleotides possessing a primary amino group in the terminal nucleotide
US5118802A (en) 1983-12-20 1992-06-02 California Institute Of Technology DNA-reporter conjugates linked via the 2' or 5'-primary amino group of the 5'-terminal nucleoside
US5015733A (en) 1983-12-20 1991-05-14 California Institute Of Technology Nucleosides possessing blocked aliphatic amino groups
US5550111A (en) 1984-07-11 1996-08-27 Temple University-Of The Commonwealth System Of Higher Education Dual action 2',5'-oligoadenylate antiviral derivatives and uses thereof
FR2567892B1 (fr) 1984-07-19 1989-02-17 Centre Nat Rech Scient Nouveaux oligonucleotides, leur procede de preparation et leurs applications comme mediateurs dans le developpement des effets des interferons
US5367066A (en) 1984-10-16 1994-11-22 Chiron Corporation Oligonucleotides with selectably cleavable and/or abasic sites
US5258506A (en) 1984-10-16 1993-11-02 Chiron Corporation Photolabile reagents for incorporation into oligonucleotide chains
US5430136A (en) 1984-10-16 1995-07-04 Chiron Corporation Oligonucleotides having selectably cleavable and/or abasic sites
US4828979A (en) 1984-11-08 1989-05-09 Life Technologies, Inc. Nucleotide analogs for nucleic acid labeling and detection
FR2575751B1 (fr) 1985-01-08 1987-04-03 Pasteur Institut Nouveaux nucleosides de derives de l'adenosine, leur preparation et leurs applications biologiques
US5185444A (en) 1985-03-15 1993-02-09 Anti-Gene Deveopment Group Uncharged morpolino-based polymers having phosphorous containing chiral intersubunit linkages
US5235033A (en) 1985-03-15 1993-08-10 Anti-Gene Development Group Alpha-morpholino ribonucleoside derivatives and polymers thereof
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US5166315A (en) 1989-12-20 1992-11-24 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US5405938A (en) 1989-12-20 1995-04-11 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US5656493A (en) 1985-03-28 1997-08-12 The Perkin-Elmer Corporation System for automated performance of the polymerase chain reaction
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4762779A (en) 1985-06-13 1988-08-09 Amgen Inc. Compositions and methods for functionalizing nucleic acids
US5093232A (en) 1985-12-11 1992-03-03 Chiron Corporation Nucleic acid probes
US4910300A (en) 1985-12-11 1990-03-20 Chiron Corporation Method for making nucleic acid probes
US5317098A (en) 1986-03-17 1994-05-31 Hiroaki Shizuya Non-radioisotope tagging of fragments
JPS638396A (ja) 1986-06-30 1988-01-14 Wakunaga Pharmaceut Co Ltd ポリ標識化オリゴヌクレオチド誘導体
US5276019A (en) 1987-03-25 1994-01-04 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US5264423A (en) 1987-03-25 1993-11-23 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US4904582A (en) 1987-06-11 1990-02-27 Synthetic Genetics Novel amphiphilic nucleic acid conjugates
WO1988010264A1 (en) 1987-06-24 1988-12-29 Howard Florey Institute Of Experimental Physiology Nucleoside derivatives
US5585481A (en) 1987-09-21 1996-12-17 Gen-Probe Incorporated Linking reagents for nucleotide probes
US5188897A (en) 1987-10-22 1993-02-23 Temple University Of The Commonwealth System Of Higher Education Encapsulated 2',5'-phosphorothioate oligoadenylates
US4924624A (en) 1987-10-22 1990-05-15 Temple University-Of The Commonwealth System Of Higher Education 2,',5'-phosphorothioate oligoadenylates and plant antiviral uses thereof
US5525465A (en) 1987-10-28 1996-06-11 Howard Florey Institute Of Experimental Physiology And Medicine Oligonucleotide-polyamide conjugates and methods of production and applications of the same
DE3738460A1 (de) 1987-11-12 1989-05-24 Max Planck Gesellschaft Modifizierte oligonukleotide
US5082830A (en) 1988-02-26 1992-01-21 Enzo Biochem, Inc. End labeled nucleotide probe
WO1989009221A1 (en) 1988-03-25 1989-10-05 University Of Virginia Alumni Patents Foundation Oligonucleotide n-alkylphosphoramidates
US5278302A (en) 1988-05-26 1994-01-11 University Patents, Inc. Polynucleotide phosphorodithioates
US5109124A (en) 1988-06-01 1992-04-28 Biogen, Inc. Nucleic acid probe linked to a label having a terminal cysteine
US5216141A (en) 1988-06-06 1993-06-01 Benner Steven A Oligonucleotide analogs containing sulfur linkages
US5175273A (en) 1988-07-01 1992-12-29 Genentech, Inc. Nucleic acid intercalating agents
US5262536A (en) 1988-09-15 1993-11-16 E. I. Du Pont De Nemours And Company Reagents for the preparation of 5'-tagged oligonucleotides
US5512439A (en) 1988-11-21 1996-04-30 Dynal As Oligonucleotide-linked magnetic particles and uses thereof
US5457183A (en) 1989-03-06 1995-10-10 Board Of Regents, The University Of Texas System Hydroxylated texaphyrins
US5599923A (en) 1989-03-06 1997-02-04 Board Of Regents, University Of Tx Texaphyrin metal complexes having improved functionalization
US5391723A (en) 1989-05-31 1995-02-21 Neorx Corporation Oligonucleotide conjugates
US4958013A (en) 1989-06-06 1990-09-18 Northwestern University Cholesteryl modified oligonucleotides
US5451463A (en) 1989-08-28 1995-09-19 Clontech Laboratories, Inc. Non-nucleoside 1,3-diol reagents for labeling synthetic oligonucleotides
US5134066A (en) 1989-08-29 1992-07-28 Monsanto Company Improved probes using nucleosides containing 3-dezauracil analogs
US5254469A (en) 1989-09-12 1993-10-19 Eastman Kodak Company Oligonucleotide-enzyme conjugate that can be used as a probe in hybridization assays and polymerase chain reaction procedures
US5591722A (en) 1989-09-15 1997-01-07 Southern Research Institute 2'-deoxy-4'-thioribonucleosides and their antiviral activity
US5399676A (en) 1989-10-23 1995-03-21 Gilead Sciences Oligonucleotides with inverted polarity
US5264562A (en) 1989-10-24 1993-11-23 Gilead Sciences, Inc. Oligonucleotide analogs with novel linkages
ATE269870T1 (de) 1989-10-24 2004-07-15 Isis Pharmaceuticals Inc 2'-modifizierte oligonukleotide
US5264564A (en) 1989-10-24 1993-11-23 Gilead Sciences Oligonucleotide analogs with novel linkages
US5292873A (en) 1989-11-29 1994-03-08 The Research Foundation Of State University Of New York Nucleic acids labeled with naphthoquinone probe
US5177198A (en) 1989-11-30 1993-01-05 University Of N.C. At Chapel Hill Process for preparing oligoribonucleoside and oligodeoxyribonucleoside boranophosphates
US5130302A (en) 1989-12-20 1992-07-14 Boron Bilogicals, Inc. Boronated nucleoside, nucleotide and oligonucleotide compounds, compositions and methods for using same
US5486603A (en) 1990-01-08 1996-01-23 Gilead Sciences, Inc. Oligonucleotide having enhanced binding affinity
US5670633A (en) 1990-01-11 1997-09-23 Isis Pharmaceuticals, Inc. Sugar modified oligonucleotides that detect and modulate gene expression
US5646265A (en) 1990-01-11 1997-07-08 Isis Pharmceuticals, Inc. Process for the preparation of 2'-O-alkyl purine phosphoramidites
US5587361A (en) 1991-10-15 1996-12-24 Isis Pharmaceuticals, Inc. Oligonucleotides having phosphorothioate linkages of high chiral purity
US5459255A (en) 1990-01-11 1995-10-17 Isis Pharmaceuticals, Inc. N-2 substituted purines
US5587470A (en) 1990-01-11 1996-12-24 Isis Pharmaceuticals, Inc. 3-deazapurines
US5681941A (en) 1990-01-11 1997-10-28 Isis Pharmaceuticals, Inc. Substituted purines and oligonucleotide cross-linking
US5578718A (en) 1990-01-11 1996-11-26 Isis Pharmaceuticals, Inc. Thiol-derivatized nucleosides
AU7579991A (en) 1990-02-20 1991-09-18 Gilead Sciences, Inc. Pseudonucleosides and pseudonucleotides and their polymers
US5214136A (en) 1990-02-20 1993-05-25 Gilead Sciences, Inc. Anthraquinone-derivatives oligonucleotides
US5321131A (en) 1990-03-08 1994-06-14 Hybridon, Inc. Site-specific functionalization of oligodeoxynucleotides for non-radioactive labelling
US5470967A (en) 1990-04-10 1995-11-28 The Dupont Merck Pharmaceutical Company Oligonucleotide analogs with sulfamate linkages
GB9009980D0 (en) 1990-05-03 1990-06-27 Amersham Int Plc Phosphoramidite derivatives,their preparation and the use thereof in the incorporation of reporter groups on synthetic oligonucleotides
EP0745689A3 (en) 1990-05-11 1996-12-11 Microprobe Corporation A dipstick for a nucleic acid hybridization assay
US5677437A (en) 1990-07-27 1997-10-14 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
US5541307A (en) 1990-07-27 1996-07-30 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogs and solid phase synthesis thereof
US5218105A (en) 1990-07-27 1993-06-08 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
US5610289A (en) 1990-07-27 1997-03-11 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogues
US5688941A (en) 1990-07-27 1997-11-18 Isis Pharmaceuticals, Inc. Methods of making conjugated 4' desmethyl nucleoside analog compounds
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5489677A (en) 1990-07-27 1996-02-06 Isis Pharmaceuticals, Inc. Oligonucleoside linkages containing adjacent oxygen and nitrogen atoms
US5618704A (en) 1990-07-27 1997-04-08 Isis Pharmacueticals, Inc. Backbone-modified oligonucleotide analogs and preparation thereof through radical coupling
US5138045A (en) 1990-07-27 1992-08-11 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
US5623070A (en) 1990-07-27 1997-04-22 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
US5608046A (en) 1990-07-27 1997-03-04 Isis Pharmaceuticals, Inc. Conjugated 4'-desmethyl nucleoside analog compounds
DE69126530T2 (de) 1990-07-27 1998-02-05 Isis Pharmaceutical, Inc., Carlsbad, Calif. Nuklease resistente, pyrimidin modifizierte oligonukleotide, die die gen-expression detektieren und modulieren
BR9106729A (pt) 1990-08-03 1993-07-20 Sterling Winthrop Inc Composto,processos para inibir a degradacao por nuclease de compostos e para estabilizar sequencias de nicleotideos ou oligonucleosideos,composicao utilizavel para inibir expressao de genes e processo para inibir expressao de genes em um mamifero necessitando de tal tratamento
US5245022A (en) 1990-08-03 1993-09-14 Sterling Drug, Inc. Exonuclease resistant terminally substituted oligonucleotides
US5177196A (en) 1990-08-16 1993-01-05 Microprobe Corporation Oligo (α-arabinofuranosyl nucleotides) and α-arabinofuranosyl precursors thereof
US5512667A (en) 1990-08-28 1996-04-30 Reed; Michael W. Trifunctional intermediates for preparing 3'-tailed oligonucleotides
US5214134A (en) 1990-09-12 1993-05-25 Sterling Winthrop Inc. Process of linking nucleosides with a siloxane bridge
US5561225A (en) 1990-09-19 1996-10-01 Southern Research Institute Polynucleotide analogs containing sulfonate and sulfonamide internucleoside linkages
CA2092002A1 (en) 1990-09-20 1992-03-21 Mark Matteucci Modified internucleoside linkages
NZ239893A (en) 1990-09-25 1993-11-25 Hoechst Japan A method for introducing a foreign dna into a cell
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
KR930702373A (ko) 1990-11-08 1993-09-08 안토니 제이. 페이네 합성 올리고누클레오티드에 대한 다중 리포터(Reporter)그룹의 첨합
US5672697A (en) 1991-02-08 1997-09-30 Gilead Sciences, Inc. Nucleoside 5'-methylene phosphonates
US5719262A (en) 1993-11-22 1998-02-17 Buchardt, Deceased; Ole Peptide nucleic acids having amino acid side chains
US5539082A (en) 1993-04-26 1996-07-23 Nielsen; Peter E. Peptide nucleic acids
US5714331A (en) 1991-05-24 1998-02-03 Buchardt, Deceased; Ole Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility
US5371241A (en) 1991-07-19 1994-12-06 Pharmacia P-L Biochemicals Inc. Fluorescein labelled phosphoramidites
US5571799A (en) 1991-08-12 1996-11-05 Basco, Ltd. (2'-5') oligoadenylate analogues useful as inhibitors of host-v5.-graft response
DE59208572D1 (de) 1991-10-17 1997-07-10 Ciba Geigy Ag Bicyclische Nukleoside, Oligonukleotide, Verfahren zu deren Herstellung und Zwischenprodukte
US5594121A (en) 1991-11-07 1997-01-14 Gilead Sciences, Inc. Enhanced triple-helix and double-helix formation with oligomers containing modified purines
EP0637965B1 (en) 1991-11-26 2002-10-16 Isis Pharmaceuticals, Inc. Enhanced triple-helix and double-helix formation with oligomers containing modified pyrimidines
US5484908A (en) 1991-11-26 1996-01-16 Gilead Sciences, Inc. Oligonucleotides containing 5-propynyl pyrimidines
TW393513B (en) 1991-11-26 2000-06-11 Isis Pharmaceuticals Inc Enhanced triple-helix and double-helix formation with oligomers containing modified pyrimidines
US5359044A (en) 1991-12-13 1994-10-25 Isis Pharmaceuticals Cyclobutyl oligonucleotide surrogates
US5565552A (en) 1992-01-21 1996-10-15 Pharmacyclics, Inc. Method of expanded porphyrin-oligonucleotide conjugate synthesis
US5595726A (en) 1992-01-21 1997-01-21 Pharmacyclics, Inc. Chromophore probe for detection of nucleic acid
FR2687679B1 (fr) 1992-02-05 1994-10-28 Centre Nat Rech Scient Oligothionucleotides.
US5633360A (en) 1992-04-14 1997-05-27 Gilead Sciences, Inc. Oligonucleotide analogs capable of passive cell membrane permeation
US5434257A (en) 1992-06-01 1995-07-18 Gilead Sciences, Inc. Binding compentent oligomers containing unsaturated 3',5' and 2',5' linkages
EP0577558A2 (de) 1992-07-01 1994-01-05 Ciba-Geigy Ag Carbocyclische Nukleoside mit bicyclischen Ringen, Oligonukleotide daraus, Verfahren zu deren Herstellung, deren Verwendung und Zwischenproduckte
US5272250A (en) 1992-07-10 1993-12-21 Spielvogel Bernard F Boronated phosphoramidate compounds
US5574142A (en) 1992-12-15 1996-11-12 Microprobe Corporation Peptide linkers for improved oligonucleotide delivery
US5476925A (en) 1993-02-01 1995-12-19 Northwestern University Oligodeoxyribonucleotides including 3'-aminonucleoside-phosphoramidate linkages and terminal 3'-amino groups
GB9304618D0 (en) 1993-03-06 1993-04-21 Ciba Geigy Ag Chemical compounds
WO1994022864A1 (en) 1993-03-30 1994-10-13 Sterling Winthrop Inc. Acyclic nucleoside analogs and oligonucleotide sequences containing them
AU6412794A (en) 1993-03-31 1994-10-24 Sterling Winthrop Inc. Oligonucleotides with amide linkages replacing phosphodiester linkages
WO1994022890A1 (en) 1993-03-31 1994-10-13 Sterling Winthop Inc. Novel 5'-substituted nucleosides and oligomers produced therefrom
DE4311944A1 (de) 1993-04-10 1994-10-13 Degussa Umhüllte Natriumpercarbonatpartikel, Verfahren zu deren Herstellung und sie enthaltende Wasch-, Reinigungs- und Bleichmittelzusammensetzungen
GB9311682D0 (en) 1993-06-05 1993-07-21 Ciba Geigy Ag Chemical compounds
US5502177A (en) 1993-09-17 1996-03-26 Gilead Sciences, Inc. Pyrimidine derivatives for labeled binding partners
US5457187A (en) 1993-12-08 1995-10-10 Board Of Regents University Of Nebraska Oligonucleotides containing 5-fluorouracil
US5446137B1 (en) 1993-12-09 1998-10-06 Behringwerke Ag Oligonucleotides containing 4'-substituted nucleotides
US5519134A (en) 1994-01-11 1996-05-21 Isis Pharmaceuticals, Inc. Pyrrolidine-containing monomers and oligomers
US5596091A (en) 1994-03-18 1997-01-21 The Regents Of The University Of California Antisense oligonucleotides comprising 5-aminoalkyl pyrimidine nucleotides
US5627053A (en) 1994-03-29 1997-05-06 Ribozyme Pharmaceuticals, Inc. 2'deoxy-2'-alkylnucleotide containing nucleic acid
US5625050A (en) 1994-03-31 1997-04-29 Amgen Inc. Modified oligonucleotides and intermediates useful in nucleic acid therapeutics
US5525711A (en) 1994-05-18 1996-06-11 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Pteridine nucleotide analogs as fluorescent DNA probes
US5597696A (en) 1994-07-18 1997-01-28 Becton Dickinson And Company Covalent cyanine dye oligonucleotide conjugates
US5580731A (en) 1994-08-25 1996-12-03 Chiron Corporation N-4 modified pyrimidine deoxynucleotides and oligonucleotide probes synthesized therewith
US5597909A (en) 1994-08-25 1997-01-28 Chiron Corporation Polynucleotide reagents containing modified deoxyribose moieties, and associated methods of synthesis and use
US6720140B1 (en) 1995-06-07 2004-04-13 Invitrogen Corporation Recombinational cloning using engineered recombination sites
US6143557A (en) 1995-06-07 2000-11-07 Life Technologies, Inc. Recombination cloning using engineered recombination sites
PT937098E (pt) 1995-06-07 2002-12-31 Invitrogen Corp Clonagem recombinatoria in vitro utilizando locais de recombinacao modificados
GB9606158D0 (en) 1996-03-23 1996-05-29 Ciba Geigy Ag Chemical compounds
US6770748B2 (en) 1997-03-07 2004-08-03 Takeshi Imanishi Bicyclonucleoside and oligonucleotide analogue
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
US6794499B2 (en) 1997-09-12 2004-09-21 Exiqon A/S Oligonucleotide analogues
EP2341058A3 (en) 1997-09-12 2011-11-23 Exiqon A/S Oligonucleotide Analogues
CN100342008C (zh) 1997-10-24 2007-10-10 茵维特罗根公司 利用具重组位点的核酸进行重组克隆
US6955807B1 (en) 1998-05-15 2005-10-18 Bayer Pharmaceuticals Corporation IL-2 selective agonists and antagonists
US6562798B1 (en) 1998-06-05 2003-05-13 Dynavax Technologies Corp. Immunostimulatory oligonucleotides with modified bases and methods of use thereof
US7053207B2 (en) 1999-05-04 2006-05-30 Exiqon A/S L-ribo-LNA analogues
US6525191B1 (en) 1999-05-11 2003-02-25 Kanda S. Ramasamy Conformationally constrained L-nucleosides
JP3893057B2 (ja) 1999-07-15 2007-03-14 独立行政法人科学技術振興機構 新規な核酸塩基対
AU1239901A (en) 1999-10-29 2001-05-14 Stratagene Compositions and methods utilizing dna polymerases
AU785483B2 (en) 1999-12-10 2007-09-20 Invitrogen Corporation Use of multiple recombination sites with unique specificity in recombinational cloning
CN1505635A (zh) 2001-03-01 2004-06-16 2′,3′-二脱氧-2',3'-二脱氢核苷的合成方法
US20060074035A1 (en) 2002-04-17 2006-04-06 Zhi Hong Dinucleotide inhibitors of de novo RNA polymerases for treatment or prevention of viral infections
US7745417B2 (en) 2002-07-17 2010-06-29 Riken Nucleosides or nucleotides having novel unnatural bases and use thereof
AU2003291753B2 (en) 2002-11-05 2010-07-08 Isis Pharmaceuticals, Inc. Polycyclic sugar surrogate-containing oligomeric compounds and compositions for use in gene modulation
EP1560840B1 (en) 2002-11-05 2015-05-06 Isis Pharmaceuticals, Inc. Compositions comprising alternating 2'-modified nucleosides for use in gene modulation
JP5642916B2 (ja) 2003-04-17 2014-12-17 ザ スクリプス リサーチ インスティテュート 真核遺伝コードの拡張
WO2004106356A1 (en) 2003-05-27 2004-12-09 Syddansk Universitet Functionalized nucleotide derivatives
US7427672B2 (en) 2003-08-28 2008-09-23 Takeshi Imanishi Artificial nucleic acids of n-o bond crosslinkage type
US20110087015A1 (en) 2003-09-10 2011-04-14 Riken Nucleoside and nucleotide having an unnatural base and use thereof
WO2005027962A1 (en) 2003-09-18 2005-03-31 Isis Pharmaceuticals, Inc. 4’-thionucleosides and oligomeric compounds
EP1801213A3 (en) 2003-11-03 2007-10-24 Medical Research Council Polymerase
JP4896745B2 (ja) 2004-02-02 2012-03-14 アンブレツクス・インコーポレイテツド 修飾されたヒトインターフェロンポリペプチドおよびこれらの使用
EP1816130A4 (en) 2004-11-08 2012-04-25 Riken NOVEL NUCLEOSIDE OR NUCLEOTIDE DERIVATIVE AND USE THEREOF
JP5649018B2 (ja) 2005-08-04 2015-01-07 タグシクス・バイオ株式会社 新規人工塩基対及びその利用
AU2006323745B2 (en) 2005-12-09 2012-11-22 Riken Method for replicating nucleic acids and novel unnatural base pairs
EP2314594B1 (en) 2006-01-27 2014-07-23 Isis Pharmaceuticals, Inc. 6-modified bicyclic nucleic acid analogs
WO2007134181A2 (en) 2006-05-11 2007-11-22 Isis Pharmaceuticals, Inc. 5'-modified bicyclic nucleic acid analogs
US20100190837A1 (en) 2007-02-15 2010-07-29 Isis Pharmaceuticals, Inc. 5'-Substituted-2-F' Modified Nucleosides and Oligomeric Compounds Prepared Therefrom
DK2170917T3 (da) 2007-05-30 2012-10-08 Isis Pharmaceuticals Inc N-Substituerede bicycliske nukleinsyreanaloge med aminomethylenbro
ES2386492T3 (es) 2007-06-08 2012-08-21 Isis Pharmaceuticals, Inc. Análogos de ácidos nucleicos bicíclicos carbocíclicos
CA2692579C (en) 2007-07-05 2016-05-03 Isis Pharmaceuticals, Inc. 6-disubstituted bicyclic nucleic acid analogs
CA2723134C (en) 2008-03-31 2016-08-16 Tagcyx Biotechnologies Dna capable of being amplified by pcr with high selectivity and high efficiency
EP2487181A4 (en) 2009-10-06 2013-08-28 Riken ARTIFICIAL BASIC COUPLE FOR THE FORMATION OF SPECIFIC BASIC COUPLES
EP2625186B1 (en) 2010-04-28 2016-07-27 Ionis Pharmaceuticals, Inc. 5' modified nucleosides and oligomeric compounds prepared therefrom
CA3144697A1 (en) 2010-11-12 2012-05-18 Nektar Therapeutics Conjugates of an il-2 moiety and a polymer
UA117294C2 (uk) 2011-02-10 2018-07-10 Рош Глікарт Аг Імунокон'югат
JP6826367B2 (ja) 2012-08-31 2021-02-03 ストロ バイオファーマ インコーポレーテッド アジド基を含む修飾アミノ酸
CA2905049A1 (en) 2013-03-13 2014-10-02 Trustees Of Boston University Tunable control of protein degradation in synthetic and endogenous bacterial systems
PT3041854T (pt) 2013-08-08 2020-03-05 Scripps Research Inst Um método para a identificação enzimática específica ao local de ácidos nucleicos in vitro pela incorporação de nucleótidos não-naturais
US9840493B2 (en) 2013-10-11 2017-12-12 Sutro Biopharma, Inc. Modified amino acids comprising tetrazine functional groups, methods of preparation, and methods of their use
EP3055320B1 (en) 2013-10-11 2018-10-03 Sutro Biopharma, Inc. NON-NATURAL AMINO ACID tRNA SYNTHETASES FOR PYRIDYL TETRAZINE
PL3055321T3 (pl) 2013-10-11 2019-02-28 Sutro Biopharma, Inc. SYNTETAZY tRNA DOŁĄCZAJĄCE AMINOKWAS NIENATURALNY DLA PARA-METYLOAZYDO-L-FENYLOALANINY
US20160304893A1 (en) 2013-12-13 2016-10-20 Cellectis Cas9 nuclease platform for microalgae genome engineering
TWI638047B (zh) 2014-04-09 2018-10-11 史基普研究協會 藉由核酸三磷酸酯轉運子將非天然或經修飾的核苷三磷酸酯輸入至細胞中
EP3597740B1 (en) 2014-11-06 2022-03-23 DuPont US Holding, LLC Peptide-mediated delivery of rna-guided endonuclease into cells
EP3985115A1 (en) 2014-12-12 2022-04-20 The Broad Institute, Inc. Protected guide rnas (pgrnas)
WO2016115168A1 (en) 2015-01-12 2016-07-21 Synthorx, Inc. Incorporation of unnatural nucleotides and methods thereof
WO2016179545A1 (en) * 2015-05-06 2016-11-10 Trelys, Inc. Compositions and methods for biological production of methionine
CA3006629A1 (en) * 2015-11-30 2017-06-08 European Molecular Biology Laboratory Means and methods for preparing engineered proteins by genetic code expansion in insect cells
WO2017106767A1 (en) 2015-12-18 2017-06-22 The Scripps Research Institute Production of unnatural nucleotides using a crispr/cas9 system
WO2017223528A1 (en) 2016-06-24 2017-12-28 The Scripps Research Institute Novel nucleoside triphosphate transporter and uses thereof
EP3651774A4 (en) 2017-07-11 2021-07-07 The Scripps Research Institute INTEGRATION OF INNATURAL NUCLEOTIDES AND APPLICATION METHODS IN VIVO
WO2019014267A1 (en) 2017-07-11 2019-01-17 Synthorx, Inc. INCORPORATION OF NON-NATURAL NUCLEOTIDES AND ASSOCIATED METHODS
EP3732187A4 (en) 2017-12-29 2021-11-10 The Scripps Research Institute PAIRING COMPOSITIONS OF NON-NATURAL BASES AND METHODS OF USE
BR112021025130A2 (pt) 2019-06-14 2022-03-15 Scripps Research Inst Reagentes e métodos para replicação, transcrição e tradução em organismos semissintéticos
WO2021067313A1 (en) 2019-09-30 2021-04-08 The Scripps Research Institute Eukaryotic semi-synthetic organisms
TW202128996A (zh) 2019-10-10 2021-08-01 美商史基普研究協會 用於活體內合成非天然多肽的組合物及方法

Also Published As

Publication number Publication date
US20240294962A1 (en) 2024-09-05
CN114207129A (zh) 2022-03-18
JP2022538784A (ja) 2022-09-06
BR112021025130A2 (pt) 2022-03-15
US20200392550A1 (en) 2020-12-17
KR20220034109A (ko) 2022-03-17
AU2020291535A1 (en) 2022-01-20
WO2020252262A1 (en) 2020-12-17
US11879145B2 (en) 2024-01-23
IL288941A (en) 2022-02-01
MX2021015450A (es) 2022-03-11
CA3143330A1 (en) 2020-12-17
EP3983543A1 (en) 2022-04-20
EP3983543A4 (en) 2023-05-03

Similar Documents

Publication Publication Date Title
US11879145B2 (en) Reagents and methods for replication, transcription, and translation in semi-synthetic organisms
TWI821192B (zh) 非天然核苷酸之導入及其方法
EP3475295B1 (en) Novel nucleoside triphosphate transporter and uses thereof
US20200032274A1 (en) Polynucleotide secondary structure
WO2017106767A1 (en) Production of unnatural nucleotides using a crispr/cas9 system
US20220243244A1 (en) Compositions and methods for in vivo synthesis of unnatural polypeptides
JP7429642B2 (ja) 非天然塩基対組成物および使用の方法
TW202128994A (zh) 真核半合成生物
US20230392140A1 (en) Reverse transcription of polynucleotides comprising unnatural nucleotides
KR20240035752A (ko) 원형 폴리리보뉴클레오티드의 농축 방법
RU2799441C2 (ru) Композиции на основе неприродных пар оснований и способы их применения