KR20210030399A - 4'-에티닐 뉴클레오시드 유사체의 효소적 합성 - Google Patents

4'-에티닐 뉴클레오시드 유사체의 효소적 합성 Download PDF

Info

Publication number
KR20210030399A
KR20210030399A KR1020217003533A KR20217003533A KR20210030399A KR 20210030399 A KR20210030399 A KR 20210030399A KR 1020217003533 A KR1020217003533 A KR 1020217003533A KR 20217003533 A KR20217003533 A KR 20217003533A KR 20210030399 A KR20210030399 A KR 20210030399A
Authority
KR
South Korea
Prior art keywords
gly
ala
ser
thr
val
Prior art date
Application number
KR1020217003533A
Other languages
English (en)
Inventor
마크 에이. 허프만
안나 프리스츠코브스카
조슈아 엔. 코레브
폴 엔. 데빈
케빈 알. 캄포스
매튜 트루포
크리스토퍼 씨. 나우랫
Original Assignee
머크 샤프 앤드 돔 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 머크 샤프 앤드 돔 코포레이션 filed Critical 머크 샤프 앤드 돔 코포레이션
Publication of KR20210030399A publication Critical patent/KR20210030399A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/16Purine radicals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/38Nucleosides
    • C12P19/40Nucleosides having a condensed ring system containing a six-membered ring having two nitrogen atoms in the same ring, e.g. purine nucleosides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C29/00Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C29/00Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring
    • C07C29/09Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring by hydrolysis
    • C07C29/095Preparation of compounds having hydroxy or O-metal groups bound to a carbon atom not belonging to a six-membered aromatic ring by hydrolysis of esters of organic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C33/00Unsaturated compounds having hydroxy or O-metal groups bound to acyclic carbon atoms
    • C07C33/04Acyclic alcohols with carbon-to-carbon triple bonds
    • C07C33/042Acyclic alcohols with carbon-to-carbon triple bonds with only one triple bond
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C67/00Preparation of carboxylic acid esters
    • C07C67/28Preparation of carboxylic acid esters by modifying the hydroxylic moiety of the ester, such modification not being an introduction of an ester group
    • C07C67/293Preparation of carboxylic acid esters by modifying the hydroxylic moiety of the ester, such modification not being an introduction of an ester group by isomerisation; by change of size of the carbon skeleton
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07FACYCLIC, CARBOCYCLIC OR HETEROCYCLIC COMPOUNDS CONTAINING ELEMENTS OTHER THAN CARBON, HYDROGEN, HALOGEN, OXYGEN, NITROGEN, SULFUR, SELENIUM OR TELLURIUM
    • C07F9/00Compounds containing elements of Groups 5 or 15 of the Periodic Table
    • C07F9/02Phosphorus compounds
    • C07F9/06Phosphorus compounds without P—C bonds
    • C07F9/08Esters of oxyacids of phosphorus
    • C07F9/09Esters of phosphoric acids
    • C07F9/091Esters of phosphoric acids with hydroxyalkyl compounds with further substituents on alkyl
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07FACYCLIC, CARBOCYCLIC OR HETEROCYCLIC COMPOUNDS CONTAINING ELEMENTS OTHER THAN CARBON, HYDROGEN, HALOGEN, OXYGEN, NITROGEN, SULFUR, SELENIUM OR TELLURIUM
    • C07F9/00Compounds containing elements of Groups 5 or 15 of the Periodic Table
    • C07F9/02Phosphorus compounds
    • C07F9/06Phosphorus compounds without P—C bonds
    • C07F9/08Esters of oxyacids of phosphorus
    • C07F9/09Esters of phosphoric acids
    • C07F9/113Esters of phosphoric acids with unsaturated acyclic alcohols
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07FACYCLIC, CARBOCYCLIC OR HETEROCYCLIC COMPOUNDS CONTAINING ELEMENTS OTHER THAN CARBON, HYDROGEN, HALOGEN, OXYGEN, NITROGEN, SULFUR, SELENIUM OR TELLURIUM
    • C07F9/00Compounds containing elements of Groups 5 or 15 of the Periodic Table
    • C07F9/02Phosphorus compounds
    • C07F9/547Heterocyclic compounds, e.g. containing phosphorus as a ring hetero atom
    • C07F9/655Heterocyclic compounds, e.g. containing phosphorus as a ring hetero atom having oxygen atoms, with or without sulfur, selenium, or tellurium atoms, as the only ring hetero atoms
    • C07F9/65515Heterocyclic compounds, e.g. containing phosphorus as a ring hetero atom having oxygen atoms, with or without sulfur, selenium, or tellurium atoms, as the only ring hetero atoms the oxygen atom being part of a five-membered ring
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H1/00Processes for the preparation of sugar derivatives
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H13/00Compounds containing saccharide radicals esterified by carbonic acid or derivatives thereof, or by organic acids, e.g. phosphonic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/04Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P9/00Preparation of organic compounds containing a metal or atom other than H, N, C, O, S or halogen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/02Pentosyltransferases (2.4.2)
    • C12Y204/02001Purine-nucleoside phosphorylase (2.4.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/02Aldehyde-lyases (4.1.2)
    • C12Y401/02004Deoxyribose-phosphate aldolase (4.1.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y504/00Intramolecular transferases (5.4)
    • C12Y504/02Phosphotransferases (phosphomutases) (5.4.2)
    • C12Y504/02007Phosphopentomutase (5.4.2.7)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/55Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 중간체 상의 보호기의 사용을 제거하고, 글리코실화의 입체선택성을 개선시키고, 화합물을 제조하는 데 필요한 공정 단계의 수를 감소시키는, 4'-에티닐-2'-데옥시 뉴클레오시드 및 그의 유사체, 예를 들어 EFdA의 효소적 합성에 관한 것이다. 이는 또한 공정에 이용되는 신규한 중간체에 관한 것이다.

Description

4'-에티닐 뉴클레오시드 유사체의 효소적 합성
전자적으로 제출된 서열 목록에 대한 언급
본 출원의 서열 목록은 2019년 7월 2일의 생성일 및 80.5 kb의 크기를 갖는 파일명 "24608WOPCT-SEQLIST-02JUl2019.txt"로 ASCII 형식화된 서열 목록으로서 EFS-웹을 통해 전자적으로 제출된다. EFS-웹을 통해 제출된 이 서열 목록은 명세서의 일부이며, 그 전문이 본원에 참조로 포함된다.
4'-에티닐-2'-데옥시 뉴클레오시드 유사체는 HIV, AIDS 및 관련된 질환에 대한 활성에 대해 공지되어 있다.
Figure pct00001
4'-에티닐 뉴클레오시드 유사체의 한 예는 시험관내에서 (Kawamoto, A., Kodama, E., Sarafianos S. F. et al, Int. J. Biochem. Cell Biol.; 40(11):2410-20 [2008]; Ohrui, H., Kohgo, S., Hayakawa, H. et al, Nucleosides, Nucleotides & Nucleic Acids, 26, 1543-1546 [2007]) 및 생체내에서 (Hattori, S., Ide, K., Nakata, H. et al. Antimicrobial. Agents and Chemotherapy, 53, 3887-3893 [2009]) HIV-1 및 SIV 바이러스 복제를 차단하는 뉴클레오시드 리버스 트랜스크립타제 전위 억제제인 4'-에티닐-2-플루오로-2'-데옥시아데노신 (EFdA, 또한 MK-8591로 공지됨)이다. EFdA는 미국 특허 번호 7,339,053에 청구되어 있다 ('053 특허에서 2'-데옥시-4'-C-에티닐-2-플루오로아데노신으로 지칭됨). EFdA는 하기 화학 구조를 갖는다:
Figure pct00002
EFdA는 세포에서 HIV 리버스 트랜스크립타제를 억제하는 그의 활성 트리포스페이트 동화산물로 대사된다. 들어오는 뉴클레오티드의 혼입을 차단하는 3'-OH 기가 결여된 HIV 감염의 치료에 현재 이용가능한 뉴클레오시드 리버스 트랜스크립타제 억제제 (NsRTI) 및 뉴클레오티드 리버스 트랜스크립타제 억제제 (NtRTI)와 대조적으로, EFdA는 3' OH 기를 보유하며, 리버스 트랜스크립타제 (RT) 활성 부위에서 프라이머:주형의 전위를 방지하고, 들어오는 데옥시리보뉴클레오티드 트리포스페이트 (dNTP)의 결합을 방지함으로써 쇄 종결자로서 작용한다. 또한, EFdA의 변형된 리보스 고리의 주름은 들어오는 뉴클레오티드로부터의 인산전이가 비효율적인 벡터에서 3'-OH를 정치시킴으로써 리버스 트랜스크립타제의 억제에 기여하는 것으로 여겨진다. (Michailidis E, et al., Mechanism of inhibition of HIV-1 reverse transcriptase by 4'-ethynyl-2-fluoro-2'-deoxyadenosine triphosphate, J Biol Chem 284:35681-35691 [2009]; Michailidis E, et al., 4'-Ethynyl-2-fluoro-2'-deoxyadenosine (EFdA) inhibits HIV-1 reverse transcriptase with multiple mechanisms, J Biol Chem 289:24533-24548 [2014]).
시험관내 HIV 복제 검정에서, EFdA는 강력한 항레트로바이러스제이며, 평가된 모든 서브타입에 걸쳐 임상 분리주에 대해 필적하는 항바이러스 활성을 나타낸다. 이는 림프 유래된 세포주 및 말초 혈액 단핵 세포 둘 다에서 시험관내에서 활성 트리포스페이트로 급속하게 동화되며, EFdA 트리포스페이트 (EFdA-TP)의 세포내 반감기는 72시간을 초과한다. (Stoddart, C. A., Galkina, et al., Oral Administration of the Nucleoside EFdA (4'-Ethynyl-2-Fluoro-2'-Deoxyadenosine) Provides Rapid Suppression of HIV Viremia in Humanized Mice and Favorable Pharmacokinetic Properties in Mice and the Rhesus Macaque, Antimicrob Agents Chemother, 2015 Jul; 59(7): 4190-4198, Published online 2015 May 4).
EFdA는 인간화 마우스 모델 및 SIV 감염된 레수스 마카크 모델을 비롯한 HIV 감염의 동물 모델에서 효능을 갖는 것으로 나타났다. 마우스 및 레수스 원숭이에서의 경구 투여된 EFdA의 약동학 연구는 급속한 흡수 및 높은 혈장 농도를 입증하였다. 긴 세포내 반감기는 레수스 마카크로부터의 단리된 말초 혈액 단핵 세포가 약물 투여 후 24시간에 SIV 감염에 대해 불응성이었다는 사실에 의해 입증되었다. (상기 문헌).
EFdA를 비롯한 4'-에티닐 뉴클레오시드 유사체의 이전의 합성은 에티닐-데옥시리보스 당 및 2-플루오로아데닌 (또한 2-플루오로-9H-퓨린-6-아민으로 지칭됨) 핵염기 사이의 C-N 결합의 형성에서 보통의 입체선택성을 겪는다. 이전의 합성은 또한 합성의 효율을 감소시키는 글리코실화 반응을 수행하기 위해 보호기를 요구한다.
문헌 [Kei Fukuyama, et al., Synthesis of EFdA via a Diastereoselective Aldol Reaction of a Protected 3-Keto Furanose, Organic Letters 2015, 17(4), pp. 828-831; DOI: 10.1021/ol5036535)]에 기재된 합성은 3개의 입체중심을 설정하는 부분입체선택적 반응을 사용하는 D-글루코스 디아세토나이드로부터의 14-단계 합성이다. 아노머성 중심의 입체화학은 후속적으로 가수분해 및 탈산소화에 의해 제거되는 2'-아세톡시 지향성기에 의해 제어된다. 이 경로는 4회의 크로마토그래피 정제, 및 후기 탈산소화를 위한 독성 오르가노틴 시약의 화학량론적 사용을 요구한다.
또다른 경로에서 (문헌 [Mark McLaughlin, et al., Enantioselective Synthesis of 4'-Ethynyl-2-fluoro-2'-deoxyadenosine (EFdA) via Enzymatic Desymmetrization, Organic Letters 2017, 19 (4), pp. 926-929] 참조), 완전히 치환된 4'-카르비놀은 효소적 비대칭화로 입체선택적으로 생성된다. 3'-입체중심은 촉매적 비대칭 전이 수소화로 설정되고, 아노머성 1'-연결은 기질 대조군을 사용하여 보통의 입체선택성에서 확립되며, 입체화학적 순도의 승급은 중간체의 결정화에 의해 달성된다. 이 공정은 15 단계를 요구하고, 몇몇 보호기의 사용을 요구하며, 낮은 입체선택성 (1.8:1)으로 핵염기 및 당 단편 사이의 글리코실 연결을 생성한다.
R-글리세르알데히드 아세토나이드로부터 EFdA를 제조하는 12-단계 합성은 문헌 [Kageyama, M., et al., Concise Synthesis of the Anti-HIV Nucleoside EFdA, Biosci. Biotechnol. Biochem, 2012, 76, pp. 1219-1225]; 및 [Enantioselective Total Synthesis of the Potent Anti-HIV Nucleoside EFdA, Masayuki Kageyama, et al., Organic Letters 2011 13 (19), pp. 5264-5266 [DOI: 10.1021/ol202116k]]에 기재되어 있다. 합성은 적당한 부분입체선택성을 갖는 3'-입체중심을 설정하는 키랄 출발 물질을 사용한다. 입체이성질체의 크로마토그래피 분리 후, 새로운 입체중심을 사용하여 부분입체선택적 알킨 첨가를 가이드하여 완전히 치환된 4'-입체중심을 설정한다. 아노머성 1'-위치는 적은 입체제어로 확립되며, 아노머를 분리하기 위해 크로마토그래피를 요구한다. 이 경로는 2개의 상이한 단계에서 부분입체이성질체의 크로마토그래피 분리를 요구하며, 고가의 키랄 출발 물질로부터 시작한다.
문헌 [Kohgo, S., et al., Design, Efficient Synthesis, and Anti-HIV Activity of 4'-C-Cyano- and 4'-C-Ethynyl-2'-deoxy Purine Nucleosides, Nucleosides, Nucleotides and Nucleic Acids, 2004, 23, pp. 671-690 [DOI: 10.1081/NCN-120037508]]은 기존의 뉴클레오시드로부터 시작하고, 당 및 핵염기 부분 둘 다를 변형시키는 합성 경로를 기재한다. 이는 2-아미노-2'-데옥시아데노신으로부터 시작하는 낮은 2.5% 전체 수율을 갖는 18-단계 합성이다.
퓨린 뉴클레오시드 포스포릴라제 (PNP, EC 2.4.2.1)와 같은 효소는 높은 입체선택성으로 및 보호기의 사용 없이 뉴클레오시드 및 뉴클레오시드 유사체에서 글리코실 연결을 형성할 수 있는 것으로 공지되어 있다. 예를 들어 리뷰: 문헌 [New Trends in Nucleoside Biotechnology, Mikhailopulo, I.A., Miroshnikov, A.I,. Acta Naturae 2010, 2, pp. 36-58]을 참조한다. 그러나, PNP에 의해 촉매되는 반응을 겪을 수 있는 당 단편의 현재 범위는 C2' 및 C3' 위치에 작은 H, NH2, 또는 F 치환기 및 C5' OH 기의 대체를 갖는 소수의 유사체와 함께 천연 리보스 및 데옥시리보스의 α-1-포스페이트에 제한되었다. 고리 상의 탄소 치환기 또는 C4' 위치에 임의의 치환을 갖는 당을 사용한 PNP에 의해 촉매되는 성공적인 글리코실화에 대한 보고는 없었다.
PNP-촉매된 글리코실화를 위한 리보스 및 데옥시리보스 α-1-포스페이트 기질에 대한 접근은 효소 포스포펜토뮤타제 (PPM, EC 5.4.2.7)로의 5'-히드록실로부터 1'-히드록실 위치로의 포스페이트 기의 전위에 의해 입증되었다 ([Mikhailopulo, I.A., et al. 상기 문헌] 참조). 그러나, PPM이 이 반응을 촉매할 수 있는 당의 범위는 리보스, 아라비노스, 2-데옥시리보스, 및 2,3-디데옥시리보스에 제한되었다. 임의의 추가의 치환기를 함유하는 당 포스페이트로의 성공적인 반응의 예는 보고되지 않았다.
데옥시리보스 포스페이트 알돌라제 (DERA, EC 4.1.2.4) 효소는 다른 단쇄 알데히드에의 아세트알데히드의 알돌 첨가를 촉매하는 것으로 공지되어 있다 (리뷰: [Stephen M. Dean, et al., Recent Advances in Aldolase-Catalyzed Asymmetric Synthesis, Adv. Synth. Catal. 2007, 349, pp. 1308 - 1320; DOI: 10.1002/adsc.200700115] 참조). 그러나, 알데히드에의 완전히 치환된 탄소 α를 함유하는 알데히드로의 예는 보고되지 않았다.
미국 특허 7,229,797은 퓨린 뉴클레오시드 포스포릴라제 (PNP)의 사용에 의한 및 추가적으로 효소, 예컨대 수크로스 포스포릴라제를 사용하여 무기 포스페이트 부산물을 제거하고 평형을 유도하는 천연 비치환된 데옥시리보스 1-포스페이트로부터의 데옥시리보뉴클레오시드의 형성을 기재한다. 이는 비천연 4-에티닐-D-2-데옥시리보스 1-포스페이트로부터 뉴클레오시드를 생성할 수 있는 PNP 효소의 생성을 위한 효소 조작을 개시하지 않으며, 비천연 기질 상에 작용하는 PPM 및 DERA 효소의 조작을 통해, 4-에티닐-D-2-데옥시리보스 1-포스페이트가 생성될 수 있음도 개시하지 않는다.
4'-에티닐 뉴클레오시드 유사체를 생산하기 위한 현재까지 개발된 어렵고 너무 긴 합성 선택안을 고려하여, 공정 단계의 수를 감소시키고, 보호기의 사용을 최소화하고, 글리코실화의 입체선택성을 개선시키고, 독성 물질의 사용을 회피하는 4'-에티닐 뉴클레오시드 유사체, 예컨대 EFdA에 대한 개선된 효소적 합성을 개발하는 것이 바람직할 수 있다.
놀랍게도, PPM 효소는 리보스 상의 4' 위치에 3-원자 에티닐 치환기로 일부 활성을 가지며, PPM 효소 활성은 돌연변이를 효소 내로 도입함으로써 PPM에 의해 촉매되는 4-에티닐-D-2-데옥시리보스 5-포스페이트 (6)의 4-에티닐-D-2-데옥시리보스 1-포스페이트 (6.5)로의 이성질체화를 위한 반응을 성공적으로 개발하여 4'-에티닐-2'-데옥시 뉴클레오시드의 생산을 위한 보다 효율적인 방법을 가능하게 함으로써 개선될 수 있음이 밝혀졌다.
추가적으로, PNP 효소는 데옥시리보스 상의 4 위치에 3-원자 에티닐 치환기로 일부 활성을 가지며, PNP 효소 활성은 돌연변이를 효소 내로 도입하여 PNP에 의해 촉매되는 글리코실화 반응을 성공적으로 개발하여 4'-에티닐-2'-데옥시 뉴클레오시드의 생산을 위한 보다 효율적인 방법을 가능하게 함으로써 개선될 수 있음이 또한 밝혀졌다.
전체 합성 방법에 대한 훨씬 추가의 개선은 DERA 효소, 특히 슈와넬라 할리팍센시스(Shewanella halifaxensis)로부터의 DERA가 완전히 치환된 α-탄소를 갖는 2-에티닐-글리세르알데히드 3-포스페이트와의 알돌 반응에 대한 활성을 갖는다는 발견으로부터 왔다. 이 발견은 예를 들어, EFdA를 비롯한 4'-에티닐-2'-데옥시 뉴클레오시드 유사체에 대한 전구체인 4-에티닐-D-2-데옥시리보스 5-포스페이트의 효율적인 합성을 허용하였다.
본 발명은 다른 공정 개선 중에서도, 중간체 상의 보호기의 사용을 제거하고, 글리코실화의 입체선택성을 개선시키고, 이전의 방법에 비해 상기 화합물을 제조하는 데 필요한 공정 단계의 수를 크게 감소시키는 EFdA를 비롯한 4'-에티닐-2'-데옥시 뉴클레오시드 유사체의 신규한 효소적 합성에서 조작된 효소의 사용을 포함한다. 이는 또한 효소적 공정의 필수적인 부분인 신규한 중간체에 관한 것이다.
전체 공정을 하기 반응식 1 및 반응식 2에 요약한다; 후자의 반응식은 화합물 5를 제조하기 위한 대안적인 방법을 제공한다:
반응식 1
Figure pct00003
반응식 1A
Figure pct00004
포스페이트 중간체의 산 형태 또는 염은 본원에 기재된 공정에 이용될 수 있으며, 본원의 공정 단계의 예시에서 제공된 구체적인 산 또는 염 형태에 제한되지는 않는다. 본원에 기재된 모든 포스페이트 중간체에 대해, 2X+는 2개의 양성자, 1개의 양성자와 1개의 다른 1가 양이온, 2개의 1가 양이온 (동일하거나 상이함) 또는 1개의 2가 양이온의 임의의 조합을 나타낸다. -HO3PO-로 본원에서 그려진 포스페이트 중간체는 마찬가지로 포스페이트 기와 회합된 2개의 양성자, 1개의 양성자와 1개의 다른 1가 양이온, 2개의 1가 양이온 (동일하거나 상이함) 또는 1개의 2가 양이온의 임의의 조합을 가질 수 있다. 예로는 칼슘, 마그네슘, 또는 아연의 염; 모노 또는 디-나트륨 염, 모노 또는 디-칼륨 염, 모노 또는 디-리튬 염; 모노 또는 디-암모늄 염; 또는 1차, 2차 또는 3차 아민과의 1 또는 2가 염을 들 수 있으나, 이에 제한되지는 않는다.
관련 기술분야에 널리 이해되어 있는 바와 같이, 본원의 합성 단계에서 알데히드 또는 히드레이트로서 본원에 나타내어지거나 명명된 중간체 화합물은 본원에 기재된 반응에서 형태 또는 이러한 형태의 혼합물로 존재할 수 있다. 예를 들어, 화합물 (4) 및 (5)는 반응식 1에서 각각 히드레이트 및 알데히드로서 나타내어지지만, 각각은 각각이 존재하는 반응 단계에서 히드레이트 또는 알데히드 형태 또는 이들의 혼합물로 존재할 수 있다. 각각의 이러한 형태는 본원의 공정 단계 내에서 화합물 번호 (4) 또는 (5)에 대한 언급에 의해 포함된다:
Figure pct00005
화합물 (3)은 비키랄이며, 하기 중 어느 하나로서 본원에서 나타내어질 수 있다:
Figure pct00006
화합물 (6)은 그것이 존재하는 반응 단계에서, 그의 고리 형태로 또는 개방 쇄 알데히드 또는 히드레이트로서, 각각 산 또는 그의 염으로서 존재할 수 있다:
Figure pct00007
아노머성 C-N 연결을 갖는 4'-에티닐-2'-데옥시 뉴클레오시드 및 그의 유사체
Figure pct00008
는 HIV, AIDS 및 관련된 질환에 대한 활성에 대해 탐구되었다. 4'-에티닐-2'-데옥시 뉴클레오시드 및 그의 유사체는 아노머성 C-N 연결을 통해 퓨린 또는 피리미딘 핵염기 (아데닌, 구아닌, 시토신, 티민 또는 우라실) 또는 변형된 퓨린 또는 피리미딘 핵염기에 부착된 4'-에티닐-2'-데옥시 리보스를 포함한다.
4'-에티닐-2'-데옥시 뉴클레오시드 유사체, 예컨대 EFdA는 반응식 2에 나타내어진 바와 같이, 4-에티닐-D-2-데옥시리보스 5-포스페이트 (6)를 2가지 효소, 포스포펜토뮤타제 (PPM) [예를 들어 서열식별번호(SEQ ID NO.): 8 (그러나 이에 제한되지는 않음)] 및 퓨린 뉴클레오시드 포스포릴라제 (PNP) [예를 들어 서열식별번호: 9, 서열식별번호: 15 (그러나 이에 제한되지는 않음)]와 배합함으로써 최종 단계 원-포트 공정을 이용하여 합성될 수 있음이 밝혀졌다.
반응식 2
Figure pct00009
반응식 2A
Figure pct00010
반응식 2에 나타내어진 바와 같이, 합성의 최종 단계는 바람직한 최종 생성물을 향한 반응의 평형을 유도하기 위해 임의적 제3 효소와의 2-효소 반응을 이용한다. 최종 단계는 화합물 (6) 또는 그의 염으로 시작하며, 여기서 (6)은 상기 나타내어진 바와 같은 고리 형태의 4-에티닐-2-데옥시리보스 5-포스페이트 또는 그의 개방 쇄 알데히드 또는 히드레이트 형태이다.
화합물 (6)을 망간 (II) 염을 함유하며, 필요에 따라 약 6.5 내지 8.0, 또는 보다 특히 약 7.0 내지 7.5의 범위의 pH로 조정된 완충된 용액에서, 포스포펜토뮤타제 (PPM), 퓨린 뉴클레오시드 포스포릴라제 (PNP), 수크로스 포스포릴라제, 수크로스, 및 핵염기, 예를 들어, 비치환된 또는 치환된 아데닌과 배합한다. 수크로스:화합물 (6)의 몰 비는 약 1:1 내지 4:1일 수 있으나, 이에 제한되지는 않는다. 이 원-포트 반응의 성분은 임의의 순서로 배합될 수 있다.
반응물을 효소를 변성시키지 않는 온도 범위, 예를 들어, 약 30 내지 45 ℃, 및 보다 특히 약 35 내지 45 ℃ 내에서 교반한다. 특정 지점까지, 냉각기 온도는 작동할 수 있지만, 반응 속도를 감속시킬 것이다.
적합한 pH를 가지며 망간 (II) 염을 함유하는 임의의 완충액은 반응에 사용될 수 있다. 이러한 완충액의 예로는 트리에탄올아민; PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); MOPS, 예를 들어, 3-(N-모르폴리노)프로판술폰산 또는 3-모르폴리노프로판-1-술폰산; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올; 및 BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올을 들 수 있으나, 이에 제한되지는 않는다. 보다 특히, 완충액은 트리에탄올아민이다. 완충액 중 망간 (II) 염은 예를 들어, 염화망간, 수화염화망간, 브로민화망간, 아이오드화망간, 질산망간, 및/또는 황산망간일 수 있다. 완충액 중 망간 농도는 약 0.05 mM 내지 약 10 mM의 범위일 수 있으며, 특히 이는 약 5 mM이다.
평형 반응은 반응 혼합물에 첨가된 수크로스 포스포릴라제 (EC 2.4.1.7)에 의해 촉매되는, 수크로스의 D-프룩토스 및 α-D-글루코스-1-포스페이트로의 가인산분해에 의한 부산물 무기 포스페이트 염의 소비에 의해 최종 생성물의 높은 전환율로 전방향으로 유도될 수 있다. 그러나, 반응 동안 포스페이트를 제거하기 위한 임의의 다른 선택안, 예를 들어, 수크로스 포스포릴라제 및 수크로스를 사용하는 대신 칼슘, 마그네슘, 또는 망간을 반응물에 첨가하여 포스페이트 염을 침전시키는 것이 이용될 수 있다. 이 매우 효율적이고 생태학적으로 친화적인 공정은 보호기 또는 유기 용매의 사용 없이 매우 높은 입체선택성으로 당 및 핵염기 사이의 아노머성 연결을 형성하는 이점을 가지며, 원 포트 반응으로서 수행될 수 있다.
반응이 완결되면, 최종 생성물은 관련 기술분야의 통상의 기술자에게 공지된 표준 절차, 예컨대 최종 생성물의 결정화에 의한 단리 및 여과에 의한 수집, 또는 적절한 용매 내로의 추출, 이어서 결정화 (그러나 이에 제한되지는 않음)를 사용하여 단리될 수 있다.
반응식 2A에 나타내어진 바와 같이, 합성의 최종 단계는 대안적으로 바람직한 최종 생성물을 향한 반응의 평형을 유도하기 위해 임의적 제4 효소와의 3-효소 반응을 이용할 수 있다. 최종 단계는 화합물 (5) 또는 그의 염으로 시작하며, 여기서 (5)는 (R)-2-에티닐-글리세르알데히드 3-포스페이트 또는 그의 히드레이트 형태이다.
화합물 (5)를 망간 (II) 염을 함유하며, 필요에 따라 약 4 내지 10, 또는 특히 약 6.5 내지 8.0, 또는 보다 특히 약 7.0 내지 7.5의 범위의 pH로 조정된 완충된 용액에서, 데옥시리보스-포스페이트 알돌라제 (DERA), 아세트알데히드, 포스포펜토뮤타제 (PPM), 퓨린 뉴클레오시드 포스포릴라제 (PNP), 수크로스 포스포릴라제, 수크로스, 및 핵염기 또는 그의 유사체, 예를 들어, 비치환된 또는 치환된 아데닌과 배합한다. 수크로스:화합물 (5)의 몰 비는 약 1:1 내지 4:1일 수 있으나, 이에 제한되지는 않는다. 이 원-포트 반응의 성분은 임의의 순서로 배합될 수 있다.
반응은 효소를 변성시키지 않는 온도 범위, 예를 들어 약 30 내지 45 ℃, 또는 특히 약 35 내지 45 ℃ 내에서 수행된다. 특정 지점까지, 냉각기 온도는 작동할 수 있지만, 반응 속도를 감속시킬 것이다.
아세트알데히드는 용액으로서, 및 보다 특히 이소프로필 알콜 중 40 중량% 용액으로서 첨가된다. 아세트알데히드의 임의의 적합한 용액 또는 순수한 아세트알데히드는 반응에 사용될 수 있다. 이러한 용액의 예로는 이소프로판올 중 아세트알데히드 용액, 에탄올 중 아세트알데히드 용액, 물 중 아세트알데히드 용액, THF 중 아세트알데히드 용액을 들 수 있으나, 이에 제한되지는 않는다. 알데히드:화합물 (5)의 몰 비는 약 0.5:1 내지 4:1, 및 보다 특히 1.5:1일 수 있으나, 이에 제한되지는 않는다.
적합한 pH를 가지며 망간 (II) 염을 함유하는 임의의 완충액은 반응에 사용될 수 있다. 이러한 완충액의 예로는 트리에탄올아민; PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); MOPS, 예를 들어, 3-(N-모르폴리노)프로판술폰산 또는 3-모르폴리노프로판-1-술폰산; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올; 및 BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올을 들 수 있으나, 이에 제한되지는 않는다. 보다 특히, 완충액은 트리에탄올아민이다. 완충액 중 망간 (II) 염은 예를 들어, 염화망간, 수화염화망간, 브로민화망간, 아이오드화망간, 질산망간, 및/또는 황산망간일 수 있다. 완충액 중 망간 농도는 약 0.05 mM 내지 약 10 mM의 범위일 수 있으며, 특히 이는 약 5 mM이다.
평형 반응은 반응 혼합물에 첨가된 수크로스 포스포릴라제 (EC 2.4.1.7)에 의해 촉매되는 수크로스의 D-프룩토스 및 α-D-글루코스-1-포스페이트로의 가인산분해에 의한 부산물 무기 포스페이트 염의 소비에 의해 최종 생성물의 높은 전환율로 전방향으로 유도될 수 있다. 그러나, 반응 동안 포스페이트를 제거하기 위한 임의의 다른 선택안, 예를 들어, 수크로스 포스포릴라제 및 수크로스를 사용하는 대신 칼슘, 마그네슘, 또는 망간을 반응물에 첨가하여 포스페이트 염을 침전시키는 것이 이용될 수 있다. 이 매우 효율적이고 생태학적으로 친화적인 공정은 보호기 또는 유기 용매의 사용 없이 매우 높은 입체선택성으로 당 및 핵염기 사이의 아노머성 연결을 형성하는 이점을 가지며, 원 포트 반응으로서 수행될 수 있다.
반응이 완결되면, 최종 생성물은 관련 기술분야의 통상의 기술자에게 공지된 표준 절차, 예컨대 최종 생성물의 결정화에 의한 단리 및 여과에 의한 수집, 또는 적절한 용매 내로의 추출, 이어서 결정화 (그러나 이에 제한되지는 않음)를 사용하여 단리될 수 있다.
최종 생성물 4'-에티닐-2'-데옥시 뉴클레오시드 및 그의 유사체의 합성을 위한 본 공정에서 사용되는 몇몇 상류 중간체는 또한 반응식 3; 반응식 3A 및 반응식 3B에 나타내어진 바와 같은 효소적 반응 방법을 사용하여 제조된다.
반응식 3
Figure pct00011
반응식 3A
Figure pct00012
반응식 3B
Figure pct00013
화합물 4: 옥시다제 반응
반응식 3에 나타내어진 바와 같이, (R)-2-에티닐-글리세르알데히드 (4)는 갈락토스 옥시다제를 필요에 따라 약 3 내지 10, 또는 보다 특히 약 6 내지 8의 범위의 pH로 조정된 완충된 용액에서 2-에티닐-프로판-1,2,3-트리올 (3)과 반응시킴으로써 제조된다. 적합한 pH 범위를 갖는 임의의 완충액, 예를 들어 인산나트륨; 아세트산나트륨; PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); MOPS, 예를 들어, 3-(N-모르폴리노)프로판술폰산 또는 3-모르폴리노프로판-1-술폰산; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올; 및 BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올; 보레이트; CAPS, 예를 들어, N-시클로헥실-3-아미노프로판술폰산,; MES, 예를 들어 2-(N-모르폴리노)에탄술폰산; CHES, 예를 들어, N-시클로헥실-2-아미노에탄술폰산; 글리신; 또는 비신 (N,N-비스(2-히드록시에틸)글리신) (그러나 이에 제한되지는 않음); (인산나트륨이 바람직함)이 사용될 수 있다.
구리 및 퍼옥시다제는 둘 다 갈락토스 옥시다제 (GOase)를 활성화시키기 위해 반응에 사용된다. 구리는 CuSO4, Cu(OAc)2, CuCl2 또는 Cu(II) 또는 Cu(I)의 다른 염의 첨가에 의해 반응 혼합물에 공급될 수 있다. 퍼옥시다제는 서양고추냉이 퍼옥시다제, 또는 다른 유기체로부터 유래된 퍼옥시다제일 수 있거나, 이는 산화제, 예컨대 페리시아나이드, 이리데이트, 망간 (III) 염, 퍼술페이트 염 및 다른 1 전자 또는 2 전자 산화제, 또는 무기 또는 유기 산화제에 의해 대체될 수 있다. 바람직하게는, 퍼옥시다제는 서양고추냉이 퍼옥시다제이다. 카탈라제는 또한 GOase 탈활성화를 방지하는 것을 돕기 위해 첨가된다. 카탈라제는 포유동물 공급원 (소)으로부터의 또는 박테리아 또는 진균 공급원, 예컨대 코리네박테리움(Corynebacterium), 아스페르길루스(Aspergillus) 또는 이 목적을 위해 관련 기술분야에 공지된 다른 유기체로부터의 것일 수 있다.
반응은 산소의 존재 하에서 진행된다. 한 편리한 방법은 반응물을 공기로 살포하는 것이다. 대안적으로, 산소를 생성하는 다른 시스템, 예컨대 과산화수소/카탈라제, 슈퍼옥시드 또는 이 목적을 위해 관련 기술분야에 공지된 다른 방법의 사용이 이용될 수 있다.
반응은 약 10 내지 180 g/L, 및 특히 20 내지 50 g/L의 기질 농도로 수행될 수 있다. 반응은 약 0 내지 40 ℃, 및 특히 약 10 내지 30 ℃의 온도에서 실행될 수 있다.
화합물 8: 아미날 형성
반응식 3A에 예시된 바와 같이, (R)-2-에티닐-글리세르알데히드 (4)는 이를 안정한 N,N-아세탈 또는 N,O-아세탈을 형성하는 임의의 아민, 디아민 또는 아미노 알콜, 예를 들어 N,N'-디벤질에탄-1,2-디아민, N,N'-디메틸에탄-1,2-디아민, N,N'-디페닐에탄-1,2-디아민, 및 N-벤질에탄올아민 (그러나 이에 제한되지는 않음); (N,N'-디벤질에탄-1,2-디아민이 바람직함)과 반응시킴으로써 그의 아미날 형태 (예를 들어, 화합물 8)로 단리될 수 있다. 반응은 아미날의 분해를 회피하기 위해 유기 용매에서 약 50 ℃ 이하, 바람직하게는 20 내지 30 ℃의 온도에서 수행된다. 물과 혼화성이 아닌 임의의 용매, 예를 들어 MTBE, 2-MeTHF, CPME, 디에틸 에테르, 디이소프로필 에테르, 에틸 아세테이트, 이소프로필 아세테이트, 톨루엔, DCM 또는 이들의 혼합물 (그러나 이에 제한되지는 않음) (MTBE가 바람직함)이 사용될 수 있다. 반응은 약 10 내지 100 g/L, 및 특히 20 내지 50 g/L의 기질 농도로 수행될 수 있다.
임의로 아미날은 유기 용매, 예를 들어 MTBE, 2-MeTHF, CPME, 디에틸 에테르, 디이소프로필 에테르, 에틸 아세테이트, 이소프로필 아세테이트, 톨루엔, DCM 또는 이들의 혼합물 (그러나 이에 제한되지는 않음) (MTBE가 바람직함)로부터의 결정화에 의해 추가로 정제될 수 있다. 결정화는 아미날의 분해를 회피하기 위해 50 ℃ 이하에서, 예를 들어 약 40 ℃에서 수행된다.
반응은 산소의 부재 하에서 진행된다. 한 편리한 방법은 반응물을 N2로 살포하는 것이다. 대안적으로, 산소를 배제하는 다른 시스템, 예컨대 아르곤, 헬륨, 또는 이 목적을 위해 관련 기술분야에 공지된 다른 방법의 사용이 이용될 수 있다.
화합물 4: 아미날 8로부터의 알데히드 4 재생
(R)-2-에티닐-글리세르알데히드 (4)는 이를 물과 혼화성이 아닌 유기 용매의 존재 하에서, 아미날의 분해를 회피하기 위해 50 ℃ 이하의 온도, 예를 들어 약 0 내지 15 ℃에서 유기 또는 무기 산과 반응시킴으로써 그의 각각의 아미날로부터 재생될 수 있다. 임의의 유기 또는 무기 산, 예를 들어 p-톨루엔술폰산, 메탄술폰산, 캄포르술폰산, 아세트산, 염산, 인산, 황산 (그러나 이에 제한되지는 않음)이 사용될 수 있다. p-톨루엔술폰산은 물 중 N,N'-디벤질에탄-1,2-디아민 비스 p-톨루엔술포네이트 염의 낮은 용해도로 인해 아미날 8과의 반응에서 바람직하다. 물과 혼화성이 아닌 임의의 용매, 예를 들어 MTBE, 2-MeTHF, CPME, 디에틸 에테르, 디이소프로필 에테르, 에틸 아세테이트, 이소프로필 아세테이트, 톨루엔, DCM 또는 이들의 혼합물 (그러나 이에 제한되지는 않음); (MTBE 및 2-MeTHF가 바람직함)이 사용될 수 있다. 반응은 약 5 내지 100 g/L, 및 특히 20 내지 50 g/L의 기질 농도로 수행될 수 있다.
임의로 알데히드 4 용액은 과량의 유기 또는 무기 산을 제거하기 위해 수지로 추가로 처리될 수 있다. 수지 처리는 염기성 수지, 예컨대 도웩스(DOWEX)™ 마라톤(MARATHON)™ A 수지 (히드록시드 형태) 및 암벌리스트(AMBERLYST)® 15 수지 (수소 형태), 또는 이들의 혼합물, 바람직하게는 혼합물 도웩스™ 마라톤™ A 수지 (히드록시드 형태) 및 암벌리스트® 15 수지로 수행될 수 있다.
임의로 알데히드 4 용액은 과량의 유기 용매를 제거하기 위해 추가로 진공 하에서 증발되거나, 기체로 스윕될 수 있다.
화합물 5: 키나제 반응
Figure pct00014
반응식 3 및 반응식 3A에 나타내어진 바와 같이, (R)-2-에티닐-글리세르알데히드 3-포스페이트 히드레이트 (5)는 이. 콜라이(E. coli)로부터의 판토테네이트 키나제 (PanK) 야생형 또는 그의 변이체를 필요에 따라 약 4 내지 10, 또는 특히 약 6.5 내지 8.5 또는 보다 특히 5.5 내지 8.5의 범위의 pH로 조정된 완충된 용액에서 화합물 (4)와 반응시킴으로써 제조된다. 적합한 pH 범위를 갖는 임의의 완충액, 예를 들어 인산나트륨, PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올; 보레이트; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; 트리에탄올아민 및 TRIS, 예를 들어, TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올 (그러나 이에 제한되지는 않음); (인산나트륨이 바람직함)이 사용될 수 있다. 반응은 임의의 적합한 2가 금속 염, 예를 들어 마그네슘 염, 예를 들어 염화마그네슘, 및 코발트, 망간, 아연 또는 칼슘의 염 (그러나 이에 제한되지는 않음)의 존재 하에서 수행될 수 있다.
이 반응은 5'-트리포스페이트 (ATP)로 재생시키는 것을 요구하는 포스페이트 공급원으로서 아데노신 5'-디포스페이트 (ADP)를 이용한다. ATP는 계내에서 생성되고, 이어서 관련 기술분야에 공지된 임의의 방법에 의해 ADP, 아데노신 5'-모노포스페이트 (AMP) 또는 아데노신으로부터 재생될 수 있다. 예를 들어, 아세테이트 키나제와 함께 아세틸 포스페이트의 조합은 ADP를 ATP로 재생시키는데 사용될 수 있다. 예를 들어, 피루베이트, 포스페이트 및 산소의 존재 하에서, 피루베이트 옥시다제 및 카탈라제의 조합은 아세틸 포스페이트를 생성하고, 따라서 아세테이트 키나제의 존재 하에서, ADP를 ATP로 재생시키는데 사용될 수 있다.
반응은 약 10 내지 100 g/L, 및 특히 약 20 내지 40 g/L의 기질 농도로 수행될 수 있다. 반응은 약 0 내지 40 ℃의 온도에서, 및 특히 약 10 내지 25 ℃에서 실행될 수 있다.
반응은 또한 수지 상에 고정화된 판토테네이트 키나제 (PanK)로, 또는 수지 상에 고정화된 PanK 및 아세테이트 키나제 둘 다로 수행될 수 있다. 관련 기술분야에 공지된 임의의 적합한 효소 고정화 방법, 예를 들어 고정화된 금속-이온 친화도 크로마토그래피 (IMAC) 수지, 또는 다른 생물학적 태그를 사용한 친화도 수지-고정화, 공유 고정화, 이온성 수지 상의 고정화, 흡착, 캡슐화, 및/또는 가교된 효소에 의한 고정화 (그러나 이에 제한되지는 않음)가 사용될 수 있다. 예를 들어, 금속-이온 친화도 크로마토그래피 (IMAC) 수지가 사용될 수 있거나, IMAC 수지 및 2가 양이온의 임의의 적합한 조합이 사용될 수 있으며, 여기서 양이온은 예를 들어 니켈, 코발트, 구리, 아연, 철, 및/또는 알루미늄일 수 있으나, 이에 제한되지는 않는다. 특히, 니켈로 충전된 IMAC 수지가 사용될 수 있다. 바람직하게는, 아세테이트 키나제 및 판토테네이트 키나제 (PanK) 둘 다는 수지 상에 고정화된다.
화합물 9: 키나제 반응
Figure pct00015
반응식 3B에 나타내어진 바와 같이, (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9)는 이. 콜라이로부터의 판토테네이트 키나제 (PanK) 야생형 또는 그의 변이체를 필요에 따라 약 4 내지 10, 또는 특히 약 6.5 내지 8.5 또는 보다 특히 5.5 내지 8.5의 범위의 pH로 조정된 완충된 용액에서 화합물 (3)과 반응시킴으로써 제조된다. 적합한 pH 범위를 갖는 임의의 완충액, 예를 들어 인산나트륨, PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올; 보레이트; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산;, 트리에탄올아민 및 TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올 (그러나 이에 제한되지는 않음) (인산나트륨이 바람직함)이 사용될 수 있다. 반응은 임의의 적합한 2가 금속 염, 예를 들어 마그네슘 염, 예를 들어 염화마그네슘, 및 코발트, 망간, 아연 또는 칼슘의 염 (그러나 이에 제한되지는 않음)의 존재 하에서 수행될 수 있다.
이 반응은 5'-트리포스페이트 (ATP)로 재생시키는 것을 요구하는 포스페이트 공급원으로서 아데노신 5'-디포스페이트 (ADP)를 이용한다. ATP는 계내에서 생성되고, 이어서 관련 기술분야에 공지된 임의의 방법에 의해 ADP, 아데노신 5'-모노포스페이트 (AMP) 또는 아데노신으로부터 재생될 수 있다. 예를 들어, 아세테이트 키나제와 함께 아세틸 포스페이트의 조합은 ADP를 ATP로 재생시키는데 사용될 수 있다. 대안적으로, (a) 피루베이트, 포스페이트 및 산소의 존재 하에서 피루베이트 옥시다제, 카탈라제 및 아세테이트 키나제의 조합은 ADP를 ATP로 재생시키는데 사용될 수 있거나, (b) 아세틸 포스페이트 및 아세테이트 키나제와 조합으로 피루베이트, 포스페이트, 및 산소의 존재 하에서 피루베이트 옥시다제, 카탈라제 및 아세테이트 키나제의 조합은 ADP로부터의 ATP 재생에 사용될 수 있다.
반응은 약 10 내지 100 g/L, 및 특히 약 20 내지 40 g/L의 기질 농도로 수행될 수 있다. 반응은 약 0 내지 40 ℃의 온도에서, 및 특히 약 10 내지 25 ℃에서 실행될 수 있다.
반응은 또한 수지 상에 고정화된 판토테네이트 키나제 (PanK)로, 또는 수지 상에 고정화된 PanK 및 아세테이트 키나제 둘 다로 수행될 수 있다. 관련 기술분야에 공지된 임의의 적합한 효소 고정화 방법, 예를 들어 고정화된 금속-이온 친화도 크로마토그래피 (IMAC) 수지, 또는 다른 생물학적 태그를 사용한 친화도 수지-고정화, 공유 고정화, 이온성 수지 상의 고정화, 흡착, 캡슐화, 및/또는 가교된 효소에 의한 고정화 (그러나 이에 제한되지는 않음)가 사용될 수 있다. 예를 들어, 금속-이온 친화도 크로마토그래피 (IMAC) 수지가 사용될 수 있거나, IMAC 수지 및 2가 양이온의 임의의 적합한 조합이 사용될 수 있으며, 여기서 양이온은 예를 들어 니켈, 코발트, 구리, 아연, 철, 및/또는 알루미늄일 수 있으나, 이에 제한되지는 않는다. 특히, 니켈로 충전된 IMAC 수지가 사용될 수 있다. 바람직하게는, 아세테이트 키나제 및 판토테네이트 키나제 (PanK) 둘 다는 수지 상에 고정화된다.
화합물 5: 옥시다제 반응
Figure pct00016
반응식 3B에 나타내어진 바와 같이, (R)-2-에티닐-글리세르알데히드 히드레이트 3-포스페이트 (5)는 갈락토스 옥시다제를 필요에 따라 약 3 내지 10, 또는 보다 특히 약 6 내지 8의 범위의 pH로 조정된 완충된 용액에서 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9)와 반응시킴으로써 제조된다. 적합한 pH 범위를 갖는 임의의 완충액, 예를 들어 인산나트륨; 아세트산나트륨; PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); MOPS, 예를 들어, 3-(N-모르폴리노)프로판술폰산 또는 3-모르폴리노프로판-1-술폰산; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; TRIS, 예를 들어, 트리스(히드록시메틸)아미노메탄 또는 2-아미노-2-(히드록시메틸)프로판-1,3-디올; 및 BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올; 보레이트; CAPS, 예를 들어, N-시클로헥실-3-아미노프로판술폰산,; MES, 예를 들어 2-(N-모르폴리노)에탄술폰산; CHES, 예를 들어, N-시클로헥실-2-아미노에탄술폰산; 글리신; 또는 비신 (N,N-비스(2-히드록시에틸)글리신) (그러나 이에 제한되지는 않음); (인산나트륨이 바람직함)이 사용될 수 있다.
구리 및 퍼옥시다제는 둘 다 갈락토스 옥시다제 (GOase)를 활성화시키기 위해 반응에 사용된다. 구리는 CuSO4, Cu(OAc)2, CuCl2 또는 Cu(II) 또는 Cu(I)의 다른 염의 첨가에 의해 반응 혼합물에 공급될 수 있다. 퍼옥시다제는 서양고추냉이 퍼옥시다제, 또는 다른 유기체로부터 유래된 퍼옥시다제일 수 있거나, 이는 산화제, 예컨대 페리시아나이드, 이리데이트, 망간 (III) 염, 퍼술페이트 염 및 다른 1 전자 또는 2 전자 산화제, 또는 무기 또는 유기 산화제에 의해 대체될 수 있다. 바람직하게는, 퍼옥시다제는 서양고추냉이 퍼옥시다제이다. 카탈라제는 또한 GOase 탈활성화를 방지하는 것을 돕기 위해 첨가된다. 카탈라제는 포유동물 공급원 (소)으로부터의 또는 박테리아 또는 진균 공급원, 예컨대 코리네박테리움, 아스페르길루스 또는 이 목적을 위해 관련 기술분야에 공지된 다른 유기체로부터의 것일 수 있다.
반응은 산소의 존재 하에서 진행된다. 한 편리한 방법은 반응물을 공기로 살포하는 것이다. 대안적으로, 산소를 생성하는 다른 시스템, 예컨대 과산화수소/카탈라제, 슈퍼옥시드 또는 이 목적을 위해 관련 기술분야에 공지된 다른 방법의 사용이 이용될 수 있다.
반응은 약 10 내지 180 g/L, 및 특히 20 내지 50 g/L의 기질 농도로 수행될 수 있다. 반응은 약 0 내지 40 ℃, 및 특히 약 10 내지 30 ℃의 온도에서 실행될 수 있다.
화합물 6: 데옥시리보스-포스페이트 알돌라제 (DERA) 반응
이전의 공지된 공정에 비해 화합물 (6)을 생산하기 위한 이 새로운 경로의 중요한 이점은 이것이 보호기의 사용 없이 정확한 산화 상태에서 당 프레임워크를 생성한다는 것이다.
4-에티닐-D-2-데옥시리보스 5-포스페이트 (6)는 데옥시리보스-포스페이트 알돌라제 (DERA)를 필요에 따라 약 5 내지 9, 또는 보다 특히 약 6 내지 8의 범위의 pH로 조정된 수용액에서 산으로서 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5) 또는 그의 염, 및 아세트알데히드와 반응시킴으로써 제조된다. (5)의 염의 예로는 칼슘, 마그네슘, 아연, 모노- 또는 디-Na 염, 모노- 또는 디-K 염, 또는 모노- 또는 디-Li 염; 모노- 또는 디-암모늄 또는 염; 또는 1차, 2차 또는 3차 아민과의 1가 또는 2가 염을 들 수 있으나, 이에 제한되지는 않는다. 반응은 개방된 용기에서 수행될 수 있거나, 바람직하게는 아세트알데히드의 증발을 방지하기 위해 밀봉된 용기에서 수행된다.
반응은 약 10 내지 100 g/L, 특히 약 30 내지 60 g/L의 기질 농도로 수행될 수 있다. 이는 약 0 내지 40 ℃, 및 특히 약 25 내지 35 ℃의 온도에서 실행될 수 있다.
반응은 임의의 완충액 없이 실행될 수 있다. 대안적으로, 완충액, 예를 들어 트리에탄올아민; 포스페이트; MOPS, 예를 들어, 3-(N-모르폴리노)프로판술폰산 또는 3-모르폴리노프로판-1-술폰산; HEPES, 예를 들어, 4-(2-히드록시에틸)-1-피페라진에탄술폰산 또는 2-[4-(2-히드록시에틸)피페라진-1-일]에탄술폰산; BIS-TRIS 메탄, 예를 들어, 2-[비스(2-히드록시에틸)아미노]-2-(히드록시메틸)프로판-1,3-디올; 보레이트; PIPES, 예를 들어 피페라진-N,N'-비스(2-에탄술폰산); MES, 예를 들어, 2-(N-모르폴리노)에탄술폰산; 및 보레이트; 또는 임의의 1차 아민 기를 갖지 않는 적합한 pH 범위를 갖는 다른 완충액 (그러나 이에 제한되지는 않음)이 사용될 수 있다.
1종 이상의 효소의 사용을 포함하는 본원에 기재된 공정의 각각의 단계 및 방법은 상기 1종 이상의 효소를 변성시키지 않는 온도에서 수행된다. 1종 이상의 효소의 사용을 포함하는 본원에 기재된 공정의 각각의 단계 및 방법은 약 3 내지 10 또는 약 4 내지 10의 범위의 pH에서 수행될 수 있다.
"핵염기" (또는 "질소성 염기" 또는 "염기")는 핵산, 예컨대 DNA 및 RNA의 피리미딘 또는 퓨린 헤테로사이클이다. 본원에 사용된 바와 같은 핵염기는 아데닌, 구아닌, 시토신, 티민 또는 우라실, 뿐만 아니라 비-천연 변형을 갖는 핵염기를 포함하며, 예를 들어, 여기서 염기는 1개 이상의 비-천연 치환기, 또는 아노머성 C-N 연결에 대한 임의의 변화를 배제하는 염기에서의 헤테로원자(들)에 영향을 미치는 변형을 갖는다.
4'-에티닐-2'-데옥시 뉴클레오시드는 핵염기를 함유한다. 본원에 사용된 바와 같은 4'-에티닐-2'-데옥시 뉴클레오시드의 유사체는 뉴클레오시드의 염기에 대한 비-천연 변형을 의미하며, 예를 들어 여기서 염기는 1개 이상의 비-천연 치환기, 또는 아노머성 C-N 연결에 대한 임의의 변화를 제외하고 염기에서의 헤테로원자(들)에 영향을 미치는 변형을 갖는다.
본원에 사용된 바와 같은 "포스포펜토뮤타제" ("PPM") 효소 (예를 들어 EC 5.4.2.7)는 리보스 1-포스페이트의 리보스 5-포스페이트 및 관련된 화합물, 예컨대 데옥시리보스 포스페이트 및 리보스 포스페이트 및 데옥시리보스 포스페이트의 유사체로의 가역적 이성질체화를 촉매하는 효소이다.
본원에 사용된 바와 같은 "퓨린 뉴클레오시드 포스포릴라제" ("PNP") 효소 (EC 2.4.2.2)는 퓨린 리보뉴클레오시드 및 관련된 화합물 (예를 들어, 데옥시리보뉴클레오시드 및 리보뉴클레오시드 및 데옥시리보뉴클레오시드의 유사체)의 유리 퓨린 염기 및 리보스-1-포스페이트 (및 그의 유사체)로의 가역적 가인산분해를 촉매하는 효소이다.
본원에 사용된 바와 같은 "수크로스 포스포릴라제" ("SP") 효소 (EC 2.4.1.7)는 수크로스의 D-프룩토스 염기 및 글루코스-1-포스페이트 (및 그의 유사체)로의 가역적 가인산분해를 촉매하는 효소이다. 수크로스와 조합으로 수크로스 포스포릴라제 (SP)는 퓨린 뉴클레오시드 포스포릴라제 (PNP) 및 포스포뮤타제 (PPM)와 조합으로 이용되어 반응으로부터 유리 포스페이트 이온을 제거하며, 여기서 효소의 조합은 뉴클레오시드 MK-8591 (EFdA)의 형성을 촉매하는 반면, 일부 실시양태에서 이는 관련 기술분야에 공지된 다른 방법에 의해 대체될 수 있다.
본원에 사용된 바와 같은 "데옥시리보스-포스페이트 알돌라제" ("DERA") (예를 들어, EC 4.1.2.4)는 탄소-탄소 결합을 가역적으로 절단하거나 생성하는 리아제의 패밀리 중의 효소를 지칭한다. 본원에 사용된 바와 같은 데옥시리보스-포스페이트 알돌라제는 천연 발생 (야생형) 데옥시리보스-포스페이트 알돌라제 뿐만 아니라 인간 조작에 의해 생성된 비-천연 발생 조작된 폴리펩티드를 포함한다. 야생형 데옥시리보스-포스페이트 알돌라제는 2-데옥시-D-리보스 5-포스페이트의 D-글리세르알데히드 3-포스페이트 및 아세트알데히드로의 가역적 반응을 촉매한다.
본원에 사용된 바와 같은 "판토테네이트 키나제" ("PanK")는 자연에서 판토테네이트를 인산화하여 4'-포스포판토테네이트를 형성하는 효소 (EC 2.7.1.33)를 지칭한다. 이러한 PanK 효소로부터 유래된 변이체 효소는 이러한 변이체가 판토테네이트에 대한 그들의 천연 기능을 보유하는지 여부와 무관하게 개선된 활성 및 D-에티닐글리세르알데히드의 3'OH-기에 대한 입체선택성을 나타낼 수 있다.
본원에 사용된 바와 같은 "갈락토스 옥시다제" ("GOase"; EC 1.1.3.9) 효소는 2분자성 산소의 존재 하에서 1차 알콜의 상응하는 알데히드로의 산화를 촉매하는 구리-의존성 효소이다. 이들은 위치- 및 거울상특이적 방식 둘 다로 작용하여, 관능기 보호를 거의 또는 전혀 요구하지 않고, 바람직한 입체이성질체를 생성하는 합성 접근법을 가능하게 한다. 산화의 방식은 활성이 알콜의 그의 상응하는 카르복실산으로의 과다-산화를 초래하지 않도록 온건하고 제어된다.
본원에 사용된 바와 같은 "서양고추냉이 퍼옥시다제" (HRP, EC 1.11.1.7) 효소는 정상 GOase 촉매적 환화 동안 일어나는 활성 부위의 불활성 산화환원 상태를 산화시킴으로써 GOase 촉매 활성을 활성화시키고 유지하는 철-의존성 효소이다. 유형 I HRP는 본원에 포함되는 실시예에서 촉매적 방식으로 이용되지만, 이는 이 역할에서 배타적인 것으로 의미되지 않는데, 이는 이 및 다른 효소 부류에 속하는 다른 전자-전달 효소 뿐만 아니라 이 역할을 달성할 수 있는 화학적 시약이 있기 때문이다.
본원에 사용된 바와 같은 "카탈라제"는 효소를 과산화수소의 특정 수준 초과로 불활성이 되게 할 수 있는 갈락토스 옥시다제 또는 피루베이트 옥시다제 반응의 부산물인 과산화수소에 대해 작용하는 헴-의존성 효소 (EC 1.11.1.6)를 지칭한다. 카탈라제는 본원의 실시예에서 촉매적 유지 효소로서 이용되어 과산화수소를 물 및 산소로 전환시키는 반면, 일부 실시양태에서 이는 다른 방법, 예컨대 과산화수소의 전기화학적 분해에 의해 대체될 수 있다. 헴-의존성 카탈라제는 본원에 포함된 실시예에서 촉매적 방식으로 이용되지만, 이는 이 역할에서 배타적인 것으로 의미되지 않는데, 이는 이 역할을 달성할 수 있는 이 부류에 속하는 다른 효소가 있기 때문이다.
본원에 사용된 바와 같은 "아세테이트 키나제" ("AcK")는 아세테이트 및 아데노신 트리포스페이트 (ATP)로부터의 아세틸 포스페이트의 형성을 촉매하는 효소 (EC 2.7.2.1)를 지칭한다. 이는 또한 역반응을 촉매할 수 있으며, 여기서 이는 아세틸 포스페이트의 존재 하에서 아데노신 5'-디포스페이트 (ADP)를 아데노신 5'-트리포스페이트 (ATP)로 인산화한다. 아세테이트 키나제는 본원의 실시예에서 판토테네이트 키나제 (PanK)에 의해 요구되는 ATP를 재사용하기 위해 이용되는 반면, 일부 실시양태에서 아세틸 포스페이트- 아세테이트 키나제 재사용 조합은 관련 기술분야에 공지된 다른 방법에 의해 대체될 수 있다.
본원에 사용된 바와 같은 "피루베이트 옥시다제" ("PO")는 플라빈 아데닌 디뉴클레오티드 (FAD) 및 티아민 디포스페이트에 의존성인 효소 (EC 1.2.3.3)를 지칭한다. 피루베이트 옥시다제는 옥시도리덕타제, 구체적으로 수용자로서 산소를 갖는 공여자의 알데히드 또는 옥소 기에 대해 작용하는 것들의 패밀리에 속하는 효소이며, 이는 피루베이트, 포스페이트 이온 및 2분자성 산소 사이의 화학 반응을 촉매하여 아세틸 포스페이트, 이산화탄소 및 과산화수소를 형성한다. 피루베이트 옥시다제 (PO)는 본원의 실시예에서 촉매적 ATP-재생 조합으로서 아세테이트 키나제 (AcK) 및 카탈라제와 조합으로 이용되며, 여기서 효소의 조합은 산소, 피루베이트 및 포스페이트 이온의 존재 하에서 ADP로부터의 ATP의 형성을 촉매하는 반면, 일부 실시양태에서 이는 관련 기술분야에 공지된 다른 방법에 의해 대체될 수 있다.
본원에 사용된 바와 같은 "야생형" 및 "천연-발생" 효소는 자연에서 발견되는 형태를 지칭한다. 예를 들어, 야생형 폴리펩티드 서열은 자연에서 공급원으로부터 단리될 수 있는 유기체에 존재하며, 인간 조작에 의해 의도적으로 변형되지 않은 서열이다.
폴리펩티드를 포함하여 효소에 관하여 사용되는 경우 본원에 사용된 바와 같은 "조작된", "변이체", "돌연변이체" 및 "비-천연 발생"은 그렇지 않다면 자연에서 존재하지 않을 방식으로 변형된 물질, 또는 물질의 천연 또는 네이티브 형태에 상응하는 물질을 지칭한다. 일부 실시양태에서, 폴리펩티드는 천연 발생 폴리펩티드와 동일하지만, 합성 물질로부터, 및/또는 재조합 기법을 사용한 조작에 의해 생산되거나 유래된다.
효소에 관하여 "서열 동일성의 백분율", "퍼센트 동일성", 및 "퍼센트 동일한"은 폴리뉴클레오티드 서열 또는 폴리펩티드 서열 사이의 비교를 지칭하기 위해 본원에서 사용되고, 2개의 최적으로 정렬된 서열을 비교 창에 비해 비교함으로써 결정되며, 여기서 비교 창에서의 폴리뉴클레오티드 또는 폴리펩티드 서열의 부분은 2개의 서열의 최적 정렬을 위해 참조 서열에 비해 부가 또는 결실 (즉, 갭)을 포함할 수 있다. 백분율은 동일한 핵산 염기 또는 아미노산 잔기 중 어느 하나가 둘 다의 서열에서 발생하거나, 핵산 염기 또는 아미노산 잔기가 갭을 갖고 정렬되어 매칭된 위치의 수를 생성하는 위치의 수를 결정하고, 매칭된 위치의 수를 비교의 창에서의 위치의 총 수로 나누고, 결과에 100을 곱하여 서열 동일성의 백분율을 생성함으로써 계산된다. 최적 정렬 및 퍼센트 서열 동일성의 결정은 BLAST 및 BLAST 2.0 알고리듬을 사용하여 수행된다 (예를 들어, 문헌 [Altschul et al., 1990, J. Mol. Biol. 215: 403-410] 및 [Altschul et al., 1977, Nucleic Acids Res. 3389-3402] 참조). BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물공학 정보 센터(National Center for Biotechnology Information) 웹사이트를 통해 공개적으로 이용가능하다.
간략하게, BLAST 분석은 먼저 데이터베이스 서열에서 동일한 길이의 단어로 정렬되는 경우 일부 양의 값 역치 점수 T를 매칭하거나 만족시키는, 의문 서열에서의 길이 W의 짧은 단어를 확인함으로써 높은 점수화 서열 쌍 (HSP)을 확인하는 것을 포함한다. T는 이웃 단어 점수 역치로 지칭된다 (Altschul et al., 상기 문헌). 이들 초기 이웃 단어 히트는 그들을 함유하는 보다 긴 HSP를 발견하기 위한 검색을 개시하기 위한 시드로서 작용한다. 그 후, 단어 히트는 누적 정렬 점수가 증가될 수 있는 한, 각각의 서열을 따라 둘 다의 방향에서 연장된다. 누적 점수는 뉴클레오티드 서열에 대해, 파라미터 M (매칭 잔기의 쌍에 대한 보상 점수; 항상 >0) 및 N (미스매칭 잔기에 대한 페널티 점수; 항상 <0)을 사용하여 계산된다. 아미노산 서열에 대해, 점수화 행렬을 사용하여 누적 점수를 계산한다. 각각의 방향에서의 단어 히트의 연장은 누적 정렬 점수가 그의 최대 달성된 값으로부터 양 X에 의해 저하되거나; 누적 점수가 1개 이상의 음-점수화 잔기 정렬의 축적으로 인해 0 이하로 가거나; 어느 하나의 서열의 말단이 도달되는 경우 중단된다. BLAST 알고리듬 파라미터 W, T, 및 X는 정렬의 민감도 및 속도를 결정한다. BLASTN 프로그램 (뉴클레오티드 서열에 대해)은 디폴트로서 11의 단어길이 (W), 10의 기대값 €, M=5, N=-4, 및 둘다의 가닥의 비교를 사용한다. 아미노산 서열에 대해, BLASTP 프로그램은 디폴트로서 3의 단어길이 (W), 10의 기대값 €(E), 및BLOSUM62 점수화 행렬을 사용한다 (문헌 [Henikoff and Henikoff, 1989, Proc Natl Acad Sci USA 89:10915] 참조).
2개의 서열에 대한 퍼센트 동일성을 제공하는데 있어서 BLAST와 유사하게 기능하는 다수의 다른 알고리듬이 이용가능하다. 비교를 위한 서열의 최적 정렬은 예를 들어, 문헌 [Smith and Waterman, 1981, Adv. Appl. Math. 2:482]의 국소 상동성 알고리듬에 의해, 문헌 [Needleman and Wunsch, 1970, J. Mol. Biol. 48:443]의 상동성 정렬 알고리듬에 의해, 문헌 [Pearson and Lipman, 1988, Proc. Natl. Acad. Sci. USA 85:2444]의 유사성 방법에 대한 검색에 의해, 이들 알고리듬의 컴퓨터화된 실행 (GCG 위스콘신 소프트웨어 패키지에서의 GAP, BESTFIT, FASTA, 및 TFASTA)에 의해, 또는 육안 검사에 의해 수행될 수 있다 (일반적으로, 문헌 [Current Protocols in Molecular Biology, F. M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (1995 Supplement) (Ausubel)] 참조). 추가적으로, 서열 정렬 및 퍼센트 서열 동일성의 결정은 제공된 디폴트 파라미터를 사용하여 GCG 위스콘신 소프트웨어 패키지 (액셀러리스(Accelerys), 미국 위스콘신주 매디슨)에서의 BESTFIT 또는 GAP를 이용할 수 있다.
"실질적 동일성"은 적어도 20개 잔기 위치의 비교 창에 비해, 빈번히 적어도 30-50개 잔기의 창에 비해 참조 서열에 비해, 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리뉴클레오티드 또는 폴리펩티드 서열을 지칭하며, 여기서 서열 동일성의 백분율은 참조 서열을 비교의 창에 비해 참조 서열의 총 20 퍼센트 이하인 결실 또는 부가를 포함하는 서열과 비교함으로써 계산된다. 폴리펩티드에 적용되는 구체적인 실시양태에서, 용어 "실질적 동일성"은 2개의 폴리펩티드 서열이 예컨대 디폴트 갭 가중치를 사용하여 프로그램 GAP 또는 BESTFIT에 의해 최적으로 정렬되는 경우, 적어도 80 퍼센트 서열 동일성, 바람직하게는 적어도 89 퍼센트 서열 동일성, 보다 바람직하게는 적어도 95 퍼센트 서열 동일성 이상 (예를 들어, 99 퍼센트 서열 동일성)을 공유하는 것을 의미한다. 바람직하게는, 동일하지 않은 잔기 위치는 보존적 아미노산 치환에 의해 상이하다.
"입체선택성"은 또 다른 것에 비해 하나의 입체이성질체의 화학적 또는 효소적 반응에서의 우선적 형성을 지칭한다. 입체선택성은 하나의 입체이성질체의 형성이 다른 것에 비해 선호되는 경우 부분적일 수 있거나, 이는 단지 하나의 입체이성질체가 형성되는 경우 완전할 수 있다. 입체이성질체가 거울상이성질체인 경우, 입체선택성은 거울상선택성, 둘 다의 합계 중 하나의 거울상이성질체의 분율 (전형적으로 백분율로서 보고됨)로 지칭된다. 이는 통상적으로 대안적으로 관련 기술분야에서 식 [주 거울상이성질체 - 부 거울상이성질체]/[주 거울상이성질체 + 부 거울상이성질체]에 따라 그로부터 계산되는 거울상이성질체 과량 (e.e.)으로서 (전형적으로 백분율로서) 보고된다. 입체이성질체가 부분입체이성질체인 경우, 입체선택성은 부분입체선택성, 2개의 부분입체이성질체의 혼합물 중 하나의 부분입체이성질체의 분율 (전형적으로 백분율로서 보고됨)로 지칭되며, 통상적으로 대안적으로 부분입체이성질체 과량 (d.e.)으로 보고된다. 거울상이성질체 과량 및 부분입체이성질체 과량은 입체이성질체 과량의 유형이다.
어구 "적합한 반응 조건"은 본 발명에 사용되는 각각의 폴리펩티드가 기질을 바람직한 생성물 화합물로 전환시킬 수 있는 효소적 전환 반응 용액에서의 조건 (예를 들어, 효소 로딩, 기질 로딩, 온도, pH, 완충액, 공-용매 등의 범위)을 지칭한다. 일부 예시적인 적합한 반응 조건은 본원에 제공된다.
효소적 전환 반응 공정의 맥락에서 본원에 사용된 바와 같은 "기질"은 본원에 사용된 조작된 효소에 의해 작용되는 화합물 또는 분자를 지칭한다.
효소적 전환 공정의 맥락에서 본원에 사용된 바와 같은 "생성물"은 기질 상의 효소적 폴리펩티드의 작용으로부터 초래되는 화합물 또는 분자를 지칭한다.
본원에 사용된 바와 같은 반응으로부터의 생성물 (예를 들어, 4'-에티닐-2'-데옥시리보스 포스페이트 유사체 또는 4'-에티닐-2'-데옥시 뉴클레오시드 유사체)의 "증가하는" 수율은 반응 동안 존재하는 특정한 성분 (예를 들어, 효소)이 동일한 기질로의 동일한 반응 하에서, 그러나 관심의 성분의 부재 하에서 수행되는 반응에 비해, 보다 많은 생성물이 생산되는 것을 유발하는 경우 발생한다.
본원에 사용된 바와 같이, 본원에 사용된 바와 같은 "평형(equilibration)" 또는 "평형(equilibrium)"은 화학적 또는 효소적 반응의 전방향 속도 상수 및 역방향 속도 상수에 의해 결정 시, 입체이성질체의 상호전환을 비롯한 화학적 또는 효소적 반응 (예를 들어, 2개의 종 A 및 B의 상호전환)에서의 화학적 종의 정상 상태 농도를 초래하는 공정을 지칭한다.
"거울상이성질체 과량" (ee)은 키랄 물질에 대해 사용되는 순도의 측정이다. 이는 샘플이 하나의 거울상이성질체를 다른 것보다 더 많은 양으로 함유하는 정도를 반영한다. 예를 들어, 라세미 혼합물은 0%의 e.e.를 갖는 반면, 단일 완전히 순수한 거울상이성질체는 100%의 e.e.를 가지며; 70%의 하나의 거울상이성질체 및 30%의 다른 것을 갖는 샘플은 40% (70% - 30%)의 e.e.를 갖는다. 부분입체이성질체 과량 (de)은 단지 2개의 부분입체이성질체가 혼합물에 존재하는 경우 e.e.와 동일한 방식으로 계산된다.
"단백질", "효소", "폴리펩티드", 및 "펩티드"는 길이 또는 번역후 변형 (예를 들어, 글리코실화, 인산화, 지질화, 미리스틸화, 10 유비퀴틴화 등)과 무관하게, 아미드 결합에 의해 공유 연결된 적어도 2개의 아미노산의 중합체를 나타내기 위해 본원에서 상호교환가능하게 사용된다. 이 정의 내에 포함되는 것은 D- 및 L-아미노산, 및 D- 및 L-아미노산의 혼합물이다.
본원에 사용된 바와 같은 용어 "약"은 특정한 값에 대한 허용가능한 오차를 의미한다. 일부 예에서, "약"은 주어진 값 범위의 하단 및 상단에서 0.05%, 0.5%, 1.0%, 또는 2.0% 내를 의미한다. pH에 관하여, "약"은 플러스 또는 마이너스 0.5를 의미한다.
본원에 사용된 바와 같은 "실질적으로 순수한" 폴리펩티드 또는 "정제된" 단백질은 폴리펩티드 종이 존재하는 우세한 종인 (즉, 몰 또는 질량 기준으로 그것이 조성물에서의 임의의 다른 개별적 거대분자 종보다 더 풍부한) 조성물을 지칭하며, 일반적으로 대상 종이 몰 또는 % 중량으로 존재하는 거대분자 종의 적어도 약 50 퍼센트를 포함하는 경우 실질적으로 정제된 조성물이다. 그러나, 일부 실시양태에서, 폴리펩티드를 포함하는 조성물은 50% 미만 (예를 들어, 약 10%, 약 20%, 약 30%, 약 40%, 또는 약 50%) 순수한 폴리펩티드를 포함한다. 일반적으로, 실질적으로 순수한 폴리펩티드 조성물은 조성물에 존재하는 몰 또는 % 중량으로 모든 거대분자 종의 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 및 약 98% 이상을 포함한다. 일부 실시양태에서, 폴리펩티드는 본질적인 균질성까지 정제되며 (즉, 오염물 종이 통상적인 검출 방법에 의해 조성물에서 검출될 수 없음), 여기서 조성물은 본질적으로 단일 거대분자 종으로 이루어진다. 용매 종, 소분자 (<500 달톤), 및 원소 이온 종은 거대분자 종으로 간주되지 않는다. 일부 실시양태에서, 단리된 폴리펩티드는 실질적으로 순수한 폴리펩티드 조성물이다.
본원에 사용된 바와 같은 효소의 "개선된 특성"은 효소의 적어도 1종의 개선된 특성을 지칭한다. 일부 실시양태에서, 본 발명은 각각 참조 PPM, PNP, DERA, PanK, AcK, SP 또는 GOase 폴리펩티드, 및/또는 각각 야생형 PPM, PNP, DERA, PanK, AcK, SP 또는 GOase 폴리펩티드, 및/또는 각각 또 다른 조작된 PPM, PNP, DERA, PanK, AcK, SP 또는 GOase 폴리펩티드에 비해 임의의 효소 특성의 개선을 나타내는 조작된 PPM, PNP, DERA, PanK, AcK, SP 및/또는 GOase 폴리펩티드를 이용한다. 따라서, "개선"의 수준은 야생형, 뿐만 아니라 조작된 폴리펩티드를 비롯한 다양한 폴리펩티드 사이에 결정되고 비교될 수 있다. 개선된 특성은 증가된 단백질 발현, 의도된 생성물의 증가된 생산, 증가된 기질 특이성 또는 친화도 (즉, 기질에 대한 증가된 활성), 증가된 열활성, 증가된 열안정성, 증가된 pH 활성, 증가된 안정성, 증가된 효소적 활성, 증가된 특이적 활성, 기질 또는 최종-생성물 억제에 대한 증가된 저항성, 증가된 화학적 안정성, 개선된 화학선택성, 개선된 용매 안정성, 산성 pH에 대한 증가된 내성, 단백질분해적 활성에 대한 증가된 내성 (즉, 단백질분해에 대한 감소된 민감성), 감소된 응집, 증가된 용해도, 및 변경된 온도 프로파일과 같은 특성을 포함하나, 이에 제한되지는 않는다. 추가의 실시양태에서, 상기 용어는 PPM, PNP, DERA, PanK, AcK, SP 및/또는 GOase 효소의 적어도 1종의 개선된 특성에 관하여 사용된다. 일부 실시양태에서, 본 발명은 각각 참조 PPM, PNP, DERA, PanK, AcK, SP 및/또는 GOase 폴리펩티드; 및/또는 야생형 폴리펩티드, 및/또는 각각 또 다른 조작된 PPM, PNP, DERA, PanK, AcK, SP 및/또는 GOase 폴리펩티드에 비해 임의의 효소 특성의 개선을 나타내는 조작된 PPM, PNP, DERA, PanK, AcK, SP 및/또는 GOase 폴리펩티드를 이용한다. 따라서, "개선"의 수준은 야생형, 뿐만 아니라 조작된 폴리펩티드를 비롯한 다양한 폴리펩티드 사이에 결정되고 비교될 수 있다.
본원에 사용된 바와 같은 "전환" ("conv" 또는 "conv.")은 기질(들)의 상응하는 생성물(들)로의 효소적 전환 (또는 생물전환)을 지칭한다. "퍼센트" 전환은 특정된 조건 하에서 시간의 기간 내에 생성물로 전환되는 기질의 퍼센트를 지칭한다. 따라서, 폴리펩티드의 "효소적 활성" 또는 "활성"은 특정된 시간의 기간에서 기질의 생성물로의 퍼센트 전환으로서 표현될 수 있다.
본원에 사용된 바와 같은 "입체선택성"은 또 다른 것에 비해 하나의 입체이성질체의 화학적 또는 효소적 반응에서의 우선적 형성을 지칭한다. 입체선택성은 하나의 입체이성질체의 형성이 다른 것에 비해 선호되는 경우 부분적일 수 있거나, 이는 단지 하나의 입체이성질체가 형성되는 경우 완전할 수 있다. 입체이성질체가 거울상이성질체인 경우, 입체선택성은 거울상선택성, 둘 다의 합계 중 하나의 거울상이성질체의 분율 (전형적으로 백분율로서 보고됨)로 지칭된다. 이는 통상적으로 대안적으로 관련 기술분야에서 식 [주 거울상이성질체 - 부 거울상이성질체]/[주 거울상이성질체 + 부 거울상이성질체]에 따라 그로부터 계산되는 거울상이성질체 과량 ("e.e.")으로서 (전형적으로 백분율로서) 보고된다. 입체이성질체가 부분입체이성질체인 경우, 입체선택성은 부분입체선택성, 2개의 부분입체이성질체의 혼합물 중 하나의 부분입체이성질체의 분율 (전형적으로 백분율로서 보고됨)로 지칭되며, 통상적으로 대안적으로 부분입체이성질체 과량 ("d.e.")으로 보고된다. 거울상이성질체 과량 및 부분입체이성질체 과량은 입체이성질체 과량의 유형이다.
본 공정 발명은 조작된 PPM, PNP, DERA, PanK, AcK, SP 및 GOase 폴리펩티드, 특히 서열식별번호 1 내지 21을 갖는 것들, 및 서열식별번호 1 내지 21의 각각의 보존적으로 변형된 변이체로 지칭될 수 있는 1개 이상의 보존적 아미노산 치환을 포함하는 상기 서열의 사용을 포괄한다.
본원에 사용된 바와 같은 "보존적" 아미노산 치환은 변화가 단백질의 생물학적 활성을 변경시키지 않으면서 빈번히 이루어질 수 있도록, 유사한 특징 (예를 들어 산성, 염기성, 양으로 또는 음으로 하전된, 극성 또는 비-극성, 측쇄 크기, 소수성/친수성, 백본 형태 및 강성 등)을 갖는 다른 아미노산으로의 단백질에서의 아미노산의 치환을 지칭한다. 이는 동일하거나 유사한 한정된 부류의 아미노산 내의 상이한 아미노산으로의 폴리펩티드에서의 아미노산의 1개 이상의 치환을 포함한다. 관련 기술분야의 통상의 기술자는 일반적으로 폴리펩티드의 비-필수 영역에서의 단일 아미노산 치환이 생물학적 활성을 실질적으로 변경시키지 않음을 인식한다 (예를 들어, 문헌 [Watson et al. (1987) Molecular Biology of the Gene, The Benjamin/Cummings Pub. Co., p. 224 (4th Ed.)] 참조). 또한, 구조적으로 또는 기능적으로 유사한 아미노산의 치환은 생물학적 활성을 방해할 가능성이 적다. 예로서 및 제한 없이, 일부 실시양태에서, 지방족 측쇄를 갖는 아미노산은 또 다른 지방족 아미노산 (예를 들어, 알라닌, 발린, 류신, 및 이소류신)으로 치환되고/거나; 히드록실 측쇄를 갖는 아미노산은 히드록실 측쇄를 갖는 또 다른 아미노산 (예를 들어, 세린 및 트레오닌)으로 치환되고/거나; 방향족 측쇄를 갖는 아미노산은 방향족 측쇄를 갖는 또 다른 아미노산 (예를 들어, 페닐알라닌, 티로신, 및 히스티딘)으로 치환되고/거나; 염기성 측쇄를 갖는 아미노산은 염기성 측쇄를 갖는 또 다른 아미노산 (예를 들어, 리신 및 아르기닌)으로 치환되고/거나; 산성 측쇄를 갖는 아미노산은 산성 측쇄를 갖는 또 다른 아미노산 (예를 들어, 아스파르트산 또는 글루탐산)으로 치환되고/거나; 소수성 또는 친수성 아미노산은 각각 또 다른 소수성 또는 친수성 아미노산으로 대체된다. 추가의 예시적인 보존적 아미노산 치환은 표 1에 제시된다.
표 1. 예시적인 보존적 아미노산 치환
Figure pct00017
용어 "아미노산 치환 세트" 또는 "치환 세트"는 참조 서열에 비해 폴리펩티드 서열에서의 아미노산 치환의 그룹을 지칭한다. 치환 세트는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 이상의 아미노산 치환을 가질 수 있다.
"기능적 단편"은 아미노-말단 및/또는 카르복시-말단 결실(들) 및/또는 내부 결실을 갖지만, 나머지 아미노산 서열은 그것이 비교되고 있는 서열 (예를 들어, 본 발명에 사용되는 전장 조작된 PPM, PNP, DERA, PanK, AcK, SP 또는 GOase 효소)에서의 상응하는 위치와 동일하고, 전장 폴리펩티드의 실질적으로 모든 활성을 보유하는 폴리펩티드를 지칭한다.
본원에 사용된 바와 같은 "결실"은 참조 폴리펩티드로부터 1개 이상의 아미노산의 제거에 의한 폴리펩티드에 대한 변형을 지칭한다. 결실은 효소적 활성을 보유하고/거나 조작된 PPM, PNP, DERA, PanK, AcK, SP 또는 GOase 효소의 개선된 특성을 보유하면서, 참조 효소를 구성하는 아미노산의 총 수의 10% 까지, 또는 아미노산의 총 수의 20%까지, 1개 이상의 아미노산, 2개 이상의 아미노산, 5개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산, 또는 20개 이상의 아미노산의 제거를 포함할 수 있다. 결실은 폴리펩티드의 내부 부분 및/또는 말단 부분에 지정될 수 있다. 다양한 실시양태에서, 결실은 연속적 절편을 포함할 수 있거나, 불연속적일 수 있다. 결실은 전형적으로 아미노산 서열에서 "-"에 의해 지시된다.
본원에 사용된 바와 같은 "삽입"은 참조 폴리펩티드로부터 1개 이상의 아미노산의 부가에 의한 폴리펩티드에 대한 변형을 지칭한다. 삽입은 폴리펩티드의 내부 부분에 있거나, 카르복시 또는 아미노 말단에 대한 것일 수 있다. 본원에 사용된 바와 같은 삽입은 관련 기술분야에 공지된 바와 같이 융합 단백질을 포함한다. 삽입은 아미노산의 인접한 절편이거나, 천연 발생 폴리펩티드에서 1개 이상의 아미노산에 의해 분리될 수 있다.
본원에 사용된 추가의 두문자어 및 약어는 하기와 같다:
Figure pct00018
실험 절차
2-에티닐-2-히드록시프로판-1,3-디일 디아세테이트 (2)의 제조
방법 A:
Figure pct00019
THF (1000 mL) 중 디아세톡시아세톤 (1) (159 g, 914.0 mmol)의 -35 ℃ 용액에 THF 중 에티닐 마그네슘 클로라이드의 0.5 M 용액 1600 mL을 온도를 -20 ℃ 미만으로 유지하면서 첨가하였다. 반응이 완결에 도달한 후, 400 mL 메틸 tert-부틸 에테르 (MTBE) 중 아세트산 (78 mL)을 온도를 -20 ℃ 미만으로 유지하면서 적가하였다. 그 후, MTBE (800 mL)를 첨가하고, 혼합물을 실온으로 가온하였다. 물 (1000 mL) 중 포화 NaCl, 이어서 물 (1050 mL) 중 포화 NH4Cl 용액을 첨가하였다. 유기 층을 분리하고, Na2SO4 상에서 건조시키고, 증발시켜 화합물 (2)를 오일 (160 g, 88%)로서 얻었다. 1H NMR (CDCl3, 500 MHz): δ 4.26 (dd, 4 H), 2.55 (s, 1H), 2.14 (s, 6H).
2-에티닐-프로판-1,2,3-트리올 (3)의 제조
방법 B:
Figure pct00020
에탄올 중 2-에티닐-2-히드록시프로판-1,3-디일 디아세테이트 (2) (70 g, 350 mmol)의 용액에 메탄올 중 나트륨 메톡실레이트의 0.5M 용액 (69.9 mL, 35.0 mmol)을 실온 (rt)에서 첨가하였다. 반응물을 rt에서 2시간 (h) 동안 교반하여 완결에 도달하였다. 용매를 증발시키고, 잔류물을 100 mL 물에 재-용해시키고, 3 x 50 mL MTBE로 추출하였다. 수성 층을 질소로 살포하여 잔류의 용매를 제거하여 핵 자기 공명 (NMR) (내부 표준물로서 말레산)에 의해 결정 시, 2-에티닐-프로판-1,2,3-트리올 (3) (108 g, 100% 수율)의 40.9% 용액을 얻었다. 1H NMR (D2O, 500 MHz): δ 3.60 (dd, 4 H), 2.85 (s, 1H).
( R )-2-에티닐-글리세르알데히드 (4)의 교대적 제조
방법 C1:
Figure pct00021
교반된 반응기에서, 발포방지제 204 (시그마(Sigma) A6426, 1 방울 ~ 20 μL)를 함유하는 인산나트륨 완충액 (30 mL, 100 mM, pH 7.0) 중 2-에티닐-프로판-1,2,3-트리올 (3) (1.1 g, 9.47 mmol)을 12.5 sccm에서 공기 살포하면서 30 ℃로 가온하였다. 인산나트륨 완충액 (5 mL 100 mM, pH 7.0)에 용해된 갈락토스 옥시다제 (GOase, 서열식별번호: 1) (250 mg), 서양고추냉이 퍼옥시다제* (유형 I, 5 mg) 및 소 카탈라제** (5 mg)를 반응기에 첨가하고, 이어서 CuSO4 수용액 (100 mM, 150 μL)을 첨가하였다. 반응 혼합물을 600 rpm에서 공기 살포하면서 47h 동안 교반하여 (R)-2-에티닐-글리세르알데히드 (4)를 47% 전환율 (NMR에 의해) 및 72% e.e.로 얻었다. (생성물은 단리하지 않았다). 1H NMR (D2O, 500 MHz): δ 4.29 (s, 1H), 3.65 (dd, 2H), 2.83 (s, 1H).
* 서양고추냉이 퍼옥시다제: 서양고추냉이 뿌리 (아모라시아 루스티카나(Amoracia rusticana))로부터 단리된 시그마 (P8125)로부터 시판되는 서양고추냉이 유형 I로부터의 야생형 퍼옥시다제.
** 소 카탈라제: 시그마 (C1345)로부터 시판되는 소 공급원으로부터의 헴-의존성 카탈라제
방법 C2:
Figure pct00022
탈이온수 (56.2 kg)로 충전된 교반된 100 L 재킷형 반응기에서, 인산이수소나트륨 (1.212 kg, 10 몰)을 첨가하였다. pH를 25 ℃에서 10 N 수산화나트륨 용액 (852.6 g)을 사용하여 7.02로 조정하였다. 반응기를 발포방지제 204 (A6426, 10 mL), 이어서 CuSO4·5H2O (6.5 g)로 충전하였다. 갈락토스 옥시다제 (451.2 g) (서열식별번호: 10)를 첨가하고, 공기로 살포하면서 15분 동안 교반하였다. 서양고추냉이 퍼옥시다제* (200.2 g) 및 카탈라제** (502.6 g)를 첨가하고, 반응기를 물 (2.0 kg)로 세정하였다. 다음으로, 물 중 2-에티닐-프로판-1,2,3-트리올 (3) 용액 (9.48%, 30.34 kg, 24.72 mol)을 첨가하고, 이어서 추가의 부분의 발포방지제 204 (A6426, 10 mL)를 첨가하였다. 반응물을 공기로 살포하고, 밤새 교반하여 (R)-2-에티닐-글리세르알데히드 (4) 94.0 kg을 66% 전환율 (NMR에 의해) 및 84% e.e.로 얻었다. 검정 수율 60%: 1H NMR (D2O, 500 MHz): δ 4.29 (s, 1H), 3.65 (dd, 2H), 2.83 (s, 1H).
* 서양고추냉이 퍼옥시다제: 서양고추냉이 뿌리 (아모라시아 루스티카나)로부터 단리된 토요보(Toyobo) (PEO-301)로부터 시판되는 정제된 서양고추냉이로부터의 야생형 퍼옥시다제.
** 소 카탈라제: 시그마 (C1345)로부터 시판되는 소 공급원으로부터의 헴-의존성 카탈라제.
상기 반응을 또한 갈락토스 옥시다제 (서열식별번호: 11)를 사용하여 수행하고, 생성물 (4)을 67% 전환율 (NMR에 의해) 및 88% e.e. 및 검정 수율 59%로 얻었다: 1H NMR (D2O, 500 MHz): δ 4.29 (s, 1H), 3.65 (dd, 2H), 2.83 (s, 1H).
방법 C3:
Figure pct00023
살포기 및 유동 제어기가 구비된 100 mL 이지맥스(EasyMax) 용기에서, 물 (82 mL) 및 PIPES 칼륨 완충액 (5mL, 0.5 M)을 충전하였다. pH를 25℃에서 5 M KOH 용액을 사용하여 7.5로 조정하였다. 발포방지제 204 (200 μL), 이어서 개량된 갈락토스 옥시다제 (서열식별번호: 17, 450 mg 효소 분말) 및 구리(II) 술페이트 펜타히드레이트 (100 μL, 100 mM)를 첨가하였다. 반응 혼합물을 125 분 당 표준 입방 센티미터 (sccm)로 15분 동안 공기로 살포하였다. 소 카탈라제 (C1345, 시그마-알드리치(Sigma-Aldrich), 150 mg, 2000-5000 U/mg, 0.75 MU), 이어서 서양고추냉이 퍼옥시다제 (HRP, 토요보 PEO-301, 100 mg, 130 U/mg, 1.3 kU) 및 2-에티닐-프로판-1,2,3-트리올 (3)의 수용액 (25 중량%, 12 mL, 25.8 mmol)을 충전하였다. 반응 혼합물을 30 ℃에서 에어레이션하면서 125 sccm에서 교반하고, 이지샘플러(EasySampler)를 사용하여 20h에 걸쳐 샘플링하여 70% 전환율을 얻고, 화합물 (4) ((R)-2-에티닐-글리세르알데히드)를 58% 검정 수율 및 99% e.e.로 형성하였다. 1H NMR (D2O, 500 MHz): δ 4.29 (s, 1H), 3.65 (dd, 2H), 2.83 (s, 1H). 조 반응 스트림을 후속 인산화 단계로 직접적으로 운반하였다.
방법 C4: 고정화된 갈락토스 옥시다제로의 산화
Figure pct00024
효소 고정화 절차:
누비아(Nuvia) IMAC Ni-충전된 수지 (침전된 부피를 기준으로 16 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (10 컬럼 부피, 160 mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하여 수지 저장 용액을 제거하였다. 용기에서 개량된 갈락토스 옥시다제 (서열식별번호: 17, 2.00 g) 동결건조된 분말을 구리 (II) 술페이트 용액 (100 μM; 5.00 mL)에 재현탁시키고, 이어서 결합 완충액 (50 mL) 및 수지를 첨가하였다. 용액을 20 ℃에서 5h 동안 회전 혼합기를 사용하여 혼합하였다. 수지를 여과하고, 결합 완충액 (10 컬럼 부피, 160 mL) 및 칼륨 PIPES 완충액 (10 컬럼 부피, 160 mL; 50 mM, pH 7.5)으로 세척하고, 이를 반응에 직접적으로 사용하였다.
반응 절차:
살포기 및 유동 제어기가 구비된 100 mL 이지맥스 용기에서, 물 (82 mL) 및 PIPES 칼륨 완충액 (5mL, 1 M)을 충전하였다. pH를 25℃에서 5 M KOH 용액을 사용하여 7.5로 조정하였다. 발포방지제 204 (200 μL), 이어서 수지 상에 고정화된 개량된 갈락토스 옥시다제 (서열식별번호: 17, 6 mL 수지 당 750 mg 효소 분말) 및 구리(II) 술페이트 펜타히드레이트 (100 μL, 100 mM)를 첨가하였다. 반응 혼합물을 125 분 당 표준 입방 센티미터 (sccm)에서 15분 동안 공기로 살포하였다. 소 카탈라제 (C1345, 시그마-알드리치, 210 mg, 2000-5000 U/mg, 1.05 MU), 이어서 서양고추냉이 퍼옥시다제 (HRP, 토요보 PEO-301, 100 mg, 130 U/mg, 1.3 kU) 및 2-에티닐-프로판-1,2,3-트리올 (3)의 수용액 (25 중량%, 13 mL, 29.4 mmol)을 충전하였다. 반응 혼합물을 25 ℃에서 에어레이션하면서 125 sccm에서 교반하였다. 22h 후, 반응은 91% 전환율에 도달하여 200 mM (R)-2-에티닐-글리세르알데히드 (4) 용액 (100 mL, 68% 검정 수율, 97% e.e.)를 얻었다. 1H NMR (D2O, 500 MHz): δ 4.29 (s, 1H), 3.65 (dd, 2H), 2.83 (s, 1H). 조 반응 스트림을 후속 인산화 단계로 직접적으로 운반하였다.
방법 C5: 아미날 (8)의 형성을 통한 알데히드의 임의적 단리
단계 1: ( S )-2-(1,3-디벤질이미다졸리딘-2-일)부트-3-인-1,2-디올의 제조
Figure pct00025
질소 버블러, 기계식 교반기 및 열전대가 구비된 100 L 재킷형 원통형 용기를 (R)-2-에티닐-글리세르알데히드 ((4), 26.0 kg, 1.85 중량% 알데히드, 3.64 mol)를 함유하는 조 옥시다제 반응 스트림으로 충전하고, N2 분위기로 불활성화시켰다. 수용액을 20 ℃로 가온하고, N,N-디메틸도데칸-1-아민 옥시드 (DDAO) (물 중 30 중량%, 798 g, 0.96 mol;), 이어서 MTBE (55.3 kg, 76 L) 및 N,N'-디벤질에탄-1,2-디아민 (1.55 kg, 6.43 mol)을 첨가하였다. 갈색 2상 혼합물을 질소 분위기 하에서 20 ℃에서 밤새 교반하였다. 17시간 후, 교반을 중지하고, 유기 상을 제거하고, 버렸다. (S)-2-(1,3-디벤질이미다졸리딘-2-일)부트-3-인-1,2-디올 (56.5 kg, 2.02 중량% 아미날, 3.39 mmol, 93% 검정 수율)의 밝은 갈색 MTBE 용액을 얻었다.
6개의 유사한 MTBE 용액을 단일 증류 및 결정화 단계로 함께 프로세싱하였다 (총 374.4 kg의 용액, 7.91 kg 아미날을 함유함).
기계식 교반기, 증류 헤드 (-20 ℃에서 응축기) 및 열전대가 구비된 50 L 재킷형 원통형 용기를 아미날 용액 (45 L)으로 충전하였다. 진공을 용기에 적용하고 (65-95 토르), 재킷을 40 ℃로 설정하였다. 용매를 35 L의 부피가 도달될 때까지 증류에 의해 제거하였다. 이 시점에서, 내부 온도는 6.1 ℃였으며, 회백색 고체가 결정화되기 시작하였다. 나머지 MTBE 용액을 35-40 L의 일정한 부피 및 0-10 ℃의 내부 온도를 유지하면서 서서히 첨가하였다. 모든 MTBE 용액이 첨가되었으면, 부피를 25 L로 감소시켰다. 증류를 중지하고, 용기를 질소로 불활성화시키고, 재킷 온도를 10 ℃로 감소시켰다. 생성된 담황색 현탁액을 이 온도에서 2시간 동안 숙성시키고, 고체를 여과에 의해 수집하였다. 필터 케이크를 차가운 (-2℃) MTBE (12.7 kg)로 세척한 후, 질소 유동 하에서 7시간 동안 건조시켰다. (S)-2-(1,3-디벤질이미다졸리딘-2-일)-부트-3-인-1,2-디올을 회백색 결정질 고체 (5.75 kg)로서 얻었다. 1H NMR (500 MHz, DMSO-d 6) δ 7.42 - 7.35 (m, 4H), 7.32 (td, J = 7.5, 1.6 Hz, 4H), 7.27 - 7.21 (m, 2H), 5.10 (t, J = 5.6 Hz, 1H), 5.03 (s, 1H), 4.28 (d, J = 13.3Hz, 1H), 4.16 (d, J = 13.3 Hz, 1H), 3.76 (s, 1H), 3.70 - 3.58 (m, 4H), 3.21 (d, J = 0.9 Hz, 1H), 2.90 - 2.80 (m, 2H), 2.60 - 2.51 (m, 2H).13C NMR (126 MHz, DMSO-d 6) δ 140.0, 140.0, 128.5, 128.3, 128.2, 128.1, 126.8, 126.8, 88.6, 86.9, 75.0, 74.0, 66.4, 60.7, 60.5, 50.4, 50.3, 39.5. HR-MS (ESI) 아미날 (M + H+) C21H25N2O2 + 계산치 337.1911; 실측치 337.1922.
단계 2: 아미날 ( 8 )로부터의 ( R )-2-에티닐-글리세르알데히드 ( 4 )의 제조
Figure pct00026
질소 버블러 및 기계식 교반기가 구비된 4 L 재킷형 원통형 용기를 TsOH·H2O (12.0 g, 63.1 mmol), 물 (60 mL), (S)-2-(1,3-디벤질이미다졸리딘-2-일)부트-3-인-1,2-디올 (110 g, 327 mmol) 및 MTBE (1700 mL)로 충전하였다. 2상 혼합물을 질소 하에서 정치하고, 재킷 온도를 15 ℃로 설정하였다. 물 (600 mL) 중 TsOH·H2O (114 g, 599.3 mmol)의 용액을 오버헤드 교반하면서 (200 rpm) 1.5 시간에 걸쳐 적가하였다. 첨가가 완결된 후, 재킷 온도를 5 ℃로 하강시키고, 생성된 슬러리를 1시간 동안 숙성시켰다. 고체를 여과에 의해 제거하고, 차가운 물 (270 mL)로 세척하였다. 2상 용액을 분리 깔대기로 옮기고, 유기 상을 제거하고, 버렸다. 수성 상을 200 sccm의 속도에서 24시간 동안 N2로 살포하면서 도웩스™ 마라톤™ A 수지 (히드록시드 형태, 11.0 g) 및 암벌리스트® 15 수지 (수소 형태, 11.0 g)로 처리하여 잔류의 MTBE를 제거하였다. 수지를 여과에 의해 제거하여 (R)-2-히드록시-2-(히드록시메틸)부트-3-이날 (774 g, 4.6 중량% 알데히드, 82% 수율)의 무색 수용액을 얻었다. 1H NMR (500 MHz, D2O) δ 5.01 (s, 1H), 3.77 (d, J = 11.7 Hz, 1H), 3.73 (d, J = 11.7 Hz, 1H), 2.92 (s, 1H). 13C NMR (126 MHz, D2O) δ 129.4, 125.4, 90.3, 81.0, 76.0, 73.9, 65.3. HRMS (ESI) 알데히드 이량체 (2M + Na+) C10H12NaO6 + 계산치 251.0526; 실측치 251.0530.
( R )-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 교대적 제조:
방법 D1: 아세테이트 키나제: ATP-재생 시스템
Figure pct00027
교반된 반응기에서, HEPES 완충액 (66 mM, pH 7.5, 30 mL) 중 아데노신 디포스페이트 디나트륨 염 (40 mg, 0.087 mmol) 및 염화마그네슘 (38 mg, 0.400 mmol)의 용액에 (R)-2-에티닐-글리세르알데히드 (4) (1.9 mL, 물 중 210 g/L 용액, 3.51 mmol), 이어서 아세테이트 키나제 (서열식별번호: 3) (40 mg), 및 판토테네이트 키나제 (서열식별번호: 2) (120 mg)를 첨가하였다. 반응 혼합물을 25 ℃로 가온하고, HEPES 완충액 (50 mM, pH 7.5, 10 mL) 중 아세틸 포스페이트 리튬 칼륨 염 (1.3 g, 7.01 mmol)의 용액을 5M 수산화나트륨을 사용하여 7.5에서 유지된 pH로 4시간에 걸쳐 적가하였다. 반응물을 18시간 동안 교반하여 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)를 85% 전환율 (HPLC에 의해)로 얻었다 (생성물은 단리하지 않았다). 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
방법 D2: 피루베이트 옥시다제 ATP-재생 시스템
Figure pct00028
교반된 반응기에서, 76 mL 물 pH 7.5 중 피루브산나트륨 (3.11 g, 28 mmol) 및 인산 (0.523 mL, 7.71 mmol)의 용액을 (R)-2-에티닐-글리세르알데히드 (4) (3.8 mL, 물 중 210 g/L 용액, 7.01 mmol), 아데노신 디포스페이트 디나트륨 염 (80 mg, 0.174 mmol), 티아민 피로포스페이트 (40 mg, 0.086 mmol), 플라빈 아데닌 디뉴클레오티드 디나트륨 염 히드레이트 (64 mg, 0.077 mmol), 및 염화마그네슘 (400 μL, 물 중 1 M 용액, 0.4 mmol)으로 충전하였다. pH를 5M 수성 수산화나트륨으로 7.5로 재-조정하고, 반응 부피를 물로 80 mL로 재-조정하였다. 아세테이트 키나제 (서열식별번호: 3) (80 mg), 피루베이트 옥시다제 (서열식별번호: 4) (80 mg, 동결건조된 무세포 추출물), 판토테네이트 키나제 (서열식별번호: 2) (400 mg), 및 카탈라제 (800 μL, 황산암모늄 현탁액 CAT-101, 바이오카탈리틱스(Biocatalytics))를 첨가하였다. 반응물을 500 rpm 및 30 ℃에서 공기 살포하면서 72시간 동안 교반하여 (R)-2-에티닐-글리세르알데히드 3-포스페이트 5를 95% 전환율 (HPLC에 의해)로 얻었다 (생성물은 단리하지 않았다). 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
상기 반응을 또한 판토테네이트 키나제 (서열식별번호: 13)를 사용하여 수행하고, 생성물 5를 66% 전환율로 얻었다. (생성물은 단리하지 않았다). 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H).
방법 D3: 아세테이트 키나제: 고정화된 효소를 사용한 ATP-재생 시스템
Figure pct00029
효소 고정화 절차:
누비아™ 고정화된 금속-이온 친화도 크로마토그래피 (IMAC) 니켈-충전된 수지 (침전된 부피를 기준으로 168 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (1.6 L; 500 mM 염화나트륨, 50 mM 인산나트륨, pH 8.0)으로 세척하였다. 용기에서, 판토테네이트 키나제 (8.4 g) (서열식별번호: 12) 및 아세테이트 키나제 (2.8 g) (서열식별번호: 3)를 결합 완충액 (500 mL)에 용해시켰다. 세척된 수지를 용기에 충전하고, 용액을 20 ℃에서 4시간 동안 교반하였다. 수지를 여과하고, 먼저 결합 완충액 (1.6 L), 이어서 피페라진-N,N'-비스(2-에탄술폰산) (PIPES) 완충액 (840 mL; 50 mM, pH 6.5)으로 세척하였다. 세척된 수지를 다음 단계에 직접적으로 사용하였다.
반응 절차:
1 L 반응기에, 물 중 (R)-2-에티닐-글리세르알데히드 (4) (608.7 g, 4.6 중량%, 212 mmol)의 용액을 충전하고, 5 ℃로 냉각시켰다. 냉각된 용액에 피페라진-N,N'-비스(2-에탄술폰산) (PIPES) 완충액 (32.7 mL, 1 M, pH 6.5, 32.7 mmol), 염화마그네슘 (9.33 mL, 1 M, 9.33 mmol), 아세틸 포스페이트 디암모늄 염 (51.8 g, 265 mmol), 아데노신 디포스페이트 디나트륨 염 히드레이트 (1.17 g, 2.12 mmol), 및 물 (192 mL)을 첨가하였다. 용액을 교반하고, pH를 5 N KOH를 사용하여 6.4로 조정하였다. 반응물을 20 ℃로 가온하고, 공동-고정화된 판토테네이트 키나제 (서열식별번호: 12) 및 아세테이트 키나제 (서열식별번호: 3)를 갖는 수지 168 mL를 첨가하였다. 반응물을 6.4의 pH를 유지하는데 사용된 5 N KOH와 함께 10시간 동안 교반하여 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)를 92% 전환율 (HPLC에 의해) 및 91% 수율 (내부 표준물로서 테트라페닐포스포늄 클로라이드로의 31P NMR에 의해)로 얻었다 (생성물은 단리하지 않았다). 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
4-에티닐-D-2-데옥시리보스 5-포스페이트 (6)의 제조
방법 E:
Figure pct00030
물 중 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5) (5, 20 mL, 5.3 mmol)의 용액에, 물 중 아세트알데히드 (40 중량%, 2.02 mL, 15.9 mmol)의 용액을 실온에서 첨가하고, 이어서 데옥시리보스-포스페이트 알돌라제 (DERA) (서열식별번호: 6), 트리에탄올아민 히드로클로라이드 완충액 (1 mL, 1 M, pH 7.0) 중 25 mg 용액을 첨가하였다. 반응기를 밀봉하고, 혼합물을 30 ℃ 및 600 rpm에서 밤새 교반하여 4-에티닐-D-2-데옥시리보스 5-포스페이트 (6)를 99% conv. 및 99% e.e., 99% d.e.로 1:1 아노머 혼합물로서 얻었다 (생성물은 단리하지 않았다). α-아노머: 1H NMR (D2O, 600 MHz) δ 5.31 (t, 1H), 4.13 (t, 1H), 3.81-3.72 (m, 2H), 2.89 (s, 1H), 2.42-2.34 (m, 1H), 1.87-1.79 (m, 1H); 13C NMR (D2O, 151 MHz) δ 97.7 (s), 81.4 (d), 79.4 (s), 78.9 (s), 71.1 (s), 67.7 (d), 39.6 (s). β-아노머: 1H NMR (D2O, 600 MHz) δ 5.40 (dd, 1H), 4.28 (t, 1H), 3.88-3.80 (m, 2H), 2.87 (s, 1H), 2.13-2.06 (m, 1H), 2.04-1.97 (m, 1H); 13C NMR (D2O, 151 MHz) δ 97.3 (s), 82.2 (d), 78.7 (s), 78.5 (s), 71.3 (s), 68.4 (d), 39.6 (s). LC-MS: (ES, m/z): C7H10O7P에 대한 계산치 (M-H): 237.0; 실측치 237.0
(2 R ,3 S ,5 R )-5-(6-아미노-2-플루오로-9H-퓨린-9-일)-2-에티닐-2-(히드록시메틸)테트라히드로푸란-3-올 모노히드레이트 (7) [대안적 명칭 4'-에티닐-2-플루오로-2'-데옥시아데노신 또는 EFdA]의 교대적 제조
방법 F1:
Figure pct00031
암모늄 ((2R,3S)-2-에티닐-3,5-디히드록시테트라히드로푸란-2-일)메틸 수소 포스페이트 (1.00 g, 3.91 mmol)를 pH 7.5 완충액 (5 mM MnCl2를 함유하는 100 mM 트리에탄올아민·HCl) 10 mL에 용해시켰다. 용액 pH를 5 N NaOH로 7.3으로 조정하였다. 용액에 2-플루오로아데닌 (0.599 g, 3.91 mmol) 및 수크로스 (2.68 g, 7.82 mmol)를 첨가하였다. 효소 용액을 포스포펜토뮤타제 (서열식별번호: 8) (100 mg), 퓨린 뉴클레오시드 포스포릴라제 (서열식별번호: 9) (50 mg), 및 수크로스 포스포릴라제 (서열식별번호: 7) (10 mg)를 pH 7.5 완충액 10 mL에 용해시킴으로써 제조하였다. 효소 용액을 시약 혼합물에 첨가하고, 생성된 현탁액을 40 ℃에서 진탕하였다. 20h 후, 현탁액을 0 ℃로 냉각시키고, 여과하고, 차가운 물로 세정하였다. 고체를 흡인 건조시켜 표제 화합물 (1.12 g, 92%)을 단일 이성질체로서 얻었다.
1H NMR: (300 MHz, DMSO-d6, ppm): δ 7.68 (br s, 2H), 7.32 (d, J = 2.0 Hz, 1H), 6.44 (t, J = 5.8 Hz, 1H), 5.52 (d, J = 5.6 Hz, 1H), 5.27 (t, J = 6.0 Hz, 1H), 4.44 (q, J = 6.4 Hz, 1H), 3.60 (q, J = 6.0 Hz, 1H), 3.53 (q, J = 6.4 Hz, 1H), 3.48 (s, 1H), 2.48-2.41 (m, 1H), 2.37-2.30 (m, 1H). 13C NMR (150.92 MHz, DMSO-d6, ppm) δ 158.5 (d, JCF = 203.5), 157.6 (d, JCF = 21.2), 150.2 (d, JCF = 20.2), 139.7 (d, JCF = 2.4), 117.4 (d, JCF = 4.0), 85.1, 82.0, 81.4, 78.7, 70.1, 64.2, 38.1. LC-MS: (ES, m/z): C12H12FN5O3에 대한 계산치 (M+Na): 316.0822; 실측치 316.0818.
이 단계에 사용된 PPM 및 PNP 효소는 각각 이. 콜라이 (에스케리키아 콜라이(Escherichia coli))로부터의 효소로부터 시작하여 돌연변이로부터 유래되었다. 이 단계에 사용된 수크로스 포스포릴라제 (SP)는 알로스카르도비아 옴니콜렌스(Alloscardovia omnicolens)로부터 유래되었으며; 다른 유기체로부터 유래된 SP는 또한 사용될 수 있다.
방법 F2:
Figure pct00032
약 5.5 내지 6.0의 pH에서의 피페라진-N,N'-비스(2-에탄술폰산) (PIPES) 완충액을 함유하는 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5) (950 mL, 157 mmol)의 수용액에 트리에탄올아민 (7.09 g, 47.5 mmol)을 첨가하였다. 용액의 pH를 수산화칼륨 (8 mL, 8M)을 사용하여 7.1 내지 7.6으로 조정하였다. 망간(II) 클로라이드 히드레이트 (0.592 g, 4.70 mmol), 이어서 수크로스 (161 g, 470 mmol)를 첨가하여, 7.5의 pH를 얻었다. 용액에 하기 효소를 첨가하였다: 데옥시리보스-포스페이트 알돌라제 (서열식별번호: 14) (461 mg), 수크로스 포스포릴라제 (서열식별번호: 7) (494 mg), 포스포펜토뮤타제 (서열식별번호: 8)(2.63 g), 및 퓨린 뉴클레오시드 포스포릴라제 (서열식별번호: 15) (659 mg). 효소가 용해되었으면, 2-플루오로아데닌 (19.80 g, 125 mmol)을 첨가하였다. 반응물을 35 ℃로 가열하고, 아세트알데히드를 첨가하였다 (이소프로필 알콜 중 40 중량%, 29.8 mL, 235 mmol). 2h 동안 반응시킨 후, 혼합물을 EFdA 결정질 생성물 (0.96 g, 2 mol%)로 시딩하였다. 35 ℃에서 26 h에 걸쳐 반응시킨 후, 슬러리를 0 ℃로 냉각시키고, 고체를 물 (40 mL ea.)로 2회 세척하면서 여과에 의해 수집하였다. 고체를 질소 스위프 하에서 건조시켰다. 수득량 43.2 g, 92 중량%, 96.2% 보정됨. 1H NMR: (300 MHz, DMSO-d6, ppm): δ 7.68 (br s, 2H), 7.32 (d, J = 2.0 Hz, 1H), 6.44 (t, J = 5.8 Hz, 1H), 5.52 (d, J = 5.6 Hz, 1H), 5.27 (t, J = 6.0 Hz, 1H), 4.44 (q, J = 6.4 Hz, 1H), 3.60 (q, J = 6.0 Hz, 1H), 3.53 (q, J = 6.4 Hz, 1H), 3.48 (s, 1H), 2.48-2.41 (m, 1H), 2.37-2.30 (m, 1H). 13C NMR (150.92 MHz, DMSO-d6, ppm) δ 158.5 (d, JCF = 203.5), 157.6 (d, JCF = 21.2), 150.2 (d, JCF = 20.2), 139.7 (d, JCF = 2.4), 117.4 (d, JCF = 4.0), 85.1, 82.0, 81.4, 78.7, 70.1, 64.2, 38.1. LC-MS: (ES, m/z): C12H12FN5O3에 대한 계산치 (M+Na): 316.0822; 실측치 316.0818.
( S )-2-에티닐-프로판-1,2,3-트리올 l 1-포스페이트 (9)의 교대적 제조:
방법 G1: 효소 서열식별번호: 2 및 서열식별번호: 3을 사용한 아세테이트 키나제: ATP-재생 시스템
Figure pct00033
50 mL 반응기를 물 (9.29 g, 9.46 중량%, 7.57 mmol) 중 2-에티닐-프로판-1,2,3-트리올 (3)의 용액, 칼륨 PIPES 완충액 (1.02 mL, 1 M, pH 6.5, 1.02 mmol), 염화마그네슘 (292 μL, 1 M, 0.292 mmol), 아세틸 포스페이트 디암모늄 염 (1.851 g, 89 중량%, 9.46 mmol), 아데노신 디포스페이트 디나트륨 염 히드레이트 (ADP, 42 mg, 0.076 mmol, 0.01 eq), 및 물 (28 mL)로 충전하였다. pH를 5 M KOH를 사용하여 6.4로 조정하고, 용액을 20 ℃로 가온하고, 개량된 판토테네이트 키나제 PanK 서열식별번호: 2 (264 mg) 및 아세테이트 키나제 AcK 서열식별번호: 3 (88 mg)을 첨가하였다. 반응물을 5 N KOH를 사용하여 6.4에서 유지된 pH로 16시간 동안 교반하였다. 최종 반응 내용물은 >95% e.e. 및 99% 전환율 (31P NMR에 의해)로 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9)를 제공하였다. 생성물은 단리하지 않았다. 1H NMR (D2O, 500 MHz) δ 3.89 (m, 2H), 3.72 (d, J = 11.6 Hz, 1 H), 3.65 (d, J = 11.6 Hz, 1H), 2.93 (s, 1H). 13C NMR (D2O, 126 MHz) δ 82.9 (s), 75.1 (s), 71.0 (d, J = 6.9 Hz), 67.0 (d, J = 4.5 Hz), 64.7 (s). 31P NMR (D2O, 202 MHz) δ 3.39. HRMS: (ESI, m/z): [M-1]- C5H8O6P에 대한 계산치: 195.0058; 실측치 195.0068 [M-H]-: 195.0058.
방법 G2: 효소 서열식별번호: 20 및 효소 서열식별번호: 21을 사용한 아세테이트 키나제: ATP-재생 시스템
Figure pct00034
재킷형 반응기에 수용액 2-에티닐-프로판-1,2,3-트리올 (3) (11.47 kg, 8.7 중량%, 8.61 mol) 및 물 (7.5kg), 이어서 1M BIS-TRIS 메탄 완충액 pH 6.5 (1L) 및 염화마그네슘 (41.4 g)을 충전하였다. ATP (48g, 0.086 mol, 0.01 당량) 및 디암모늄 아세틸 포스페이트 (2.021 kg, 89%, 10.33 mmol)를 첨가하고, 용액을 20 ℃까지 가온하고, 용액의 pH를 KOH (270.4 g)를 사용하여 6.8로 재-조정하였다. 그 후, 개량된 판토테네이트 키나제 서열식별번호: 20 (20.4 g) 및 개량된 아세테이트 키나제 서열식별번호: 21 (3 g)을 고체로서 충전하였다. 반응물을 20 ℃에서 16h 동안 교반하고, 그 동안 pH를 5.5로 강하시켰다. 정량적 전환율의 2-에티닐-프로판-1,2,3-트리올 (3)을 1H 및 31P NMR에 의해 판단된 바와 같이 얻었다. 이렇게 제조된 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9) 용액 (397 mM, 22.5 kg, 98% 수율)을 임의의 추가의 정제 없이 후속 산화 단계에 사용하였다. 1H NMR (D2O, 500 MHz) δ 3.89 (m, 2H), 3.72 (d, J = 11.6 Hz, 1 H), 3.65 (d, J = 11.6 Hz, 1H), 2.93 (s, 1H).
방법 G3: 절대 입체화학을 할당하고 비대칭화 인산화를 입증하기 위한 중수소화된 화합물 (3)을 갖는 효소 서열식별번호: 20 및 효소 서열식별번호: 21을 사용한 아세테이트 키나제: ATP-재생 시스템.
Figure pct00035
개량된 판토테네이트 키나제 서열식별번호: 20 (물 중 10 g/L 용액 100 μL) 및 개량된 아세테이트 키나제 서열식별번호: 21 (물 중 2g/L 용액 100 μL)을 pH 6.5에서의 물 (800 μL) 중 디암모늄 아세틸 포스페이트 (41 mg), 2-에티닐-프로판-1,1-d2-1,2,3-트리올 ((R)-3-d2, 20 mg, 170 μmol), 염화마그네슘 (물 중 1 M 용액 10 μL), ADP (물 중 100 g/L 용액 10 μL), 및 인산나트륨 완충액 (물 중 1 M 용액 10 μL)을 함유하는 용액에 첨가하였다. 반응물을 rt에서 24h 동안 인큐베이션하여 중수소화된 2-에티닐-프로판-1,2,3-트리올 1-포스페이트 유사체 (S)-9-( 3,3-d2 ) 및 (S)-9-( 1,1-d2 )를 95:5 비 및 99% 전체 수율로 얻었다. 인산화된 화합물의 비는 31P NMR에 의해 ~95:5인 것으로 결정되었으며, 이는 프로-(S) 히드록실 기에서의 2-에티닐-프로판-1,2,3-트리올 (3)의 입체선택적 인산화 (즉, 비대칭 인산화)를 확인시켜 준다. 1H NMR (D2O, 500 MHz) δ 3.89 (m, 2H), 3.72 (d, J = 11.6 Hz, 1 H), 3.65 (d, J = 11.6 Hz, 1H), 2.93 (s, 1H). 13C NMR (D2O, 126 MHz) δ 82.9 (s), 75.1 (s), 71.0 (d, J = 6.9 Hz), 67.0 (d, J = 4.5 Hz), 64.7 (s).
방법 G4: 고정화된 효소 서열식별번호: 20 및 효소 서열식별번호: 21을 사용한 아세테이트 키나제: ATP-재생 시스템
Figure pct00036
효소 고정화 절차:
누비아 IMAC Ni-충전된 수지 (침전된 부피를 기준으로 75 mL)를 필터 깔대기에 첨가하고, 물 (9 컬럼 부피, 3 x 225 mL) 및 결합 완충액 (1 컬럼 부피, 75mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하였다. 용기에서 판토테네이트 키나제 (서열식별번호: 20, 6.0 g) 동결건조된 분말을 결합 완충액 (200 mL)에 재현탁시키고, 세척된 수지를 첨가하였다. 용액을 회전 혼합기를 사용하여 25℃에서 6h 동안 혼합하였다. 수지를 여과하고, 결합 완충액 (6 컬럼 부피, 6 x 225 mL) 및 BIS-TRIS 완충액 (8 컬럼 부피, 600 mL; 50 mM, pH 6.2)으로 세척하였다.
반응 절차:
2-에티닐-프로판-1,2,3-트리올 (3) (574 g, 8.7 중량%, 0.430 mol) 및 물 (350 mL)의 수용액, 이어서 1M BIS-TRIS 메탄 완충액 pH 6.5 (50 mL) 및 염화마그네슘 (2.033 g, 0.01 mol)을 재킷형 반응기에 충전하였다. ATP (2.37g, 0.0043 mol, 0.01 당량) 및 디암모늄 아세틸 포스페이트 (101 g, 89%, 0.530 mmol, 1.2 eq)를 첨가하고, 용액을 20 ℃까지 가온하고, 용액의 pH를 5 M KOH를 사용하여 6.8로 재-조정하였다. 그 후, 고정화된 판토테네이트 키나제 서열식별번호: 20 (25 mL) 및 개량된 아세테이트 키나제 서열식별번호: 21 (0.15 g)을 갖는 수지를 고체로서 충전하였다. 반응물을 20 ℃에서 16h 동안 교반하고, 그 동안 pH를 5.5로 강하시켰다. 정량적 전환율의 2-에티닐-프로판-1,2,3-트리올 (3) 대 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9)를 1H 및 31P NMR에 의해 판단된 바와 같이 얻었다. 1H NMR (D2O, 500 MHz) δ 3.89 (m, 2H), 3.72 (d, J = 11.6 Hz, 1 H), 3.65 (d, J = 11.6 Hz, 1H), 2.93 (s, 1H).
( R )-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 교대적 제조:
방법 H1 : 고정화된 갈락토스 옥시다제 서열식별번호: 16
Figure pct00037
효소 고정화 절차:
누비아 IMAC Ni-충전된 수지 (침전된 부피를 기준으로 10 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (10 컬럼 부피, 100 mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하여 수지 저장 용액을 제거하고, 세척된 수지 16 g을 얻었다. 용기에서 개량된 갈락토스 옥시다제 (서열식별번호: 16, 750 mg) 동결건조된 분말을 구리 (II) 술페이트 용액 (100 μM; 5.00 mL)에 재현탁시키고, 이어서 결합 완충액 (20 mL) 및 세척된 수지 (3.0g)를 첨가하였다. 용액을 회전 혼합기에서 20 ℃에서 5h 동안 혼합하였다. 수지를 여과하고, 결합 완충액 (10 컬럼 부피, 100 mL) 및 BIS-TRIS 완충액 (10 컬럼 부피, 100 mL; 50 mM, pH 7.5)으로 세척하고, 이를 글리코실화 반응에 직접적으로 사용하였다.
반응 절차:
고정화된 갈락토스 옥시다제 서열식별번호: 16 (3.0 g)을 갖는 수지를 BIS-TRIS 메탄 완충액 (35 mM, 7.2로 조정된 pH) 중 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9, 5.4 mmol, 270 mM, 20 mL)의 용액에 첨가하고, 이어서 물 (30 μL, 100 mM) 중 구리 (II) 술페이트 용액, 및 물 (600 μL)에 재현탁된 서양고추냉이 퍼옥시다제 (PEO-301, 18 mg) 및 소 카탈라제 (C1345, 120 mg)를 첨가하였다. 반응을 기체 투과성 막으로 밀봉하고, 22℃에서 4일 동안 격렬하게 진탕하여 77%의 최종 전환율에 도달하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)를 95% e.e.로 얻었다. 효소 수지를 여과하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 용액을 글리코실화 반응에 직접적으로 사용하였다. 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
방법 H2: 고정화된 갈락토스 옥시다제 서열식별번호: 17
Figure pct00038
효소 고정화 절차:
누비아 IMAC Ni-충전된 수지 (침전된 부피를 기준으로 10 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (10 컬럼 부피, 100 mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하여 수지 저장 용액을 제거하고, 세척된 수지 16g을 얻었다. 용기에서, 개량된 갈락토스 옥시다제 (서열식별번호: 16, 750 mg) 동결건조된 분말을 구리 (II) 술페이트 용액 (100 μM; 5.00 mL)에 재현탁시키고, 이어서 결합 완충액 (20 mL) 및 세척된 수지 (3.0g)를 첨가하였다. 용액을 회전 혼합기를 사용하여 20 ℃에서 5h 동안 혼합하였다. 수지를 여과하고, 결합 완충액 (10 컬럼 부피, 100 mL) 및 BIS-TRIS 메탄 완충액 (10 컬럼 부피, 100 mL; 50 mM, pH 7.5)으로 세척하고, 이를 반응에 직접적으로 사용하였다.
반응 절차:
고정화된 개량된 갈락토스 옥시다제 서열식별번호: 17 (3.0 g)을 갖는 수지를 BIS-TRIS 메탄 완충액 (35 mM, 7.2로 조정된 pH) 중 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 (9, 5.4 mmol, 270 mM, 20 mL)의 용액에 첨가하고, 이어서 물 (30 μL, 100 mM) 중 구리 (II) 술페이트 용액, 및 물 (600 μL)에 재현탁된 서양고추냉이 퍼옥시다제 (PEO-301, 18 mg) 및 소 카탈라제 (C1345, 120 mg)를 첨가하였다. 반응을 기체 투과성 막으로 밀봉하고, 22℃에서 4일 동안 격렬하게 진탕하여 77%의 최종 전환율에 도달하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)를 95% e.e.로 얻었다. 효소 수지를 여과하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 용액을 글리코실화 반응에 직접적으로 사용하였다. 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
방법 H3: 고정화된 갈락토스 옥시다제 서열식별번호: 18
Figure pct00039
효소 고정화 절차:
누비아 IMAC Ni-충전된 수지 (침전된 부피를 기준으로 3 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (10 컬럼 부피, 30 mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하여 수지 저장 용액을 제거하고, 세척된 수지 2.4 g을 얻었다. 바이알에서 개량된 갈락토스 옥시다제 (서열식별번호: 18, 75mg) 동결건조된 분말을 구리 (II) 술페이트 용액 (100 μM; 1.00 mL)에 재현탁시키고, 이어서 결합 완충액 (5 mL) 및 세척된 수지 (400 mg)를 첨가하였다. 용액을 회전 혼합기를 사용하여 20 ℃에서 5h 동안 혼합하였다. 수지를 여과하고, 결합 완충액 (10 컬럼 부피, 4 mL) 및 BIS-TRIS 메탄 완충액 (10 컬럼 부피, 4 mL; 50 mM, pH 7.5)으로 세척하고, 이를 반응에 직접적으로 사용하였다.
반응 절차:
고정화된 개량된 GOase 서열식별번호: 18 (400 mg)을 BIS-TRIS 메탄 완충액 (35 mM, 7.2로 조정된 pH) 중 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 용액 ((9), 5.4 mmol, 270 mM, 1 mL)의 용액에 첨가하고, 이어서 물 (100 μL)에 재현탁된 서양고추냉이 퍼옥시다제 (PEO-301, 1 mg) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)으로부터의 카탈라제 (로슈(Roche), 동결건조물, #11650645103, 3 mg)를 첨가하였다. 반응을 기체 투과성 막으로 밀봉하고, 30℃에서 48h 동안 격렬하게 진탕하였다. 2일 후에 최종 전환율은 90% 전환율 및 (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5) >99% e.e.에 도달하였다. 효소 수지를 여과하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 용액을 추가의 정제 없이 직접적으로 사용하였다. 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
방법 H4: 고정화된 갈락토스 옥시다제 서열식별번호: 19
Figure pct00040
효소 고정화 절차:
누비아 IMAC Ni-충전된 수지 (침전된 부피를 기준으로 3 mL)를 필터 깔대기에 첨가하고, 결합 완충액 (10 컬럼 부피, 30 mL; 500 mM 염화나트륨, 50 mM 인산나트륨, 15 mM 이미다졸, pH 8.0)으로 세척하여 수지 저장 용액을 제거하고, 세척된 수지 2.4 g을 얻었다. 바이알에서 개량된 갈락토스 옥시다제 (서열식별번호: 19, 75mg) 동결건조된 분말을 구리 (II) 술페이트 용액 (100 μM; 1.00 mL)에 재현탁시키고, 이어서 결합 완충액 (5 mL) 및 세척된 수지 (400 mg)를 첨가하였다. 용액을 회전 혼합기를 사용하여 20 ℃에서 5h 동안 혼합하였다. 수지를 여과하고, 결합 완충액 (10 컬럼 부피, 4 mL) 및 BIS-TRIS 메탄 완충액 (10 컬럼 부피, 4 mL; 50 mM, pH 7.5)으로 세척하고, 이를 반응에 직접적으로 사용하였다.
반응 절차:
고정화된 개량된 GOase 서열식별번호: 18 (400 mg)을 BIS-TRIS 메탄 완충액 (35 mM, 7.2로 조정된 pH) 중 (S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트 용액 (9, 5.4 mmol, 270 mM, 1 mL)의 용액에 첨가하고, 이어서 물 (100 μL)에 재현탁된 서양고추냉이 퍼옥시다제 (PEO-301, 1 mg) 및 코리네박테리움 글루타미쿰으로부터의 카탈라제 (로슈, 동결건조물, #11650645103, 3 mg)를 첨가하였다. 반응을 기체 투과성 막으로 밀봉하고, 30 ℃에서 48h 동안 격렬하게 진탕하였다. 2일 후의 최종 전환율은 100% 전환율에 도달하였으며, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)를 >99% e.e.로 얻었다. 효소 수지를 여과하고, (R)-2-에티닐-글리세르알데히드 3-포스페이트 (5)의 용액을 추가의 정제 없이 직접적으로 사용하였다. 1H NMR (D2O, 400 MHz): δ 5.02 (s, 1H), 4.00 (dq, 2 H), 2.88 (s, 1H). LC-MS: (ES, m/z): C5H7O6P에 대한 계산치 (M-H): 193.1; 실측치 193.0.
"아미노산"은 본원에서 IUPAC-IUB 생화학 명명법 위원회에 의해 권고된 그들의 통상적으로 공지된 1-문자 기호에 의해 지칭된다. 본원의 설명의 목적을 위해, 본원의 방법에 사용되는 효소에 대한 유전적으로 코딩된 아미노산에 사용되는 부호는 표 2에서 통상적이다:
표 2
Figure pct00041
본원에 기재된 EFdA를 합성하는 공정에서 및 본원에 기재된 실험 절차에서 예시된 공정 단계에서 이용된, 또는 이용될 수 있는 효소에 대한 서열식별번호는 표 3에서의 것들로 제공되지만, 이에 제한되지는 않는다.
표 3
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
서양고추냉이 퍼옥시다제: 서양고추냉이 뿌리 (아모라시아 루스티카나)로부터 단리된 시그마 (P8125)로부터 시판되는 서양고추냉이 유형 I로부터의 야생형 퍼옥시다제.
카탈라제: (1) 시그마 (C1345)로부터 시판되는 소 간으로부터의; 또는 (2) CAT-101, 바이오카탈리틱스; 또는 (3) 코리네박테리움 글루타미쿰 (로슈, #11650645103)으로부터의 야생형 카탈라제.
본 발명의 추가의 실시양태는 4'-에티닐 2'-데옥시 뉴클레오시드 또는 그의 유사체, 예를 들어, EFdA를 생산하기 위한 본원에 기재된 합성 공정 단계에서 하기 효소의 사용을 포함하나, 이에 제한되지는 않는다.
A. 퓨린 뉴클레오시드 포스포릴라제.
1A. 서열식별번호: 9 또는 서열식별번호: 15와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 퓨린 뉴클레오시드 포스포릴라제이며, 여기서 상기 조작된 퓨린 뉴클레오시드 포스포릴라제의 폴리펩티드 서열은 서열식별번호: 9 또는 서열식별번호: 15에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 퓨린 뉴클레오시드 포스포릴라제.
2A. 상기 조작된 퓨린 뉴클레오시드 포스포릴라제가 서열식별번호: 9 또는 서열식별번호: 15와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 1A의 조작된 퓨린 뉴클레오시드 포스포릴라제.
3A. 서열식별번호: 9 또는 서열식별번호: 15에 제시된 바와 같은 폴리펩티드 서열로 구성된 조작된 퓨린 뉴클레오시드 포스포릴라제.
A4. 야생형 이. 콜라이 퓨린 뉴클레오시드 포스포릴라제에 비해 적어도 1종의 개선된 특성을 포함하는 1A 내지 3A 중 어느 하나의 조작된 퓨린 뉴클레오시드 포스포릴라제.
5A. 상기 개선된 특성이 야생형 이. 콜라이 퓨린 뉴클레오시드 포스포릴라제에 비해 기질 화합물 6.5 (그의 고리 형태로 또는 개방 쇄 알데히드 또는 히드레이트, 또는 상기 중 임의의 것의 염으로서)에 대한 개선된 활성을 포함하는 것인 4A의 조작된 퓨린 뉴클레오시드 포스포릴라제.
6A. 상기 개선된 특성이 야생형 이. 콜라이 퓨린 뉴클레오시드 포스포릴라제에 비해 EFdA (화합물 7)의 개선된 생산을 포함하는 것인 4A의 조작된 퓨린 뉴클레오시드 포스포릴라제.
7A. 상기 조작된 퓨린 뉴클레오시드 포스포릴라제가 정제된 것인 A1 내지 6A 중 어느 하나의 조작된 퓨린 뉴클레오시드 포스포릴라제.
8A. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 1A 내지 7A 중 어느 하나의 조작된 퓨린 뉴클레오시드 포스포릴라제.
B. 포스포펜토뮤타제.
1B. 서열식별번호: 8과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 포스포펜토뮤타제이며, 여기서 상기 조작된 포스포펜토뮤타제의 폴리펩티드 서열은 서열식별번호: 8에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 포스포펜토뮤타제.
2B. 상기 조작된 포스포펜토뮤타제가 서열식별번호: 8과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 1B의 조작된 포스포펜토뮤타제.
3B. 서열식별번호: 8에 제시된 바와 같은 폴리펩티드 서열로 구성된 조작된 포스포펜토뮤타제.
4B. 야생형 이. 콜라이 포스포펜토뮤타제에 비해 적어도 1종의 개선된 특성을 포함하는 1B 내지 3B 중 어느 하나의 조작된 포스포펜토뮤타제.
5B. 상기 개선된 특성이 야생형 이. 콜라이 포스포펜토뮤타제에 비해 기질 화합물 6 (그의 고리 형태로 또는 개방 쇄 알데히드 또는 히드레이트, 또는 상기 중 임의의 것의 염으로서)에 대한 개선된 활성을 포함하는 것인 4B의 조작된 포스포펜토뮤타제.
6B. 상기 개선된 특성이 야생형 이. 콜라이 포스포펜토뮤타제에 비해 화합물 6.5 또는 화합물 7 (EFdA)의 개선된 생산을 포함하는 것인 4B의 조작된 포스포펜토뮤타제.
7B. 상기 조작된 포스포펜토뮤타제가 정제된 것인 1B 내지 6B 중 어느 하나의 조작된 포스포펜토뮤타제.
8B. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 1B 내지 7B 중 어느 하나의 조작된 포스포펜토뮤타제.
C. 데옥시리보스-포스페이트 알돌라제.
1C. 서열식별번호: 5에 제시된 바와 같은 슈와넬라 할리팍센시스 폴리펩티드 서열로부터의 야생형으로 구성된 데옥시리보스-포스페이트 알돌라제.
2C. 서열식별번호: 6 또는 서열식별번호: 14에 제시된 바와 같은 폴리펩티드 서열로 구성된 조작된 데옥시리보스-포스페이트 알돌라제.
3C. 조작된 데옥시리보스-포스페이트 알돌라제이며, 여기서 상기 조작된 데옥시리보스-포스페이트 알돌라제는 서열식별번호: 5, 서열식별번호: 6 또는 서열식별번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 조작된 데옥시리보스-포스페이트 알돌라제.
4C. 서열식별번호: 5, 서열식별번호: 6 또는 서열식별번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 데옥시리보스-포스페이트 알돌라제이며, 여기서 상기 조작된 데옥시리보스-포스페이트 알돌라제의 폴리펩티드 서열은 서열식별번호: 5, 서열식별번호: 6 또는 서열식별번호: 14에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 데옥시리보스-포스페이트 알돌라제.
5C. 기질 화합물 5 ((R)-2-에티닐-글리세르알데히드 3-포스페이트, 그의 히드레이트 또는 상기 중 어느 하나의 염)에 대한 활성을 갖는 1C 내지 4C 중 어느 하나의 데옥시리보스-포스페이트 알돌라제.
6C. 반응 동안 기질 화합물 5 ((R)-2-에티닐-글리세르알데히드 3-포스페이트, 그의 히드레이트, 또는 상기 중 어느 하나의 염) 상의 보호기에 대한 필요 없이 화합물 6 (4-에티닐-D-2-데옥시리보스 5-포스페이트, 또는 그의 개방 쇄 알데히드 또는 히드레이트 형태, 또는 상기 중 임의의 것의 염)을 생산하는 능력을 포함하는 1C 내지 5C 중 어느 하나의 데옥시리보스-포스페이트 알돌라제.
7C. 데옥시리보스-포스페이트 알돌라제가 야생형 슈와넬라 할리팍센시스 데옥시리보스-포스페이트 알돌라제에 비해 화합물 6 (4-에티닐-D-2-데옥시리보스 5-포스페이트, 또는 그의 개방 쇄 알데히드 또는 히드레이트 형태, 또는 상기 중 임의의 것의 염)의 개선된 생산을 포함하는 개선된 특성을 갖는 것인 2C 내지 6C 중 어느 하나의 조작된 데옥시리보스-포스페이트 알돌라제.
8C. 상기 데옥시리보스-포스페이트 알돌라제가 정제된 것인 1C 내지 7C 중 어느 하나의 데옥시리보스-포스페이트 알돌라제.
9C. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 2C 내지 7C 중 어느 하나의 조작된 데옥시리보스-포스페이트 알돌라제.
D. 판토테네이트 키나제.
1D. 서열식별번호: 2, 서열식별번호: 12, 서열식별번호: 13 또는 서열식별번호: 20과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 판토테네이트 키나제이며, 여기서 상기 조작된 판토테네이트 키나제의 폴리펩티드 서열은 서열식별번호: 2, 서열식별번호: 12, 서열식별번호: 13 또는 서열식별번호: 20에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 판토테네이트 키나제.
2D. 상기 조작된 판토테네이트 키나제가 서열식별번호: 2, 서열식별번호: 12, 서열식별번호: 13 또는 서열식별번호: 20과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 1D의 조작된 판토테네이트 키나제.
3D. 서열식별번호: 2, 서열식별번호: 12, 서열식별번호: 13 또는 서열식별번호: 20에 제시된 바와 같은 폴리펩티드 서열로 구성된 조작된 판토테네이트 키나제.
4D. 야생형 이. 콜라이 판토테네이트 키나제에 비해 적어도 1종의 개선된 특성을 포함하는 1D 내지 3D 중 어느 하나의 조작된 판토테네이트 키나제.
5D. 상기 개선된 특성이 야생형 이. 콜라이 판토테네이트 키나제에 비해 기질 화합물 4 ((R)-2-에티닐-글리세르알데히드 또는 그의 히드레이트 형태)에 대한 개선된 활성을 포함하는 것인 4D의 조작된 판토테네이트 키나제.
6D. 상기 개선된 특성이 야생형 판토테네이트 키나제에 비해 화합물 5 ((R)-2-에티닐-글리세르알데히드 3-포스페이트)의 개선된 생산을 포함하는 것인 5D의 조작된 판토테네이트 키나제.
7D. 상기 개선된 특성이 야생형 이. 콜라이 판토테네이트 키나제에 비해 기질 화합물 3 (2-에티닐-프로판-1,2,3-트리올)에 대한 개선된 활성을 포함하는 것인 4D의 조작된 판토테네이트 키나제.
8D. 상기 개선된 특성이 야생형 판토테네이트 키나제에 비해 화합물 9 ((S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트)의 개선된 생산을 포함하는 것인 7D의 조작된 판토테네이트 키나제.
9D. 상기 판토테네이트 키나제가 정제된 것인 1D 내지 8D 중 어느 하나의 조작된 판토테네이트 키나제.
10D. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 1D 내지 9D 중 어느 하나의 조작된 판토테네이트 키나제.
E. 갈락토스 옥시다제.
1E. 서열식별번호: 1, 10, 11, 16, 17, 18 또는 19와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 갈락토스 옥시다제이며, 여기서 상기 조작된 갈락토스 옥시다제의 폴리펩티드 서열은 서열식별번호: 1, 10, 11, 16, 17, 18 또는 19에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 갈락토스 옥시다제.
2E. 상기 조작된 갈락토스 옥시다제가 서열식별번호: 1, 10, 11, 16, 17, 18 또는 19와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 1E의 조작된 갈락토스 옥시다제.
3E. 서열식별번호: 1, 10, 11, 16, 17, 18 또는 19에 제시된 바와 같은 폴리펩티드 서열로 구성된 조작된 갈락토스 옥시다제.
4E. 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 적어도 1종의 개선된 특성을 포함하는 1E 내지 3E 중 어느 하나의 조작된 갈락토스 옥시다제.
5E. 상기 개선된 특성이 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 1차 알콜인 기질에 대한 개선된 활성을 포함하는 것인 4E의 조작된 갈락토스 옥시다제.
6E. 상기 개선된 특성이 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 기질 화합물 3 (2-에티닐-프로판-1,2,3-트리올)에 대한 개선된 활성을 포함하는 것인 4E의 조작된 갈락토스 옥시다제.
7E. 상기 개선된 특성이 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 화합물 4 ((R)-2-에티닐-글리세르알데히드 또는 그의 히드레이트 형태)의 개선된 생산을 포함하는 것인 6E의 조작된 갈락토스 옥시다제.
8E. 상기 개선된 특성이 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 기질 화합물 9 ((S)-2-에티닐-프로판-1,2,3-트리올 1-포스페이트)에 대한 개선된 활성을 포함하는 것인 4E의 조작된 갈락토스 옥시다제.
9E. 상기 개선된 특성이 야생형 에프. 그라미네아룸 갈락토스 옥시다제에 비해 화합물 5 ((R)-2-에티닐-글리세르알데히드 3-포스페이트 또는 그의 히드레이트 형태)의 개선된 생산을 포함하는 것인 8E의 조작된 갈락토스 옥시다제.
10E. 상기 갈락토스 옥시다제가 정제된 것인 1E 내지 9E 중 어느 하나의 조작된 갈락토스 옥시다제.
11E. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 1E 내지 10E 중 어느 하나의 조작된 갈락토스 옥시다제.
F. 아세테이트 키나제.
1F. 서열식별번호: 3 또는 서열식별번호: 21에 제시된 바와 같은 써모토가 마리티마 폴리펩티드 서열로부터의 야생형으로 구성된 아세테이트 키나제.
2F. 상기 조작된 아세테이트 키나제가 서열식별번호: 3 또는 서열식별번호: 21과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함하는 것인 조작된 아세테이트 키나제.
3F. 서열식별번호: 3 또는 서열식별번호: 21과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 폴리펩티드 서열, 또는 그의 기능적 단편을 포함하는 조작된 아세테이트 키나제이며, 여기서 상기 조작된 아세테이트 키나제의 폴리펩티드 서열은 서열식별번호: 3 또는 서열식별번호: 21에 비해 적어도 1개의 아미노산 치환 또는 아미노산 치환 세트를 포함하는 것인 조작된 아세테이트 키나제.
4F. 야생형 티. 마리티마 아세테이트 키나제에 비해 적어도 1종의 개선된 특성을 포함하는 2F 또는 3F의 아세테이트 키나제.
5F. 상기 개선된 특성이 야생형 써모토가 마리티마 아세테이트 키나제에 비해 기질 화합물 4 ((R)-2-에티닐-글리세르알데히드 또는 그의 히드레이트 형태)에 대한 인산화 반응에서의 ATP-보조인자 재사용에 대한 개선된 활성을 포함하는 것인 4F의 아세테이트 키나제.
6F. 상기 개선된 특성이 야생형 써모토가 마리티마 아세테이트 키나제에 비해 화합물 5 ((R)-2-에티닐-글리세르알데히드 3-포스페이트 또는 그의 히드레이트 형태 또는 상기 중 어느 하나의 염)의 개선된 생산을 포함하는 것인 5F의 아세테이트 키나제.
7F. 상기 개선된 특성이 야생형 써모토가 마리티마 아세테이트 키나제에 비해 기질 화합물 3 (2-에티닐-프로판-1,2,3-트리올)에 대한 인산화 반응에서의 ATP-보조인자 재사용에 대한 개선된 활성을 포함하는 것인 4F의 아세테이트 키나제.
8F. 상기 개선된 특성이 야생형 써모토가 마리티마 아세테이트 키나제에 비해 화합물 9 ((S)-2- 에티닐-프로판-1,2,3-트리올 1-포스페이트 또는 상기 중 어느 하나의 염)의 개선된 생산을 포함하는 것인 7F의 아세테이트 키나제.
9F. 상기 아세테이트 키나제가 정제된 것인 1F 내지 8F 중 어느 하나의 아세테이트 키나제.
10F. 적어도 1개의 아미노산 치환 (즉, 1개 이상의 아미노산 치환(들))이 보존적 아미노산 치환(들)인 2F 내지 7F 중 어느 하나의 조작된 아세테이트 키나제.
SEQUENCE LISTING <110> Merck Sharp & Dohme Corp. Huffman, Mark A. Fryszkowska, Anna Kolev, Joshua N. Devine, Paul N. Campos, Kevin R. Truppo, Matthew Nawrat, Christopher C. <120> ENZYMATIC SYNTHESIS OF 4'-ETHYNYL NUCLEOSIDE ANALOGS <130> 24608-WO-PCT <150> 62/695508 <151> 2018-07-09 <150> 62/822320 <151> 2019-03-22 <160> 21 <170> PatentIn version 3.5 <210> 1 <211> 657 <212> PRT <213> Fusarium graminearum <400> 1 Met Ala Ser Ala Pro Ile Gly Ser Ala Ile Pro Arg Asn Asn Trp Ala 1 5 10 15 Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Asn Lys Ala Ile 20 25 30 Asp Gly Asn Lys Asp Thr Phe Trp His Thr Phe Tyr Gly Ala Asn Gly 35 40 45 Asp Pro Lys Pro Pro His Thr Tyr Thr Ile Asp Met Lys Thr Thr Gln 50 55 60 Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn 65 70 75 80 Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Thr Asn 85 90 95 Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr 100 105 110 Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val 115 120 125 Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile 130 135 140 Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly 145 150 155 160 Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ala Ala Ala Ala 165 170 175 Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Asn 180 185 190 Asp Ala Phe Glu Gly Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp 195 200 205 Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Lys 210 215 220 His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile 225 230 235 240 Val Val Asp Glu Thr Ala Thr Gly Gly Asn Asp Ala Lys Lys Thr Ser 245 250 255 Leu Tyr Asp Ser Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln 260 265 270 Val Ala Arg Gly Tyr Gln Ser Ser Ala Thr Met Ser Asp Gly Arg Val 275 280 285 Phe Thr Ile Gly Gly Ser Phe Ser Gly Gly Arg Val Glu Lys Asn Gly 290 295 300 Glu Val Tyr Ser Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala 305 310 315 320 Lys Val Asn Pro Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser 325 330 335 Asp Asn His Ala Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln 340 345 350 Ala Gly Pro Ser Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly 355 360 365 Asp Val Lys Ser Ala Gly Lys Arg Gln Ser Asn Arg Gly Val Ala Pro 370 375 380 Asp Ala Met Cys Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys 385 390 395 400 Ile Leu Thr Phe Gly Gly Ser Pro Asp Tyr Glu Asp Ser Asp Ala Thr 405 410 415 Thr Asn Ala His Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn 420 425 430 Thr Val Phe Ala Ser Asn Gly Leu Tyr Phe Ala Arg Thr Phe His Thr 435 440 445 Ser Val Val Leu Pro Asp Gly Ser Thr Phe Ile Thr Gly Gly Gln Arg 450 455 460 Arg Gly Ile Pro Thr Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile 465 470 475 480 Tyr Val Pro Glu Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile 485 490 495 Val Arg Ala Tyr His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val 500 505 510 Phe Asn Gly Gly Gly Gly Leu Cys Gly Asp Cys Thr Thr Asn His Phe 515 520 525 Asp Ala Gln Ile Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn 530 535 540 Leu Ala Thr Arg Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Lys 545 550 555 560 Val Gly Gly Arg Ile Thr Ile Ser Thr Asp Ser Ser Ile Ser Lys Ala 565 570 575 Ser Leu Ile Arg Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln 580 585 590 Arg Arg Ile Pro Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser 595 600 605 Phe Gln Val Pro Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met 610 615 620 Leu Phe Val Met Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile 625 630 635 640 Arg Val Thr Gln Gly Gly Gly Gly Ser Trp Ser His Pro Gln Phe Glu 645 650 655 Lys <210> 2 <211> 316 <212> PRT <213> Escherichia coli <400> 2 Met Ser Ile Lys Glu Gln Thr Leu Met Thr Pro Tyr Leu Gln Phe Asp 1 5 10 15 Arg Asn Gln Trp Ala Ala Leu Arg Asp Ser Val Pro Met Thr Leu Ser 20 25 30 Glu Asp Glu Ile Ala Arg Leu Lys Gly Ile Asn Glu Asp Leu Ser Leu 35 40 45 Glu Glu Val Ala Glu Ile Tyr Leu Pro Leu Ser Arg Leu Leu Asn Phe 50 55 60 Tyr Ile Ser Ser Asn Leu Arg Arg Gln Ala Val Leu Glu Gln Phe Leu 65 70 75 80 Gly Thr Asn Gly Gln Arg Ile Pro Tyr Ile Ile Ser Ile Ala Gly Ser 85 90 95 Val Ala Val Gly Lys Ser Thr Thr Ala Arg Val Leu Gln Ala Leu Leu 100 105 110 Ser Arg Trp Pro Glu His Arg Arg Val Glu Leu Ile Thr Thr Asp Gly 115 120 125 Phe Leu His Pro Asn Gln Val Leu Lys Glu Arg Gly Leu Met Lys Lys 130 135 140 Lys Gly Phe Pro Glu Ser Tyr Asp Met His Arg Leu Val Lys Phe Val 145 150 155 160 Ser Asp Leu Lys Ser Gly Val Pro Asn Val Thr Ala Pro Val Tyr Ser 165 170 175 His Leu Ile Tyr Asp Val Ile Pro Asp Gly Asp Lys Thr Val Val Gln 180 185 190 Pro Asp Ile Leu Ile Leu Glu Gly Leu Asn Val Leu Gln Ser Gly Met 195 200 205 Asp Tyr Pro His Asp Pro His His Val Phe Val Ser Asp Phe Val Asp 210 215 220 Phe Ser Ile Tyr Val Asp Ala Pro Glu Asp Leu Leu Gln Thr Trp Tyr 225 230 235 240 Ile Asn Arg Phe Leu Lys Phe Arg Glu Gly Ala Phe Thr Asp Pro Asp 245 250 255 Ser Tyr Phe His Asn Tyr Ala Lys Leu Thr Lys Glu Glu Ala Ile Lys 260 265 270 Thr Ala Met Thr Ile Trp Lys Glu Met Asn Trp Leu Asn Leu Lys Gln 275 280 285 Asn Ile Leu Pro Thr Arg Glu Arg Ala Ser Leu Ile Leu Thr Lys Ser 290 295 300 Ala Asn His Ala Val Glu Glu Val Arg Leu Arg Lys 305 310 315 <210> 3 <211> 413 <212> PRT <213> Thermotoga maritima <400> 3 Met Gly Ser His His His His His His Gly Ser Arg Val Leu Val Ile 1 5 10 15 Asn Ser Gly Ser Ser Ser Ile Lys Tyr Gln Leu Ile Glu Met Glu Gly 20 25 30 Glu Lys Val Leu Cys Lys Gly Ile Ala Glu Arg Ile Gly Ile Glu Gly 35 40 45 Ser Arg Leu Val His Arg Val Gly Asp Glu Lys His Val Ile Glu Arg 50 55 60 Glu Leu Pro Asp His Glu Glu Ala Leu Lys Leu Ile Leu Asn Thr Leu 65 70 75 80 Val Asp Glu Lys Leu Gly Val Ile Lys Asp Leu Lys Glu Ile Asp Ala 85 90 95 Val Gly His Arg Val Val His Gly Gly Glu Arg Phe Lys Glu Ser Val 100 105 110 Leu Val Asp Glu Glu Val Leu Lys Ala Ile Glu Glu Val Ser Pro Leu 115 120 125 Ala Pro Leu His Asn Pro Ala Asn Leu Met Gly Ile Lys Ala Ala Met 130 135 140 Lys Leu Leu Pro Gly Val Pro Asn Val Ala Val Phe Asp Thr Ala Phe 145 150 155 160 His Gln Thr Ile Pro Gln Lys Ala Tyr Leu Tyr Ala Ile Pro Tyr Glu 165 170 175 Tyr Tyr Glu Lys Tyr Lys Ile Arg Arg Tyr Gly Phe His Gly Thr Ser 180 185 190 His Arg Tyr Val Ser Lys Arg Ala Ala Glu Ile Leu Gly Lys Lys Leu 195 200 205 Glu Glu Leu Lys Ile Ile Thr Cys His Ile Gly Asn Gly Ala Ser Val 210 215 220 Ala Ala Val Lys Tyr Gly Lys Cys Val Asp Thr Ser Met Gly Phe Thr 225 230 235 240 Pro Leu Glu Gly Leu Val Met Gly Thr Arg Ser Gly Asp Leu Asp Pro 245 250 255 Ala Ile Pro Phe Phe Ile Met Glu Lys Glu Gly Ile Ser Pro Gln Glu 260 265 270 Met Tyr Asp Ile Leu Asn Lys Lys Ser Gly Val Tyr Gly Leu Ser Lys 275 280 285 Gly Phe Ser Ser Asp Met Arg Asp Ile Glu Glu Ala Ala Leu Lys Gly 290 295 300 Asp Glu Trp Cys Lys Leu Val Leu Glu Ile Tyr Asp Tyr Arg Ile Ala 305 310 315 320 Lys Tyr Ile Gly Ala Tyr Ala Ala Ala Met Asn Gly Val Asp Ala Ile 325 330 335 Val Phe Thr Ala Gly Val Gly Glu Asn Ser Pro Ile Thr Arg Glu Asp 340 345 350 Val Cys Ser Tyr Leu Glu Phe Leu Gly Val Lys Leu Asp Lys Gln Lys 355 360 365 Asn Glu Glu Thr Ile Arg Gly Lys Glu Gly Ile Ile Ser Thr Pro Asp 370 375 380 Ser Arg Val Lys Val Leu Val Val Pro Thr Asn Glu Glu Leu Met Ile 385 390 395 400 Ala Arg Asp Thr Lys Glu Ile Val Glu Lys Ile Gly Arg 405 410 <210> 4 <211> 613 <212> PRT <213> Streptococcus thermophilus <400> 4 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Thr Val Gly Lys Thr Lys Val Ser Thr Ala Ser 20 25 30 Leu Lys Val Leu Ala Gly Trp Gly Ile Asp Thr Ile Tyr Gly Ile Pro 35 40 45 Ser Gly Thr Leu Ala Pro Leu Met Glu Ala Leu Gly Glu Gln Glu Glu 50 55 60 Thr Asp Ile Lys Phe Leu Gln Val Lys His Glu Glu Val Gly Ala Met 65 70 75 80 Ala Ala Val Met Gln Trp Lys Phe Gly Gly Lys Leu Gly Val Cys Val 85 90 95 Gly Ser Gly Gly Pro Gly Ala Ser His Leu Ile Asn Gly Leu Tyr Asp 100 105 110 Ala Ala Met Asp Asn Thr Pro Val Leu Ala Ile Leu Gly Ser Pro Pro 115 120 125 Gln Arg Glu Leu Asn Met Asp Ala Phe Gln Glu Leu Asn Gln Asn Pro 130 135 140 Met Tyr Asp His Ile Ala Val Tyr Asn Arg Arg Val Ala Tyr Ala Glu 145 150 155 160 Gln Leu Pro Lys Leu Ile Asp Asp Ala Ile Arg Thr Ala Ile Ser Lys 165 170 175 Arg Gly Val Ala Val Leu Glu Val Pro Gly Asp Phe Gly Tyr Lys Glu 180 185 190 Ile Ala Asn Asp Ala Phe Tyr Ser Ser Gly His Ser Tyr Arg Asp Tyr 195 200 205 Val Ser Ser Ala Ile Asn Glu Val Asp Ile Asp Ala Ala Val Glu Val 210 215 220 Leu Asn Lys Ser Lys Arg Ala Val Ile Tyr Ala Gly Ile Gly Thr Met 225 230 235 240 Gly His Gly Pro Ala Val Gln Glu Leu Ser Arg Lys Ile Lys Ala Pro 245 250 255 Ile Ile Thr Thr Ala Lys Asn Phe Glu Thr Phe Asp Tyr Asp Phe Glu 260 265 270 Gly Leu Thr Gly Ser Thr Tyr Arg Val Gly Trp Lys Pro Ala Asn Glu 275 280 285 Ala Val Lys Glu Ala Asp Thr Val Leu Phe Val Gly Ser Asn Phe Pro 290 295 300 Phe Ala Glu Val Glu Gly Thr Phe Ser Asn Val Glu Asn Phe Ile Gln 305 310 315 320 Ile Asp Asn Asn Pro Thr Met Leu Gly Lys Arg His Asn Ala Asp Val 325 330 335 Ala Ile Leu Gly Asp Ala Gly Glu Ala Val Gln Met Leu Leu Glu Lys 340 345 350 Val Ala Pro Val Glu Glu Ser Ala Trp Trp Asn Ala Asn Leu Lys Asn 355 360 365 Ile Gln Asn Trp Arg Asp Tyr Met Thr Lys Leu Glu Thr Lys Glu Asn 370 375 380 Gly Pro Leu Gln Leu Tyr Gln Val Tyr Asn Ala Ile Asn Lys Tyr Ala 385 390 395 400 Asp Glu Asp Ala Ile Tyr Ser Ile Asp Val Gly Asn Thr Thr Gln Thr 405 410 415 Ser Ile Arg His Leu His Met Thr Pro Lys Asn Met Trp Arg Thr Ser 420 425 430 Pro Leu Phe Ala Ser Met Gly Ile Ala Leu Pro Gly Gly Ile Gly Ala 435 440 445 Lys Asn Val Tyr Pro Glu Arg Gln Val Phe Asn Leu Met Gly Asp Gly 450 455 460 Ala Phe Ser Met Asn Tyr Gln Asp Ile Val Thr Asn Val Arg Tyr Asn 465 470 475 480 Met Pro Val Ile Asn Val Val Phe Thr Asn Thr Glu Tyr Gly Phe Ile 485 490 495 Lys Asn Lys Tyr Glu Asp Thr Asn Thr Asn Thr Phe Gly Thr Glu Phe 500 505 510 Thr Asp Val Asp Tyr Ala Met Ile Gly Glu Ala Gln Gly Ala Val Gly 515 520 525 Phe Thr Val Ser Arg Ile Glu Asp Met Asp Gln Val Met Ala Ala Ala 530 535 540 Val Lys Ala Asn Lys Glu Gly Lys Thr Val Val Ile Asp Ala Lys Ile 545 550 555 560 Thr Lys Asp Arg Pro Ile Pro Val Glu Thr Leu Lys Leu Asp Pro Ala 565 570 575 Leu Tyr Ser Glu Glu Glu Ile Lys Ala Tyr Lys Glu Arg Tyr Glu Ala 580 585 590 Glu Glu Leu Val Pro Phe Ser Glu Phe Leu Lys Ala Glu Gly Leu Glu 595 600 605 Ser Lys Val Ala Lys 610 <210> 5 <211> 257 <212> PRT <213> Shewanella halifaxensis <400> 5 Met Ser Asp Leu Lys Lys Ala Ala Gln Gln Ala Ile Ser Leu Met Asp 1 5 10 15 Leu Thr Thr Leu Asn Asp Asp Asp Thr Asp Gln Lys Val Ile Glu Leu 20 25 30 Cys His Lys Ala Lys Thr Pro Ala Gly Asp Thr Ala Ala Ile Cys Ile 35 40 45 Tyr Pro Arg Phe Ile Pro Ile Ala Arg Lys Thr Leu Asn Glu Ile Gly 50 55 60 Gly Asp Asp Ile Lys Ile Ala Thr Val Thr Asn Phe Pro His Gly Asn 65 70 75 80 Asp Asp Ile Ala Ile Ala Val Leu Glu Thr Arg Ala Ala Val Ala Tyr 85 90 95 Gly Ala Asp Glu Val Asp Val Val Phe Pro Tyr Arg Ala Leu Met Glu 100 105 110 Gly Asn Glu Thr Val Gly Phe Glu Leu Val Lys Ala Cys Lys Glu Ala 115 120 125 Cys Gly Glu Asp Thr Ile Leu Lys Val Ile Ile Glu Ser Gly Val Leu 130 135 140 Ala Asp Pro Ala Leu Ile Arg Lys Ala Ser Glu Leu Ser Ile Asp Ala 145 150 155 160 Gly Ala Asp Phe Ile Lys Thr Ser Thr Gly Lys Val Ala Val Asn Ala 165 170 175 Thr Leu Glu Ala Ala Glu Ile Met Met Thr Val Ile Ser Glu Lys Asn 180 185 190 Pro Lys Val Gly Phe Lys Pro Ala Gly Gly Val Lys Asp Ala Ala Ala 195 200 205 Ala Ala Glu Phe Leu Gly Val Ala Ala Arg Leu Leu Gly Asp Asp Trp 210 215 220 Ala Thr Pro Ala Thr Phe Arg Phe Gly Ala Ser Ser Leu Leu Thr Asn 225 230 235 240 Leu Leu His Thr Leu Glu Leu Ala Asp Ala Pro Gln Gly Ala Gln Gly 245 250 255 Tyr <210> 6 <211> 257 <212> PRT <213> Shewanella halifaxensis <400> 6 Met Cys Asp Leu Lys Lys Ala Ala Gln Arg Ala Ile Ser Leu Met Asp 1 5 10 15 Leu Thr Thr Leu Asn Asp Asp Asp Thr Asp Gln Lys Val Ile Glu Leu 20 25 30 Cys His Lys Ala Lys Thr Pro Ala Gly Asp Thr Ala Ala Ile Val Ile 35 40 45 Tyr Pro Arg Phe Ile Pro Ile Ala Arg Lys Thr Leu Asn Glu Ile Gly 50 55 60 Gly Leu Asp Ile Lys Ile Val Thr Val Thr Asn Phe Pro His Gly Asn 65 70 75 80 Asp Asp Ile Ala Ile Ala Val Leu Glu Thr Arg Ala Ala Val Ala Tyr 85 90 95 Gly Ala Asp Glu Val Asp Val Val Phe Pro Tyr Arg Ala Leu Met Glu 100 105 110 Gly Asn Glu Thr Val Gly Phe Glu Leu Val Lys Ala Cys Lys Glu Ala 115 120 125 Cys Gly Glu Asp Thr Ile Leu Lys Val Ile Ile Glu Ser Gly Val Leu 130 135 140 Lys Asp Pro Ala Leu Ile Arg Lys Ala Ser Glu Ile Ser Ile Asp Ala 145 150 155 160 Gly Ala Asp Phe Ile Lys Thr Ser Thr Gly Lys Val Ala Val Asn Ala 165 170 175 Thr Leu Glu Ala Ala Glu Ile Ile Met Thr Val Ile Ser Glu Lys Asn 180 185 190 Pro Lys Val Gly Phe Lys Pro Ala Gly Gly Ile Lys Asp Ala Ala Ala 195 200 205 Ala Ala Glu Phe Leu Gly Val Ala Ala Arg Leu Leu Gly Asp Asp Trp 210 215 220 Ala Thr Pro Ala Thr Phe Arg Phe Gly Ala Thr Asp Leu Leu Thr Asn 225 230 235 240 Leu Leu His Thr Leu Glu Leu Ala Asp Ala Pro Gln Gly Ala Gln Gly 245 250 255 Tyr <210> 7 <211> 500 <212> PRT <213> Alloscardovia omnicolens <400> 7 Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp 1 5 10 15 Gly Thr Leu Lys Ser Met Thr Glu Thr Leu Arg Lys His Phe Glu Gly 20 25 30 Val Tyr Glu Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly 35 40 45 Ala Asp Ala Gly Phe Asp Pro Val Asp His Thr Lys Val Asp Pro Arg 50 55 60 Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Thr Thr His Asp Ile 65 70 75 80 Met Val Asp Thr Ile Val Asn His Met Ser Trp Glu Ser Glu Gln Phe 85 90 95 Gln Asp Val Met Ala Lys Gly Glu Asp Ser Glu Tyr Tyr Pro Met Phe 100 105 110 Leu Thr Met Ser Ser Ile Phe Pro Asp Gly Val Thr Glu Glu Asp Leu 115 120 125 Thr Ala Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Asn 130 135 140 Trp Gly Gly Lys Thr Arg Leu Val Trp Thr Thr Phe Thr Pro Gln Gln 145 150 155 160 Val Asp Ile Asp Thr Asp Ser Glu Met Gly Trp Asn Tyr Leu Leu Ser 165 170 175 Ile Leu Asp Gln Leu Ser Gln Ser His Val Ser Gln Ile Arg Leu Asp 180 185 190 Ala Val Gly Tyr Gly Ala Lys Glu Lys Asn Ser Ser Cys Phe Met Thr 195 200 205 Pro Lys Thr Phe Lys Leu Ile Glu Arg Ile Lys Ala Glu Gly Glu Lys 210 215 220 Arg Gly Leu Glu Thr Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln 225 230 235 240 Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Ile Pro 245 250 255 Gly Leu Leu Leu His Ala Leu Glu Phe Gly Lys Thr Asp Ala Leu Ala 260 265 270 Gln Trp Ile Asp Val Arg Pro Asn Asn Ala Val Asn Val Leu Asp Thr 275 280 285 His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Met Asp Arg 290 295 300 Ser Leu Ala Gly Leu Val Pro Asp Glu Glu Val Asp Ala Leu Val Glu 305 310 315 320 Ser Ile His Arg Asn Ser Lys Gly Glu Ser Gln Glu Ala Thr Gly Ala 325 330 335 Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Tyr Tyr Ala 340 345 350 Ala Leu Gly Ser Asp Asp Gln Lys Tyr Ile Ala Ala Arg Ala Val Gln 355 360 365 Phe Phe Met Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala 370 375 380 Gly Ser Asn Asp Met Asp Leu Leu Lys Arg Thr Asn Val Gly Arg Asp 385 390 395 400 Ile Asn Arg His Tyr Tyr Ser Ala Ala Glu Val Ala Ser Glu Val Glu 405 410 415 Arg Pro Val Val Gln Ala Leu Asn Ala Leu Gly Arg Phe Arg Asn Thr 420 425 430 Leu Ser Ala Phe Asp Gly Glu Phe Ser Tyr Ser Asn Ala Asp Gly Val 435 440 445 Leu Thr Met Thr Trp Ala Asp Asp Ala Thr Arg Ala Thr Leu Thr Phe 450 455 460 Ala Pro Lys Ala Asn Ser Asn Gly Ala Ser Val Ala Arg Leu Glu Trp 465 470 475 480 Thr Asp Ala Ala Gly Glu His Ala Thr Asp Asp Leu Ile Ala Asn Pro 485 490 495 Pro Val Val Ala 500 <210> 8 <211> 407 <212> PRT <213> Escherichia coli <400> 8 Met Lys Arg Ala Phe Ile Met Val Leu Asp Ser Phe Gly Ile Gly Ala 1 5 10 15 Thr Glu Asp Ala Glu Arg Phe Gly Asp Val Gly Ala Asp Thr Leu Gly 20 25 30 His Ile Ala Glu Ala Cys Ala Lys Gly Glu Ala Asp Asn Gly Arg Lys 35 40 45 Gly Pro Leu Asn Leu Pro Asn Leu Thr Arg Leu Gly Leu Ala Lys Ala 50 55 60 His Glu Gly Ser Thr Gly Phe Ile Pro Ala Gly Met Asp Gly Asn Ala 65 70 75 80 Glu Val Ile Gly Ala Tyr Ala Trp Ala His Glu Met Ser Ser Gly Lys 85 90 95 Asp Ser Val Ser Gly His Trp Glu Ile Ala Gly Val Pro Val Leu Phe 100 105 110 Glu Trp Gly Tyr Phe Ser Asp His Glu Asn Ser Phe Pro Gln Glu Leu 115 120 125 Leu Asp Lys Leu Val Glu Arg Ala Asn Leu Pro Gly Tyr Leu Gly Asn 130 135 140 Cys Arg Ser Ser Gly Thr Val Ile Leu Asp Gln Leu Gly Glu Glu His 145 150 155 160 Met Lys Thr Gly Lys Pro Ile Phe Tyr Thr Ser Ala Ala Ser Val Phe 165 170 175 Gln Ile Ala Cys His Glu Glu Thr Phe Gly Leu Asp Lys Leu Tyr Glu 180 185 190 Leu Cys Glu Ile Ala Arg Glu Glu Leu Thr Asn Gly Gly Tyr Asn Ile 195 200 205 Gly Arg Val Ile Ala Arg Pro Phe Ile Gly Asp Lys Ala Gly Asn Phe 210 215 220 Gln Arg Thr Gly Asn Arg Arg Asp Leu Ala Val Glu Pro Pro Ala Pro 225 230 235 240 Thr Val Leu Gln Lys Leu Val Asp Glu Lys His Gly Gln Val Val Ser 245 250 255 Val Gly Lys Ile Ala Asp Ile Tyr Ala Asn Cys Gly Ile Thr Lys Lys 260 265 270 Val Lys Ala Thr Gly Leu Asp Ala Leu Phe Asp Ala Thr Ile Lys Glu 275 280 285 Met Lys Glu Ala Gly Asp Asn Thr Ile Val Phe Thr Asn Phe Val Asp 290 295 300 Phe Asp Ser Ser Trp Gly His Arg Arg Asp Val Ala Gly Tyr Ala Ala 305 310 315 320 Gly Leu Glu Leu Phe Asp Arg Arg Leu Pro Glu Leu Met Ser Leu Leu 325 330 335 Arg Asp Asp Asp Ile Leu Ile Leu Thr Ala Asp His Gly Cys Asp Pro 340 345 350 Thr Trp Thr Gly Thr Asp His Thr Arg Glu His Ile Pro Val Leu Val 355 360 365 Tyr Gly Pro Lys Val Lys Pro Gly Ser Leu Gly His Arg Glu Thr Phe 370 375 380 Ala Asp Ile Gly Gln Thr Leu Ala Lys Tyr Phe Gly Thr Ser Asp Met 385 390 395 400 Glu Tyr Gly Lys Ala Met Phe 405 <210> 9 <211> 239 <212> PRT <213> Escherichia coli <400> 9 Met Ala Thr Pro His Ile Asn Ala Glu Met Gly Asp Phe Ala Asp Val 1 5 10 15 Val Leu Met Pro Gly Asp Pro Leu Arg Ala Lys Tyr Ile Ala Glu Thr 20 25 30 Phe Leu Glu Asp Ala Arg Glu Val Asn Asn Val Arg Gly Met Leu Gly 35 40 45 Phe Thr Gly Thr Tyr Lys Gly Arg Lys Ile Ser Val Met Gly His Gly 50 55 60 Ala Gly Ile Pro Ser Cys Ser Ile Tyr Thr Lys Glu Leu Ile Thr Asp 65 70 75 80 Phe Gly Val Lys Lys Ile Ile Arg Val Gly Ser Cys Gly Ala Val Leu 85 90 95 Pro His Val Lys Leu Arg Asp Val Val Ile Gly Met Gly Ala Cys Thr 100 105 110 Asp Ser Lys Val Asn Arg Ile Arg Phe Lys Asp His Asp Phe Ala Ala 115 120 125 Ile Ala Asp Phe Asp Met Val Arg Asn Ala Val Asp Ala Ala Lys Ala 130 135 140 Leu Gly Ile Asp Ala Arg Val Gly Asn Leu Phe Ser Ala Asp Leu Phe 145 150 155 160 Tyr Ser Pro Asp Gly Glu Met Phe Asp Val Met Glu Lys Tyr Gly Ile 165 170 175 Leu Gly Val Glu Met Glu Ala Ala Gly Ile Tyr Gly Val Ala Ala Glu 180 185 190 Phe Gly Ala Lys Ala Leu Thr Ile Cys Thr Val Ser Asp His Ile Arg 195 200 205 Thr His Glu Gln Thr Thr Ala Ala Glu Arg Gln Thr Thr Phe Asn Asp 210 215 220 Met Ile Lys Ile Ala Leu Glu Ser Val Leu Leu Gly Asp Lys Glu 225 230 235 <210> 10 <211> 650 <212> PRT <213> Fusarium graminearum <400> 10 Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala 1 5 10 15 Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Asn Lys Ala Ile 20 25 30 Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly 35 40 45 Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln 50 55 60 Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn 65 70 75 80 Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn 85 90 95 Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr 100 105 110 Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val 115 120 125 Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile 130 135 140 Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly 145 150 155 160 Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala 165 170 175 Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln 180 185 190 Asp Ala Phe Glu Gly Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp 195 200 205 Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Lys 210 215 220 His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile 225 230 235 240 Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser 245 250 255 Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly 260 265 270 Tyr Gln Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly 275 280 285 Gly Ser Phe Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser 290 295 300 Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro 305 310 315 320 Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser Asp Asn His Ala 325 330 335 Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser 340 345 350 Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser 355 360 365 Ala Gly Lys Arg Gln Ser Asn Arg Gly Val Ala Pro Asp Ala Met Cys 370 375 380 Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe 385 390 395 400 Gly Gly Ser Pro Asp Tyr Glu Asp Ser Asp Ala Thr Thr Asn Ala His 405 410 415 Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala 420 425 430 Ser Asn Gly Leu Tyr Phe Ala Arg Thr Phe His Thr Ser Val Val Leu 435 440 445 Pro Asp Gly Ser Thr Phe Ile Thr Gly Gly Gln Gln Arg Gly Ile Pro 450 455 460 Thr Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu 465 470 475 480 Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr 485 490 495 His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly 500 505 510 Gly Gly Leu Cys Gly Asp Cys Thr Thr Asn His Phe Asp Ala Gln Ile 515 520 525 Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg 530 535 540 Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp 545 550 555 560 Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg 565 570 575 Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Pro 580 585 590 Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro 595 600 605 Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met 610 615 620 Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Arg Val Thr Gln 625 630 635 640 Gly Gln Thr Gly His His His His His His 645 650 <210> 11 <211> 650 <212> PRT <213> Fusarium graminearum <400> 11 Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala 1 5 10 15 Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Asn Lys Ala Ile 20 25 30 Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly 35 40 45 Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln 50 55 60 Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn 65 70 75 80 Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn 85 90 95 Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr 100 105 110 Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val 115 120 125 Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile 130 135 140 Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly 145 150 155 160 Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala 165 170 175 Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln 180 185 190 Asp Ala Phe Glu Gly Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp 195 200 205 Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Gly 210 215 220 His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile 225 230 235 240 Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser 245 250 255 Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly 260 265 270 Tyr Asn Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly 275 280 285 Gly Ser Phe Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser 290 295 300 Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro 305 310 315 320 Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser Asp Asn His Ala 325 330 335 Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser 340 345 350 Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser 355 360 365 Ala Gly Lys Arg Gln Ser Asn Arg Gly Val Ala Pro Asp Ala Met Cys 370 375 380 Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe 385 390 395 400 Gly Gly Ser Pro Asp Tyr Gln Asp Ser Asp Ala Thr Thr Asn Ala His 405 410 415 Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala 420 425 430 Ser Asn Gly Leu Leu Phe Ala Arg Thr Phe His Thr Ser Val Val Leu 435 440 445 Pro Asp Gly Ser Thr Phe Ile Thr Gly Gly Gln Gln Arg Gly Ile Pro 450 455 460 Thr Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu 465 470 475 480 Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr 485 490 495 His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly 500 505 510 Gly Gly Leu Cys Gly Asp Cys Glu Thr Asn His Phe Asp Ala Gln Ile 515 520 525 Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg 530 535 540 Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp 545 550 555 560 Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg 565 570 575 Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Pro 580 585 590 Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro 595 600 605 Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met 610 615 620 Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Asn Val Thr Gln 625 630 635 640 Gly Gln Thr Gly His His His His His His 645 650 <210> 12 <211> 316 <212> PRT <213> Escherichia coli <400> 12 Met Ser Ile Lys Glu Gln Thr Leu Met Thr Pro Tyr Leu Gln Leu Asp 1 5 10 15 Arg Asn Gln Trp Ala Ala Leu Arg Asp Ser Asn Pro Met Thr Leu Ser 20 25 30 Glu Asp Glu Ile Ala Arg Leu Lys Gly Ile Asn Glu Asp Leu Ser Leu 35 40 45 Glu Glu Val Ala Glu Val Tyr Leu Pro Leu Ser Arg Leu Leu Asn Phe 50 55 60 Tyr Ile Ser Ser Asn Leu Arg Arg Gln Ala Val Leu Glu Gln Phe Leu 65 70 75 80 Gly Thr Asn Gly Gln Arg Ile Pro Tyr Ile Ile Ser Ile Ala Gly Ser 85 90 95 Val Ala Val Gly Lys Ser Thr Thr Ala Arg Val Leu Gln Ala Leu Leu 100 105 110 Ser Arg Trp Pro Glu His Arg Arg Val Glu Leu Ile Thr Thr Asp Gly 115 120 125 Phe Leu His Pro Asn Gln Val Leu Lys Glu Arg Gly Leu Met Lys Lys 130 135 140 Lys Gly Phe Pro Glu Ser Tyr Asp Met His Arg Leu Met Lys Phe Val 145 150 155 160 Lys Asp Leu Lys Ser Gly Val Pro Asn Val Thr Ala Pro Val Tyr Ser 165 170 175 His Leu Ile Tyr Asp Val Ile Pro Asp Gly Asp Lys Thr Val Val Gln 180 185 190 Pro Asp Ile Leu Ile Leu Glu Gly Leu Asn Val Leu Gln Ser Gly Met 195 200 205 Asp Tyr Pro His Asp Pro His His Val Phe Val Ser Asp Phe Val Asp 210 215 220 Phe Ser Ile Tyr Val Asp Ala Pro Glu Asp Leu Leu Gln Thr Trp Tyr 225 230 235 240 Ile Asn Arg Phe Leu Lys Phe Arg Glu Gly Ala Phe Thr Asp Pro Asp 245 250 255 Ser Tyr Phe His Gly Tyr Ala Lys Leu Thr Lys Glu Glu Ala Ile Lys 260 265 270 Thr Ala Met Thr Ile Trp Lys Glu Met Asn His Leu Asn Leu Lys Gln 275 280 285 Asn Ile Leu Pro Thr Arg Glu Arg Ala Ser Leu Ile Leu Thr Lys Ser 290 295 300 Ala Asn His Ile Val Glu Glu Val Arg Leu Arg Lys 305 310 315 <210> 13 <211> 325 <212> PRT <213> Escherichia coli <400> 13 Met His His His His His His Gly Gly Met Ser Ile Lys Glu Gln Thr 1 5 10 15 Leu Met Thr Pro Tyr Leu Gln Leu Asp Arg Asn Gln Trp Ala Ala Leu 20 25 30 Arg Asp Ser Asn Pro Met Thr Leu Ser Glu Asp Glu Ile Ala Arg Leu 35 40 45 Lys Gly Ile Asn Glu Asp Leu Ser Leu Glu Glu Val Ala Glu Val Tyr 50 55 60 Leu Pro Leu Ser Arg Leu Leu Asn Phe Tyr Ile Ser Ser Asn Leu Arg 65 70 75 80 Arg Gln Ala Val Leu Glu Gln Phe Leu Gly Thr Asn Gly Gln Arg Ile 85 90 95 Pro Tyr Ile Ile Ser Ile Ala Gly Ser Val Ala Val Gly Lys Ser Thr 100 105 110 Thr Ala Arg Val Leu Gln Ala Leu Leu Ser Arg Trp Pro Glu His Arg 115 120 125 Arg Val Glu His Ile Thr Thr Asp Gly Phe Leu His Pro Asn Gln Val 130 135 140 Leu Lys Glu Arg Gly Leu Met Gly Lys Lys Gly Phe Pro Glu Ser Tyr 145 150 155 160 Asp Met His Arg Leu Met Lys Phe Val Lys Asp Leu Lys Ser Gly Val 165 170 175 Pro Asn Val Thr Ala Pro Val Tyr Ser His Leu Ile Tyr Asp Val Ile 180 185 190 Pro Asp Gly Asp Lys Thr Val Val Gln Pro Asp Ile Leu Ile Leu Glu 195 200 205 Gly Leu Asn Val Leu Gln Ser Gly Met Asp Tyr Pro His Asp Pro His 210 215 220 His Val Phe Val Ser Asp Phe Val Asp Phe Ser Ile Tyr Val Asp Ala 225 230 235 240 Pro Glu Asp Leu Leu Gln Thr Trp Tyr Ile Asn Arg Phe Leu Lys Phe 245 250 255 Arg Glu Gly Ala Phe Thr Asp Pro Asp Ser Tyr Phe His Gly Tyr Ala 260 265 270 Lys Leu Thr Lys Glu Glu Ala Ile Lys Thr Ala Met Thr Ile Trp Lys 275 280 285 Glu Met Asn His Leu Asn Leu Lys Gln Asn Ile Leu Pro Thr Arg Glu 290 295 300 Arg Ala Ser Leu Ile Leu Thr Lys Ser Ala Asn His Ile Val Glu Glu 305 310 315 320 Val Arg Leu Arg Lys 325 <210> 14 <211> 263 <212> PRT <213> Shewanella halifaxensis <400> 14 Met His His His His His His Cys Asp Leu Lys Lys Ala Ala Gln Arg 1 5 10 15 Ala Ile Ser Leu Met Asp Leu Thr Thr Leu Asn Asp Asp Asp Thr Asp 20 25 30 Gln Lys Val Ile Glu Leu Cys His Lys Ala Lys Thr Pro Ala Gly Asp 35 40 45 Thr Ala Ala Ile Val Ile Tyr Pro Arg Phe Ile Pro Ile Ala Arg Lys 50 55 60 Thr Leu Asn Glu Ile Gly Gly Leu Asp Ile Lys Ile Val Thr Val Thr 65 70 75 80 Asn Phe Pro His Gly Asn Asp Asp Ile Ala Ile Ala Val Leu Glu Thr 85 90 95 Arg Ala Ala Val Ala Tyr Gly Ala Asp Glu Val Asp Val Val Phe Pro 100 105 110 Tyr Arg Ala Leu Met Glu Gly Asn Glu Thr Val Gly Phe Glu Leu Val 115 120 125 Lys Ala Cys Lys Glu Ala Cys Gly Glu Asp Thr Ile Leu Lys Val Ile 130 135 140 Ile Glu Ser Gly Val Leu Lys Asp Pro Ala Leu Ile Arg Lys Ala Ser 145 150 155 160 Glu Ile Ser Ile Asp Ala Gly Ala Asp Phe Ile Lys Thr Ser Thr Gly 165 170 175 Lys Val Ala Val Asn Ala Thr Leu Glu Ala Ala Glu Ile Ile Met Thr 180 185 190 Val Ile Ser Glu Lys Asn Pro Lys Val Gly Phe Lys Pro Ala Gly Gly 195 200 205 Ile Lys Asp Ala Ala Ala Ala Ala Glu Phe Leu Gly Val Ala Ala Arg 210 215 220 Leu Leu Gly Asp Asp Trp Ala Thr Pro Ala Thr Phe Arg Phe Gly Ala 225 230 235 240 Thr Asp Leu Leu Thr Asn Leu Leu His Thr Leu Glu Leu Ala Asp Ala 245 250 255 Pro Gln Gly Ala Gln Gly Tyr 260 <210> 15 <211> 239 <212> PRT <213> Escherichia coli <400> 15 Met Ala Thr Pro His Ile Asn Ala Glu Met Gly Asp Phe Ala Asp Val 1 5 10 15 Val Leu Met Pro Gly Asp Pro Leu Arg Ala Lys Tyr Ile Ala Glu Thr 20 25 30 Phe Leu Glu Asp Ala Arg Glu Val Asn Asn Val Arg Gly Met Leu Gly 35 40 45 Phe Thr Gly Thr Tyr Lys Gly Arg Lys Ile Ser Val Met Gly His Gly 50 55 60 Met Gly Ile Pro Ser Cys Ser Ile Tyr Thr Lys Glu Leu Ile Thr Asp 65 70 75 80 Phe Gly Val Lys Lys Ile Ile Arg Val Gly Ser Cys Gly Ala Val Leu 85 90 95 Pro His Val Lys Leu Arg Asp Val Val Ile Gly Met Gly Ala Cys Thr 100 105 110 Asp Ser Lys Val Asn Arg Ile Arg Phe Lys Asp His Asp Phe Ala Ala 115 120 125 Ile Ala Asp Phe Asp Met Val Arg Asn Ala Val Asp Ala Ala Lys Ala 130 135 140 Leu Gly Ile Asp Ala Arg Val Gly Asn Leu Phe Ser Ala Asp Leu Phe 145 150 155 160 Tyr Ser Pro Asp Gly Glu Met Phe Asp Val Met Glu Lys Tyr Gly Ile 165 170 175 Leu Gly Val Glu Met Glu Ala Ala Gly Ile Tyr Gly Val Ala Ala Glu 180 185 190 Phe Gly Ala Lys Ala Leu Thr Ile Cys Thr Val Ser Asp His Ile Arg 195 200 205 Thr His Glu Gln Thr Thr Ala Ala Glu Arg Gln Thr Thr Phe Asn Asp 210 215 220 Met Ile Lys Ile Ala Leu Glu Ser Val Leu Leu Gly Asp Lys Glu 225 230 235 <210> 16 <211> 650 <212> PRT <213> Fusarium graminearum <400> 16 Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala 1 5 10 15 Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Asn Lys Ala Ile 20 25 30 Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly 35 40 45 Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln 50 55 60 Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn 65 70 75 80 Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn 85 90 95 Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr 100 105 110 Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val 115 120 125 Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile 130 135 140 Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly 145 150 155 160 Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala 165 170 175 Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln 180 185 190 Asp Ala Phe Glu Pro Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp 195 200 205 Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Gly 210 215 220 His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile 225 230 235 240 Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser 245 250 255 Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly 260 265 270 Tyr Asn Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly 275 280 285 Gly Ser Tyr Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser 290 295 300 Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro 305 310 315 320 Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser Asp Asn His Ala 325 330 335 Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser 340 345 350 Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser 355 360 365 Ala Gly Lys Arg Gln Ser Asp Arg Gly Val Ala Pro Asp Ala Met Cys 370 375 380 Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe 385 390 395 400 Gly Gly Ser Pro Asp Tyr Gln Asp Ser Asp Ala Thr Thr Asn Ala His 405 410 415 Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala 420 425 430 Ser Asn Gly Leu Leu Phe Ala Arg Thr Phe His Thr Ser Val Val Leu 435 440 445 Pro Asp Gly Ser Val Phe Ile Thr Gly Gly Gln Gln Arg Gly Val Pro 450 455 460 Leu Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu 465 470 475 480 Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr 485 490 495 His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly 500 505 510 Gly Gly Leu Cys Gly Asp Cys Glu Thr Asn His Phe Asp Ala Gln Ile 515 520 525 Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg 530 535 540 Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp 545 550 555 560 Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg 565 570 575 Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Gly 580 585 590 Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro 595 600 605 Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met 610 615 620 Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Asn Val Thr Gln 625 630 635 640 Gly Gln Thr Gly His His His His His His 645 650 <210> 17 <211> 650 <212> PRT <213> Fusarium graminearum <400> 17 Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala 1 5 10 15 Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Ile Lys Ala Ile 20 25 30 Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly 35 40 45 Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln 50 55 60 Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn 65 70 75 80 Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn 85 90 95 Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr 100 105 110 Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val 115 120 125 Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile 130 135 140 Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly 145 150 155 160 Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala 165 170 175 Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln 180 185 190 Asp Ala Phe Glu Asp Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp 195 200 205 Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Gly 210 215 220 His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile 225 230 235 240 Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser 245 250 255 Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly 260 265 270 Tyr Asn Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly 275 280 285 Gly Ser Tyr Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser 290 295 300 Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro 305 310 315 320 Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser Asp Asn His Ala 325 330 335 Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser 340 345 350 Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser 355 360 365 Ala Gly Lys Arg Gln Ser Asp Arg Gly Val Ala Pro Asp Ala Met Cys 370 375 380 Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe 385 390 395 400 Gly Gly Ser Pro Asp Tyr Gln Asp Ser Asp Ala Thr Thr Asn Ala His 405 410 415 Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala 420 425 430 Ser Asn Gly Leu Leu Phe Ala Arg Thr Phe His Thr Ser Val Val Leu 435 440 445 Pro Asp Gly Ser Val Phe Ile Thr Gly Gly Gln Gln Arg Gly Val Pro 450 455 460 Leu Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu 465 470 475 480 Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr 485 490 495 His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly 500 505 510 Gly Gly Leu Cys Gly Asp Cys Glu Thr Asn His Phe Asp Ala Gln Ile 515 520 525 Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg 530 535 540 Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp 545 550 555 560 Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg 565 570 575 Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Gly 580 585 590 Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro 595 600 605 Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met 610 615 620 Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Asn Val Thr Gln 625 630 635 640 Gly Gln Thr Gly His His His His His His 645 650 <210> 18 <211> 650 <212> PRT <213> Fusarium graminearum <400> 18 Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala 1 5 10 15 Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Ile Lys Ala Ile 20 25 30 Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly 35 40 45 Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln 50 55 60 Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn 65 70 75 80 Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn 85 90 95 Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr 100 105 110 Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val 115 120 125 Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile 130 135 140 Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly 145 150 155 160 Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala 165 170 175 Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln 180 185 190 Asp Ala Phe Glu Asp Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp 195 200 205 Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Gly 210 215 220 His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile 225 230 235 240 Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser 245 250 255 Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly 260 265 270 Tyr Asn Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly 275 280 285 Gly Ser Tyr Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser 290 295 300 Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro 305 310 315 320 Met Leu Thr Ala Asp Lys Arg Gly Leu Tyr Arg Ser Asp Asn His Ala 325 330 335 Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser 340 345 350 Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser 355 360 365 Ala Gly Lys Arg Gln Ser Asp Arg Gly Val Ala Pro Asp Ala Met Cys 370 375 380 Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe 385 390 395 400 Gly Gly Ser Pro Asp Tyr Gln Asp Ser Asp Ala Thr Thr Asn Ala His 405 410 415 Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala 420 425 430 Ser Asn Gly Leu Leu Phe Ala Arg Thr Phe His Thr Ser Val Val Leu 435 440 445 Pro Asp Gly Ser Val Phe Ile Thr Gly Gly Gln Gln Arg Gly Val Pro 450 455 460 Leu Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu 465 470 475 480 Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr 485 490 495 His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly 500 505 510 Gly Gly Leu Cys Gly Asp Cys Glu Thr Asn His Phe Asp Ala Gln Ile 515 520 525 Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg 530 535 540 Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp 545 550 555 560 Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg 565 570 575 Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Gly 580 585 590 Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro 595 600 605 Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met 610 615 620 Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Asn Val Thr Gln 625 630 635 640 Gly Gln Thr Gly His His His His His His 645 650 <210> 19 <211> 650 <212> PRT <213> Fusarium graminearum <400> 19 Met Ala Ser Ala Pro Ile Gly Val Ala Ile Pro Arg Asn Asn Trp Ala 1 5 10 15 Val Thr Cys Asp Ser Ala Gln Ser Gly Asn Glu Cys Ile Lys Ala Ile 20 25 30 Asp Gly Asn Lys Asp Thr Phe Trp His Thr Gln Tyr Gly Val Asn Gly 35 40 45 Asp Pro Lys Pro Pro His Thr Ile Thr Ile Asp Met Lys Thr Val Gln 50 55 60 Asn Val Asn Gly Leu Ser Val Leu Pro Arg Gln Asp Gly Asn Gln Asn 65 70 75 80 Gly Trp Ile Gly Arg His Glu Val Tyr Leu Ser Ser Asp Gly Val Asn 85 90 95 Trp Gly Ser Pro Val Ala Ser Gly Ser Trp Phe Ala Asp Ser Thr Thr 100 105 110 Lys Tyr Ser Asn Phe Glu Thr Arg Pro Ala Arg Tyr Val Arg Leu Val 115 120 125 Ala Ile Thr Glu Ala Asn Gly Gln Pro Trp Thr Ser Ile Ala Glu Ile 130 135 140 Asn Val Phe Gln Ala Ser Ser Tyr Thr Ala Pro Gln Pro Gly Leu Gly 145 150 155 160 Arg Trp Gly Pro Thr Ile Asp Leu Pro Ile Val Pro Ser Ala Ala Ala 165 170 175 Ile Glu Pro Thr Ser Gly Arg Val Leu Met Trp Ser Ser Tyr Arg Gln 180 185 190 Asp Ala Phe Arg Asp Ser Pro Gly Gly Ile Thr Leu Thr Ser Ser Trp 195 200 205 Asp Pro Ser Thr Gly Ile Val Ser Asp Arg Thr Ser Thr Val Thr Gly 210 215 220 His Asp Met Phe Cys Pro Gly Ile Ser Met Asp Gly Asn Gly Gln Ile 225 230 235 240 Val Val Ser Gly Gly Asn Asp Ala Lys Lys Thr Ser Leu Tyr Asp Ser 245 250 255 Ser Ser Asp Ser Trp Ile Pro Gly Pro Asp Met Gln Val Ala Arg Gly 260 265 270 Tyr Asn Ser Ser Ala Thr Met Ser Asp Gly Arg Val Phe Thr Ile Gly 275 280 285 Gly Ser Tyr Ser Gly Gly Gln Val Glu Lys Asn Gly Glu Val Tyr Ser 290 295 300 Pro Ser Ser Lys Thr Trp Thr Ser Leu Pro Asn Ala Lys Val Asn Pro 305 310 315 320 Met Leu Thr Ala Asp Lys Gln Gly Leu Tyr Arg Ser Asp Asn His Ala 325 330 335 Trp Leu Phe Gly Trp Lys Lys Gly Ser Val Phe Gln Ala Gly Pro Ser 340 345 350 Thr Ala Met Asn Trp Tyr Tyr Thr Ser Gly Ser Gly Asp Val Lys Ser 355 360 365 Ala Gly Lys Arg Gln Ser Asp Arg Gly Val Ala Pro Asp Ala Met Cys 370 375 380 Gly Asn Ala Val Met Tyr Asp Ala Val Lys Gly Lys Ile Leu Thr Phe 385 390 395 400 Gly Gly Ser Pro Asp Tyr Gln Asp Ser Asp Ala Thr Thr Asn Ala His 405 410 415 Ile Ile Thr Leu Gly Glu Pro Gly Thr Ser Pro Asn Thr Val Phe Ala 420 425 430 Ser Asn Gly Leu Leu Phe Ala Arg Thr Phe His Thr Ser Val Val Leu 435 440 445 Pro Asp Gly Ser Val Phe Ile Thr Gly Gly Gln Gln Arg Gly Val Pro 450 455 460 Leu Glu Asp Ser Thr Pro Val Phe Thr Pro Glu Ile Tyr Val Pro Glu 465 470 475 480 Gln Asp Thr Phe Tyr Lys Gln Asn Pro Asn Ser Ile Val Arg Ala Tyr 485 490 495 His Ser Ile Ser Leu Leu Leu Pro Asp Gly Arg Val Phe Asn Gly Gly 500 505 510 Gly Gly Leu Cys Gly Asp Cys Glu Thr Asn His Phe Asp Ala Gln Ile 515 520 525 Phe Thr Pro Asn Tyr Leu Tyr Asp Ser Asn Gly Asn Leu Ala Thr Arg 530 535 540 Pro Lys Ile Thr Arg Thr Ser Thr Gln Ser Val Val Val Gly Gly Trp 545 550 555 560 Ile Thr Ile Trp Thr Asp Met Ser Ile Ser Ala Ala Ser Leu Ile Arg 565 570 575 Tyr Gly Thr Ala Thr His Thr Val Asn Thr Asp Gln Arg Arg Ile Gly 580 585 590 Leu Thr Leu Thr Asn Asn Gly Gly Asn Ser Tyr Ser Phe Gln Val Pro 595 600 605 Ser Asp Ser Gly Val Ala Leu Pro Gly Tyr Trp Met Leu Phe Val Met 610 615 620 Asn Ser Ala Gly Val Pro Ser Val Ala Ser Thr Ile Asn Val Thr Gln 625 630 635 640 Gly Gln Thr Gly His His His His His His 645 650 <210> 20 <211> 326 <212> PRT <213> Escherichia coli <400> 20 Met His His His His His His Gly Gly Ser Gly Ser Ile Lys Glu Gln 1 5 10 15 Thr Leu Met Thr Pro Tyr Leu Gln Leu Asp Arg Asn Gln Trp Ala Ala 20 25 30 Leu Arg Asp Ser Asn Pro Met Thr Leu Ser Glu Asp Glu Ile Ala Arg 35 40 45 Leu Lys Gly Ile Asn Glu Asp Leu Ser Leu Glu Glu Val Ala Glu Val 50 55 60 Tyr Leu Pro Leu Ser Arg Leu Leu Asn Phe Tyr Ile Ser Ser Asn Leu 65 70 75 80 Arg Arg Gln Ala Gln Leu Glu Gln Phe Leu Gly Thr Asn Gly Gln Arg 85 90 95 Ile Pro Tyr Ile Ile Ser Ile Ala Gly Ser Val Ala Val Gly Lys Ser 100 105 110 Thr Phe Ala Arg Val Leu Gln Ala Leu Leu Ser Arg Trp Pro Glu His 115 120 125 Arg Arg Val Glu His Ile Thr Thr Asp Gly Phe Leu His Pro Asn Gln 130 135 140 Val Leu Lys Glu Arg Gly Leu Met Gly Lys Lys Gly Phe Pro Glu Ser 145 150 155 160 Tyr Asp Met His Arg Leu Met Lys Phe Val Lys Asp Leu Lys Ser Gly 165 170 175 Val Pro Asn Val Thr Ala Pro Val Tyr Ser His Leu Ile Tyr Asp Val 180 185 190 Ile Pro Asp Gly Asp Lys Thr Val Val Gln Pro Asp Ile Leu Ile Leu 195 200 205 Glu Gly Leu Asn Val Leu Gln Ser Gly Met Asp Tyr Pro His Asp Pro 210 215 220 His His Val Phe Val Ser Asp Phe Val Asp Phe Ser Ile Tyr Val Asp 225 230 235 240 Ala Pro Glu Asp Leu Leu Gln Thr Trp Tyr Ile Asn Arg Phe Leu Lys 245 250 255 Phe Arg Glu Gly Ala Phe Thr Asp Pro Asp Ser Tyr Phe His Gly Tyr 260 265 270 Ala Lys Leu Thr Lys Glu Glu Ala Ile Lys Thr Ala Met Thr Ile Trp 275 280 285 Lys Glu Met Asn His Val Asn Leu Lys Gln Asn Ile Leu Pro Thr Arg 290 295 300 Glu Arg Ala Ser Leu Ile Leu Thr Lys Ser Ala Asn His Ile Val Glu 305 310 315 320 Glu Val Arg Leu Arg Lys 325 <210> 21 <211> 413 <212> PRT <213> Thermotoga maritima <400> 21 Met Gly Ser His His His His His His Gly Ser Arg Val Leu Asn Ile 1 5 10 15 Asn Ser Gly Ser Ser Ser Ile Lys Tyr Gln Leu Ile Glu Met Glu Gly 20 25 30 Glu Lys Val Leu Cys Lys Gly Ile Ala Glu Arg Ile Gly Ile Glu Gly 35 40 45 Ser Arg Leu Val His Arg Val Gly Asp Glu Lys His Val Ile Glu Arg 50 55 60 Glu Leu Pro Asp His Glu Glu Ala Leu Lys Leu Ile Leu Asn Thr Leu 65 70 75 80 Val Asp Glu Lys Leu Gly Val Ile Lys Asp Leu Lys Glu Ile Asp Ala 85 90 95 Val Gly His Arg Val Val His Gly Gly Glu Arg Phe Lys Glu Ser Val 100 105 110 Leu Val Asp Glu Glu Val Leu Lys Ala Ile Glu Glu Val Ser Pro Leu 115 120 125 Ala Pro Leu His Asn Pro Ala Asn Leu Met Gly Ile Lys Ala Ala Met 130 135 140 Lys Leu Leu Pro Gly Val Pro Asn Val Gln Val Phe Asp Thr Ala Phe 145 150 155 160 His Gln Thr Ile Pro Gln Lys Ala Tyr Leu Tyr Ala Ile Pro Tyr Glu 165 170 175 Tyr Tyr Glu Lys Tyr Lys Ile Arg Arg Tyr Gly Phe His Gly Ile Ser 180 185 190 His Arg Tyr Val Ser Lys Arg Ala Ala Glu Ile Leu Gly Lys Lys Leu 195 200 205 Glu Glu Leu Lys Ile Ile Thr Cys His Ile Gly Asn Gly Ala Ser Val 210 215 220 Ala Ala Val Lys Tyr Gly Lys Cys Val Asp Thr Ser Met Gly Phe Thr 225 230 235 240 Pro Leu Glu Gly Leu Val Met Gly Thr Arg Ser Gly Asp Leu Asp Pro 245 250 255 Ala Ile Pro Phe Phe Ile Met Glu Lys Glu Gly Ile Ser Pro Gln Glu 260 265 270 Met Tyr Asp Ile Leu Asn Lys Lys Ser Gly Val Tyr Gly Leu Ser Lys 275 280 285 Gly Phe Ser Ser Asp Met Arg Asp Asn Leu Glu Ala Ala Leu Lys Gly 290 295 300 Asp Glu Trp Cys Lys Leu Val Leu Glu Ile Tyr Asp Tyr Arg Ile Ala 305 310 315 320 Lys Tyr Ile Gly Ala Tyr Ala Ala Ala Met Asn Gly Val Asp Ala Ile 325 330 335 Val Phe Thr Ala Gly Val Gly Glu Asn Ser Pro Ile Thr Arg Glu Asp 340 345 350 Val Cys Lys Tyr Leu Glu Phe Leu Gly Val Lys Leu Asp Lys Gln Lys 355 360 365 Asn Glu Glu Thr Ile Arg Gly Lys Glu Gly Ile Ile Ser Thr Pro Asp 370 375 380 Ser Arg Val Lys Val Leu Val Val Pro Thr Asn Glu Glu Leu Met Ile 385 390 395 400 Ala Arg Asp Thr Lys Glu Ile Val Glu Lys Ile Gly Arg 405 410

Claims (37)

  1. 화합물 6.5를 망간 (II) 염을 함유하는 완충된 용액에서 퓨린 뉴클레오시드 포스포릴라제 및 핵염기 또는 그의 유사체와 배합하는 것을 포함하는, 4'-에티닐 2'-데옥시 뉴클레오시드 또는 그의 유사체를 합성하는 방법.
    Figure pct00050

    상기 식에서 2X+는 (a) 2개의 양성자, (b) 1개의 양성자 및 1개의 1가 양이온, (c) 2개의 1가 양이온 (여기서 각각의 양이온은 동일하거나 상이함), 또는 (d) 1개의 2가 양이온이다.
  2. 제1항에 있어서, 4'-에티닐 2'-데옥시 뉴클레오시드 또는 그의 유사체가
    Figure pct00051

    인 방법.
  3. 제1항 또는 제2항에 있어서,
    Figure pct00052

    를 단리하는 것을 추가로 포함하는 방법.
  4. 제1항에 있어서, 화합물 6 및 포스포펜토뮤타제를 망간 (II) 염을 함유하는 완충된 용액에서 퓨린 뉴클레오시드 포스포릴라제 및 핵염기와 배합하는 것을 추가로 포함하는 4'-에티닐 2'-데옥시 뉴클레오시드 또는 그의 유사체를 합성하는 방법.
    Figure pct00053
  5. 제4항에 있어서, 반응 용액으로부터 무기 포스페이트 부산물을 제거하는 것을 추가로 포함하는 방법.
  6. 제5항에 있어서, (a) 수크로스 포스포릴라제 및 수크로스를 반응 혼합물에 첨가하거나 또는 (b) 칼슘, 마그네슘 또는 망간을 반응 혼합물에 첨가함으로써 반응 용액으로부터 무기 포스페이트 부산물을 제거하는 것을 포함하는 방법.
  7. 제4항 내지 제6항 중 어느 한 항에 있어서, 4'-에티닐 2'-데옥시 뉴클레오시드 또는 그의 유사체를 단리하는 것을 추가로 포함하는 방법.
  8. 제4항 내지 제6항 중 어느 한 항에 있어서, 4'-에티닐 2'-데옥시 뉴클레오시드 또는 그의 유사체가
    Figure pct00054

    인 방법.
  9. 제8항에 있어서,
    Figure pct00055

    를 단리하는 것을 추가로 포함하는 방법.
  10. 제4항에 있어서, 화합물 6을 합성하는 단계를 추가로 포함하며, 여기서 합성은 화합물 5를 수용액에서 아세트알데히드 및 데옥시리보스-포스페이트 알돌라제와 배합하여 화합물 6을 생성하는 것을 포함하는 것인 방법.
    Figure pct00056

    상기 식에서 2X+는 (a) 2개의 양성자, (b) 1개의 양성자 및 1개의 1가 양이온, (c) 2개의 1가 양이온 (여기서 각각의 양이온은 동일하거나 상이함), 또는 (d) 1개의 2가 양이온이다.
  11. 제10항에 있어서, 반응이 밀봉된 용기에서 수행되는 것인 방법.
  12. 제10항 또는 제11항에 있어서, 화합물 5를 합성하는 단계를 추가로 포함하며, 여기서 합성은 화합물 4를 완충된 용액에서 2가 금속 염의 존재 하에서 포스페이트 공급원으로서 ATP (여기서 ATP는 계내에서 재생됨)를 사용하여 판토테네이트 키나제와 배합하여 화합물 5를 생성하는 것을 포함하는 것인 방법.
    Figure pct00057
  13. 제12항에 있어서, ATP가 (a) 아세틸 포스페이트 및 아세테이트 키나제, 또는 (b) 피루베이트, 포스페이트 및 산소의 존재 하에서 피루베이트 옥시다제, 카탈라제 및 아세테이트 키나제 또는 (c) 이들의 조합을 이용하여 계내에서 재생되는 것인 방법.
  14. 제13항에 있어서, (a) 판토테네이트 키나제가 고정화되거나 또는 (b) 판토테네이트 키나제 및 아세테이트 키나제가 고정화되는 것인 방법.
  15. 제12항에 있어서, 화합물 4를 합성하는 단계를 추가로 포함하며, 여기서 합성은 화합물 3을 산소의 존재 하에서 완충된 용액에서 갈락토스 옥시다제, 구리, 카탈라제 및 퍼옥시다제 또는 산화제와 배합하여 화합물 4를 생성하는 것을 포함하는 것인 방법.
    Figure pct00058
  16. 제15항에 있어서, 갈락토스 옥시다제가 고정화되는 것인 방법.
  17. 화합물 5, 아세트알데히드 및 핵염기 또는 그의 유사체를 망간 (II) 염을 함유하는 완충된 용액에서 데옥시리보스-포스페이트 알돌라제, 포스포펜토뮤타제 및 퓨린 뉴클레오시드 포스포릴라제와 배합하는 것을 포함하는, 4'-에티닐 2'-데옥시 뉴클레오시드 또는 그의 유사체를 합성하는 방법.
    Figure pct00059

    상기 식에서 2X+는 (a) 2개의 양성자, (b) 1개의 양성자 및 1개의 1가 양이온, (c) 2개의 1가 양이온 (여기서 각각의 양이온은 동일하거나 상이함), 또는 (d) 1개의 2가 양이온이다.
  18. 제17항에 있어서, 반응 혼합물로부터 무기 포스페이트 부산물을 제거하는 것을 추가로 포함하는 방법.
  19. 제18항에 있어서, (a) 수크로스 포스포릴라제 및 수크로스를 반응 혼합물에 첨가하거나 또는 (b) 칼슘, 마그네슘, 또는 망간을 반응 혼합물에 첨가함으로써 반응 혼합물로부터 무기 포스페이트 부산물을 제거하는 것을 포함하는 방법.
  20. 제17항 내지 제19항 중 어느 한 항에 있어서, 4'-에티닐 2'-데옥시 뉴클레오시드를 단리하는 것을 추가로 포함하는 방법.
  21. 제17항 내지 제19항 중 어느 한 항에 있어서, 4'-에티닐 2'-데옥시 뉴클레오시드가
    Figure pct00060

    인 방법.
  22. 제21항에 있어서,
    Figure pct00061

    를 단리하는 것을 추가로 포함하는 방법.
  23. 화합물 6을 망간 (II) 염을 함유하는 완충된 용액에서 포스포펜토뮤타제와 배합하는 것을 포함하는, 화합물 6.5를 합성하는 방법.
    Figure pct00062

    Figure pct00063

    상기 식에서 2X+는 (a) 2개의 양성자, (b) 1개의 양성자 및 1개의 1가 양이온, (c) 2개의 1가 양이온 (여기서 각각의 양이온은 동일하거나 상이함), 또는 (d) 1개의 2가 양이온이다.
  24. 화합물 5를 수용액에서 아세트알데히드 및 데옥시리보스-포스페이트 알돌라제와 배합하여 화합물 6을 생성하는 것을 포함하는, 화합물 6을 합성하는 방법.
    Figure pct00064

    Figure pct00065

    상기 식에서 2X+는 (a) 2개의 양성자, (b) 1개의 양성자 및 1개의 1가 양이온, (c) 2개의 1가 양이온 (여기서 각각의 양이온은 동일하거나 상이함), 또는 (d) 1개의 2가 양이온이다.
  25. 화합물 4를 완충된 용액에서 2가 금속 염의 존재 하에서 포스페이트 공급원으로서 ATP (여기서 ATP는 계내에서 재생됨)를 사용하여 판토테네이트 키나제와 배합하는 것을 포함하는, 화합물 5를 합성하는 방법.
    Figure pct00066

    Figure pct00067

    상기 식에서 2X+는 (a) 2개의 양성자, (b) 1개의 양성자 및 1개의 1가 양이온, (c) 2개의 1가 양이온 (여기서 각각의 양이온은 동일하거나 상이함), 또는 (d) 1개의 2가 양이온이다.
  26. 제25항에 있어서, ATP가 (a) 아세틸 포스페이트 및 아세테이트 키나제, 또는 (b) 피루베이트, 포스페이트 및 산소의 존재 하에서 피루베이트 옥시다제, 카탈라제 및 아세테이트 키나제 또는 (c) 이들의 조합을 이용하여 계내에서 재생되는 것인 방법.
  27. 제26항에 있어서, (a) 판토테네이트 키나제가 고정화되거나 또는 (b) 판토테네이트 키나제 및 아세테이트 키나제가 고정화되는 것인 방법.
  28. 화합물 3을 산소의 존재 하에서 완충된 용액에서 갈락토스 옥시다제, 구리, 카탈라제, 및 퍼옥시다제 또는 산화제와 배합하여 화합물 4를 생성하는 것을 포함하는, 화합물 4를 합성하는 방법.
    Figure pct00068

    Figure pct00069
  29. 제28항에 있어서, 갈락토스 옥시다제가 고정화되는 것인 방법.
  30. (1) 화합물 4를 산소의 부재 하에서 물과 혼화성이 아닌 유기 용매에서 안정한 N,N-아세탈 또는 N,O-아세탈을 형성하는 아민, 디아민 또는 아미노 알콜과 반응시켜 아미날을 형성하고;
    (2) 아미날을 물과 혼화성이 아닌 유기 용매의 존재 하에서 유기 또는 무기 산과 반응시켜 화합물 4를 재생시키는 것을 포함하는, 화합물 4를 단리하는 방법.
    Figure pct00070
  31. 화합물 9를 완충된 용액에서 산소, 카탈라제, 및 퍼옥시다제 또는 화학적 산화제 중 어느 하나의 존재 하에서 갈락토스 옥시다제와 배합하여 화합물 5를 생성하는 것을 포함하는, 화합물 5를 합성하는 방법.
    Figure pct00071

    Figure pct00072

    상기 식에서 2X+는 (a) 2개의 양성자, (b) 1개의 양성자 및 1개의 1가 양이온, (c) 2개의 1가 양이온 (여기서 각각의 상기 양이온은 동일하거나 상이함), 또는 (d) 1개의 2가 양이온이다.
  32. 화합물 3을 완충된 용액에서 2가 금속 염의 존재 하에서 포스페이트 공급원으로서 ATP (여기서 ATP는 계내에서 재생됨)를 사용하여 판토테네이트 키나제와 배합하여 화합물 (9)를 생성하는 것을 포함하는, 화합물 9를 합성하는 방법.
    Figure pct00073

    Figure pct00074

    상기 식에서 2X+는 (a) 2개의 양성자, (b) 1개의 양성자 및 1개의 1가 양이온, (c) 2개의 1가 양이온 (여기서 각각의 상기 양이온은 동일하거나 상이함), 또는 (d) 1개의 2가 양이온이다.
  33. 하기 화합물.
    Figure pct00075
  34. 하기 화합물.
    Figure pct00076
  35. 하기 화합물.
    Figure pct00077

    상기 식에서 2X+는 (a) 2개의 양성자, (b) 1개의 양성자 및 1개의 1가 양이온, (c) 2개의 1가 양이온 (여기서 각각의 상기 양이온은 동일하거나 상이함), 또는 (d) 1개의 2가 양이온이다.
  36. 하기 화합물.
    Figure pct00078

    상기 식에서 2X+는 (a) 2개의 양성자, (b) 1개의 양성자 및 1개의 1가 양이온, (c) 2개의 1가 양이온 (여기서 각각의 상기 양이온은 동일하거나 상이함), 또는 (d) 1개의 2가 양이온이다.
  37. 하기 화합물.
    Figure pct00079

    상기 식에서 2X+는 (a) 2개의 양성자, (b) 1개의 양성자 및 1개의 1가 양이온, (c) 2개의 1가 양이온 (여기서 각각의 상기 양이온은 동일하거나 상이함), 또는 (d) 1개의 2가 양이온이다.
KR1020217003533A 2018-07-09 2019-07-02 4'-에티닐 뉴클레오시드 유사체의 효소적 합성 KR20210030399A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862695508P 2018-07-09 2018-07-09
US62/695,508 2018-07-09
US201962822320P 2019-03-22 2019-03-22
US62/822,320 2019-03-22
PCT/US2019/040316 WO2020014041A1 (en) 2018-07-09 2019-07-02 Enzymatic synthesis of 4'-ethynyl nucleoside analogs

Publications (1)

Publication Number Publication Date
KR20210030399A true KR20210030399A (ko) 2021-03-17

Family

ID=69143135

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217003533A KR20210030399A (ko) 2018-07-09 2019-07-02 4'-에티닐 뉴클레오시드 유사체의 효소적 합성

Country Status (10)

Country Link
US (2) US12037623B2 (ko)
EP (1) EP3820473A4 (ko)
JP (3) JP2021530479A (ko)
KR (1) KR20210030399A (ko)
CN (1) CN112996511B (ko)
AU (1) AU2019300832A1 (ko)
BR (1) BR112021000202B1 (ko)
CA (1) CA3105823C (ko)
MX (1) MX2021000278A (ko)
WO (1) WO2020014041A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022191612A1 (ko) 2021-03-08 2022-09-15 주식회사 엘지에너지솔루션 전지셀 및 이를 제조하는 전지셀 제조 장치

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11202107145SA (en) 2019-01-25 2021-08-30 Univ Brown Compositions and methods for treating, preventing or reversing age-associated inflammation and disorders
JP2022538229A (ja) * 2019-07-02 2022-09-01 コデクシス, インコーポレイテッド 操作された酢酸キナーゼバリアント酵素
CN110527704B (zh) * 2019-10-31 2020-03-13 烟台华康荣赞生物科技有限公司 一种合成乳-n-二糖的方法
IL305928A (en) * 2021-04-02 2023-11-01 Codexis Inc Transgenic enzymes of acetate kinase variant
CN116855471B (zh) * 2023-09-04 2023-11-28 江苏申基生物科技有限公司 一种嘌呤核苷磷酸化酶突变体及其应用
CN117143942A (zh) * 2023-10-30 2023-12-01 泰兴合全药业有限公司 3’-氨基-2’,3’-双脱氧鸟苷5’-三磷酸的合成方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2207504T3 (es) * 1999-05-12 2004-06-01 Yamasa Corporation Nucleosidos 4'-c-etinilpurina.
CA2382462A1 (en) 1999-08-20 2001-03-01 Roche Diagnostics Gmbh Enzymatic synthesis of deoxyribonucleosides
EP1178051B1 (en) 2000-02-10 2008-05-28 Mitsui Chemicals, Inc. Process for selectively producing 1-phosphorylated sugar derivative anomer and process for producing nucleoside
JP4058663B2 (ja) * 2000-09-22 2008-03-12 有機合成薬品工業株式会社 リボース1−リン酸類及びヌクレオシド化合物の製造方法
JP4058667B2 (ja) 2001-08-31 2008-03-12 有機合成薬品工業株式会社 2’−デオキシヌクレオシド化合物の製造方法
JP2003250570A (ja) 2002-03-04 2003-09-09 Yuki Gosei Kogyo Co Ltd 2’−デオキシリボヌクレオシド化合物の製造方法及びこの中間体の製造方法、並びにこれらに使用する2−デオキシリボース5−リン酸アルドラーゼ遺伝子
CA2502109C (en) 2004-03-24 2010-02-23 Yamasa Corporation 4'-c-substituted-2-haloadenosine derivative
JP5120949B2 (ja) * 2008-07-28 2013-01-16 独立行政法人産業技術総合研究所 白色蛍光体の製造方法
CN105879047A (zh) 2008-12-16 2016-08-24 建新公司 寡糖-蛋白缀合物
CN107746834A (zh) 2013-03-27 2018-03-02 辉瑞爱尔兰制药公司 用于制备普瑞巴林的方法和中间体
WO2015143712A1 (en) * 2014-03-28 2015-10-01 Merck Sharp & Dohme Corp. 4'-substituted nucleoside reverse transcriptase inhibitors
CA3103819A1 (en) * 2018-07-09 2020-01-16 Codexis, Inc. Engineered pantothenate kinase variant enzymes
AU2019300837A1 (en) 2018-07-09 2021-01-07 Codexis, Inc. Engineered galactose oxidase variant enzymes
KR20210031933A (ko) 2018-07-09 2021-03-23 코덱시스, 인코포레이티드 조작된 포스포펜토뮤타제 변이체 효소
CA3103721A1 (en) * 2018-07-09 2020-01-16 Codexis, Inc. Engineered deoxyribose-phosphate aldolases
KR20210031926A (ko) * 2018-07-09 2021-03-23 코덱시스, 인코포레이티드 조작된 퓨린 뉴클레오사이드 포스포릴라제 변이체 효소

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022191612A1 (ko) 2021-03-08 2022-09-15 주식회사 엘지에너지솔루션 전지셀 및 이를 제조하는 전지셀 제조 장치

Also Published As

Publication number Publication date
US20240301460A1 (en) 2024-09-12
US12037623B2 (en) 2024-07-16
JP2023123750A (ja) 2023-09-05
CN112996511B (zh) 2024-08-09
JP2021530479A (ja) 2021-11-11
CA3105823C (en) 2023-07-25
US20220228184A1 (en) 2022-07-21
AU2019300832A1 (en) 2021-02-04
WO2020014041A1 (en) 2020-01-16
CN112996511A (zh) 2021-06-18
MX2021000278A (es) 2021-03-31
BR112021000202A2 (pt) 2021-08-10
BR112021000202A8 (pt) 2022-12-27
CA3105823A1 (en) 2020-01-16
EP3820473A1 (en) 2021-05-19
JP7482188B2 (ja) 2024-05-13
JP2023012498A (ja) 2023-01-25
EP3820473A4 (en) 2022-05-11
BR112021000202B1 (pt) 2023-03-28

Similar Documents

Publication Publication Date Title
KR20210030399A (ko) 4&#39;-에티닐 뉴클레오시드 유사체의 효소적 합성
US8728789B2 (en) DNA fragment encoding a polyphosphate-driven nucleoside 5′-diphosphate kinase polypeptide
KR20160030876A (ko) 약제학적 활성 성분들로써 뉴클레오시드 유사체들의 생물촉매적 생산
CN114075585A (zh) 一种β-烟酰胺单核苷酸的制备方法
CN106701723B (zh) D-果糖-6-磷酸醛缩酶a突变体、重组表达载体、基因工程菌及其应用和反应产物
JPWO2006085535A1 (ja) テトラヒドロビオプテリン生合成酵素を用いたビオプテリン類の製造方法
AU2018344883B2 (en) Cellular transport system for transferring a sulfonic acid construct carrying a cargo into the cytoplasm of a cell
RU2816846C2 (ru) Ферментативный синтез 4’-этинилнуклеозидных аналогов
JP7510573B2 (ja) 抗ウイルス性ヌクレオシドの合成
US20240140920A1 (en) Synthesis of uridine
CN116744938A (zh) 抗病毒核苷的合成
JP6286036B2 (ja) 人工補因子の合成のためのs−アデノシルメチオニン(sam)シンターゼ変異体
US20230174992A1 (en) Reductase enzymes and processes for making and using reductase enzymes
EP4153189A1 (en) Synthesis of fluorinated nucleotides
WO2022212230A1 (en) Synthesis of fluorinated cyclic dinucleotides
WO2024129235A1 (en) Enzymatic synthesis of ntp and nqp
CN118726510A (zh) 一管法酶促合成加帽mRNA的方法
CN116555378A (zh) 制备核糖核苷或其衍生物的方法、生物酶制剂及其应用
KR20060095772A (ko) α-1-인산화-2-데옥시-2-플루오로아라비노시드 및2’-데옥시-2’-플루오로-β-D-아라비노뉴클레오시드의제조법
KR20040031866A (ko) 데옥시당의 중간체인티디피-4-케토-6-데옥시-디-글루코즈의 생합성 방법, 이를위한 재조합 효소들, 재조합 벡터들 및 형질전환체들

Legal Events

Date Code Title Description
E902 Notification of reason for refusal