KR20220149587A - 시스틴의 생체촉매적 환원을 위한 효소-촉매화된 산화환원 시스템의 코어 구성요소로서의 생체촉매 - Google Patents

시스틴의 생체촉매적 환원을 위한 효소-촉매화된 산화환원 시스템의 코어 구성요소로서의 생체촉매 Download PDF

Info

Publication number
KR20220149587A
KR20220149587A KR1020227034139A KR20227034139A KR20220149587A KR 20220149587 A KR20220149587 A KR 20220149587A KR 1020227034139 A KR1020227034139 A KR 1020227034139A KR 20227034139 A KR20227034139 A KR 20227034139A KR 20220149587 A KR20220149587 A KR 20220149587A
Authority
KR
South Korea
Prior art keywords
ala
gly
protein
leu
enzyme
Prior art date
Application number
KR1020227034139A
Other languages
English (en)
Inventor
카르슈텐 보른회프트
구이도 야흐
몬로이 잉리트 토레스
페터 벨테르스
Original Assignee
와커 헤미 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 와커 헤미 아게 filed Critical 와커 헤미 아게
Publication of KR20220149587A publication Critical patent/KR20220149587A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0051Oxidoreductases (1.) acting on a sulfur group of donors (1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/12Methionine; Cysteine; Cystine
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y108/00Oxidoreductases acting on sulfur groups as donors (1.8)
    • C12Y108/01Oxidoreductases acting on sulfur groups as donors (1.8) with NAD+ or NADP+ as acceptor (1.8.1)
    • C12Y108/01009Thioredoxin-disulfide reductase (1.8.1.9), i.e. thioredoxin-reductase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y108/00Oxidoreductases acting on sulfur groups as donors (1.8)
    • C12Y108/04Oxidoreductases acting on sulfur groups as donors (1.8) with a disulfide as acceptor (1.8.4)
    • C12Y108/04008Phosphoadenylyl-sulfate reductase (thioredoxin) (1.8.4.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y108/00Oxidoreductases acting on sulfur groups as donors (1.8)
    • C12Y108/04Oxidoreductases acting on sulfur groups as donors (1.8) with a disulfide as acceptor (1.8.4)
    • C12Y108/0401Adenylyl-sulfate reductase (thioredoxin) (1.8.4.10)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 시스틴을 시스테인으로 환원시키기 위한 효소에 관한 것이며, 상기 효소는 KEGG 데이터베이스 번호 EC 1.8.4.8 또는 EC 1.8.4.10을 갖는 티오레독신(thioredoxin)(단백질 i) 및 KEGG 데이터베이스 번호 EC 1.8.1.9를 갖는 티오레독신 리덕타제(thioredoxin reductase)(단백질 ii)의 단백질 활성을 포함하는 융합 단백질이고, 상기 융합 단백질의 활성은 동일하지만 비융합된 개별 단백질 i과 ii의 혼합물의 활성의 적어도 100%인 것을 특징으로 한다. 나아가, 본 발명은 상기 융합 단백질을 사용하여 보조인자의 존재 하에 시스틴을 시스테인으로 효소적으로 환원시키는 방법에 관한 것이다.

Description

시스틴의 생체촉매적 환원을 위한 효소-촉매화된 산화환원 시스템의 코어 구성요소로서의 생체촉매
본 발명은 시스틴을 시스테인으로 환원시키기 위한 효소에 관한 것이며, 상기 효소는 KEGG 데이터베이스 번호 EC 1.8.4.8 또는 EC 1.8.4.10을 갖는 티오레독신(thioredoxin)(단백질 i) 및 KEGG 데이터베이스 번호 EC 1.8.1.9를 갖는 티오레독신 리덕타제(thioredoxin reductase)(단백질 ii)의 단백질 활성을 포함하는 융합 단백질이고, 상기 융합 단백질의 활성은 동일하지만 비융합된 개별 단백질 i과 ii의 혼합물의 활성의 적어도 100%인 것을 특징으로 한다. 나아가, 본 발명은 상기 융합 단백질을 사용하여 보조인자의 존재 하에 시스틴을 시스테인으로 효소적으로 환원시키는 방법에 관한 것이다.
Cys 또는 C로도 약칭되는 시스테인은 측쇄 -CH2-SH를 갖는 α-아미노산이다. 천연 발생 거울상 이성질체 형태가 L-시스테인이고 이것만 단백질형성 아미노산이기 때문에, 본 발명의 맥락에서 용어 시스테인이 기술어 없이 사용될 때 이는 L-시스테인이다. 설피드릴기의 산화는 2개의 시스테인 잔기를 초래하며 이들 잔기는 함께 디설파이드 결합을 형성할 수 있고, 결과적으로 시스틴이 형성되며, 이러한 시스틴에도 동일한 언급이 적용되는데, 즉, 기술어의 부재 시, 본 발명에서 의미하는 것은 L-거울상 이성질체(또는 R,R-시스틴)이다. L-시스테인은 인간에 대해 준필수 아미노산인데, 이것이 아미노산 메티오닌으로부터 형성될 수 있기 때문이다.
아미노산 L-시스테인은 예를 들어 식품 첨가제로서(특히 제과 산업에서), 화장품 내 원료로서, 그리고 활성 약학적 성분(특히 N-아세틸시스테인 및 S-카르복시메틸시스테인)의 생산을 위한 출발 물질로서 사용되고, 따라서 경제적으로 중요하다. 식품 산업에서 착향료 성분으로서(예를 들어 닭 또는 육류 착향료로서) 시스테인의 사용은 특히 중요한 것으로 보여진다. L-시스테인은 또한 예를 들어 주스에서 항산화제로서 그리도 도우(dough)의 유변학을 변형시키는 데 사용된다.
모든 유기체에서, L-시스테인은 항 대사에 핵심적인 역할을 한다. 이는 단백질, 메티오닌, 비오틴, 리포산, 글루타티온, 및 다른 황-함유 대사산물의 합성에 사용된다. L-시스테인은 또한 조효소 A의 생합성에 사용된다. 효소에서, 티올기는 종종 반응의 촉매작용에 중요한 역할을 하고, 분자내 또는 분자간 디설파이드 결합의 형성을 통해 단백질을 안정화시킨다.
L-시스테인은 케라틴-함유 물질, 예컨대 모발, 털(bristle), 손톱, 발굽, 깃털, 및 뿔로부터의 가수분해에 의해 수득될 수 있다. 그러나, 이러한 과정은 항상 생물안전성 및 환경 보호에 대한 문제를 제기한다. 이들은 또한 낮은 생산성을 가진다. 대안으로서, L-시스테인의 전구체로부터의 생물전환(biotransformation)에 의한 생산 및 발효 생산을 위한 과정이 개발되었다(US 6 218 168 B1, US 5 972 663 A, US 2004-038352 A, CA 2 386 539 A2, EP 2 138 585, EP 1 769 080, 및 EP 2 726 625 B1).
발효 생산의 단점은 L-시스테인의 낮은 수율이며(심지어 최적화된 발효 제어 후에도), 이 또한 시스테인이 대기중 산소의 존재 하에 산화한 다음 주로 디설파이드 L-시스틴으로서 존재하고 이 형태로 수득될 수 있기 때문이다.
산화 반응은 가역적이며, 결과적으로 L-시스틴은 선택적 환원에 의해 L-시스테인으로 다시 전환될 수 있다. 그러나, L-시스틴이 세포로부터의 분리(예를 들어 디캔터(decanter)를 사용함) 후 전기분해에 의해 L-시스테인으로 다시 환원된다면, 이러한 화학적 전환은 이러한 L-시스테인이 착향료 규제(Regulation on Flavorings)에 따라 천연적인 것으로 신고될 수 없음을 의미한다.
유럽 착향료 규제(1334/2008 식품 표시 규정 개편에 관한 규정 제22조)에 따르면, 천연 착향료는 하기와 같이 정의된다: "천연" 착향료는 천연적으로 발생하고 자연에서 검출되어 온 향미 특성을 갖는 화학적으로 정의된 성분이다. 이들은 식물, 동물 또는 미생물 기원의 출발 물질로부터 적합한 물리적, 효소적 또는 미생물 과정에 의해 수득되며, 이는 그 자체로 사용되거나 하나 이상의 종래의 식품 제조 과정에 의해 인간 소비용으로 제조된다.
용어 "천연"은 본 명세서에서 이러한 의미로 많이 사용된다. 착향료의 생산에서 천연 원료의 사용에 큰 관심이 있다.
효소적 절단은 높은 발효적 시스틴 수율을 이용하여 천연 시스테인의 생산을 허용할 것이다. 이러한 효소적 과정의 성능에 대해, 적합한 산화환원 효소 캐스케이드 시스템이 필요하다. 기재되어 온 디설파이드-절단 효소의 예는 티오레독신, 글루타레독신, 및 디설파이드 이소머라제를 포함한다. 그러나, 이들 효소는 단백질의 2개의 하위단위 사이에서 또는 폴리펩타이드 내에서 형성된 디설파이드에 가장 빈번하게 작용한다. 자유(free) 시스틴의 절단은 단지 몇몇 단백질에 대해서만, 예를 들어 박테리아 티오레독신에 대해서만 기재되었고, 이는 결국 티오레독신 리덕타제에 의해 재생되며, 이를 위해 NADPH가 보조인자로서 필요하다. 이러한 산화환원 효소 또는 효소 캐스케이드는 종종 환원 반응을 위해 상응하는 전자를 제공하는 보조인자로서 NADH 또는 NADPH를 필요로 한다.
이에, 시스틴 리덕타제는 이것이 기질 시스틴을 사용하고 NADPH 또는 NADH와 같은 보조인자의 도움으로 2개의 전자를 전달하여 2개의 시스테인을 최종 생성물로서 형성하는 것을 특징으로 한다.
이는 따라서, 보조인자가 반응에 등몰량으로 첨가되어야 함을 의미하며, 이는 비용-집약적이고 따라서 경제적으로 선호할 만하지 않다. 이는 보조인자를 재생하기 위한 제2 반응과 결합됨으로써 피해질 수 있다. 재생 시스템으로서, 데하이드로게나제, 예컨대 알코올 데하이드로게나제(alcohol dehydrogenase) 또는 글루코스-6-포스페이트 데하이드로게나제를 사용하는 것이 가능하다. 경제적인 관점에서, 이들 효소를 발효에 의해 상응하게 높은 수율로 많이 생산하는 것이 가능해야 한다.
필요한 효소를 생산하는 데 관여하는 노력이 효소의 수에 따라 증가하기 때문에, 개별 효소를 유전자 조작에 의해 융합하는 것이 경제적으로 의미있다. 이는 기질이 가까운 공간적 근접성 덕분에 하나의 효소로부터 다음 효소로 더 쉽게 이동할 수 있다는 점에서 추가 이점을 가질 수 있다. 그러나, 이러한 효소 융합은 종종 더 불량한 발효 생산성을 초래하거나 심지어 융합 단백질은 감소된 활성을 갖거나 심지어 활성을 전혀 갖지 않는다. 2개의 효소가 융합 단백질에서 상호 저해 효과를 갖는 것을 방지하기 위해, 2개의 단백질을 연결/분리하는 더 긴 링커 서열이 대신에 종종 이용된다. 매우 짧은 링커 서열이 이용되거나 링커 서열이 전혀 이용되지 않을 때 융합 단백질이 출발 단백질의 혼합물과 비교하여 필적할 만한 활성을 보여주는 것은 드문 일이다.
미코박테리움 레프래(Mycobacterium leprae)(Wieles B. 1995, J. Biol. Chem. 270, pp. 25604-25606)에서, 티오레독신 및 티오레독신 리덕타제로서 활성인 단백질이 발견되며, 상기 단백질의 N-말단은 티오레독신 리덕타제에 상동성이고 C-말단은 티오레독신에 상동성이다. 2개의 단백질 단위를 이. 콜라이로부터의 상동성 단백질과 비교할 때, 이들은 엠. 레프래(M. leprae)에서 22-아미노산 스페이서/링커를 통해 연결된다.
본 발명의 목적은 저렴하게 생산될 수 있고 종래 기술에 알려진 티오레독신과 티오레독신 리덕타제 단백질의 혼합물만큼 적어도 높은 활성을 갖는, 시스틴으로부터 시스테인으로의 생체촉매적 환원을 위한 단백질을 제공하는 것이다. 시스틴을 시스테인으로 효소적으로 환원시키기 위한 과정에서 이 단백질을 사용함으로써, 특히 효율적이고 경제적인 과정이 제공되어야 한다.
이러한 목적은 본 발명은 시스틴을 시스테인으로 환원시키기 위한 효소를 제공함으로써 달성되며, 상기 효소는 KEGG 데이터베이스 번호 EC 1.8.4.8 또는 EC 1.8.4.10을 갖는 티오레독신(단백질 i) 및 KEGG 데이터베이스 번호 EC 1.8.1.9를 갖는 티오레독신 리덕타제(단백질 ii)의 단백질 활성을 포함하는 융합 단백질이고, 상기 융합 단백질의 활성은 동일하지만 비융합된 개별 단백질 티오레독신과 티오레독신 리덕타제의 혼합물의 활성의 적어도 100%인 것을 특징으로 한다.
본 발명에 따르면, 시스틴을 시스테인으로 환원시키기 위한 효소는 단백질 i 및 ii의 단백질 활성을 포함하는 융합 단백질이다. 이는, 단백질 i(Trx로서, KEGG 데이터베이스 번호 EC 1.8.4.8 또는 EC 1.8.4.10에 기재됨)의 활성 및 단백질 ii(TR로서, KEGG 데이터베이스 번호 EC 1.8.1.9에 기재됨)의 활성을 책임지는 코딩 서열(cds)이 융합됨을 의미한다. 제1 cds 다음에 존재하는 정지 코돈을 제거함으로써, 2개의 cds는 단일 cds로서 함께 발현된다.
Trx의 단백질 활성은 활성 부위에서 디설파이드 결합을 갖고 환원된 또는 산화된 상태로 존재할 수 있는 옥시도리덕타제(oxidoreductase)이다.
반응에서, 2개의 전자는 2개의 설피드릴기로부터 디설파이드 결합(분자내 또는 분자간)으로 전달된다. 분자내 디설파이드 결합은 여기서 Trx에서 형성된다. 그 후에, 환원된 상태의 Trx는 옥시도리덕타제 TR의 촉매 활성에 의해 복구된다. 이는 디설파이드 결합의 절단과 함께 Trx로 전달되는 전자를 필요로 한다.
단백질이 시스틴에 대해 Trx 및/또는 TR로서 활성인지의 여부(이하 단백질이 활성을 둘 다 가질 때 시스틴 리덕타제/CR 활성으로 지칭됨)는 하기 시험의 도움으로 체크될 수 있다:
우선, NADPH의 소모는 340 nm에서 광도적으로(photometrically) 측정될 수 있다. 융합 단백질, 기질 시스틴, 및 보조인자 NADPH를 포함하는 혼합물에서, 전자는 NADPH로부터 시스틴으로 전달되고, 이때 시스테인이 형성된다. 그 후에, NADPH의 소모는 광도적으로 모니터링될 수 있다.
대안적으로, 형성되는 시스테인이 또한 이러한 혼합물(융합 단백질, 시스틴, 및 NADPH를 포함함)에서 측정될 수 있다. 이는 염료의 형성과 함께 DTNB(5,5'-디티오비스-2-니트로벤조산; 엘만 시약)와 반응하는 시스테인의 자유 -SH 기의 능력을 사용한다. 이러한 착색된 화합물 Cys-TNB는 412 nm에서 측정될 수 있다. 그러므로, 시간에 따른 이 반응의 경과는 시스틴에 대한 융합 단백질의 효소 활성이 측정되게 할 수 있다.
단백질 i 및 단백질 ii는 바람직하게는 미생물 서열이다.
티오레독신(단백질 i)은 바람직하게는 이. 콜라이로부터의 티오레독신 1(본 발명의 맥락에서 TrxA로 약칭됨)의 단백질 활성이다.
티오레독신 리덕타제(단백질 ii)는 바람직하게는 이. 콜라이로부터의 티오레독신 리덕타제(본 발명의 맥락에서 TrxB로 약칭됨)의 단백질 활성이다.
융합 단백질이 2개의 아미노산 서열을 포함하며, 이들 아미노산 서열 중 하나는 SEQ ID No. 7과 적어도 50%, 바람직하게는 적어도 70%, 특히 바람직하게는 적어도 90% 동일하고 다른 아미노산 서열은 SEQ ID No. 8과 적어도 50%, 바람직하게는 적어도 70%, 특히 바람직하게는 적어도 90% 동일하고, 융합 단백질은 CR 활성을 갖는 것이 특히 바람직하다.
이에, 융합 단백질은 TrxAB 또는 TrxBA/TrxB5A로 지정되며, 융합 단백질 TrxAB에서 단백질 TrxA는 TrxB에 대해 N-말단적으로 위치한다. 반대로, 융합 단백질 TrxBA 또는 TrxB5A에서 단백질 TrxB는 TrxA에 대해 N-말단적으로 위치한다. 융합 단백질이 TrxAB, TrxBA 또는 TrxB5A인 것이 바람직하다. 융합 단백질은 특히 바람직하게는 이. 콜라이로부터의 티오레독신 B와 티오레독신 A의 아미노산 서열의 융합이고, 특히 바람직하게는 아미노산 서열 중 하나는 SEQ ID No. 9, SEQ ID No. 10, 및 SEQ ID No. 28로 이루어진 군으로부터 선택된다.
특히 바람직한 구현예에서, 융합 단백질은 TrxBA이고, 특히 바람직하게는 SEQ ID No. 10을 갖는 아미노산 서열이다.
DNA 동일성 정도는 "뉴클레오타이드 블라스트(blast)" 프로그램에 의해 결정되며, 이는 http://blast.ncbi.nlm.nih.gov/에서 찾을 수 있고 blastn 알고리즘에 기초한다. 디폴트 파라미터는 2개 이상의 뉴클레오타이드 서열의 정렬을 위한 알고리즘 파라미터로서 사용되었다. 디폴트 일반 파라미터는 하기이다: 최대 표적 서열 = 100; 쇼트 쿼리(Short queries) = "짧은 투입 서열에 대한 파라미터의 자동 조정(Automatically adjust parameter for short input sequence)"; 예상 역치(Expect Threshold) = 10; 워드 사이즈(Word size) = 28; 짧은 투입 서열에 대한 파라미터의 자동 조정 = 0. 상응하는 디폴트 채점 파라미터는 하기이다: 매치/미스매치 점수 = 1,-2; 갭 코스트(Gap Costs) = 선형.
단백질 서열은 http://blast.ncbi.nlm.nih.gov/에서 "단백질 블라스트" 프로그램을 사용하여 비교된다. 이 프로그램은 blastp 알고리즘을 사용한다. 디폴트 파라미터는 2개 이상의 단백질 서열의 정렬을 위한 알고리즘 파라미터로서 사용되었다. 디폴트 일반 파라미터는 하기이다: 최대 표적 서열 = 100; 쇼트 쿼리 = "짧은 투입 서열에 대한 파라미터의 자동 조정"; 예상 역치 = 10; 워드 사이즈 = 3; 짧은 투입 서열에 대한 파라미터의 자동 조정 = 0. 디폴트 채점 파라미터는 하기이다: 매트릭스 = BLOSUM62; 갭 코스트 = 존재(Existence): 11 익스텐션(Extension): 1; 조성 조정 = 조건부 조성 점수 매트릭스 조정.
본 발명의 맥락에서, 단백질, 예컨대 TrxA, TrxB, TrxAB, TrxBA, TrxB5A 또는 Ml-TrxBA는 대문자로 시작하는 반면, 이들 단백질을 코딩하는 서열(cds로도 약칭됨)은 소문자로 식별된다(trxA, trxB, trxAB, trxBA, trxB5A 또는 Ml-trxBA).
본 발명의 맥락에서, 용어 융합 단백질은 상기 단백질이 2개의 개별 단백질 티오레독신(Trx) 및 티오레독신 리덕타제(TR)를 포함함을 의미한다. 이는 유전자에 의해 인코딩되며, 이의 코딩 영역은 Trx 코딩 영역 및 TR 코딩 영역을 포함하고, 그 결과 이들은 폴리펩타이드로서 전사되고 번역되는 단일 단위로서 함께 존재한다.
2개의 개별 단백질 Trx 및 TR을 사용하는 것과 비교하여 Trx와 TR을 함유하는 융합 단백질을 사용하는 특정 이점은 2개의 단백질의 공간 내 위치로 인한 것이다: TR은 전자를 Trx에 전달하며, Trx 및 TR은 우선 3-차원 확산 과정에서 서로 만나게 될 필요가 없지만, 융합 단백질에서 서로 연결된다. 다시 말해, 공간적 근접성은 전자가 하나의 효소로부터 다른 효소로 더 쉽게 통과할 수 있음을 의미한다.
개별 단백질은 별개로 정제되어야 하는 반면, 융합 단백질에서의 효소 활성은 함께 단리되고, 이는 또한 큰 경제적 이점이다.
바람직하게는, 융합 단백질은 정제에 일조하기 위한 서열, 예컨대 특히 바람직하게는 폴리히스티딘 태그(His-태그)를 추가로 포함한다. His-태그는 단백질 정제 및 태깅된 단백질의 검출에 사용될 수 있는 단백질 태그이다. 폴리히스티딘 태그의 아미노산 서열은 적어도 6개 히스티딘(6HIS)의 서열이며, 이의 유전자 서열은 출발 메티오닌 코돈 다음에 N-말단적으로 또는 정지 코돈 앞에서 C-말단적으로 cds 내로 클로닝된다. 이는 폴리히스티딘 태그를 갖는 융합 단백질을 생성한다. 단지 하나의 His-태그의 클로닝은 단백질 Trx 및 TR로 이루어진 융합 단백질을 정제하는 것을 가능하게 한다. 이는 정제에 더 적은 수의 반응 단계가 필요할 뿐만 아니라, 클로닝 전략이 크게 단순화됨을 의미한다.
이에 더하여, 폴리펩타이드 서열과 His-태그 사이에 인테인(intein) 또는 프로테아제에 대한 절단 부위를 삽입하여, 단백질 정제 후 His-태그가 절단되어 나오게 하는 것이 가능하다.
N-말단적으로 위치한 단백질의 아미노산 서열은 1개 내지 최대 5개 아미노산만큼 C-말단적으로 단축된 융합 단백질에 존재하는 것이 바람직하다. N-말단적으로 위치한 단백질의 아미노산 서열은 1개 아미노산만큼 C-말단적으로 단축된 융합 단백질에 존재하는 것이 특히 바람직하다.
C-말단적으로 위치한 단백질의 아미노산 서열은 1개 내지 최대 5개 아미노산만큼, 특히 바람직하게는 1개 아미노산만큼 N-말단적으로 단축된 융합 단백질에 존재하는 것이 바람직하다. 특히 바람직하게는, 개시 코돈은 융합 단백질에서 C-말단적으로 위치한 단백질에 부재한다. 이러한 후자의 특질은 이 지점에서 번역이 새로 시작될 위험이 없다는 이점을 갖는다.
이에 더하여, 티오레독신(단백질 i) 및 티오레독신 리덕타제(단백질 ii)의 융합된 단백질 활성의 아미노산 서열은 융합 단백질에서 1개 내지 최대 5개 아미노산, 특히 바람직하게는 1개 아미노산의 링커 서열에 의해 연결되는 것이 바람직하다.
융합된 단백질 티오레독신(단백질 i) 및 티오레독신 리덕타제(단백질 ii)의 아미노산 서열은 융합 단백질에서 서로 직접 이어져 있으며, 즉, 어떠한 링커 서열도 존재하지 않는 것이 특히 바람직하다.
상기 언급된 바와 같이, 융합 단백질에서 이의 클로닝, 정제, 및 활성을 향상시키기 위해 협력해서 작용하는 단백질을 망라하는 것이 유리하다. 그러나, 2개의 융합 단백질의 접힘(folding) 또는 이 경우 필요한 이들 사이의 상호작용을 방해하지 않기 위해, 길이가 긴 링커 서열의 사용은 권할 만한 것으로 여겨질 것이다. 그러나, 놀랍게도, 이 경우 2개 단백질(Trx, TR)의 직접 융합이 기능적 효소쌍을 초래하였다는 것이 발견되었다. 이는 융합 단백질의 활성이 융합 순서에 의존한다는 발견에 의해 강조된다. 그러므로, 융합 단백질 TrxAB는 개별 단백질의 혼합물과 필적할 만한 활성을 나타내었다.
융합 단백질 TrxAB(SEQ ID No. 9)에서 정지 코돈은 TrxA 서열(SEQ ID No. 7)에서 부재하는 한편, TrxB(SEQ ID No. 8)에서 첫번째 아미노산(메티오닌, M)은 결실되었다. 이에 더하여, 단백질은 His-태그(SEQ ID No. 9에서 아미노산 1-12)를 운반한다. TrxA의 마지막 아미노산(Ala)과 개시 코돈의 제거 후 TrxB의 첫번째 아미노산(Gly) 사이에 어떠한 링커 서열도 존재하지 않는다.
융합 단백질 TrxBA(SEQ ID No. 10)에서 마지막 아미노산(리신) 및 정지 코돈은 TrxB 서열(SEQ ID No. 8)에 부재하는 한편, TrxA(SEQ ID No. 7)에서 첫번째 아미노산(메티오닌, M)은 결실되었다. 이에 더하여, 단백질은 His-태그(SEQ ID No. 10에서 아미노산 1-12)를 운반한다. 하나의 아미노산(Gly)의 링커 서열은 TrxB의 끝에서 두번째(penultimate) 아미노산(Ala)과 TrxA의 첫번째 아미노산(Ser) 사이에 존재한다.
융합 단백질 TrxB5A(SEQ ID No. 28)에 대해, TrxBA에 대해 기재된 바와 같은 동일한 것이 적용되는데, 단, TrxB와 TrxA 사이에 5개 아미노산(Gly-Pro-Ala-Pro-Gly)의 링커 서열이 존재한다.
융합 단백질의 아미노산 서열을 코딩하는 개시 코돈과 정지 코돈 사이에 위치한 영역은 코딩 서열(cds)로 지칭된다. Cds는 비-코딩 영역에 의해 둘러싸인다. 유전자로 지칭되는 것은 생물학적으로 기능적인 단백질을 생산하기 위한 모든 염기 정보를 함유하는 DNA의 구획(section)이다. 유전자는, 단일-가닥 RNA 사본이 전사에 의해 생산되고 또한 이러한 복사(copying) 과정의 조절에 관여하는 발현 신호가 생산되는 DNA의 구획을 함유한다. 발현 신호는 예를 들어 적어도 하나의 프로모터, 전사 개시, 번역 개시, 및 리보솜 결합 부위를 포함한다. 이에 더하여, 종결자 및 하나 이상의 오퍼레이터(operator)에 의한 발현 조절이 가능하다.
기능적 프로모터에 대해, 이러한 프로모터의 조절 하에 cds는 RNA로 전사된다.
융합 단백질(티오레독신)의 단백질 i를 인코딩하는 DNA의 구획은 먼저 올리고뉴클레오타이드를 프라이머로서 사용하고 티오레독신을 인코딩하는 DNA 매트릭스, 예를 들어 이. 콜라이로부터 단리된 게놈 DNA를 사용하는 PCR에 의해 증폭된 다음, 각각의 경우 융합 단백질의 단백질 ii 서열(티오레독신 리덕타제)을 포함하고 유사한 방식으로 생성되었던 DNA 분자와 표준 분자 생물학 기법에 의해 접합될 수 있으며, 이러한 방식으로 인-프레임(in-frame) 융합이 발생한다. 단백질 i과 ii 사이에서 융합 단백질에 존재하는 C-말단적으로 위치한 융합 파트너의 두번째 개시 코돈은 대안적인 리딩 프레임(reading frame)을 피하기 위해 결실될 수 있다. 2개 융합 파트너의 이행점(transition point)에서, 다양한 길이의 링커 서열이 삽입될 수 있다.
클로닝 부위를 통한 융합에 대한 대안으로서, 전체 DNA 분자가 유전자 합성에 의해 생성될 수 있다. 그 후에, 이러한 DNA 분자는 기지의 방법에 의해 벡터, 예를 들어 플라스미드 내로 도입되거나, 박테리아 균주의 염색체 내로 직접 통합될 수 있다. 바람직하게는 DNA 분자는 플라스미드, 예를 들어 기지의 발현 벡터의 유도체, 예컨대 pJF118EH, pKK223-3, pUC18, pBR322, pACYC184, pASK-IBA3, pGJ3477 또는 pET 내로 도입된다.
DNA 분자가 주로 융합 단백질의 코딩 서열 및 소수의 다른 뉴클레오타이드를 운반하고 따라서 클로닝이 프로모터 및 종결자로부터 정의된 거리에서 발생하도록 플라스미드 내로 클로닝되는 것, 즉, DNA 분자가 프로모터를 인코딩하는 영역의 3'에서 그리고 종결자를 인코딩하는 영역의 5'에서 플라스미드 내로 클로닝되는 것이 바람직하다.
적합한 프로모터는 당업자에게 알려진 모든 프로모터, 예컨대 항시적 프로모터, 예를 들어 GAPDH 프로모터, 또는 유도성 프로모터, 예를 들어 lac, tac, trc, 람다(lambda) PL, araB, 쿠메이트(cumate) 또는 tet 프로모터 또는 이로부터 유래된 서열이다. 융합 단백질은 특히 바람직하게는 아라비노스-유도성 araB 프로모터(PBAD)의 제어 하에 발현된다.
사용되는 플라스미드는 선택 마커를 운반할 수 있다. 선택 마커로서 적합한 것은 항생제, 예컨대 앰피실린, 테트라사이클린, 클로람페니콜, 카나마이신 또는 다른 것에 대한 내성을 코딩하는 유전자이다. 플라스미드는 바람직하게는 유전자의 발현이 앰피실린 내성을 부여하는 이러한 유전자를 함유한다. 또한 영양요구성(auxotrophy) 마커가 선택 마커로서 적합한데, 이들 영양요구성 마커가, 플라스미드를 함유하는 각각의 박테리아 균주에서 결실되는, 대사에 필수적인 유전자를 코딩하기 때문이다.
플라스미드는 당업자에게 알려진 방법을 사용하여 박테리아 균주의 세포 내로 도입될 수 있다(형질전환). 박테리아 균주는 바람직하게는 상기 박테리아 균주가 그람-음성 박테리아, 특히 바람직하게는 엔테로박테리아세애(Enterobacteriaceae) 속의 박테리아 균주, 특히 바람직하게는 에스케리키아 콜라이(Escherichia coli)(이. 콜라이) 종의 균주인 것을 특징으로 한다.
플라스미드를 함유하는 박테리아 균주는 발효 과정에 사용될 수 있으며, 즉, 박테리아 세포는 배지에서, 바람직하게는 선택적 LB 배지(플라스미드에 존재하는 선택 마커에 상응함)에서 전파될 수 있고, 배양 후 상층액의 폐기와 함께 침강에 의해 배지로부터 분리되고 용해된다. 그 후에, 발현된 융합 단백질은 예를 들어 친화도 크로마토그래피(예를 들어 His-태그를 통해, 상기 참조)에 의해 단리될 수 있다.
본 발명의 효소는 이것이 발효에 의해 고수율로 생산되고 따라서 저렴하게 생산될 수 있다는 이점을 갖는다. 이의 생산은 특히 경제적으로 효과적이고 또한 유리한데, 2개의 별개의 단백질 대신에 단지 하나의 융합 단백질만 생산되고, 정제되고 단리될 필요가 있기 때문이다.
효소가 보조인자, 예컨대 NADPH 또는 NADH에 의해 전자 공여체로서, 따라서 환원제로서 재생될 수 있다는 것은 유리한데, NADPH 또는 NADH를 재생하기 위한 시스템이 이미 존재하기 때문이다.
Trx 및 TR의 효소 활성은 보조인자의 전환을 통해, 예를 들어 340 nm에서 광도적으로 결정될 수 있다. 이는 환원된(NADPH/NADH) 상태로부터 산화된(NADP/NAD) 상태로 진행됨에 따라 340 nm에서의 흡광 계수(extinction coefficient)가 유의하게 변하기 때문에 가능하다.
개별 단백질의 다양한 혼합비 또는 다양한 작제물(융합 단백질)의 효소 활성을 측정할 때, 융합 단백질의 활성이 동일하지만 비융합된 개별 단백질 티오레독신과 티오레독신 리덕타제의 혼합물의 활성의 적어도 100%, 바람직하게는 적어도 150%, 특히 바람직하게는 적어도 200%임을 발견하는 것은 놀라웠고 당업자에게 예측 불가능한 것이었다. 이는 융합 단백질의 활성이 동일하지만 비융합된 단일 단백질 i과 ii의 혼합물의 활성만큼 높거나 심지어 더 높음을 의미한다.
더 정확하게는, 이는 보조인자 또는 기질이 없는 음성 대조군의 경우를 제외하고는, 기질, 보조인자, 및 완충제 시스템으로 구성된 동일한 반응 혼합물이 각각의 경우 초기에 충전되었음을 의미한다. 동일한 양의 융합 단백질을 혼합물에 첨가하거나, 개별 단백질 i(Trx) 및 ii(TR)를 또 다른 혼합물에 첨가한 후, 보조인자 전환이 동일한 반응 조건 하에 동일한 시간에 결정되었다. 대안적으로, 기질 양의 저하 또는 생성물 양의 증가를 검출하는 것이 동일하게 가능하다.
효소는 바람직하게는 융합 단백질의 유전자가 SEQ ID No. 2와 적어도 50%, 바람직하게는 적어도 70%, 특히 바람직하게는 적어도 90% 동일한 하나의 DNA 서열 및 SEQ ID No. 3과 적어도 50%, 바람직하게는 적어도 70%, 특히 바람직하게는 적어도 90% 동일한 또 다른 DNA 서열을 포함하는 것을 특징으로 한다.
특히 바람직한 구현예에서, 융합 단백질을 인코딩하는 DNA 서열은 SEQ ID No. 5이다.
나아가, 본 발명은 시스틴을 시스테인으로 효소적으로 환원시키는 방법을 제공하며, 상기 시스테인은 보조인자의 존재 하에 본 발명의 효소에 의해 환원되는 것을 특징으로 한다.
시스틴으로부터 시스테인으로의 효소적 환원에서, 디설파이드(-S-S-)는 2개의 설피드릴(-SH) 기로 전환되며, 즉, L-시스테인의 2개의 분자는 화학적 화합물 시스틴의 한 분자로부터 형성된다. 본 발명의 융합 단백질은 환원을 촉매화하고 시스틴의 디설파이드에 전자를 전달한다.
여기서 놀라운 것은, 융합 단백질 TrxBA의 활성이 동일하지만 비융합된 개별 단백질 TrxA와 TrxB의 혼합물의 활성보다 특히 두드러지게 더 높았다는 것이었다(실시예 4, 도 4 참조).
본 발명의 과정의 특정 이점은, 방법을 사용하여 생산된 시스테인이 착향료 규제에 따라 천연 시스테인으로 신고될 수 있다는 점이다.
경제적인 방법에 대한 추가 과제는 중성 pH 범위에서(또는 생리학적 pH 범위에서, 즉 대략 7.4의 pH에서) 완충제 시스템에서의 시스틴의 불량한 용해도였다.
방법은 바람직하게는 4 내지 11, 특히 바람직하게는 5 내지 10, 특히 바람직하게는 6 내지 9의 pH 범위 내에서 수행된다.
본 발명의 효소가 생리학적 pH에서 시스틴을 시스테인으로 효소적으로 환원시키는 과정에 사용될 때 특히 유리하고 따라서 추가로 특히 바람직하다.
방법은 바람직하게는 20℃ 내지 40℃, 특히 바람직하게는 25℃ 내지 30℃ 범위의 온도에서 수행된다.
방법은 바람직하게는 보조인자가 NADPH 및 NADH로 이루어진 군으로부터 선택되는 성분인 것을 특징으로 한다. 보조인자는 특히 바람직하게는 NADPH이다.
방법은 바람직하게는 환원 후, 형성된 시스테인이 단리되는 것을 특징으로 한다. 표적 생성물의 추가 정제를 위해, 하기 단계/절차가 이용될 수 있다:
- 이온-교환 흡착에 의한 L-시스테인의 단리
- 침전 결정화.
이러한 방법은 종래 기술로부터 알려져 있다(예를 들어, WO 2013/000864 참조).
시스틴으로부터 시스테인으로의 환원에서, 본 발명의 효소는 산화되며, 즉, 이는 전자를 시스틴에게 전달하고 이때 디설파이드 결합이 형성된다. 존재하는 NADPH 또는 NADH 보조인자의 전자가 융합 단백질(TR 부분)의 활성에 의해 융합 단백질(Trx 부분)에 전달되기 때문에, NADP+ 또는 NAD+가 각각 형성된다. 이러한 이유에서, 방법은 보조인자-재생 효소를 포함하는 것이 바람직하다. 특히 바람직하게는, 보조인자-재생 효소는 데하이드로게나제이며, 이때 환원은 추가 전자 공여체의 존재 하에 추가로 발생한다.
보조인자-재생 효소는 글루코스-6-포스페이트 데하이드로게나제 및/또는 알코올 데하이드로게나제일 수 있다. 특히 바람직한 구현예에서, 데하이드로게나제는 전자 공여체로서 사용되는 이소프로판올과 함께 알코올 데하이드로게나제이다.
본 발명은 예시적인 구현예를 참조로 하여 아래에서 더 상세히 기재되며, 이러한 구현예로 제한되지 않는다.
실시예
실시예 1: 시스틴 리덕타제 시스템 TrxA, TrxB, TrxBA, 및 TrxAB의 생성
발현 벡터의 제조:
상응하는 후보 단백질 TrxA, TrxB, TrxAB, TrxBA, TrxB5A 또는 Ml-TrxBA를 코딩하는 DNA 서열의 발현을 위한 벡터로서, 발현 플라스미드 pGJ3477을 선택하였다. 이는 ColE1 복제 원점에 기초하여 중간(medium)-사본 내지 고(high)-사본 플라스미드(세포당 50개 내지 60개 사본)이다. 플라스미드 맵을 도 1에 도시하며, 여기서 보편적인 단지 단일-절단 제한 효소(6-염기 인식 서열을 가짐)의 위치는 플라스미드 맵 상에 표시되어 있다. 서열은 SEQ ID No. 11로 명시된다.
이 플라스미드에서, 각각의 후보의 코딩 서열을 아라비노스-유도성 프로모터 PBAD의 제어 하에 두었다.
먼저, 전체 발현 플라스미드를 인버스 PCR에 의해 증폭시켰다:
- 50 μl의 최종 부피에서 50 ng의 pGJ3477 DNA, 0.5 pmol의 각각의 프라이머 3477-fwrd(SEQ ID No. 12) 및 3477-rev(SEQ ID No. 13), Q5® 반응 완충제(New England Biolabs, NEB), 1 단위의 Q5® DNA 폴리머라제(NEB).
- PCR 프로그램: 98℃에서 1분, 그 후에 98℃에서 30초, 65℃에서 30초(어닐링), 및 72℃에서 2분(합성)의 30 사이클.
반응의 종료 시, 제한 효소 DpnI(10 단위, NEB)를 반응 믹스에 첨가하고, 혼합물을 37℃에서 1시간 동안 인큐베이션하였다. 뒤이어 DNA의 크로마토그래피 정제(Macherey & Nagel: NucleoSpin® Gel 및 PCR Clean-up-Kit)를 수행하였다.
trxA 및 trxB의 클로닝:
단백질-코딩 서열 trxA(SEQ ID No. 2) 및 trxB(SEQ ID No. 3)의 클로닝을 위해, 올리고뉴클레오타이드 프라이머를 정의하였고, 이의 표적-유전자-특이적 서열을 적어도 15개 뉴클레오타이드만큼 신장시키고, 이는 벡터 DNA의 단부(end)에서의 서열과 중첩되고 있었다. 유전자를 BL21의 이. 콜라이 게놈의 PCR(콜로니 PCR)에 의해 증폭시켰다.
하기 혼합물이 PCR에 의한 증폭을 위해 선택되었다:
- 50 μl의 최종 부피에서 50 ng의 게놈 이. 콜라이 BL21 DNA(NEB), 0.5 pmol의 각각의 프라이머 trxA-fwrd(SEQ ID No. 14) 및 trxA-rev(SEQ ID No. 15) 또는 trxB-fwrd(SEQ ID No. 16) 및 trxB-rev(SEQ ID No. 17), Q5® 반응 완충제(NEB), 1 단위의 Q5® DNA 폴리머라제(NEB).
- PCR 프로그램: 98℃에서 1분, 그 후에 98℃에서 30초, 60℃에서 30초(어닐링), 및 72℃에서 15초(trxA) 또는 30초(trxB)(합성)의 30 사이클.
반응의 종료 시, 제한 효소 DpnI(10 단위, NEB)를 반응 믹스에 첨가하고, 혼합물을 37℃에서 1시간 동안 인큐베이션하였다. 뒤이어 DNA의 크로마토그래피 정제(Macherey & Nagel: NucleoSpin® Gel 및 PCR Clean-up-Kit)를 수행하였다.
LIC-PCR:
일반적으로, 단백질-코딩 DNA 서열을 Aslanidis C. 및 de Jong P.J., Nucleic Acids Res. 18, pp. 6069-6074에 기재된 바와 같이 LIC-PCR(PCR 생성물의 리게이션-독립적-클로닝)을 통해 기본 발현 벡터 pGJ3477 내로 염기-정확하게 도입하였다.
이러한 목적을 위해, 50 ng의 각각의 후보 단백질의 정제된 코딩 DNA를 50 ng의 제조된 벡터 DNA와 함께 LIC-PCR 반응에 사용하였다.
그 후에, LIC-PCR 혼합물을 표준 방법을 사용하여 이. 콜라이 XL1 Blue 세포에 형질전환시키고, 선택적 LB 배지(LB + 100 mg/L 앰피실린) 상에 평판배양하고, 37℃에서 18시간 동안 인큐베이션하였다. 올바른 클론의 식별을 위해, 플라스미드 DNA를 수득된 콜로니로부터 단리하고, 발현 카세트를 완전히 시퀀싱하였다.
발현 벡터 pGJ3477 및 코딩 DNA 서열 trxA 또는 trxB로 이루어진 생성된 플라스미드는 이하 trxA 또는 trxB 발현 벡터로 지칭되었다.
trxAB 및 trxBA의 클로닝:
상응하는 융합 단백질 TrxAB 또는 TrxBA를 각각 인코딩하는 DNA trxAB 또는 trxBA의 클로닝을 상기 기재된 바와 같이 trxA 및 trxB의 클로닝과 유사한 방식으로 N-말단 His-태그와 단백질 TrxB를 인코딩하는 서열 trxB 사이에서 LIC-PCR에 의해 trxA 서열을 trxB 발현 벡터 내로 삽입함으로써 또는 His-태그와 단백질 TrxA를 인코딩하는 서열 trxA 사이에서 LIC-PCR에 의해 trxB 서열을 trxA 발현 벡터 내로 삽입함으로써 수행하였다.
하기 혼합물이 PCR에 의한 증폭을 위해 선택되었다:
- 프라이머 vtrxA-fwrd(SEQ ID No. 18)와 3477-rev(SEQ ID No. 13) 또는 vtrxB-fwrd(SEQ ID No. 21)와 3477-rev(SEQ ID No. 13)를 이용한 인버스 PCR에 의해 벡터 DNA(trxA 또는 trxB 발현 벡터)를 증폭시켰고, 이를 위해 하기 PCR 프로그램을 선택하였다: 98℃에서 2분, 그 후에 98℃에서 45초 / 60℃에서 30초 / 72℃에서 2.5분의 30 사이클.
- 프라이머 ftrxA-fwrd(SEQ ID No. 22)와 ftrxA-rev(SEQ ID No. 23) 또는 ftrxB-fwrd(SEQ ID No. 19)와 ftrxB-rev(SEQ ID No. 20)를 이용한 PCR에 의해 융합 단백질에 대한 trxA 또는 trxB 유전자 분절을 증폭시켰고, 이를 위해 하기 PCR 프로그램을 선택하였다: 98℃에서 2분 -> 그 후에 98℃에서 45초 / 60℃에서 30초 / 72℃에서 15초의 30 사이클. BL21 게놈 DNA을 주형으로서 사용하였다.
PCR 반응의 종료 시, 제한 효소 DpnI(10 단위, NEB)를 각각의 반응 믹스에 첨가하고, 혼합물을 37℃에서 1시간 동안 인큐베이션하였다. 뒤이어 삽입물 DNA의 크로마토그래피 정제(Macherey & Nagel; NucleoSpin® Gel 및 PCR Clean-up-Kit)를 수행하였다.
50 ng의 trxA 또는 trxB 발현 벡터의 증폭된 벡터 DNA 및 75 ng의 삽입물 DNA(trxB 또는 trxA)를 사용하여 LIC-PCR 반응을 수행하였다.
그 후에, LIC-PCR 혼합물을 표준 방법을 사용하여 이. 콜라이 XL1 Blue 세포에 형질전환시키고, 선택적 LB 배지(LB + 100 mg/L 앰피실린) 상에 평판배양하고, 37℃에서 18시간 동안 인큐베이션하였다. 올바른 클론의 식별을 위해, 플라스미드 DNA를 수득된 콜로니로부터 단리하고, 발현 카세트를 완전히 시퀀싱하였다.
SEQ ID No. 9 및 SEQ ID No. 10은 서열 SEQ ID No. 4 및 SEQ ID No. 5의 발현으로부터 각각 비롯되는 융합 단백질 TrxBA 및 TrxAB의 아미노산 서열을 명시한다.
실시예 2: 시스틴 리덕타제 Ml-TrxBA의 클로닝
도입에 기재된 바와 같이, 미코박테리움 레프래는 티오레독신(Trx) 및 티오레독신 리덕타제(TR)와 상동성을 갖는 단백질을 인코딩하는 유전자 분절을 갖는다(Wieles B. 1995, J. Biol. Chem. 270, pp. 25604-25606). 이러한 서열을 공개 데이터베이스(NCBI 기준 서열: WP_010909042.1)로부터 얻을 수 있다.
공개 데이터베이스로부터 얻은 서열을 인실리코에서(in silico)에서 숙주 이. 콜라이의 코돈 용법에 맞추었다. IDT 웹 서버(www.idtdna.com)를 사용하여 이를 수행하였다. 표적 벡터 pGJ3477 내로의 클로닝을 위해, 코딩 영역을 5' 단부 및 3' 단부에서 벡터 서열과 중첩되는 서열만큼 신장시켰다(또한 trxA 및 trxB의 클로닝을 참조). 생성된 총 DNA 서열을 Geneart(www.thermofisher.com)에 의해 합성적으로 생산하고(SEQ ID No. 24로 명시됨), Ml-trxBA(ml-trxBA로도 지칭됨)로 지정하였다.
합성 Ml-trxBA 서열을 trxA 및 trxB 발현 벡터의 클로닝과 유사한 방식으로 벡터 pGJ3477 내로 LIC-PCR에 의해 클로닝하였다.
단백질-코딩 서열 Ml-trxBA(SEQ ID No. 24)의 클로닝을 위해, 올리고뉴클레오타이드 프라이머를 정의하였고, 이의 표적-유전자-특이적 서열을 적어도 15개 뉴클레오타이드만큼 신장시키고, 이는 벡터 DNA의 단부에서의 서열과 중첩되고 있었다. 합성 유전자는 주형으로서 역할을 하였다.
하기 혼합물이 PCR에 의한 증폭을 위해 선택되었다:
- 50 μl의 최종 부피에서 20 ng의 주형(Geneart), 0.5 pmol의 각각의 프라이머 Ml-trxBA-fwrd(SEQ ID No. 25)와 Ml-trxBA-rev(SEQ ID No. 26), Q5® 반응 완충제, 1 단위의 Q5® DNA 폴리머라제(NEB).
- PCR 프로그램: 98℃에서 1분, 그 후에 98℃에서 30초, 60℃에서 30초(어닐링), 및 72℃에서 60초(합성)의 30 사이클.
반응의 종료 시, 제한 효소 DpnI(10 단위, NEB)를 반응 믹스에 첨가하고, 혼합물을 37℃에서 1시간 동안 인큐베이션하였다. 뒤이어 DNA의 크로마토그래피 정제(Macherey & Nagel: NucleoSpin® Gel 및 PCR Clean-up-Kit)를 수행하였다.
LIC-PCR:
단백질-코딩 DNA 서열을 Aslanidis C. 및 de Jong P.J., Nucleic Acids Res. 18, pp. 6069-6074에 기재된 바와 같이 LIC-PCR(PCR 생성물의 리게이션-독립적-클로닝)을 통해 기본 발현 벡터 pGJ3477 내로 염기-정확하게 도입하였다.
이러한 목적을 위해, 50 ng의 정제된 코딩 DNA를 60 ng의 제조된 벡터 DNA와 함께 LIC-PCR 반응에 사용하였다.
그 후에, LIC-PCR 혼합물을 표준 방법을 사용하여 이. 콜라이 XL1 Blue 세포에 형질전환시키고, 선택적 LB 배지(LB + 100 mg/L 앰피실린) 상에 평판배양하고, 37℃에서 18시간 동안 인큐베이션하였다. 올바른 클론의 식별을 위해, 플라스미드 DNA를 수득된 콜로니로부터 단리하고, 발현 카세트를 완전히 시퀀싱하였다.
발현 벡터 pGJ3477 및 코딩 DNA 서열 Ml-trxBA로 이루어진 생성된 플라스미드는 이하 Ml-trxBA 발현 벡터로 지칭되었다.
실시예 3: 시스틴 리덕타제 TrxB5A(링커 서열이 있음)의 클로닝
trxB5A의 클로닝:
상응하는 융합 단백질 TrxB5A를 인코딩하는 DNA trxB5A의 클로닝을 상기 기재된 바와 같이 His-태그와 단백질 TrxA를 인코딩하는 서열 trxA 사이에서 LIC-PCR에 의해 5개 아미노산만큼 C-말단적으로 신장된 TrxB 서열(이하 TrxB5로 지칭되고 cds는 trxB5로 지칭됨)을 trxA 발현 벡터 내로 삽입함으로써 trxBA의 클로닝과 유사하게 수행하였다:
하기 혼합물이 PCR에 의한 증폭을 위해 선택되었다:
- 프라이머 vtrxA5-fwrd(SEQ ID No. 29) 및 3477-rev(SEQ ID No. 13)를 이용한 인버스 PCR에 의해 벡터 DNA(trxA 발현 벡터)를 증폭시켰고, 이를 위해 하기 PCR 프로그램을 선택하였다: 98℃에서 2분, 그 후에 98℃에서 45초 / 60℃에서 30초 / 72℃에서 2.5분의 30 사이클.
- 프라이머 ftrxB-fwrd(SEQ ID No. 19) 및 ftrxB5-rev(SEQ ID No. 30)를 이용한 PCR에 의해 trxB5를 증폭시켰고, 이를 위해 하기 PCR 프로그램을 선택하였다: 98℃에서 2분 -> 그 후에 98℃에서 45초 / 60℃에서 30초 / 72℃에서 15초의 30 사이클. BL21 게놈 DNA을 주형으로서 사용하였다.
PCR 반응의 종료 시, 제한 효소 DpnI(10 단위, NEB)를 각각의 반응 믹스에 첨가하고, 혼합물을 37℃에서 1시간 동안 인큐베이션하였다. 뒤이어 삽입물 DNA의 크로마토그래피 정제(Macherey & Nagel; NucleoSpin® Gel 및 PCR Clean-up-Kit)를 수행하였다.
50 ng의 trxA 발현 벡터의 증폭된 벡터 DNA 및 75 ng의 삽입물 DNA(trxB5)를 사용하여 LIC-PCR 반응을 수행하였다.
그 후에, LIC-PCR 혼합물을 표준 방법을 사용하여 이. 콜라이 XL1 Blue 세포에 형질전환시키고, 선택적 LB 배지(LB + 100 mg/L 앰피실린) 상에 평판배양하고, 37℃에서 18시간 동안 인큐베이션하였다. 올바른 클론의 식별을 위해, 플라스미드 DNA를 수득된 콜로니로부터 단리하고, 발현 카세트를 완전히 시퀀싱하였다.
SEQ ID No. 28은 서열 SEQ ID No. 27의 발현으로부터 각각 비롯되는 융합 단백질 TrxB5A의 아미노산 서열을 명시한다.
실시예 4: 시스틴 리덕타제의 효소 활성
단백질 TrxA, TrxB, TrxBA, TrxB5A, TrxAB, 및 Ml-TrxBA의 재조합 발현을 위해, 조사된 상응하는 단백질을 인코딩하는 발현 플라스미드를 균주 이. 콜라이 TOP10(Thermo Fisher Scientific, MA/USA) 내로 도입하였다. 100 mg/L 앰피실린을 함유하는 LB 배지 상에 박테리아 세포를 평판배양하였다. 그 후에, 100 mg/L 앰피실린 및 0.2% 아라비노스(w/v)를 함유하는 25 ml의 LB 배지를 단일 콜로니와 함께 접종하고, 배양 진탕기 캐비넷에서 28℃에서 18시간 동안 인큐베이션하였다.
발현된 단백질의 단리를 위해, 세포를 원심분리(4000 g에서 10분)에 의해 침강시키고, 배지 상층액을 제거하고, 바이오매스를 용해 완충제(PBS + 10% BugBuster(Sigma))에 재현탁시켰다. 세포를 BugBuster 키트(Sigma)의 매뉴얼에서 제조업체의 설명에 따라 RT에서 15분 동안 완전히 용해시킨 다음, 불용성 물질을 원심분리(제조업체의 설명에 따라 9500 rpm에서 20분)에 의해 제거하였다. 친화도 크로마토그래피에 의한 상층액(= 세포 용해물)의 정제를 위해, 수득된 세포 용해물을 PBS-평형화된 Protino IDA2000 컬럼(Macherey & Nagel) 내로 로딩하였다. 세척 단계(7 ml의 PBS) 후, 시료를 5 ml의 용리 완충제(PBS + 200 mM 이미다졸)로 용리시켰다. 생성된 단백질 농도를 브래드포드 검정(Bradford assay)(Thermo Fisher)에 의해 결정하였다.
다양한 효소 TrxA, TrxB, TrxBA, TrxB5A, TrxAB 또는 Ml-TrxBA의 시스틴 리덕타제 활성을 아래 상세히 기재된 2개의 분석 방법을 사용하여 결정하였다.
1. 제1 방법은 광도적(photometric) 검출 방법으로 구성되었으며, 이 방법은 환원 반응 동안 NADPH의 소모 및 340 nm에서 흡광도 값의 결과적인 하락에 기초한다. 도 2에서 개략적으로 도시된 바와 같이, 시스테인으로의 환원에서 시스틴의 효소적 전환에 보조인자 NADPH의 소모가 동반된다.
하기 검정 혼합물을 광도적 결정에 사용하였으며, 시료의 최종 부피는 1 ml였다:
· 100 mM 포스페이트 완충제 pH 7.4
· 2 mM EDTA
· 0.2 mM NADPH (Sigma)
· 1 mM 시스틴 (Wacker Chemie AG)
· 효소를 제외한 모든 검정 구성요소를 혼합한 후, 효소를 첨가함으로써 반응을 시작하였다:
10 μg의 효소 TrxA, TrxB, TrxA와 TrxB의 혼합물, TrxBA, TrxB5A, TrxAB 또는 Ml-TrxBA. 아래 기재된 측정 시까지 검정 혼합물을 실온(대략 25℃)에서 인큐베이션하였다.
다양한 1 ml 검정 혼합물의 NADPH 농도를 분광광도계(Evolution 201 UV-vis 분광광도계, Thermo Fisher Scientific)를 사용하여 다양한 시점에서 340 nm에서의 흡광도 값의 형태로 측정하였다. 340 nm에서의 흡광도 값을 사용하여, 다양한 시료의 효소 활성을 제조업체 Thermo Fisher Scientific로부터의 Thermo INSIGHT 소프트웨어를 사용하여 계산하였다. 각각의 경우 음성 대조군으로서 병행하여 분석된 것은 열-비활성 효소를 함유한 시료, 효소 무함유 시료, 기질로서의 시스틴 무함유 시료, 또는 보조인자로서의 NADPH 무함유 시료였다.
NADPH 소모 속도를 나타내는 시간에 따른 흡광도 변화(저하)와 함께 기록된 곡선의 시작부에서 선형 기울기로부터 효소 활성을 결정하였다. 동일한 양의 효소를 항상 사용하기 때문에, 속도를 비교할 수 있다.
2. 제2 방법에서, 시스틴 리덕타제 활성에 의해 시스틴으로부터 형성된 시스테인을 도 3에 개략적으로 도시된 바와 같이 화합물 DTNB(5,5'-디티오비스-2-니트로벤조산; 엘만 시약)와의 반응에 의해 자유 SH 기를 통해 직접 검출하였고, 이는 본 발명의 맥락에서 DTNB 검정으로도 지칭된다.
하기 검정 혼합물을 광도적 측정에 사용하였으며, 시료의 최종 부피는 1 ml였다:
· 100 mM 포스페이트 완충제 pH 7.4
· 2 mM EDTA
· 0.2 mM NADPH (Sigma)
· 1 mM 시스틴 (Wacker Chemie AG)
· 효소를 제외한 모든 검정 구성요소를 혼합한 후, 효소를 첨가함으로써 반응을 시작하였다:
10 μg의 효소 TrxA, TrxB, TrxA와 TrxB의 혼합물, TrxBA, TrxB5A, TrxAB 또는 Ml-TrxBA. 아래 기재된 측정 시까지 검정 혼합물을 실온(대략 25℃)에서 인큐베이션하였다.
L-시스테인을 5,5'-디티오비스-2-니트로벤조산(DTNB)을 사용하여 Lee S.-H. 1995(Biochemical and Biophysical Research Communications 213, pp. 837-844)에 기재된 시험에 의해 정량화하였다. Cys-TNB의 정량화는 412 nm에서 DTNB-매개 흡광도의 측정에 의한 것이었다. HPLC에 의한 분석이 또한 가능하다.
각각의 경우 음성 대조군으로서 병행하여 분석된 것은 열-비활성 효소를 함유한 시료, 효소 무함유 시료, 기질로서의 시스틴 무함유 시료, 또는 보조인자로서의 NADPH 무함유 시료였다.
도 4는 상기 기재된 바와 같이 광도적 결정에 따라 1 지점 하에 효소 TrxBA, TrxB5A, TrxAB, 및 Ml-Trx 및 TrxA와 TrxB의 (9:1) 혼합물의 상대적인 시스틴 리덕타제 활성을 도시하며, TrxA와 TrxB의 (9:1) 혼합물의 활성을 1로 정규화하고 모든 다른 활성을 이와 관련하여 설정한다. TrxA와 TrxB의 (9:1) 혼합물은, 비교 시험이 가장 활성인 혼합비인 것으로 나타낸 개별 효소의 추정 혼합비이다.
도 5는 상기 기재된 바와 같이 2 지점 하에 DTNB 검정 및 HPLC에 따라 TrxBA 및 TrxAB에 의한 시스테인 형성의 검출을 도시한다.
TrxA 및 TrxB에 대한 cds 사이의 ≥60개 뉴클레오타이드의 영역에서 TrxB5A보다 더 긴 링커 서열을 함유하는 클론의 사용은 융합 단백질에서 놀랍게도 유의하게 더 낮은 활성을 유발하였다.
실시예 5: 효소 조합 시스틴 리덕타제와 ADH의 활성
보조인자 NADPH 및 NADP+에 대한 효소 특이성의 비교는 시스틴 리덕타제 TrxBA 및 TrxAB가 보조인자 NADPH에 고도로 특이적임을 발견하였다. 시험에서, 시스틴에 대한 어떠한 효소 활성도 NADP+로는 검출되지 않았다.
조합 실험은 효소 알코올 데하이드로게나제(ADH)가 반응을 위해 NADP+를 NADPH로 다시 전환시킬 수 있는 정도를 조사하였다.
하기 조건을 이러한 목적을 위해 사용하였다:
· 100 mM 포스페이트 완충제 pH 7.4
· 5 μl의 이소프로판올
· 2 mM EDTA
· 15-50 μM NADPH 또는 NADP+
· 1 mM 시스틴
· 5 μg의 효소 TrxBA
· 50 μl의 세포 용해물 조(crude) 추출물, 또는 음성 대조군으로서, 50 μl의 포스페이트 완충제(1.5 ml의 4x 포스페이트 완충제 pH 7.4에서의 0.5 ml의 세포의 Fast Prep 분해. EP 1 832 658 B1에 기재된 바와 같은 세포의 생산).
반응을 30℃에서 60분 동안 인큐베이션하였다. 시료를 5분 간격으로 얻고, 유리화된(liberated) 시스테인을 WO 2013/000864 A1에 기재된 바와 같이 DTNB로 유도체화하였다. 정량화는 412 nm에서 DTNB-매개 흡광도의 측정에 의한 것이었다.
도 6은 재생 시스템으로서 ADH의 존재(함께) 또는 부재(없이) 하에 DTNB 검정을 사용하여 TrxBA에 의한 시스테인 형성의 측정 결과를 도시한다.
도면에 사용된 약어
AraC: AraC 유전자(억제자 유전자)
pAraC: AraC 유전자의 프로모터(억제자 유전자; PBAD에 대한 rev 배향)
pBAD(본 발명의 맥락에서 PBAD로도 지칭됨): 삽입된 표적 단백질 서열의 발현(다운스트림)에 대한 아라비노스-유도성 프로모터
6HIS: His-태그에 대한 코딩 영역
term: 전사 종결자
Amp: 앰피실린 내성 마커
CR: 시스틴 리덕타제
rel.: 상대적인
bps: 염기쌍
t: 시간
SEQUENCE LISTING <110> Wacker Chemie AG <120> Biocatalyst as a core component of an enzyme-catalyzed redox system for the biocatalytic reduction of cystine <130> CO11913 <160> 30 <170> PatentIn version 3.5 <210> 1 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> his-tag <400> 1 atgacacaga gggcccacca tcaccatcac cattcc 36 <210> 2 <211> 330 <212> DNA <213> Escherichia coli <220> <222> (1)..(330) <400> 2 atgagcgata aaattattca cctgactgac gacagttttg acacggatgt actcaaagcg 60 gacggggcga tcctcgtcga tttctgggca gagtggtgcg gtccgtgcaa aatgatcgcc 120 ccgattctgg atgaaatcgc tgacgaatat cagggcaaac tgaccgttgc aaaactgaac 180 atcgatcaaa accctggcac tgcgccgaaa tatggcatcc gtggtatccc gactctgctg 240 ctgttcaaaa acggtgaagt ggcggcaacc aaagtgggtg cactgtctaa aggtcagttg 300 aaagagttcc tcgacgctaa cctggcgtaa 330 <210> 3 <211> 966 <212> DNA <213> Escherichia coli <220> <222> (1)..(966) <400> 3 atgggcacga ccaaacacag taaactgctt atcctgggtt caggcccggc gggatacacc 60 gctgctgtct acgcggcgcg cgccaacctg caacctgtgc tgattaccgg catggaaaaa 120 ggcggccaac tgaccaccac cacggaagtg gaaaactggc ctggcgatcc aaacgatctg 180 accggtccgt tattaatgga gcgcatgcac gaacatgcca ccaagtttga aactgagatc 240 atttttgatc atatcaacaa ggtggatctg caaaaccgtc cgttccgtct gaatggcgat 300 aacggcgaat acacttgcga cgcgctgatt attgccaccg gagcttctgc acgctatctc 360 ggcctgccct ctgaagaagc ctttaaaggc cgtggggttt ctgcttgtgc aacctgcgac 420 ggtttcttct atcgcaacca gaaagttgcg gtcatcggcg gcggcaatac cgcggttgaa 480 gaggcgctgt atctgtctaa catcgcttcg gaagtgcatc tgattcaccg ccgtgacggt 540 ttccgcgcgg aaaaaatcct cattaagcgc ctgatggata aagtggagaa cggcaacatc 600 attctgcaca ccaaccgtac gctggaagaa gtgaccggcg atcaaatggg tgtcactggc 660 gttcgtctgc gcgatacgca aaacagcgat aacatcgagt cactcgacgt tgccggtctg 720 tttgttgcta tcggtcacag cccgaatact gcgattttcg aagggcagct ggaactggaa 780 aacggctaca tcaaagtaca gtcgggtatt catggtaatg ccacccagac cagcattcct 840 ggcgtctttg ccgcaggcga cgtgatggat cacatttatc gccaggccat tacttcggcc 900 ggtacaggct gcatggcagc acttgatgcg gaacgctacc tcgatggttt agctgacgca 960 aaataa 966 <210> 4 <211> 1326 <212> DNA <213> Artificial Sequence <220> <223> histrxAB (Fusion gene of his-tag and E.coli genes trxA and trxB) <400> 4 atgacacaga gggcccacca tcaccatcac cattccatga gcgataaaat tattcacctg 60 actgacgaca gttttgacac ggatgtactc aaagcggacg gggcgatcct cgtcgatttc 120 tgggcagagt ggtgcggtcc gtgcaaaatg atcgccccga ttctggatga aatcgctgac 180 gaatatcagg gcaaactgac cgttgcaaaa ctgaacatcg atcaaaaccc tggcactgcg 240 ccgaaatatg gcatccgtgg tatcccgact ctgctgctgt tcaaaaacgg tgaagtggcg 300 gcaaccaaag tgggtgcact gtctaaaggt cagttgaaag agttcctcga cgctaacctg 360 gcgggcacga ccaaacacag taaactgctt atcctgggtt caggcccggc gggatacacc 420 gctgctgtct acgcggcgcg cgccaacctg caacctgtgc tgattaccgg catggaaaaa 480 ggcggccaac tgaccaccac cacggaagtg gaaaactggc ctggcgatcc aaacgatctg 540 accggtccgt tattaatgga gcgcatgcac gaacatgcca ccaagtttga aactgagatc 600 atttttgatc atatcaacaa ggtggatctg caaaaccgtc cgttccgtct gaatggcgat 660 aacggcgaat acacttgcga cgcgctgatt attgccaccg gagcttctgc acgctatctc 720 ggcctgccct ctgaagaagc ctttaaaggc cgtggggttt ctgcttgtgc aacctgcgac 780 ggtttcttct atcgcaacca gaaagttgcg gtcatcggcg gcggcaatac cgcggttgaa 840 gaggcgctgt atctgtctaa catcgcttcg gaagtgcatc tgattcaccg ccgtgacggt 900 ttccgcgcgg aaaaaatcct cattaagcgc ctgatggata aagtggagaa cggcaacatc 960 attctgcaca ccaaccgtac gctggaagaa gtgaccggcg atcaaatggg tgtcactggc 1020 gttcgtctgc gcgatacgca aaacagcgat aacatcgagt cactcgacgt tgccggtctg 1080 tttgttgcta tcggtcacag cccgaatact gcgattttcg aagggcagct ggaactggaa 1140 aacggctaca tcaaagtaca gtcgggtatt catggtaatg ccacccagac cagcattcct 1200 ggcgtctttg ccgcaggcga cgtgatggat cacatttatc gccaggccat tacttcggcc 1260 ggtacaggct gcatggcagc acttgatgcg gaacgctacc tcgatggttt agctgacgca 1320 aaataa 1326 <210> 5 <211> 1326 <212> DNA <213> Artificial Sequence <220> <223> histrxBA (Fusion gene of his-tag and E.coli genes trxB and trxA) <400> 5 atgacacaga gggcccacca tcaccatcac cattccatgg gcacgaccaa acacagtaaa 60 ctgcttatcc tgggttcagg cccggcggga tacaccgctg ctgtctacgc ggcgcgcgcc 120 aacctgcaac ctgtgctgat taccggcatg gaaaaaggcg gccaactgac caccaccacg 180 gaagtggaaa actggcctgg cgatccaaac gatctgaccg gtccgttatt aatggagcgc 240 atgcacgaac atgccaccaa gtttgaaact gagatcattt ttgatcatat caacaaggtg 300 gatctgcaaa accgtccgtt ccgtctgaat ggcgataacg gcgaatacac ttgcgacgcg 360 ctgattattg ccaccggagc ttctgcacgc tatctcggcc tgccctctga agaagccttt 420 aaaggccgtg gggtttctgc ttgtgcaacc tgcgacggtt tcttctatcg caaccagaaa 480 gttgcggtca tcggcggcgg caataccgcg gttgaagagg cgctgtatct gtctaacatc 540 gcttcggaag tgcatctgat tcaccgccgt gacggtttcc gcgcggaaaa aatcctcatt 600 aagcgcctga tggataaagt ggagaacggc aacatcattc tgcacaccaa ccgtacgctg 660 gaagaagtga ccggcgatca aatgggtgtc actggcgttc gtctgcgcga tacgcaaaac 720 agcgataaca tcgagtcact cgacgttgcc ggtctgtttg ttgctatcgg tcacagcccg 780 aatactgcga ttttcgaagg gcagctggaa ctggaaaacg gctacatcaa agtacagtcg 840 ggtattcatg gtaatgccac ccagaccagc attcctggcg tctttgccgc aggcgacgtg 900 atggatcaca tttatcgcca ggccattact tcggccggta caggctgcat ggcagcactt 960 gatgcggaac gctacctcga tggtttagct gacgcaggta gcgataaaat tattcacctg 1020 actgacgaca gttttgacac ggatgtactc aaagcggacg gggcgatcct cgtcgatttc 1080 tgggcagagt ggtgcggtcc gtgcaaaatg atcgccccga ttctggatga aatcgctgac 1140 gaatatcagg gcaaactgac cgttgcaaaa ctgaacatcg atcaaaaccc tggcactgcg 1200 ccgaaatatg gcatccgtgg tatcccgact ctgctgctgt tcaaaaacgg tgaagtggcg 1260 gcaaccaaag tgggtgcact gtctaaaggt cagttgaaag agttcctcga cgctaacctg 1320 gcgtaa 1326 <210> 6 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> His-tag <400> 6 Met Thr Gln Arg Ala His His His His His His Ser 1 5 10 <210> 7 <211> 109 <212> PRT <213> Escherichia coli <220> <222> (1)..(109) <400> 7 Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp 1 5 10 15 Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp 20 25 30 Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp 35 40 45 Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn 50 55 60 Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu 65 70 75 80 Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser 85 90 95 Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala 100 105 <210> 8 <211> 321 <212> PRT <213> Escherichia coli <220> <222> (1)..(321) <400> 8 Met Gly Thr Thr Lys His Ser Lys Leu Leu Ile Leu Gly Ser Gly Pro 1 5 10 15 Ala Gly Tyr Thr Ala Ala Val Tyr Ala Ala Arg Ala Asn Leu Gln Pro 20 25 30 Val Leu Ile Thr Gly Met Glu Lys Gly Gly Gln Leu Thr Thr Thr Thr 35 40 45 Glu Val Glu Asn Trp Pro Gly Asp Pro Asn Asp Leu Thr Gly Pro Leu 50 55 60 Leu Met Glu Arg Met His Glu His Ala Thr Lys Phe Glu Thr Glu Ile 65 70 75 80 Ile Phe Asp His Ile Asn Lys Val Asp Leu Gln Asn Arg Pro Phe Arg 85 90 95 Leu Asn Gly Asp Asn Gly Glu Tyr Thr Cys Asp Ala Leu Ile Ile Ala 100 105 110 Thr Gly Ala Ser Ala Arg Tyr Leu Gly Leu Pro Ser Glu Glu Ala Phe 115 120 125 Lys Gly Arg Gly Val Ser Ala Cys Ala Thr Cys Asp Gly Phe Phe Tyr 130 135 140 Arg Asn Gln Lys Val Ala Val Ile Gly Gly Gly Asn Thr Ala Val Glu 145 150 155 160 Glu Ala Leu Tyr Leu Ser Asn Ile Ala Ser Glu Val His Leu Ile His 165 170 175 Arg Arg Asp Gly Phe Arg Ala Glu Lys Ile Leu Ile Lys Arg Leu Met 180 185 190 Asp Lys Val Glu Asn Gly Asn Ile Ile Leu His Thr Asn Arg Thr Leu 195 200 205 Glu Glu Val Thr Gly Asp Gln Met Gly Val Thr Gly Val Arg Leu Arg 210 215 220 Asp Thr Gln Asn Ser Asp Asn Ile Glu Ser Leu Asp Val Ala Gly Leu 225 230 235 240 Phe Val Ala Ile Gly His Ser Pro Asn Thr Ala Ile Phe Glu Gly Gln 245 250 255 Leu Glu Leu Glu Asn Gly Tyr Ile Lys Val Gln Ser Gly Ile His Gly 260 265 270 Asn Ala Thr Gln Thr Ser Ile Pro Gly Val Phe Ala Ala Gly Asp Val 275 280 285 Met Asp His Ile Tyr Arg Gln Ala Ile Thr Ser Ala Gly Thr Gly Cys 290 295 300 Met Ala Ala Leu Asp Ala Glu Arg Tyr Leu Asp Gly Leu Ala Asp Ala 305 310 315 320 Lys <210> 9 <211> 441 <212> PRT <213> Artificial Sequence <220> <223> HisTrxAB (Fusion protein of His-tag and E.coli protein TrxA and TrxB) <400> 9 Met Thr Gln Arg Ala His His His His His His Ser Met Ser Asp Lys 1 5 10 15 Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp Val Leu Lys Ala 20 25 30 Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp Cys Gly Pro Cys 35 40 45 Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp Glu Tyr Gln Gly 50 55 60 Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn Pro Gly Thr Ala 65 70 75 80 Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu Leu Phe Lys Asn 85 90 95 Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser Lys Gly Gln Leu 100 105 110 Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Thr Thr Lys His Ser Lys 115 120 125 Leu Leu Ile Leu Gly Ser Gly Pro Ala Gly Tyr Thr Ala Ala Val Tyr 130 135 140 Ala Ala Arg Ala Asn Leu Gln Pro Val Leu Ile Thr Gly Met Glu Lys 145 150 155 160 Gly Gly Gln Leu Thr Thr Thr Thr Glu Val Glu Asn Trp Pro Gly Asp 165 170 175 Pro Asn Asp Leu Thr Gly Pro Leu Leu Met Glu Arg Met His Glu His 180 185 190 Ala Thr Lys Phe Glu Thr Glu Ile Ile Phe Asp His Ile Asn Lys Val 195 200 205 Asp Leu Gln Asn Arg Pro Phe Arg Leu Asn Gly Asp Asn Gly Glu Tyr 210 215 220 Thr Cys Asp Ala Leu Ile Ile Ala Thr Gly Ala Ser Ala Arg Tyr Leu 225 230 235 240 Gly Leu Pro Ser Glu Glu Ala Phe Lys Gly Arg Gly Val Ser Ala Cys 245 250 255 Ala Thr Cys Asp Gly Phe Phe Tyr Arg Asn Gln Lys Val Ala Val Ile 260 265 270 Gly Gly Gly Asn Thr Ala Val Glu Glu Ala Leu Tyr Leu Ser Asn Ile 275 280 285 Ala Ser Glu Val His Leu Ile His Arg Arg Asp Gly Phe Arg Ala Glu 290 295 300 Lys Ile Leu Ile Lys Arg Leu Met Asp Lys Val Glu Asn Gly Asn Ile 305 310 315 320 Ile Leu His Thr Asn Arg Thr Leu Glu Glu Val Thr Gly Asp Gln Met 325 330 335 Gly Val Thr Gly Val Arg Leu Arg Asp Thr Gln Asn Ser Asp Asn Ile 340 345 350 Glu Ser Leu Asp Val Ala Gly Leu Phe Val Ala Ile Gly His Ser Pro 355 360 365 Asn Thr Ala Ile Phe Glu Gly Gln Leu Glu Leu Glu Asn Gly Tyr Ile 370 375 380 Lys Val Gln Ser Gly Ile His Gly Asn Ala Thr Gln Thr Ser Ile Pro 385 390 395 400 Gly Val Phe Ala Ala Gly Asp Val Met Asp His Ile Tyr Arg Gln Ala 405 410 415 Ile Thr Ser Ala Gly Thr Gly Cys Met Ala Ala Leu Asp Ala Glu Arg 420 425 430 Tyr Leu Asp Gly Leu Ala Asp Ala Lys 435 440 <210> 10 <211> 441 <212> PRT <213> Artificial Sequence <220> <223> HisTrxBA (Fusion protein of His-tag and E.coli proteins TrxB and TrxA) <400> 10 Met Thr Gln Arg Ala His His His His His His Ser Met Gly Thr Thr 1 5 10 15 Lys His Ser Lys Leu Leu Ile Leu Gly Ser Gly Pro Ala Gly Tyr Thr 20 25 30 Ala Ala Val Tyr Ala Ala Arg Ala Asn Leu Gln Pro Val Leu Ile Thr 35 40 45 Gly Met Glu Lys Gly Gly Gln Leu Thr Thr Thr Thr Glu Val Glu Asn 50 55 60 Trp Pro Gly Asp Pro Asn Asp Leu Thr Gly Pro Leu Leu Met Glu Arg 65 70 75 80 Met His Glu His Ala Thr Lys Phe Glu Thr Glu Ile Ile Phe Asp His 85 90 95 Ile Asn Lys Val Asp Leu Gln Asn Arg Pro Phe Arg Leu Asn Gly Asp 100 105 110 Asn Gly Glu Tyr Thr Cys Asp Ala Leu Ile Ile Ala Thr Gly Ala Ser 115 120 125 Ala Arg Tyr Leu Gly Leu Pro Ser Glu Glu Ala Phe Lys Gly Arg Gly 130 135 140 Val Ser Ala Cys Ala Thr Cys Asp Gly Phe Phe Tyr Arg Asn Gln Lys 145 150 155 160 Val Ala Val Ile Gly Gly Gly Asn Thr Ala Val Glu Glu Ala Leu Tyr 165 170 175 Leu Ser Asn Ile Ala Ser Glu Val His Leu Ile His Arg Arg Asp Gly 180 185 190 Phe Arg Ala Glu Lys Ile Leu Ile Lys Arg Leu Met Asp Lys Val Glu 195 200 205 Asn Gly Asn Ile Ile Leu His Thr Asn Arg Thr Leu Glu Glu Val Thr 210 215 220 Gly Asp Gln Met Gly Val Thr Gly Val Arg Leu Arg Asp Thr Gln Asn 225 230 235 240 Ser Asp Asn Ile Glu Ser Leu Asp Val Ala Gly Leu Phe Val Ala Ile 245 250 255 Gly His Ser Pro Asn Thr Ala Ile Phe Glu Gly Gln Leu Glu Leu Glu 260 265 270 Asn Gly Tyr Ile Lys Val Gln Ser Gly Ile His Gly Asn Ala Thr Gln 275 280 285 Thr Ser Ile Pro Gly Val Phe Ala Ala Gly Asp Val Met Asp His Ile 290 295 300 Tyr Arg Gln Ala Ile Thr Ser Ala Gly Thr Gly Cys Met Ala Ala Leu 305 310 315 320 Asp Ala Glu Arg Tyr Leu Asp Gly Leu Ala Asp Ala Gly Ser Asp Lys 325 330 335 Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp Val Leu Lys Ala 340 345 350 Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp Cys Gly Pro Cys 355 360 365 Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp Glu Tyr Gln Gly 370 375 380 Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn Pro Gly Thr Ala 385 390 395 400 Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu Leu Phe Lys Asn 405 410 415 Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser Lys Gly Gln Leu 420 425 430 Lys Glu Phe Leu Asp Ala Asn Leu Ala 435 440 <210> 11 <211> 4100 <212> DNA <213> Artificial Sequence <220> <223> pGJ3477 (vector sequence) <400> 11 aaaccaattg tccatattgc atcagacatt gccgtcactg cgtcttttac tggctcttct 60 cgctaaccaa accggtaacc ccgcttatta aaagcattct gtaacaaagc gggaccaaag 120 ccatgacaaa aacgcgtaac aaaagtgtct ataatcacgg cagaaaagtc cacattgatt 180 atttgcacgg cgtcacactt tgctatgcca tagcattttt atccataaga ttagctgatc 240 ctacctgacg ctttttatcg caactctcta ctgtttctcc atacccgttt aaataatttt 300 gtttaacttt aagaaggaga tatacccatg acacagaggg cccaccatca ccatcaccat 360 tccggatccg gctgctaaca aagcccgaaa ggaagctgag ttggctgctg ccaccgctga 420 gcaataacta gcataacccc ttggggcctc taaacgggtc ttgaggggtt ttttgctgaa 480 aggaggaact atatccggcc ggatatccac aggacgggtg tggtcgccat gatcgcgtag 540 tcgatagtgg ctccaagtag cgaagcgagc aggactgggc ggcggccaaa gcggtcggac 600 agtgctccga gaacgggtgc gcatagaaat tgcatcaacg catatagcgc tagcagcacg 660 ccatagtgac tggcgatgct gtcggaatgg acgatatccc gcaagaggcc cggcagtacc 720 ggcataacca agcctatgcc tacagcatcc agggtgacgg tgccgaggat gacgatgagc 780 gcattgttag atttcataca cggtgcctga ctgcgttagc aatttaactg tgataaacta 840 ccgcattaaa gcttatcgat gataagctgt caaacatgag aattcttgaa gacgaaaggg 900 cctcgtgata cgcctatttt tataggttaa tgtcatgcat gagacaataa ccctgataaa 960 tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta 1020 ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag 1080 taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca 1140 gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta 1200 aagttctgct atgtggcgcg gtattatccc gtgttgacgc cgggcaagag caactcggtc 1260 gccgcataca ctattctcag aatgacttgg ttgacgcgtc accagtcaca gaaaagcatc 1320 ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca 1380 ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc 1440 acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca 1500 taccaaacga cgagcgtgac accacgatgc ctgcagcaat ggcaacaacg ttgcgcaaac 1560 tattaactgg cgaactactt actctagctt cccggcaaca attaatagac tggatggagg 1620 cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg 1680 ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg 1740 gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac 1800 gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc 1860 aagtttactc atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct 1920 aggtgaagat cctttttgat aatctcatgc atgaccaaaa tcccttaacg tgagttttcg 1980 ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 2040 ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 2100 ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 2160 ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 2220 ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 2280 tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 2340 tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 2400 tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 2460 tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 2520 gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 2580 tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 2640 ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 2700 gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 2760 gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt 2820 acgcatctgt gcggtatttc acaccgcata tatggtgcac tctcagtaca atctgctctg 2880 atgccgcata gttaagccag tatacactcc gctatcgcta cgtgactggg tcatggctgc 2940 gccccgacac ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc 3000 cgcttacaga caagctgtga ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc 3060 atcaccgaaa cgcgcgaggc agctggcacg acaggtttcc cgactggaat gtgcctgtca 3120 aatggacgaa gcagggattc tgcaaaccct atgctactcc gtcaagccgt caattgtctg 3180 attcgttacc aattatgaca acttgacggc tacatcattc actttttctt cacaaccggc 3240 acggaactcg ctcgggctgg ccccggtgca ttttttaaat acccgcgaga aatagagttg 3300 atcgtcaaaa ccaacattgc gaccgacggt ggcgataggc atccgggtgg tgctcaaaag 3360 cagcttcgcc tggctgatac gttggtcctc gcgccagctt aagacgctaa tccctaactg 3420 ctggcggaaa agatgtgaca gacgcgacgg cgacaagcaa acatgctgtg cgacgctggc 3480 gatatcaaaa ttgctgtctg ccaggtgatc gctgatgtac tgacaagcct cgcgtacccg 3540 attatccatc ggtggatgga gcgactcgtt aatcgcttcc atgcgccgca gtaacaattg 3600 ctcaagcaga tttatcgcca gcagctccga atagcgccct tccccttgcc cggcgttaat 3660 gatttgccca aacaggtcgc tgaaatgcgg ctggtgcgct tcatccgggc gaaagaaccc 3720 cgtattggca aatattgacg gccagttaag ccattcatgc cagtaggcgc gcggacgaaa 3780 gtaaacccac tggtgatacc attcgcgagc ctccggatga cgaccgtagt gatgaatctc 3840 tcctggcggg aacagcaaaa tatcacccgg tcggcaaaca aattctcgtc cctgattttt 3900 caccaccccc tgaccgcgaa tggtgagatt gagaatataa cctttcattc ccagcggtcg 3960 gtcgataaaa aaatcgagat aaccgttggc ctcaatcggc gttaaacccg ccaccagatg 4020 ggcattaaac gagtatcccg gcagcagggg atcattttgc gcttcagcca tacttttcat 4080 actcccgcca ttcagagaag 4100 <210> 12 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 3477 - fwrd (Primer sequence vector pGJ3477-fwrd) <400> 12 ggatccggct gctaacaaag c 21 <210> 13 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 3477 - rev (Primer sequence vector pGJ3477-rev) <400> 13 ggaatggtga tggtgatggt g 21 <210> 14 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> trxA-fwrd (Primer sequence trxA-fwrd) <400> 14 catcaccatc accattccat gagcgataaa attattcacc tgactgac 48 <210> 15 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> trxA-rev (Primer sequence trxA-rev) <400> 15 ctttgttagc agccggatcc ttacgccagg ttagcgtcga ggaac 45 <210> 16 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> trxB-fwrd (Primer sequence trxB-fwrd) <400> 16 caccatcacc attccatggg cacgaccaaa cacagtaaac 40 <210> 17 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> trxB-rev (Primer sequence trxB-rev) <400> 17 ctttgttagc agccggatcc ttattttgcg tcagctaaac catcgag 47 <210> 18 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> vtrxA-fwrd (Primer vector with trxA for trxBA fusion gene fwrd) <400> 18 ctgacgcagg tagcgataaa attattcacc tgactgac 38 <210> 19 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> ftrxB-fwrd (Primer insert trxB for trxBA fusion gene fwrd) <400> 19 catcaccatc accattccat gggcacgacc aaacacagta aactgc 46 <210> 20 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> ftrxB-rev (Primer insert trxB for trxBA fusion gene rev) <400> 20 gtcaggtgaa taattttatc gctacctgcg tcagctaaac catcgaggta gc 52 <210> 21 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> vtrxB-fwrd (Primer vector with trxB for trxAB fusion gene fwrd) <400> 21 cgctaacctg gcgggcacga ccaaacacag taaactg 37 <210> 22 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> ftrxA-fwrd (Primer insert trxA for trxAB fusion gene fwrd) <400> 22 catcaccatc accattccat gagcgataaa attattcacc tgactgac 48 <210> 23 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> ftrxA-rev (Primer insert trxA for trxAB fusion gene rev) <400> 23 gtgtttggtc gtgcccgcca ggttagcgtc gaggaac 37 <210> 24 <211> 1377 <212> DNA <213> Artificial Sequence <220> <223> Ml-trxBA (E.coli codon usage optimized ml-trxBA gene) <400> 24 atgaacacaa cgcctagtgc gcatgagaca atccatgaag tgatcgtcat aggttccggt 60 cctgcgggtt atacagcagc gttgtacgca gctagagcac aactgacccc tctcgtcttt 120 gagggcacat catttggcgg ggctttaatg accacaactg aagtcgagaa ctacccgggt 180 tttcgcaacg gtattacagg tccggaactc atggacgaca tgcgtgaaca ggcattacgg 240 tttggagcgg agctgcgtac cgaagatgtt gagtcagtca gtctaagagg accgataaaa 300 tccgttgtca ctgccgaggg ccagacctat caagcgagag cggtgattct ggctatggga 360 acttctgtac gttacttaca aataccgggt gagcaggaac tgctcgggcg cggagtgtcc 420 gcttgcgcga cctgtgatgg tagtttcttc aggggccaag atatcgccgt gatcggtggt 480 ggcgacagcg ctatggagga agcgctgttt cttacccgat tcgccagatc tgtgactctc 540 gtacaccgac gcgacgagtt tcgtgcgagt aaaatcatgt tgggtcgcgc ccgtaataac 600 gataaaataa agttcataac taaccacacg gtggtggcag tcaatggcta taccacggtg 660 accggactgc gtttgcggaa tacgacgacc ggtgaagaaa ccacattagt cgtaaccggc 720 gtcttcgtgg ctattggcca cgaaccgaga agttctttag tgtcagatgt agtggatata 780 gatcccgacg gttatgtact ggtaaagggt cgaactactt ccaccagcat ggatggagtg 840 ttcgcggctg gggacttggt tgaccgcaca tatcgtcaag caattaccgc tgcgggttca 900 ggctgcgctg cggctataga cgcggaacgt tggttggcag agcatgcggg ttccaaggca 960 aatgaaacca ctgaagagac aggcgacgtg gattccaccg atacgacaga ttggtccaca 1020 gcgatgacag acgcaaagaa tgctggtgtg actatcgagg ttacggacgc ctctttcttc 1080 gccgacgttc taagctcaaa taagccggtc ctcgtcgact tctgggccac ttggtgtggc 1140 ccgtgtaaaa tggttgcacc cgtgttagag gagattgcat cggaacagcg caatcaatta 1200 acagttgcta agcttgatgt cgatacgaac ccggagatgg ctagagagtt tcaggtcgtg 1260 tccataccta caatgatatt atttcaaggt ggtcaaccgg tcaagcgcat cgtaggggcg 1320 aaagggaagg ccgcattact tcgcgacctc agcgatgttg ttcctaacct gaactga 1377 <210> 25 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Ml-trxBA-fwrd (Primer sequence ml-trxBA-fwrd) <400> 25 catcaccatc accattccat gaacacaacg cctagtgcgc atgag 45 <210> 26 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Ml-trxBA-rev (Primer sequence ml-trxBA-rev) <400> 26 ctttgttagc agccggatcc tcagttcagg ttaggaacaa catcgctg 48 <210> 27 <211> 1338 <212> DNA <213> Artificial Sequence <220> <223> histrxB5A (Fusion gene of His-tag and E.coli proteins TrxB and TrxA) <400> 27 atgacacaga gggcccacca tcaccatcac cattccatgg gcacgaccaa acacagtaaa 60 ctgcttatcc tgggttcagg cccggcggga tacaccgctg ctgtctacgc ggcgcgcgcc 120 aacctgcaac ctgtgctgat taccggcatg gaaaaaggcg gccaactgac caccaccacg 180 gaagtggaaa actggcctgg cgatccaaac gatctgaccg gtccgttatt aatggagcgc 240 atgcacgaac atgccaccaa gtttgaaact gagatcattt ttgatcatat caacaaggtg 300 gatctgcaaa accgtccgtt ccgtctgaat ggcgataacg gcgaatacac ttgcgacgcg 360 ctgattattg ccaccggagc ttctgcacgc tatctcggcc tgccctctga agaagccttt 420 aaaggccgtg gggtttctgc ttgtgcaacc tgcgacggtt tcttctatcg caaccagaaa 480 gttgcggtca tcggcggcgg caataccgcg gttgaagagg cgctgtatct gtctaacatc 540 gcttcggaag tgcatctgat tcaccgccgt gacggtttcc gcgcggaaaa aatcctcatt 600 aagcgcctga tggataaagt ggagaacggc aacatcattc tgcacaccaa ccgtacgctg 660 gaagaagtga ccggcgatca aatgggtgtc actggcgttc gtctgcgcga tacgcaaaac 720 agcgataaca tcgagtcact cgacgttgcc ggtctgtttg ttgctatcgg tcacagcccg 780 aatactgcga ttttcgaagg gcagctggaa ctggaaaacg gctacatcaa agtacagtcg 840 ggtattcatg gtaatgccac ccagaccagc attcctggcg tctttgccgc aggcgacgtg 900 atggatcaca tttatcgcca ggccattact tcggccggta caggctgcat ggcagcactt 960 gatgcggaac gctacctcga tggtttagct gacgcaggtc cggcccctgg cagcgataaa 1020 attattcacc tgactgacga cagttttgac acggatgtac tcaaagcgga cggggcgatc 1080 ctcgtcgatt tctgggcaga gtggtgcggt ccgtgcaaaa tgatcgcccc gattctggat 1140 gaaatcgctg acgaatatca gggcaaactg accgttgcaa aactgaacat cgatcaaaac 1200 cctggcactg cgccgaaata tggcatccgt ggtatcccga ctctgctgct gttcaaaaac 1260 ggtgaagtgg cggcaaccaa agtgggtgca ctgtctaaag gtcagttgaa agagttcctc 1320 gacgctaacc tggcgtaa 1338 <210> 28 <211> 445 <212> PRT <213> Artificial Sequence <220> <223> HisTrxB5A (Fusion protein of His-tag and E.coli proteins TrxB and TrxA) <400> 28 Met Thr Gln Arg Ala His His His His His His Ser Met Gly Thr Thr 1 5 10 15 Lys His Ser Lys Leu Leu Ile Leu Gly Ser Gly Pro Ala Gly Tyr Thr 20 25 30 Ala Ala Val Tyr Ala Ala Arg Ala Asn Leu Gln Pro Val Leu Ile Thr 35 40 45 Gly Met Glu Lys Gly Gly Gln Leu Thr Thr Thr Thr Glu Val Glu Asn 50 55 60 Trp Pro Gly Asp Pro Asn Asp Leu Thr Gly Pro Leu Leu Met Glu Arg 65 70 75 80 Met His Glu His Ala Thr Lys Phe Glu Thr Glu Ile Ile Phe Asp His 85 90 95 Ile Asn Lys Val Asp Leu Gln Asn Arg Pro Phe Arg Leu Asn Gly Asp 100 105 110 Asn Gly Glu Tyr Thr Cys Asp Ala Leu Ile Ile Ala Thr Gly Ala Ser 115 120 125 Ala Arg Tyr Leu Gly Leu Pro Ser Glu Glu Ala Phe Lys Gly Arg Gly 130 135 140 Val Ser Ala Cys Ala Thr Cys Asp Gly Phe Phe Tyr Arg Asn Gln Lys 145 150 155 160 Val Ala Val Ile Gly Gly Gly Asn Thr Ala Val Glu Glu Ala Leu Tyr 165 170 175 Leu Ser Asn Ile Ala Ser Glu Val His Leu Ile His Arg Arg Asp Gly 180 185 190 Phe Arg Ala Glu Lys Ile Leu Ile Lys Arg Leu Met Asp Lys Val Glu 195 200 205 Asn Gly Asn Ile Ile Leu His Thr Asn Arg Thr Leu Glu Glu Val Thr 210 215 220 Gly Asp Gln Met Gly Val Thr Gly Val Arg Leu Arg Asp Thr Gln Asn 225 230 235 240 Ser Asp Asn Ile Glu Ser Leu Asp Val Ala Gly Leu Phe Val Ala Ile 245 250 255 Gly His Ser Pro Asn Thr Ala Ile Phe Glu Gly Gln Leu Glu Leu Glu 260 265 270 Asn Gly Tyr Ile Lys Val Gln Ser Gly Ile His Gly Asn Ala Thr Gln 275 280 285 Thr Ser Ile Pro Gly Val Phe Ala Ala Gly Asp Val Met Asp His Ile 290 295 300 Tyr Arg Gln Ala Ile Thr Ser Ala Gly Thr Gly Cys Met Ala Ala Leu 305 310 315 320 Asp Ala Glu Arg Tyr Leu Asp Gly Leu Ala Asp Ala Gly Pro Ala Pro 325 330 335 Gly Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp 340 345 350 Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp 355 360 365 Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp 370 375 380 Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn 385 390 395 400 Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu 405 410 415 Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser 420 425 430 Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala 435 440 445 <210> 29 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> vtrxA5-fwrd (Primer vector with trxA for trxB5A fusion gene fwrd) <400> 29 ctgacgcagg tccggcccct ggcagcgata aaattattca cctgactgac 50 <210> 30 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> ftrxB5-rev (Primer insert trxB5 for trxB5A fusion gene rev) <400> 30 gtcaggtgaa taattttatc gctgccaggg gccggacctg cgtcagctaa accatcgagg 60 tagc 64

Claims (15)

  1. 시스틴을 시스테인으로 환원시키기 위한 효소로서,
    상기 효소는
    i) KEGG 데이터베이스 번호 EC 1.8.4.8 또는 EC 1.8.4.10을 갖는 티오레독신(thioredoxin)(단백질 i) 및
    ii) KEGG 데이터베이스 번호 EC 1.8.1.9를 갖는 티오레독신 리덕타제(thioredoxin reductase)(단백질 ii)
    의 단백질 활성을 포함하는 융합 단백질이고,
    상기 융합 단백질의 활성은, 동일하지만 비융합된 개별 단백질 i과 ii의 혼합물의 활성의 적어도 100%인 것을 특징으로 하는, 효소.
  2. 제1항에 있어서,
    상기 단백질 i 및 단백질 ii는 미생물 서열인 것을 특징으로 하는, 효소.
  3. 제2항에 있어서,
    상기 티오레독신(단백질 i)은 이. 콜라이(E. coli)로부터의 티오레독신 1의 단백질 활성인 것을 특징으로 하는, 효소.
  4. 제2항에 있어서,
    상기 티오레독신 리덕타제(단백질 ii)는 이. 콜라이로부터의 티오레독신 리덕타제의 단백질 활성인 것을 특징으로 하는, 효소.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 융합 단백질은 2개의 아미노산 서열을 포함하며, 이들 아미노산 서열 중
    - 하나는 SEQ ID No. 7과 적어도 50% 동일하고,
    - 다른 아미노산 서열은 SEQ ID No. 8과 적어도 50% 동일하며,
    상기 융합 단백질은 CR 활성을 갖는 것을 특징으로 하는, 효소.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    N-말단적으로 위치한 상기 단백질의 아미노산 서열은 1개 내지 최대 5개 아미노산에 의해 C-말단적으로 단축된 융합 단백질에 존재하는 것을 특징으로 하는, 효소.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    C-말단적으로 위치한 상기 단백질의 아미노산 서열은 1개 내지 최대 5개 아미노산에 의해 N-말단적으로 단축된 융합 단백질에 존재하는 것을 특징으로 하는, 효소.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    상기 티오레독신(단백질 i)과 티오레독신 리덕타제(단백질 ii)의 융합된 단백질 활성의 아미노산 서열은 1개 내지 최대 5개 아미노산의 링커 서열에 의해 연결된 융합 단백질에 존재하는 것을 특징으로 하는, 효소.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 융합 단백질은 SEQ ID No. 9, SEQ ID No. 10, 및 SEQ ID No. 28로 이루어진 군으로부터 선택되는 아미노산 서열인 것을 특징으로 하는, 효소.
  10. 시스틴을 시스테인으로 효소적으로 환원시키는 방법으로서,
    상기 시스테인은 보조인자의 존재 하에 제1항 내지 제9항 중 어느 한 항의 효소에 의해 환원된 것임을 특징으로 하는, 방법.
  11. 제10항에 있어서,
    상기 환원은 6 내지 9의 pH에서 발생하는 것을 특징으로 하는, 방법.
  12. 제10항 또는 제11항에 있어서,
    상기 보조인자는 NADPH 및 NADH로 이루어진 군으로부터 선택되는 성분인 것을 특징으로 하는, 방법.
  13. 제10항 내지 제12항 중 어느 한 항에 있어서,
    상기 방법은 보조인자-재생 효소를 포함하는 것을 특징으로 하는, 방법.
  14. 제13항에 있어서,
    상기 보조인자-재생 효소는 데하이드로게나제(dehydrogenase)이고
    상기 환원은 전자 공여체의 존재 하에 추가로 발생하는 것을 특징으로 하는, 방법.
  15. 제14항에 있어서,
    상기 데하이드로게나제는 알코올 데하이드로게나제(alcohol dehydrogenase)이고, 전자 공여체로서 이소프로판올과 사용되는 것을 특징으로 하는, 방법.
KR1020227034139A 2020-04-03 2020-04-03 시스틴의 생체촉매적 환원을 위한 효소-촉매화된 산화환원 시스템의 코어 구성요소로서의 생체촉매 KR20220149587A (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2020/059654 WO2021197632A1 (de) 2020-04-03 2020-04-03 Biokatalysator als kernkomponente eines enzymkatalysierten redoxsystems zur biokatalytischen reduktion von cystin

Publications (1)

Publication Number Publication Date
KR20220149587A true KR20220149587A (ko) 2022-11-08

Family

ID=70680448

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227034139A KR20220149587A (ko) 2020-04-03 2020-04-03 시스틴의 생체촉매적 환원을 위한 효소-촉매화된 산화환원 시스템의 코어 구성요소로서의 생체촉매

Country Status (7)

Country Link
US (1) US20230124898A1 (ko)
EP (1) EP4103729B1 (ko)
JP (1) JP2023527107A (ko)
KR (1) KR20220149587A (ko)
CN (1) CN115244183A (ko)
ES (1) ES2966310T3 (ko)
WO (1) WO2021197632A1 (ko)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19539952A1 (de) 1995-10-26 1997-04-30 Consortium Elektrochem Ind Verfahren zur Herstellung von O-Acetylserin, L-Cystein und L-Cystein-verwandten Produkten
DE19726083A1 (de) 1997-06-19 1998-12-24 Consortium Elektrochem Ind Mikroorganismen und Verfahren zur fermentativen Herstellung von L-Cystein, L-Cystin, N-Acetyl-Serin oder Thiazolidinderivaten
DE19949579C1 (de) 1999-10-14 2000-11-16 Consortium Elektrochem Ind Verfahren zur fermentativen Herstellung von L-Cystein oder L-Cystein-Derivaten
DE10232930A1 (de) 2002-07-19 2004-02-05 Consortium für elektrochemische Industrie GmbH Verfahren zur fermentativen Herstellung von Aminosäuren und Aminosäure-Derivaten der Phosphoglycerat-Familie
DE102004035052A1 (de) 2004-07-20 2006-02-16 Basf Ag Mikroorganismen zur Herstellung von schwefelhaltigen Verbindungen
DE102006010994A1 (de) 2006-03-09 2007-09-13 Wacker Chemie Ag Verfahren zur enzymatischen Herstellung von chiralen Alkoholen
US8383372B2 (en) 2008-03-06 2013-02-26 Ajinomoto Co., Inc. L-cysteine producing bacterium and a method for producing L-cysteine
CN101899460B (zh) * 2010-02-24 2013-06-19 浙江大学 一种制备降低食物过敏原反应的融合蛋白的方法
DE102011078481A1 (de) 2011-06-30 2013-01-03 Wacker Chemie Ag Verfahren zur fermentativen Produktion von natürlichem L-Cystein
FR3041635B1 (fr) * 2015-09-30 2019-01-25 Arkema France Procede de production de mercaptans par hydrogenolyse enzymatique de disulfures

Also Published As

Publication number Publication date
ES2966310T3 (es) 2024-04-19
CN115244183A (zh) 2022-10-25
US20230124898A1 (en) 2023-04-20
EP4103729B1 (de) 2023-10-18
EP4103729A1 (de) 2022-12-21
JP2023527107A (ja) 2023-06-27
WO2021197632A1 (de) 2021-10-07

Similar Documents

Publication Publication Date Title
CN103975069B (zh) 通过使用AlkB烷烃1-单加氧酶氧化烷烃的方法
CN113151230A (zh) 一种甲醛裂合酶的突变体蛋白及其应用
Broadwater et al. Spinach Holo-Acyl Carrier Protein: Overproduction and Phosphopantetheinylation inEscherichia coliBL21 (DE3), in VitroAcylation, and Enzymatic Desaturation of Histidine-Tagged Isoform I
Gao et al. Three novel Escherichia coli vectors for convenient and efficient molecular biological manipulations
KR20200010285A (ko) 증가된 nadph를 유도하는 생합성 경로의 게놈 공학
CN112831484B (zh) T7-rna聚合酶突变体及其应用
Wang et al. Identification of functional cysteine residues in human galactosyltransferase
US9416388B2 (en) Method for producing disulfide bond containing proteins in a prokaryotic cytoplasm
KR20220149587A (ko) 시스틴의 생체촉매적 환원을 위한 효소-촉매화된 산화환원 시스템의 코어 구성요소로서의 생체촉매
KR20150146300A (ko) 가용성 단백질 발현량이 증대된 헬리코박터 파일로리 유래 α-1,2 푸코실 전달효소의 유전자와 단백질 및 α-1,2 푸코실올리고당 생산에의 응용
JP4759054B2 (ja) ニューロスポラ・クラッサ(Neurosporacrassa)由来のS−アデノシルメチオニン−β−N−リジン−メチルトランスフェラーゼ、それをコードする遺伝子、同遺伝子を含むベクター及び宿主細胞、ならびに同宿主細胞を使用してトリメチルリジンを生産する方法
KR20210089699A (ko) 산화성 세포질을 갖는 대장균 균주
CN115058398B (zh) 一种精氨酸突变的核酸连接酶
CN106318917B (zh) 天冬氨酸-β-半醛脱氢酶突变体及其应用
US20220340628A1 (en) Tag protein for increasing water solubility and heat stability of target protein, and fusion protein comprising same
Coulombe et al. Dual-tag prokaryotic vectors for enhanced expression of full-length recombinant proteins
JP4399684B2 (ja) 改良されたrnaポリメラーゼ
KR102282778B1 (ko) 재조합 미생물 및 이의 사용 방법
US7198932B1 (en) Gdp-4-keto-6-deoxy-d-mannose-3,5-epimerase-4-reductase gene derived from arabidopsis thaliana
KR20200083488A (ko) 키랄 아릴술피드의 거울상선택성 효소 술폭시드화
Schlesinger et al. Localization of translation initiation in the message for E. coli UDP-galactose 4-epimerase: the amino terminal sequence
US20070048774A1 (en) Continuous in-vitro evolution
US20210017504A1 (en) Hybrid reverse transcriptases
KR102023348B1 (ko) BaCYP106A2 효소 단백질, 그의 결정화 방법 및 그의 용도
CN116144686A (zh) 一种细菌体内靶向蛋白酰基化修饰方法

Legal Events

Date Code Title Description
A201 Request for examination