KR102640531B1 - 디하이드로콜린산 화합물의 생체촉매적 전세포 환원을 위한 방법, 7β-히드록시스테로이드 탈수소효소 변이체들 및 우르소데스옥시콜린산을 제조하기 위한 개선된 생체촉매 방법 - Google Patents

디하이드로콜린산 화합물의 생체촉매적 전세포 환원을 위한 방법, 7β-히드록시스테로이드 탈수소효소 변이체들 및 우르소데스옥시콜린산을 제조하기 위한 개선된 생체촉매 방법 Download PDF

Info

Publication number
KR102640531B1
KR102640531B1 KR1020177001891A KR20177001891A KR102640531B1 KR 102640531 B1 KR102640531 B1 KR 102640531B1 KR 1020177001891 A KR1020177001891 A KR 1020177001891A KR 20177001891 A KR20177001891 A KR 20177001891A KR 102640531 B1 KR102640531 B1 KR 102640531B1
Authority
KR
South Korea
Prior art keywords
hsdh
ala
gly
formula
val
Prior art date
Application number
KR1020177001891A
Other languages
English (en)
Other versions
KR20170020511A (ko
Inventor
더크 베우스테르-보츠
보퀴아오 선
크리스티안 퀴린
Original Assignee
파마젤 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파마젤 게엠베하 filed Critical 파마젤 게엠베하
Publication of KR20170020511A publication Critical patent/KR20170020511A/ko
Application granted granted Critical
Publication of KR102640531B1 publication Critical patent/KR102640531B1/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01047Glucose 1-dehydrogenase (1.1.1.47)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01053Alpha-hydroxysteroid 3-dehydrogenase (B-specific) (1.1.1.50)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/011453-Beta-hydroxy-DELTA5-steroid dehydrogenase (1.1.1.145)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/012017-Beta-hydroxysteroid dehydrogenase (NADP+) (1.1.1.201)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Steroid Compounds (AREA)

Abstract

본 발명은 디하이드로콜린산(DHCA) 화합물들의 전세포 환원을 포함하는 새로운 생체촉매 방법들, 새로운 7β-히드록시스테로이드 탈수소효소 변이체들, 상기 효소 변이체들을 위해 코딩하는 서열, 효소 변이체들을 제조하기 위한 방법, 및 콜린산 화합물의 효소적 전환 및 특히 우르소데스옥시콜린산(UDCA)의 제조에 있어서 이들의 용도에 관한 것이며; 또한, 본 발명의 주제는 효소 변이체들을 사용한 UDCA의 새로운 합성방법들; 및 특히 재조합 전세포 생체촉매들을 사용하여 UDCA를 제조하기 위한 또다른 개선된 방법이다.

Description

디하이드로콜린산 화합물의 생체촉매적 전세포 환원을 위한 방법, 7β-히드록시스테로이드 탈수소효소 변이체들 및 우르소데스옥시콜린산을 제조하기 위한 개선된 생체촉매 방법{NOVEL METHOD FOR BIOCATALYTIC WHOLE CELL REDUCTION OF DEHYDROCHOLIC ACID COMPOUNDS, NOVEL 7β-HYDROXYSTEROID DEHYDROGENASE MUTANTS AND IMPROVED BIOCATALYTIC METHOD FOR PRODUCING URSODESOXYCHOLIC ACID}
본 발명은 디하이드로콜린산(DHCA) 화합물의 전세포 환원을 포함하는 새로운 생체촉매 방법들, 새로운 7-β-히드록시스테로이드 탈수소효소 변이체들, 상기 효소 변이체들을 코딩하기 위한 서열, 효소 변이체들을 제조하기 위한 방법, 및 콜린산 화합물(담즙산 유도체들)의 효소적 전환 및 특히 우르소데스옥시콜린산(UDCA)의 제조에 있어서 이들의 용도에 관한 것이며; 또한, 본 발명의 주제는 효소 변이체들을 사용한 UDCA의 새로운 합성방법들, 및 특히 재조합 전세포 생체촉매들을 사용하여 UDCA를 제조하기 위한 또다른 개선된 방법이다.
담석 문제점들을 의약 치료하기 위해, 그중에서도 담즙산염 활성 물질들 우르소데스옥시콜린산(UDCS 또는 UDCA) 및 대응하는 다이어스테레오머 케노데스옥시콜린산(CDCS 또는 CDCA)이 수년동안 사용되어왔다. 두 화합물들은 C 원자 7에서 히드록시기의 구성에서만 상이하다(UDCA: β-구성, CDCA: α-구성). 당 기술분야에서, UDCA를 제조하기 위해 여러 방법들이 설명되어 있으며, 이들은 순수하게 화학적으로 수행되거나, 화학적 및 효소적 공정단계들의 조합으로 구성된다. 각 경우에 출발 지점은 콜린산(CA 또는 CA) 또는, 콜린산으로부터 제조된 CDCA이다.
따라서, UDCA 제조를 위한 전통적인 화학 방법은 하기와 같이 도표로 나타낼 수 있다:
이 중에서, 심각한 단점은 다음과 같다: 화학적 산화가 선택적이지 않으므로, 카르복시기 및 3α 및 7α-히드록시기가 에스테르화에 의해 보호되어야 한다.
효소 12α-히드록시스테로이드 탈수소효소(12α-HSDH)의 사용에 근거한 임의의 화학적/효소적 방법은 하기와 같이 나타낼 수 있으며, 및 예를 들면 본 출원인의 PCT/EP2009/002190에 설명되어 있다.
여기에서, 12α-HSDH는 CA를 선택적으로 12-케토-CDCA로 산화한다. 그 결과, 전통적인 화학적 방법들에 따라 필요한 두 보호단계들이 더이상 불필요하게 된다.
그리고, 임의의 효소적/화학적 방법은 Monti, D., et al., (One-Pot Multienzymatic Synthesis of 12-ketoursodeoxycholic Acid: Subtle Cofactor Specificities Rule the Reaction Equilibria of Five Biocatalysts Working in a Row. Advanced Synthesis & Catalysis, 2009)에 설명되어 있으며, 이는 하기와 같이 도표로 나타낼 수 있다:
CA는 첫째로, 박테로이데스 프라질리스(bacteroides fragilis) ATCC 25285(Zhu, D., et al., Enzymatic enantioselective reduction of keto esters by a thermostable 7-hydroxysteroid dehydrogenase from Bacteroides fragilis. Tetrahedron, 2006. 62(18): p. 4535-4539)로부터의 7α-HSDH 및 12α-HSDH에 의해 7,12-디케토-LCA로 산화된다. 이러한 두 효소들은 모두 NADH-의존적이다. 클로스트리듐 압소눔(Clostridium absonum) ATCC 27555(DSM 599)(MacDonald, I.A. and P.D. Roach, Bile induction of 7 alpha- and 7 beta-hydroxysteroid dehydrogenases in Clostridium absonum. Biochim Biophys Acta, 1981. 665(2): p. 262-9)로부터의 7β-HSDH(NADPH-의존적)에 의한 환원 후, 12-케토-UDCA가 형성된다. 최종 생성물이 Wolff-Kishner 환원에 의해 얻어진다. 이 방법에서, 촉매된 반응의 평형위치때문에, 완전한 전환이 가능하지 않으며, 전환의 첫번째 단계를 위해 2개의 다른 효소들이 사용되어야 해서, 방법이 비싸지는 단점이 있다. 보조인자 재생을 위해, 락테이트 탈수소효소(LDH; NAD+의 재생을 위함) 및 글루코스 탈수소효소(GlcDH 또는 GDH, NADPH의 재생을 위함)가 사용된다. 본원에 사용된 보조인자 재생에서, 제조된 부산물이 반응혼합물로부터 매우 어렵게 제거될 수 있을 뿐, 반응 평형이 바람직한 영향을 받을 수 없어, 유리체가 불완전하게 전환된다는 단점이 있다.
균주 콜린셀라 아에로파시엔스(Collinsella aerofaciens) ATCC 25986(DSM 3979; 전자 유박테리움 아에로파시엔스(Eubacterium aerofaciens))로부터의 7β-HSDH는 1982년, Hirano 및 Masuda의 (Hirano, S. and N. Masuda, Characterization of NADP-dependent 7 beta-hydroxysteroid dehydrogenases from Peptostreptococcus productus and Eubacterium aerofaciens. Appl Environ Microbiol, 1982. 43(5): p. 1057-63)에 설명되어 있다. 이 효소에 대한 서열 정보는 개시되어 있지 않다. 겔 여과에 의해 측정된 분자량은 45,000Da이었다(Hirano, 페이지 1059, 좌측 컬럼 참조). 더욱이, 7-옥소 기를 7β-히드록시기로 환원하는 것은 상기 효소에 대하여 관찰될 수 없었다(Hirano, 페이지 1061, Discussion 1st 단락 참조). 따라서, 당업자들은 Hirano 외 다수에 의해 설명된 효소가 7-위치의 디하이드로콜린산(DHCA 또는 DHCA)이 3,12-디케토-UDCA로 환원되는 것을 촉매하기에 적당하지 않다는 것을 알 것이다.
본 출원인의 WO2011/064404에는, 그중에서도 약 28-32kDa의 분자량(SDS 겔 전기영동 상에서)을 갖고, 약 53 내지 60kDa의 분자량(특히 SDS 없는 것과 같은 비-변성 조건하에, 겔 여과 상에서)을 갖고, 및 7-케토 LCA의 7-카르보닐기를 7β-히드록시기로 입체선택적 환원하는 것을 실시할 수 있는 능력을 갖는, 콜린셀라 아에로파시엔스 ATCC 25986으로부터의 새로운 7β-HSDH가 설명되어 있다.
이 외에도, WO2011/064404에는 UDCA 제조 방법이 개시되어 있으며, 이는 하기와 같이 도표로 도시될 수 있다:
여기에서, CA의 산화는 전통적인 화학적 경로에 의해 간단하게 일어난다. DHCA는 효소 쌍 7β-HSDH 및 3α-HSDH에 의해 연속으로 또는 한 포트로 단독으로 12-케토-UDCA로 환원된다. Wolff-Kishner 환원과 조합하여, UDCA는 단지 세 단계로 CA로부터 합성될 수 있다. 7β-HSDH가 보조인자 NADPH에 의존적인 반면, 3α-HSDH는 보조인자 NADH를 필요로 한다. 같은 보조인자에 대한 의존성 또는 (예를 들면, 보조인자 NADH 및 NADPH에 대한) 연장된 의존성을 갖는 효소 쌍들의 유용성은 유리하며, 그럼으로써 보조인자 재생이 간소화될 수 있었다.
본 출원인의 WO2012/080524에는, 특히 디하이드로콜린산 화합물(DHCA)의 생체촉매 환원을 위한 전세포 방법 및, 특히 7β-HSDH 및 3α-HSDH를 발현하는 재조합 전세포 촉매들을 사용하여 UDCA를 제조하기 위한 새로운 방법이 설명되어 있으며, 보조인자 재생을 위한 효소적 환원 단계들이 보조인자-재생 효소, 예컨대 예를 들면 적당한 글루코스 탈수소효소(GDH)와 결합된다.
효소적 합성의 효율에 대한 기준은 요구되는 효소들이 사용된 방법이다. 여기에서, 전세포 생체촉매는 입증된 접근법이다. 여기에서, 종종 이종성인 효소들은 숙주 유기체내에서 과잉발현되며, 세포들이 전반적으로 생체촉매로 사용된다. WO2012/080524에 개시된 특별한 전세포 생체촉매는 콜린셀라 아에로파시엔스로부터 예를 들면 NADPH-의존성, 7β-HSDH를, 코마모나스 테스토스테로니(Comamonas testosteroni)로부터 예를 들면 NADH-의존성 3α-HSDH를, 및 바실루스 서브틸리스(bacillus subtilis)로부터 NADH 및 NADPH를 모두 사용하는 GDH를 이종 발현하며, DHCA를 12-케토-우르소데스옥시콜린산(12-케토-UDCA)로 환원하기 위한 전세포 생체촉매로서 사용된다. 게다가, 100mM DHCA 98%를 12-케토-UDCA로 전환하기 위해 예를 들면, 17.7g BDM L-1 생체촉매를 사용하였다. 생체촉매가 본 제조방법에서 주요 비용 요소이므로, 본 기술적인 문제는 예를 들면, 생체촉매들을 다른 물질들로 일부 대체함으로써, 공정 비용이 감소될 수 있는 기술적인 해결방법들을 발견하는 것으로 이루어져 있다.
따라서, 제1 목적은 DHCA를 통해 UDCA를 환원적으로 제조하는데 있어서 특히 높은 비용효율을 특징으로 하는 새로운 생체촉매 방법들을 제공하는 것이다.
본 발명의 또다른 목적은 더욱 개선된 7β-HSDH를 제공하는 것이다. 특히, 효소 변이체들은 7-위치에서 DHCA의 입체특이적 환원을 통해 UDCA의 효소적 또는 미생물적(생체촉매적) 제조를 위해 보다 유리하게 사용될 수 있으며, 특히 변경된 보조인자 용법(특히, 개선된 NADH 특이성)을 갖는 효소 변이체들이 제공되어야 한다.
발명의 개요:
상기 첫번째 문제점은 전세포 촉매작용을 위해 요구되는 바이오매스가 보조인자 NAD 및/또는 NADP 첨가에 의해 일부 대체될 수 있다는 점에서 감소될 수 있는, DHCA 화합물의 생체촉매 환원을 위한 새로운 전세포 방법에 의해 놀랍게 해결될 수 있었다. 여기에서, NAD 또는 NADP, 또는 NAD 및 NADP가 반응 혼합물에 가해질 수 있다.
특히, 상기 첫번째 문제점은 개선된 생체촉매적(미생물적 또는 효소적) 방법, 특히 전세포 방법을 제공함으로써 해결되었으며, 상기 방법은 7β-HSDH 및 3α-HSDH에 의해 각각 촉매되는 2개의 환원성분단계들을 통한 DHCA의 효소적 전환단계를 포함하며, 이는 모두 환원성분단계들로부터, 사용된 보조인자를 재생하는 글루코스 탈수소효소(GDH) 효소를 사용함으로써, 12-케토-UDCA 및 보조인자 재생으로 동시에 진행되거나, 또는 임의의 순서로 차례대로 분리될 수 있다.
상기 두번째 문제점은 NADH 특이성이 개선된 콜린셀라 속, 특히 균주 콜린셀라 아에로파시엔스의 호기성 세균으로부터 7β-HSDH의 변이체들을 생성하고, 특징화함으로써 해결될 수 있었으며, 상기 변이체들은 또한, (효소적 또는 미생물적) 전환, 특히 콜린산 화합물의 전세포 프로세스의 문맥에서, 특히 UDCA의 제조에 사용된다.
도 1a는 콜린셀라 아에로파시엔스로부터의 7β-HSDH의 아미노산 서열을 나타내며, 도 1b는 도 1a의 아미노산 서열을 위한 코딩 핵산 서열이며; 도 1c는 코마노모나스 테스토스테로니로부터의 3α-HSDH의 아미노산 서열을 나타내며, 및 도 1d는 도 1c의 아미노산 서열을 위한 코딩 핵산 서열이며; 도 1e는 7β-HSDH 야생형(WT) 및 여러 변이체들: 7β-HSDH D, 7β-HSDH DF, 7β-HSDH DFK 및 7β-HSDH DFKG의 아미노산 서열들 비교를 도시하고 있다.
도 2는 전세포 생체촉매를 사용하여 디하이드로콜린산을 12-케토-우르소데스옥시콜린산으로 2단계 효소적 환원하는 것을 나타낸 모식도를 도시하고 있으며, 여기에서 환원의 성분 단계들은 7β-HSDH 및 3α-HSDH에 의해 촉매된다. 사용된 보조인자(NADH 또는 NADPH)는 글루코스 소모(글루코노-1,5-락톤의 형성)와 함께 전세포 촉매 GDH에 의해 발현된 GDH에 의해 재생된다.
도 3은 발현 플라스미드들 p7(A)T3rG(서열번호 18), p7(A)T3rG-K(서열번호 19) 및 p7(A)T3TG(서열번호 20)의 벡터 맵을 도시하고 있다.
도 4는 1gBDM L-1 생체촉매, 0.05mM NAD 및 0.01mM NADP(X=67)을 사용한, 전세포 생체촉매들 E.  coli BL49 p7(A)T3rG, E.  coli BL21 ΔhdhA p7(A)T3rG-K 및 E. coli BL49 p7(A)T3TG와의 생체촉매 반응들의 과정을 도시하고 있다.
도 5는 3.5gBDM L-1 생체촉매 및 0.025mM NAD(X=147.5)를 사용한, 전세포 생체촉매 E. coli BL49 p7(A)T3rG와의 생체촉매 반응의 과정을 도시하고 있다.
도 6은 1.75gBDM L-1 생체촉매, 0.025mM NAD 및 0.01mM NADP(X=89.5)을 사용한, 전세포 생체촉매 E. coli BL49 p7(A)T3rG와의 생체촉매 반응의 과정을 도시하고 있다.
도 7은 1gBDM L-1 생체촉매, 0.04mM NAD 및 0.0075mM NADP(X=61)을 사용한, 전세포 생체촉매 E. coli BL21 ΔhdhA p7(A)T3rG-K와의 생체촉매 반응의 과정을 도시하고 있다.
도 8은 본 발명에 따른 특이적 효소 변이체들과 함께 종래 기술로부터 알려져 있는 변형되지않은 7β-HSDH, 효소 변이체들 7β-HSDH G39D 및 7β-HSDH G39D R40I의 아미노산 서열 정렬을 도시하고 있다. 원 서열로부터 벗어난 위치들은 밑줄로 표시되어 있다.
도 9는 본 발명에 따른 7β-HSDH 변이체들의 효소 동력학 연구를 도시하고 있다. 0.5mM NADH의 일정한 보조인자 농도에서 사용된 다른 기질농도(DHCA/DHCA)에 대한 특이적인 효소활성의 플롯.
도 10은 본 발명에 따른 7β-HSDH 변이체들의 효소 동력학 연구를 도시하고 있다. 10mM DHCA/DHCA의 일정한 기질 농도에서 사용된 다른 보조인자 농도(NADH)에 대한 특이적인 효소활성의 플롯.
도 11은 -20℃ 및 실온/4℃에서 저장된 전세포 생체촉매 E. coli BLLiu p7(A)T3TG-K의 세포들에 의한 전세포 생체내 변환을 도시하고 있다. 상기 두 제조예들은 표준 조건들 하에서 수행하였다: 70mM DHCA, 350mM 글루코스, OD 2 세포들, 50μM NAD, 10μM NADP, 1mM MgCl2, 50mM KPi 버퍼(pH 7.0) 및 30℃. 아래 제조예에서, NAD 농도는 그외의 불변 조건에 의해 100μM로 두배가 되었다. pH는 NaOH 용액(5M)에 의해 초기 값으로 30분마다 수동조정되었다. 도시된 3회 진행된 것으로부터의 평균 값들 및 표준 편차들은 오차 지표들에 의해 나타낸다.
도 12는 NADH-의존성 7β-HSDH 변이체들 D, DF, DFK 및 DKFG를 야생형(WT) 효소와 비교한 것을 도시하고 있다. 각 경우, 반응 조건들은 0.2mg mL-1 7β-HSDH, 10U mL-1 GDH, 0.5mM NAD, 50mM DHCA, 200mM 글루코스, 500mM 인산칼륨, pH 8.0 및 30℃였다. 강하게 완충된 시스템에서 pH 조절없이 셰이킹된 깊은 웰 플레이트내에서 반응이 수행되었다. 3회 진행한 것의 표준 편차들은 오차 지표들에 의해 나타낸다.
도 13은 NADH-의존성 7β-HSDH 변이체들 DFK 및 DFKG에 의한 2-단계 생체내 변환의 반응과정들을 도시하고 있다. 각 경우, 반응조건들은 0.2mg mL-1 7β-HSDH, 1U mL-1 3α-HSDH, 10U mL-1 GDH, 0.5mM NAD, 50mM DHCA, 200mM 글루코스, 500mM 인산칼륨, pH 8.0 및 30℃이었다. 강하게 완충된 시스템에서 pH 조절없이 셰이킹된 깊은 웰 플레이트내에서 반응이 수행되었다. 3회 진행한 것의 표준 편차들은 오차 지표들에 의해 나타낸다.
본 발명은 특히, 하기 특정 구현예들에 관한 것이다:
1. 화학식 3의 디하이드로콜린산 화합물(DHCA)을 화학식 5의 대응하는 12-케토-우르소데스옥시콜린산 화합물(12-케토-UDCA)로 생체촉매 환원, 특히 전세포 환원하기 위한 방법으로서:
(상기 화학식 3에서,
R은 알킬, H, 알칼리금속 이온 또는 N(R3)4 +(식 중, 잔기들 R3은 같거나 다르며, H 또는 알킬을 나타냄)를 나타내거나, 또는 기 -CO2R은 산 아미드 기 -CONR1R2(식 중, R1 및 R2는 서로 독립적으로 알킬 잔기를 나타냄)에 의해 치환된다);
(상기 화학식 5에서,
R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
액체 반응매질내 1개 이상의 같거나 또는 다른 전세포 생체촉매, 특히 1개의 전세포 생체촉매는 전환에 필요한 효소들의 보조인자 특이성에 의존하여, NAD(H) 및/또는 NADP(H), 글루코스 및 선택적으로 추가의 첨가제를 포함하며, 및 화학식 3의 적어도 하나의 기질은 전세포 생체촉매(들)과 접촉하고, 및 선택적으로 반응 생성물이 반응 매질로부터 분리되며; 이 반응은 7β-히드록시스테로이드 탈수소효소(7β-HSDH), (NAD(H)- 및/또는 NADP(H)-의존적, 특히 NADP(H)-의존적); 3α-히드록시스테로이드 탈수소효소(3α-HSDH)(NAD(H)- 및/또는 NADP(H)-의존적, 특히 NAD(H)-의존적) 및 글루코스 탈수소효소(GDH)(NAD(H)- 및/또는 NADP(H)-의존적; 특히 보조인자-비특이적, 즉 NAD(H)- 및 NADP(H)-사용)의 존재하에 일어나며,
요구되는 효소들, 글루코스 및 선택적으로 추가의 첨가제들의 보조인자 특이성에 의존하여, NAD(H) 및/또는 NADP(H), 및 화학식 3의 적어도 하나의 기질은 기본적으로 생체촉매의 내인성 성분들이 아니지만, 액체 특히 수성 반응 매질에 첨가되며; 및
전세포 생체촉매(또는 다양한 전세포 생체촉매와 함께)는 효소 활성들을 동시에 발현(발현)하며
(1) 7β-HSDH 및
(2) 3α-HSDH, 및 선택적으로
(3) GDH가 액체 반응 매질에 첨가되지 않는 경우, GDH를 발현(발현)하며;
및 반응 혼합물내 전세포 생체촉매, NAD(H), NADP(H) 및 화학식 3의 기질의 농도는 하기 수학식 관계로 있다:
여기에서,
(여기에서, 변수들은 하기와 같이 정의된다:
cDHCA = 화학식 3의 화합물의 초기 기질 농도[mM]
cCat = 전세포 생체촉매 농도 [gBDM L-1]
cNAD(H) = NAD(H) 농도 [mM]
cNADP(H) = NADP(H) 농도 [mM].)
여기에서, 하기 바람직한 의미들은 특히, 상기 진술된 변수들에 대하여 단독으로 또는 전체적으로 적용된다:
a) cCat는 0.05 내지 50, 0.1 내지 10, 특히 0.5 내지 5gBDM L-1의 범위내에 있으며, 여기에서 "BDM"은 세균의 건조 질량을 나타낸다;
b) cNAD(H) 및 cNADP(H)는 동시에 0을 나타내지 않으며; 특히 두 값들은 0 이상이며, 즉 NAD(H)-의존적 및 또한 NADP(H)-의존적 단계는 생체촉매 방법의 일부이다;
c) cNAD(H) + cNADP(H)의 합은 적어도 10μM, 특히 적어도 20μM, 예컨대 예를 들면 10 내지 1000mM, 또는 15 내지 500mM 또는 20 내지 250mM 또는 25 내지 100mM이다.
d) cNAD(H) 및 cNADP(H)는 NAD(H) 및 NADP(H)의 각 포화농도보다 각각 낮으며, 예컨대 예를 들면 각 경우에, 1 내지 500mM, 5 내지 200mM 또는 10 내지 150mM 또는 15 내지 100mM이다, 및
e) cDHCA는 약 0.1 내지 500mM, 특히 1 내지 200mM, 또는 10 내지 100mM의 범위내에 있다.
예를 들면, 적어도 조건들 a), b) 및 c), 또는 a), b), c) 및 d) 또는, 또는 a) 내지 e)는 상기 정의에 따라 동시에 설정된다.
바람직한 배치는 전세포 생체촉매를 액체 반응매질에 사용하는 것을 포함하며; 이 반응은 7β-히드록시-스테로이드 탈수소효소(7β-HSDH), (NADP(H)-의존적); 3α-히드록시스테로이드 탈수소효소(3α-HSDH)(NAD(H)-의존적), 및 글루코스 탈수소효소(GDH)(보조인자-비특이적, 즉 NAD(H)- 및 NADP(H)-사용)의 존재하에 일어난다.
더욱 바람직한 배치는:
상기 바람직한 보조인자 특이성의 효소활성들
(1) 7β-HSDH
(2) 3α-HSDH 및
(3) GDH
을 동시에 발현하는 전세포 촉매를 포함한다.
특히, 본 발명에 따른 하기 교시내용을 보면, 당업자들은 >95%, >98%, >99% 또는 >99.5%의 전환율이 4 내지 24시간, 특히 6 내지 12시간 또는 7 내지 8시간 간격의 시간내에 도달하도록, 예를 들면 >98%가 6 내지 12시간 또는 7 내지 8시간 간격의 시간내에 도달하도록; 또는 >99.5%가 4 내지 24시간, 또는 6 내지 12시간내에 일어나도록 상기 농도값들을 선택할 수 있다. 10시간 미만, 예컨대 특히 3 내지 9.5시간 또는 4 내지 9시간, 5 내지 9시간, 6 내지 9시간, 또는 7 내지 9시간 및 상기 모든 약 8시간의 반응시간내에 >99%의 전환율이 특히 바람직하다. 상기 전환율들은 하기 실험예 부분에서 보다 상세히 설명되는 바와 같이, 표준 시험방법들(IPC 방법들)에 의해 측정될 수 있으며, DHCA의 12-케토-UDCA로의 전환율이 측정된다.
2. 구현예 1에 설명된 방법으로서, 전세포 생체촉매는 재조합 미생물이다.
3. 구현예 1 또는 2에 설명된 방법으로서, 생체촉매는 1개 이상, 특히 1 또는 2개의 플라스미드들, 또는 게놈-통합된, 특히 플라스미드 상에서 발현되는 7β-HSDH, 3α-HSDH 및 GDH의 효소 활성을 위한 코딩 서열들을 함유한다. 예를 들면, 플라스미드들:
p7(A)T3rG = p7(A)T3rG-A = pET22b 7β-HSDH (G39A) T7P 3α-HSDH rbs bsGDH (서열번호 18);
p7(A)T3rG-K = pET28a 7β-HSDH(G39A) T7P 3α-HSDH rbs bsGDH (서열번호 19);
p7(A)T3TG = p7(A)T3TG-A = pET22b 7β-HSDH(G39A) T7P 3α-HSDH T7P bsGDH (서열번호 20);
p7(A)T3TG-K = pET28a 7β-HSDH(G39A) T7P 3α-HSDH T7P bsGDH (서열번호 21)이 언급되며;
및 이로부터 유도된 플라스미드들,
여기에서 여기에 함유된 1개 이상의 효소-코딩 서열들은 효소 변이체를 위해 코딩하는 서열에 의해 치환되며, 예를 들면 7β-HSDH(G39A) 코딩서열은 다른 7β-HSDH 변이체 서열, 예컨대 예를 들면, 서열번호 9, 10, 11, 12 또는 13에 따른 변이체, 또는 본원에 설명된 또는 당 분야에 공지된 다른 변이체에 대하여 코딩하는 서열에 의해 치환될 수 있다.
4. 구현예 1 내지 3 중 어느 하나에 설명된 방법으로서, 생체촉매는 7α-HSDH 효소 활성을 발현하지 않는다(특히, 서열번호 6에 따라 없음).
5. 구현예 1 내지 4 중 어느 하나에 설명된 방법으로서, 7β-HSDH, 3α-HSDH 및 GDH는 외인성 발현된 효소활성들이며, 즉 재조합 미생물의 내인성 성분들(전세포 촉매)이 아니다.
6. 구현예 1 내지 5 중 어느 하나에 설명된 방법으로서, 7β-HSDH, 3α-HSDH 및/또는 GDH는 야생형 효소들 또는 유전자변형된 효소들(효소 변이체들)이다.
7. 구현예 1 내지 6 중 어느 하나에 설명된 방법으로서,
a) 7β-HSDH는 이 서열에 대하여 적어도 60% 서열 상동성, 예컨대 예를 들면 적어도 65, 70, 75, 80, 85, 또는 90, 예컨대 예를 들면 적어도 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 99.5%의 서열 상동성을 갖는, 서열번호 2에 따른 아미노산 서열 또는 이로부터 유도된 아미노산 서열을 가지며;
예컨대 예를 들면 본 출원인의 WO2012/080504로부터 공지된 변이체들로부터 선택된 효소 변이체, 예컨대 예를 들면, 단일 변이체들: G39A, G39S, G39D, G39V, G39T, G39P, G39N, G39E, G39Q, G39H, G39R, G39K 및 G39W, 및 R40D, R40E, R40I, R40V, R40L, R40G 및 R40A,
이중 변이체들: (G39D,R40I), (G39D,R40L), (G39D,R40V), (R40D,R41I), (R40D,R41L), (R40D,R41V), (R40I,R41I), (R40V,R41I) 및 (R40L,R41I), 또는
삼중 변이체들 (G39D,R40I,R41N), 또는 하기 구현예들 20 내지 24에 새로 설명된 다중 변이체들;
b) 3α-HSDH는 이 서열에 대하여 적어도 60% 서열 상동성, 예컨대 예를 들면 적어도 65, 70, 75, 80, 85, 또는 90, 예컨대 예를 들면 적어도 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 99.5%의 서열 상동성을 갖는, 서열번호 4에 따른 아미노산 서열 또는 이들로부터 유도된 아미노산 서열을 가지며; 및/또는
c) GDH는 이 서열에 대하여 적어도 60% 서열 상동성, 예컨대 예를 들면 적어도 65, 70, 75, 80, 85, 또는 90, 예컨대 예를 들면 적어도 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 99.5%의 서열 상동성을 갖는, 서열번호 8에 따른 아미노산 서열 또는 이들로부터 유도된 아미노산 서열을 가진다.
8. 구현예 1 내지 7 중 어느 하나에 설명된 방법으로서, 생체촉매는 에스케리치아 속의 미생물들의 재조합 균주, 특히 E. coli 균주이다.
9. 구현예 1 내지 8 중 어느 하나에 설명된 방법으로서, 7β-HSDH, 3α-HSDH 및 GDH는 NAD(H) 및 NADP(H)로부터 선택되는 같거나 다른 보조인자들을 사용하며; 예를 들면, 7β-HSDH는 NADP(H)를 사용하며, 3α-HSDH는 (NAD(H)를 사용하며; 및 GDH는 NAD(H) 및 NADP(H)를 사용한다.
10. 구현예 1 내지 9 중 어느 하나에 설명된 방법으로서, GDH는 7β-HSDH 및 3α-HSDH에 의해 촉매되는 부분 반응에서 소모되는, 보조인자들(NAD(H) 및/또는 NADP(H), 특히 NAD(H) 및 NADP(H)의 적어도 부분적인, 특히 완전한 재생을 할 수 있다.
11. 구현예 1 내지 10 중 어느 하나에 설명된 방법으로서, 반응이 pH=6~8의 완충된 수성 반응매질에서 수행된다.
12. 구현예 1 내지 11 중 어느 하나에 설명된 방법으로서, 글루코스가 10mM 내지 3000mM, 예컨대 예를 들면 100 내지 1000mM의 초기 농도로 사용된다.
13. 구현예 1 내지 12 중 어느 하나에 설명된 방법으로서, 반응이 연속적으로 또는 불연속적으로 수행된다.
14. 구현예 1 내지 13 중 어느 하나에 설명된 방법으로서, 촉매가 비-고정되거나, 비활성 지지체 재료 상에서 고정된다.
15. 구현예 1 내지 14 중 어느 하나에 설명된 방법으로서, 반응매질이 추가의 첨가제들, 예컨대 알칼리 또는 알칼리토금속염, 다가 저분자량 알콜 및/또는 버퍼들을 함유한다. 특히, 하나 이상의 첨가제들, 예컨대 예를 들면 알칼리 또는 알칼리토금속염, 예컨대 예를 들면 MgCl2(예를 들면, 0~20, 특히 1 내지 10mM) 및/또는 다가 저분자량 알콜, 예컨대 글리세린 0~30, 특히 1 내지 20%(v/v)가 반응매질에 첨가될 수 있다. 그리고, 버퍼 물질들, 예컨대 예를 들면 트리스, 아세테이트, 또는 포스페이트 버퍼는 10 내지 500mM, 특히 20 내지 150 또는 25 내지 100mM의 범위의, 예컨대 예를 들면 나트륨 또는 특히 인산칼륨 버퍼로 첨가될 수 있다. 여기에서, pH는 5.5 내지 9, 특히 6 내지 8, 예컨대 예를 들면 7 내지 7.5의 범위로 조정될 수 있다.
16. 구현예 1 내지 15 중 어느 하나에 설명된 방법으로서, 반응매질내에서 임의로 더이상 증식할 수 없는 전세포 생체촉매가 사용된다.
17. 구현예 16에 설명된 방법으로서, 전세포 생체촉매는 반응매질에 첨가되기 전에, 그의 세포막을 손상시켜 활성화시킴으로써 얻어진다.
전세포 생체촉매를 "활성화"시키기 위한 가능성들은 여러개 있다. 본래, 예를 들면 동결 및 해동에 의해, 또는 실온 또는 4℃에서 저장함으로써, 또는 세포막을 화학적으로 또는 기계적으로 천공함으로써 1개의 세포막만 손상되어야 한다.
18. 하기 화학식 1의 우르소데스옥시콜린산 화합물(UDCA)의 제조 방법으로서,
(상기 화학식 1에서,
R은 알킬, H, 알칼리금속이온 또는 N(R3)4 +(식 중, 잔기들 R3은 같거나 다르며, H 또는 알킬을 나타냄)이며, 또는 기 -CO2R은 산 아미드 기 -CONR1R2(식 중, R1 및 R2는 서로 독립적으로 알킬 잔기를 나타냄)에 의해 치환된다)
a) 선택적으로 하기 화학식 2의 콜린산(CA)이 화학식 3의 디하이드로콜린산 화합물(DHCA)로 예컨대 예를 들면 화학적으로 또는 효소적으로, 특히 화학적으로 산화되며;
(상기 화학식 2에서,
R은 상기 진술된 의미들을 가지며, 또는 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
(화학식 3)
(상기 화학식 3에서,
R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
b) DHCA는 구현예들 1 내지 17 중 어느 하나에 설명된 생체촉매 방법에 의해, 하기 화학식 5의 대응하는 12-케토-우르소데스옥시콜린산 화합물(12-케토-UDCA)로 환원된다:
(화학식 5)
(상기 화학식 5에서,
R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
c) 화학식 5의 12-케토-UDCA는 UDCA 화합물로 화학적으로 환원되며; 및
d) 반응생성물이 선택적으로 추가로 정제된다.
19. 상기 구현예들 중 하나에 설명된 방법으로서, 효소 활성은 하기 농도범위로 반응혼합물내에 함유된다:
(1) 7β-HSDH: 100 내지 3000, 예컨대 예를 들면 100 내지 1500, 예컨대 예를 들면 500 내지 1000 U/gBDM
(2) 3α-HSDH: 50 내지 500, 예컨대 예를 들면 10 내지 300 U/gBDM
(3) GDH: 100 내지 2000, 예컨대 예를 들면 200 내지 1000 U/gBDM
여기에서, cCat은 0.05 내지 50, 0.1 내지 10, 특히 0.5 내지 5 gBDM L-1 의 범위내에 있다.
20. 7-케토스테로이드를 대응하는 7-히드록시스테로이드로 적어도 입체특이적 효소적 환원하는 것을 촉매하는, 7β-히드록시스테로이드 탈수소효소(7β-HSDH)로서, 효소는 서열번호 2의 위치들 G39 및 R40의 각각에, 및 선택적으로 서열번호 2의 위치 R41 및/또는 선택적으로 위치 K44에, 또는 서열번호 2의 서열과 적어도 80% 서열 상동성, 예컨대 예를 들면 이 서열과 적어도 85 또는 90, 예컨대 예를 들면 적어도 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 99.5%의 서열 상동성을 갖는, 이로부터 유도된 아미노산 서열의 각 해당하는 서열 위치들에 돌연변이를 포함한다.
21. 구현예 20에 설명된 7β-HSDH로서, 이중 돌연변이 G39D/R40F를 포함한다.
22. 구현예 20 또는 21에 설명된 7β-HSDH로서, 삼중 돌연변이 G39D/R40F/R41X1을 포함하며, 상기 X1은 임의의 다른 아미노산 잔기, 특히 단백질구성(proteinogenic) 아미노산 잔기, 특히 K, Q, S 또는 R, 및 K에 대한 모든 것에 대한 NADH 특이성을 증가시키는 잔기를 나타낸다.
23. 구현예들 20 내지 22 중 하나에 설명된 7β-HSDH로서, 사중 돌연변이 G39D/R40F/R41X1,/K44X2를 포함하며, 여기에서 X1은 임의의 다른 아미노산 잔기, 특히 단백질구성(proteinogenic) 아미노산 잔기, 특히 K, Q, S 또는 R, 및 K에 대한 모든 것에 대한 NADH 특이성을 증가시키는 잔기를 나타내며, 및 X2는 임의의 다른 아미노산 잔기, 특히 단백질구성(proteinogenic) 아미노산 잔기, 특히 G, N, 또는 Q에 대한 NADH 특이성 및 G에 대한 모든 것을 증가시키는 잔기를 나타낸다.
24. 구현예들 20 내지 23 중 어느 하나에 설명된 7β-HSDH로서, 7β-HSDH를 서열번호 2와 비교하여, 하기 물성 프로필을 나타낸다:
a) 보조인자로서 NADH에 의한 DHCA의 효소적 환원에 있어서, NADH에 대한 증가된 특이적 활성(Vmax[U/mg]); 및 선택적으로
b) 보조인자로서 NADH에 의한 7-케토스테로이드(특히, 스테로이드 고리의 위치 C7에 케토 기를 갖는 담즙산염)의 효소적 환원에 있어서, NADH에 대한 증가된 특이적 활성(Vmax[U/mg]);
25. 구현예들 20 내지 24 중 어느 하나에 설명된 7β-HSDH에 대하여 코딩하는 뉴클레오티드 서열.
26. 적어도 하나의 조절서열의 조절하에 구현예 25에 설명된 적어도 하나의 뉴클레오티드 서열, 및 히드록시스테로이드 탈수소효소, 특히 3α-HSDH, 및 선택적으로, 보조인자 재생에 적당한 탈수소효소, 예컨대 예를 들면 FDH, GDH, ADH, G-6-PDH 또는 PDH로부터 선택되는 적어도 하나의(예컨대 예를 들면 1, 2 또는 3개의) 추가의 효소에 대한 코딩 서열들을 포함하는 발현 카세트. 특히, 발현 카세트내에 함유된 효소들은 다르지만, 바람직하게는 동일한 보조인자 쌍, 예컨대 예를 들면 보조인자 쌍 NAD+/NADH 또는 NADP+/NADPH를 사용할 수 있다.
27. 구현예 26에 설명된 바와 같은, 적어도 하나의 발현 카세트를 포함하는 발현 벡터.
28. 구현예 25에 설명된 적어도 하나의 뉴클레오티드 서열 또는 구현예 26에 설명된 적어도 하나의 발현 카세트 또는 구현예 27에 설명된 적어도 하나의 발현 벡터를 포함하는 재조합 미생물.
29. 구현예 28에 설명된 재조합 미생물로서, 히드록시스테로이드 탈수소효소(HSDH) 및, 보조인자 재생에 적당한 탈수소효소로부터 선택되는, 적어도 하나의 추가의 효소에 대한 코딩 서열을 추가로 선택적으로 포함한다.
30. 구현예 29에 설명된 재조합 미생물로서, 추가의 HSDH가 3α-HSDH들로부터 선택되며; 및
탈수소효소는 NADH-재생 효소들, 예컨대 NADH 탈수소효소, 알콜 탈수소효소(ADH), 및 NADH 재생 포르메이트 탈수소효소(FDH) 및 글루코스 탈수소효소(GDH), 글루코스-6-포스페이트 탈수소효소(G-6-PDH), 또는 포스파이트 탈수소효소(PtDH) 및 NADH 재생 글루코스 탈수소효소(GDH)로부터 선택된다.
31. 구현예 28 내지 30 중 어느 하나에 설명된 재조합 미생물은, 7α-HSDH 녹아웃 균주이다.
32. 구현예 1 내지 19 중 어느 하나에 설명된 방법은, 구현예 28 내지 30 중 어느 하나에 설명된 미생물을 사용하여 수행된다.
33. 7β-히드록시스테로이드의 효소적 또는 미생물 합성을 위한 방법으로서, 대응하는 7-케토-스테로이드는 구현예 20 내지 24 중 어느 하나의 정의에 따른 7β-HSDH의 존재하에, 또는 구현예 28 내지 32 중 어느 하나에 설명된 상기 7β-HSDH를 발현하는 재조합 미생물의 존재하에, 환원되며, 및 선택적으로, 형성된 적어도 하나의 환원 생성물은 반응 혼합물로부터 분리된다.
34. 구현예 33에 설명된 방법으로서, 7-케토스테로이드는
디하이드로콜린산(DHCA),
7-케토-리토콜린산(7-케토-LCA),
7,12-디케토-리토콜린산(7,12-디케토-LCA) 및
이들의 유도체들, 예컨대 특히 산의 염, 아미드 또는 알킬 에스테르
로부터 선택된다.
35. 구현예 33 또는 34에 설명된 방법으로서, NADH 및/또는 NAPH의 존재하에 및, 특히 소모와 함께; 특히 NADH의 소모와 함께 환원이 일어난다.
36. 구현예 35에 설명된 방법으로서, 사용된 NADH는 NADH-재생 효소와 결합함으로써 재생되며, 이는 NADPH 탈수소효소, 알콜 탈수소효소(ADH), 및 NADH-재생 포르메이트 탈수소효소(FDH) 및 NADH-재생 글루코스 탈수소효소(GDH)로부터 특히 선택되며, NADH-재생 효소는 재조합 미생물에 의해 선택적으로 발현되며;
및/또는 사용된 NADPH는 NADPH-재생 효소와 결합함으로써 재생되며, 이는 NADPH 탈수소효소, NADPH-재생 포르메이트 탈수소효소(FDH), NADPH-재생 알콜 탈수소효소(ADH), NADPH-재생 글루코스-6-포스페이트 탈수소효소(G6PDH), NADH-재생 포스파이트 탈수소효소(PtDH) 및 NADPH-재생 글루코스 탈수소효소(GDH)로부터 특히 선택되며, NADPH-재생 효소는 재조합 미생물에서 선택적으로 발현된다.
37. 구현예 36에 설명된 방법으로서, NADPH-재생 효소는 GDH들로부터 선택된다.
38. 하기 화학식 1의 우르소데스옥시콜린산(UDCA)의 제조 방법으로서,
(화학식 1)
(상기 화학식 1에서,
R은 알킬, H, 알칼리금속이온 또는 N(R3)4 +(식 중, 잔기들 R3은 같거나 또는 다르며, H 또는 알킬을 나타냄)를 나타내거나, 또는 기 -CO2R은 산 아미드 기 -CONR1R2(식 중, R1 및 R2는 서로 독립적으로 알킬 잔기를 나타냄)에 의해 치환된다);
a) 선택적으로 하기 화학식 2의 콜린산(CA)이 화학식 3의 디하이드로콜린산 화합물(DHCA)로 예컨대 예를 들면 화학적으로 또는 효소적으로, 특히 화학적으로 산화되며;
(화학식 2)
(상기 화학식 2에서,
R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
(화학식 3)
(상기 화학식 3에서,
R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
b) DHCA는 구현예들 20 내지 24 중 어느 하나의 정의에 따른 적어도 하나의 7β-HSDH 변이체의 존재하에, 및 적어도 하나의 3α-HSDH의 존재하에, 하기 화학식 5의 대응하는 12-케토-우르소데스옥시콜린산(12-케토-UDCA)으로 환원되며:
(화학식 5)
(상기 화학식 5에서,
R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이, 특히 NADH 및/또는 NADPH의 존재 및 소모하에, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
c) 화학식 5의 12-케토-UDCA는 UDCA로 화학적으로 환원되며; 및
d) 반응생성물이 선택적으로 추가로 정제된다.
39. 구현예 38에 설명된 방법으로서, 적어도 단계 b)는 구현예들 28 내지 32 중 어느 하나에 설명된 재조합 미생물의 존재하에 수행된다.
40. 구현예 38 또는 39에 설명된 방법으로서, 단계 b)는 같거나 다른 보조인자 재생 시스템과 결합된다.
41. 화학식 1의 UDCA의 제조 방법:
(상기 화학식 1에서,
R은 알킬, NR1R2, H, 알칼리금속이온 또는 N(R3)4 +(식 중, 잔기들 R3은 같거나 다르며, H 또는 알킬을 나타냄)이며, 또는 상기 정의된 바와 같이 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
a) 선택적으로 하기 화학식 2의 CA가 화학식 3의 DHCA로 예컨대 예를 들면 화학적으로 또는 효소적으로, 특히 화학적으로 산화되며;
(화학식 2)
(상기 화학식 2에서,
R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
(화학식 3)
(상기 화학식 3에서,
R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
b) DHCA는 적어도 하나의 7β-HSDH의 존재하에, 및 적어도 하나의 3α-HSDH의 존재하에, 특히 NADH 및/또는 NADPH의 존재 및 소모하에 하기 화학식 5의 대응하는 12-케토-UDCA로 환원된다:
(화학식 5)
(상기 화학식 5에서,
R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
c) 화학식 5의 12-케토-UDCA는 UDCA로 화학적으로 환원되며; 및
d) 반응생성물이 선택적으로 추가로 정제되며;
단계 b)의 전환은 구현예들 28 내지 32 중 어느 하나에 설명된 재조합 미생물의 존재하에 일어난다.
본 발명은 본원에 설명된 특정 구현예들로 제한되지 않는다. 더 정확히 말하면, 당업자들은 본 발명의 교시를 통해, 허용되지않는 노력없이 본 발명의 추가 구성들을 제공할 수 있게 된다. 따라서, 예를 들면 당업자들은 또한, 추가의 효소 변이체들을 계획적으로 발생시킬 수 있으며, 원하는 물성 프로필(개선된 보조인자 의존성 및/또는 안정성, 감소된 기질 저해)을 위해 스크리닝 및 최적화할 수 있으며; 또는 본 발명에 따라 추가의 적당한 야생형 효소들(7β- 및 3α-HSDH, FDH, GDH ADH 등)을 분리 및 사용할 수 있다. 그리고, 예를 들면 사용된 HSDH, 예컨대 특히 7β-HSDH 및 3α-HSDH, 또는 그의 변이체들의 물성 프로필(특히 보조인자 의존성)에 의존하여, 이들은 보조인자 재생에 적당한 사용가능한 탈수소효소(GDH, FHD, ADH 등) 및 그의 변이체들을 선택할 수 있으며, 상기 선택된 효소들을 하나 이상의 발현 구조물들 또는 벡터들 상에 분포시키며, 이와 함께 필요하다면 하나 이상의 재조합 미생물들을 생성하여, 최적화된 전세포-기반 제조방법을 가능하게 한다.
발명의 추가 구성
1. 일반적인 정의들 및 사용된 약어들
"전세포 촉매"는 독자생존가능한(임의의 성장단계에서 증식할 수 있는) 미생물 및 또한, 더이상 독자생존할 수 없는 미생물들, 특히 재조합 미생물들을 모두 포함하며, 이는 본 발명에 따른 방법을 완전히, 또는 적어도 부분적으로, 발현된 형태로 수행하기 위해 필요한 효소 활성들을 함유한다. 여기에서, 전세포 촉매는 주위 반응매질에 의한 물질들(특히, 기질, 생성물, 보조인자들)의 교환을 추가로 촉진하기 위해, 화학적, 기계적 또는 다른 작용(온도, 저장)에 의해 천공된 세포벽을 추가로 가질 수 있다.
다르게 진술되지 않는 한, 용어 "7β-HSDH"는 탈수소효소를 지칭하며, 이는 특히 NADPH의 화학량론적 소모, 및 선택적으로, 대응하는 역반응과 함께 DHCA 또는 7,12-디케토-UDCA(7,12-디케토-LCA)를 3,12-디케토-UDCA 또는 12-케토-UDCA로 적어도 입체특이적 및/또는 위치특이적 환원하는 것을 촉매한다. 여기에서, 효소는 천연 재조합 제조된 효소일 수 있다. 효소는 원칙적으로 세포성, 예컨대 예를 들면 단백질 불순물과 혼합하여 존재할 수 있지만, 바람직하게는 순수한 형태로 존재할 수 있다. 적당한 검출 방법들은 예를 들면 하기 실험 부분에서 설명되거나, 문헌으로부터 공지되어 있다(예를 들면, Characterization of NADP-dependent 7 beta-hydroxysteroid dehydrogenases from Peptostreptococcus productus and Eubacterium aerofaciens. S Hirano and N Masuda. Appl Environ Microbiol. 1982). 이 활성을 갖는 효소들은 EC 번호 1.1.1.201로 분류되어 있다.
다르게 진술되지 않는 한, 용어 "3α-HSDH"는 탈수소효소를 지칭하며, 이는 특히 NADH 및/또는 NADPH의 화학량론적 소모, 및 선택적으로, 대응하는 역반응과 함께 3,12-디케토-UDCA 또는 DHCA를 12-케토-UDCA 또는 7,12-디케토-UDCA(7,12-디케토-LCA)로 적어도 입체특이적 및/또는 위치특이적 환원하는 것을 촉매한다. 적당한 검출 방법들은 예를 들면 하기 실험 부분에서 설명되거나, 문헌으로부터 공지되어 있다. 적당한 효소들은 예를 들면, 코마노모나스 테스토스테로니(Comanomonas testosteroni)(예를 들면, ATCC11996)로부터 얻어질 수 있다. NADPH-의존성 3α-HSDH는 예를 들면, 설치류로부터 알려져 있으며, 또한, 사용가능하다.(Cloning and sequencing of the cDNA for rat liver 3 alpha-hydroxysteroid/dihydrodiol dehydrogenase, J E Pawlowski, M Huizinga and T M Penning, May 15, 1991 The Journal of Biological Chemistry, 266, 8820-8825). 이 활성을 갖는 효소들은 EC 번호 1.1.1.50으로 분류되어 있다.
다르게 진술되지 않는 한, 용어 "GDH"는 탈수소효소를 지칭하며, 이는 NAD+ 및/또는 NADP+의 화학량론적 소모, 및 선택적으로, 대응하는 역반응과 함께 β-D-글루코스를 D-글루코노-1,5-락톤으로 적어도 산화하는 것을 촉매한다. 적당한 효소들은 예를 들면 바실루스 서브틸리스(Bacillus subtilis) 또는 바실루스 메가테리움(Bacillus megaterium)으로부터 얻어질 수 있다. 이 활성을 갖는 효소들은 EC 번호 1.1.1.47로 분류되어 있다.
다르게 진술되지 않는한, 용어 "FDH"는 탈수소효소를 지칭하며, 이는 NAD+ 및/또는 NADP+의 화학량론적 소모, 및 선택적으로, 대응하는 역반응과 함께, 포름산(또는 대응하는 포르메이트염)을 이산화탄소로 적어도 산화하는 것을 촉매한다. 적당한 검출 방법들은 예를 들면 하기 실험 부분에서 설명되거나, 문헌으로부터 공지되어 있다. 적당한 효소들은 예를 들면, 칸디다 보이디니(Candida boidinii), 슈도모나스 에스피(Pseudomonas sp), 또는 마이코박테리움 바카에(Mycobacterium vaccae)로부터 얻어질 수 있다. 이 활성을 갖는 효소들은 EC 번호 1.2.1.2로 분류되어 있다.
"순수한 형태" 또는 "순수한" 또는 "본질적으로 순수한" 효소는 본 발명에 따르면, 보통의 단백질 측정방법들, 예컨대 예를 들면 뷰렛 방법 또는, Lowry외 다수의(R.K. Scopes, Protein Purification, Springer Verlag, New York, Heidelberg, Berlin (1982)의 설명 참조)에 따른 단백질 측정법에 의해 측정된 총 단백질함량 기준부, 80 초과, 바람직하게는 90 초과, 특히 95 초과, 및 무엇보다도 99wt.% 초과의 순도를 갖는 효소를 의미하는 것으로 이해된다.
"산화환원 등가물"은 전자 공여체 또는 전자 수용체, 예컨대 예를 들면, 니코틴아미드 유도체들, 예컨대 NAD+ 및 NADH+, 또는 그의 환원된 형태들 NADH 및 NADPH로서 각각 저분자량 유기 화합물을 의미하는 것으로 이해된다. "산화환원 등가물" 및 "보조인자"는 본 발명의 문맥에서 동의어로 사용된다. 따라서, 본 발명의 의미에서 "보조인자"는 또한, "산화환원-가능한 요소" 즉, 환원된 및 산화된 형태로 존재할 수 있는 보조인자로 기술될 수 있다.
"소모된" 보조인자는 기질의 예정된 환원 또는 산화반응의 과정중에 각각 대응하는 산화된 또는 환원된 형태로 전환되는 보조인자의 환원된 또는 산화된 형태를 의미하는 것으로 이해된다. 재생에 의하여, 본 반응에서 생성된 산화된 또는 환원된 보조인자 형태는 각각 환원된 또는 산화된 개시 형태로 역전환되어, 다시 기질의 전환을 위해 사용될 수 있다.
"변경된 보조인자 사용량"은 본 발명의 문맥에서, 참고문헌과 비교하여 질적인 또는 양적인 변화량을 의미하는 것으로 이해된다. 특히, 아미노산 서열 돌연변이를 통한 변경된 보조인자 사용량이 관찰된 것이다. 그후, 이 변경은 변이되지않은 개시 효소와 비교하여 관찰가능하다. 여기에서, 특정 보조인자와 관련된 활성은 돌연변이를 구현함으로써 증가되거나 감소되거나 완전히 차단될 수 있다. 그러나, 변경된 보조인자 사용량은 또한, 단일 보조인자에 대한 특이성 대신에, 제1 보조인자와 상이한 적어도 하나의 추가의, 제2 보조인자가 사용될 수 있도록(즉, 확장된 보조인자 사용량이 존재하도록) 하는 타입의 변경들을 포함한다. 그러나, 역으로 2개의 다른 보조인자들을 사용하기 위한 원래 존재한 능력도 또한, 상기 보조인자들 중 한 인자에 대하여만 특이성이 증가되거나, 또는 보조인자들 중 하나에 대하여 감소된 또는 완전히 제거되도록 변경될 수 있다. 따라서, 예를 들면 보조인자 사용량 변경때문에, 보조인자 NAD(NADH)에 의존적인 효소는 이제 NAD(NADH) 및 보조인자 NADP(NADPH) 모두에 대하여 의존적일 수 있으며, NAD(NADH)에 대한 원래의 의존성은 NADP(NADPH)에 대한 의존성으로 완전히 전환될 수 있으며, 역으로도 마찬가지이다.
본 발명에 따르면, 다르게 정의되지 않는한, 용어들 "NAD+/NADH 의존성" 및 "NADP+/NADPH 의존성"은 광범위하게 해석된다. 이들 용어들은 모두 "특이적" 의존성, 즉 독점적으로 NAD+/NADH 또는 NADP+/NADPH 각각에 대한 의존성 및 두 보조인자들에 대한 본 발명에 따라 사용된 효소들의 의존성, 즉 NAD+/NADH 및 NADP+/NADPH에 대한 의존성을 포함한다.
사용된 용어들 "NAD+/NADH-수용하는" 및 "NADP+/NADPH-수용하는"에도 각각 동일하게 적용한다.
본 발명에 따르면, 다르게 정의되지 않는한, 용어들 "NAD+/NADH-재생하는" 및 "NADP+/NADPH-재생하는"은 광범위하게 해석된다. 이들 용어들은 모두 소모된 보조인자 NAD+/NADH 또는 NADP+/NADPH를 재생할 수 있는 "특이적"인, 즉 독점적인 능력 및 두 보조인자들, 즉 NAD+/NADH 및 NADP+/NADPH를 재생할 수 있는 능력을 포함한다.
"단백질구성(proteinogenic)" 아미노산은 특히 (단일 문자 코드): G, A, V, L, I, F, P, M, W, S, T, C, Y, N, Q, D, E, K, R 및 H를 포함한다.
"고정화"는 본 발명에 따르면, 주위의 액체 매질, 지지체 물질에 본래 불용성인, 본 발명에 따라 사용된 생체촉매, 예컨대 예를 들면 고체 상의 7β-HSDH의 공유결합 또는 비-공유결합을 의미하는 것으로 이해된다. 따라서, 본 발명에 따르면, 본 발명에 따라 사용된 재조합 미생물들과 같은 전세포들은 또한, 상기 지지체들에 의해 고정될 수 있다.
"변이되지않은 효소와 비교하여 감소된 기질 저해"는 변이되지않은 효소에 의한 특정 기질에 대하여 관찰된 기질 저해가 더이상 관찰되지 않음을, 즉 본질적으로 더이상 측정할 수 없음을, 또는 높은 기질농도에서 유일하게 설정됨을, 즉 Ki 값이 증가됨을 의미한다.
"콜린산 화합물"은 본 발명에 따라, 고리 위치 7 및 임의로 고리 위치들 3 및/또는 12에 케토 및/또는 히드록시 또는 아실옥시기들이 존재하고, 콜린산의 기초 탄소골격, 특히 스테로이드 구조를 갖는 화합물을 의미하는 것으로 이해된다.
특정 타입의 화합물, 예컨대 예를 들면 "콜린산 화합물" 또는 "우르소데스옥시콜린산 화합물"은 특히, 근본적인 개시 화합물(예컨대 예를 들면, 콜린산 또는 우르소데스옥시콜린산)의 유도체들을 의미하는 것으로 이해된다.
상기 유도체들은 "염들" 예컨대 예를 들면 알칼리금속염들, 예컨대 화합물들의 리튬, 나트륨 및 칼륨염들, 및 암모늄 염들을 포함하며, 암모늄 염은 NH4 + 염 및, 적어도 하나의 수소원자가 C1-C6 알킬 잔기에 의해 치환될 수 있는 상기 암모늄 염들을 포함한다. 전형적인 알킬 잔기들은 특히, C1-C4 알킬 잔기들, 예컨대 메틸, 에틸, n- 또는 i-프로필, n-, sec- 또는 tert-부틸, 및 n-펜틸 및 n-헥실 및 이들의 단일 또는 다중 분지형 유사체들이다.
본 발명에 따른 화합물들의 "알킬 에스테르"는 특히 저급 알킬 에스테르들, 예컨대 예를 들면, C1-C6 알킬 에스테르이다. 비-제한적인 예로서, 메틸, 에틸, n- 또는 i-프로필, n-, sec- 또는 tert-부틸 에스테르, 또는 장쇄 에스테르, 예컨대 예를 들면 n-펜틸 및 n-헥실 에스테르 및 이들의 단일 또는 다중 분지형 유사체들이 언급된다.
"아미드"는 특히, 암모니아 또는 1차 또는 2차 모노아민을 갖는 본 발명에 따른 산들의 특정 전환 생성물들이다. 상기 아민들은 예를 들면, 모노- 또는 디-C1-C6 알킬 모노아민들이며, 상기 알킬 잔기들은 서로 독립적으로, 예컨대 예를 들면 카르복시, 히드록시, 할로겐(예컨대 F, Cl, Br, I), 니트로 및 설포네이트 기에 의해 선택적으로 추가로 치환될 수 있다.
본 발명에 따른 "아실 기들"은 2 내지 4개의 탄소원자들을 갖는 특정 비-방향족 기들, 예컨대 예를 들면 아세틸, 프로피오닐 및 부티릴 기, 및 임의로 치환된 단핵 방향족 고리를 갖는 방향족 기들이며, 여기에서 적당한 치환체들은 예를 들면, 히드록시, 할로겐(예컨대, F, Cl, Br, I), 니트로 및 C1-C6 알킬 기들, 예컨대 예를 들면 벤조일 또는 톨루오일로부터 선택된다.
본 발명에 따라 사용된 또는 제조된 히드록시스테로이드 화합물들, 예컨대 예를 들면 콜린산, 우르소데스옥시콜린산, 12-케토-케노데스옥시콜린산, 케노데스옥시콜린산 및 7-케토-리토콜린산이 입체이성질체로 순수한 형태로 본 발명에 따른 방법에 사용될 수 있거나, 다른 입체이성질체들과 혼합되거나 이로부터 얻어질 수 있다. 그러나, 바람직하게는 사용된 화합물들 또는 제조된 화합물들은 본질적으로 입체이성질체로 순수한 형태로 사용 또는 분리된다.
본원에 사용된 동의어들은 CDCS 및 CDCA; UDCS 및 UDCA; DHCS 및 DHCA; NAD 및 NAD+; 및 NADP 및 NADP+이다.
"BDM"은 세균의 건조질량을 나타낸다.
하기 표 1에서, 화학식, 그들의 화학명 및 필수 화학적 화합물들의 약어들이 표 형태로 요약되어 있다:
화학식 약어 화학명

콜린산
CA 콜린산

디하이드로콜린산
DHCA 디하이드로콜린산

3,12-디케토-7β-콜란산
3,12-디케토-7β-CA 3,12-디케토-7β-콜란산

12-케토-우르소데스옥시콜린산
12-케토-UDCA 12-케토-우르소데옥시콜린산

우르소데스옥시콜린산
UDCA 우르소데옥시콜린산

콜린산 메틸 에스테르
CA 메틸 에스테르 콜린산 메틸 에스테르

3,7-디아세틸-콜린산 메틸 에스테르
3,7-디아세틸-CA 메틸 에스테르 3,7-디아세틸-콜린산 메틸 에스테르*

12-케토-3,7-디아세틸-콜란산 메틸 에스테르
12-케토-디아세틸-CA 메틸 에스테르 12-케토-3,7-디아세틸-콜란산 메틸 에스테르*

케노데옥시콜린산
CDCA 케노데옥시콜린산

7-케토-리토콜린산
7-케토-LCA 7-케토-리토콜린산

7,12-디케토-리토콜린산
7,12-디케토-LCA 7,12-디케토-리토콜린산

12-케토-케노데옥시콜린산
12-케토-CDCA 12-케토-케노데옥시콜린산
3,12-디케토-7-β-콜란산은 3,12-디케토-우르소데스옥시콜린산(3,12-디케토-UDCA)에 대한 동의어이다.
7,12-디케토-리토콜린산은 7,12-디케토-우르소데스옥시콜린산(7,12-디케토-UDCA)에 대한 동의어이다.
2. 단백질들
본 발명은 7β-HSDH, FDH, GDH 또는 3α-HSDH 활성을 갖는, 특히 본원에 분명히 개시된 단백질들 및 효소들, 및 그의 변이체들에 국한되지 않지만, 오히려 이들의 기능적 균등물들로 확장된다.
본 발명의 문맥에서, 특별히 개시된 효소들의 "기능적 균등물" 또는 유사체들은 예를 들면, 7βHSDH 활성과 같은 원하는 생물학적 활성을 더욱 갖는, 다양한 폴리펩티드들이다.
따라서, 예를 들면 "기능적 균등물들"은 7β-HSDH, FDH, GDH 또는 3α-HSDH 활성에 대하여 사용된 시험에서, 적어도 1%, 예컨대 예를 들면 적어도 10% 또는 20%, 예컨대 예를 들면 적어도 50% 또는 75% 또는 90%로 정의된 아미노산 서열을 포함하는 개시 효소보다 높거나 또는 낮은 활성을 나타내는 효소들로 이해된다.
게다가, 기능적 균등물들은 pH 4 내지 11에서 바람직하게 안정적이며, 유리하게는, pH 6 내지 10, 예컨대 특히, 8.5 내지 9.5 범위의 최적의 pH 및 15℃ 내지 80℃, 또는 20℃ 내지 70℃, 예컨대 예를 들면 약 45℃ 내지 60℃ 또는 약 50℃ 내지 55℃ 범위의 최적의 온도를 갖는다.
7β-HSDH 활성은 다양한 공지 시험들에 의해 측정될 수 있다. 여기에 국한되지 않으면서, 실험예 부분에 설명된 바와 같은 표준화 조건하에, 참조 기질, 예컨대 예를 들면, CA 또는 DHCA를 사용한 시험이 언급될 수 있다.
FDH, GDH 또는 3α-HSDH 활성을 측정하기 위한 시험들도 또한 그 자체가 공지되어 있다.
"기능적 균등물들"은 본 발명에 따라, 상기 아미노산 서열들의 적어도 하나의 서열 위치내에 구체적으로 언급된 것과 다른 아미노산을 가지며, 그렇다고는 하지만 상기 생물학적 활성들 중 하나를 갖고 있는 특정 "변이체들"을 의미하는 것으로 이해된다. 따라서, "기능적 균등물들"은 하나 이상, 예컨대 예를 들면 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15개의 아미노산 부가, 치환, 결실 및/또는 도치에 의해 얻어질 수 있는 변이체들을 포함하며, 상기 변형들은 본 발명에 따른 물성 프로필을 갖는 변이체로 유도되는 한, 임의의 서열 위치에서 발생할 수 있다. 기능적 균등물은 특히, 변이체와 변형되지않은 폴리펩티드 사이의 반응성 패턴들이 질적으로 일치하는 경우 존재하며, 즉 예를 들면 같은 기질이 다른 비율로 전환된다. 적당한 아미노산 치환들의 예들은 하기 표 2에 요약되어 있다:
원래의 잔기
Ala
Arg
Asn
Asp
Cys
Gln
Glu
Gly
His
Ile
Leu
Lys
Met
Phe
Ser
Thr
Trp
Tyr
Val
치환의 예들
Ser
Lys
Gln; His
Glu
Ser
Asn
Asp
Pro
Asn ; Gln
Leu ; Val
Ile ; Val
Arg ; Gln ; Glu
Leu ; Ile
Met ; Leu ; Tyr
Thr
Ser
Tyr
Trp ; Phe
Ile ; Leu
상기 의미에서 "기능적 균등물들"은 설명된 폴리펩티드들의 "전구물질들" 및 폴리펩티드들의 "기능적 유도체들" 및 "염들"이다.
본원에서 "전구물질들"은 원하는 생물학적 활성을 갖거나 갖지 않는 폴리펩티드들의 천연 또는 합성 전구물질들이다.
"염"이라는 표현은 본 발명에 따른 단백질 분자들의 카르복실기들의 염 및 또한, 아미노 기들의 산 부가염을 모두 의미하는 것으로 이해된다. 카르복실기들의 염들은 그 자체로 공지된 방법으로 제조될 수 있으며, 무기 염들, 예컨대 예를 들면 나트륨, 칼슘, 암모늄, 철 및 아연 염들, 및 유기 염기들, 예컨대 예를 들면 아민들, 예컨대 트리에탄올아민, 아르기닌, 리신, 피페리딘 등을 갖는 염들을 포함한다. 산 부가염들, 예컨대 예를 들면 염산 또는 황산과 같은 무기 산을 갖는 염들, 및 아세트산 및 옥살산과 같은 유기 산을 갖는 염들도 또한 본 발명의 대상이다.
본 발명에 따른 폴리펩티드들의 "기능적인 유도체들"은 기능적인 아미노산 측기 상에, 또는 그들의 N- 또는 C-말단 상에서, 공지 기술에 의해 생성될 수도 있다. 상기 유도체들은, 예를 들면 암모니아 또는 1차 또는 2차 아민과의 반응에 의해 얻어질 수 있는, 카르복실산 기들의 지방족 에스테르, 카르복실산 기들의 아미드들; 아실 기들과의 반응에 의해 생성되는, 유리 아미노 기들의 N-아실 유도체들; 또는 아실 기들과의 반응에 의해 생성되는, 유리 히드록실 기들의 O-아실 유도체들을 포함한다.
"기능적 균등물들"은 자연적으로, 다른 유기체들로부터 이용가능한 폴리펩티드들, 및 자연발생 변이체들을 포함한다. 예를 들면, 상동 서열 영역들의 범위는 본 발명의 명시 규정에 근거하여 정의된 서열 비교 및 균등한 효소들에 의해 확인될 수 있다.
"기능적 균등물들"은 또한, 예를 들면 원하는 생물학적 기능을 갖는, 본 발명에 따른 폴리펩티드들의 단편들, 바람직하게는 개별적인 도메인들, 또는 서열 모티프들을 포함한다.
이외에도, "기능적 균등물들"은 상기 폴리펩티드 서열들 또는 이로부터 유도된 기능적 균등물들 중 하나 및 기능적 N- 또는 C-말단 결합내에 이와 기능적으로 다른 적어도 하나의 추가 이종서열을 갖는(즉, 융합 단백질 부분의 큰 상호간의 기능적 장애없는) 융합 단백질이다. 상기 이종서열들의 비-제한적인 예들은 예를 들면, 신호 펩티드, 히스티딘 앵커 또는 효소들이다.
본 발명에 따라 포함된 "기능적 균등물들"은 또한, 분명하게 개시된 단백질들과 상동하다. 이들은 Pearson and Lipman, Proc. Natl. Acad, Sci. (USA) 85(8), 1988, 2444-2448의 알고리즘에 따라 계산된, 분명하게 개시된 아미노산 서열들 중 하나에 대하여 적어도 60%, 바람직하게는 적어도 75%, 특히 적어도 85%, 예컨대 예를 들면 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 상동성(또는 동일성)을 가진다. 본 발명에 따른 상동의 폴리펩티드의 상동성 또는 동일성 비율은 특히 본원에 분명하게 설명된 아미노산 서열들 중 하나의 총 길이에 근거한 아미노산 잔기들의 동일성 비율을 의미한다.
동일성 비율 값들은 또한, BLAST 정렬, 알고리즘 blastp(단백질-단백질 BLAST) 또는 하기 진술된 클러스탈 설정들의 사용에 근거하여 측정될 수 있다.
가능한 단백질 글리코실화의 경우, 본 발명에 따른 "기능적 균등물들"은 탈글리코실화 또는 글리코실화 형태 및, 글리코실화 패턴의 변형에 의해 얻어질 수 있는 변형된 형태들로 상기 설명된 종류의 단백질들을 포함한다.
본 발명에 따른 단백질 또는 폴리펩티드들의 상동체들은 단백질의 돌연변이생성, 예를 들면 점 돌연변이, 확장 또는 절단에 의해 생성될 수 있다.
본 발명에 따른 단백질들의 상동체들은 변이체들, 예컨대 예를 들면 절단 변이체들의 조합 뱅크들의 스크리닝에 의해 확인될 수 있다. 예를 들면, 단백질 변종의 다양한 종류로 이루어진 뱅크는 예컨대 예를 들면, 합성 올리고뉴클레오티드들의 혼합물의 효소적 결찰에 의해 핵산 수준에서 조합 돌연변이생성에 의해 생성될 수 있다. 퇴화된 올리고뉴클레오티드 서열로부터 잠재적인 상동체들의 뱅크들을 제조하기 위해 사용될 수 있는 다수의 방법들이 있다. 퇴화된 유전자 서열의 화학합성은 DNA 합성장치에서 수행될 수 있으며, 및 그후 합성 유전자는 적당한 발현 벡터로 결찰될 수 있다. 퇴화한 유전자 세트를 사용하면, 한 혼합물내 모든 서열들을 제공할 수 있게 되며, 이는 원하는 잠재적 단백질 서열의 세트를 위해 코딩한다. 퇴화한 올리고뉴클레오티드들의 합성 방법은 당업자들에게 공지되어 있다(예를 들면, Narang, S.A. (1983) Tetrahedron 39:3; Itakura et al. (1984) Annu. Rev. Biochem. 53:323; Itakura et al., (1984) Science 198:1056; Ike et al. (1983) Nucleic Acids Res. 11:477).
종래 분야에서, 점 돌연변이 또는 절단에 의해 생성된 조합 뱅크들의 유전자 생성물들을 스크리닝하기 위해, 및 선택된 물성을 갖는 유전자 생성물에 대한 cDNA 뱅크들을 스크리닝하기 위해 여러 기술들이 알려져 있다. 이러한 기술들은 본 발명에 따른 상동체들의 조합 돌연변이생성에 의해 생성된 유전자 뱅크들의 신속한 스크리닝에 적합할 수 있다. 높은 처리량으로 분석되는 대형 유전자 뱅크들을 스크리닝하기 위해 가장 빈번하게 사용된 기술들은 복제가능한 발현 벡터들내 유전자 뱅크의 클로닝, 얻어진 벡터 뱅크에 의한 적당한 세포들의 변환 및, 원하는 활성을 검출함으로써 검출되는 생성물의 유전자를 인코딩하는 벡터의 분리를 용이하게 하는 조건하에 조합 유전자들의 발현을 포함한다. 뱅크들내 기능성 변이체들의 빈도를 확대하는 기술인, 반복성 앙상블 돌연변이생성(REM)이 상동체를 확인하기 위한 스크리닝 테스트와 조합하여 사용될 수 있다(Arkin and Yourvan (1992) PNAS 89:7811-7815; Delgrave et al. (1993) Protein Engineering 6(3):327-331).
본 발명은 여기에 명확히 참조로 개시된, 본 출원인의 이전 국제특허출원 WO2011/064404(PCT/EP2010/068576)에 개시된 바와 같이, 콜린셀라 아에로파시엔스 ATCC 25986으로부터의 7β-HSDH 야생형을 사용하는 것을 추가로 포함한다.
3. 핵산 및 구조물들
3.1 핵산
또한 본 발명의 주제는 본원에 설명된 7β-HSDH, FDH, GDH 및/또는 3α-HSDH 활성을 갖는 효소 및 그의 변이체들을 코딩하는 핵산 서열이다.
본 발명은 또한, 본원에 설명된 특정 서열들에 대하여 정해진 정도의 동일성(identity)을 갖는 핵산들에 관한 것이다.
두 핵산들 사이의 "동일성"은 각각의 전체 핵산 길이에 대하여, 뉴클레오티드들의 동일성, 특히 Informax(USA)의 벡터 NTI Suite 7.1 소프트웨어를 하기 파라미터들의 설정을 갖는 클러스탈 방법(Higgins DG, Sharp PM. Fast and sensitive multiple sequence alignments on a microcomputer. Comput Appl. Biosci. 1989 Apr;5(2):151-1) 사용과 비교하여 계산된 동일성을 의미하는 것으로 이해된다:
다수의 선형(alignment) 파라미터들:
간극 개구 페널티 10
간극 확장 페널티 10
간극 분리 페널티 범위 8
간극 분리 페널티 오프(off)
정렬 지연을 위한 동일성(%) 40
잔기 특이적 간극들 오프(off)
친수성 잔기 간극 오프(off)
전이 평가(transition weighing) 0
짝 방식(pairwise) 정렬 파라미터:
FAST 알고리즘 온(on)
K-투플(tuple) 크기 1
간극 페널티 3
윈도우 크기 5
최상 대각선 수 5
이에 대한 대안적으로, 동일성은 또한, 인터넷 주소: http://www.ebi.ac.uk/Tools/clustalw/index.html# 및 하기 파라미터들에 따라 Chenna, Ramu, Sugawara, Hideaki, Koike, Tadashi, Lopez, Rodrigo, Gibson, Toby J, Higgins, Desmond G, Thompson, Julie D. Multiple sequence alignment with the Clustal series of programs. (2003) Nucleic Acids Res 31 (13):3497-500 이후에 측정될 수 있다:
DNA 간극 개구 페널티 15.0
DNA 간극 확장 페널티 6.66
DNA 매트릭스 동일성
단백질 간극 개구 페널티 10.0
단백질 간극 확장 페널티 0.2
단백질 매트릭스 Gonnet
단백질/DNA ENDGAP -1
단백질/DNA GAPDIST 4
본원에 언급된 모든 핵산 서열들(단일 및 이중-가닥 DNA 및 RNA 서열들, 예컨대 예를 들면 cDNA 및 mRNA)은 뉴클레오티드 구성 요소들(building blocks)로부터의 화학적 합성에 의해, 예컨대 예를 들면 각각의 단편 축합, 오버랩핑, 이중 나선의 상보적 핵산 구성 요소들에 의해 그 자체로 공지된 방법으로 생성될 수 있다. 올리고뉴클레오티드들의 화학적 합성은 예를 들면, 포스포아미다이트(phosphoamidite) 방법(Voet, Voet, 2nd Edition, Wiley Press New York, pages 896-897)에 따른 공지된 방법으로 실시될 수 있다. DNA 중합효소의 Klenow 단편에 의한 합성 올리고뉴클레오티드들의 부착 및 간극들의 충전, 및 결찰 반응 및 일반적인 클로닝 방법들은 Sambrook et al. (1989), Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press에 설명되어 있다.
또한, 본 발명의 주제는 상기 폴리펩티드들 및 그의 기능성 균등물들 중 하나에 대해 코딩하는 핵산 서열들(단일 및 이중-가닥 DNA 및 RNA 서열들, 예컨대 예를 들면 cDNA 및 mRNA)이며, 이는 인공 뉴클레오티드 유사체들을 사용하여 접근할 수 있다.
본 발명은 본 발명에 따른 폴리펩티드들 또는 단백질들을 코딩하는 분리된 핵산분자들 또는 그의 생물학적 활성 세그먼트들, 및 본 발명에 따른 핵산을 코딩하는 것을 확인 또는 증폭하기 위한 혼성화 프로브 또는 프라이머들로서 사용될 수 있는 핵산 단편들에 관한 것이다.
본 발명에 따른 핵산 분자들은 코딩 유전자 영역의 3' 및/또는 5' 말단으로부터의 미번역 서열들을 추가로 함유할 수 있다.
더욱이, 본 발명은 구체적으로 설명된 핵산 서열들에 대하여 상보적인 핵산 분자들 또는 그의 세그먼트를 포함한다.
본 발명에 따른 뉴클레오티드 서열들은 다른 세포 타입들 및 유기체들의 상동성 서열들의 확인 및/또는 클로닝을 위해 사용가능한 프로브들 및 프라이머들을 생성할 수 있게 한다. 상기 프로브들 및 프라이머들은 일반적으로, "엄격한" 조건들(하기 참조)하에 본 발명에 따른 핵산 서열의 센스 가닥 또는 대응하는 안티센스 가닥의 적어도 약 12, 바람직하게는 적어도 약 25, 예컨대 예를 들면 약 40, 50 또는 75개의 연속 뉴클레오티드들로 혼성화하는 뉴클레오티드 서열 영역을 포함한다.
"분리된" 핵산 분자는 핵산의 천연 공급원내에 존재하는 다른 핵산 분자들로부터 분리되며, 게다가 재조합 기술에 의해 제조된 경우 다른 세포성 물질 또는 배양 배지가 본래 없을 수 있으며, 또는 화학적으로 합성된 경우 화학적 전구물질 또는 다른 화학물질이 없을 수 있다.
본 발명에 따른 핵산 분자는 표준 분자생물학 기술 및 본 발명에 따라 제공된 서열 정보에 의해 분리될 수 있다. 예를 들면, cDNA는 혼성화 프로브 및 표준 혼성화 기술(예컨대, 예를 들면 Sambrook, J., Fritsch, E.F. and Maniatis, T. Molecular Cloning: A Laboratory Manual. 2nd Edn., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989에 설명됨)로서 구체적으로 개시된 완전한 서열들 중 하나 또는 그의 세그먼트를 사용하여 적당한 cDNA 뱅크로부터 분리될 수 있다. 그리고, 개시된 서열들 중 하나 또는 그의 세그먼트를 포함하는 핵산 분자는 중합효소 연쇄반응에 의해 분리될 수 있으며, 상기 서열에 기초하여 형성된 올리고뉴클레오티드 프라이머들이 사용된다. 이에 따라 증폭된 핵산은 적당한 벡터로 클로닝될 수 있으며, DNA 서열 분석에 의해 특징화될 수 있다. 그리고, 본 발명에 따른 올리고뉴클레오티드들은 자동 DNA 합성기와 같은 표준 합성 방법들에 의해 제조될 수 있다.
본 발명에 따른 핵산 서열들 또는 이들의 유도체들, 상기 서열들의 상동체 또는 그의 일부들은 예를 들면 일반적인 혼성화 방법들 또는 PCR 기술에 의해, 다른 세균으로부터 예를 들면 게놈 또는 cDNA 뱅크를 통해 분리될 수 있다. 상기 DNA 서열들은 본 발명에 따른 서열들과 표준 조건하에 혼성화한다.
"혼성화"는 표준 조건하에 거의 상보적인 서열에 결합할 수 있는 폴리- 또는 올리고뉴클레오티드의 능력을 의미하는 것으로 이해되며, 반면 상기 조건들 하에 비-상보적인 파트너들 사이의 비특이적 결합들이 발생하지 않는다. 이를 위해, 서열들은 90~100% 상보적일 수 있다. 서로에게 특이적으로 결합할 수 있는 상보서열들의 특성은 예를 들면, 노던 또는 서던 블롯 기술 또는 PCR 또는 RT-PCR에서의 프라이머 결합에서 이용된다.
혼성화를 위해, 보존된 영역들의 짧은 올리고뉴클레오티드들이 유리하게 사용된다. 그러나, 본 발명에 따른 핵산들의 긴 단편들 또는 완전한 서열들이 혼성화에 사용될 수 있다. 사용된 핵산(올리고뉴클레오티드, 긴 단편 또는 완전한 서열)에 의존하여, 또는 혼성화를 위해 어떤 핵산 종류 DNA 또는 RNA가 사용되었는지에 의존하여, 상기 표준 조건들은 다양하다. 따라서, 예를 들면 DNA:DNA 하이브리드를 위한 용융 온도는 같은 길이의 DNA:RNA 하이브리드를 위한 용융온도보다 약 10℃ 낮다.
표준 조건은 예를 들면, 핵산에 의존하여, 0.1 내지 5 x SSC(1 X SSC = 0.15M NaCl, 15mM 시트르산나트륨, pH 7.2)의 농도를 갖는 버퍼 수용액내 온도가 42 내지 58℃이거나, 또한 5 x SSC, 50% 포름아미드에서 예를 들면 42℃와 같은 50% 포름아미드의 존재하에 있는 것을 의미하는 것으로 이해되어야 한다. 유리하게는, DNA:DNA 하이브리드를 위한 혼성화 조건은 0.1 x SSC 및 약 20℃ 내지 45℃, 바람직하게는 약 30℃ 내지 45℃의 온도이다. DNA:RNA 하이브리드를 위해, 혼성화 조건은 유리하게는 0.1 x SSC 및 약 30℃ 내지 55℃, 바람직하게는 약 45℃ 내지 55℃의 온도이다. 상기 진술된 혼성화를 위한 온도들은 한 예로서, 포름아미드의 부재하에 약 100개의 뉴클레오티드들의 길이 및 50%의 G+C 함량을 갖는 핵산에 대하여 계산된 용융 온도이다. DNA 혼성화를 위한 실험조건들은 관련 유전학 교과서, 예컨대 예를 들면 Sambrook et al., "Molecular Cloning", Cold Spring Harbor Laboratory, 1989에 설명되어 있으며, 예를 들면 핵산의 길이, 하이브리드의 성질 또는 G+C 함량에 의존하여, 당업자들에게 공지된 식에 따라 계산될 수 있다. 당업자들은 하기 교과서들로부터 혼성화에 대한 추가 정보를 얻을 수 있다: Ausubel et al. (eds), 1985, Current Protocols in Molecular Biology, John Wiley & Sons, New York; Hames and Higgins (eds), 1985, Nucleic Acids Hybridization: A Practical Approach, IRL Press at Oxford University Press, Oxford; Brown (ed), 1991, Essential Molecular Biology: A Practical Approach, IRL Press at Oxford University Press, Oxford.
"혼성화"는 특히 엄격한 조건하에 일어날 수 있다. 상기 혼성화 조건들은 예를 들면, Sambrook, J., Fritsch, E.F., Maniatis, T., in: Molecular Cloning (A Laboratory Manual), 2nd Edition, Cold Spring Harbor Laboratory Press, 1989, pages 9.31-9.57 또는 Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6에 설명되어 있다.
"엄격한" 혼성화 조건들은 특히, 50% 포름아미드, 5 x SSC (750mM NaCl, 75mM 시트르산 삼나트륨), 50mM 인산나트륨(pH 7.6), 5x Denhardt 용액, 10% 덱스트란 설페이트 및 20g/ml 변성된, 전단된 연어정자 DNA로 구성된 용액내에서 42℃에서 밤새 배양한 후, 65℃의 0.1 x SSC를 갖는 필터의 세척 단계인 것으로 이해된다.
또한, 본 발명의 주제는 구체적으로 개시된 또는 유도성 핵산 서열들의 유도체들이다.
따라서, 본 발명에 따른 또다른 핵산 서열들은 예를 들면 서열번호 1, 3 또는 7로부터 유도될 수 있으며, 단일 또는 여러개의 뉴클레오티드들의 부가, 치환, 삽입 또는 결실에 의해 이로부터 달라질 수 있지만, 원하는 물성 프로필을 갖는 폴리펩티드들에 대하여 코딩할 수 있다.
또한, 소위 사일런트 돌연변이를 포함하거나, 구체적으로 언급된 서열, 자연발생 변이체들, 예컨대 예를 들면 이들의 스플라이스 변이체들 또는 대립유전자 변이체들과 비교하여 구체적인 공급원 또는 숙주 유기체의 코돈 사용에 따라 변형된 상기 핵산 서열들도 본 발명에 따라 포함된다.
또한, 보존적 뉴클레오티드 치환들(즉, 관련 아미노산은 같은 전하, 크기, 극성 및/또는 용해도의 아미노산에 의해 치환됨)에 의해 얻어질 수 있는 서열들이 본 발명의 주제이다.
또한, 본 발명의 주제는 서열 다형성에 의해 구체적으로 개시된 핵산들로부터 유도된 분자들이다. 이들 유전적 다형성은 천연 변이때문에 군집내에서 각각의 사이에 존재할 수 있다. 상기 천연 변형(variation)들은 보통 유전자의 뉴클레오티드 서열에서 1 내지 5%의 변형(variance)을 야기한다.
본 발명에 따른 핵산 서열들의 유도체들은 전체 서열 영역에 대하여, 유도된 아미노산 수준에서 적어도 60% 상동성, 바람직하게는 적어도 80% 상동성, 매우 특별히 바람직하게는 적어도 90% 상동성을 나타내는 대립유전자 변이체들을 의미하는 것으로 이해되어야 한다(아미노산 수준에서의 상동성과 관련하여, 폴리펩티드에 대한 상기 설명들을 참조할 수 있음). 서열들의 일부 영역들에 대하여, 상동성이 유리하게는 더욱 높아질 수 있다.
그리고, 유도체들은 또한, 본 발명에 따른 핵산 서열들의 상동체들, 예를 들면 균류 또는 세균류 상동체, 절단된 서열들, 또는 코딩 및 비-코딩 DNA 서열의 단일-가닥 DNA 또는 RNA를 의미하는 것으로 이해되어야 한다. 따라서, 예를 들면 DNA 수준에서의 상동체들은 전체 기술된 DNA 영역에 대하여 적어도 40%, 바람직하게는 적어도 60%, 특히 바람직하게는 적어도 70%, 매우 특히 바람직하게는 적어도 80%의 상동성을 가진다.
또한, 유도체들은 또한 예를 들면 프로모터와의 융합을 의미하는 것으로 이해되어야 한다. 설명된 뉴클레오티드 서열들의 업스트림에 연결된 프로모터들은 프로모터의 기능성 또는 효과가 손상되지 않으면서, 적어도 하나의 뉴클레오티드 치환, 적어도 하나의 삽입, 도치 및/또는 결실에 의해 변형될 수 있다. 그리고, 프로모터의 효과는 그의 서열 변형에 의해 증가될 수 있거나, 또는 이들은 다른 종류들의 유기체들의 보다 효과적인 프로모터에 의해 완전히 치환될 수도 있다.
게다가, 기능성 변이체들을 생성하는 방법들이 당업자들에게 알려져 있다.
사용된 기술에 의존하여, 당업자들은 유전자들 또는 비-코딩 핵산 영역들(예를 들면, 발현 조절에 중요함)에 전체적으로 무작위의 또는 보다 타겟팅된 변이들을 도입한 후, 유전자 뱅크를 생성할 수 있다. 본원에 필요한 분자생물학적 방법들이 당업자에게 알려져 있으며, 예를 들면 Sambrook and Russell, Molecular Cloning. 3rd Edition, Cold Spring Harbor Laboratory Press 2001에 설명되어 있다.
유전자 변형방법 및 이에 의해 코딩된 단백질의 변형방법들은 당업자들에게 오랫동안 친숙하며, 예컨대 예를 들면 하기와 같은 방법들이 있다:
- 유전자의 단일 또는 여러개의 뉴클레오티드들이 교환되는, 부위-특이적 돌연변이생성(Trower MK (Publ.) 1996; In vitro mutagenesis protocols. Humana Press, New Jersey),
- 유전자의 임의의 부위에서 임의의 아미노산에 대한 코돈이 교환 또는 부가될 수 있는, 포화 돌연변이생성(Kegler-Ebo DM, Docktor CM, DiMaio D (1994) Nucleic Acids Res 22:1593; Barettino D, Feigenbutz M, Valcarel R, Stunnenberg HG (1994) Nucleic Acids Res 22:541; Barik S (1995) Mol Biotechnol 3:1),
- 뉴클레오티드 서열들이 부정확하게 동작하는 DNA 중합효소에 의해 변이되는, 오류유발 중합효소 연쇄반응(오류유발 PCR)(Eckert KA, Kunkel TA (1990) Nucleic Acids Res 18:3739);
- 결함 DNA 복구 메카니즘때문에, 뉴클레오티드 서열들의 증가된 변이율이 일어나는, 변이체 균주내 유전자들의 통과(Greener A, Callahan M, Jerpseth B (1996) An efficient random mutagenesis technique using an E.coli mutator strain. In: Trower MK (Publ.) In vitro mutagenesis protocols. Humana Press, New Jersey), 또는
- 밀접하게 관련된 유전자들의 풀이 형성되고, 소화되며, 중합효소 연쇄반응을 위한 주형으로서 단편들이 사용되고, 말단에서 반복된 가닥 분리 및 재접근에 의해 전장 모자이크 유전자들이 생성되는, DNA 셔플링(Stemmer WPC (1994) Nature 370:389; Stemmer WPC (1994) Proc Natl Acad Sci USA 91:10747).
소위 유도진화법(directed evolution)(Reetz MT and Jaeger K-E (1999), Topics Curr Chem 200:31; Zhao H, Moore JC, Volkov AA, Arnold FH (1999), Methods for optimizing industrial enzymes by directed evolution, In: Demain AL, Davies JE (Publ.) Manual of industrial microbiology and biotechnology. American Society for Microbiology에 설명되어 있음)을 사용하여, 당업자들은 또한, 타겟팅된 방법으로 및 또한 대규모로 기능성 변이체들을 생성할 수 있다. 여기에서, 제1 단계에서, 관련 단백질들의 유전자 뱅크들이 생성되며, 예를 들면 상기 설명된 방법들이 사용될 수 있다. 유전자 뱅크는 적당한 방법, 예를 들면 세균 또는 파지 디스플레이 시스템에 의해 발현될 수 있다.
원하는 물성들에 주로 대응하는 물성들을 갖는 기능성 변이체들을 발현하는 숙주 유기체들의 관련 유전자들이 추가 변이 라운드로 들어갈 수 있다. 변이 및 선택 또는 스크리닝의 단계들은 존재하는 기능성 변이체들이 원하는 물성들을 충분한 정도로 가질때까지 되풀이하여 반복될 수 있다. 이러한 동작의 반복모드를 통해, 한정된 수의 변이들, 예컨대 예를 들면 1 내지 5회의 변이들이 단계식으로 수행될 수 있으며, 관련 효소 물성에 대한 그들의 영향에 대하여 평가 및 선택될 수 있다. 그후, 선택된 변이체는 같은 방법으로 추가 변이단계로 들어갈 수 있다. 이 방법에서, 시험되는 각 변이체들의 수는 크게 감소될 수 있다.
본 발명에 따른 결과들은 원하는 변형된 물성들을 갖는 추가의 효소들을 계획적으로 생성시키기 위해 필요한, 관련 효소들의 구조 및 서열과 관련된 중요한 정보를 생성한다. 특히, 소위 "핫 스팟"들, 즉 타겟팅된 변이들을 도입하는 것을 통해 효소 물성을 변형시키기에 잠재적으로 적당한 서열 세그먼트들이 정의될 수 있다.
3.2 구조물
또한, 본 발명의 주제는 조절 핵산서열의 유전적 조절하에 본 발명에 따른 적어도 하나의 폴리펩티드에 대하여 코딩하는 핵산서열을 함유하는 발현 구조물들, 및 상기 발현 구조물들 중 적어도 하나를 포함하는 벡터들이다.
본 발명에 따르면, "발현 유닛"은 본원에 정의된 프로모터를 포함하고, 발현되는 핵산 또는 유전자와의 기능적 결찰후, 발현 즉, 이 핵산 또는 이 유전자의 전사 및 번역을 조절하는, 발현활성을 갖는 핵산을 의미하는 것으로 이해된다. 따라서, 본 명세서에서, 이것은 "조절 핵산서열"로 설명된다. 프로모터에 더해, 추가의 조절요소들, 예컨대 예를 들면 인핸서들도 또한 함유될 수 있다.
본 발명에 따르면, "발현 카세트" 또는 "발현 구조물"은 발현되는 핵산 또는 발현되는 유전자와 기능적으로 결합되는 발현 유닛을 의미하는 것으로 이해된다. 발현 유닛과 대조적으로, 발현 카세트는 따라서 전사 및 번역을 조절하는 핵산서열 뿐만 아니라 전사 및 번역의 결과로서 단백질로 발현되는 핵산서열들도 포함한다.
본 발명의 명세서에서, 용어들 "발현" 또는 "과발현"은 대응하는 DNA에 의해 인코딩되는 미생물내 하나 이상의 효소들의 세포내 활성을 생성 또는 증가시키는 것을 의미한다. 이를 위해, 예를 들면 유전자가 유기체, 다른 유전자에 의해 치환되는 기존의 유전자, 증가되는 유전자 또는 유전자들의 복제수, 사용되는 강한 프로모터, 또는 고활성의 대응 효소에 대하여 코딩하는 사용된 유전자로 도입될 수 있으며, 이들 방법들은 임의로 조합될 수 있다.
바람직하게는, 본 발명에 따른 상기 구조물들은 특정 코딩서열로부터의 프로모터 5' 업스트림 및 종결자 서열 3' 다운스트림, 및 임의로 추가의 정상적인 조절 요소들을 포함하며, 상기 각각은 코딩서열과 조작적으로 결합된다.
본 발명에 따르면, "프로모터", "프로모터 활성을 갖는 핵산" 또는 "프로모터 서열"은 전사되는 핵산과의 기능적 결합이 상기 핵산의 전사를 조절하는 핵산을 의미하는 것으로 이해된다.
이와 관련하여, "기능적" 또는 "조작적" 결합은 각 조절요소들이 핵산서열의 전사에서의 기능을 만족시킬 수 있는 방법으로, 프로모터 활성을 갖는 핵산들 중 하나 및 전사되는 핵산서열 및 임의로 추가의 조절 요소들, 예컨대 예를 들면 핵산을 전사하게 하는 핵산 서열, 및 예를 들면 종결자의 순차적 배열을 의미하는 것으로 이해된다. 이를 위해, 화학적 관점에서 직접적인 결합이 절대적으로 필요하지는 않는다. 유전적 조절서열들, 예컨대 예를 들면 인핸서 서열들은 보다 먼 위치로부터 또는 심지어 다른 DNA 분자들로부터의 타겟 서열에 그들의 기능을 발휘할 수 있다. 전사되는 핵산 서열이 프로모터 서열의 뒤(즉, 3' 말단)에 위치되어, 2개의 서열들이 서로 공유결합되는 배열들이 바람직하다. 여기에서, 트랜스제닉으로 발현되는 프로모터 서열과 핵산 서열 사이의 거리는 200염기쌍 미만, 또는 100염기쌍 미만, 또는 50염기쌍 미만일 수 있다.
프로모터 및 종결자 뿐만 아니라, 추가의 조절요소들 타겟팅 서열들의 예로서, 인핸서, 폴리아데닐화 신호, 선택가능한 마커들, 증폭 신호, 복제 기원 등이 언급된다. 적당한 조절서열들은 예를 들면, Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990)에 설명되어 있다.
본 발명에 따른 핵산 구조물들은 특히, 서열 서열번호 1, 3 또는 7 또는 그의 유도체들 및 상동체들, 및 그로부터 유도가능한 핵산 서열들을 포함하며, 이들은 유리하게는, 유전자 발현을 조절하기 위해, 예를 들면 증가시키기 위해 하나 이상의 조절 신호들과 조작적으로 또는 기능적으로 결합된다.
상기 조절 서열에 더해, 실제 구조 유전자들 앞에 상기 서열들의 자연적인 조절이 존재할 수 있으며, 및 선택적으로 유전자 변형되며, 그럼으로써 자연적인 조절이 사일런싱되고, 유전자 발현이 증가된다. 그러나, 핵산 구조물은 보다 간단하게 혼입될 수 있으며, 즉 그의 조절에 의해 코딩 서열 및 천연 프로모터가 제거되지 않기 전에 추가의 조절 신호들이 삽입되지 않았다. 이 대신, 천연 조절서열이 변이되어, 조절이 더이상 일어나지 않으며, 유전자 발현이 증가된다.
바람직한 핵산 구조물은 유리하게, 핵산 서열의 발현을 증가시킬 수 있는, 프로모터와 기능적으로 결합된, 상기 언급된 "인핸서" 서열들 중 하나 이상을 함유한다. 또한, DNA 서열들의 3' 말단에서, 추가의 유리한 서열들, 예컨대 추가의 조절 요소들 또는 종결자들이 삽입될 수 있다. 본 발명에 따른 핵산은 구조물내에 하나 이상의 복제본으로 함유될 수 있다. 추가의 마커들, 예컨대 항생 내성 또는 영양요구성을 보완하는 유전자들이 구조물내에, 임의로 구조물에 대하여 선택하기 위해 함유될 수 있다.
적당한 조절서열들의 예들은 프로모터들, 예컨대 cos-, tac-, trp-, tet-, trp-tet-, lpp-, lac-, lpp-lac-, lacIq-, T7-, T5-, T3-, gal-, trc-, ara-, rhaP (rhaPBAD)SP6-, 람다-PR-내에, 또는 람다-PL 프로모터내에 함유되며, 이는 그람-음성 세균에 유리하게 사용된다. 또다른 유리한 조절서열들은 예를 들면, 그람-양성 프로모터들 amy 및 SPO2내에, 및 효소 또는 균류 프로모터들 ADC1, MFalpha, AC, P-60, CYC1, GAPDH, TEF, rp28 및 ADH내에 함유된다. 또한, 조절을 위해 인조 프로모터들이 사용될 수 있다.
숙주 유기체내에서 발현을 위해, 핵산 구조물이 벡터, 예컨대 예를 들면, 숙주내 유전자의 최적 발현을 가능하게 하는 플라스미드 또는 파지내에 유리하게 삽입된다. 플라스미드 및 벡터 외에, 벡터들은 당업자들에게 공지된 모든 다른 벡터들, 예컨대 예를 들면 바이러스, 예컨대 SV40, CMV, 바큘로바이러스 및 아데노바이러스, 트랜스포손, IS 요소들, 플라스미드, 코스미드, 및 선형 또는 원형 DNA를 의미하는 것으로 이해되어야 한다. 상기 벡터들은 숙주 유기체내에서 자동 복제되거나, 염색체 복제될 수 있다. 이러한 벡터들은 본 발명의 추가 구성을 대표한다.
적당한 플라스미드들은 예를 들면, E. coli 내에서 pLG338, pACYC184, pBR322, pUC18, pUC19, pKC30, pRep4, pHS1, pKK223-3, pDHE19.2, pHS2, pPLc236, pMBL24, pLG200, pUR290, pIN-III113-B1, λgt11 또는 pBdCI, 스트렙토마이세스 내에서 pIJ101, pIJ364, pIJ702 또는 pIJ361, 바실루스 내에서 pUB110, pC194 또는 pBD214, 코리네박테리움 내에서 pSA77 또는 pAJ667, 균류 내에서 pALS1, pIL2 또는 pBB116, 효모 내에서 2alphaM, pAG-1, YEp6, YEp13 또는 pEMBLYe23 또는 식물 내에서 pLGV23, pGHlac+, pBIN19, pAK2004 또는 pDH51이다. 상기 플라스미드들은 가능한 플라스미드들 중 작은 선택이다. 추가의 플라스미드들이 당업자에게 잘 알려져 있으며, 예를 들면, 클로닝 벡터 교과서(Eds. Pouwels P. H. et al. Elsevier, Amsterdam-New York-Oxford, 1985, ISBN 0 444 904018)로부터 알 수 있다.
벡터의 추가 구성에서, 본 발명에 따른 핵산 구조물 또는 본 발명에 따른 핵산을 함유하는 벡터가 선형 DNA의 형태로 미생물내에 유리하게 도입될 수 있으며, 이종성 또는 상동성 재조합을 통해 숙주 유기체의 게놈으로 통합될 수 있다. 이러한 선형 DNA는 플라스미드와 같은 선형화 벡터로 구성될 수 있으며, 또는 본 발명에 따른 핵산 구조물 또는 핵산으로만 구성될 수 있다.
유기체내에서 이종성 유전자의 최적 발현을 위해, 유기체내에 사용된 특정 "코돈 사용량"에 따라 핵산 서열들을 변형시키는 것이 유리하다. "코돈 사용량"은 관련 유기체의 다른 알려진 유전자들의 컴퓨터 평가에 근거하여 용이하게 측정될 수 있다.
본 발명에 따른 발현 카세트의 제조는 적당한 프로모터와, 적당한 코딩 뉴클레오티드 서열 및 종결자 또는 폴리아데닐화 신호와의 융합에 의해 실시된다. 표준 재조합 및 클로닝 기술들이 이를 위해 사용되며, 예컨대 예를 들면 T. Maniatis, E.F. Fritsch and J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989) and in T.J. Silhavy, M.L. Berman and L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984) and in Ausubel, F.M. et al., Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience (1987)에 설명되어 있다.
적당한 숙주 유기체내 발현을 위해, 재조합 핵산 구조물 또는 유전자 구조물이 숙주내 유전자들의 최적 발현을 가능하게 하는 숙주-특이적 벡터에 유리하게 삽입된다. 벡터들은 당업자들에게 잘 알려져 있으며, 예를 들면 "클로닝 벡터(Cloning Vectors)" (Pouwels P. H. et al., Eds., Elsevier, Amsterdam-New York-Oxford, 1985).로부터 알 수 있다.
4. 미생물들
본 명세서에 따르면, 용어 "미생물"은 개시 미생물(야생형) 또는 유전자 변형된, 재조합 미생물 또는 둘다를 의미하는 것으로 이해될 수 있다.
본 발명에 따른 벡터에 의하면, 본 발명에 따른 적어도 하나의 벡터에 의해 예를 들면 변환되는 재조합 미생물들이 생성될 수 있으며, 본 발명에 따른 폴리펩티드들을 제조하기 위해 사용될 수 있다. 유리하게는, 상기 설명된 재조합 구조물들은 적당한 숙주 시스템내에 도입되며, 발현된다. 여기에서, 당업자에게 공지된 표준 클로닝 및 트랜스펙션 방법들, 예컨대 예를 들면 공침전, 원형질 융합, 전기천공법, 레트로바이러스 트랜스펙션 등은 특정 발현 시스템에서 상기 핵산들을 발현시키기 위해 바람직하게 사용된다. 적당한 시스템들은 예를 들어, Current Protocols in Molecular Biology, F. Ausubel et al., Publ., Wiley Interscience, New York 1997, or Sambrook et al. Molecular Cloning: A Laboratory Manual. 2nd Edn., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989에 설명되어 있다. 단백질의 이종 발현을 위한 세균성 발현 시스템들의 개요는 예를 들어, Terpe, K. Appl. Microbiol. Biotechnol. (2006) 72: 211-222에 의해 제공되어 있다.
본 발명에 따른 핵산 또는 핵산 구조물을 위한 재조합 숙주 유기체로서, 원칙적으로 모든 원핵 또는 진핵 유기체들이 가능하다. 유리하게는, 미생물들, 예컨대 세균, 균류 또는 효모들이 숙주 유기체로서 사용된다. 유리하게는, 과들(Families) 엔테로박테리아세(Enterobacteriaceae), 슈도모나다세(Pseudomonadaceae), 리조비아세(Rhizobiaceae), 스트렙토마이세타세(Streptomycetaceae) 또는 노카르디아세(Nocardiaceae)의 세균들, 특히 바람직하게는 속 에스케리치아(Escherichia), 슈도모나스(Pseudomonas), 스트렙토마이세스(Streptomyces), 노카르디아(Nocardia), 부르크홀데리아(Burkholderia), 살모넬라(Salmonella), 아그로박테리움(Agrobacterium), 클로스트리듐(Clostridium) 또는 로도코커스(Rhodococcus)의 세균이 사용된다. 속 및 종 에스케리치아 콜라이(Escherichia coli)가 매우 특히 바람직하다. 게다가, 더욱 유리한 세균들은 알파 프로테오박테리아, 베타 프로테오박테리아 또는 감마 프로테오박테리아의 그룹에서 발견된다.
본 발명에 따른 숙주 유기체 또는 숙주 유기체들은 본원에서, 바람직하게 본 발명에 설명된 핵산 서열들, 핵산 구조물들 또는 벡터들 중 적어도 하나를 함유하며, 상기 정의에 따른 7β-HSDH 활성을 갖는 효소를 코딩한다.
본 발명에 따른 방법에 사용되는 유기체들은 당업자들에게 공지된 방법으로 숙주 유기체에 의존하여 재배 또는 배양된다. 미생물들은 일반적으로, 주로 당 형태의 탄소 공급원, 주로 유기 질소 공급원 형태의 질소 공급원, 예컨대 효모 추출물 또는 염들, 예컨대 황산암모늄, 미량 원소들, 예컨대 철, 망간 및 마그네슘 염들 및 선택적으로 비타민들을 함유하는 액체 배지내에서, 0℃ 내지 100℃, 바람직하게는 10℃ 내지 60℃의 온도에서 산소 통기와 함께 성장한다. 그동안, 배양액(nutrient liquid)의 pH는 고정된 값으로 고정될 수 있으며, 즉 배양하는 동안 조절되거나 그렇지 않을 수 있다. 배양은 "배치식", "반-배치식" 또는 연속식으로 실시될 수 있다. 발효 시작시에 영양분이 제공될 수 있으며, 또는 반연속식 또는 연속식으로 추가로 공급될 수 있다.
이들을 사용할때까지, 본 발명에 따른 유기체들은 예를 들면, -20℃의 동결 상태에서; 또는 동결건조물로서 적당하게 저장될 수 있다. 사용을 위해, 동결된 배양물을 실온으로 하고; 선택적으로 하나 이상의 동결/해동 사이클도 수행될 수 있다. 동결건조된 제조물들은 추가로 사용하기 위해, 적당한 액체 배지, 예컨대 버퍼 용액내에 용해/현탁될 수 있다.
5. UDCA의 제조
제1 단계: CA를 DHCA로 화학적 전환
CA의 히드록시기는 예를 들면 산 용액(예를 들면, H2SO4)내 크롬산 또는 크로메이트에 의해 전형적인 화학적 경로에 의해 그 자체로 알려져 있는 방법으로 카르보닐기들로 산화된다. 그 결과, DHCA가 형성된다.
제2 단계: DHCA를 12-케토-UDCA로 효소적 또는 미생물적 전환
수용액에서, DHCA는 각각 NADPH 또는 NADH의 존재하에서, 3α-HSDH 및 7β-HSDH 또는 그의 변이체들에 의해 12-케토-UDCA로 특이적으로 환원된다. 보조인자 NADPH 또는 NADH는 ADH 또는 FDH 또는 GDH 또는 그의 변이체들에 의해 이소프로판올 또는 소듐 포르메이트 또는 글루코스로부터 재생될 수 있다. 이 반응은 온화한 조건하에 진행한다. 예를 들면, 이 반응은 pH = 6 내지 9, 특히 약 pH = 8 및 약 10 내지 30℃, 15 내지 25℃ 또는 약 23℃에서 수행될 수 있다.
미생물 전환단계의 경우, 필요한 효소활성(들)을 발현하는 재조합 미생물들은 전환되는 기질(DHCA)의 존재하에 적당한 액체 배지내에서 혐기성으로 또는 호기성으로 배양될 수 있다. 적당한 배양 조건은 당업자들에게 그 자체로 알려져 있다. 이들은 예를 들면, 5 내지 10 또는 6 내지 9의 pH 범위에서, 10 내지 60℃ 또는 15 내지 45℃ 또는 25 내지 40℃ 또는 37℃ 범위의 온도에서의 전환들을 포함한다. 적당한 배지는 예를 들면, 하기 설명된 LB 및 TB 배지를 포함한다. 본원에서 전환 기간은 예를 들면, 배치식으로 또는 연속식으로, 또는 다른 일반적인 공정변수들(상기 설명된 바와 같음)에서 일어날 수 있다. 본원에서 전환 기간은 예를 들면, 수 분 내지 수 시간 또는 수 일의 범위내에 있을 수 있으며, 예를 들면 1시간 내지 48시간일 수 있다. 선택적으로, 효소 활성이 연속식으로 발현되지 않는다면, 이들은 예를 들면 약 OD600=0.5 내지 1.0의 타겟 세포 밀도를 달성한 후, 적당한 유도물질을 첨가함으로써 개시될 수 있다.
발효, 배지에 첨가하는 것, 효소 고정화 및 가치있는 물질들의 분리와 관련된 미생물 제조방법의 추가의 가능한 적당한 변형들은 또한 "효소 및 변이체들의 제조"와 관련된 하기 부분에서 알 수 있다.
제3 단계: 12-케토-UDCA를 UDCA로 화학적 전환
12-케토-UDCA의 12-카르보닐기는 그 자체로 공지된 방법에서 Wolff-Kishner 환원에 의해 제거되며, 그 결과 UDCA가 12-케토-UDCA로부터 형성된다. 반응에서, 카르보닐기가 히드라진에 의해 히드라존으로 첫째로 전환된다. 다음으로, 히드라존은 염기(예를 들면, KOH)의 존재하에 200℃로 가열되어, 질소가 제거되고, UDCA가 형성된다.
6. 효소들 및 변이체들의 재조합 제조
또한, 본 발명의 주제는 본 발명에 따른 폴리펩티드들, 또는 그의 기능적, 생물학적 활성 단편의 재조합 제조방법이며, 상기 폴리펩티드-생성 미생물이 배양되며, 선택적으로 폴리펩티드들의 발현이 유도되고, 및 이들은 배양액으로부터 분리된다. 따라서 폴리펩티드들은 또한, 원하는 경우 산업적인 대규모로 제조될 수도 있다.
본 발명에 따라 제조된 미생물들은 배치 공정에서 연속식으로 또는 불연속식으로, 또는 유가배양식 방법 또는 반복된 유가배양식 방법으로 배양될 수 있다. 공지된 배양방법들의 요약은 Chmiel의 교과서(Bioprozeβtechnik 1. Einfuhrung in die Bioverfahrenstechnik [Bioprocess Technology 1. Introduction to Bioprocess Technology](Gustav Fischer Verlag, Stuttgart, 1991)) 또는 Storhas의 교과서(Bioreaktoren und periphere Einrichtungen [Bioreactors and Peripheral Equipment](Vieweg Verlag, Braunschweig/Wiesbaden, 1994))내에서 찾아볼 수 있다.
사용된 배양 배지는 특정 균주들의 요건들을 적당하게 만족시켜야 한다. 다양한 미생물을 위한 배양 배지의 설명들은 American Society for Bacteriology manual "Manual of Methods for General Bacteriology" (Washington D. C., USA, 1981)내에 포함되어 있다.
본 발명에 따라 사용가능한 상기 배지는 보통 하나 이상의 탄소 공급원, 질소 공급원, 무기 염들, 비타민들 및/또는 미량 원소들을 포함한다.
바람직한 탄소 공급원들은 당, 예컨대 모노사카라이드, 디사카라이드 또는 폴리사카라이드이다. 매우 양호한 탄소 공급원은 예를 들면, 글루코스, 프룩토스, 만노스, 갈락토스, 리보스, 소르보스, 리뷸로스, 락토스, 말토스, 사카로스, 라피노즈, 전분 또는 셀룰로스이다. 당은 또한, 복합 화합물, 예컨대 당밀, 또는 당 정제의 다른 부산물들을 통해 배지에 첨가될 수 있다. 다른 탄소 공급원들의 혼합물을 가하는 것이 유리할 수도 있다. 다른 가능한 탄소 공급원들은 오일 및 지방, 예컨대 예를 들면 소야 오일, 해바라기유, 피넛 오일 및 코코넛 지방, 지방산 예컨대 예를 들면, 팔미트산, 스테아르산 또는 리놀산, 알콜, 예컨대 예를 들면 글리세린, 메탄올 또는 에탄올 및 유기 산, 예컨대 예를 들면 아세트산 또는 락트산이다.
질소 공급원들은 일반적으로 유기 또는 무기 질소 화합물들 또는 상기 화합물들을 함유하는 물질들이다. 질소 공급원들의 예들은 암모니아 가스 또는 암모늄 염, 예컨대 암모늄 설페이트, 암모늄 클로라이드, 암모늄 포스페이트, 암모늄 카보네이트 또는 암모늄 니트레이트, 니트레이트, 우레아, 아미노산 또는 복합 질소 공급원들, 예컨대 옥수수 침지액, 콩가루, 콩단백질, 효모추출물, 육류 추출물 및 기타를 포함한다. 질소 공급원들은 단독으로 또는 혼합물로 사용될 수 있다.
배지내에 함유될 수 있는 무기 염 화합물들은 칼슘, 마그네슘, 소듐, 코발트, 몰리브덴, 칼륨, 망간, 아연, 구리 및 철의 클로라이드, 포스페이트 또는 설페이트 염들을 포함한다.
황 공급원으로서, 무기 황-함유 화합물들, 예컨대 예를 들면 설페이트, 설파이트, 디티오나이트, 테트라티오네이트, 티오설페이트, 설파이드, 뿐만 아니라 유기 황 화합물들, 예컨대 메르캅탄 및 티올이 사용될 수 있다.
인 공급원으로서, 인산, 인산이수소칼륨 또는 인산수소이나트륨 또는 대응하는 나트륨-함유 염들이 사용될 수 있다.
용액내 금속 이온들을 유지하기 위해 배지에 킬레이트제가 첨가될 수 있다. 특히 적당한 킬레이트제들은 디히드록시페놀, 예컨대 카테콜 또는 프로토카테츄에이트, 또는 유기 산 예컨대 시트르산을 포함한다.
본 발명에 따라 사용되는 발효 배지는 일반적으로 다른 성장인자들, 예컨대 비타민들 또는 성장 프로모터들도 함유하며, 이들은 비오틴, 리보플라빈, 티아민, 엽산, 니코틴산, 판토테네이트 및 피리독신을 포함한다. 성장인자들 및 염들은 종종 복합배지성분들, 예컨대 효모 추출물, 당밀, 옥수수 침지액 등으로부터 유도된다. 그리고, 적당한 전구물질들이 배양 배지에 가해질 수 있다. 배지 화합물들의 정확한 조성은 특정 실험에 크게 의존하며, 각 구체적인 경우에 대하여 개별적으로 결정된다. 배지 최적화에 대한 정보는 교과서 "Applied Microbiol. Physiology, A Practical Approach" (Publ. P.M. Rhodes, P.F. Stanbury, IRL Press (1997) pp.53-73, ISBN 0 19 963577 3)로부터 얻을 수 있다. 성장 배지는 또한, 상업적 공급사, 예컨대 Standard 1(Merck) 또는 BHI(Brain heart infusion, DIFCO) 등으로부터 입수할 수 있다.
모든 배지 성분들은 가열(1.5 bar 및 121℃에서 20분) 또는 멸균 여과에 의해 살균된다. 성분들은 함께, 또는 필요하다면 별도로 살균될 수 있다. 모든 배지 성분들은 배양 시작시에 존재할 수 있거나, 선택적으로, 연속식 또는 배치식으로 가해질 수 있다.
배양액의 온도는 보통 15℃ 내지 45℃, 바람직하게는 25℃ 내지 40℃이며, 실험하는 동안 일정하게 유지되거나 변화될 수 있다. 배지의 pH는 5 내지 8.5, 바람직하게는 약 7.0이어야 한다. 배양을 위한 pH는 염기성 화합물들, 예컨대 수산화나트륨, 수산화칼륨, 암모니아 또는 암모니아수 또는 산성 화합물들, 예컨대 인산 또는 황산을 첨가함으로써 배양하는 동안 조절될 수 있다. 포밍(foaming)을 조절하기 위해, 소포제, 예컨대 예를 들면 지방산 폴리글리콜 에스테르가 사용될 수 있다. 플라스미드의 안정성을 유지하기 위해, 선택적 작용 물질, 예컨대 예를 들면 항생제들이 배지에 첨가될 수 있다. 호기성 조건을 유지하기 위해, 산소 또는 산소-함유 가스 혼합물, 예컨대 예를 들면 주위 공기가 배지에 도입된다. 배양액의 온도는 보통 20℃ 내지 45℃이다. 최대량의 원하는 생성물이 형성될때까지 배양이 계속된다. 이 목표는 보통 10시간 내지 160시간 이내에 도달된다.
그후, 발효 브로쓰가 추가 처리된다. 요건에 의존하여, 바이오매스는 분리 방법들, 예컨대 예를 들면 원심분리, 여과, 경사법, 또는 이들 방법들의 조합에 의해 발효 브로쓰로부터 전체 또는 부분 제거될 수 있거나, 그 안에 전체 남아있을 수 있다.
폴리펩티드가 배양 배지에 분비되지 않는 경우, 세포들이 또한 분해될 수 있으며, 및 공지된 단백질 분리 방법들에 의해 용해물로부터 생성물이 얻어진다. 세포들은 선택적으로, 고주파수 초음파, 고압, 예컨대 예를 들면 프렌치 압력 세포, 삼투압, 세제의 작용, 용해 효소 또는 유기 용매, 균질화기 또는 이들 여러 방법들의 조합에 의해 분해될 수 있다.
폴리펩티드들의 정제는 공지된 크로마토그래피 방법들, 예컨대 분자체 크로마토그래피(겔 여과), 예컨대 Q 세파로스 크로마토그래피, 이온교환 크로마토그래피 및 소수성 크로마토그래피 및 다른 일반적인 방법들, 예컨대 한외여과, 결정화, 염석, 투석 및 천연 겔 전기영동에 의해 이루어질 수 있다. 적당한 방법들은 예를 들면, Cooper, F. G., Biochemische Arbeitsmethoden [Biochemical Work Methods], Verlag Walter de Gruyter, Berlin, New York or in Scopes, R., Protein Purification, Springer Verlag, New York, Heidelberg, Berlin에 설명되어 있다.
재조합 단백질의 분리를 위해, 정해진 뉴클레오티드 서열들에 의해 cDNA를 신장시키고, 예를 들면 더 간단한 정제를 위해 제공하는, 변형된 폴리펩티드 또는 융합 단백질에 대하여 코딩하는, 벡터 시스템들 또는 올리고뉴클레오티드들을 사용하는 것이 유리할 수 있다. 적당한 상기 변형들은 예를 들면, 앵커로서 기능하는 소위 "태그들", 예컨대 예를 들면 항체들에 의해 항원으로 인식될 수 있는 헥사-히스티딘 앵커 또는 에피토프들로 알려져 있는 변형이다(예를 들면, Harlow, E. and Lane, D., 1988, Antibodies: A Laboratory Manual. Cold Spring Harbor (N.Y.) Press에 설명되어 있음). 이러한 앵커들은 고체 지지체, 예컨대 예를 들면 폴리머 매트릭스 상에 단백질들을 부착하기 위해 제공할 수 있으며, 이는 크로마토그래피 컬럼내에 패킹될 수 있거나, 미세적정기 플레이트 또는 다른 지지체 상에서 사용될 수 있다.
이와 동시에, 상기 앵커들은 단백질들을 인식하기 위해 사용될 수도 있다. 단백질들을 인식하기 위해, 이외에 일반 마커들, 예컨대 형광 염료들, 기질과 반응후 검출가능한 반응 생성물을 형성하는, 효소 마커들, 또는 방사성 마커들이 단독으로 또는 앵커들과 조합하여 단백질의 유도체화를 위해 사용될 수 있다.
7. 효소 고정화
본 발명에 따른 효소들은 본원에 설명된 방법들에서 자유롭게 사용되거나 고정화될 수 있다. 고정화 효소는 비활성 지지체 상에 고정되는 효소를 의미하는 것으로 이해된다. 적당한 지지체 물질 및 그 위에 고정화된 효소들은 EP-A-1149849, EP-A-1 069 183 및 DE-OS 100193773로부터 및 여기에 인용된 참조문헌들로부터 알려져 있다. 이와 관련하여 상기 문헌들을 전문 참조한다. 적당한 지지체 물질들은 예를 들면, 클레이, 클레이 미네랄, 예컨대 카올리나이트, 규조토, 펄라이트, 이산화규소, 산화알루미늄, 탄산나트륨, 탄산칼슘, 셀룰로스 분말, 음이온교환 물질들, 및 합성 폴리머, 예컨대 폴리스티렌, 아크릴 수지, 페놀 포름알데히드 수지, 폴리우레탄 및 폴리올레핀, 예컨대 폴리에틸렌 및 폴리프로필렌을 포함한다. 지지체 물질들은 보통 미세하게 분해된 입자 형태의 지지된 효소들을 제조하는데 사용되며, 다공성 형태가 바람직하다. 지지체 물질의 입자 크기는 보통 5mm 이하, 특히 2mm 이하이다(입도 곡선). 이와 비슷하게, 전세포 촉매로서 탈수소효소를 사용하여, 자유 형태 또는 고정화된 형태가 선택될 수 있다. 지지체 물질은 예를 들면, Ca 알기네이트 및 카라기난이다. 효소들 및 또한 세포들은 또한, 글루타르알데히드와 직접 가교될 수 있다(가교하여 CLEA를 제공함). 유사한 및 또다른 고정화 방법들은 예를 들면, J. Lalonde and A. Margolin "Immobilization of enzymes" in K. Drauz and H. Waldmann, Enzyme Catalysis in Organic Synthesis 2002, Vol.III, 991-1032, Wiley-VCH, Weinheim에 설명되어 있다.
실험예 부분:
A. 일반적인 정보
1. 재료들:
콜린셀라 아에로파시엔스 DSM 3979(ATCC 25986, 이전 이름 유박테리움 아에로파시엔스(Eubacterium aerofaciens)의 게놈 DNA를 미생물 및 세포 배양액의 독일 컬렉션(DSMZ)로부터 얻었다. UDCA 및 7-케토-LCA는 그 자체로 알려져 있는 개시 화합물이며, 문헌에 설명되어 있다. 모든 다른 화학물들 및 효소들은 다른 제조사들의 상업용으로 입수가능한 무역제품들이었다.
2. 미생물들 및 벡터들:
2.1 미생물들
2.2 발현 벡터들 및 벡터 구조물들
발현 플라스미드들(도 3 참조)
p7(A)T3rG ( = p7(A)T3rG-A) (WO2012/080504 참조)
p7(A)T3rG-K 및
p7(A)T3TG (=p7(A)T3TG-A)
각각은 유전자들 7β-HSDH, 3α-HSDH 및 GDH가 인코딩된 발현 카세트들을 가지지만, 다른 발현 카세트 구조 및 다른 항생 내성을 가진다. 상기 플라스미드들은 숙주 균주 E. coli BL49 또는 E. coli BL21 ΔhdhA(둘다 출원인의 WO 2012/080504 또는 WO 2011/147957에 알려져 있음)에서 임의로 사용되었다.
이에 따라 변형된 하기 균주들이 사용되었다:
E. coli BL49 p7(A)T3rG,
E. coli BL21 ΔhdhA p7(A)T3rG-K
E. coli BL49 p7(A)T3TG
3. 미생물학적 방법들
다르게 진술하지 않는한, 예를 들어 Sambrook, J., Fritsch, E.F. and Maniatis, T. Molecular Cloning: A Laboratory Manual. 2nd Edn., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989; Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, NY (1993); Kriegler, Gene Transfer and Expression, A Laboratory Manual, Stockton Press, NY (1990)에 설명된, 인가된 방법들에 기초하여, 분자생물학적 작업이 수행된다.
3.1 셰이커 플라스크내에서 에스케리치아 콜라이를 배양
재조합 단백질을 발현하기 위해, 적당한 항생제가 첨가된 5mL LB 배지에 세균 콜로니 또는 크리오배양액(cryoculture)을 먼저 접종한후, 30℃ 및 200rpm에서 밤새 배양했다. 다음날, 적당한 항생제를 갖는 100-200mL TB 배지에 밤새 배양액 1-5mL를 접종하고, 37℃ 및 250rpm에서 배양했다. 0.6~0.8의 OD600을 달성할때, 1mM IPTG를 첨가하여 재조합 단백질의 발현을 유도하고, 배양액을 25℃ 및 160rpm에서 추가 21시간동안 배양했다.
3.2 7.5L 교반용기 반응기내에서 에스케리치아 콜라이를 배양
전세포 생체촉매들을 리터 규모로 배양하는 것은 Infors AG(Infors 3, Bottmingen, 스위스)제 교반용기 반응기(V=7.5L)에서 실시하였다. 반응기는 온도, pH 및 pO2를 위한 프로브를 갖추었으며, 그래서 상기 파라미터들이 읽어낼 수 있었으며, 선택적으로 조절 유닛 온라인에 의해 조절될 수 있었다. 반응기는 조절 유닛에 연결된 이중 재킷을 통해 온도-조절하였다. 딥 튜브를 통해 에어레이션(aeration)이 실시되고, 반응기 커버 상의 모터에 의해 구동되는, 3개의 6날 임펠러들로 철저한 혼합이 실시되었다. 그리고, 기질 및 염기(수산화암모늄 용액, 25%(w/v))를 공급 펌프를 통해 반응기에 공급할 수 있었다.
전배양
7.5L 교반용기 반응기내에서 배양하기 위해, 2개의 전배양 단계들 모두 적용하였다. 적당한 항생제를 갖는 5mL LB 배지와 함께 시험관내에서 제1 전배양이 일어났다. 아침에, 이것을 100μL의 냉 배양액(cryoculture)에 접종하고, 30℃ 및 200rpm에서 6~10시간동안, 가시 탁도가 나타날때까지 배양하였다. 다음으로, 200mL 최소배지를 채운 1L 목이 좁은 삼각플라스크에 500~1000μL의 제1 전배양액을 옮기고, Wilms 외 다수의 (2001) 이후 37℃, 250rpm(편심(eccentricity) 5cm)에서 밤새 배양했다.
배치 단계
교반용기 배양을 위해, 2.8~3.8L 최소배지 및 1.5mL 소포제(Antifoam 204, Sigma-Aldrich, Munich)를 채운 멸균된 교반용기 반응기를 사용하였으며, 그의 프로브들은 배양을 개시하기 전에 표준 방법들에 의해 보정하였다. 이를 배치(batch) 글루코스(최종 농도 2g L-1) 및 적당한 항생제로 처리한후, 200mL의 제2 전배양 스테이지를 접종하였다. 2L min-1 압축공기에 의해 에어레이션을 수행하고, 배양 개시할때 교반기 회전속도는 200rpm이었다. pO2가 30%의 임계값 이하로 떨어질때, 교반기 회전속도를 1100rpm의 이론적 최대값 이하로 5rpm까지 증가하도록 증가시켰다. 염기(25% 수산화암모늄, w/v)를 가함으로써, pH를 7.0으로 일방적으로 조절하면서, 온도는 37℃에서 유지하였다. 배치 글루코스를 소모한 후, 이는 pO2가 갑자기 증가시킴으로써 확인될 수 있었으며, 기질-제한 공급 단계로의 전이가 일어났다.
기질-제한 성장 단계
공급 단계를 개시할때, 압축 공기에 의한 에어레이션이 5L min-1로 증가하고, 온도는 30℃로 감소하였으며, 증가의 교반기 회전속도를 위한 임계값이 20% pO2로 낮아졌다. 기질 공급에 있어서의 계량은 μ=0.15hrs-1의 특정 성장속도를 기초로 하여 실시하였다. 공급 배지는 500g L-1 글루코스 및 99g L-1 인산수소이암모늄을 함유하였다. 바이오매스 수득량은 0.45gBDM gGlc -1인 것으로 추정되었다.
기질-제한 성장단계의 지속은 19시간이었다. 이 단계가 끝나기 1시간전에, 온도가 20℃로 낮아졌으며, 추가로, 3mL L-1 미량원소 용액 및 2mL L-1 황산마그네슘 용액(1M)을 첨가했으며, 각각은 V0에 기초하였다. 암피실린이 선택 항생제로서 사용되었다면, 기질-제한 성장단계를 개시할때, 및 끝나기 1시간 전에 50mg L-1 암피실린을 첨가했다.
발현 단계
기질-제한 성장단계가 끝난 후, 발현 단계가 개시될때, 0.5mM IPTG(V0에 기초)를 가하였다. 온도를 20℃에서 유지하였으며, 예정 성장속도를 μ=0.06hrs-1로 감소하였다. 18시간후, 공급부피 흐름이 가장 마지막에 조정된 값에서 일정했으며, 그렇지 않았으면 pO2≥20%의 산소 포화가 확보될 수 없었을 것이다. 3mL L-1 미량원소 용액, 2mL L-1 황산마그네슘 용액(1M) 및 선택적으로 50mg L-1 암피실린을 발현단계 개시한후 8시간후에 추가로 가하였다. 발현단계 개시후 24시간후에 세포들을 수확하고, 30% 글리세린(v/v)에 의해 선택적으로 처리하고, -20℃에서 저장하였다.
3.3 깊은 웰 플레이트내에서 에스케리치아 콜라이 배양
깊은 웰 플레이트내에서 E. coli 라이브러리들을 배양하기 위해, 첫째로 96개의 웰을 갖는 멸균 미세적정기 플레이트내에서 전배양액을 제조하였다. 이를 위해, 전배양 배지(5%(v/v) DMSO에 의해 처리된 TB 배지) 150μL를 각 웰들에 넣었다. 다음으로, 멸균 이쑤시게에 의해 웰들에 아가 플레이트로부터의 콜로니를 접종하였다. 그후, 미세적정기 플레이트를 멸균, 통기성있는 밀봉 필름(Breathe-Easy, Diversified Biotech, USA)에 의해 밀봉하고, 37℃에서 밤새 200~250rpm에서 밤새 배양하였다. 배양후, 미세적정기 플레이트를 스톡 플레이트로서 -80℃에서 멸균저장하였다. 2.2mL 웰 부피 및 사각형 웰 구경들에서 96개의 웰들을 갖는 멸균의 깊은 웰 플레이트내에서 단백질 발현을 실시하였다. 이를 위해, 적당한 항생제를 갖는 600μL 멸균 TB 배지를 각 웰에 옮기고, 그후 웰들에 각각 스톡 플레이트로부터의 10μL 전배양액을 접종하였다. 깊은 웰 플레이트들을 멸균의 통기성 밀봉 필름으로 밀봉하고, 37℃에서 9시간동안 200~250rpm에서 배양하였다. 9시간 배양후, 배양액들을 각각 100μL 유도용액으로 처리하였다. 다음으로, 깊은 웰 플레이트들을 멸균의 통기성 밀봉 필름으로 밀봉하고, 30℃에서 21시간동안 더 200~250rpm에서 배양하였다. 원심분리(30분, 3000g)에 의해 세포들을 수확하였다. 추가로 사용할때까지 세포 펠릿들을 -80℃에서 저장하였다.
3.4 균주 유지
E. coli의 단기간 및 중간기간 균주 유지는 4℃에서 적당히 선택한 항생제를 갖는 LB 아가 플레이트 상에서 실시하였다. 장기간 균주 유지를 위해, LB 배지내 E. coli 배양액을 배양하고, 이들을 지수적 성장단계(OD≤0.8)내에서 20% 멸균 글리세린(v/v)로 처리하여 냉 배양액(cryoculture)을 제조하고, -80℃에서 멸균 1.5mL 반응용기내에 저장하였다.
3.5 진동 밀에서 에스케리치아 콜라이를 세포분해
진동 밀에서 E. coli의 세포 분해는 2mL 반응 용기내에서 실시하였다. 이를 위해, 1mL의 유리 비드(직경 0.25~0.5mm, Carl Roth, Karlsruhe) 및 분해되는 세균 현탁액 1mL를 각 반응용기에 넣고, 그후 이를 진동 밀(MM 200, Retsch, Haan)내에 장착하고, 30Hz에서 6분간 셰이킹하였다. 다음으로, 용기들을 벤치 원심분리기(Biofuge Stratos, Thermo Fischer Scientific, Waltham, USA)에서 4℃ 및 17880g에서 10분간 원심분리하였다. 상층액을 추가 용도를 위해 사용할 수 있었다.
3.6 고압 균질화기내에서 에스케리치아 콜라이의 세포 분해
생물반응기내 배양액들로부터의 세포들을 고압 균질화기(Ariete, GEA Niro Soavi, Lubeck)에 의해 분해하였다. 이를 위해, 세포 현탁액을 먼저 50L 인산칼륨 버퍼(20mM, pH 7.4)를 채운 200L 스테인레스 스틸 탱크에 옮기고, 4℃로 냉각하였다. 950bar의 압력 및 300~350L hr-1의 부피 유량에서 분해를 실시하였으며, 그후 15~20분후 150L hr-1로 낮췄다. 제1 통과후, 세포 브로쓰를 4℃로 냉각된 제2의 200L 스테인레스 스틸 탱크에 수집하고, 20℃ 이하로 냉각하였으며, 50L 인산칼륨 버퍼로 채운 제3의 200L 스테인레스 스틸 탱크에 옮기고, 4℃로 냉각하였다. 다음으로, 고압 균질화기를 통한 제2 통과는 상기 설명한 바와 같이 수행하였다.
이 과정은 분해하는 동안 세포 브로쓰의 온도가 35℃를 초과하지 않도록 해야 하며, 그 이유는 고압 균질화기를 통해 1회 통과하면 배지가 10~15℃까지 가열되기 때문이다. 세포 분해후, 제1 단계에서 세포 잔해물이 디스크 분리기에 의해 분리되었다(CAA 08, GEA Westphalia, Oelde). 이를 100L hr-1의 부피 유량, 0~3bar의 배압(back-pressure) 및 999초의 고형 분출물의 부분적 비움 간격에서 동작시켰다. 깨끗해진 세포 브로쓰를 10L 플라스틱 캐니스터로 분액시키고, 추가로 사용할때까지 -20℃에서 저장하였다.
3.7 리소자임에 의한 에스케리치아 콜라이의 세포 분해
리소자임에 의한 효소적 세포분해를 위해, 펠릿화 세포들을 600μL 분해 버퍼(50mM KPi, 10mM MgCl2, 70000U mL-1 리소자임, 50U mL-1 DNAseI)내 깊은 웰 플레이트내에 현탁시키고, 37℃에서 1시간동안 배양하였다. 다음으로, 세포 잔해를 플로어-스탠딩 원심분리기(Rotixa 50 RS, Hettich, Tuttlingen)에서 원심분리(30분, 3000g, 4℃)에 의해 분리하였다. 상층액을 추가 사용을 위해 사용하였다.
4. 분자생물학 방법들
4.1 플라스미드 DNA의 분리
플라스미드 DNA 분리는 GenEluteTM 플라스미드 미니프레프 키트(Plasmid Miniprep Kit)(Sigma-Aldrich, Munich)에 의해 수행하였다. 이를 위해, E. coli의 LB 하룻밤 배양물 5mL를 제조사의 지시에 따라 처리하였다. 분리된 플라스미드 DNA를 용출하기 위해, 100μL의 70℃로 온도조절된, 이중-증류된 멸균수를 사용하였다.
4.2 중합효소 연쇄반응
DNA 단편들을 제조용으로 증폭시키기 위한 중합효소 연쇄반응(PCR)을 Saiki R. K. et al. Science, 239:487-491, 1988의 방법에 의해 수행하였다. 반응 혼합물은 1-2.5μL 주형 DNA, 0.5μM의 각 올리고뉴클레오티드, 0.2mM의 각 데스옥시리보뉴클레오티드 트리포스페이트(dNTP) 및 0.02U μL-1 Phusion DNA 중합효소로 구성되었다. DNA 증폭을 위한 온도 프로그램은 중합효소 제조사의 데이터 및 올리고뉴클레오티드들의 용융 온도에 기초하였다.
4.3 분석적 및 제조식 아가로스 겔 전기영동
DNA 분자들을 분리하기 위해, 1% 아가로스(w/v)의 농도를 갖는 아가로스 겔을 사용하였다. 여기에, 1g의 아가로스를 끓여서 100mL 1x TAE 버퍼에 용해하고, 5μL 에티듐 브로마이드(≥98%) 또는 선택적으로 5μL Roti® GelStain(Carl Roth, Karlsruhe)로 처리하고, 그후 겔 챔버(C.B.S. Scientific, San Diego, USA)에 부었다. 도포 전에, 분리되는 DNA를 Sambrook & Russell(2001)에 따른 5x 아가로스 겔 로딩 버퍼로 처리하고, 겔 위에 도포하였다. 확장된 100bp DNA 래더(Carl Roth, Karlsruhe)를 길이 표준으로 사용하였다. 120V의 정전압의 1x TAE 버퍼내에서 전기영동으로 실시하였다.
4.4 겔 추출에 의한 DNA 단편들의 정제
아가로스 겔로부터 DNA 단편들을 정제하기 위해, GenEluteTM 겔 추출 키트(Sigma-Aldrich, Munich)를 사용하였다. 이는 제조사의 지시에 따라 수행하였다. 분리된 DNA 단편들을 용출하기 위해, 70℃로 온도-조절된 50μL의 이중-증류된 멸균수를 사용하였다.
4.5 PCR 클린-업 키트를 사용한 DNA 단편들의 정제
GenEluteTM PCR 클린-업 키트(Sigma-Aldrich, Munich)에 의한 DNA 단편들의 정제를 제조사의 지시에 따라 수행하였다. 정제된 DNA 단편들을 용출하기 위해, 70℃로 온도-조절된 50μL의 이중-증류된 멸균수를 사용하였다.
4.6 엔도뉴클레아제에 의한 제한
DNA를 제한시키기 위해, 40~45μL의 제거되는 DNA를 10~20U의 관련 제한효소에 의해 처리하고, 제조사에 의해 권장되는 적당한 첨가제들을 갖는 반응 버퍼내에서 37℃에서 2시간동안 배양하였다. 다음으로, 단편들을 아가로스 겔 전기영동 후 겔 추출에 의해 또는 PCR 클린-업 키트를 사용하여 정제하였다.
4.7 DNA 단편들의 결찰
DNA 단편들을 결찰하기 위해, 이전에 이미 제한되고 정제된 DNA 단편들을 사용하였다. 16℃에서 제조사에 의해 이를 위해 제공된 버퍼내 0.5mM ATP를 첨가하면서, 12μL 제거된 벡터 DNA, 4μL 제거된 삽입 DNA, 및 20U mL-1 T4 DNA 리가아제(New England Biolabs, Frankfurt)를 사용하여 결찰을 실시하였다. 선택적으로, 제조사의 지시에 따라, Quick LigationTM 키트(New England Biolabs, Frankfurt)에 의해 결찰을 수행하였다. 여기에서, 6μL의 제거된 벡터 DNA 및 3μL의 제거된 삽입 DNA를 사용하였다.
4.8 부위-지향된 돌연변이생성
Sanchis et al., Appl. Microbiol. Biotechnol., 81(2):387-97, 2008 or Liu, H. & Naismith, J. H., BMC Biotechnol., 8:91, 2008에 따른 방법에 의해 플라스미드 DNA 상에서 부위-지향적 돌연변이생성을 선별적으로 수행하였다. 포화 돌연변이생성이 수행된 경우, 동의 코돈(degenerate codon)을 갖는 프라이머들을 사용하였다. Sanchis et al., Appl. Microbiol. Biotechnol., 81(2):387-97, 2008에 따른 방법의 경우, 반응 혼합물은 0.4μL 주형 DNA, 0.1μM의 각 올리고뉴클레오티드, 0.2mM의 각 dNTPs 및 0.02U μL-1의 Phusion Hot Start DNA 중합효소로 구성되었다. DNA 증폭을 위한 온도 프로그램은 공개된 방법에 기초하였으며, 중합효소 제조사로부터의 정보 및 올리고뉴클레오티드들의 용융 온도에 따라 주로 조정되었다.
Liu & Naismith (2008)에 따른 방법에서, 반응 혼합물은 0.2μL 주형 DNA, 1μM의 각 올리고뉴클레오티드, 0.2mM의 각 dNTPs 및 0.02U μL-1의 퓨젼 핫 스타트(Phusion Hot Start) DNA 중합효소로 구성되었다. DNA 증폭을 위한 온도 프로그램은 공개된 방법에 근거를 두었으며, 주로 중합효소 제조사로부터의 정보 및 올리고뉴클레오티드들의 용융온도에 따라 적응되었다. 돌연변이생성 PCR 후, 각 시간에 DpnI, 0.5U μL-1 를 2회 연속으로 가하고, 그후 37℃에서 1시간동안 배양함으로써, 모 DNA를 제한하였다.
4.9 화학적으로 컴피턴트 세포들의 제조 및 형질전환
화학적으로 컴피턴트한 E. coli 세포들을 제조하기 위해, 지수 성장단계(OD 0.5)의 100mL LB 액체 배지를 50mL 반응용기에 옮기고, 원심분리(3220g, 4℃, 10분)에 의해 펠릿화하였다. 그후, 상층액을 폐기하고, 세포 펠릿을 40mL의 얼음으로 냉각된 TFB1 매질내에 현탁시키고, 얼음 위에서 15분간 배양하였다. 그후, 세포들을 다시 원심분리(3220g, 4℃, 10분)에 의해 펠릿화하고, 상층액을 폐기하고, 세포들을 4mL의 얼음으로 냉각된 TFB2 매질내에 현탁시키고, 얼음 위에서 추가 15분간 배양하였다. 다음, 200μL 분액들을 멸균 1.5mL 반응용기내에 넣고, -80℃에서 동결시켰다. 형질전환을 위해, 각 경우 분액을 해동하고, 1-10μL DNA 용액으로 처리하고, 얼음 위에서 45분간 배양하였다. 써모믹서(Thermomixer)(RiO, QUANTIFOIL Instruments, Jena)에서 열충격(42℃, 1:30분)후, 세포들을 다시 얼음 위에서 1~2분간 두었다. 다음으로, 600μL의 멸균 LB 매질을 가하고, 그 혼합물을 37℃ 및 600rpm에서 추가로 45분간 써모믹서에서 배양하였다. 온화한 원심분리(3000rpm, 1분)후, 상층액을 50~100μL 외에 폐기하고, 펠릿들을 남은 상층액에 재현탁하고, 및 적당한 아가 플레이트 상으로 석출시켰다. 그후, 이들을 37℃의 인큐베이터에서 밤새 배양하였다.
4.10 일렉트로컴피턴트 세포들의 제조 및 형질전환
일렉트로컴피턴트 E. coli 세포들을 제조하기 위해, 지수 성장단계(OD 0.5)의 200mL LB 액체 배지를 얼음-냉각된 50mL 반응용기에 옮기고, 얼음 위에서 20분간 배양하고, 원심분리(4000g, 4℃, 15분)에 의해 펠릿화하였다. 그후, 세포들을 200mL, 100mL 및 8mL의 얼음-냉각된 10% 글리세린 용액(v/v)에 펠릿을 연속으로 재현탁하고, 다시 원심분리(6000g, 4℃, 15분)에 의해 펠릿화함으로써 3회 세척하였다. 다음으로, 세포들을 얼음-냉각된 10%(v/v) 글리세린에 의해 총 부피 0.4~0.8mL로 재현탁하고, 얼음-냉각된, 멸균 1.5mL 반응용기내 20μL의 분액을 채우고, -80℃에서 동결시켰다.
형질전환을 위해, 세포들을 2~10μL의 탈이온 DNA 용액으로 처리하고, 전기천공기 제조사의 프로토콜(Gene Pulser XcellTM, Bio-Rad, Munich.)에 따라 1~2mm 전극 갭을 갖춘 전기천공 큐벳에서 전기천공하였다. 다음으로, 1mL의 LB 매질을 세포에 즉시 첨가하고, 현탁액을 멸균 1.5mL 반응용기내에 옮기고, 써모믹서(RiO, QUANTIFOIL Instruments, Jena)에서 37℃ 및 600rpm에서 60분간 배양하였다. 온화한 원심분리(3000rpm, 1분)후, 상층액을 50~100μL 외에 폐기하고, 펠릿들을 남은 상층액에 재현탁하고, 및 적당한 아가 플레이트 상으로 석출시켰다. 그후, 이들을 37℃의 인큐베이터에서 밤새 배양하였다.
4.11 콜로니 중합효소 연쇄반응
바실루스 서브틸리스(Bacillus subtilis)로부터 글루코스 탈수소효소를 위한 유전자를 분리하기 위해, 제조용 콜로니 중합효소 연쇄반응(콜로니 PCR)을 수행하였다. 과정은 섹션 4.2에 설명된 것에 대응하며, 주형 DNA 대신 아가 플레이트 상에서 배양된 단일 콜로니로부터의 세균 표본을 반응 혼합물에 가한 것만 변형시켰다. 정확한 결찰을 위해 체크하는데 분석적 콜로니 PCR을 사용하였다. 여기에서 또한, 단일 세균 콜로니의 표본을 주형으로 사용하였다. 이들이 삽입 부위를 플랭킹하는 영역들을 갖는 타겟 DNA로 혼성화하도록 콜로니 PCR을 위한 프라이머를 선택하여, 증폭 생성물의 길이에 기초하여, 삽입이 성공적인지의 여부를 평가할 수 있다. 반응 혼합물은 0.5μM의 각 올리고뉴클레오티드, 0.2mM의 각 dNTP 및 0.05U μL-1 Taq DNA 중합효소로 구성되었다. DNA 증폭을 위한 온도 프로그램은 중합효소 제조사의 지시 및 올리고뉴클레오티드들의 용융 온도에 기초하고 있었다.
4.12 염색체 유전자들의 특이적 사일런싱
E. coli내 염색체 7α-HSDH의 특이적 사일런싱은 Sigma Aldrich(Munich)제 키트 TargeTronTM 유전자 녹아웃 시스템에 의해 실시하였다. 사일런싱에 필요한 플라스미드 pMB13은 Braun, M., PhD thesis, Technische Universitat Munich, 2011에 설명되어 있다. 이 플라스미드를 화학적 컴피턴트 E. coli로 형질전환시키고, 타겟 유전자의 사일런싱을 제조사의 지시에 따라 수행하였다. 카나마이신 및 콜로니 PCR을 갖는 LB 아가 플레이트 상에서 선택하여, 성공적인 사일런싱을 검출할 수 있었다. 세균내에 남은 플라스미드를 제거하기 위해, 카나마이신(50mg L-1) 및 노보바이오신(62mg L-1)을 갖는 LB 배지내에서 37℃에서 밤새 세포들을 배양하였다. 다음으로, 카나마이신을 갖는 LB 아가 플레이트 상에 상기 배양액을 넣고, 37℃에서 밤새 배양하였다. 제거되는 플라스미드의 존재는 클로람페니콜 민감도에 대하여 각 콜로니들을 시험하여 테스트하였다. 이는 LB 매질내에서 37℃에서 밤새 배양하는 것과 동시에 실시하였으며, 한번은 33mg L-1 클로람페니콜을 첨가하고, 한번은 이를 첨가하지 않았다.
5. 단백질 화학방법들
5.1 mL 규모로 단백질의 정제
mL 규모로 단백질들을 정제하는 것은 고정화 금속 친화도 크로마토그래피(IMAC)의 원칙에 따라 실시하였다. 분리 원칙은 정제되는 타겟 단백질 상에서 매트릭스-결합된 금속 리간드들의 히스티딘 잔기들과의 특정 상호작용에 기초한다. 이러한 목적을 위해, 타겟 단백질의 발현동안 His6 앵커가 N-말단 또는 C-말단 융합된다. 신속한 단백질 액체 크로마토그래피(FPLC) 유닛, HisTrap 컬럼(1mL 또는 5mL 컬럼 부피) 상에서 정제하기 위해, Ni2+ 이온으로 로딩된 그의 아가로스 매트릭스를 사용하였다. 유동상의 유속을 각 경우에 분당 1 컬럼 부피(CV)로 설정되었다. 이동안, 용출액 스트림내 단백질 농도는 280nm에서 UV 흡광을 통해 모니터링될 수 있었다. 첫째로, 적어도 5CV의 결합 버퍼에 의해 컬럼들을 보정하고, 그후 샘플들을 적용하였다. 그후, 컬럼들을 결합 버퍼로 세척하여, 비특이적-결합 외부 단백질들을 제거하였다. UV 신호의 기준선이 다시 도달할때까지 세척을 수행하였다. 타겟 단백질의 용출은 0% 내지 100%의 직선적 상승 용출 버퍼구배에 의해 20분간 이루어졌으며, 그동안 2CV의 용출액 프랙션이 수집되었다. 타겟 단백질을 함유하는 프랙션은 UV 신호를 통해 확인될 수 있다. 다음으로, 컬럼을 10CV의 용출 버퍼로 다시 세척하였다. 그후, 타겟 단백질을 함유하는 프랙션은 Vivaspin 원심농축기(배제 사이즈 10kDa)를 통해 농축하고, 타겟 버퍼를 채우고 3회 농축함으로써 버퍼를 교체하였다. 일반적으로, 타겟 버퍼는 단백질을 추가로 사용하기 위해 필요한 반응 버퍼에 대응한다.
원심 유닛에 의해 정제하기 위해, 3mL의 흡착제 부피를 갖는 HisPurTMNi-NTA 수지 스핀 컬럼들(Thermo Fischer Scientific, Waltham, USA)을 사용하였다. 이를 위한 과정은 제조사의 지시에 대응한다. 농도 및 버퍼 교환은 이전에 설명된 과정에 대응하였다.
5.2 L 규모로 단백질의 정제
L 규모로 단백질의 정제는 IMAC에 기초하여 실시하였다. 이를 위해, Ni 세파로스 6 패스트 플로우(GE Healthcare Life Science, Uppsala, Sweden)로 채운, 600mL 부피 및 직경 50mm의 크로마토그래피 컬럼을 사용하였다. 패킹하기 전에, 20% 에탄올에 저장된 컬럼 물질을 3배 경사법에 의해 세척하고, 물로 재충전하고, 슬러리화 및 침강시켰다. 다음으로, 슬러리화된 매질을 빈 컬럼, 및 150mL min-1의 최대 유속 및 1.5bar의 최대 압력으로 패킹된 컬럼에 공급하였다. 그후, 종료된 패킹된 컬럼을 1.2bar의 최대 압력에서 5CV의 결합 버퍼로 보정하였다. 해동후, 적용된 샘플을 500mM NaCl로 먼저 처리하고, 1M NaOH에 의해 pH 7.4로 조정하였다. 다음으로, 샘플을 투명하게 하기 위해, 일련으로 연결된 멸균 필터들(0.2㎛ 배제 크기)을 갖는 Sartocon® 슬라이스 Hydrosart® 필터 카세트(0.2㎛ 배제 크기, 각각 0.1m2 필터 면적, Sartorius Stedim Biotech, Gottingen)로 직교류를 수행하였다. 그후, 용출 방향에 대하여 1.2bar의 최대 압력을 갖는 컬럼 상에 샘플들을 도포하였다. 다음으로, 용출액 스트림의 UV 신호가 다시 기준선을 나타낼때까지, 용출 방향의 결합 버퍼로 컬럼을 세척하였다. 각각 2L의 프랙션이 수집되는 동안, 180분 동안 0%에서 100%로 직선적 상승하는 용출 버퍼 구배를 통해, 단백질의 용출을 실시하였다. 타겟 단백질을 함유하는 프랙션을 검출기의 UV 신호를 통해 확인할 수 있었다. 2개의 Sartocon® 슬라이스 Hydrosart® 필터 카세트(10kDa 배제크기, 각각 0.1m2 필터 면적, Sartorius Stedim Biotech, Gottingen)에 의해 직교류 여과에 의해 상기 프랙션들을 첫번째로 농축한 후, 타겟 버퍼의 5-10-배 교환 부피를 갖는 정용여과(diafiltration)에 의해 재퍼버링하였다.
5.3 소듐 도데실설페이트 폴리아크릴아미드 겔 전기영동(SDS-PAGE)
단백질 혼합물의 분석적인 분리는 12.5% 분리 및 3% 수집 겔을 갖는, 불연속적 소듐 도데실설페이트 폴리아크릴아미드 겔 전기영동(SDS-PAGE)에 의해 수행하였다(Laemmli, U. K., Nature, 227 (5259); 680-5, 1970; Fling, S. P. & Gregerson, D. S., Anal. Biochem., 155(1):83-8, 1986). 분리 겔에 대하여, 17.5mL 증류수를 10mL 분리 겔 버퍼(4x) 및 12.5mL 아크릴아미드(40%)와 혼합하고, 및 100μL 과황산암모늄(APS, 10%) 및 10μL 테트라-메틸에틸렌디아민(TEMED)에 의해 중합을 개시하였다. 수집 겔의 조성은 15mL 증류수, 20mL 수집 겔 버퍼(2x), 5mL 아크릴아미드(40%), 100μL APS 및 10μL TEMED로 구성된다. 적용 전에, 단백질을 변성시키기 위해, 단백질 샘플을 Laemmli 버퍼로 처리하고, 95℃에서 5분간 배양하였다. 다음으로, 이들을 겔 위에 적용하고, Roti® -Mark 스탠다드(14-212 kDa, Carl Roth, Karlsruhe)를 크기 표준으로 사용하였다. 겔당 30mA의 정전류에서 유동상으로서 Rotiphorese® SDS-PAGE(Carl Roth, Karlsruhe)를 갖는 전기영동 챔버(PEQLAB, Erlangen)내에서 전기영동을 실시하였다. 단백질 밴드를 염색하기 위해, Roti®-Blue 염료 용액(Carl Roth, Karlsruhe)을 제조사의 지시에 따라 사용하였다.
5.4 바이신코닌산 분석(BCA 분석)에 의한 단백질 농도 측정
PierceTM BCA 단백질 분석 키트(Thermo Scientific, Rockford, USA)에 의해 총 단백질 농도는 제조사의 지시에 따라 측정하였다. 단백질 표준으로서, 키트내에 함유된 소혈청 알부민(BSA)의 스탠다드를 사용하였다.
5.5 미세적정기 플레이트 광도계에서 효소 활성의 측정
250μL의 샘플 부피를 갖는 미세적정기 플레이트 광도계에서 30℃에서 효소활성 측정을 수행하였으며, NAD(P)H 농도 변화(ε 340 = 6.22mL μmol-1cm-1)를 λ=340nm의 파장에서 모니터링하였다. 여기에서, 직선으로 진행하는 반응의 부분에서 선형 회귀에 의해 활성들이 측정되었다. 이를 위해, 처리되는 샘플을 인산칼륨 버퍼(50mM, pH 8.0)에 의해 적당하게 희석하고, 기질 및 보조인자에 의해 처리하였다. 기질 및 보조인자의 최종 농도는 7β-HSDH에 대하여 10mM DHCA 및 100μM NADPH, 3α-HSDH에 대하여 10mM DHCA 및 100μM NADH, 및 GDH에 대하여 200mM 글루코스 및 1000μM NAD(P)였다.
모든 기질들 및 보조인자들은 인산칼륨 버퍼(50mM, pH 8.0)내에 용해되었다. 모든 측정은 3회 수행하였으며, 그후 평균값을 측정하였다. DHCA를 12-케토-UDCA로 다중-효소적 환원의 기계론적 모델링을 위한 인조 유닛들(AU)의 측정에서, 효소 활성 측정을 위한 프로토콜을 변경하였다. 여기에서, 반응 버퍼로서, 20%(v/v) 글리세린, 0.6%(w/v) BSA 및 0.006%(v/v) Antifoam 204(Sigma-Aldrich, Munich)가 혼합된 인산칼륨 버퍼(100mM, pH 7.0)를 사용하였다. 기질 및 보조인자의 농도는 3α-HSDH에 대하여 500μM DHCA 및 200μM NADH, 7β-HSDH에 대하여 500μM DHCA 및 200μM NADPH, 및 GDH에 대하여 200mM 글루코스 및 1000μM NAD이었다. 측정된 초기 소화 변화율이 GDH에 의해 0.0005~0.0020s-1의 범위 및 HSDH에 의해 0.00025~0.00100s-1의 범위내에 있는 희석율로 효소들을 사용하였다. 모든 측정은 8회 반복하여 수행하였으며, 그후 25% 절단된 평균 값이 측정되었다. 여기에서 AU는 상기 진술된 반응조건하에 1분내에 1μmol 기질 또는 보조인자의 전환을 촉매하는 활성 효소의 정량으로 정의된다.
6. 분석 방법들
6.1 세균 현탁액의 광학 밀도의 측정
λ=600nm의 파장에서 1cm 층 두께의 큐벳내에서 E. coli 현탁액의 광학 밀도를 큐벳 광도계에서 측정하였다. 세균 현탁액을 적당한 매질 또는 버퍼에 의해 임의로 희석하여, 측정된 소화율이 0.5를 초과하지 않았다.
6.2 세균 현탁액의 건조 바이오매스 농도의 측정
다르게 진술하지 않는 하, 건조 바이오매스 농도를 중량측정에 의해 측정하였다. 이를 위해, 1mL의 관련 세균 현탁액을 사전건조된 및 사전칭량된 1.5mL 반응용기내에 넣고, 그후 세포들을 13000rpm의 벤치 원심분리기에서 10분간 실온에서 펠릿화하고, 상층액을 폐기하였다. 그후, 용기들을 항량으로 건조시키고, 다시 칭량하였다. 그후, 건조 바이오매스 농도를 하기 식에 의해 계산할 수 있었다.
cX = (mfull -mempty)/V
상기 식중:
cX = 건조 바이오매스 농도, gBDM L-1
mfull = 건조후 샘플 물질로 채운 반응 용기의 질량, g
mempty = 건조후 빈 반응 용기의 질량, g
V = 침강전 세포 현탁액의 부피, L
6.3 보조인자 농도의 광도계 측정
NAD(P) 및 NADP(H)의 농도를 Lambert-Beer 법칙에 따라 큐벳 광도계에서 측광적으로 측정하였다. 이를 위해, 1cm의 층두께를 갖는 석영 큐벳(Hellma Analytics, Mulheim)을 사용하고, 이를 1mL 샘플로 채웠다. NAD(P) 농도의 측정을 λ = 259nm의 파장에서 수행하고, 몰량 흡광계수는 ε259nm = 16.9mL μmol-1 cm-1이었다. NAD(P)H의 농도를 λ = 340nm의 파장에서 측정하고, 여기에서 몰량 흡광계수는 ε340 nm = 6.22 mL μmol-1 cm-1이었다.
6.4 고성능 액체 크로마토그래피(HPLC)
담즙산염의 정성적 및 정량적 분석을 HPLC에 의한 물질들의 분리에 의해 실시하였다. 이를 위해, 타입 Hibar® 125-4 RP-18e(5㎛)(Merck, Darmstadt)의 역상 크로마토그래피 컬럼을 갖는 HPLC 시스템 Finnigan Surveyor Plus(Thermo Fischer Scientific, Waltham, USA)을 사용하였다. 유동상으로서, 수성 인산(pH 2.6) 및 아세토니트릴의 유동상 혼합물을 사용하고, 및 분리를 위해 유동상 구배를 사용하였다. 유동상의 유속은 1mL min-1이며, 및 각 경우 20μL의 샘플을 주사하였다. 답즙산염을 λ=200nm에서 UV 흡광에 의해 검출하였다. 방법은 표준 방법들에 의해 참조 물질들에 의해 보정하였다.
구배 프로필은 다음과 같았다:
0~3분: 35% (v/v)의 일정한 아세토니트릴 함량, 3~7분: 39% (v/v)의 아세토니트릴 함량에 있어서 선형 증가, 7~8분: 70% (v/v)의 아세토니트릴 함량에 있어서 선형 증가, 8~9.5분: 70% (v/v)의 일정한 아세토니트릴 함량, 9.5~10.5분: 35% (v/v)의 아세토니트릴 함량에 있어서 선형 감소, 10.5~14분: 35% (v/v)의 일정한 아세토니트릴 함량.
6.5 유동 세포계측법(FACS)
전세포 생체촉매들의 세포 보존을 조사하기 위해, 유동 세포계측법(형광-활성화 세포 분류, FACS)을 사용하였다. 이를 위해, 세포들을 PBS에 의해, 1mL s-1의 유속에서 1000 신호 s-1에 대응하는 약 109mL-1의 입자밀도로 희석하였다. 이들 세포들을 0.75mM의 염료 비스-(1,3-디부틸바비투르산)-트리메틴-옥소놀(Dibac4[3])에 의해 처리하고, 이는 편광된 세포막을 극복하고, 세포내 단백질 및 막에 결합함으로써 증가된 형광을 생성한다. 입자크기의 지표인 입자들의 광 산란에 대하여 Dibac4[3]-매개된 형광을 플롯팅함으로써, 세포 보존과 관련된 추론이 이끌어질 수 있었다(Suller, M. T.& Lloyd D., Cytometry, 35(3):235-41, 1999; Langemann et al., Bioeng. Bugs, 1(5):326-36, 2010).
6.6 DHCA를 12-케토-UDCA로 효소적 전환하는 것을 측정하는 표준화 시험 방법(IPC 방법)
a. 장비
장치: UV 검출기 및 오토샘플러에 의한 HPLC(Merck Hitachi, LaChrom Elite (고압 구배 시스템) 또는 대조가능);
컬럼: Merck, Purospher® STAR RP-18e, 125mm X 4.0mm, 5㎛, Art. #5I0 036; 또는 대조가능.
b. 구배 형성에 적당한 제제들
아세토니트릴 Merck LiChroSolv®
물 초순수
H3PO4 오르토인산 85.0%; Merck
메탄올 Merck LiChroSolv®
c. HPLC 파라미터들
유속 1.0ml/분
컬럼 온도 25℃
주입 용량 20μl
검출 UV 200nm
진행 시간 36.0분
세척 메탄올/물:9/1(v/v)
d. 용액 및 샘플들의 제조
유동상 A H2O(H3PO4(85%)에 의해 pH 2.6으로 조정됨)
유동상 B 아세토니트릴
블랭크 희석제:메탄올/물:9/1(v/v)
시스템 적합성 솔루션(System Suitability Solution, SST) 10.0ml 희석제내에서, 5.00mg DHCA, 5.00mg 12-케토-UDCA, 5.00mg 3,12-디케토-UDCA 및 5.00mg 7,12-디케토-CA(각각 정확하게 칭량함).
테스트 용액 9ml 희석제에 의해 희석한 1ml 반응 용액; 실온에서 초음파처리하고, 10분간 원심분리함.
e. 과정
분석 순서:
- 블랭크 1 x 주입
- 시스템 적합성 솔루션(SST) 1 x 주입
- 테스트 용액 2 x 주입
- 블랭크 1 x 주입
재생:
각 순서 후, 컬럼을 메탄올/물(4/6 내지 9/1(v/v))에 의해 재생한다.
그후, 컬럼을 아세토니트릴/물(4/6(v/v))로 세척한다.
f. 평가
SST 샘플의 분석으로부터 화합물의 보유 시간(Rt) 측정.
ㆍDHCA(추출물)
ㆍ12-케토-UDCA(생성물)
ㆍ3,12-디케토-UDCA(중간물질)
ㆍ7,12-디케토-CA(중간물질)
의 %면적 분석
보유 시간:
RT : 보유 시간
RRT : 상대 보유 시간
7. 데히드로콜린산의 입체선택적 환원
7.1 2mL 규모로 배치 환원
DHCA를 12-케토-UDCA로 다중효소적 환원의 기계론적 모델링을 위한 확인 실험으로서 2mL 규모의 배치 환원을 수행하였다. 이를 위해, 웰당 2.0mL의 명목 용량을 갖는 사각형 웰 구경 및 V-형태 바닥을 갖는 깊은 웰 플레이트들을 사용하였다. 전체 혼합을 위해, 실험실 셰이커 상에서 깊은 웰 플레이트를 500rpm에서 셰이킹하였다. 반드시 항온이 되도록 하기 위해, 전체 장치가 30℃로 온도-조절된 배양 캐비넷 내에 위치하였다. DHCA, NAD, NADP, 3α-HSDH, 7β-HSDH 및 GDH로 구성된, 반응 혼합물은 0.6%((w)/v) BSA의 첨가와 함께 인산칼륨버퍼(100mM, pH 7.0)내에 존재하였으며, 웰에 직접 넣었다. 글루코스 용액을 첨가함으로써 반응이 개시되었으며, 그후 깊은 웰 플레이트를 3배 도치하였다. 섹션 5.2에 따라 정제된 효소들을 사용하였다. 100μL의 반응 혼합물을 빼냄으로써 30분 간격으로 샘플링이 일어났으며, 이를 900μL의 메탄올(77%, v/v)에 의해 직접 처리하였다. 그후, 메탄올-처리된 샘플들을 보르텍싱에 의해 혼합하고, 실온에서 벤치 원심분리기에서 13000rpm으로 10분간 원심분리하였다. 그후, 상층액을 HPLC로 분석하였다. 모든 반응들은 3회 수행하였다.
7.2 20mL 규모로 배치 환원
20mL 규모에서 DHCA의 입체선택적 환원은 50mL의 명목용량, 41mm의 내부직경, 및 GL32 스크류-캡 실을 갖춘 목이 좁은 스크류-캡 병(DURAN Group, Wertheim/Main)내에서 실시하였다. 450rpm의 십자형 자석교반기에 의해 철저한 혼합이 제공되었으며, 이는 다중교반기 플레이트(Variomag Multipoint, Thermo Scientific, Waltham, USA)에 의해 구동되었다. 항온을 보장하기 위해, 온도-조절된 배양 캐비넷에 전체 장치를 위치시켰다. 반응 혼합물에 대하여, 기질 DHCA를 첫째로 균등몰량의 NaOH와 함께 사전용해하였다. DHCA, 보조기질(글루코스 또는 포르메이트), 및 임의의 추가 첨가제, 예컨대 NAD(P), 글리세린 및 MgCl2로 구성된 반응 혼합물을 반응시작하기 전에 함께 혼합하였다. 인산칼륨(50mM)을 버퍼로서 사용하고, pH를 필요에 따라 수산화나트륨 용액, 인산 또는 포름산(각 5M)에 의해 원하는 값으로 조정하였다. 전 세포 생체촉매를 첨가함으로써 반응을 개시하였다. 반응하는 동안, 수동 pH-측정기(pH-테스터 Checker®, Carl Roth, Karlsruhe)에 의해 30분 간격으로 pH를 측정하고, 필요에 따라 수산화나트륨 용액, 인산 또는 포름산(각 5M)에 의해 개시값으로 조정하였다. 반응 혼합물 300μL를 빼내고, 700μL 메탄올(≥99.9%)과 혼합함으로써, 샘플링을 30분 또는 60분 간격으로 수행하였다. 다음으로, 샘플-메탄올 혼합물을 3:10으로 70% 메탄올(v/v)에 의해 희석하고, 실온에서 벤치 원심분리기에서 13000rpm으로 10분간 원심분리하였다. 샘플을 상층액으로부터 취해서, 메탄올(70%, v/v)에 의해 1:10으로 희석하고, 시험관에 넣고, HPLC에 의해 분석하였다. 모든 반응들은 3회 수행하였다.
7.3 1L 규모로 배치 환원
1L 규모로 DHCA를 입체선택적 환원하는 것은 배플 없이, Infors AG(Infors 3, Bottmingen, Schweiz)제 1.5L 교반용기 반응기에서 수행하였다. 반응기는 온도와 pH에 대한 센서를 갖추었으며, 이들은 조절유닛 온라인으로부터 읽어낼 수 있었으며, 선택적으로 조절될 수 있었다. 조절 유닛에 연결된 이중 재킷을 통해 반응기를 온도-조절하고, 2개의 6-날 임펠러들에 의해 500~1000rpm에서 혼합을 실시하고, 반응기 커버 상에서 모터에 의해 구동하였다. 그리고, pH 조절을 위한 산(인산, 5M) 또는 염기(수산화나트륨, 5M)를 공급 펌프를 통해 반응기에 공급할 수 있었다. 기질 DHCA는 균등몰량 수산화나트륨 용액내에 사전용해되거나, 분말 형태의 유리 산으로서 직접 첨가되었다. 모든 다른 성분들은 또한, 고체로서 또는 스톡 용액으로서 첨가되었다. 적당한 용량으로 채우고, 원하는 pH를 설정한 후, 전세포 생체촉매를 가함으로써 반응을 개시하였다. 섹션 7.2에 설명된 바와 같이 30 또는 60분의 간격으로 샘플을 취했다.
7.4 산 침전에 의한 담즙산염의 분리
담즙산염의 분리는 산성 pH의 그들의 양성화된 형태의 담즙산염의 낮은 용해도에 기초하고 있다. 이를 위해, 교반된 상태의 용해된 담즙산염과의 혼합물을 염산(6M)에 의해 pH≤2.0으로 적상 적정한다. 그동안 용해된 담즙산염은 고체로 거의 침전되었다. 그후, 이를 여과지가 삽입된 Buchner 깔때기(직경 150mm, 보유범위 ≥4㎛)에 의해 잔류 용액으로부터 분리하였다. 필요하다면, 담즙산염을 초순수에 넣고, 수산화나트륨 용액(5M)에 의해 pH 8~9로 적정하면서 용해하여 세척할 수 있었으며, Buchner 깔때기에 의해 여과한 후, 다시 산 침전에 의해 분리하였다. 7,12-디케토-UDCA 및 12-케토-UDCA를 제조하기 위해, 2배 세척과정을 실시하였으며, 3,12-디케토-UDCA를 제조하기 위해, 세척 과정을 1회 실시하였다. 다음으로, 분리된 담즙산염을 60℃에서 항량으로 건조하였다.
8. 전 세포 촉매(3α-HSDH, 7β-HSDH 및 GDH 활성을 가짐)에 의해 디하이드로콜린산(DHCA)를 12-케토-우르소데옥시콜린산(12-케토-UDCA)로 전환하기 위한 표준화 시험과정
8.1 제제들
K2HPO4 * 3 H2O (≥ 99%, p.a.); Roth
KH2PO4 (결정성, puriss.); Merck
C6H12O6 * H2O (≥ 99.5%, Ph. Eur.); Roth
MgCl2 * 6 H2O (≥ 99%, p.a.); Roth
DHCA: PharmaZell
β-NAD: Roth
β-NADP-Na2: Merck,
전 세포 촉매(3α-HSDH, 7β-HSDH 및 GDH 활성을 가짐) -20℃에서 저장됨)
HCl (37%)
NaOH (10%)
8.2 버퍼 용액의 제조(스톡 용액)
버퍼 스톡 용액을 제조하기 위해, 인산수소이칼륨 삼수화물 2.54g 및 인산이수소칼륨 0.18g을 연속해서 칭량하고, 1000ml 탈이온수내에 용해하였다; 용액의 pH: 25℃에서 7.8.
8.3 NAD/NADP 용액의 제조(스톡 용액)
NAD/NADP 스톡 용액을 제조하기 위해, 158mg β-NADP-Na2 및 663mg β-NAD를 연속해서 1000ml 부피측정 플라스크로 칭량하고, 탈이온수에 의해 용량 이하로 제조되며, 용해되었다.
8.4 전 세포 촉매 샘플 제조(세포 현탁액)
세포 현탁액을 빼내기 전에, 샘플을 실온(RT)으로 데워야 한다. 약 30분 내지 약 3시간 데우기를 지속하였다.
8.5 반응 혼합물(DHCA를 12-케토-UDCA로 전 세포 전환)
180ml의 상기 버퍼 스톡 용액을 삼각 플라스크내에서 26~28℃로 미리 데웠다. 다음으로, 250ml내 3구 플라스크내 13.87g(0.07mol)의 α-D(+)-글루코스 모노하이드레이트를 미리 데워진 버퍼의 용량의 약 2/3와 용해하였다. 남은 버퍼와 함께 디하이드로콜린산(DHCA) 5.64g(0.014mol)을 글루코스 버퍼 용액내에 현탁하고, 수조 상에서 26~28℃로 데웠으며, 그동안 pH는 이미 감소하며, 6.8로 조정된다. 지연없이, 36mg(0.18mmol)의 염화마그네슘 육수화물, 10ml의 NAD/NADP 스톡 용액 및 5ml의 해동된 세포 현탁액을 현탁액에 연속해서 첨가한다.
반응 현탁액을 수조 상에서 8시간(26~28℃)동안 교반한다. pH-측정기 및 수동 pH 조절기(10% NaOH 용액에 의해 적정)를 사용하여, 현탁액의 pH는 항상 6.70 내지 6.90에 있어야 한다. pH-스태트(stat)를 임의 사용하여, pH는 항상 6.8에 있어야 한다.
8.6 HPLC 분석
0.5시간, 1시간, 1.5시간, 2시간, 2.5시간, 3시간, 4시간, 5시간, 6시간, 7시간 및 8시간 반응시간 후, 반응을 모니터링하기 위한 샘플들(1ml 용량)을 피펫에 의해 반응 현탁액으로부터 빼내고, HPLC에 의해 분석하였다(상기 IPC 방법을 참조).
이를 위해, 20ml 스냅-뚜껑 바이알내에서 메탄올/H2O(9:1; v/v)의 용매 혼합물 9ml에 의해 1ml 샘플용량을 희석하고 잘 혼합하였다. 스냅-뚜껑 바이알을 밀봉한다. HPLC 컬럼 상에 주입하기 전에, 탁하고 희석된 용액을 원심분리해야 한다. 그후, 맑은 상층액을 빼내고, 그로부터 주입용량을 추출한다.
적당한 반응시간, 예를 들면 7 내지 10시간, 예컨대 예를 들면 8시간 반응시간 후, 반응을 끝냈다. 이를 위해, 탁한 반응 용액을 약 4~5ml 농도의 HCl로 산성화(pH≤1.5)하고, 30분 더 교반하였다.
8.7 평가
반응 동역학의 측정:
반응 모니터링/반응 동역학은 (분석되지 않은) 개시 지점 "0시간"(DHCA에 대하여: 100% 영역, 다른 모든 분해물질에 대하여: 0% 영역) 및 예를 들면 11개의 추가 측정지점/HPLC 분석들(예를 들면, 0.5시간, 1시간, 1.5시간, 2시간, 2.5시간, 3시간, 4시간, 5시간, 6시간, 7시간 및 8시간 반응시간 후)로 이루어져 있다.
(시간 지점: x시간 반응시간)현재 샘플링내 분해물질의 조성물이 측정된다. 이를 위해, 분해물질 DHCA(추출물), 12-케토-UDCA(최종 생성물), 3,12-디케토-우르소데옥시콜린산(3,12-디케토-UDCA; 중간물질) 및 7,12-디케토-콜린산(7,12-디케토-CA; 중간물질)에 대한 HPLC-UV 크로마토그램에서 % 영역 데이터를 평가하고, 보고한다.
B. 전 세포 환원
실시예 B.1: 3개의 다른 전 세포 생체촉매들에 의한 DHCA의 2-단계 전 세포 환원(X=67).
전환을 위해, 생체촉매 균주들 E. coli BL49 p7(A)T3rG, E. coli BL21 ΔhdhA p7(A)T3rG-K 및 E. coli BL49 p7(A)T3TG를 사용하였다. 플라스미드들 p7(A)T3rG, p7(A)T3rG-K 및 p7(A)T3TG 각각은 유전자들 7β-HSDH, 3α-HSDH 및 GDH가 인코딩되는 발현 카세트를 가지지만, 발현 카세트 구조는 상이하며, 항생제 내성도 상이하다. 이러한 플라스미드들은 숙주 균주 E. coli BL49 또는 E. coli BL21 ΔhdhA(WO 2012/080504 및 출원인의 WO 2011/147957 모두로부터 알려져 있음)로 원하는대로 형질전환되었으며, 이들은 다른 녹아웃 균주들이며, 이들 각각은 게놈 7α-HSDH가 녹아웃되었다. 발현 플라스미드는 도 3에 도시되어 있다.
상기 생체촉매에 의해, 전환은 1L 규모로 수행되었다. 여기에서, 각 경우, 1gBDM L-1 생체촉매, 0.05mM NAD 및 0.01mM NADP가 사용되었으며, 따라서 3개의 제조물 모두에 대하여 X = 67이었다. 추가 전환 조건들은: 70mM DHCA, 350mM 글루코스, 10mM MgCl2, 50mM 인산칼륨 버퍼, pH 7 및 30℃이었다. 전환을 평가하는데 필수적인 것은 반응 혼합물내에서 형성된 생성물(12-케토-UDCA)의 분량이다. 기질 DHCA, 중간물질 3,12-디케토-UDCA 및 7,12-디케토-UDCA의 농도 및 반응 혼합물내 생성물 12-케토-UDCA의 농도는 고성능 액체 크로마토그래피(HPLC)에 의해 측정될 수 있다.
반응 과정들은 도 4에 도시되어 있다. 모든 제조물에 의해, 5~6시간후 > 99%의 전환율이 달성될 수 있었다. 따라서, 모든 세 효소들 7β-HSDH, 3α-HSDH 및 GDH가 발현되는 한, 다양한 전 세포 생체촉매 균주들에 대하여 식(formula)이 유효한 것이 분명하다.
실시예 B.2 3.5 g BDM  L -1 생체촉매 및 0.025 mM NAD에 의한 DHCA의 2-단계 전 세포 환원 (X = 147.5).
전환을 위해, 생체촉매 균주 E. coli BL49 p7(A)T3rG를 사용하였다. 여기에서, 3.5gBDM L-1 생체촉매, 0.025mM NAD 및 0의 NADP가 사용되었으므로, 이 제조를 위해 X = 147.5이었다. 추가 전환 조건들은: 70mM DHCA, 350mM 글루코스, 10mM MgCl2, 50mM 인산칼륨 버퍼, pH 7, 30℃ 및 20mL 반응 용량이었다.
반응 과정은 도 5에 도시되어 있다. 이 제조에 의해, 24시간후 > 99%의 전환율이 달성될 수 있다. 따라서, 이 접근법에 있어서 식이 유효하다. 그리고, NAD 및 NADP는 절대적으로 반드시 첨가되어야 하는 것은 아니지만, 물질들 중 하나를 첨가하면 충분할 수 있다는 것이 나타나 있다.
실시예 B.3 1.75g BDM  L -1 생체촉매, 0.025mM NAD 및 0.01mM NADP에 의한 DHCA의 2-단계 전 세포 환원(X = 89.5).
전환을 위해, 생체촉매 균주 E. coli BL49 p7(A)T3rG를 사용하였다. 여기에서, 1.75gBDM L-1 생체촉매, 0.025mM NAD 및 0.01mM NADP가 사용되었으므로, 이 접근법을 위해 X = 89.5이었다. 추가 전환 조건들은: 70mM DHCA, 350mM 글루코스, 10mM MgCl2, 50mM 인산칼륨 버퍼, pH 7, 30℃ 및 20mL 반응 용량이었다.
반응 과정은 도 6에 도시되어 있다. 이 접근법에 의하면, 24시간후 > 98%의 전환율이 달성될 수 있다. 따라서, 이 접근법에 있어서 식이 유효하다.
실시예 B.4 1g BDM  L -1 생체촉매, 0.04mM NAD 및 0.0075mM NADP에 의한 DHCA의 2-단계 전 세포 환원(X = 61).
전환을 위해, 생체촉매 균주 E. coli BL21 ΔhdhA p7(A)T3rG-K를 사용하였다. 여기에서, 1gBDM L-1 생체촉매, 0.04mM NAD 및 0.0075mM NADP가 사용되었으므로, 이 접근법을 위해 X = 61이었다. 추가 전환 조건들은: 70mM DHCA, 200mM 글루코스, 5mM MgCl2, 4%(v/v) 글리세린, 50mM 인산칼륨 버퍼, pH 7, 30℃ 및 20mL 반응 용량이었다.
반응 과정은 도 7에 도시되어 있다. 이 접근법에 의하면, 24시간후 > 99%의 전환율이 달성될 수 있다. 따라서, 이 접근법에 있어서 식이 유효하다.
실시예 B.5 전 세포 생체촉매 E. coli BLLiu p7(A)T3TG-K에 의한 DHCA의 2-단계 전 세포 환원
증가된 GDH-발현을 갖는 카나마이신-내성 전 세포 생체촉매 균주를 제조하였다. 여기에서, GDH 전에 발현 카세트로 추가의 T7 프로모터가 삽입되는 정도로 플라스미드 p7(A)T3rG-K를 변형시켰다. 얻어진 플라스미드는 일명 p7(A)T3TG-K를 갖고 있으며, 숙주 균주 E. coli BLLiu로 형질전환되었다. 얻은 전 세포 생체촉매는 일명 E. coli BLLiu p7(A)T3TG-K를 가진다.
a) 전 세포 생체 촉매 E. coli BLLiu p7(A)T3TG-K의 배양
균주 E. coli BLLiu p7(A)T3TG-K를 표준 프로토콜에 따른 교반된 반응용기내에서 배양하고, 성장 및 발현 행동과 관련하여, 관련 균주들과 비교하였다.
이를 위해, E. coli BLLiu p7(A)T3TG-K를 25℃의 발현 온도에서 교반된 반응용기내에서 표준 프로토콜에 따라 배양하였다. 수확시에 존재하는 세포 농도 및 효소 활성은 하기 표 3에 개시되어 있다. 원래의 카나마이신-내성 균주 E.coli BLLiu p7(A)T3rG-K에 대한 데이터 및, 증가된 GDH 활성을 갖는 암피실린-내성 균주 BL49 p7(A)T3TG에 대한 데이터가 이와 대조된다.
표로부터, 새로운 균주 E. coli BLLiu p7(A)T3TG-K가 각각 비교 균주들(2.4-2.7의 인자)보다 현저하게 높은 7β-HSDH 활성들을 가짐을 알 수 있다. 3α-HSDH 활성은 비교 균주들 중에서도 가장 높은 값의 수준이다. 한편, GDH 활성은 카나마이신-내성 균주 E. coli BLLiu p7(A)T3rG-K의 GDH 활성보다 4~10의 요소까지 높지만, 암피실린-내성 균주 BL49 p7(A)T3TG의 GDH 활성의 70%일 뿐이다. 수확시에 얻은 세포 농도는 비교 균주들에 의한 것보다 일관되게 더 높았다.
균주 E. coli BLLiu p7(A)T3TG-K를 균주들 E. coli BLLiu p7(A)T3rG-K 및 E. coli BL49 p7(A)T3TG와 성장 및 발현 데이터 비교
균주 BLLiu p7(A)T3rG-K BL49 p7(A)T3TG BLLiu p7(A)T3TG-K
T발현,℃ 20 25 30 20 25
OD, - 69 64 66 62 78
BDM, g L-1 33 34 37 37 40
7β-HSDH, U gBDM -1 565 509 556 490 1360
3α-HSDH, U gBDM -1 111 135 74 70 135
GDH, U gBDM -1 343 184 127 1900 1300
b) 전 세포 생체촉매 E. coli BLLiu p7(A)T3TG-K의 생체내 변환
교반용기 생물반응기내에서 배양된 새로운 균주 E. coli BLLiu p7(A)T3TG-K를 전 세포 생체촉매작용 성능과 관련하여 조사하였다.
전 세포 생체촉매작용 성능을 평가하기 위해, 두 세포들 모두 -20℃에서 저장하고, 실온 및 4℃에서 저장한 것을 사용하였다. 이전 균주들과 비교하면, 실온에서 1일간 저장을 지속한 이 균주에 의하여 세포들의 전체 활성을 얻기에는 충분하지 않았다. 이때문에, 실온에서 1일 저장 및 4℃에서 3일 저장한 후, 균주는 실온에서 3일간 다시 저장했으며, 그후 생체내 변환을 위해 사용하였다.
전 세포 생체내 변환을 위한 반응 조건들은: 70mM DHCA, 350mM 글루코스, OD 2 세포들, 50μM NAD, 10μM NADP, 1mM MgCl2, 50mM KPi 버퍼(pH 7.0) 및 30℃이었다. 그리고, 실온 세포들에서 저장한 세포들에 의해, 100μM의 두배가 된 NAD 농도에 의해 실험이 수행되었다. NaOH 용액(5M)에 의해 30분마다 개시 값으로 pH를 수동조정하였다. 생체내 변환 과정들은 도 11에 도시되어 있다.
생체내 변환을 표준 NAD 농도(50μM)와 비교할때, 반응은 4시간(-20℃에서 저장한 세포에 의함) 및 4.5시간(RT/4℃에서 저장된 세포에 의함) 후 완료되었다. 따라서, 생체내 변환의 지속은 다른 생체촉매 균주들에 의해 달성되었던 시간들(4.5시간~6시간)의 범위내 또는 약간 이하로 지속되었다. 그러나, 고르지 않은 부상물 형성은 분명하다. 두 제조시에, 7β-HSDH의 중간 생성물(3,12-디케토-UDCA)은 3α-HSDH의 중간 생성물보다 약간 강하게 축적한다. 이는 다른 전 세포 생체촉매 균주들과 비교하여, 상기 균주의 현저하게 증가된 7β-HSDH 활성에 기여할 수 있다. NAD 농도- 및 3α-HSDH 전환을 위한 보조인자 농도-가 증가된다면, 그후 이는 2개의 HSDH의 반응속도를 균등화하며, 이는 2개의 중간생성물의 균등한 형성과 구별된다. 또한, 생체내 변환의 지속은 4.5시간에서 4.0시간으로 감소한다.
C. 7β-HSDH 변이체들
실시예 C.1: NADH 특이성을 갖는 7β-HSDH 변이체들의 제조
여기에서, 단백질 공학에 의해 제조되고, 보조인자로서 NADPH 대신에 NADH를 수용하는, 콜린셀라 아에로파시엔스로부터 7β-HSDH의 효소 변이체들이 설명되어 있다.
본 발명에 따른 7β-HSDH 변이체들은 위치들 39, 40, 41 및/또는 44에서 그들의 아미노산 서열에서 천연 효소의 공개된 서열과 상이하며, 위치 40, 41 및 44에서 공지된 7β-HSDH 변이체들과 상이하다.
변이체 7β-HSDH는 야생형 서열과 비교되는 아미노산 치환체 G39D R40F를 함유하며, 변이체 7β-HSDH DFK는 야생형 서열과 비교되는 아미노산 치환체 G39D R40F R41K를 함유하며, 및 변이체 7β-HSDH DFKG는 야생형 서열과 비교되는 아미노산 치환체들 G39D R40F R41K K44G를 함유한다(도 8 참조).
C.1.2 NADH-의존성 단일 변이체 G39D의 제조
7β-HSDH의 G39D 변이체를 WO 2012/080504에 설명된 바와 같이 제조하였다. N-말단 His 태그에 의해 단백질을 발현하고, IMAC에 의해 정제하였다. 첫번째 활성 분석은 매우 약간의 NADPH 활성만 나타냈다(10mM DHCA, 0.5mM NADPH 및 pH 8.0에 의해 0.040±0.005U mg-1). 한편, 뚜렷한 NADH 활성이 관찰될 수 있었다.
C.1.3 NADH-의존성 7β-HSDH의 유도 진화
a) 변이체 라이브러리를 위한 숙주 균주의 제조
반복적 포화 돌연변이생성의 원칙에 따라 추가의 돌연변이생성이 실시되었다(Reetz et al., Mol. Biosyst., 5(2):115-22, 2009). 이를 위해, 변이체 라이브러리를 제조하기 위해, 높은 형질전환 효율을 갖고, 동시에 세포 분해물에 의해 스크리닝하기에 매우 적합한 E. coli 숙주 균주가 필요하다. E.coli는 스크리닝에서 부반응을 촉매하여, 측정 데이터를 위조할 수 있는 7β-HSDH를 게놈적으로 인코딩되기 때문에, 이 유전자가 사일런싱되는 숙주 균주로 사용되어야 한다. 그러나, 2개의 기존의 녹아웃 균주들 BL49 및 BLLiu는 모두 낮은 형질전환 효율을 갖는 E. coli-BL21(DE3) 유도체들이다. 따라서, 게놈 7α-HSDH가 사일런싱된 적당한 숙주 균주를 첫번째로 제조할 필요가 있었다.
녹아웃을 위한 개시 균주로서, 높은 형질전환 효율을 갖는 K-12 유도체인, E. coli NovaBlue(DE3)가 선택되었다. 이와 동시에, DE3은 T7 발현 시스템을 갖는 외부 단백질의 발현을 가능하게 하며, 이를 통해 E. coli DH5α와 구별된다. 7α-HSDH에 대한 유전자의 성공적인 사일런싱 및 녹아웃 플라스미드의 차후 분비는 적당한 선택 항생제 상에서의 배양, PCR 및 시퀀싱에 의해 확인되었다. 이 균주는 일명 E. coli NB13을 포함한다.
b) 변이되는 위치들의 선택
NADPH-결합 SDR(단쇄 탈수소효소 환원효소)에서 보존영역들은 주로 보조인자-결합 포켓내에 염기성 아미노산 잔기들을 포함하며, 이는 NADP(H)의 아데노신 리보스 상의 2'-포스페이트 기와의 산-염기 상호작용에 의한 NADP(H) 결합을 안정화한다(Carugo, O. & Argos, P., Proteins, 28(1):10-28, , 1997a + Proteins, 28(1): 29-40, 1997b; Woodyer et al., Biochemistry, 42(40):11604-14, 2003). 무엇보다도, 위치 39에 인접한 위치 40이 고려되며, 일반적으로 아르기닌 또는 리신은 NADPH-결합 SDR내에 자리잡고 있다(Bellamacina, C. R., FASEB J., 10(11):1257-69, 1996; Kallberg et al., Eur. J. Biochem., 269(18):4409-4417, 2002; Persson, B., Chem. Biol. Interact., 143-144:271-278, 2003).
R40을 갖는, 7β-HSDH에서, 염기성 아미노산은 또한, G39에 인접한 위치에 존재한다. 그리고, R41 및 K44에 의해, 2개의 추가 염기성 아미노산들은 결합 포켓에 바로 근접하여 확인되었다. 이러한 3개의 위치들은 반복적 포화 돌연변이생성을 위한 타겟 위치로서 정의되었다.
c) 유도 진화의 구현
사용된 프라이머들:
이 프라이머는 동의코돈을 함유하며, 그래서 G와 다른 아미노산들은 위치 44에서 일어날 수도 있다.
유도 진화는 3개의 돌연변이생성 라운드들로 수행되었으며, 이들 각각에서 한 위치가 변이되었다. 스크리닝에서 가장 높은 NADH 활성을 나타낸 각 라운드의 변이체는 돌연변이를 확인하기 위해 시퀀싱되었으며, 다음 라운드에서 개시 변이체로 제공되었다. 돌연변이 생성은 첫번째로 위치 R40에서 7β-HSDH G39D(D)로부터 개시하여 실시되었다. 이 중 최상의 변이체는 7β-HSDH G39D R40F(DF)이었다. 다음으로, 위치 R41에서의 돌연변이 생성이 실시되었으며, 7β-HSDH G39D R40F R41K (DFK)가 최상의 변이체이며, 및 최종적으로 위치 K44에서, 7β-HSDH G39D R40F R41K K44G (DFKG)가 최상의 변이체였다.
실시예 C.2: NADH 특이성을 갖는 7β-HSDH 변이체들의 효소 동역학 연구
효소 동역학 연구들에 의해, 상기 생성된 변이체들을 평가하였다. DHCA 동역학을 연구하기 위해, 보조인자로서 0.5mM NADH를 사용하였으며(도 9), NADH 동역학을 연구하는 동안, 10mM DHCA를 기질로서 사용하였다(도 10). DHCA 동역학의 플롯으로부터, Michaelis-Menten 동역학의 특징적인 곡선 형태는 7β-HSDH 변이체들에 대하여 식별될 수 있으며, 어떤 기질 저해도 관찰되지 않았다. 따라서, 전통적인 Michaelis-Menten 모델(식 1)은 동역학 변수들을 평가하기 위해 사용되었다. 한편, NADH 동역학은 선형 과정을 나타내고, 보조인자 농도에 있어서 포화를 가리키지 않았으며, 따라서 이에 대하여 어떤 동역학 변수들이 측정될 수 없었다.
식 1: Michaelis-Menten 식.
EAX: 특이적 효소 활성, U mg-1= μmol min -1 mg-1
v max : 최대 특이적 효소 활성,
U mg-1= μmol min -1 mg-1
c s : 기질 또는 보조인자 농도, mol L-1
K m : 반-포화 농도, mol L-1
새로운 7β-HSDH 변이체들에 대하여 측정된 동역학 변수들은 표 4에 개시되어 있으며, 이 표는 이전에 보고된 변이체들 G39D 및 G39D R40I에 대한 비교값들을 추가로 포함한다. 각각 5.91 ± 0.23U mg-1 및 5.72 ± 0.19U mg-1 을 갖는 새로운 변이체들 7β-HSDH DFK 및 7β-HSDH DFKG는 이전에 최고의 활성 변이체 G39D R40I보다 23~27%까지 높은 최대의 특이적 효소활성을 나타낸다.
보조인자로서 NADH를 갖는 새로운 7β-HSDH 변이체들 DF, DFK 및 DFKG의 효소 동역학 변수들. 참고로, 이전에 제조된 변이체들 G39D 및 G39D R40I가 개시된다.
K m, DHCA , μM v max , U mg -1
G39D 660 ± 120 2.90 ± 0.16
G39D R40I 920 ± 170 4.64 ± 0.27
DF 420 ± 60 3.70 ± 0.13
DFK 290 ± 50 5.91 ± 0.23
DFKG 380 ± 50 5.72 ± 0.19
실시예 C.3: NADH-의존성 7β-HSDH 변이체들에 의한 단일-단계 생체내 변환
NADH-의존성 7β-HSDHs와 비교하기 위해, 50mM DHCA를 3,12-디케토-UDCA로 2mL 규모로 단일-단계 생체내 변환하는 것은 3회 반복하여 수행하였다.
여기에서, 정제된 효소들이 사용되었으며, 보조인자로서 NAD만 첨가되었다. 보조인자 재생을 위해, GDH를 사용하였다. 연구된 7β-HSDH(야생형(WT) 및 변이체들: D, DF, DFK 및 DKFG) 중, 각 경우에 0.2mg mL-1의 효소가 사용되었다. 다른 반응조건들은: 10U mL-1 GDH, 0.5mM NAD, 50mM DHCA, 200mM 글루코스, 500mM 인산칼륨 및 pH 8.0이었다. 반응은 강한 버퍼 시스템에서 pH 조절없이, 배치 과정으로서 30℃에서 셰이킹된 깊은 웰 플레이트내에서 3회 반복하여 수행되었다.
생체내 변환의 결과들은 도 12에 도시되어 있다. 모든 NADH-의존성 변이체들에 의하면, 야생형 효소보다 많은 3,12-디케토-UDCA가 형성될 수 있었다. 변이체 DFKG에 의하면, 16시간후 DHCA가 3,12-디케토-UDCA로 완전하게 전환될 수 있었다.
실시예 C.4 NADH-의존성 7β-HSDH 변이체들에 의한 2-단계 생체내 변환
더욱이, NADH-의존성 7β-HSDH 변이체들 DFK 및 DFKG에 의해, 50mM DHCA를 12-케토-UDCA로 2mL 규모로 2-단계 생체내 변환이 3회 반복하여 수행되었다.
여기에서, 정제된 효소들이 사용되었으며, 보조인자로서 NAD만 첨가되었다. 보조인자 재생을 위해, 7β-HSDH 뿐만 아니라, 코모모나스 테스토스테로니(Comomonas testosteroni)로부터의 3α-HSDH 및 GDH를 사용하였다. 연구된 7β-HSDH 변이체들 중, 각 경우에 0.2mg mL-1의 효소가 사용되었다. 다른 반응조건들은: 10U mL-1 3α-HSDH, 10U mL-1 GDH, 0.5mM NAD, 50mM DHCA, 200mM 글루코스, 500mM 인산칼륨 및 pH 8.0이었다. 반응은 강한 버퍼 시스템에서 pH 조절없이, 배치 과정으로서 30℃에서 셰이킹된 깊은 웰 플레이트내에서 3회 반복하여 수행되었다.
각 제조물들의 반응 곡선들은 도 13에 도시되어 있다. 모든 7β-HSDH 변이체들에 의하면, NADP 첨가 없이 DHCA가 12-디케토-UDCA로 완전하게 전환될 수 있었다.
서열번호의 배치
서열번호 설명 타입
1 7β-HSDH (C. aerofaciens) NS
2 7β-HSDH(C. aerofaciens) AS
3 3α-HSDH (C. testosteroni) NS
4 3α-HSDH (C. testosteroni) AS
5 7β-HSDH NS
6 7β-HSDH AS
7 GDH, (B. subtilis) NS
8 GDH (B. subtilis) AS
9 7β-HSDH G39D AS
10 7β-HSDH G39D R40I AS
11 7β-HSDH G39D R40F AS
12 7β-HSDH G39D R40F R41K AS
13 7β-HSDH G39D R40F R41K K44G AS
14 PCR 프라이머 NS
15 PCR 프라이머 NS
16 PCR 프라이머 NS
17 PCR 프라이머 NS
18 플라스미드 p7(A)T3rG-A NS
19 플라스미드 p7(A)T3rG-K NS
20 플라스미드 p7(A)T3TG-A NS
21 플라스미드 p7(A)T3TG-K NS
AS = 아미노산 서열
NS = 핵산 서열
본원에 언급된 공보들의 내용들을 분명하게 참조한다.
SEQUENCE LISTING <110> PharmaZell GmbH <120> Neuartige Ganzzellreduktion von Dehydrochols?re und Neuartige 7?Hydroxysteroiddehydrogenase-Mutanten und deren Verwendung <130> M/54141 <160> 21 <170> PatentIn version 3.5 <210> 1 <211> 792 <212> DNA <213> Collinsella aerofaciens <220> <221> CDS <222> (1)..(792) <400> 1 atg aac ctg agg gag aag tac ggt gag tgg ggc ctg atc ctg ggc gcg 48 Met Asn Leu Arg Glu Lys Tyr Gly Glu Trp Gly Leu Ile Leu Gly Ala 1 5 10 15 acc gag ggc gtc ggc aag gcg ttc tgc gag aag atc gcc gcc ggc ggc 96 Thr Glu Gly Val Gly Lys Ala Phe Cys Glu Lys Ile Ala Ala Gly Gly 20 25 30 atg aac gtc gtc atg gtc ggc cgt cgc gag gag aag ctg aac gtg ctc 144 Met Asn Val Val Met Val Gly Arg Arg Glu Glu Lys Leu Asn Val Leu 35 40 45 gca ggc gag atc cgc gag acc tac ggc gtg gag acc aag gtc gtg cgc 192 Ala Gly Glu Ile Arg Glu Thr Tyr Gly Val Glu Thr Lys Val Val Arg 50 55 60 gcc gac ttt agc cag ccc ggc gct gcc gag acc gtc ttc gcc gcg acc 240 Ala Asp Phe Ser Gln Pro Gly Ala Ala Glu Thr Val Phe Ala Ala Thr 65 70 75 80 gag ggc ctg gac atg ggc ttc atg agc tac gtg gcc tgc ctg cac agc 288 Glu Gly Leu Asp Met Gly Phe Met Ser Tyr Val Ala Cys Leu His Ser 85 90 95 ttc ggt aag atc cag gac acc ccc tgg gag aag cac gag gcc atg atc 336 Phe Gly Lys Ile Gln Asp Thr Pro Trp Glu Lys His Glu Ala Met Ile 100 105 110 aac gtc aac gtc gtg acc ttc ctc aag tgc ttc cac cac tac atg cgg 384 Asn Val Asn Val Val Thr Phe Leu Lys Cys Phe His His Tyr Met Arg 115 120 125 atc ttt gcc gcc cag gac cgc ggc gcc gtg atc aac gtc tcg tcg atg 432 Ile Phe Ala Ala Gln Asp Arg Gly Ala Val Ile Asn Val Ser Ser Met 130 135 140 acc ggc atc agc tcc agc ccc tgg aac ggc cag tac ggc gcg ggc aag 480 Thr Gly Ile Ser Ser Ser Pro Trp Asn Gly Gln Tyr Gly Ala Gly Lys 145 150 155 160 gcc ttc atc ctc aag atg acc gag gcc gtg gcc tgc gag tgc gag ggc 528 Ala Phe Ile Leu Lys Met Thr Glu Ala Val Ala Cys Glu Cys Glu Gly 165 170 175 acc ggc gtc gac gtc gag gtc atc acc ctc ggc acc acc cta acc ccc 576 Thr Gly Val Asp Val Glu Val Ile Thr Leu Gly Thr Thr Leu Thr Pro 180 185 190 agc ctg ctg tcc aac ctc ccc ggc ggc ccg cag ggc gag gcc gtc atg 624 Ser Leu Leu Ser Asn Leu Pro Gly Gly Pro Gln Gly Glu Ala Val Met 195 200 205 aag atc gcc ctc acc ccc gag gag tgc gtt gac gag gcc ttt gag aag 672 Lys Ile Ala Leu Thr Pro Glu Glu Cys Val Asp Glu Ala Phe Glu Lys 210 215 220 ctg ggt aag gag ctc tcc gtc atc gcc ggc cag cgc aac aag gac tcc 720 Leu Gly Lys Glu Leu Ser Val Ile Ala Gly Gln Arg Asn Lys Asp Ser 225 230 235 240 gtc cac gac tgg aag gca aac cac acc gag gac gag tac atc cgc tac 768 Val His Asp Trp Lys Ala Asn His Thr Glu Asp Glu Tyr Ile Arg Tyr 245 250 255 atg ggg tcg ttc tac cgc gac tag 792 Met Gly Ser Phe Tyr Arg Asp 260 <210> 2 <211> 263 <212> PRT <213> Collinsella aerofaciens <400> 2 Met Asn Leu Arg Glu Lys Tyr Gly Glu Trp Gly Leu Ile Leu Gly Ala 1 5 10 15 Thr Glu Gly Val Gly Lys Ala Phe Cys Glu Lys Ile Ala Ala Gly Gly 20 25 30 Met Asn Val Val Met Val Gly Arg Arg Glu Glu Lys Leu Asn Val Leu 35 40 45 Ala Gly Glu Ile Arg Glu Thr Tyr Gly Val Glu Thr Lys Val Val Arg 50 55 60 Ala Asp Phe Ser Gln Pro Gly Ala Ala Glu Thr Val Phe Ala Ala Thr 65 70 75 80 Glu Gly Leu Asp Met Gly Phe Met Ser Tyr Val Ala Cys Leu His Ser 85 90 95 Phe Gly Lys Ile Gln Asp Thr Pro Trp Glu Lys His Glu Ala Met Ile 100 105 110 Asn Val Asn Val Val Thr Phe Leu Lys Cys Phe His His Tyr Met Arg 115 120 125 Ile Phe Ala Ala Gln Asp Arg Gly Ala Val Ile Asn Val Ser Ser Met 130 135 140 Thr Gly Ile Ser Ser Ser Pro Trp Asn Gly Gln Tyr Gly Ala Gly Lys 145 150 155 160 Ala Phe Ile Leu Lys Met Thr Glu Ala Val Ala Cys Glu Cys Glu Gly 165 170 175 Thr Gly Val Asp Val Glu Val Ile Thr Leu Gly Thr Thr Leu Thr Pro 180 185 190 Ser Leu Leu Ser Asn Leu Pro Gly Gly Pro Gln Gly Glu Ala Val Met 195 200 205 Lys Ile Ala Leu Thr Pro Glu Glu Cys Val Asp Glu Ala Phe Glu Lys 210 215 220 Leu Gly Lys Glu Leu Ser Val Ile Ala Gly Gln Arg Asn Lys Asp Ser 225 230 235 240 Val His Asp Trp Lys Ala Asn His Thr Glu Asp Glu Tyr Ile Arg Tyr 245 250 255 Met Gly Ser Phe Tyr Arg Asp 260 <210> 3 <211> 774 <212> DNA <213> Comamonas testosteroni <220> <221> CDS <222> (1)..(774) <400> 3 atg tcc atc atc gtg ata agc ggc tgc gcc acc ggc att ggt gcc gct 48 Met Ser Ile Ile Val Ile Ser Gly Cys Ala Thr Gly Ile Gly Ala Ala 1 5 10 15 acg cgc aag gtc ctg gag gcg gcc ggt cac cag atc gta ggc atc gat 96 Thr Arg Lys Val Leu Glu Ala Ala Gly His Gln Ile Val Gly Ile Asp 20 25 30 ata cgc gat gcg gaa gtg att gcc gat ctc tcg acg gcc gaa ggt cga 144 Ile Arg Asp Ala Glu Val Ile Ala Asp Leu Ser Thr Ala Glu Gly Arg 35 40 45 aag cag gcg att gcc gat gta ctg gcg aag tgc agc aag ggc atg gac 192 Lys Gln Ala Ile Ala Asp Val Leu Ala Lys Cys Ser Lys Gly Met Asp 50 55 60 ggc ctg gtg ctg tgc gcc ggc ctg gga ccg cag acc aag gtg ctt ggc 240 Gly Leu Val Leu Cys Ala Gly Leu Gly Pro Gln Thr Lys Val Leu Gly 65 70 75 80 aat gtg gtt tcg gtc aat tat ttt ggc gcg acc gag ctg atg gat gcc 288 Asn Val Val Ser Val Asn Tyr Phe Gly Ala Thr Glu Leu Met Asp Ala 85 90 95 ttt ttg cca gcg ctg aaa aaa ggc cat cag ccc gca gcc gtc gtc atc 336 Phe Leu Pro Ala Leu Lys Lys Gly His Gln Pro Ala Ala Val Val Ile 100 105 110 tcg tcc gtg gct tcc gcg cat ctg gct ttt gac aag aac cca ctg gcg 384 Ser Ser Val Ala Ser Ala His Leu Ala Phe Asp Lys Asn Pro Leu Ala 115 120 125 ctg gca ctg gaa gcc ggc gag gaa gcc aag gcc cgc gcc att gtc gaa 432 Leu Ala Leu Glu Ala Gly Glu Glu Ala Lys Ala Arg Ala Ile Val Glu 130 135 140 cat gcg gga gag cag ggc gga aat ctg gcc tat gcg ggc agc aag aat 480 His Ala Gly Glu Gln Gly Gly Asn Leu Ala Tyr Ala Gly Ser Lys Asn 145 150 155 160 gct ttg acg gtg gct gtg cgc aaa cgc gcc gcc gcc tgg ggc gag gct 528 Ala Leu Thr Val Ala Val Arg Lys Arg Ala Ala Ala Trp Gly Glu Ala 165 170 175 ggc gtg cgc ctg aac acc atc gcc ccc ggt gca acc gag act ccc ttg 576 Gly Val Arg Leu Asn Thr Ile Ala Pro Gly Ala Thr Glu Thr Pro Leu 180 185 190 ctg cag gcg ggc ctg cag gac ccg cgc tat ggc gaa tcc att gcc aag 624 Leu Gln Ala Gly Leu Gln Asp Pro Arg Tyr Gly Glu Ser Ile Ala Lys 195 200 205 ttc gtt cct ccc atg ggc cgc cgt gcc gag ccg tcc gag atg gcg tcg 672 Phe Val Pro Pro Met Gly Arg Arg Ala Glu Pro Ser Glu Met Ala Ser 210 215 220 gtc atc gcc ttt ttg atg agc ccg gcc gca agc tat gtg cat ggc gcg 720 Val Ile Ala Phe Leu Met Ser Pro Ala Ala Ser Tyr Val His Gly Ala 225 230 235 240 cag atc gtc att gat ggc ggc att gat gcg gtg atg cgc ccg aca cag 768 Gln Ile Val Ile Asp Gly Gly Ile Asp Ala Val Met Arg Pro Thr Gln 245 250 255 ttc tga 774 Phe <210> 4 <211> 257 <212> PRT <213> Comamonas testosteroni <400> 4 Met Ser Ile Ile Val Ile Ser Gly Cys Ala Thr Gly Ile Gly Ala Ala 1 5 10 15 Thr Arg Lys Val Leu Glu Ala Ala Gly His Gln Ile Val Gly Ile Asp 20 25 30 Ile Arg Asp Ala Glu Val Ile Ala Asp Leu Ser Thr Ala Glu Gly Arg 35 40 45 Lys Gln Ala Ile Ala Asp Val Leu Ala Lys Cys Ser Lys Gly Met Asp 50 55 60 Gly Leu Val Leu Cys Ala Gly Leu Gly Pro Gln Thr Lys Val Leu Gly 65 70 75 80 Asn Val Val Ser Val Asn Tyr Phe Gly Ala Thr Glu Leu Met Asp Ala 85 90 95 Phe Leu Pro Ala Leu Lys Lys Gly His Gln Pro Ala Ala Val Val Ile 100 105 110 Ser Ser Val Ala Ser Ala His Leu Ala Phe Asp Lys Asn Pro Leu Ala 115 120 125 Leu Ala Leu Glu Ala Gly Glu Glu Ala Lys Ala Arg Ala Ile Val Glu 130 135 140 His Ala Gly Glu Gln Gly Gly Asn Leu Ala Tyr Ala Gly Ser Lys Asn 145 150 155 160 Ala Leu Thr Val Ala Val Arg Lys Arg Ala Ala Ala Trp Gly Glu Ala 165 170 175 Gly Val Arg Leu Asn Thr Ile Ala Pro Gly Ala Thr Glu Thr Pro Leu 180 185 190 Leu Gln Ala Gly Leu Gln Asp Pro Arg Tyr Gly Glu Ser Ile Ala Lys 195 200 205 Phe Val Pro Pro Met Gly Arg Arg Ala Glu Pro Ser Glu Met Ala Ser 210 215 220 Val Ile Ala Phe Leu Met Ser Pro Ala Ala Ser Tyr Val His Gly Ala 225 230 235 240 Gln Ile Val Ile Asp Gly Gly Ile Asp Ala Val Met Arg Pro Thr Gln 245 250 255 Phe <210> 5 <211> 768 <212> DNA <213> Escherichia coli <220> <221> CDS <222> (1)..(768) <400> 5 gtg ttt aat tct gac aac ctg aga ctc gac gga aaa tgc gcc atc atc 48 Val Phe Asn Ser Asp Asn Leu Arg Leu Asp Gly Lys Cys Ala Ile Ile 1 5 10 15 aca ggt gcg ggt gca ggt att ggt aaa gaa atc gcc att aca ttc gcg 96 Thr Gly Ala Gly Ala Gly Ile Gly Lys Glu Ile Ala Ile Thr Phe Ala 20 25 30 aca gct ggc gca tct gtg gtg gtc agt gat att aac gcc gac gca gct 144 Thr Ala Gly Ala Ser Val Val Val Ser Asp Ile Asn Ala Asp Ala Ala 35 40 45 aac cat gtt gta gac gaa att caa caa ctg ggt ggt cag gca ttt gcc 192 Asn His Val Val Asp Glu Ile Gln Gln Leu Gly Gly Gln Ala Phe Ala 50 55 60 tgc cgt tgt gat att act tcc gaa cag gaa ctc tct gca ctg gca gac 240 Cys Arg Cys Asp Ile Thr Ser Glu Gln Glu Leu Ser Ala Leu Ala Asp 65 70 75 80 ttt gct atc agt aag ctg ggt aaa gtt gat att ctg gtt aac aac gcc 288 Phe Ala Ile Ser Lys Leu Gly Lys Val Asp Ile Leu Val Asn Asn Ala 85 90 95 ggt ggc ggt gga cct aaa ccg ttt gat atg cca atg gcg gat ttt cgc 336 Gly Gly Gly Gly Pro Lys Pro Phe Asp Met Pro Met Ala Asp Phe Arg 100 105 110 cgt gct tat gaa ctg aat gtg ttt tct ttt ttc cat ctg tca caa ctt 384 Arg Ala Tyr Glu Leu Asn Val Phe Ser Phe Phe His Leu Ser Gln Leu 115 120 125 gtt gcg cca gaa atg gaa aaa aat ggc ggt ggc gtt att ctg acc atc 432 Val Ala Pro Glu Met Glu Lys Asn Gly Gly Gly Val Ile Leu Thr Ile 130 135 140 act tct atg gcg gca gaa aat aaa aat ata aac atg act tcc tat gca 480 Thr Ser Met Ala Ala Glu Asn Lys Asn Ile Asn Met Thr Ser Tyr Ala 145 150 155 160 tca tct aaa gct gcg gcc agt cat ctg gtc aga aat atg gcg ttt gac 528 Ser Ser Lys Ala Ala Ala Ser His Leu Val Arg Asn Met Ala Phe Asp 165 170 175 cta ggt gaa aaa aat att cgg gta aat ggc att gcg ccg ggg gca ata 576 Leu Gly Glu Lys Asn Ile Arg Val Asn Gly Ile Ala Pro Gly Ala Ile 180 185 190 tta acc gat gcc ctg aaa tcc gtt att aca cca gaa att gaa caa aaa 624 Leu Thr Asp Ala Leu Lys Ser Val Ile Thr Pro Glu Ile Glu Gln Lys 195 200 205 atg tta cag cac acg ccg atc aga cgt ctg ggc caa ccg caa gat att 672 Met Leu Gln His Thr Pro Ile Arg Arg Leu Gly Gln Pro Gln Asp Ile 210 215 220 gct aac gca gcg ctg ttc ctt tgc tcg cct gct gcg agc tgg gta agc 720 Ala Asn Ala Ala Leu Phe Leu Cys Ser Pro Ala Ala Ser Trp Val Ser 225 230 235 240 gga caa att ctc acc gtc tcc ggt ggt ggg gta cag gag ctc aat taa 768 Gly Gln Ile Leu Thr Val Ser Gly Gly Gly Val Gln Glu Leu Asn 245 250 255 <210> 6 <211> 255 <212> PRT <213> Escherichia coli <400> 6 Val Phe Asn Ser Asp Asn Leu Arg Leu Asp Gly Lys Cys Ala Ile Ile 1 5 10 15 Thr Gly Ala Gly Ala Gly Ile Gly Lys Glu Ile Ala Ile Thr Phe Ala 20 25 30 Thr Ala Gly Ala Ser Val Val Val Ser Asp Ile Asn Ala Asp Ala Ala 35 40 45 Asn His Val Val Asp Glu Ile Gln Gln Leu Gly Gly Gln Ala Phe Ala 50 55 60 Cys Arg Cys Asp Ile Thr Ser Glu Gln Glu Leu Ser Ala Leu Ala Asp 65 70 75 80 Phe Ala Ile Ser Lys Leu Gly Lys Val Asp Ile Leu Val Asn Asn Ala 85 90 95 Gly Gly Gly Gly Pro Lys Pro Phe Asp Met Pro Met Ala Asp Phe Arg 100 105 110 Arg Ala Tyr Glu Leu Asn Val Phe Ser Phe Phe His Leu Ser Gln Leu 115 120 125 Val Ala Pro Glu Met Glu Lys Asn Gly Gly Gly Val Ile Leu Thr Ile 130 135 140 Thr Ser Met Ala Ala Glu Asn Lys Asn Ile Asn Met Thr Ser Tyr Ala 145 150 155 160 Ser Ser Lys Ala Ala Ala Ser His Leu Val Arg Asn Met Ala Phe Asp 165 170 175 Leu Gly Glu Lys Asn Ile Arg Val Asn Gly Ile Ala Pro Gly Ala Ile 180 185 190 Leu Thr Asp Ala Leu Lys Ser Val Ile Thr Pro Glu Ile Glu Gln Lys 195 200 205 Met Leu Gln His Thr Pro Ile Arg Arg Leu Gly Gln Pro Gln Asp Ile 210 215 220 Ala Asn Ala Ala Leu Phe Leu Cys Ser Pro Ala Ala Ser Trp Val Ser 225 230 235 240 Gly Gln Ile Leu Thr Val Ser Gly Gly Gly Val Gln Glu Leu Asn 245 250 255 <210> 7 <211> 786 <212> DNA <213> Bacillus subtilis <400> 7 atgtatccgg atttaaaagg aaaagtcgtc gctattacag gagctgcttc agggctcgga 60 aaggcgatgg ccattcgctt cggcaaggag caggcaaaag tggttatcaa ctattatagt 120 aataaacaag atccgaacga ggtaaaagaa gaggtcatca aggcgggcgg tgaagctgtt 180 gtcgtccaag gagatgtcac gaaagaggaa gatgtaaaaa atatcgtgca aacggcaatt 240 aaggagttcg gcacactcga tattatgatt aataatgccg gtcttgaaaa tcctgtgcca 300 tctcacgaaa tgccgctcaa ggattgggat aaagtcatcg gcacgaactt aacgggtgcc 360 tttttaggaa gccgtgaagc gattaaatat ttcgtagaaa acgatatcaa gggaaatgtc 420 attaacatgt ccagtgtgca cgaagtgatt ccttggccgt tatttgtcca ctatgcggca 480 agtaaaggcg ggataaagct gatgacagaa acattagcgt tggaatacgc gccgaagggc 540 attcgcgtca ataatattgg gccaggtgcg atcaacacgc caatcaatgc tgaaaaattc 600 gctgacccta aacagaaagc tgatgtagaa agcatgattc caatgggata tatcggcgaa 660 ccggaggaga tcgccgcagt agcagcctgg cttgcttcga aggaagccag ctacgtcaca 720 ggcatcacgt tattcgcgga cggcggtatg acacaatatc cttcattcca ggcaggccgc 780 ggttaa 786 <210> 8 <211> 261 <212> PRT <213> Bacillus subtilis <400> 8 Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala 1 5 10 15 Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala 20 25 30 Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val 35 40 45 Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly 50 55 60 Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile 65 70 75 80 Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu 85 90 95 Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val 100 105 110 Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile 115 120 125 Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser 130 135 140 Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala 145 150 155 160 Ser Lys Gly Gly Ile Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr 165 170 175 Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn 180 185 190 Thr Pro Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Lys Ala Asp 195 200 205 Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile 210 215 220 Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr 225 230 235 240 Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe 245 250 255 Gln Ala Gly Arg Gly 260 <210> 9 <211> 263 <212> PRT <213> Artificial Sequence <220> <223> abgeleitet aus Collinsella aerofaciens (G39D) <400> 9 Met Asn Leu Arg Glu Lys Tyr Gly Glu Trp Gly Leu Ile Leu Gly Ala 1 5 10 15 Thr Glu Gly Val Gly Lys Ala Phe Cys Glu Lys Ile Ala Ala Gly Gly 20 25 30 Met Asn Val Val Met Val Asp Arg Arg Glu Glu Lys Leu Asn Val Leu 35 40 45 Ala Gly Glu Ile Arg Glu Thr Tyr Gly Val Glu Thr Lys Val Val Arg 50 55 60 Ala Asp Phe Ser Gln Pro Gly Ala Ala Glu Thr Val Phe Ala Ala Thr 65 70 75 80 Glu Gly Leu Asp Met Gly Phe Met Ser Tyr Val Ala Cys Leu His Ser 85 90 95 Phe Gly Lys Ile Gln Asp Thr Pro Trp Glu Lys His Glu Ala Met Ile 100 105 110 Asn Val Asn Val Val Thr Phe Leu Lys Cys Phe His His Tyr Met Arg 115 120 125 Ile Phe Ala Ala Gln Asp Arg Gly Ala Val Ile Asn Val Ser Ser Met 130 135 140 Thr Gly Ile Ser Ser Ser Pro Trp Asn Gly Gln Tyr Gly Ala Gly Lys 145 150 155 160 Ala Phe Ile Leu Lys Met Thr Glu Ala Val Ala Cys Glu Cys Glu Gly 165 170 175 Thr Gly Val Asp Val Glu Val Ile Thr Leu Gly Thr Thr Leu Thr Pro 180 185 190 Ser Leu Leu Ser Asn Leu Pro Gly Gly Pro Gln Gly Glu Ala Val Met 195 200 205 Lys Ile Ala Leu Thr Pro Glu Glu Cys Val Asp Glu Ala Phe Glu Lys 210 215 220 Leu Gly Lys Glu Leu Ser Val Ile Ala Gly Gln Arg Asn Lys Asp Ser 225 230 235 240 Val His Asp Trp Lys Ala Asn His Thr Glu Asp Glu Tyr Ile Arg Tyr 245 250 255 Met Gly Ser Phe Tyr Arg Asp 260 <210> 10 <211> 263 <212> PRT <213> Artificial Sequence <220> <223> 7?HSDH Mutante <400> 10 Met Asn Leu Arg Glu Lys Tyr Gly Glu Trp Gly Leu Ile Leu Gly Ala 1 5 10 15 Thr Glu Gly Val Gly Lys Ala Phe Cys Glu Lys Ile Ala Ala Gly Gly 20 25 30 Met Asn Val Val Met Val Asp Ile Arg Glu Glu Lys Leu Asn Val Leu 35 40 45 Ala Gly Glu Ile Arg Glu Thr Tyr Gly Val Glu Thr Lys Val Val Arg 50 55 60 Ala Asp Phe Ser Gln Pro Gly Ala Ala Glu Thr Val Phe Ala Ala Thr 65 70 75 80 Glu Gly Leu Asp Met Gly Phe Met Ser Tyr Val Ala Cys Leu His Ser 85 90 95 Phe Gly Lys Ile Gln Asp Thr Pro Trp Glu Lys His Glu Ala Met Ile 100 105 110 Asn Val Asn Val Val Thr Phe Leu Lys Cys Phe His His Tyr Met Arg 115 120 125 Ile Phe Ala Ala Gln Asp Arg Gly Ala Val Ile Asn Val Ser Ser Met 130 135 140 Thr Gly Ile Ser Ser Ser Pro Trp Asn Gly Gln Tyr Gly Ala Gly Lys 145 150 155 160 Ala Phe Ile Leu Lys Met Thr Glu Ala Val Ala Cys Glu Cys Glu Gly 165 170 175 Thr Gly Val Asp Val Glu Val Ile Thr Leu Gly Thr Thr Leu Thr Pro 180 185 190 Ser Leu Leu Ser Asn Leu Pro Gly Gly Pro Gln Gly Glu Ala Val Met 195 200 205 Lys Ile Ala Leu Thr Pro Glu Glu Cys Val Asp Glu Ala Phe Glu Lys 210 215 220 Leu Gly Lys Glu Leu Ser Val Ile Ala Gly Gln Arg Asn Lys Asp Ser 225 230 235 240 Val His Asp Trp Lys Ala Asn His Thr Glu Asp Glu Tyr Ile Arg Tyr 245 250 255 Met Gly Ser Phe Tyr Arg Asp 260 <210> 11 <211> 263 <212> PRT <213> Artificial Sequence <220> <223> 7?HSDH Mutante <400> 11 Met Asn Leu Arg Glu Lys Tyr Gly Glu Trp Gly Leu Ile Leu Gly Ala 1 5 10 15 Thr Glu Gly Val Gly Lys Ala Phe Cys Glu Lys Ile Ala Ala Gly Gly 20 25 30 Met Asn Val Val Met Val Asp Phe Arg Glu Glu Lys Leu Asn Val Leu 35 40 45 Ala Gly Glu Ile Arg Glu Thr Tyr Gly Val Glu Thr Lys Val Val Arg 50 55 60 Ala Asp Phe Ser Gln Pro Gly Ala Ala Glu Thr Val Phe Ala Ala Thr 65 70 75 80 Glu Gly Leu Asp Met Gly Phe Met Ser Tyr Val Ala Cys Leu His Ser 85 90 95 Phe Gly Lys Ile Gln Asp Thr Pro Trp Glu Lys His Glu Ala Met Ile 100 105 110 Asn Val Asn Val Val Thr Phe Leu Lys Cys Phe His His Tyr Met Arg 115 120 125 Ile Phe Ala Ala Gln Asp Arg Gly Ala Val Ile Asn Val Ser Ser Met 130 135 140 Thr Gly Ile Ser Ser Ser Pro Trp Asn Gly Gln Tyr Gly Ala Gly Lys 145 150 155 160 Ala Phe Ile Leu Lys Met Thr Glu Ala Val Ala Cys Glu Cys Glu Gly 165 170 175 Thr Gly Val Asp Val Glu Val Ile Thr Leu Gly Thr Thr Leu Thr Pro 180 185 190 Ser Leu Leu Ser Asn Leu Pro Gly Gly Pro Gln Gly Glu Ala Val Met 195 200 205 Lys Ile Ala Leu Thr Pro Glu Glu Cys Val Asp Glu Ala Phe Glu Lys 210 215 220 Leu Gly Lys Glu Leu Ser Val Ile Ala Gly Gln Arg Asn Lys Asp Ser 225 230 235 240 Val His Asp Trp Lys Ala Asn His Thr Glu Asp Glu Tyr Ile Arg Tyr 245 250 255 Met Gly Ser Phe Tyr Arg Asp 260 <210> 12 <211> 263 <212> PRT <213> Artificial Sequence <220> <223> 7?HSDH Mutante <400> 12 Met Asn Leu Arg Glu Lys Tyr Gly Glu Trp Gly Leu Ile Leu Gly Ala 1 5 10 15 Thr Glu Gly Val Gly Lys Ala Phe Cys Glu Lys Ile Ala Ala Gly Gly 20 25 30 Met Asn Val Val Met Val Asp Phe Lys Glu Glu Lys Leu Asn Val Leu 35 40 45 Ala Gly Glu Ile Arg Glu Thr Tyr Gly Val Glu Thr Lys Val Val Arg 50 55 60 Ala Asp Phe Ser Gln Pro Gly Ala Ala Glu Thr Val Phe Ala Ala Thr 65 70 75 80 Glu Gly Leu Asp Met Gly Phe Met Ser Tyr Val Ala Cys Leu His Ser 85 90 95 Phe Gly Lys Ile Gln Asp Thr Pro Trp Glu Lys His Glu Ala Met Ile 100 105 110 Asn Val Asn Val Val Thr Phe Leu Lys Cys Phe His His Tyr Met Arg 115 120 125 Ile Phe Ala Ala Gln Asp Arg Gly Ala Val Ile Asn Val Ser Ser Met 130 135 140 Thr Gly Ile Ser Ser Ser Pro Trp Asn Gly Gln Tyr Gly Ala Gly Lys 145 150 155 160 Ala Phe Ile Leu Lys Met Thr Glu Ala Val Ala Cys Glu Cys Glu Gly 165 170 175 Thr Gly Val Asp Val Glu Val Ile Thr Leu Gly Thr Thr Leu Thr Pro 180 185 190 Ser Leu Leu Ser Asn Leu Pro Gly Gly Pro Gln Gly Glu Ala Val Met 195 200 205 Lys Ile Ala Leu Thr Pro Glu Glu Cys Val Asp Glu Ala Phe Glu Lys 210 215 220 Leu Gly Lys Glu Leu Ser Val Ile Ala Gly Gln Arg Asn Lys Asp Ser 225 230 235 240 Val His Asp Trp Lys Ala Asn His Thr Glu Asp Glu Tyr Ile Arg Tyr 245 250 255 Met Gly Ser Phe Tyr Arg Asp 260 <210> 13 <211> 263 <212> PRT <213> Artificial Sequence <220> <223> 7?HSDH Mutante <400> 13 Met Asn Leu Arg Glu Lys Tyr Gly Glu Trp Gly Leu Ile Leu Gly Ala 1 5 10 15 Thr Glu Gly Val Gly Lys Ala Phe Cys Glu Lys Ile Ala Ala Gly Gly 20 25 30 Met Asn Val Val Met Val Asp Phe Lys Glu Glu Gly Leu Asn Val Leu 35 40 45 Ala Gly Glu Ile Arg Glu Thr Tyr Gly Val Glu Thr Lys Val Val Arg 50 55 60 Ala Asp Phe Ser Gln Pro Gly Ala Ala Glu Thr Val Phe Ala Ala Thr 65 70 75 80 Glu Gly Leu Asp Met Gly Phe Met Ser Tyr Val Ala Cys Leu His Ser 85 90 95 Phe Gly Lys Ile Gln Asp Thr Pro Trp Glu Lys His Glu Ala Met Ile 100 105 110 Asn Val Asn Val Val Thr Phe Leu Lys Cys Phe His His Tyr Met Arg 115 120 125 Ile Phe Ala Ala Gln Asp Arg Gly Ala Val Ile Asn Val Ser Ser Met 130 135 140 Thr Gly Ile Ser Ser Ser Pro Trp Asn Gly Gln Tyr Gly Ala Gly Lys 145 150 155 160 Ala Phe Ile Leu Lys Met Thr Glu Ala Val Ala Cys Glu Cys Glu Gly 165 170 175 Thr Gly Val Asp Val Glu Val Ile Thr Leu Gly Thr Thr Leu Thr Pro 180 185 190 Ser Leu Leu Ser Asn Leu Pro Gly Gly Pro Gln Gly Glu Ala Val Met 195 200 205 Lys Ile Ala Leu Thr Pro Glu Glu Cys Val Asp Glu Ala Phe Glu Lys 210 215 220 Leu Gly Lys Glu Leu Ser Val Ile Ala Gly Gln Arg Asn Lys Asp Ser 225 230 235 240 Val His Asp Trp Lys Ala Asn His Thr Glu Asp Glu Tyr Ile Arg Tyr 245 250 255 Met Gly Ser Phe Tyr Arg Asp 260 <210> 14 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> PCR Primer <400> 14 cgtcgtcatg gtcgactttc gcgagg 26 <210> 15 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> PCR Primer <400> 15 ccgccgcatc cataccgcca gttgtttacc c 31 <210> 16 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> PCR Primer <400> 16 cgtcgtcatg gtcgacttta aagaggagaa gctg 34 <210> 17 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> PCR Primer <220> <221> misc_feature <222> (19)..(19) <223> n is a, c, g, or t <400> 17 gtcgacttta aagaggagnd tctgaacgtg ctc 33 <210> 18 <211> 7891 <212> DNA <213> Artificial Sequence <220> <223> Plasmid p7(A)T3rG-A <400> 18 atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60 ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120 tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagttaaccg cggcctgcct 180 ggaatgaagg atattgtgtc ataccgccgt ccgcgaataa cgtgatgcct gtgacgtagc 240 tggcttcctt cgaagcaagc caggctgcta ctgcggcgat ctcctccggt tcgccgatat 300 atcccattgg aatcatgctt tctacatcag ctttctgttt agggtcagcg aatttttcag 360 cattgattgg cgtgttgatc gcacctggcc caatattatt gacgcgaatg cccttcggcg 420 cgtattccaa cgctaatgtt tctgtcatca gctttatccc gcctttactt gccgcatagt 480 ggacaaataa cggccaagga atcacttcgt gcacactgga catgttaatg acatttccct 540 tgatatcgtt ttctacgaaa tatttaatcg cttcacggct tcctaaaaag gcacccgtta 600 agttcgtgcc gatgacttta tcccaatcct tgagcggcat ttcgtgagat ggcacaggat 660 tttcaagacc ggcattatta atcataatat cgagtgtgcc gaactcctta attgccgttt 720 gcacgatatt ttttacatct tcctctttcg tgacatctcc ttggacgaca acagcttcac 780 cgcccgcctt gatgacctct tcttttacct cgttcggatc ttgtttatta ctataatagt 840 tgataaccac ttttgcctgc tccttgccga agcgaatggc catcgccttt ccgagccctg 900 aagcagctcc tgtaatagcg acgacttttc cttttaaatc cggatacatg tatatctcct 960 tgcggccgct cagaactgtg tcgggcgcat caccgcatca atgccgccat caatgacgat 1020 ctgcgcgcca tgcacatagc ttgcggccgg gctcatcaaa aaggcgatga ccgacgccat 1080 ctcggacggc tcggcacggc ggcccatggg aggaacgaac ttggcaatgg attcgccata 1140 gcgcgggtcc tgcaggcccg cctgcagcaa gggagtctcg gttgcaccgg gggcgatggt 1200 gttcaggcgc acgccagcct cgccccaggc ggcggcgcgt ttgcgcacag ccaccgtcaa 1260 agcattcttg ctgcccgcat aggccagatt tccgccctgc tctcccgcat gttcgacaat 1320 ggcgcgggcc ttggcttcct cgccggcttc cagtgccagc gccagtgggt tcttgtcaaa 1380 agccagatgc gcggaagcca cggacgagat gacgacggct gcgggctgat ggcctttttt 1440 cagcgctggc aaaaaggcat ccatcagctc ggtcgcgcca aaataattga ccgaaaccac 1500 attgccaagc accttggtct gcggtcccag gccggcgcac agcaccaggc cgtccatgcc 1560 cttgctgcac ttcgccagta catcggcaat cgcctgcttt cgaccttcgg ccgtcgagag 1620 atcggcaatc acttccgcat cgcgtatatc gatgcctacg atctggtgac cggccgcctc 1680 caggaccttg cgcgtagcgg caccaatgcc ggtggcgcag ccgcttatca cgatgatgga 1740 catcatatgt atatctcctt cttatactta actaatatac taagatgggg aattgttatc 1800 cgctcacaat tcccctatag tgagtcgtat taatttcgat tatgcggccg tgtacaatac 1860 gattactttc tgttcgactt aagcattata agcttctagt cgcggtagaa cgaccccatg 1920 tagcggatgt actcgtcctc ggtgtggttt gccttccagt cgtggacgga gtccttgttg 1980 cgctggccgg cgatgacgga gagctcctta cccagcttct caaaggcctc gtcaacgcac 2040 tcctcggggg tgagggcgat cttcatgacg gcctcgccct gcgggccgcc ggggaggttg 2100 gacagcaggc tgggggttag ggtggtgccg agggtgatga cctcgacgtc gacgccggtg 2160 ccctcgcact cgcaggccac ggcctcggtc atcttgagga tgaaggcctt gcccgcgccg 2220 tactggccgt tccaggggct ggagctgatg ccggtcatcg acgagacgtt gatcacggcg 2280 ccgcggtcct gggcggcaaa gatccgcatg tagtggtgga agcacttgag gaaggtcacg 2340 acgttgacgt tgatcatggc ctcgtgcttc tcccaggggg tgtcctggat cttaccgaag 2400 ctgtgcaggc aggccacgta gctcatgaag cccatgtcca ggccctcggt cgcggcgaag 2460 acggtctcgg cagcgccggg ctggctaaag tcggcgcgca cgaccttggt ctccacgccg 2520 taggtctcgc ggatctcgcc tgcgagcacg ttcagcttct cctcgcgacg ggcgaccatg 2580 acgacgttca tgccgccggc ggcgatcttc tcgcagaacg ccttgccgac gccctcggtc 2640 gcgcccagga tcaggcccca ctcaccgtac ttctccctca ggttcatatg tatatctcct 2700 tcttaaagtt aaacaaaatt atttctagag gggaattgtt atccgctcac aattccccta 2760 tagtgagtcg tattaatttc gcgggatcga gatctcgatc ctctacgccg gacgcatcgt 2820 ggccggcatc accggcgcca caggtgcggt tgctggcgcc tatatcgccg acatcaccga 2880 tggggaagat cgggctcgcc acttcgggct catgagcgct tgtttcggcg tgggtatggt 2940 ggcaggcccc gtggccgggg gactgttggg cgccatctcc ttgcatgcac cattccttgc 3000 ggcggcggtg ctcaacggcc tcaacctact actgggctgc ttcctaatgc aggagtcgca 3060 taagggagag cgtcgagatc ccggacacca tcgaatggcg caaaaccttt cgcggtatgg 3120 catgatagcg cccggaagag agtcaattca gggtggtgaa tgtgaaacca gtaacgttat 3180 acgatgtcgc agagtatgcc ggtgtctctt atcagaccgt ttcccgcgtg gtgaaccagg 3240 ccagccacgt ttctgcgaaa acgcgggaaa aagtggaagc ggcgatggcg gagctgaatt 3300 acattcccaa ccgcgtggca caacaactgg cgggcaaaca gtcgttgctg attggcgttg 3360 ccacctccag tctggccctg cacgcgccgt cgcaaattgt cgcggcgatt aaatctcgcg 3420 ccgatcaact gggtgccagc gtggtggtgt cgatggtaga acgaagcggc gtcgaagcct 3480 gtaaagcggc ggtgcacaat cttctcgcgc aacgcgtcag tgggctgatc attaactatc 3540 cgctggatga ccaggatgcc attgctgtgg aagctgcctg cactaatgtt ccggcgttat 3600 ttcttgatgt ctctgaccag acacccatca acagtattat tttctcccat gaagacggta 3660 cgcgactggg cgtggagcat ctggtcgcat tgggtcacca gcaaatcgcg ctgttagcgg 3720 gcccattaag ttctgtctcg gcgcgtctgc gtctggctgg ctggcataaa tatctcactc 3780 gcaatcaaat tcagccgata gcggaacggg aaggcgactg gagtgccatg tccggttttc 3840 aacaaaccat gcaaatgctg aatgagggca tcgttcccac tgcgatgctg gttgccaacg 3900 atcagatggc gctgggcgca atgcgcgcca ttaccgagtc cgggctgcgc gttggtgcgg 3960 atatctcggt agtgggatac gacgataccg aagacagctc atgttatatc ccgccgttaa 4020 ccaccatcaa acaggatttt cgcctgctgg ggcaaaccag cgtggaccgc ttgctgcaac 4080 tctctcaggg ccaggcggtg aagggcaatc agctgttgcc cgtctcactg gtgaaaagaa 4140 aaaccaccct ggcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa 4200 tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat 4260 gtaagttagc tcactcatta ggcaccggga tctcgaccga tgcccttgag agccttcaac 4320 ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tatgactgtc 4380 ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tctgggtcat tttcggcgag 4440 gaccgctttc gctggagcgc gacgatgatc ggcctgtcgc ttgcggtatt cggaatcttg 4500 cacgccctcg ctcaagcctt cgtcactggt cccgccacca aacgtttcgg cgagaagcag 4560 gccattatcg ccggcatggc ggccccacgg gtgcgcatga tcgtgctcct gtcgttgagg 4620 acccggctag gctggcgggg ttgccttact ggttagcaga atgaatcacc gatacgcgag 4680 cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct gagcaacaac atgaatggtc 4740 ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt cagcgccctg caccattatg 4800 ttccggatct gcatcgcagg atgctgctgg ctaccctgtg gaacacctac atctgtatta 4860 acgaagcgct ggcattgacc ctgagtgatt tttctctggt cccgccgcat ccataccgcc 4920 agttgtttac cctcacaacg ttccagtaac cgggcatgtt catcatcagt aacccgtatc 4980 gtgagcatcc tctctcgttt catcggtatc attaccccca tgaacagaaa tcccccttac 5040 acggaggcat cagtgaccaa acaggaaaaa accgccctta acatggcccg ctttatcaga 5100 agccagacat taacgcttct ggagaaactc aacgagctgg acgcggatga acaggcagac 5160 atctgtgaat cgcttcacga ccacgctgat gagctttacc gcagctgcct cgcgcgtttc 5220 ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg 5280 taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt 5340 cggggcgcag ccatgaccca gtcacgtagc gatagcggag tgtatactgg cttaactatg 5400 cggcatcaga gcagattgta ctgagagtgc accatatatg cggtgtgaaa taccgcacag 5460 atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca ctgactcgct 5520 gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 5580 atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 5640 caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 5700 gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 5760 ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 5820 cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 5880 taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 5940 cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 6000 acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 6060 aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt 6120 atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 6180 atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 6240 gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 6300 gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 6360 ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 6420 ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 6480 tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 6540 accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 6600 atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 6660 cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 6720 tagtttgcgc aacgttgttg ccattgctgc aggcatcgtg gtgtcacgct cgtcgtttgg 6780 tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 6840 gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 6900 agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 6960 aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 7020 gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 7080 tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 7140 gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 7200 tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 7260 aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 7320 catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 7380 acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaaattg taaacgttaa 7440 tattttgtta aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc 7500 cgaaatcggc aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtgttgt 7560 tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa 7620 aaccgtctat cagggcgatg gcccactacg tgaaccatca ccctaatcaa gttttttggg 7680 gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg 7740 acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc 7800 tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa 7860 tgcgccgcta cagggcgcgt cccattcgcc a 7891 <210> 19 <211> 7758 <212> DNA <213> Artificial Sequence <220> <223> Plasmid p7(A)T3rG-K <400> 19 atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60 ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120 tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagttaaccg cggcctgcct 180 ggaatgaagg atattgtgtc ataccgccgt ccgcgaataa cgtgatgcct gtgacgtagc 240 tggcttcctt cgaagcaagc caggctgcta ctgcggcgat ctcctccggt tcgccgatat 300 atcccattgg aatcatgctt tctacatcag ctttctgttt agggtcagcg aatttttcag 360 cattgattgg cgtgttgatc gcacctggcc caatattatt gacgcgaatg cccttcggcg 420 cgtattccaa cgctaatgtt tctgtcatca gctttatccc gcctttactt gccgcatagt 480 ggacaaataa cggccaagga atcacttcgt gcacactgga catgttaatg acatttccct 540 tgatatcgtt ttctacgaaa tatttaatcg cttcacggct tcctaaaaag gcacccgtta 600 agttcgtgcc gatgacttta tcccaatcct tgagcggcat ttcgtgagat ggcacaggat 660 tttcaagacc ggcattatta atcataatat cgagtgtgcc gaactcctta attgccgttt 720 gcacgatatt ttttacatct tcctctttcg tgacatctcc ttggacgaca acagcttcac 780 cgcccgcctt gatgacctct tcttttacct cgttcggatc ttgtttatta ctataatagt 840 tgataaccac ttttgcctgc tccttgccga agcgaatggc catcgccttt ccgagccctg 900 aagcagctcc tgtaatagcg acgacttttc cttttaaatc cggatacatg tatatctcct 960 tgcggccgct cagaactgtg tcgggcgcat caccgcatca atgccgccat caatgacgat 1020 ctgcgcgcca tgcacatagc ttgcggccgg gctcatcaaa aaggcgatga ccgacgccat 1080 ctcggacggc tcggcacggc ggcccatggg aggaacgaac ttggcaatgg attcgccata 1140 gcgcgggtcc tgcaggcccg cctgcagcaa gggagtctcg gttgcaccgg gggcgatggt 1200 gttcaggcgc acgccagcct cgccccaggc ggcggcgcgt ttgcgcacag ccaccgtcaa 1260 agcattcttg ctgcccgcat aggccagatt tccgccctgc tctcccgcat gttcgacaat 1320 ggcgcgggcc ttggcttcct cgccggcttc cagtgccagc gccagtgggt tcttgtcaaa 1380 agccagatgc gcggaagcca cggacgagat gacgacggct gcgggctgat ggcctttttt 1440 cagcgctggc aaaaaggcat ccatcagctc ggtcgcgcca aaataattga ccgaaaccac 1500 attgccaagc accttggtct gcggtcccag gccggcgcac agcaccaggc cgtccatgcc 1560 cttgctgcac ttcgccagta catcggcaat cgcctgcttt cgaccttcgg ccgtcgagag 1620 atcggcaatc acttccgcat cgcgtatatc gatgcctacg atctggtgac cggccgcctc 1680 caggaccttg cgcgtagcgg caccaatgcc ggtggcgcag ccgcttatca cgatgatgga 1740 catcatatgt atatctcctt cttatactta actaatatac taagatgggg aattgttatc 1800 cgctcacaat tcccctatag tgagtcgtat taatttcgat tatgcggccg tgtacaatac 1860 gattactttc tgttcgactt aagcattata agcttctagt cgcggtagaa cgaccccatg 1920 tagcggatgt actcgtcctc ggtgtggttt gccttccagt cgtggacgga gtccttgttg 1980 cgctggccgg cgatgacgga gagctcctta cccagcttct caaaggcctc gtcaacgcac 2040 tcctcggggg tgagggcgat cttcatgacg gcctcgccct gcgggccgcc ggggaggttg 2100 gacagcaggc tgggggttag ggtggtgccg agggtgatga cctcgacgtc gacgccggtg 2160 ccctcgcact cgcaggccac ggcctcggtc atcttgagga tgaaggcctt gcccgcgccg 2220 tactggccgt tccaggggct ggagctgatg ccggtcatcg acgagacgtt gatcacggcg 2280 ccgcggtcct gggcggcaaa gatccgcatg tagtggtgga agcacttgag gaaggtcacg 2340 acgttgacgt tgatcatggc ctcgtgcttc tcccaggggg tgtcctggat cttaccgaag 2400 ctgtgcaggc aggccacgta gctcatgaag cccatgtcca ggccctcggt cgcggcgaag 2460 acggtctcgg cagcgccggg ctggctaaag tcggcgcgca cgaccttggt ctccacgccg 2520 taggtctcgc ggatctcgcc tgcgagcacg ttcagcttct cctcgcgacg ggcgaccatg 2580 acgacgttca tgccgccggc ggcgatcttc tcgcagaacg ccttgccgac gccctcggtc 2640 gcgcccagga tcaggcccca ctcaccgtac ttctccctca ggttcatatg tatatctcct 2700 tcttaaagtt aaacaaaatt atttctagag gggaattgtt atccgctcac aattccccta 2760 tagtgagtcg tattaatttc gcgggatcga gatctcgatc ctctacgccg gacgcatcgt 2820 ggccggcatc accggcgcca caggtgcggt tgctggcgcc tatatcgccg acatcaccga 2880 tggggaagat cgggctcgcc acttcgggct catgagcgct tgtttcggcg tgggtatggt 2940 ggcaggcccc gtggccgggg gactgttggg cgccatctcc ttgcatgcac cattccttgc 3000 ggcggcggtg ctcaacggcc tcaacctact actgggctgc ttcctaatgc aggagtcgca 3060 taagggagag cgtcgagatc ccggacacca tcgaatggcg caaaaccttt cgcggtatgg 3120 catgatagcg cccggaagag agtcaattca gggtggtgaa tgtgaaacca gtaacgttat 3180 acgatgtcgc agagtatgcc ggtgtctctt atcagaccgt ttcccgcgtg gtgaaccagg 3240 ccagccacgt ttctgcgaaa acgcgggaaa aagtggaagc ggcgatggcg gagctgaatt 3300 acattcccaa ccgcgtggca caacaactgg cgggcaaaca gtcgttgctg attggcgttg 3360 ccacctccag tctggccctg cacgcgccgt cgcaaattgt cgcggcgatt aaatctcgcg 3420 ccgatcaact gggtgccagc gtggtggtgt cgatggtaga acgaagcggc gtcgaagcct 3480 gtaaagcggc ggtgcacaat cttctcgcgc aacgcgtcag tgggctgatc attaactatc 3540 cgctggatga ccaggatgcc attgctgtgg aagctgcctg cactaatgtt ccggcgttat 3600 ttcttgatgt ctctgaccag acacccatca acagtattat tttctcccat gaagacggta 3660 cgcgactggg cgtggagcat ctggtcgcat tgggtcacca gcaaatcgcg ctgttagcgg 3720 gcccattaag ttctgtctcg gcgcgtctgc gtctggctgg ctggcataaa tatctcactc 3780 gcaatcaaat tcagccgata gcggaacggg aaggcgactg gagtgccatg tccggttttc 3840 aacaaaccat gcaaatgctg aatgagggca tcgttcccac tgcgatgctg gttgccaacg 3900 atcagatggc gctgggcgca atgcgcgcca ttaccgagtc cgggctgcgc gttggtgcgg 3960 atatctcggt agtgggatac gacgataccg aagacagctc atgttatatc ccgccgttaa 4020 ccaccatcaa acaggatttt cgcctgctgg ggcaaaccag cgtggaccgc ttgctgcaac 4080 tctctcaggg ccaggcggtg aagggcaatc agctgttgcc cgtctcactg gtgaaaagaa 4140 aaaccaccct ggcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa 4200 tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat 4260 gtaagttagc tcactcatta ggcaccggga tctcgaccga tgcccttgag agccttcaac 4320 ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tatgactgtc 4380 ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tctgggtcat tttcggcgag 4440 gaccgctttc gctggagcgc gacgatgatc ggcctgtcgc ttgcggtatt cggaatcttg 4500 cacgccctcg ctcaagcctt cgtcactggt cccgccacca aacgtttcgg cgagaagcag 4560 gccattatcg ccggcatggc ggccccacgg gtgcgcatga tcgtgctcct gtcgttgagg 4620 acccggctag gctggcgggg ttgccttact ggttagcaga atgaatcacc gatacgcgag 4680 cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct gagcaacaac atgaatggtc 4740 ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt cagcgccctg caccattatg 4800 ttccggatct gcatcgcagg atgctgctgg ctaccctgtg gaacacctac atctgtatta 4860 acgaagcgct ggcattgacc ctgagtgatt tttctctggt cccgccgcat ccataccgcc 4920 agttgtttac cctcacaacg ttccagtaac cgggcatgtt catcatcagt aacccgtatc 4980 gtgagcatcc tctctcgttt catcggtatc attaccccca tgaacagaaa tcccccttac 5040 acggaggcat cagtgaccaa acaggaaaaa accgccctta acatggcccg ctttatcaga 5100 agccagacat taacgcttct ggagaaactc aacgagctgg acgcggatga acaggcagac 5160 atctgtgaat cgcttcacga ccacgctgat gagctttacc gcagctgcct cgcgcgtttc 5220 ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg 5280 taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt 5340 cggggcgcag ccatgaccca gtcacgtagc gatagcggag tgtatactgg cttaactatg 5400 cggcatcaga gcagattgta ctgagagtgc accatatatg cggtgtgaaa taccgcacag 5460 atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca ctgactcgct 5520 gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 5580 atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 5640 caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 5700 gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 5760 ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 5820 cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 5880 taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 5940 cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 6000 acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 6060 aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt 6120 atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 6180 atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 6240 gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 6300 gtggaacgaa aactcacgtt aagggatttt ggtcatgaac aataaaactg tctgcttaca 6360 taaacagtaa tacaaggggt gttatgagcc atattcaacg ggaaacgtct tgctctaggc 6420 cgcgattaaa ttccaacatg gatgctgatt tatatgggta taaatgggct cgcgataatg 6480 tcgggcaatc aggtgcgaca atctatcgat tgtatgggaa gcccgatgcg ccagagttgt 6540 ttctgaaaca tggcaaaggt agcgttgcca atgatgttac agatgagatg gtcagactaa 6600 actggctgac ggaatttatg cctcttccga ccatcaagca ttttatccgt actcctgatg 6660 atgcatggtt actcaccact gcgatccccg ggaaaacagc attccaggta ttagaagaat 6720 atcctgattc aggtgaaaat attgttgatg cgctggcagt gttcctgcgc cggttgcatt 6780 cgattcctgt ttgtaattgt ccttttaaca gcgatcgcgt atttcgtctc gctcaggcgc 6840 aatcacgaat gaataacggt ttggttgatg cgagtgattt tgatgacgag cgtaatggct 6900 ggcctgttga acaagtctgg aaagaaatgc ataaactttt gccattctca ccggattcag 6960 tcgtcactca tggtgatttc tcacttgata accttatttt tgacgagggg aaattaatag 7020 gttgtattga tgttggacga gtcggaatcg cagaccgata ccaggatctt gccatcctat 7080 ggaactgcct cggtgagttt tctccttcat tacagaaacg gctttttcaa aaatatggta 7140 ttgataatcc tgatatgaat aaattgcagt ttcatttgat gctcgatgag tttttctaag 7200 aattaattca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt 7260 ccgcgcacat ttccccgaaa agtgccacct gaaattgtaa acgttaatat tttgttaaaa 7320 ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 7380 atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac 7440 aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag 7500 ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc gaggtgccgt 7560 aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg gggaaagccg 7620 gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag ggcgctggca 7680 agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc gccgctacag 7740 ggcgcgtccc attcgcca 7758 <210> 20 <211> 8019 <212> DNA <213> Artificial Sequence <220> <223> Plasmid p7(A)T3TG-A <400> 20 atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60 ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120 tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagttaaccg cggcctgcct 180 ggaatgaagg atattgtgtc ataccgccgt ccgcgaataa cgtgatgcct gtgacgtagc 240 tggcttcctt cgaagcaagc caggctgcta ctgcggcgat ctcctccggt tcgccgatat 300 atcccattgg aatcatgctt tctacatcag ctttctgttt agggtcagcg aatttttcag 360 cattgattgg cgtgttgatc gcacctggcc caatattatt gacgcgaatg cccttcggcg 420 cgtattccaa cgctaatgtt tctgtcatca gctttatccc gcctttactt gccgcatagt 480 ggacaaataa cggccaagga atcacttcgt gcacactgga catgttaatg acatttccct 540 tgatatcgtt ttctacgaaa tatttaatcg cttcacggct tcctaaaaag gcacccgtta 600 agttcgtgcc gatgacttta tcccaatcct tgagcggcat ttcgtgagat ggcacaggat 660 tttcaagacc ggcattatta atcataatat cgagtgtgcc gaactcctta attgccgttt 720 gcacgatatt ttttacatct tcctctttcg tgacatctcc ttggacgaca acagcttcac 780 cgcccgcctt gatgacctct tcttttacct cgttcggatc ttgtttatta ctataatagt 840 tgataaccac ttttgcctgc tccttgccga agcgaatggc catcgccttt ccgagccctg 900 aagcagctcc tgtaatagcg acgacttttc cttttaaatc cggatacata tgtatatctc 960 cttcttatac ttaactaata tactaagatg gggaattgtt atccgctcac aattccccta 1020 tagtgagtcg tattaatttc gattatgcgg ccgtgtacaa tacgattact ttctgttcga 1080 cttaagcatt atgcggccgc tcagaactgt gtcgggcgca tcaccgcatc aatgccgcca 1140 tcaatgacga tctgcgcgcc atgcacatag cttgcggccg ggctcatcaa aaaggcgatg 1200 accgacgcca tctcggacgg ctcggcacgg cggcccatgg gaggaacgaa cttggcaatg 1260 gattcgccat agcgcgggtc ctgcaggccc gcctgcagca agggagtctc ggttgcaccg 1320 ggggcgatgg tgttcaggcg cacgccagcc tcgccccagg cggcggcgcg tttgcgcaca 1380 gccaccgtca aagcattctt gctgcccgca taggccagat ttccgccctg ctctcccgca 1440 tgttcgacaa tggcgcgggc cttggcttcc tcgccggctt ccagtgccag cgccagtggg 1500 ttcttgtcaa aagccagatg cgcggaagcc acggacgaga tgacgacggc tgcgggctga 1560 tggccttttt tcagcgctgg caaaaaggca tccatcagct cggtcgcgcc aaaataattg 1620 accgaaacca cattgccaag caccttggtc tgcggtccca ggccggcgca cagcaccagg 1680 ccgtccatgc ccttgctgca cttcgccagt acatcggcaa tcgcctgctt tcgaccttcg 1740 gccgtcgaga gatcggcaat cacttccgca tcgcgtatat cgatgcctac gatctggtga 1800 ccggccgcct ccaggacctt gcgcgtagcg gcaccaatgc cggtggcgca gccgcttatc 1860 acgatgatgg acatatgtat atctccttct tatacttaac taatatacta agatggggaa 1920 ttgttatccg ctcacaattc ccctatagtg agtcgtatta atttcgatta tgcggccgtg 1980 tacaatacga ttactttctg ttcgacttaa gcattataag cttctagtcg cggtagaacg 2040 accccatgta gcggatgtac tcgtcctcgg tgtggtttgc cttccagtcg tggacggagt 2100 ccttgttgcg ctggccggcg atgacggaga gctccttacc cagcttctca aaggcctcgt 2160 caacgcactc ctcgggggtg agggcgatct tcatgacggc ctcgccctgc gggccgccgg 2220 ggaggttgga cagcaggctg ggggttaggg tggtgccgag ggtgatgacc tcgacgtcga 2280 cgccggtgcc ctcgcactcg caggccacgg cctcggtcat cttgaggatg aaggccttgc 2340 ccgcgccgta ctggccgttc caggggctgg agctgatgcc ggtcatcgac gagacgttga 2400 tcacggcgcc gcggtcctgg gcggcaaaga tccgcatgta gtggtggaag cacttgagga 2460 aggtcacgac gttgacgttg atcatggcct cgtgcttctc ccagggggtg tcctggatct 2520 taccgaagct gtgcaggcag gccacgtagc tcatgaagcc catgtccagg ccctcggtcg 2580 cggcgaagac ggtctcggca gcgccgggct ggctaaagtc ggcgcgcacg accttggtct 2640 ccacgccgta ggtctcgcgg atctcgcctg cgagcacgtt cagcttctcc tcgcgacggg 2700 cgaccatgac gacgttcatg ccgccggcgg cgatcttctc gcagaacgcc ttgccgacgc 2760 cctcggtcgc gcccaggatc aggccccact caccgtactt ctccctcagg ttcatatgta 2820 tatctccttc ttaaagttaa acaaaattat ttctagaggg gaattgttat ccgctcacaa 2880 ttcccctata gtgagtcgta ttaatttcgc gggatcgaga tctcgatcct ctacgccgga 2940 cgcatcgtgg ccggcatcac cggcgccaca ggtgcggttg ctggcgccta tatcgccgac 3000 atcaccgatg gggaagatcg ggctcgccac ttcgggctca tgagcgcttg tttcggcgtg 3060 ggtatggtgg caggccccgt ggccggggga ctgttgggcg ccatctcctt gcatgcacca 3120 ttccttgcgg cggcggtgct caacggcctc aacctactac tgggctgctt cctaatgcag 3180 gagtcgcata agggagagcg tcgagatccc ggacaccatc gaatggcgca aaacctttcg 3240 cggtatggca tgatagcgcc cggaagagag tcaattcagg gtggtgaatg tgaaaccagt 3300 aacgttatac gatgtcgcag agtatgccgg tgtctcttat cagaccgttt cccgcgtggt 3360 gaaccaggcc agccacgttt ctgcgaaaac gcgggaaaaa gtggaagcgg cgatggcgga 3420 gctgaattac attcccaacc gcgtggcaca acaactggcg ggcaaacagt cgttgctgat 3480 tggcgttgcc acctccagtc tggccctgca cgcgccgtcg caaattgtcg cggcgattaa 3540 atctcgcgcc gatcaactgg gtgccagcgt ggtggtgtcg atggtagaac gaagcggcgt 3600 cgaagcctgt aaagcggcgg tgcacaatct tctcgcgcaa cgcgtcagtg ggctgatcat 3660 taactatccg ctggatgacc aggatgccat tgctgtggaa gctgcctgca ctaatgttcc 3720 ggcgttattt cttgatgtct ctgaccagac acccatcaac agtattattt tctcccatga 3780 agacggtacg cgactgggcg tggagcatct ggtcgcattg ggtcaccagc aaatcgcgct 3840 gttagcgggc ccattaagtt ctgtctcggc gcgtctgcgt ctggctggct ggcataaata 3900 tctcactcgc aatcaaattc agccgatagc ggaacgggaa ggcgactgga gtgccatgtc 3960 cggttttcaa caaaccatgc aaatgctgaa tgagggcatc gttcccactg cgatgctggt 4020 tgccaacgat cagatggcgc tgggcgcaat gcgcgccatt accgagtccg ggctgcgcgt 4080 tggtgcggat atctcggtag tgggatacga cgataccgaa gacagctcat gttatatccc 4140 gccgttaacc accatcaaac aggattttcg cctgctgggg caaaccagcg tggaccgctt 4200 gctgcaactc tctcagggcc aggcggtgaa gggcaatcag ctgttgcccg tctcactggt 4260 gaaaagaaaa accaccctgg cgcccaatac gcaaaccgcc tctccccgcg cgttggccga 4320 ttcattaatg cagctggcac gacaggtttc ccgactggaa agcgggcagt gagcgcaacg 4380 caattaatgt aagttagctc actcattagg caccgggatc tcgaccgatg cccttgagag 4440 ccttcaaccc agtcagctcc ttccggtggg cgcggggcat gactatcgtc gccgcactta 4500 tgactgtctt ctttatcatg caactcgtag gacaggtgcc ggcagcgctc tgggtcattt 4560 tcggcgagga ccgctttcgc tggagcgcga cgatgatcgg cctgtcgctt gcggtattcg 4620 gaatcttgca cgccctcgct caagccttcg tcactggtcc cgccaccaaa cgtttcggcg 4680 agaagcaggc cattatcgcc ggcatggcgg ccccacgggt gcgcatgatc gtgctcctgt 4740 cgttgaggac ccggctaggc tggcggggtt gccttactgg ttagcagaat gaatcaccga 4800 tacgcgagcg aacgtgaagc gactgctgct gcaaaacgtc tgcgacctga gcaacaacat 4860 gaatggtctt cggtttccgt gtttcgtaaa gtctggaaac gcggaagtca gcgccctgca 4920 ccattatgtt ccggatctgc atcgcaggat gctgctggct accctgtgga acacctacat 4980 ctgtattaac gaagcgctgg cattgaccct gagtgatttt tctctggtcc cgccgcatcc 5040 ataccgccag ttgtttaccc tcacaacgtt ccagtaaccg ggcatgttca tcatcagtaa 5100 cccgtatcgt gagcatcctc tctcgtttca tcggtatcat tacccccatg aacagaaatc 5160 ccccttacac ggaggcatca gtgaccaaac aggaaaaaac cgcccttaac atggcccgct 5220 ttatcagaag ccagacatta acgcttctgg agaaactcaa cgagctggac gcggatgaac 5280 aggcagacat ctgtgaatcg cttcacgacc acgctgatga gctttaccgc agctgcctcg 5340 cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 5400 cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 5460 gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga tagcggagtg tatactggct 5520 taactatgcg gcatcagagc agattgtact gagagtgcac catatatgcg gtgtgaaata 5580 ccgcacagat gcgtaaggag aaaataccgc atcaggcgct cttccgcttc ctcgctcact 5640 gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 5700 atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 5760 caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 5820 cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 5880 taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 5940 ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 6000 tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 6060 gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 6120 ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 6180 aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 6240 aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 6300 agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 6360 cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 6420 gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 6480 atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 6540 gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 6600 tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 6660 gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 6720 ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 6780 actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 6840 ccagttaata gtttgcgcaa cgttgttgcc attgctgcag gcatcgtggt gtcacgctcg 6900 tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 6960 cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 7020 ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 7080 ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 7140 tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 7200 agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 7260 atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 7320 gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 7380 aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 7440 tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 7500 aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgaaattgta 7560 aacgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac 7620 caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg 7680 agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa 7740 gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt 7800 tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt 7860 agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga 7920 gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc 7980 gcgcttaatg cgccgctaca gggcgcgtcc cattcgcca 8019 <210> 21 <211> 7886 <212> DNA <213> Artificial Sequence <220> <223> Plasmid p7(A)T3TG-K <400> 21 atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60 ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120 tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagttaaccg cggcctgcct 180 ggaatgaagg atattgtgtc ataccgccgt ccgcgaataa cgtgatgcct gtgacgtagc 240 tggcttcctt cgaagcaagc caggctgcta ctgcggcgat ctcctccggt tcgccgatat 300 atcccattgg aatcatgctt tctacatcag ctttctgttt agggtcagcg aatttttcag 360 cattgattgg cgtgttgatc gcacctggcc caatattatt gacgcgaatg cccttcggcg 420 cgtattccaa cgctaatgtt tctgtcatca gctttatccc gcctttactt gccgcatagt 480 ggacaaataa cggccaagga atcacttcgt gcacactgga catgttaatg acatttccct 540 tgatatcgtt ttctacgaaa tatttaatcg cttcacggct tcctaaaaag gcacccgtta 600 agttcgtgcc gatgacttta tcccaatcct tgagcggcat ttcgtgagat ggcacaggat 660 tttcaagacc ggcattatta atcataatat cgagtgtgcc gaactcctta attgccgttt 720 gcacgatatt ttttacatct tcctctttcg tgacatctcc ttggacgaca acagcttcac 780 cgcccgcctt gatgacctct tcttttacct cgttcggatc ttgtttatta ctataatagt 840 tgataaccac ttttgcctgc tccttgccga agcgaatggc catcgccttt ccgagccctg 900 aagcagctcc tgtaatagcg acgacttttc cttttaaatc cggatacata tgtatatctc 960 cttcttatac ttaactaata tactaagatg gggaattgtt atccgctcac aattccccta 1020 tagtgagtcg tattaatttc gattatgcgg ccgtgtacaa tacgattact ttctgttcga 1080 cttaagcatt atgcggccgc tcagaactgt gtcgggcgca tcaccgcatc aatgccgcca 1140 tcaatgacga tctgcgcgcc atgcacatag cttgcggccg ggctcatcaa aaaggcgatg 1200 accgacgcca tctcggacgg ctcggcacgg cggcccatgg gaggaacgaa cttggcaatg 1260 gattcgccat agcgcgggtc ctgcaggccc gcctgcagca agggagtctc ggttgcaccg 1320 ggggcgatgg tgttcaggcg cacgccagcc tcgccccagg cggcggcgcg tttgcgcaca 1380 gccaccgtca aagcattctt gctgcccgca taggccagat ttccgccctg ctctcccgca 1440 tgttcgacaa tggcgcgggc cttggcttcc tcgccggctt ccagtgccag cgccagtggg 1500 ttcttgtcaa aagccagatg cgcggaagcc acggacgaga tgacgacggc tgcgggctga 1560 tggccttttt tcagcgctgg caaaaaggca tccatcagct cggtcgcgcc aaaataattg 1620 accgaaacca cattgccaag caccttggtc tgcggtccca ggccggcgca cagcaccagg 1680 ccgtccatgc ccttgctgca cttcgccagt acatcggcaa tcgcctgctt tcgaccttcg 1740 gccgtcgaga gatcggcaat cacttccgca tcgcgtatat cgatgcctac gatctggtga 1800 ccggccgcct ccaggacctt gcgcgtagcg gcaccaatgc cggtggcgca gccgcttatc 1860 acgatgatgg acatatgtat atctccttct tatacttaac taatatacta agatggggaa 1920 ttgttatccg ctcacaattc ccctatagtg agtcgtatta atttcgatta tgcggccgtg 1980 tacaatacga ttactttctg ttcgacttaa gcattataag cttctagtcg cggtagaacg 2040 accccatgta gcggatgtac tcgtcctcgg tgtggtttgc cttccagtcg tggacggagt 2100 ccttgttgcg ctggccggcg atgacggaga gctccttacc cagcttctca aaggcctcgt 2160 caacgcactc ctcgggggtg agggcgatct tcatgacggc ctcgccctgc gggccgccgg 2220 ggaggttgga cagcaggctg ggggttaggg tggtgccgag ggtgatgacc tcgacgtcga 2280 cgccggtgcc ctcgcactcg caggccacgg cctcggtcat cttgaggatg aaggccttgc 2340 ccgcgccgta ctggccgttc caggggctgg agctgatgcc ggtcatcgac gagacgttga 2400 tcacggcgcc gcggtcctgg gcggcaaaga tccgcatgta gtggtggaag cacttgagga 2460 aggtcacgac gttgacgttg atcatggcct cgtgcttctc ccagggggtg tcctggatct 2520 taccgaagct gtgcaggcag gccacgtagc tcatgaagcc catgtccagg ccctcggtcg 2580 cggcgaagac ggtctcggca gcgccgggct ggctaaagtc ggcgcgcacg accttggtct 2640 ccacgccgta ggtctcgcgg atctcgcctg cgagcacgtt cagcttctcc tcgcgacggg 2700 cgaccatgac gacgttcatg ccgccggcgg cgatcttctc gcagaacgcc ttgccgacgc 2760 cctcggtcgc gcccaggatc aggccccact caccgtactt ctccctcagg ttcatatgta 2820 tatctccttc ttaaagttaa acaaaattat ttctagaggg gaattgttat ccgctcacaa 2880 ttcccctata gtgagtcgta ttaatttcgc gggatcgaga tctcgatcct ctacgccgga 2940 cgcatcgtgg ccggcatcac cggcgccaca ggtgcggttg ctggcgccta tatcgccgac 3000 atcaccgatg gggaagatcg ggctcgccac ttcgggctca tgagcgcttg tttcggcgtg 3060 ggtatggtgg caggccccgt ggccggggga ctgttgggcg ccatctcctt gcatgcacca 3120 ttccttgcgg cggcggtgct caacggcctc aacctactac tgggctgctt cctaatgcag 3180 gagtcgcata agggagagcg tcgagatccc ggacaccatc gaatggcgca aaacctttcg 3240 cggtatggca tgatagcgcc cggaagagag tcaattcagg gtggtgaatg tgaaaccagt 3300 aacgttatac gatgtcgcag agtatgccgg tgtctcttat cagaccgttt cccgcgtggt 3360 gaaccaggcc agccacgttt ctgcgaaaac gcgggaaaaa gtggaagcgg cgatggcgga 3420 gctgaattac attcccaacc gcgtggcaca acaactggcg ggcaaacagt cgttgctgat 3480 tggcgttgcc acctccagtc tggccctgca cgcgccgtcg caaattgtcg cggcgattaa 3540 atctcgcgcc gatcaactgg gtgccagcgt ggtggtgtcg atggtagaac gaagcggcgt 3600 cgaagcctgt aaagcggcgg tgcacaatct tctcgcgcaa cgcgtcagtg ggctgatcat 3660 taactatccg ctggatgacc aggatgccat tgctgtggaa gctgcctgca ctaatgttcc 3720 ggcgttattt cttgatgtct ctgaccagac acccatcaac agtattattt tctcccatga 3780 agacggtacg cgactgggcg tggagcatct ggtcgcattg ggtcaccagc aaatcgcgct 3840 gttagcgggc ccattaagtt ctgtctcggc gcgtctgcgt ctggctggct ggcataaata 3900 tctcactcgc aatcaaattc agccgatagc ggaacgggaa ggcgactgga gtgccatgtc 3960 cggttttcaa caaaccatgc aaatgctgaa tgagggcatc gttcccactg cgatgctggt 4020 tgccaacgat cagatggcgc tgggcgcaat gcgcgccatt accgagtccg ggctgcgcgt 4080 tggtgcggat atctcggtag tgggatacga cgataccgaa gacagctcat gttatatccc 4140 gccgttaacc accatcaaac aggattttcg cctgctgggg caaaccagcg tggaccgctt 4200 gctgcaactc tctcagggcc aggcggtgaa gggcaatcag ctgttgcccg tctcactggt 4260 gaaaagaaaa accaccctgg cgcccaatac gcaaaccgcc tctccccgcg cgttggccga 4320 ttcattaatg cagctggcac gacaggtttc ccgactggaa agcgggcagt gagcgcaacg 4380 caattaatgt aagttagctc actcattagg caccgggatc tcgaccgatg cccttgagag 4440 ccttcaaccc agtcagctcc ttccggtggg cgcggggcat gactatcgtc gccgcactta 4500 tgactgtctt ctttatcatg caactcgtag gacaggtgcc ggcagcgctc tgggtcattt 4560 tcggcgagga ccgctttcgc tggagcgcga cgatgatcgg cctgtcgctt gcggtattcg 4620 gaatcttgca cgccctcgct caagccttcg tcactggtcc cgccaccaaa cgtttcggcg 4680 agaagcaggc cattatcgcc ggcatggcgg ccccacgggt gcgcatgatc gtgctcctgt 4740 cgttgaggac ccggctaggc tggcggggtt gccttactgg ttagcagaat gaatcaccga 4800 tacgcgagcg aacgtgaagc gactgctgct gcaaaacgtc tgcgacctga gcaacaacat 4860 gaatggtctt cggtttccgt gtttcgtaaa gtctggaaac gcggaagtca gcgccctgca 4920 ccattatgtt ccggatctgc atcgcaggat gctgctggct accctgtgga acacctacat 4980 ctgtattaac gaagcgctgg cattgaccct gagtgatttt tctctggtcc cgccgcatcc 5040 ataccgccag ttgtttaccc tcacaacgtt ccagtaaccg ggcatgttca tcatcagtaa 5100 cccgtatcgt gagcatcctc tctcgtttca tcggtatcat tacccccatg aacagaaatc 5160 ccccttacac ggaggcatca gtgaccaaac aggaaaaaac cgcccttaac atggcccgct 5220 ttatcagaag ccagacatta acgcttctgg agaaactcaa cgagctggac gcggatgaac 5280 aggcagacat ctgtgaatcg cttcacgacc acgctgatga gctttaccgc agctgcctcg 5340 cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 5400 cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 5460 gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga tagcggagtg tatactggct 5520 taactatgcg gcatcagagc agattgtact gagagtgcac catatatgcg gtgtgaaata 5580 ccgcacagat gcgtaaggag aaaataccgc atcaggcgct cttccgcttc ctcgctcact 5640 gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 5700 atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 5760 caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 5820 cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 5880 taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 5940 ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 6000 tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 6060 gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 6120 ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 6180 aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 6240 aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 6300 agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 6360 cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 6420 gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgaacaa taaaactgtc 6480 tgcttacata aacagtaata caaggggtgt tatgagccat attcaacggg aaacgtcttg 6540 ctctaggccg cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg 6600 cgataatgtc gggcaatcag gtgcgacaat ctatcgattg tatgggaagc ccgatgcgcc 6660 agagttgttt ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt 6720 cagactaaac tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac 6780 tcctgatgat gcatggttac tcaccactgc gatccccggg aaaacagcat tccaggtatt 6840 agaagaatat cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg 6900 gttgcattcg attcctgttt gtaattgtcc ttttaacagc gatcgcgtat ttcgtctcgc 6960 tcaggcgcaa tcacgaatga ataacggttt ggttgatgcg agtgattttg atgacgagcg 7020 taatggctgg cctgttgaac aagtctggaa agaaatgcat aaacttttgc cattctcacc 7080 ggattcagtc gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa 7140 attaataggt tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc 7200 catcctatgg aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa 7260 atatggtatt gataatcctg atatgaataa attgcagttt catttgatgc tcgatgagtt 7320 tttctaagaa ttaattcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 7380 taggggttcc gcgcacattt ccccgaaaag tgccacctga aattgtaaac gttaatattt 7440 tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt ttttaaccaa taggccgaaa 7500 tcggcaaaat cccttataaa tcaaaagaat agaccgagat agggttgagt gttgttccag 7560 tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg 7620 tctatcaggg cgatggccca ctacgtgaac catcacccta atcaagtttt ttggggtcga 7680 ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga gcttgacggg 7740 gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg ggcgctaggg 7800 cgctggcaag tgtagcggtc acgctgcgcg taaccaccac acccgccgcg cttaatgcgc 7860 cgctacaggg cgcgtcccat tcgcca 7886

Claims (22)

  1. 7-케토스테로이드를 대응하는 7-히드록시스테로이드로 적어도 입체특이적 효소적 환원을 촉매하는, 7β-히드록시스테로이드 탈수소효소(7β-HSDH)로서, 효소는 서열번호 2 또는 서열번호 2와 적어도 90% 서열 상동성을 갖는, 이로부터 유도된 아미노산 서열 내의 위치들 G39 및 R40의 각각에 돌연변이를 가지며, 효소는 이중 돌연변이 G39D/R40F를 함유하는, 7β-HSDH.
  2. 7-케토스테로이드를 대응하는 7-히드록시스테로이드로 적어도 입체특이적 효소적 환원하는 것을 촉매하는, 7β-히드록시스테로이드 탈수소효소(7β-HSDH)로서, 효소는 서열번호 2 또는 서열번호 2와 적어도 90% 서열 상동성을 갖는, 이로부터 유도된 아미노산 서열 내의 위치들 G39 및 R40의 각각에 돌연변이를 포함하며,
    a) 삼중 돌연변이 G39D/R40F/R41X1을 포함하며, 상기 X1은 임의의 다른 아미노산 잔기에 대한 모든 것을 나타내며; 또는
    b) 사중 돌연변이 G39D/R40F/R41X1/K44X2를 포함하며, 여기에서 X1은 임의의 다른 아미노산 잔기에 대한 모든 것을 나타내며, 및 X2는 임의의 다른 아미노산 잔기를 나타내는, 7β-HSDH.
  3. 제2항에 있어서, 상기 효소는 서열번호 2 또는 서열번호 2와 적어도 90% 서열 상동성을 갖는, 이로부터 유도된 아미노산 서열의 위치 R41 또는 위치 K44에 돌연변이를 포함하는 것인, 7β-HSDH.
  4. 제2항에 있어서, 상기 X1은 K, Q, S 또는 R을 나타내고, X2는 G, N, 또는 Q를 나타내는, 7β-HSDH.
  5. 제2항에 있어서, 삼중 돌연변이 G39D/R40F/R41K를 포함하는, 7β-HSDH.
  6. 제2항에 있어서, 사중 돌연변이 G39D/R40F/R41K/K44G를 포함하는, 7β-HSDH.
  7. 제1항 내지 제6항 중 어느 한 항에 따른, 7β-HSDH에 대하여 코딩하는 뉴클레오티드 서열.
  8. 적어도 하나의 조절 서열의 조절하에, 제7항의 적어도 하나의 뉴클레오티드 서열을 포함하는, 발현 카세트.
  9. 제8항에 따른 적어도 하나의 발현 카세트를 포함하는 발현 벡터.
  10. 제9항의 적어도 하나의 발현 벡터를 포함하는 재조합 미생물.
  11. 제10항에 있어서, 히드록시스테로이드 탈수소효소(HSDH) 및, 보조인자 재생에 적당한 탈수소효소로부터 선택되는, 적어도 하나의 추가의 효소에 대한 코딩 서열을 추가로 포함하는, 재조합 미생물.
  12. 제11항에 있어서, 추가의 HSDH가 3α-HSDH들로부터 선택되며; 및
    탈수소효소는 NADH 탈수소효소, 알콜 탈수소효소(ADH), NADH-재생 포르메이트 탈수소효소(FDH), 글루코스 탈수소효소(GDH), 글루코스-6-포스페이트 탈수소효소(G-6-PDH), 포스파이트 탈수소효소(PtDH), 또는 NADH-재생 글루코스 탈수소효소(GDH)로부터 선택되는, 재조합 미생물.
  13. 제10항에 있어서, 7α-HSDH 녹아웃 균주인, 재조합 미생물.
  14. 하기 화학식 1의 우르소데스옥시콜린산(UDCA)의 제조 방법으로서,
    (화학식 1)

    (상기 화학식 1에서,
    R은 알킬, H, 알칼리금속이온 또는 N(R3)4 +(식 중, 잔기들 R3은 같거나 또는 다르며, H 또는 알킬을 나타냄)를 나타내거나, 또는 기 -CO2R은 산 아미드 기 -CONR1R2(식 중, R1 및 R2는 서로 독립적으로 알킬 잔기를 나타냄)에 의해 치환된다);
    a) 하기 화학식 2의 콜린산(CA)이 화학식 3의 디하이드로콜린산(DHCA)으로 산화되며;
    (화학식 2)

    (상기 화학식 2에서,
    R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
    (화학식 3)

    (상기 화학식 3에서,
    R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
    b) DHCA는 제1항 내지 제6항 중 어느 하나의 정의에 따른 적어도 하나의 7β-HSDH 변이체의 존재하에, 및 적어도 하나의 3α-HSDH의 존재하에, 하기 화학식 5의 대응하는 12-케토-우르소데스옥시콜린산(12-케토 UDCA)으로 환원되며:
    (화학식 5)

    (상기 화학식 5에서,
    R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
    c) 화학식 5의 12-케토-UDCA는 UDCA로 화학적으로 환원되는, 제조 방법.
  15. 제14항에 있어서, 상기 제조방법은
    d) 반응생성물이 추가로 정제되는 것을 포함하는, 제조 방법.
  16. 제14항에 있어서, 상기 단계 b)는 NADH 또는 NADPH의 존재 및 소모하에 환원이 일어나는, 제조 방법.
  17. 다음을 포함하는 화학식 1의 UDCA의 제조 방법:

    (상기 화학식 1에서,
    R은 알킬, NR1R2, H, 알칼리금속이온 또는 N(R3)4 +(식 중, 잔기들 R3은 같거나 다르며, H 또는 알킬을 나타냄)이며, 또는 상기 정의된 바와 같이, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
    a) 하기 화학식 2의 CA가 화학식 3의 DHCA로 산화되며;
    (화학식 2)

    (상기 화학식 2에서,
    R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
    (화학식 3)

    (상기 화학식 3에서,
    R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
    b) DHCA는 적어도 하나의 7β-HSDH의 존재하에, 및 적어도 하나의 3α-HSDH의 존재하에, 하기 화학식 5의 대응하는 12-케토 UDCA로 환원되고:
    (화학식 5)

    (상기 화학식 5에서,
    R은 상기 진술된 의미들을 가지며, 또는 상기 정의된 바와 같이, 기 -CO2R은 산 아미드 기 -CONR1R2에 의해 치환된다)
    c) 화학식 5의 12-케토-UDCA는 UDCA로 화학적으로 환원되며; 및
    단계 b)의 전환은 제10항에 설명된 재조합 미생물의 존재하에 일어나는, 제조 방법.
  18. 제17항에 있어서, 상기 제조방법은
    d) 반응생성물이 추가로 정제되는 것을 포함하는, 제조 방법.
  19. 제17항에 있어서, 상기 단계 b)는 NADH 또는 NADPH의 존재 및 소모하에 환원이 일어나는, 제조 방법.
  20. 삭제
  21. 삭제
  22. 삭제
KR1020177001891A 2014-06-24 2015-06-24 디하이드로콜린산 화합물의 생체촉매적 전세포 환원을 위한 방법, 7β-히드록시스테로이드 탈수소효소 변이체들 및 우르소데스옥시콜린산을 제조하기 위한 개선된 생체촉매 방법 KR102640531B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP14173747 2014-06-24
EP14173747.8 2014-06-24
EP14182290.8 2014-08-26
EP14182290 2014-08-26
PCT/EP2015/064264 WO2015197698A2 (de) 2014-06-24 2015-06-24 NEUARTIGE VERFAHREN ZUR BIOKATALYTISCHEN GANZZELLREDUKTION VON DEHYDROCHOLSÄUREVERBINDUNGEN, NEUARTIGE 7ß-HYDROXYSTEROID DEHYDROGENASE-MUTANTEN UND VERBESSERTE BIOKATALYTISCHE VERFAHREN ZUR HERSTELLUNG VON URSODESOXYCHOLSÄURE

Publications (2)

Publication Number Publication Date
KR20170020511A KR20170020511A (ko) 2017-02-22
KR102640531B1 true KR102640531B1 (ko) 2024-02-23

Family

ID=53489945

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177001891A KR102640531B1 (ko) 2014-06-24 2015-06-24 디하이드로콜린산 화합물의 생체촉매적 전세포 환원을 위한 방법, 7β-히드록시스테로이드 탈수소효소 변이체들 및 우르소데스옥시콜린산을 제조하기 위한 개선된 생체촉매 방법

Country Status (7)

Country Link
US (1) US10544441B2 (ko)
EP (1) EP3161144B1 (ko)
JP (1) JP6666855B2 (ko)
KR (1) KR102640531B1 (ko)
NZ (1) NZ725965A (ko)
PT (1) PT3161144T (ko)
WO (1) WO2015197698A2 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190018675A (ko) 2016-06-20 2019-02-25 파마젤 게엠베하 케노데옥시콜산의 우르소데옥시콜산으로의 커플링된 생체내변환 및 이러한 방법에 적용가능한 효소 돌연변이체
WO2018036982A1 (de) 2016-08-22 2018-03-01 Pharmazell Gmbh Chemisch-biokatalytisches verfahren zur herstellung von ursodesoxycholsäure
WO2018126467A1 (zh) * 2017-01-09 2018-07-12 深圳市邦泰绿色生物合成研究院 一种3α-羟基-7氧代-5β-胆烷酸的制备方法及其制备用酶2
NL2020823B1 (en) * 2018-04-25 2019-11-05 Univ Delft Tech NAD+ dependent 7ß-hydroxysteroid dehydrogenase
CN110387360B (zh) * 2019-06-18 2021-12-28 华东理工大学 羟基类固醇脱氢酶及其在合成熊去氧胆酸前体中的应用
CN113968891B (zh) * 2021-11-15 2023-04-07 湖南科瑞生物制药股份有限公司 一种植物源7-酮基石胆酸的制备方法
CN115386557A (zh) * 2022-10-14 2022-11-25 安徽大学 一种7α-羟基类固醇脱氢酶的制备方法及其催化转化应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014502490A (ja) * 2010-12-16 2014-02-03 ファルマツェル、ゲーエムベーハー 新規7β−ヒドロキシステロイドデヒドロゲナーゼ変異体及びウルソデオキシコール酸の調製方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5651997A (en) * 1979-10-05 1981-05-09 Toyobo Co Ltd Preparation of 12-keto cheno deoxycholic acid by microorganism
US6675479B1 (en) 2000-02-29 2004-01-13 The Gillette Company Shaving razor and blade unit with improved guard
EP2105500A1 (de) 2008-03-26 2009-09-30 Pharmazell GmbH Neue 12alpha-Hydroxysteroiddehydrogenasen, deren Herstellung und deren Verwendung
CN102791876B (zh) 2009-11-30 2016-06-08 细胞制药有限公司 新的7β-羟类固醇脱氢酶及它们的用途

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014502490A (ja) * 2010-12-16 2014-02-03 ファルマツェル、ゲーエムベーハー 新規7β−ヒドロキシステロイドデヒドロゲナーゼ変異体及びウルソデオキシコール酸の調製方法

Also Published As

Publication number Publication date
EP3161144A2 (de) 2017-05-03
WO2015197698A3 (de) 2016-02-25
PT3161144T (pt) 2019-12-18
JP2017522006A (ja) 2017-08-10
EP3161144B1 (de) 2019-09-18
JP6666855B2 (ja) 2020-03-18
US20170191104A1 (en) 2017-07-06
WO2015197698A2 (de) 2015-12-30
NZ725965A (en) 2022-04-29
US10544441B2 (en) 2020-01-28
KR20170020511A (ko) 2017-02-22

Similar Documents

Publication Publication Date Title
KR102640531B1 (ko) 디하이드로콜린산 화합물의 생체촉매적 전세포 환원을 위한 방법, 7β-히드록시스테로이드 탈수소효소 변이체들 및 우르소데스옥시콜린산을 제조하기 위한 개선된 생체촉매 방법
DK3027733T3 (en) Preparation of 3-Hydroxypropionic Acid in Recombinant Yeast Expressing an Insect Aspartate-1 Decarboxylase
CA2683497C (en) .delta.8 desaturases and their use in making polyunsaturated fatty acids
AU609783B2 (en) Novel fusion proteins and their purification
CN108026523B (zh) 向导rna组装载体
KR102023208B1 (ko) 신규한 7β-히드록시스테로이드 데히드로게나제 돌연변이체 및 우르소데옥시콜산의 제조 방법
DK2140006T3 (en) DELTA-5 desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids
CN107250163A (zh) 修饰的葡糖淀粉酶和具有增强的生物产物产生的酵母菌株
KR102096592B1 (ko) 신규한 crispr 연관 단백질 및 이의 용도
DK2443248T3 (en) IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES
CN107475267B (zh) 4-羟基异亮氨酸生产质粒与菌株以及4-羟基异亮氨酸的合成方法
EP2064321A1 (en) Beta-alanine/alpha-ketoglutarate aminotransferase for 3-hydroxypropionic acid production
CN108431229A (zh) 糖转运蛋白修饰的酵母菌株和用于生物制品生产的方法
CN107916275B (zh) 一种利用具有还原tca途径的解脂耶氏酵母菌株好氧合成琥珀酸的方法
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
CN101802183A (zh) 高保真度限制性内切核酸酶
CN112430622A (zh) 一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法
US6365347B1 (en) Method for identifying disruptors of biological pathways using genetic selection
CN101302531A (zh) 一种在大肠杆菌-链霉菌-假单胞菌之间穿梭表达的bac载体及其构建方法
KR20140000711A (ko) 수크로스 이용에 있어서의 야로위아 리포라이티카에서의 사카로마이세스 세레비지애 suc2 유전자의 용도
CN101693901A (zh) 一种大肠杆菌-棒状杆菌穿梭型诱导表达载体pDXW-8及其构建方法
CN113039278A (zh) 通过指导的内切核酸酶和单链寡核苷酸进行基因组编辑
CN110004131A (zh) 一种提高赖氨酸脱羧酶活性和稳定性的分子改造方法
CN113186140B (zh) 用于预防和/或治疗宿醉和肝病的基因工程细菌
CN114959919A (zh) 一种构建酿酒酵母人工小启动子文库的方法及应用

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant